Meta는 보다 효율적인 인공 지능을 위한 경쟁에서 도전장을 던졌습니다. 거대 기술 기업은 새로운 멀티 토큰 예측 접근 방식을 활용하여 대규모 언어 모델(LLM)의 개발 및 배포 방식을 잠재적으로 변화시키는 사전 훈련된 모델을 수요일에 출시했습니다.
Meta는 수요일에 새로운 멀티 토큰 예측 접근 방식은 대규모 언어 모델(LLM)의 개발 및 배포 방식을 잠재적으로 변화시킵니다.
거대 기술 기업의 최신 제품은 Meta 연구원이 발표한 최근 논문에 이어 출시되었습니다. 다중 토큰 예측을 활용합니다. 이 영역에 대한 연구를 더욱 촉진하기 위해 Meta는 이제 Hugging Face에 대한 이러한 접근 방식을 활용하여 코드 완성을 위한 사전 훈련된 모델을 출시했습니다.
이 기술은 LLM을 훈련하여 다음 단어만 예측하는 전통적인 접근 방식에서 벗어났습니다. 순서대로. 대신 Meta의 방법론 작업 모델은 여러 미래 단어를 동시에 예측하여 향상된 성능과 대폭적인 훈련 시간 단축을 약속합니다.
이 혁신의 의미는 광범위할 수 있습니다. AI 모델의 크기와 복잡성이 계속 증가함에 따라 계산 능력에 대한 탐욕스러운 욕구로 인해 비용과 환경에 미치는 영향에 대한 우려가 높아졌습니다. Meta의 멀티 토큰 예측 방법은 이러한 추세를 억제하여 고급 AI의 접근성과 지속 가능성을 높이는 방법을 제공할 수 있습니다.
AI 민주화: 효율적인 언어 모델의 약속과 위험
이 새로운 접근 방식의 잠재력은 단순한 효율성 향상을 넘어 확장됩니다. 한 번에 여러 토큰을 예측함으로써 이러한 모델은 언어 구조와 컨텍스트에 대한 보다 미묘한 이해를 개발할 수 있습니다. 이는 코드 생성에서 창의적인 글쓰기에 이르는 작업의 개선으로 이어질 수 있으며 잠재적으로 AI와 인간 수준의 언어 이해 간의 격차를 해소할 수 있습니다.
VB Transform 2024 카운트다운
7월 9일부터 11일까지 샌프란시스코에서 열리는 우리 행사에 기업 리더들과 함께하세요. 주력 AI 이벤트. 동료들과 소통하고, Generative AI의 기회와 과제를 살펴보고, AI 애플리케이션을 업계에 통합하는 방법을 알아보세요. 지금 등록하세요
위 내용은 Meta, 대규모 언어 모델 개발에 잠재적으로 혁명을 일으킬 수 있는 다중 토큰 예측 기술 공개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!