Zuckerberg는 소셜 미디어를 통해 Facebook AI Research에서 개발한 LLaMA는 연구자들이 인공 지능(AI) 분야에서 작업을 발전시킬 수 있도록 돕는 것이 목표인 "현재 최고 수준"의 대규모 언어 모델이라고 밝혔습니다.
"대형 언어 모델"(LLM)은 대량의 텍스트 데이터를 소화하고 텍스트 단어 간의 관계를 추론할 수 있습니다. 컴퓨팅 성능이 향상되고 입력 데이터 세트 및 매개변수 공간이 지속적으로 확장됨에 따라 LLM의 기능도 그에 따라 향상되었습니다.
현재 LLM은 텍스트 생성, 질문 답변, 서면 자료 요약 등 다양한 작업을 효율적으로 수행하는 것으로 입증되었습니다. Zuckerberg는 LLM이 수학적 정리를 자동으로 증명하고 단백질 구조를 예측하는 등 보다 복잡한 측면에서도 큰 발전 가능성을 가지고 있다고 말했습니다.
최근 인기를 끌고 있는 ChatGPT는 LLM을 사용해 구축한 챗봇이라는 점을 언급할 가치가 있습니다. ChatGPT는 OpenAI 175B 매개변수 기본 모델을 기반으로 학습된 LLM인 GPT3.5에서 지원됩니다. 175B는 학습 데이터에서 학습하고 축적한 내용입니다.
Meta는 공식 웹사이트 소개에서 LLaMA에는 7B, 13B, 33B, 65B의 네 가지 기본 모델이 있다고 명시했습니다. 이는 대부분의 벤치마크 테스트에서 GPT3.5의 이전 모델인 GPT3-175B보다 우수하며 LLaMA-65B는 Chinchilla-70B와 PaLM-540B가 경쟁하고 있습니다.
위 내용은 고급 대규모 언어 모델 출시, AI 전쟁 심화를 위한 Meta 공식 발표의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!