>기술 주변기기 >일체 포함 >AI 분야에 또 다른 '강자' 추가, 메타, 새로운 대규모 언어 모델 LLaMA 출시

AI 분야에 또 다른 '강자' 추가, 메타, 새로운 대규모 언어 모델 LLaMA 출시

王林
王林앞으로
2023-04-25 12:52:061137검색

ChatGTP가 인기를 얻은 이후 ChatGTP를 중심으로 개발된 AI 애플리케이션이 속속 등장하여 사람들이 인공지능의 힘을 실감하게 했습니다!

최근 페이스북의 모회사인 메타(Meta)는 LLaMA라고 불리는 인공지능 대형 언어 모델(Large Language Model Meta AI)을 출시했습니다.

AI 领域再添一员"猛将",Meta 发布全新大型语言模型LLaMA


Zuckerberg는 소셜 미디어에서 다음과 같이 말했습니다. "FAIR 팀이 개발한 LLaMA 모델은 현재 세계 최고 수준의 대규모 언어 모델입니다. 목표는 연구자들이 해당 분야에서 발전을 이룰 수 있도록 돕는 것입니다. 인공지능이 일해요!"

다른 대규모 모델과 마찬가지로 Meta LLaMA는 일련의 단어를 "입력"으로 사용하고 다음 단어를 예측하여 재귀적으로 텍스트를 생성하는 방식으로 작동합니다.

보고서에 따르면 Meta는 여러 매개변수(7B, 13B, 33B 및 65B)를 사용하여 LLaMA를 개발 중입니다. 이 중 LLaMA 65B와 LLaMA 33B는 1조 4천억 개의 토큰으로 훈련되었으며, 가장 작은 모델인 LLaMA 7B도 1조 개의 토큰으로 훈련되었습니다.

또한 LLaMA 모델은 라틴어와 키릴어를 포함한 20개 언어로 훈련되었으며 이전에 출시된 대형 모델보다 훨씬 적은 컴퓨팅 성능을 필요로 합니다.

FAIR 팀은 LLaMA가 아직 어떤 메타 제품에도 사용되지 않았다고 밝혔습니다.

"DeepMind" 및 "OpenAI"와 달리 LLaMA는 훈련 코드를 공개할 예정입니다.

Meta는 또한 이 기술을 AI 연구자들에게 우선적으로 공개할 계획입니다. LLaMA를 사용하려면 신청서를 제출하면 됩니다. 승인을 받을 수 있습니다.

위 내용은 AI 분야에 또 다른 '강자' 추가, 메타, 새로운 대규모 언어 모델 LLaMA 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제