>  기사  >  기술 주변기기  >  팔콘이 1년만에 돌아왔습니다! 110억 개의 매개변수와 5조 5천억 개의 토큰, Llama 3를 능가하는 성능

팔콘이 1년만에 돌아왔습니다! 110억 개의 매개변수와 5조 5천억 개의 토큰, Llama 3를 능가하는 성능

王林
王林원래의
2024-06-09 17:25:311065검색

요즘 OpenAI가 출시한 GPT-4o에 세계의 이목이 집중된 것 같습니다. 동시에 OpenAI의 도전자들도 동시에 역사를 만들어가고 있습니다.

5월 14일, 아부다비 첨단기술연구위원회(ATRC) 산하 기술혁신연구소(TII)가 차세대 Falcon 2 모델을 출시했습니다.

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2 11B가 접속 가능하게 오픈되었으며, Falcon 2 11B VLM이 5월 14일 정오 12시에 오픈됩니다

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

새로운 세대의 "Falcon"(Falcon은 Falcon을 의미)이 Arena로 돌아옵니다. 출시되자마자 HN 인기 목록에서 빠르게 1위를 차지했습니다.

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

작년에 Falcon은 첫 출시로 모두를 놀라게 했으며 압도적인 우위로 Llama를 능가했습니다.

Hugging Face 순위에 따르면 이번에 출시된 Falcon 2 11B의 성능은 다시 한번 Llama 3 8B를 능가했으며, 평균 점수 차이가 0.01에 불과하여 선두인 Gemma 7B의 성능과 동등했습니다.

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2에는 Falcon 2 11B와 Falcon 2 11B VLM의 두 가지 버전이 포함되어 있습니다.

전자는 5조 5천억 개의 토큰으로 훈련된 대규모 언어 모델이고, 후자는 이를 기반으로 개발된 "언어 대 언어" 모델입니다.

오픈 소스 대형 언어 모델인 Falcon 2는 다중 언어 기능을 제공할 뿐만 아니라 다중 양식을 지원하며 시각적 입력을 텍스트 출력으로 원활하게 변환할 수 있습니다. 이 기능은 오늘날 대형 모델에서 최초로 제공되는 기능입니다. 시장.

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

사용자 인터페이스에 사진을 업로드하고 프롬프트를 입력하면 사진에 대한 텍스트 설명을 받을 수 있습니다.

다국어 + 다중 모달

Falcon 2 11B에는 다국어 기능이 있습니다. 를 사용하면 영어, 프랑스어, 스페인어, 독일어, 포르투갈어 및 기타 다양한 언어로 작업에 빠르게 응답할 수 있습니다.

Falcon 2 11B VLM은 시각적 언어 모델로서 환경의 다양한 시각적 정보를 인식하고 해석할 수 있으므로 의료, 금융, 전자상거래, 교육, 그리고 법.

예를 들어 문서 관리, 문맥 색인화 등의 작업에 활용되며, '시각-언어' 기능도 향후 시각장애인에게 도움이 될 것으로 기대된다.

또한 Falcon 2는 GPU 하나만 있으면 효율적으로 실행할 수 있으며 노트북에 쉽게 배포할 수 있습니다.

Falcon의 상용화 과정을 가속화하기 위해 ATRC는 지난해 11월 AI71이라는 새로운 회사를 설립했습니다.

Falcon 모델을 기반으로 AI71은 UAE의 교육, 의료, 법률 및 기타 분야에 진출했습니다. 그리고 곧 UAE를 넘어 확장할 계획입니다. Falcon의 이번 업그레이드는 상용화 프로세스에 대한 강력한 지원을 제공합니다.

오픈 소스 Falcon 고집

TII가 출시한 인공 지능 모델은 항상 세계 최고 수준이었습니다. 새로 출시된 Falcon 2 11B 모델은 다시 한번 TII의 위치를 ​​안정시켰습니다.

더 중요한 것은 이번 업데이트의 두 모델 버전 모두 오픈 소스이므로 전 세계 개발자가 제한 없이 사용할 수 있으며 이를 기반으로 개발 및 배포가 가능하다는 것입니다. 모델이 보여준 탁월한 성능은 TII가 오픈 소스 세계의 지배력을 놓고 Meta와 경쟁할 것으로 예상된다는 것을 의미합니다.

아부다비 첨단 기술 연구 위원회(ATRC) 사무총장인 파이살 알 반나이(Faisal Al Bannai)는 계속해서 오픈 소스 혁신을 촉진하고 전 세계 개발자들이 AI 여정을 실현할 수 있도록 돕겠다고 약속했습니다.

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

TII의 수석 연구원인 Dr. Hakim Hacid도 다음과 같이 말했습니다. 인공지능의 사용 편의성은 사용자에게 이미지에서 텍스트까지 혁신적인 방식으로 상호 작용할 수 있는 새로운 가능성을 열어준다”고 밝혔으며, TII는 곧 출시될 Falcon 2의 차세대 모델을 준비 중이라고 밝혔다. 모델은 MoE(Mix of Experts) 기술을 통해 더욱 향상될 것입니다.

오픈소스와 클로즈드소스 간의 전쟁은 아직 정해지지 않았습니다. 그러나 어쨌든 TII는 AGI 분야에서 강력한 세력이 되었습니다. 그 뒤에는 UAE의 하향식 공동 노력이 있습니다. 그들은 인공 지능 개발을 적극적으로 추진하고 있으며 이 기술을 석유 다음의 경제 기둥으로 간주하고 있습니다. .

팔콘은 단지 '진지한 참여자'로서 존재하는 것이 아니라, 큰 야망을 가지고 날아다니는 '매'로 존재합니다.

위 내용은 팔콘이 1년만에 돌아왔습니다! 110억 개의 매개변수와 5조 5천억 개의 토큰, Llama 3를 능가하는 성능의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.