首頁  >  文章  >  科技週邊  >  時隔一年Falcon回歸! 110億參數5.5兆token,效能超越Llama 3

時隔一年Falcon回歸! 110億參數5.5兆token,效能超越Llama 3

王林
王林原創
2024-06-09 17:25:311070瀏覽

這幾天,全世界的目光彷彿都被OpenAI發布的GPT-4o所吸引,同時,OpenAI的挑戰者們也在同步創造歷史。

就在5月14日,阿布達比先進技術研究委員會(ATRC)下屬的技術創新研究所(TII),發布了新一代的Falcon 2模型。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2 11B已開啟訪問,Falcon 2 11B VLM將在5月14日中午12點開放

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

#新一代「獵鷹」(Falcon意為獵鷹)重返競技場,一推出,迅速登上了HN熱榜第一。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

去年Falcon首次推出就技驚四座,以碾壓性的優勢超越了Llama。

根據Hugging Face排行榜,這次推出的Falcon 2 11B性能再次超越了Llama 3 8B,與領先的Gemma 7B性能相當,平均性得分僅差0.01。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

Falcon 2包含兩個版本:Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 兆個token上訓練出的大語言模型,後者則在此基礎上發展的「視覺到語言」模型。

作為一個開源的大語言模型,Falcon 2不僅具備多語言能力,而且支援多模態,可以將視覺輸入無縫轉換為文字輸出,這種功能是當今大模型市場的首創。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

只需要在使用者介面上傳一張圖片並輸入提示,就可以得到一段關於圖片的文字描述

#多語言+多模態

Falcon 2 11B 具有多語言能力,可以快速回應英語、法語、西班牙語、德語、葡萄牙語和其他各種語言的任務。

Falcon 2 11B VLM 作為視覺語言模型,能夠從環境中識別和解釋各種視覺訊息,因此在醫療、金融、電子商務、教育和法律等領域有廣泛的應用場景。

例如用於文件管理、上下文索引等任務,而且其「視覺到語言」的功能還有望在未來為視障人群提供幫助。

此外,Falcon 2只需一個GPU就能高效運行,可以輕易部署在筆記型電腦上。

為了加速推進Falcon商業化的進程,去年11月,ATRC就成立了一家新公司-AI71

基於Falcon模型,AI71已經進軍阿聯酋的教育、醫療、法律等多個領域,並計劃很快拓展到阿聯酋以外。 Falcon的本次升級,為其商業化進程提供了有力支撐。

堅持開源的Falcon

TII發布的人工智慧模型,在全球範圍內一直名列前茅,新推出的Falcon 2 11B 模型讓TII的地位再次得到穩固。

更重要的是,本次更新的兩個模型版本均已開源,全世界的開發人員都可以不受限制地使用,並在此基礎上進行開發和部署。模型展現的優秀表現意味著TII有望與Meta競爭開源宇宙霸主的地位。

阿布達比先進技術研究委員會(ATRC)秘書長 Faisal Al Bannai 承諾,將會堅持推動開源創新,幫助全世界的開發者們實現他們的AI之旅。

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

#

TII首席研究員Hakim Hacid博士也表示「開發人員正在認識到更小、更有效率模型的無數好處······這是下一個新興的大趨勢。此外,Falcon 2的視覺轉語言能力為人工智慧的易用性開闢了新的前景,為使用者提供了變革性的從圖像到文字的互動方式。 Falcon 2下一代模型,推出時間將在不久之後,這些模型的性能將透過專家混合(MoE)技術進一步增強。

開源與閉源之爭,戰局未定。但無論如何,TII已經成為AGI領域的一支勁旅,這背後是阿聯酋自上而下形成的合力,他們正全力推動人工智慧的發展,將這項技術視為繼石油之後的下一個經濟支柱。

Falcon不僅僅是作為「嚴肅的參與者」而存在,而是雄心勃勃地振翅盤旋的「獵鷹」。

以上是時隔一年Falcon回歸! 110億參數5.5兆token,效能超越Llama 3的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn