首頁  >  文章  >  科技週邊  >  阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

王林
王林轉載
2023-09-25 22:25:051006瀏覽

2021年9月25日,阿里雲發布了開源專案通義千問140億參數模型Qwen-14B以及其對話模型Qwen-14B-Chat,並且可以免費商用。 Qwen-14B在多個權威評測中表現出色,超過了同等規模的模型,甚至有些指標接近Llama2-70B。先前,阿里雲也開源了70億參數模型Qwen-7B,僅一個多月的時間下載量就突破了100萬,成為開源社群的熱門項目

Qwen-14B是一款支援多種語言的高效能開源模型,相較於同類模型使用了更多的高品質數據,整體訓練數據超過3兆Token,使得模型具備更強大的推理、認知、規劃和記憶能力。 Qwen-14B最大支援8k的上下文視窗長度。 阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

圖1:Qwen-14B在十二個權威測評中全方位超越同規模SOTA大模型

Qwen-14B-Chat是在基座模型上經過精細SFT得到的對話模型。借助基座模型強大效能,Qwen-14B-Chat生成內容的準確度大幅提升,也更符合人類偏好,內容創作上的想像和豐富度也有顯著擴展。

Qwen具備出色的工具呼叫能力,可以幫助開發者更快地建立基於Qwen的智能體。開發者可以使用簡單的指令來教導Qwen使用複雜的工具,例如使用Code Interpreter工具來執行Python程式碼進行複雜的數學計算、資料分析和圖表繪製等。此外,Qwen還可以開發出具備多文檔問答和長文寫作等能力的"高級數字助理"

百億以內參數級別的大型語言模型目前是開發者進行應用開發和迭代的主流選擇。 Qwen-14B進一步提高了小尺寸模型的表現上限,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評中取得了最優成績,超越了所有測評中的SOTA(State-Of -The-Art)大型模型,也全面超越了Llama-2-13B。同時,Qwen-7B也進行了全新升級,核心指標最高提升了22.5%

阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

#重寫後的內容:圖2:Qwen-14B在相同尺寸模型上表現出更強的性能

用戶可以直接從魔搭社群下載模型,也可以透過阿里雲靈積平台存取和呼叫Qwen-14B和Qwen-14B-Chat 。阿里雲為用戶提供完整的服務,包括模型訓練、推理、部署和精調等方面

8月,阿里雲開源通義千問70億參數基座模型Qwen-7B,先後衝上HuggingFace、Github的trending名單。短短一個多月,累計下載量突破100萬。開源社群出現了50多個基於Qwen的模型,社群多個知名的工具和框架都整合了Qwen。

阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

通義千問是中國最深入、應用最廣泛的大型模型。國內已經有許多應用程式接入通義千問,這些應用程式的每月活躍用戶已經超過億。許多中小企業、科研機構和個人開發者都在使用通義千問開發專屬的大型模型或應用產品。例如,阿里巴巴旗下的淘寶、釘子和未來精靈,以及外部的科研機構和創業企業

浙江大學聯合高等教育出版社基於Qwen-7B開發了智海-三樂教育垂直大模型,已在全國12所大學應用。此模型具備智慧問答、試題生成、學習導航、教學評估等功能。模型已在阿里雲靈積平台上提供服務,只需一行程式碼即可呼叫。 浙江有鹿機器人科技有限公司在路面清潔機器人中整合了Qwen-7B,使機器人能夠與用戶進行即時交互,並理解用戶的需求。它能夠分析和拆解用戶的高層指令,進行邏輯分析和任務規劃,從而完成清潔任務

阿里雲CTO週靖人表示,阿里雲將持續支持和推動開源開放,致力於推動中國大模型生態系的建設。阿里雲堅信開源開放的力量,率先開源了自家研發的大模型技術,希望能夠讓更多的中小企業和個人開發者更快地接觸和應用大模型技術

#阿里雲還領導著中國最大的AI模型開源社群魔搭ModelScope的建設,團結全行業的力量,共同推動大模型技術的普及和應用的實施。在過去的兩個月內,魔搭社群的模型下載量從4500萬飆升到8500萬,成長接近100%

重新撰寫的內容如下:附:

魔搭社區模型位址:

#魔搭社群模式體驗是什麼?
  • https://www.php.cn/link/bd21307bad44dee908db2db5f6bf23c1
  •  

#阿里雲靈積平台位址:
  • #阿里雲靈積平台位址:

  • #https://www.php.cn/link/e44cf9762b402f5d8b5bc36f60304a15

#########https://www.php.cn/link/784a9c5bcc529fa412b038c974aac419############HuggingFace(擁抱臉):#################HuggingFace(擁抱臉):####### #####https://www.php.cn/link/0247f3dd84906223785fddb18353bafe############https://www.php.cn/link/0247f3dd84906223785fddb18353/0247f3dd84906223785fddb#ba# ####

以上是阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jiqizhixin.com。如有侵權,請聯絡admin@php.cn刪除