搜尋
首頁科技週邊人工智慧阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

2021年9月25日,阿里雲發布了開源專案通義千問140億參數模型Qwen-14B以及其對話模型Qwen-14B-Chat,並且可以免費商用。 Qwen-14B在多個權威評測中表現出色,超過了同等規模的模型,甚至有些指標接近Llama2-70B。先前,阿里雲也開源了70億參數模型Qwen-7B,僅一個多月的時間下載量就突破了100萬,成為開源社群的熱門項目

Qwen-14B是一款支援多種語言的高效能開源模型,相較於同類模型使用了更多的高品質數據,整體訓練數據超過3兆Token,使得模型具備更強大的推理、認知、規劃和記憶能力。 Qwen-14B最大支援8k的上下文視窗長度。 阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

圖1:Qwen-14B在十二個權威測評中全方位超越同規模SOTA大模型

Qwen-14B-Chat是在基座模型上經過精細SFT得到的對話模型。借助基座模型強大效能,Qwen-14B-Chat生成內容的準確度大幅提升,也更符合人類偏好,內容創作上的想像和豐富度也有顯著擴展。

Qwen具備出色的工具呼叫能力,可以幫助開發者更快地建立基於Qwen的智能體。開發者可以使用簡單的指令來教導Qwen使用複雜的工具,例如使用Code Interpreter工具來執行Python程式碼進行複雜的數學計算、資料分析和圖表繪製等。此外,Qwen還可以開發出具備多文檔問答和長文寫作等能力的"高級數字助理"

百億以內參數級別的大型語言模型目前是開發者進行應用開發和迭代的主流選擇。 Qwen-14B進一步提高了小尺寸模型的表現上限,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評中取得了最優成績,超越了所有測評中的SOTA(State-Of -The-Art)大型模型,也全面超越了Llama-2-13B。同時,Qwen-7B也進行了全新升級,核心指標最高提升了22.5%

阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

#重寫後的內容:圖2:Qwen-14B在相同尺寸模型上表現出更強的性能

用戶可以直接從魔搭社群下載模型,也可以透過阿里雲靈積平台存取和呼叫Qwen-14B和Qwen-14B-Chat 。阿里雲為用戶提供完整的服務,包括模型訓練、推理、部署和精調等方面

8月,阿里雲開源通義千問70億參數基座模型Qwen-7B,先後衝上HuggingFace、Github的trending名單。短短一個多月,累計下載量突破100萬。開源社群出現了50多個基於Qwen的模型,社群多個知名的工具和框架都整合了Qwen。

阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型

通義千問是中國最深入、應用最廣泛的大型模型。國內已經有許多應用程式接入通義千問,這些應用程式的每月活躍用戶已經超過億。許多中小企業、科研機構和個人開發者都在使用通義千問開發專屬的大型模型或應用產品。例如,阿里巴巴旗下的淘寶、釘子和未來精靈,以及外部的科研機構和創業企業

浙江大學聯合高等教育出版社基於Qwen-7B開發了智海-三樂教育垂直大模型,已在全國12所大學應用。此模型具備智慧問答、試題生成、學習導航、教學評估等功能。模型已在阿里雲靈積平台上提供服務,只需一行程式碼即可呼叫。 浙江有鹿機器人科技有限公司在路面清潔機器人中整合了Qwen-7B,使機器人能夠與用戶進行即時交互,並理解用戶的需求。它能夠分析和拆解用戶的高層指令,進行邏輯分析和任務規劃,從而完成清潔任務

阿里雲CTO週靖人表示,阿里雲將持續支持和推動開源開放,致力於推動中國大模型生態系的建設。阿里雲堅信開源開放的力量,率先開源了自家研發的大模型技術,希望能夠讓更多的中小企業和個人開發者更快地接觸和應用大模型技術

#阿里雲還領導著中國最大的AI模型開源社群魔搭ModelScope的建設,團結全行業的力量,共同推動大模型技術的普及和應用的實施。在過去的兩個月內,魔搭社群的模型下載量從4500萬飆升到8500萬,成長接近100%

重新撰寫的內容如下:附:

魔搭社區模型位址:

#魔搭社群模式體驗是什麼?
  • https://www.php.cn/link/bd21307bad44dee908db2db5f6bf23c1
  •  

#阿里雲靈積平台位址:
  • #阿里雲靈積平台位址:

  • #https://www.php.cn/link/e44cf9762b402f5d8b5bc36f60304a15

#########https://www.php.cn/link/784a9c5bcc529fa412b038c974aac419############HuggingFace(擁抱臉):#################HuggingFace(擁抱臉):####### #####https://www.php.cn/link/0247f3dd84906223785fddb18353bafe############https://www.php.cn/link/0247f3dd84906223785fddb18353/0247f3dd84906223785fddb#ba# ####

以上是阿里雲通義千問14B模型開源!性能超越Llama2等同等尺寸模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?擁抱面部是否7B型號奧林匹克賽車擊敗克勞德3.7?Apr 23, 2025 am 11:49 AM

擁抱Face的OlympicCoder-7B:強大的開源代碼推理模型 開發以代碼為中心的語言模型的競賽正在加劇,擁抱面孔與強大的競爭者一起參加了比賽:OlympicCoder-7B,一種產品

4個新的雙子座功能您可以錯過4個新的雙子座功能您可以錯過Apr 23, 2025 am 11:48 AM

你們當中有多少人希望AI可以做更多的事情,而不僅僅是回答問題?我知道我有,最近,我對它的變化感到驚訝。 AI聊天機器人不僅要聊天,還關心創建,研究

Camunda為經紀人AI編排編寫了新的分數Camunda為經紀人AI編排編寫了新的分數Apr 23, 2025 am 11:46 AM

隨著智能AI開始融入企業軟件平台和應用程序的各個層面(我們必須強調的是,既有強大的核心工具,也有一些不太可靠的模擬工具),我們需要一套新的基礎設施能力來管理這些智能體。 總部位於德國柏林的流程編排公司Camunda認為,它可以幫助智能AI發揮其應有的作用,並與新的數字工作場所中的準確業務目標和規則保持一致。該公司目前提供智能編排功能,旨在幫助組織建模、部署和管理AI智能體。 從實際的軟件工程角度來看,這意味著什麼? 確定性與非確定性流程的融合 該公司表示,關鍵在於允許用戶(通常是數據科學家、軟件

策劃的企業AI體驗是否有價值?策劃的企業AI體驗是否有價值?Apr 23, 2025 am 11:45 AM

參加Google Cloud Next '25,我渴望看到Google如何區分其AI產品。 有關代理空間(此處討論)和客戶體驗套件(此處討論)的最新公告很有希望,強調了商業價值

如何為抹布找到最佳的多語言嵌入模型?如何為抹布找到最佳的多語言嵌入模型?Apr 23, 2025 am 11:44 AM

為您的檢索增強發電(RAG)系統選擇最佳的多語言嵌入模型 在當今的相互聯繫的世界中,建立有效的多語言AI系統至關重要。 強大的多語言嵌入模型對於RE至關重要

麝香:奧斯汀的機器人需要每10,000英里進行干預麝香:奧斯汀的機器人需要每10,000英里進行干預Apr 23, 2025 am 11:42 AM

特斯拉的Austin Robotaxi發射:仔細觀察Musk的主張 埃隆·馬斯克(Elon Musk)最近宣布,特斯拉即將在德克薩斯州奧斯汀推出的Robotaxi發射,最初出於安全原因部署了一支小型10-20輛汽車,並有快速擴張的計劃。 h

AI震驚的樞軸:從工作工具到數字治療師和生活教練AI震驚的樞軸:從工作工具到數字治療師和生活教練Apr 23, 2025 am 11:41 AM

人工智能的應用方式可能出乎意料。最初,我們很多人可能認為它主要用於代勞創意和技術任務,例如編寫代碼和創作內容。 然而,哈佛商業評論最近報導的一項調查表明情況並非如此。大多數用戶尋求人工智能的並非是代勞工作,而是支持、組織,甚至是友誼! 報告稱,人工智能應用案例的首位是治療和陪伴。這表明其全天候可用性以及提供匿名、誠實建議和反饋的能力非常有價值。 另一方面,營銷任務(例如撰寫博客、創建社交媒體帖子或廣告文案)在流行用途列表中的排名要低得多。 這是為什麼呢?讓我們看看研究結果及其對我們人類如何繼續將

公司競爭AI代理的採用公司競爭AI代理的採用Apr 23, 2025 am 11:40 AM

AI代理商的興起正在改變業務格局。 與雲革命相比,預計AI代理的影響呈指數增長,有望徹底改變知識工作。 模擬人類決策的能力

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。