搜尋
首頁科技週邊人工智慧350億參數、開放權重,Transformer作者創業後推出新大模型

今天,由 Transformer 作者之一 Aidan Gomez 參與創立的人工智慧新創公司 Cohere 迎來了自家大模型的發布。

Cohere 最新發布的模型被命名為“Command-R”,擁有 35B 參數量,專為處理大規模生產工作負載而設計。此模型屬於「可擴展」類別,具備高效率和高精度的平衡特性,有助於企業用戶在超越概念驗證的基礎上進入生產階段。

350億參數、開放權重,Transformer作者創業後推出新大模型

Command-R 是一種生成模型,專門針對檢索增強生成(RAG)以及其他長上下文任務進行最佳化。透過結合外部 API 和工具,該模型旨在提高 RAG 應用程式的效能。它與行業領先的嵌入和重新排序模型協同工作,為企業用例提供出色的表現和一流的整合能力。

Command-R採用了經過最佳化的transformer架構,是一種自回歸語言模型。在預訓練完成後,模型透過監督微調(SFT)和偏好訓練的方式來確保與人類偏好保持一致,以實現更好的有用性和安全性。

具體而言,Command-R 具有以下功能特徵:

  • RAG 和工具使用方面的高度準確性
  • 低延遲、高吞吐量
  • 更長的128k 上下文和更低的價格
  • 跨10 種主要語言的強大功能
  • HuggingFace 上提供模型權重以供研究和評估

##Command-R目前可在Cohere的託管API上使用,並計劃不久將在主要雲端服務商上推出。這個版本是一系列模型中的首個,旨在提升對企業大規模採用至關重要的功能。

目前,Cohere 在 Huggingface 上開放了模型權重。

350億參數、開放權重,Transformer作者創業後推出新大模型

Huggingface 網址:https://huggingface.co/CohereForAI/c4ai-command-r-v01

高效能檢索增強產生(RAG)

檢索增強產生(RAG)已成為大語言模型部署中的關鍵模式。透過 RAG,企業能夠讓模型存取原本無法獲得的私有知識,搜尋私人資料庫並使用相關資訊形成回應,從而準確性和實用性將顯著提升。 RAG 的關鍵元件是:

  • 檢索:搜尋與回應使用者相關的資訊語料庫。
  • 增強產生:使用檢索到的資訊形成更明智的回應。

對於檢索,Cohere 的Embed 模型透過搜尋數百萬甚至數十億文件來改善上下文和語義理解,顯著提高了檢索步驟的實用性和準確性。同時,Cohere 的 Rerank 模型有助於進一步提高檢索資訊的價值,優化相關性和個人化等自訂指標的結果。

對於增強生成,透過識別最相關的訊息,Command-R 可以總結、分析、包裝這些信息,並幫助員工提高工作效率或創造全新的產品體驗。 Command-R 的獨特之處在於:此模型的輸出帶有明確的引文,可降低幻覺的風險,並能夠從來源材料中呈現更多背景資訊。

即使不使用自家的 Embed 和 Rerank 模型,Command-R 在可擴展的生成模型類別中也優於其他模型。不過當配合使用時,領先優勢顯著擴大,從而在更複雜的領域實現更高的性能。

下圖左為Command-R 與Mixtral 在一系列與企業相關的RAG 應用程式上,進行了Head-to-Head 整體人類偏好評估,充分考慮流暢度、答案實用性和引用。圖右為 Command-R(Embed Rerank)、Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-Turbo 等模型在 Natural Questions、TriviaQA 和 HotpotQA 等基準上的比較結果。 Cohere 的大模型實現了領先。

350億參數、開放權重,Transformer作者創業後推出新大模型#

強大的工具使用能力

大語言模型應該是核心的推理引擎,可以自動執行任務並採取實際行動,而不僅僅提取和生成文本的機器。 Command-R 透過使用工具(API)來實現這一目標,例如程式碼解釋器和其他使用者定義的工具,使模型能夠自動執行高度複雜的任務。

Tool Use 功能可讓企業開發人員將Command-R 轉變為引擎,以支援需要使用「資料庫和軟體工具等內部基礎設施」以及「CRM、搜尋引擎等外部工具”的任務和工作流程的自動化。這樣一來,我們可以實現跨多個系統且需要複雜推理和決策的耗時手動任務的自動化。

下圖為 Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-turbo,在使用搜尋工具時的多步驟推理能力比較。這裡使用到的資料集為 HotpotQA 和 Bamboogle。

350億參數、開放權重,Transformer作者創業後推出新大模型

多語言生成能力

Command-R 模型擅長全球10 種主要商業語言,包括英語、法語、西班牙語、義大利語、德語、葡萄牙語、日語、韓語、阿拉伯語和中文。

此外,Cohere 的 Embed 和 Rerank 模型本身就支援 100 多種語言。這使得用戶能夠從大量資料來源中得出答案,無論使用何種語言,都能以母語提供清晰準確的對話。

下圖為 Command-R 與 Llama 2 70B(chat)、Mixtral、GPT3.5-turbo 在多語言 MMLU 和 FLORES 上的比較。

350億參數、開放權重,Transformer作者創業後推出新大模型

更長的上下文和更低的價格

Command-R 支持了更長的上下文視窗——128k tokens。此次升級也降低了 Cohere 託管 API 的價格,並顯著提高了 Cohere 私有雲部署的效率。透過將更長的上下文視窗與更便宜的定價相結合,Command-R 解鎖了 RAG 用例,其中附加上下文可以顯著提高效能。

350億參數、開放權重,Transformer作者創業後推出新大模型

具體定價如下,其中Command 版本100 萬輸入tokens 1 美元,100 萬輸出tokens 2 美元;Command-R 版本100 萬輸入tokens 0.5 美元,100 萬輸出tokens 1.5 美元。

350億參數、開放權重,Transformer作者創業後推出新大模型

不久後,Cohere 也將放出一份簡短的技術報告,展示更多模型細節。

350億參數、開放權重,Transformer作者創業後推出新大模型

部落格網址:https://txt.cohere.com/command-r/

以上是350億參數、開放權重,Transformer作者創業後推出新大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。