搜尋
首頁科技週邊人工智慧160億參數,新增多項能力,復旦MOSS開源了

今年2 月份,機器之心報導了復旦大學推出中國版ChatGPT 的消息(請參閱《復旦發布中國版ChatGPT:MOSS 開啟測試衝上熱搜,伺服器擠爆》),引起了廣泛關注。當時,邱錫鵬教授就曾表示將於四月開源 Moss。

昨天,開源版的 Moss 真的來了。

160億參數,新增多項能力,復旦MOSS開源了

#專案位址:https://github.com/OpenLMLab/MOSS

MOSS 是一個支援中英雙語和多種外掛程式的開源對話語言模型,但參數數量比ChatGPT 少得多。在 v0.0.2 之後,團隊持續調整,推出了 MOSS v0.0.3,也就是目前開源的版本。相較於早期版本,功能也實現了多項更新。

在最初的測試中,MOSS 的基礎功能與ChatGPT 類似,可以依照使用者輸入的指令完成各類自然語言處理任務,包括文字產生、文字摘要、翻譯、程式碼生成、閒聊等等。

開放內測後,團隊繼續加大中文語料的預訓練:「截止目前,MOSS 003 的基座語言模型已經在100B 中文token 上進行了訓練,總訓練token 數量達到700B,其中還包含約300B 代碼。」

在開放內測後,我們也收集了一些用戶數據,我們發現真實中文世界的用戶意圖和OpenAI InstructGPT 論文中披露的user prompt 分佈有較大差異(這不僅與用戶來自的國家差異有關,也跟產品上線時間有關,早期產品採集的數據中存在大量對抗性和測試性輸入),於是我們以這部分真實數據作為seed 重新產生了約110 萬常規對話數據,涵蓋更細粒度的helpfulness 數據和更廣泛的harmlessness 數據。

內容來源:https://www.zhihu.com/question/596908242/answer/2994534005

#目前,團隊已將moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三個模型上傳到HuggingFace。後續,還有三個模型將會開源。

160億參數,新增多項能力,復旦MOSS開源了

根據專案首頁介紹,moss-moon 系列模型具有160 億參數,在FP16 精度下可在單張A100/A800 或兩張3090 顯示卡運行,在INT4/8 精度下可在單張3090 顯示卡運行。

團隊同時表示,由於模型參數量較小和自回歸生成範式,MOSS 仍然可能產生包含事實性錯誤的誤導性回應或包含偏見/ 歧視的有害內容,請謹慎辨別並使用MOSS 產生的內容,請勿將MOSS 產生的有害內容傳播至網路。

新增能力

在 MOSS v0.0.3 中,團隊加入了多項新能力。

團隊建構了約 30 萬個插件增強的對話數據,包含搜尋引擎、文生圖、計算器、方程式求解等。關於插件版 MOSS 如何使用,後續團隊將在 GitHub 公佈。

160億參數,新增多項能力,復旦MOSS開源了

MOSS v0.0.3 現已引入使用多種外掛程式的能力。

下圖展示了呼叫搜尋引擎的能力:

160億參數,新增多項能力,復旦MOSS開源了

下圖展示了呼叫方程式求解器的能力:

160億參數,新增多項能力,復旦MOSS開源了

下圖展示了從文字產生圖片的能力:

160億參數,新增多項能力,復旦MOSS開源了

專案作者孫天祥補充說,MOSS 003 支援啟用插件的能力是透過 meta instruction 來控制,類似 gpt-3.5-turbo 裡的 system prompt。 「因為是模型控制的,所以並不能保證100% 控制率,以及還存在一些多選插件時調用不準、插件互相打架的缺陷,我們正在盡快開發新的模型來緩解這些問題。」

下載安裝

下載本倉庫內容至本機/ 遠端伺服器:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

建立conda 環境:

conda create --name moss pythnotallow=3.8
conda activate moss

安裝依賴:

pip install -r requirements.txt

其中torch 和transformers 版本不建議低於建議版本。

根據協議,開源的MOSS 可用於商業用途:

160億參數,新增多項能力,復旦MOSS開源了

此外,開發者也可透過API 呼叫MOSS 服務,團隊將根據目前服務壓力考慮透過API 介面形式提供服務,介面格式可參考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf

目前,已有開發者根據開源​​內容進行而創,例如透過VideoChat 進行視訊問答。

VideoChat 是一款多功能影片問答工具,結合了動作辨識、視覺字幕和 StableLM 的功能。該工具可為影片中的任何物件和動作產生密集的描述性字幕,提供一系列語言風格以滿足不同的使用者偏好。它支援使用者進行不同長度、情緒、語言真實性的對話。

160億參數,新增多項能力,復旦MOSS開源了

#專案位址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS

#

以上是160億參數,新增多項能力,復旦MOSS開源了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?閱讀AI索引2025:AI是您的朋友,敵人還是副駕駛?Apr 11, 2025 pm 12:13 PM

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

開始使用Meta Llama 3.2 -Analytics Vidhya開始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

AV字節:Meta' llama 3.2,Google的雙子座1.5等AV字節:Meta' llama 3.2,Google的雙子座1.5等Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

與機器交談的人類成本:聊天機器人真的可以在乎嗎?與機器交談的人類成本:聊天機器人真的可以在乎嗎?Apr 11, 2025 pm 12:00 PM

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

了解Python的Scipy圖書館了解Python的Scipy圖書館Apr 11, 2025 am 11:57 AM

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

3種運行Llama 3.2的方法-Analytics Vidhya3種運行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

使用dagster自動化數據質量檢查使用dagster自動化數據質量檢查Apr 11, 2025 am 11:44 AM

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機在人工智能時代有角色嗎?大型機在人工智能時代有角色嗎?Apr 11, 2025 am 11:42 AM

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器