今年2 月份,機器之心報導了復旦大學推出中國版ChatGPT 的消息(請參閱《復旦發布中國版ChatGPT:MOSS 開啟測試衝上熱搜,伺服器擠爆》),引起了廣泛關注。當時,邱錫鵬教授就曾表示將於四月開源 Moss。
昨天,開源版的 Moss 真的來了。
#專案位址:https://github.com/OpenLMLab/MOSS
MOSS 是一個支援中英雙語和多種外掛程式的開源對話語言模型,但參數數量比ChatGPT 少得多。在 v0.0.2 之後,團隊持續調整,推出了 MOSS v0.0.3,也就是目前開源的版本。相較於早期版本,功能也實現了多項更新。
在最初的測試中,MOSS 的基礎功能與ChatGPT 類似,可以依照使用者輸入的指令完成各類自然語言處理任務,包括文字產生、文字摘要、翻譯、程式碼生成、閒聊等等。
開放內測後,團隊繼續加大中文語料的預訓練:「截止目前,MOSS 003 的基座語言模型已經在100B 中文token 上進行了訓練,總訓練token 數量達到700B,其中還包含約300B 代碼。」
在開放內測後,我們也收集了一些用戶數據,我們發現真實中文世界的用戶意圖和OpenAI InstructGPT 論文中披露的user prompt 分佈有較大差異(這不僅與用戶來自的國家差異有關,也跟產品上線時間有關,早期產品採集的數據中存在大量對抗性和測試性輸入),於是我們以這部分真實數據作為seed 重新產生了約110 萬常規對話數據,涵蓋更細粒度的helpfulness 數據和更廣泛的harmlessness 數據。
內容來源:https://www.zhihu.com/question/596908242/answer/2994534005
#目前,團隊已將moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三個模型上傳到HuggingFace。後續,還有三個模型將會開源。
根據專案首頁介紹,moss-moon 系列模型具有160 億參數,在FP16 精度下可在單張A100/A800 或兩張3090 顯示卡運行,在INT4/8 精度下可在單張3090 顯示卡運行。
團隊同時表示,由於模型參數量較小和自回歸生成範式,MOSS 仍然可能產生包含事實性錯誤的誤導性回應或包含偏見/ 歧視的有害內容,請謹慎辨別並使用MOSS 產生的內容,請勿將MOSS 產生的有害內容傳播至網路。
新增能力
在 MOSS v0.0.3 中,團隊加入了多項新能力。
團隊建構了約 30 萬個插件增強的對話數據,包含搜尋引擎、文生圖、計算器、方程式求解等。關於插件版 MOSS 如何使用,後續團隊將在 GitHub 公佈。
MOSS v0.0.3 現已引入使用多種外掛程式的能力。
下圖展示了呼叫搜尋引擎的能力:
下圖展示了呼叫方程式求解器的能力:
下圖展示了從文字產生圖片的能力:
專案作者孫天祥補充說,MOSS 003 支援啟用插件的能力是透過 meta instruction 來控制,類似 gpt-3.5-turbo 裡的 system prompt。 「因為是模型控制的,所以並不能保證100% 控制率,以及還存在一些多選插件時調用不準、插件互相打架的缺陷,我們正在盡快開發新的模型來緩解這些問題。」
下載安裝
下載本倉庫內容至本機/ 遠端伺服器:
git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS
建立conda 環境:
conda create --name moss pythnotallow=3.8 conda activate moss
安裝依賴:
pip install -r requirements.txt
其中torch 和transformers 版本不建議低於建議版本。
根據協議,開源的MOSS 可用於商業用途:
此外,開發者也可透過API 呼叫MOSS 服務,團隊將根據目前服務壓力考慮透過API 介面形式提供服務,介面格式可參考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf
目前,已有開發者根據開源內容進行而創,例如透過VideoChat 進行視訊問答。
VideoChat 是一款多功能影片問答工具,結合了動作辨識、視覺字幕和 StableLM 的功能。該工具可為影片中的任何物件和動作產生密集的描述性字幕,提供一系列語言風格以滿足不同的使用者偏好。它支援使用者進行不同長度、情緒、語言真實性的對話。
#專案位址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS
#以上是160億參數,新增多項能力,復旦MOSS開源了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Dreamweaver Mac版
視覺化網頁開發工具

記事本++7.3.1
好用且免費的程式碼編輯器