0門檻免費商用！孟子3-13B大模型正式開源，萬億token資料訓練-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

0門檻免費商用！孟子3-13B大模型正式開源，萬億token資料訓練

PHPz

Apr 01, 2024 pm 05:01 PM

模型開源訓練

瀾舟科技官宣：孟子3-13B大模型正式開源！

這款主打高性價比的輕量化大模型，面向學術研究完全開放，並支持免費商用。

在MMLU、GSM8K、HUMAN-EVAL等各項基準測評估中，孟子3-13B都展現了不錯的表現。

尤其在參量20B以內的輕量化大模型領域，中英文語言能力方面尤為突出。數學和程式設計能力也位於前列。

△以上結果基於5-shot。

據介紹，孟子3-13B大模型是基於Llama架構，資料集規模高達3T Tokens。

語料精選自網頁、百科、社群、媒體、新聞，以及高品質的開源資料集。透過在萬億tokens上進行多語言語料的繼續訓練，模型的中文能力突出並且兼顧多語言能力。

孟子3-13B大模型開源

只要兩步，就能使用孟子3-13B大模型了。

先進行環境配置。

pip install -r requirements.txt

然後快速開始。

import torchfrom transformers import AutoModelForCausalLM, AutoTokenizertokenizer = AutoTokenizer.from_pretrained("Langboat/Mengzi3-13B-Base", use_fast=False, trust_remote_code=True)model = AutoModelForCausalLM.from_pretrained("Langboat/Mengzi3-13B-Base", device_map="auto", trust_remote_code=True)inputs = tokenizer('指令：回答以下问题。输入：介绍一下孟子。输出：', return_tensors='pt')if torch.cuda.is_available():inputs = inputs.to('cuda')pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)print(tokenizer.decode(pred[0], skip_special_tokens=True))

此外，他們還提供了一個範例程式碼，可用於基礎模型進行單輪交互推理。

cd examplespython examples/base_streaming_gen.py --model model_path --tokenizer tokenizer_path

如果想要進行模型微調，他們也提供了相關檔案和程式碼。

0門檻免費商用！孟子3-13B大模型正式開源，萬億token資料訓練

事實上，早在3月18日的瀾舟大模型技術與產品發表會現場，就透露了孟子3-13B大模型的諸多細節。

當時他們表示，孟子3-13B大模型訓練已經完成。

對於選擇13B版本的原因，周明解釋：

首先，瀾舟明確以服務ToB場景為主，ToC為輔。

實務發現，ToB場景使用頻率最高的大模型參數量多為7B、13B、40B、100B，整體集中在10B-100B之間。

其次，在這個區間範圍內，從ROI（投資報酬率）角度來講，既滿足場景需求，又最具性價比。

因此，在很長一段時間內，瀾舟的目標都是在10B-100B參數規模範圍內，打造優質的產業大模型。

作為國內最早一批大模型創業團隊，去年3月，瀾舟就發布了孟子GPT V1（MChat）。

今年1月，孟子大模型GPT V2（含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼）對外開放。

好了，有興趣的朋友可戳下方連結體驗一下。

GitHub連結：https://github.com/Langboat/Mengzi3
HuggingFace：#https:// huggingface.co/Langboat/Mengzi3-13B-Base
ModelScope：https://www.modelscope.cn/models/langboat/Mengzi3-13B-Base
Wisemodel：https://wisemodel.cn/models/Langboat/Mengzi3-13B-Base

以上是0門檻免費商用！孟子3-13B大模型正式開源，萬億token資料訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

META的新AI助手：生產力助推器還是時間下沉？May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴，拓展了Llama Stack的企業級部署整合。在安全方面，Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具，並啟動了Llama Defenders計劃，以增強AI安全性。此外，Meta還向10個全球機構（包括致力於改善公共服務、醫療保健和教育的初創企業）發放了總額150萬美元的Llama Impact Grants。由Llama 4驅動的全新Meta AI應用，被設想為Meta AI

80％的Zers將嫁給AI：研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說，這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。零售商與機器人ho積產品，銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題，Rende

賣給機器人：將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷，並可能超過以前技術轉變的影響。這些代理代表了生成AI的重大進步，不僅是處理諸如chatgpt之類的處理信息，而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。首先，丹佛的尼古拉·喬基奇（Nikola Jokic）錯過了三分球，導致亞倫·戈登（Aaron Gordon）的最後一秒鐘。索尼的鷹

AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上，擴大重生醫學專業知識在全球範圍內要求廣泛的旅行，動手培訓和多年指導。現在，AI正在改變這一景觀，克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位，同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此，英特爾必須在業界建立更多信任，不僅要證明其工藝的競爭力，還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰，以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程，以更以客