商用利用は敷居ゼロ！ Mencius 3-13B の大規模モデルは正式にオープンソースであり、数兆のトークンデータでトレーニングされています-AI-php.cn

ホームページ

テクノロジー周辺機器

商用利用は敷居ゼロ！ Mencius 3-13B の大規模モデルは正式にオープンソースであり、数兆のトークンデータでトレーニングされています

PHPz

Apr 01, 2024 pm 05:01 PM

モデルオープンソース電車

蘭州科技が正式に発表: Mencius 3-13B 大型モデルが正式にオープンソースになりました!

この軽量でコスト効率の高い大型モデルは、学術研究に完全にオープンであり、無料の商用利用をサポートしています。

Mencius 3-13B は、MMLU、GSM8K、HUMAN-EVAL などのさまざまなベンチマーク評価で優れたパフォーマンスを示しています。

特にパラメータ20B以内の軽量大型モデルの分野では、中国語と英語の語学力が特に優れています。数学やプログラミングのスキルも最前線にあります。

△上記の結果は5ショットに基づいています。

レポートによると、Mencius 3-13B の大規模モデルは Llama アーキテクチャに基づいており、データセットのサイズは 3T トークン に達します。

コーパスは、Web ページ、百科事典、ソーシャルメディア、メディア、ニュース、および高品質のオープンソースデータセットから選択されます。数兆のトークンを使用して多言語コーパスをトレーニングし続けることにより、このモデルは優れた中国語機能を備え、多言語機能を考慮しています。

Mencius 3-13B ラージモデルのオープンソース

Mencius 3-13B ラージモデルは、わずか 2 つの手順で使用できます。

最初に環境を構成します。

pip install -r requirements.txt

それでは早速始めましょう。

import torchfrom transformers import AutoModelForCausalLM, AutoTokenizertokenizer = AutoTokenizer.from_pretrained("Langboat/Mengzi3-13B-Base", use_fast=False, trust_remote_code=True)model = AutoModelForCausalLM.from_pretrained("Langboat/Mengzi3-13B-Base", device_map="auto", trust_remote_code=True)inputs = tokenizer('指令：回答以下问题。输入：介绍一下孟子。输出：', return_tensors='pt')if torch.cuda.is_available():inputs = inputs.to('cuda')pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)print(tokenizer.decode(pred[0], skip_special_tokens=True))

さらに、基本モデルを使用した単一ラウンドの対話型推論に使用できるサンプルコードも提供します。

cd examplespython examples/base_streaming_gen.py --model model_path --tokenizer tokenizer_path

モデルを微調整したい場合は、関連するファイルとコードも提供されます。

商用利用は敷居ゼロ！ Mencius 3-13B の大規模モデルは正式にオープンソースであり、数兆のトークンデータでトレーニングされています

実際、Mencius 3-13B 大型モデルの多くの詳細は、早くも 3 月 18 日の蘭州大型モデル技術および製品発表カンファレンスで明らかにされました。

その時点で、孟子 3-13B 大型モデルの学習が完了したと発表されました。

13B バージョンを選択した理由について、Zhou Ming 氏は次のように説明しました。

まず第一に、Lanzhou は ToC によって補完される ToB シナリオの提供に明らかに重点を置いています。

実践の結果、ToB シナリオで最も頻繁に使用される大規模モデルのパラメーターは、ほとんどが 7B、13B、40B、および 100B であり、全体的な集中度は 10B ～ 100B であることがわかりました。

第二に、この範囲内では、ROI (投資収益率) の観点から、現場のニーズを満たすだけでなく、最も費用対効果が高いことになります。

したがって、蘭州市の目標は、長い間、10B ～ 100B のパラメータースケール内で高品質の業界大規模モデルを作成することでした。

中国で最も初期の大規模モデル起業家チームの 1 つとして、蘭州市は昨年 3 月に Mencius GPT V1 (MChat) をリリースしました。

今年 1 月、Mencius Big Model GPT V2 (Mencius Big Model-Standard、Mencius Big Model-Lightweight、Mencius Big Model-Finance、Mencius Big Model-Encoding を含む) が一般公開されました。

わかりました。興味のあるお友達は、下のリンクをクリックして体験してください。

GitHub リンク: https://github.com/Langboat/Mengzi3
HuggingFace: https://ハギングフェイス.co/Langboat/Mengzi3-13B-Base
モデルスコープ：https://www.modelscope.cn/models/langboat/Mengzi3-13B-Base
ワイズモデル：https://wisemodel.cn/models/Langboat/Mengzi3-13B-Base

以上が商用利用は敷居ゼロ！ Mencius 3-13B の大規模モデルは正式にオープンソースであり、数兆のトークンデータでトレーニングされていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

メタの新しいAIアシスタント：生産性ブースターまたはタイムシンク？May 01, 2025 am 11:18 AM

Metaは、NVIDIA、IBM、Dellなどのパートナーと協力して、Llama Stackのエンタープライズレベルの展開統合を拡大しました。セキュリティの観点から、MetaはLlama Guard 4、Llamafirewall、Cyberseceval 4などの新しいツールを立ち上げ、AIセキュリティを強化するためにLlama Defendersプログラムを開始しました。さらに、METAは、公共サービス、ヘルスケア、教育の改善に取り組んでいる新興企業を含む、Llama Impact Grantsの150万ドルを10のグローバル機関に分配しています。 Llama 4を搭載した新しいメタAIアプリケーションは、メタAIとして考案されました

Gen Zersの80％はAI：研究と結婚しますMay 01, 2025 am 11:17 AM

人間との相互作用の先駆者であるJoi Aiは、これらの進化する関係を説明するために「AI-lationships」という用語を導入しました。 Joi Aiの関係療法士であるJaime Bronsteinは、これらが人間cを置き換えることを意図していないことを明確にしています

AIはインターネットのボット問題を悪化させています。この20億ドルのスタートアップは最前線にありますMay 01, 2025 am 11:16 AM

オンライン詐欺とボット攻撃は、企業にとって大きな課題をもたらします。小売業者は、ボットの買いだめ製品、銀行の戦闘口座の買収、ソーシャルメディアプラットフォームと戦い、なりすまし者と闘っています。 AIの台頭は、この問題を悪化させます

ロボットへの販売：あなたのビジネスを作ったり壊したりするマーケティング革命May 01, 2025 am 11:15 AM

AIエージェントは、マーケティングに革命をもたらす態勢が整っており、以前の技術的変化の影響を上回る可能性があります。これらのエージェントは、生成AIの大幅な進歩を表し、ChatGPTのような情報を処理するだけでなく、Actioも取る

コンピュータービジョンテクノロジーがどのようにNBAプレーオフを司会しているかMay 01, 2025 am 11:14 AM

重要なNBAゲーム4の決定に対するAIの影響 2つの重要なゲーム4 NBAマッチアップは、司会におけるAIのゲームを変える役割を紹介しました。最初に、デンバーのニコラ・ジョキッチの逃した3ポインターは、アーロン・ゴードンの最後の2秒の路地につながりました。ソニーのホー

AIがどのように再生医療の未来を加速しているかMay 01, 2025 am 11:13 AM

伝統的に、再生医療の専門知識を拡大すると、世界的に大規模な旅行、実践的なトレーニング、長年のメンターシップが必要でした。現在、AIはこの風景を変えており、地理的な制限を克服し、ENを通じて進歩を加速しています

Intel Foundry Direct Connect 2025からのキーテイクアウトMay 01, 2025 am 11:12 AM

Intelは、製造プロセスを主要な位置に戻すように取り組んでいますが、Fab Semiconductorの顧客を引き付けてFabでチップを作成しようとしています。この目的のために、Intelは、そのプロセスの競争力を証明するだけでなく、パートナーが馴染みのある成熟したワークフローでチップを製造できることを実証するために、業界へのより多くの信頼を築かなければなりません。今日私が聞いたことはすべて、インテルがこの目標に向かっていると信じています。新しいCEOのタンリバイの基調講演がその日をキックオフしました。タンリバイは簡単で簡潔です。彼は、IntelのFoundry Servicesにおけるいくつかの課題と、これらの課題に対処し、将来のIntelのFoundry Servicesの成功したルートを計画するために企業が行った対策を概説しています。 Tan Libaiは、IntelのOEMサービスが顧客をより多くするために実装されているプロセスについて話しました

AIが間違っていましたか？今、そのための保険がありますMay 01, 2025 am 11:11 AM

AIのリスクを取り巻く増大する懸念に対処するために、グローバルな専門家保険会社であるChaucer GroupとArmilla AIは、新しいサードパーティの責任（TPL）保険商品を導入するために力を合わせました。このポリシーは、企業を守ります

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

WebStorm Mac版

便利なJavaScript開発ツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。