Baichuan Intelligent は Baichuan-13B AI モデルをリリースし、「130 億のパラメータがオープンソースで商用利用可能」と主張
IT ホーム 7 月 11 日のニュースによると、Wang Xiaochuan の子会社である Baichuan Intelligence は本日、「130 億パラメータのオープンソースで商用利用可能」として知られる Baichuan-13B 大型モデルをリリースしました。
▲ 画像ソース Baichuang-13B GitHub ページ
公式の紹介によると、Baichuan-13B は、Baichuan-7B の後に Baichuan Intelligent によって開発された、130 億個のパラメータを含むオープンソースの商用利用可能な大規模言語モデルであり、両方の同じサイズのモデルの中で最高の結果を達成しています。中国語と英語のベンチマーク。このリリースには、事前トレーニング (Baichuan-13B-Base) と調整 (Baichuan-13B-Chat) の 2 つのバージョンが含まれています。
▲ 画像ソース Baichuang-13B GitHub ページ
Baichuan-13B には次の特徴があると公式に主張されています:
- より大きなサイズ、より多くのデータ: Baichuan-13B は、Baichuan-7B に基づいてパラメーターの数をさらに 130 億に拡張し、高品質のコーパスで 1 兆 4000 億のトークンをトレーニングします。これは、LLaMA-13B を 40% 上回ります。 13B サイズで最大量のトレーニング データを備えたオープン ソース モデル。中国語と英語のバイリンガルをサポートし、ALiBi 位置エンコーディングを使用し、コンテキスト ウィンドウの長さは 4096 です。
- オープンソースの事前トレーニングモデルとアライメントモデルを同時に提供: 事前トレーニングモデルは開発者にとっての「ベース」ですが、大多数の一般ユーザーは対話機能を備えたアライメントモデルに対する強いニーズを持っています。したがって、このプロジェクトには、強力な会話機能を備えた調整モデル (Baichuan-13B-Chat) も含まれており、すぐに使用でき、数行のコードで簡単に導入できます。
- より効率的な推論: より幅広いユーザーの使用をサポートするために、プロジェクトは int8 と int4 の量子化バージョンもオープンソース化しました。非定量化バージョンと比較して、デプロイメント マシンのリソースしきい値が大幅に削減されます。効果の損失がほとんどなく、NVIDIA RTX3090 などのコンシューマーグレードのグラフィックス カードに導入できます。
- オープンソース、商用利用は無料: Baichuan-13B は学術研究に完全に公開されているだけでなく、開発者は電子メールで申請して正式な商用ライセンスを取得した後、無料で使用することもできます。
現在、このモデルは HuggingFace、GitHub、Model Scope で公開されているので、興味のある IT House の友人はアクセスして詳細を学ぶことができます。
以上がBaichuan Intelligent は Baichuan-13B AI モデルをリリースし、「130 億のパラメータがオープンソースで商用利用可能」と主張の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

AIの急速な統合により悪化した職場での急成長能力の危機は、増分調整を超えて戦略的な変化を要求します。 これは、WTIの調査結果によって強調されています。従業員の68%がワークロードに苦労しており、BURにつながります

ジョン・サールの中国の部屋の議論:AIの理解への挑戦 Searleの思考実験は、人工知能が真に言語を理解できるのか、それとも真の意識を持っているのかを直接疑問に思っています。 チャインを無知な人を想像してください

中国のハイテク大手は、西部のカウンターパートと比較して、AI開発の別のコースを図っています。 技術的なベンチマークとAPI統合のみに焦点を当てるのではなく、「スクリーン認識」AIアシスタントを優先しています。

MCP:AIシステムに外部ツールにアクセスできるようになります モデルコンテキストプロトコル(MCP)により、AIアプリケーションは標準化されたインターフェイスを介して外部ツールとデータソースと対話できます。人類によって開発され、主要なAIプロバイダーによってサポートされているMCPは、言語モデルとエージェントが利用可能なツールを発見し、適切なパラメーターでそれらを呼び出すことができます。ただし、環境紛争、セキュリティの脆弱性、一貫性のないクロスプラットフォーム動作など、MCPサーバーの実装にはいくつかの課題があります。 Forbesの記事「人類のモデルコンテキストプロトコルは、AIエージェントの開発における大きなステップです」著者:Janakiram MSVDockerは、コンテナ化を通じてこれらの問題を解決します。 Docker Hubインフラストラクチャに基づいて構築されたドキュメント

最先端のテクノロジーと巧妙なビジネスの洞察力を活用して、コントロールを維持しながら非常に収益性の高いスケーラブルな企業を作成する先見の明のある起業家によって採用された6つの戦略。このガイドは、建設を目指している起業家向けのためのものです

Google Photosの新しいウルトラHDRツール:画像強化のゲームチェンジャー Google Photosは、強力なウルトラHDR変換ツールを導入し、標準的な写真を活気のある高ダイナミックレンジ画像に変換しました。この強化は写真家に利益をもたらします

技術アーキテクチャは、新たな認証の課題を解決します エージェントアイデンティティハブは、AIエージェントの実装を開始した後にのみ多くの組織が発見した問題に取り組んでいます。

(注:Googleは私の会社であるMoor Insights&Strategyのアドバイザリークライアントです。) AI:実験からエンタープライズ財団まで Google Cloud Next 2025は、実験機能からエンタープライズテクノロジーのコアコンポーネント、ストリームへのAIの進化を紹介しました


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ホットトピック









