中国最大の オープンソース モデルはこちらです:
650 億のパラメーターと 2 兆 6000 億から 3 兆 2000 億のトークンに基づくトレーニングを備えています。 「Falcon」「Alpaca」に次いで2位にランクされ、その性能はGPT3.5に匹敵し、無条件で商用利用が可能になりました。
3 つの能力 :
1. 理解、生成、推論、記憶などの基本能力から、モデルの多様性、創造性まで優れたものから強力なものまで、精度の高いパフォーマンスを実現します;2. ツール呼び出し、コード解釈、反映と修正などの機能を拡張し、インテリジェント エージェントを構築するための技術的基盤を築きました(AI エージェント) およびモデルの実用性の向上;
3. 7B および 13B で一般的でおそらく深刻な幻覚問題を大幅に軽減し、大規模モデルの「無意味」を減らし、精度と専門性を向上させます。 Yuanxiang 大型モデル シリーズはすべて自社開発であり、多数の主要テクノロジーと研究開発イノベーションをカバーしています:1. 複雑な分散システム設計:
Tencent Go AI「Jue Yi」やKing of Glory AI「Jue Wu」、自社開発の効率的なオペレーター、メモリ最適化、並列スケジューリング戦略、データコンピューティングと通信のオーバーラップなどの大規模システム開発におけるチームの豊富な経験を活用、プラットフォームとフレームワークコラボレーションとその他の主要テクノロジーを使用して、効率的で安定したトレーニング システムを構築し、キロカロリー クラスターのピーク演算能力利用率は 58.5% に達し、業界トップにランクされます。2. 総合的なパフォーマンスの向上:
65B トレーニングでは、FlashAttendant2 を使用して計算を高速化し、3D に基づく仮想パイプライン(仮想パイプライン) テクノロジーを使用します。並列処理により、長いパイプラインによって生成される過剰なバブル レートが減少し、計算推論の効率が向上します。コンテキスト ウィンドウの長さは 8K から 16K まで段階的に増加し、長文の理解、長文の生成、超高速テキストの生成などの複雑なタスクを適切に完了できるだけでなく、ツールの呼び出し、コードの解釈、反映と修正の機能により、インテリジェント エージェント (AI エージェント) をより適切に構築できます。
3. トレーニングの安定性を大幅に向上:
膨大な量の計算により、65B トレーニングでは通信の輻輳、チップの過熱、計算ノードの障害が常態化しています。初期段階では、1 週間で最も多く発生した障害は 8 件でした。 クラスター インフラストラクチャの運用、リソース スケジューリング、トレーニング フレームワーク、およびスケジューリング プラットフォームの連携を継続的に最適化することにより、Yuanxiang は、安定性が高く、中断が少なく、強力なフォールト トレラントなトレーニング システムを構築し、毎週の有効トレーニング率を98.6%。 さらに、約 1.6 兆個のトークンを使用したモデルのトレーニングの途中で、損失関数によって NaN 値が生成され、トレーニングが中断される可能性がありました。 通常、業界では分析後に関連するデータ間隔を削除します。 チームは経験に基づいて、これはモデルの自然な進化であると判断し、データを削除しないことを選択し、関連するパラメーターの更新を直接スキップしました。最終的に、NaN 値の問題は解決されました。 パラメータ値、活性化値、勾配値などの中間状態のさらなる分析により、この問題が最後の変圧器ブロックの活性化値の最大値の変化に関連している可能性があることが判明しました。モデルのレイヤーを最大値にして徐々に減少していきますので、ご自身で解決してください。GPT3.5 に匹敵するパフォーマンス
業界が Yuanxiang 大型モデルのパフォーマンスを包括的、客観的かつ長期的に理解できるようにするために、研究者は一連の信頼できる文献を参照しました。知識、推論、数学、コードを含む 6 つの側面における 11 の主流で権威のある評価基準は、今後も使用され、反復されます。
XVERSE-65Bは中国には比較対象となる同レベルのモデルが存在しませんが、海外ベンチマークとの比較評価ではいくつかの指標を上回り、全体的な性能はGPT3と同等でした。 5; オープン ソース ベンチマーク Llama2 -70B および Falcon-180B を総合的に上回りましたが、GPT4 とはまだ のギャップがあります。
完全にアップグレードされた XVERSE-13B-2 は、同じサイズのモデルと比較して大量の高品質なデータを追加し、学習データは 3.2 兆件に達し、大幅に向上しました。 「小型」モデルのパフォーマンス、能力の限界。
文系と理系の両方を研究し、文系の利点を維持しています。Q&A は 18% 向上し、科学は大幅に進歩し、コーディングは 149% 向上し、数学は 198% 向上しました。評価では、Llama2やBaichuan2といった国内外のオープンソースベンチマークを完全に上回りました。
Yuanxiang の大きなモデル # は、Github、Hugging Face、Moda ModelScope などの複数のプラットフォームで「XVERSE」を検索することでダウンロードできます、簡単な登録後、無条件に無料で商用利用でき、中小企業、科学研究機関、個人開発者のほとんどのアプリケーションと反復ニーズを満たすことができます。
Yuanxiang は、モデルのトレーニング、推論、展開、微調整などのあらゆる技術サービスも提供し、エンターテインメント、金融、医療などのさまざまな業界を強化し、インテリジェントなサービスなどの複数のシナリオを支援します。顧客サービス、クリエイティブなライティング、正確な推奨事項を提供し、業界をリードするユーザー エクスペリエンスを創造します。
2023年10月、テンセントミュージックは率先して元祥モデルとの戦略的提携の締結を発表し、lyraXVERSEアクセラレーションモデルを共同で立ち上げ、音楽アシスタント「AI小琴」を包括的にアップグレードし、AIの探究を継続します。そして未来の3D、先進テクノロジー。
以上が中国最大のオープンソースモデルが無条件無料商用利用可能に公開! 650億のパラメータ、2兆6000億のトークンに基づくトレーニングの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

メモ帳++7.3.1
使いやすく無料のコードエディター

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
