検索
ホームページテクノロジー周辺機器AIAlibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速

10 月 31 日、Alibaba Cloud は、数千億のパラメーターを備えた大規模モデルである Tongyi Qianwen 2.0 を正式にリリースしました。 10 権威ある評価において、Tongyi Qianwen 2.0 の総合的なパフォーマンスは GPT-3.5 を超え、現在 Accelerate です。 GPT-4に追いつくために。同日、Tongyi Qianwen APP が主要モバイル アプリケーション市場で正式にリリースされ、誰もが APP を通じて最新モデルの機能を直接体験できます。

過去 6 か月で、Tongyi Qianwen 2.0 はパフォーマンスが大幅に向上しました。4 月にリリースされたバージョン 1.0 と比較して、Tongyi Qianwen 2.0複雑な指示を理解する能力、文学創作、一般的な数学、知識記憶、幻覚に抵抗する能力が大幅に向上しました 。現在、Tongyi Qianwen の総合パフォーマンスは GPT-3.5 を超え、GPT-4 に追いつくべく加速しています。

Alibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速

写真: Tongyi Qianwen 2.0 の総合パフォーマンスGPT-3.5 を超え、捕捉に向けて加速中アップ GPT-4


MMLU、C-Eval、GSM8K、HumanEval、MATH、 etc. 10 主流ベンチマーク評価セットでは、Tongyi Qianwen 2.0 の総合スコアは Meta の Llama-2-70B を上回り、OpenAI の Chat-3.5 と比較すると 9 勝 1 敗であり、GPT と比較すると-4でした。 4勝6敗でGPT-4との差はさらに縮まりました。

中国語と英語を理解する能力は、大規模な言語モデルの基本的なスキルです。 英語のタスクに関しては、Tongyi Qianwen 2.0 は MMLU ベンチマークで 82.5 のスコアを獲得し、GPT-4 に次いで 2 番目でした。パラメーターの数を大幅に増やすことで、Tongyi Qianwen 2.0 は複雑なタスクをよりよく理解して処理できるようになりました。言語構造と概念の向上、中国語タスクに関しては、Tongyi Qianwen 2.0 が C-Eval ベンチマークで最高のスコアを達成し、明らかな優位性を示しました。これは、モデルがトレーニング中により多くの中国語コーパスを学習し、中国語の理解と表現能力をさらに強化したためです。 。

数学的推論やコード理解などの分野で、Tongyi Qianwen 2.0 は大きな進歩を遂げました。推論ベンチマーク テスト GSM8K では、Tongyi Qianwen が 2 位となり、強力なコンピューティング能力と論理的推論能力を実証しました。HumanEval テストでは、Tongyi Qianwen のスコアは、主に大規模なモデルの能力を測定する GPT-4 および GPT-3.5 にほぼ続きました。コード フラグメントを理解して実行することは、プログラミング支援や自動コード修復などのシナリオで使用される大規模モデルの基礎となります。

Alibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速

写真: Tongyi Qianwen 2.0リリース


##Tongyi Qianwen はより成熟しており、使いやすくなっています。 Tongyi Qianwen 2.0 では、指示への準拠、ツールの使用、洗練された作成などの点で技術的な最適化が行われています。

は、下流のアプリケーション シナリオにさらに適切に統合できます。 Tongyi Large Model 公式 Web サイトでは、画像入力や文書解析などの細分化されたタスクをサポートするマルチモーダル機能とプラグイン機能を開始しました。

同時に、Tongyi ラージ モデル トレーニングに基づく 8 つの主要なインダストリ モデル グループが開始されました。

それらは Tongyi Lingma です。 -インテリジェント コーディング アシスタント、Tongyi Zhiwen-AI Reading Assistant、 Tongyi Listening-Work and Study AI Assistant#. ##、Tongyi Xiaomi - インテリジェント カスタマー サービス Tongyi Renxin - 個人専用の健康アシスタント Tongyi Farui-AI 法律顧問8 つの主要なインダストリ モデルは、専門的なトレーニングにドメイン データを使用して、最も一般的な垂直シナリオを指向しています。ユーザーは公式 Web サイトでモデル機能を直接体験でき、開発者は Web ページの埋め込み、API/SDK 呼び出しなどを通じてモデル機能を独自の大規模モデル アプリケーションやサービスに統合できます。 写真: Tongyi の大規模モデル ファミリが完全にアップグレードされ、8 つの大規模インダストリ モデルグループがオンライン

Alibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速

#10月現在、

Alibaba Cloudは60以上の企業と緊密な連携を行っています。業界のリーダーは、オフィス、文化観光、電力、政府事務、医療保険、運輸、製造、金融、ソフトウェア開発などの分野で同義前文の導入を促進します。 Zhou Jingren 氏は、Alibaba Cloud が近い将来、Tongyi Qianwen の 72B バージョンをオープンソース化する計画であることを明らかにしました。これまで、Alibaba Cloud は 7B および 14B バージョンのモデルをオープンソース化しており、 モデルの累計ダウンロード数は 100 万件を超えました。 Alibaba Cloud は、

数千の業界の開発者が Tongyi Qianwen オープンソース モデルに基づいてモデルやアプリケーションを革新できるようサポートし続けます。


Alibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速

写真: Tongyi Qianwen 72B は間もなくオープンソースになります

以上がAlibaba Cloud が General Question Answering 2.0 をリリース、パフォーマンスで GPT-3.5 を上回り、GPT-4 の追求を加速の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
最高の迅速なエンジニアリング技術の最新の年次編集最高の迅速なエンジニアリング技術の最新の年次編集Apr 10, 2025 am 11:22 AM

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ヨーロッパのAI大陸行動計画:GigaFactories、Data Labs、Green AIヨーロッパのAI大陸行動計画:GigaFactories、Data Labs、Green AIApr 10, 2025 am 11:21 AM

ヨーロッパの野心的なAI大陸行動計画は、人工知能のグローバルリーダーとしてEUを確立することを目指しています。 重要な要素は、AI GigaFactoriesのネットワークの作成であり、それぞれが約100,000の高度なAIチップを収容しています。

Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか?Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか?Apr 10, 2025 am 11:20 AM

AIエージェントアプリケーションに対するMicrosoftの統一アプローチ:企業の明確な勝利 新しいAIエージェント機能に関するマイクロソフトの最近の発表は、その明確で統一されたプレゼンテーションに感銘を受けました。 TEで行き詰まった多くのハイテクアナウンスとは異なり

従業員へのAI戦略の販売:Shopify CEOのマニフェスト従業員へのAI戦略の販売:Shopify CEOのマニフェストApr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

IBMは、完全なAI統合でZ17メインフレームを起動しますIBMは、完全なAI統合でZ17メインフレームを起動しますApr 10, 2025 am 11:18 AM

IBMのZ17メインフレーム:AIを強化した事業運営の統合 先月、IBMのニューヨーク本社で、Z17の機能のプレビューを受け取りました。 Z16の成功に基づいて構築(2022年に開始され、持続的な収益の成長の実証

5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼する5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼するApr 10, 2025 am 11:17 AM

揺るぎない自信のロックを解除し、外部検証の必要性を排除します! これらの5つのCHATGPTプロンプトは、完全な自立と自己認識の変革的な変化に向けて導きます。 ブラケットをコピー、貼り付け、カスタマイズするだけです

AIはあなたの心に危険なほど似ていますAIはあなたの心に危険なほど似ていますApr 10, 2025 am 11:16 AM

人工知能のセキュリティおよび研究会社であるAnthropicによる最近の[研究]は、これらの複雑なプロセスについての真実を明らかにし始め、私たち自身の認知領域に不穏に似た複雑さを示しています。自然知能と人工知能は、私たちが思っているよりも似ているかもしれません。 内部スヌーピング:人類の解釈可能性研究 人類によって行われた研究からの新しい発見は、AIの内部コンピューティングをリバースエンジニアリングすることを目的とする機械的解釈可能性の分野の大きな進歩を表しています。AIが何をするかを観察するだけでなく、人工ニューロンレベルでそれがどのように行うかを理解します。 誰かが特定のオブジェクトを見たり、特定のアイデアについて考えたりしたときに、どのニューロンが発射するかを描くことによって脳を理解しようとすることを想像してください。 a

Dragonwingは、QualcommのEdge Momentumを紹介していますDragonwingは、QualcommのEdge Momentumを紹介していますApr 10, 2025 am 11:14 AM

Qualcomm's DragonWing:企業とインフラストラクチャへの戦略的な飛躍 Qualcommは、新しいDragonwingブランドで世界的に企業やインフラ市場をターゲットにして、モバイルを超えてリーチを積極的に拡大しています。 これは単なるレブランではありません

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール