


数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます
Alibaba Cloud は、10 月 31 日に数千億のパラメーターを備えた大規模モデルである Tongyi Qianwen 2.0 を正式にリリースしました。 10 件の信頼できる評価結果によると、Tongyi Qianwen 2.0 の総合パフォーマンスは GPT-3.5 を上回り、GPT-4 に急速に追いつきつつあります。同日、Tongyi Qianwen APP が主要なモバイル アプリケーション市場でリリースされ、誰でも APP を通じて最新モデルの機能を直接体験できます
過去 6 か月で、Tongyi Qianwen 2.0 は大きな進歩を遂げました。パフォーマンス 4 月にリリースされたバージョン 1.0 と比較して、Tongyi Qianwen 2.0 は、複雑なコマンドの理解、文学創作、一般数学、知識記憶、幻覚耐性の能力が大幅に向上しました。現在、Tongyi Qianwenの総合パフォーマンスはGPT-3.5を超え、GPT-4に追いつくべく加速しています。
#MMLU、C-Eval、GSM8K、HumanEval、MATH、およびその他の 10 の主流ベンチマーク評価セットにおいて、Tongyi Qianwen 2.0 のスコアは総合的に Meta の Llama-2-70B を上回り、OpenAI の Chat-3.5 と比較すると 9 勝 1 勝でしたGPT-4 と比較すると 4 勝 6 敗であり、GPT-4 との差はさらに縮まっています
中国語と英語の理解力は大規模言語モデルの基礎スキルです。英語のタスクに関しては、Tongyi Qianwen 2.0 は MMLU ベンチマークで 82.5 のスコアを獲得し、GPT-4 に次いで 2 番目でした。パラメータの数を大幅に増やすことにより、Tongyi Qianwen 2.0 は複雑な言語構造と概念をよりよく理解し、処理できるようになります。タスクに関しては、Tongyi Qianwen 2.0 が優れています。 , Tongyi Qianwen 2.0 は、C-Eval ベンチマークで明らかな優位性を持って最高スコアを達成しました。これは、モデルがトレーニング中により多くの中国語コーパスを学習し、中国語の理解と表現能力がさらに強化されたためです。
Tongyi Qianwen 2.0 は、数学的推論やコード理解などの分野で大きな進歩を遂げました。推論ベンチマーク テスト GSM8K では、Tongyi Qianwen が 2 位となり、強力なコンピューティング能力と論理的推論能力を実証しました。HumanEval テストでは、Tongyi Qianwen のスコアは、主に大規模なモデルの能力を測定する GPT-4 および GPT-3.5 にほぼ続きました。コード フラグメントを理解して実行することは、プログラミング支援や自動コード修復などのシナリオで使用される大規模モデルの基礎となります。
Tongyi Qianwen はより成熟し、使いやすくなりました。 Tongyi Qianwen 2.0 は、下流のアプリケーション シナリオにうまく統合できるように、指示への準拠、ツールの使用、洗練された作成などの点で技術的な最適化が行われています。 Tongyi Large Model の公式 Web サイトでは、画像入力や文書解析などの細分化されたタスクをサポートするマルチモーダル機能とプラグイン機能を開始しました。
同時に、Tongyi ラージ モデル トレーニングに基づく 8 つの主要なインダストリ モデル グループが立ち上げられました。それらは、Tongyi Lingma - インテリジェント コーディング アシスタント、Tongyi Zhiwen - AI リーディング アシスタント、Tongyi リスニング - 作業学習 AI アシスタントです。 Tongyi Stardust - パーソナライズされたキャラクター作成プラットフォーム、Tongyi Midianjin - インテリジェントな投資リサーチアシスタント、Tongyi Xiaomi - インテリジェントな顧客サービス、Tongyi Renxin - パーソナルヘルスアシスタント、Tongyi Farui - AI 法律コンサルタント。 8 つの主要なインダストリ モデルは、最も一般的な垂直シナリオ向けに設計されており、ドメイン データを使用して特別にトレーニングされています。ユーザーは公式 Web サイトでモデル機能を直接体験でき、開発者は Web ページの埋め込み、API/SDK 呼び出しなどを通じてモデル機能を独自の大規模モデル アプリケーションやサービスに統合できます。
現在10月、アリババクラウドは60以上の業界の主要パートナーと緊密な協力を実施し、オフィス、文化観光、電力、政務、医療保険、運輸、製造、金融の分野で前文将軍の実用化を推進した。 、ソフトウェア開発およびその他の分野
Zhou Jingren氏は、Alibaba Cloudが近い将来、Tongyi Qianwenの72Bバージョンをオープンソース化する計画であると述べた。以前、Alibaba Cloud はこのモデルの 7B および 14B バージョンをオープンソース化しており、これらのモデルの累計ダウンロード数は 100 万件を超えています。 Alibaba Cloud は、さまざまな業界の開発者が Tongyi Qianwen オープン ソース モデルを使用してモデルやアプリケーションを革新できるよう引き続きサポートしていきます
以上が数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。 包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスの成功のロック解除:ビジネスインテリジェンスアナリストになるためのガイド 生データを組織の成長を促進する実用的な洞察に変換することを想像してください。 これはビジネスインテリジェンス(BI)アナリストの力です - GUにおける重要な役割

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。 ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。 シム

Excelデータカウントと分析:カウントとカウントの機能の詳細な説明 特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。 キーポイントの概要 カウントとcouを理解します

Google Chrome'sAI Revolution:パーソナライズされた効率的なブラウジングエクスペリエンス 人工知能(AI)は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。 この記事では、興奮を探ります

インパクトの再考:四重材のボトムライン 長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

ドリームウィーバー CS6
ビジュアル Web 開発ツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、
