ホームページ  >  記事  >  テクノロジー周辺機器  >  数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

王林
王林転載
2023-10-31 18:17:13867ブラウズ

Alibaba Cloud は、10 月 31 日に数千億のパラメーターを備えた大規模モデルである Tongyi Qianwen 2.0 を正式にリリースしました。 10 件の信頼できる評価結果によると、Tongyi Qianwen 2.0 の総合パフォーマンスは GPT-3.5 を上回り、GPT-4 に急速に追いつきつつあります。同日、Tongyi Qianwen APP が主要なモバイル アプリケーション市場でリリースされ、誰でも APP を通じて最新モデルの機能を直接体験できます

過去 6 か月で、Tongyi Qianwen 2.0 は大きな進歩を遂げました。パフォーマンス 4 月にリリースされたバージョン 1.0 と比較して、Tongyi Qianwen 2.0 は、複雑なコマンドの理解、文学創作、一般数学、知識記憶、幻覚耐性の能力が大幅に向上しました。現在、Tongyi Qianwenの総合パフォーマンスはGPT-3.5を超え、GPT-4に追いつくべく加速しています。

数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

Tongyi Qianwen 2.0 の総合的なパフォーマンスは GPT-3.5 を超え、GPT-4 に追いつくために加速しています

#MMLU、C-Eval、GSM8K、HumanEval、MATH、およびその他の 10 の主流ベンチマーク評価セットにおいて、Tongyi Qianwen 2.0 のスコアは総合的に Meta の Llama-2-70B を上回り、OpenAI の Chat-3.5 と比較すると 9 勝 1 勝でしたGPT-4 と比較すると 4 勝 6 敗であり、GPT-4 との差はさらに縮まっています

中国語と英語の理解力は大規模言語モデルの基礎スキルです。英語のタスクに関しては、Tongyi Qianwen 2.0 は MMLU ベンチマークで 82.5 のスコアを獲得し、GPT-4 に次いで 2 番目でした。パラメータの数を大幅に増やすことにより、Tongyi Qianwen 2.0 は複雑な言語構造と概念をよりよく理解し、処理できるようになります。タスクに関しては、Tongyi Qianwen 2.0 が優れています。 , Tongyi Qianwen 2.0 は、C-Eval ベンチマークで明らかな優位性を持って最高スコアを達成しました。これは、モデルがトレーニング中により多くの中国語コーパスを学習し、中国語の理解と表現能力がさらに強化されたためです。

Tongyi Qianwen 2.0 は、数学的推論やコード理解などの分野で大きな進歩を遂げました。推論ベンチマーク テスト GSM8K では、Tongyi Qianwen が 2 位となり、強力なコンピューティング能力と論理的推論能力を実証しました。HumanEval テストでは、Tongyi Qianwen のスコアは、主に大規模なモデルの能力を測定する GPT-4 および GPT-3.5 にほぼ続きました。コード フラグメントを理解して実行することは、プログラミング支援や自動コード修復などのシナリオで使用される大規模モデルの基礎となります。

数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

Tongyi Qianwen 2.0 リリース

Tongyi Qianwen はより成熟し、使いやすくなりました。 Tongyi Qianwen 2.0 は、下流のアプリケーション シナリオにうまく統合できるように、指示への準拠、ツールの使用、洗練された作成などの点で技術的な最適化が行われています。 Tongyi Large Model の公式 Web サイトでは、画像入力や文書解析などの細分化されたタスクをサポートするマルチモーダル機能とプラグイン機能を開始しました。

同時に、Tongyi ラージ モデル トレーニングに基づく 8 つの主要なインダストリ モデル グループが立ち上げられました。それらは、Tongyi Lingma - インテリジェント コーディング アシスタント、Tongyi Zhiwen - AI リーディング アシスタント、Tongyi リスニング - 作業学習 AI アシスタントです。 Tongyi Stardust - パーソナライズされたキャラクター作成プラットフォーム、Tongyi Midianjin - インテリジェントな投資リサーチアシスタント、Tongyi Xiaomi - インテリジェントな顧客サービス、Tongyi Renxin - パーソナルヘルスアシスタント、Tongyi Farui - AI 法律コンサルタント。 8 つの主要なインダストリ モデルは、最も一般的な垂直シナリオ向けに設計されており、ドメイン データを使用して特別にトレーニングされています。ユーザーは公式 Web サイトでモデル機能を直接体験でき、開発者は Web ページの埋め込み、API/SDK 呼び出しなどを通じてモデル機能を独自の大規模モデル アプリケーションやサービスに統合できます。

数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

Tongyi の大規模モデル ファミリが完全にアップグレードされ、8 つの主要なインダストリ モデル グループが開始されました

現在10月、アリババクラウドは60以上の業界の主要パートナーと緊密な協力を実施し、オフィス、文化観光、電力、政務、医療保険、運輸、製造、金融の分野で前文将軍の実用化を推進した。 、ソフトウェア開発およびその他の分野

Zhou Jingren氏は、Alibaba Cloudが近い将来、Tongyi Qianwenの72Bバージョンをオープンソース化する計画であると述べた。以前、Alibaba Cloud はこのモデルの 7B および 14B バージョンをオープンソース化しており、これらのモデルの累計ダウンロード数は 100 万件を超えています。 Alibaba Cloud は、さまざまな業界の開発者が Tongyi Qianwen オープン ソース モデルを使用してモデルやアプリケーションを革新できるよう引き続きサポートしていきます

数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます

Tongyi Qianwen 72B は間もなくオープンソースになります

以上が数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjiqizhixin.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。