ホームページ  >  記事  >  テクノロジー周辺機器  >  Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる

Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる

WBOY
WBOYオリジナル
2024-08-09 19:44:14755ブラウズ

8月9日のニュースによると、Alibaba Tongyiチームは新世代数学モデルQwen2-Mathをオープンソース化しました。これには、基本モデルと、1.5B、7B、72Bの3つのパラメータを備えた命令微調整モデルが含まれています。 Qwen2-Math は、Tongyi Qianwen オープンソース大規模言語モデル Qwen2 に基づいて開発されており、フラッグシップ モデル Qwen2-Math-72B-Instruct は、GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama よりも高いスコアを獲得しています。権威ある評価セット MATH. -3.1-405B などは、代数学、幾何学、計数と確率、数論などのさまざまな数学問題を 84% の精度で処理する、最も高度な数学に特化したモデルです。

Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる

注: MATH ベンチマーク評価では、Tongyi Qianwen 数学モデルの主力モデルである Qwen2-Math-72B-Instruct が 84% の精度を達成し、GPT-4、Claude-3.5、Gemini-1.5-Pro を上回りました。および Llama-3.1 などのオープン ソース モデルとクローズド ソース モデル。

Qwen2-Math 基本モデルは、Qwen2 大規模言語モデルを使用して初期化され、慎重に設計された数学固有のコーパスで事前トレーニングされています。トレーニング データには、大規模で高品質の数学オンライン テキスト、書籍、コード、試験問題が含まれています。 、および Qwen2 モデル合成用の数学的事前トレーニング データ。すべての事前トレーニングおよび微調整データセットは汚染除去されました。

その後、研究開発チームはモデルの命令微調整バージョンをトレーニングしました。まず、数学固有の報酬モデルが Qwen2-Math-72B に基づいてトレーニングされました。次に、密な報酬信号が、次のことを示すバイナリ信号と結合されました。モデルは学習ラベルを使用して質問に正しく答え、次に拒否サンプリングを通じて教師あり微調整 (SFT) データを構築し、最後に GRPO メソッドを使用して SFT モデルに基づいてモデルを最適化します。

Qwen2-Math シリーズのモデルは現在主に英語をサポートしていると報告されており、Tongyi チームは間もなく中国語と英語のバイリンガル バージョンをリリースする予定であり、多言語バージョンも開発中です。

Tongyi チームは、GSM8K や MATH などの一般的な評価ベンチマークに加えて、複数の中国語と英語の数学ベンチマーク評価セットで指導微調整モデルのパフォーマンスを評価しました。オリンピックレベルのテスト。ベンチマーク評価 OlympiadBench、大学数学ベンチマーク評価 CollegeMath、大学入学試験 (GaoKao)、American Mathematics Invitational Competition (AIME) 2024 大会問題、American Mathematics Contest (AMC) 2023 大会問題、中国語評価には CMATH 評価セットが含まれます。 2024年中国大学入試・高校入試数学問題。最終的に、Qwen2-Math-72B-Instruct は非常に優れたパフォーマンスを発揮し、トップ 10 の評価において他のオープンソース数学モデルをはるかに上回る結果を達成しました。

Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる

注: 研究開発チームは、各 Qwen2-Math-72B-Instruct モデルの 3 つのスコア結果をリストしています (下付き数字なし)。 8 つの回答のうち最も頻繁に出現する回答のスコアと、8 つの回答のうち報酬モデルによって選択された回答のスコア。

「大きなモデルは数学の問題を解決できるか?」は、ソーシャル プラットフォームで話題になっているだけでなく、業界にとっても大きな関心のある研究テーマでもあります。高度な数学的問題を処理するには、複雑な複数ステップの論理的推論機能を備えたモデルが必要です。 Tongyi チームは技術ブログで、オープンソースを通じて「高度な数学的問題の解決において科学コミュニティに貢献」したいと述べ、今後もモデルの数学的機能を強化し続けると述べた。

添付ファイル: Qwen2-数学の問題解決例

Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる

以上がTongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。