「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？-AI-php.cn

ホームページ

テクノロジー周辺機器

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

PHPz

Apr 30, 2024 pm 04:40 PM

gitaiモデル

少し前、Microsoft は自らの間違いを犯しました。WizardLM-2 を大々的にオープンソース化し、その後すぐにきれいに撤回しました。

WizardLM-2 の現在入手可能なリリース情報。これは、複雑なチャット、多言語、推論、代理店のパフォーマンスが向上した「GPT-4 に真に匹敵する」オープンソースの大規模モデルです。

このシリーズには、WizardLM-2 8x22B、WizardLM-2 70B、WizardLM-2 7B の 3 つのモデルがあります。その中には:

WizardLM-2 8x22B は最も先進的なモデルであり、非常に複雑なタスク向けの内部評価に基づいた最高のオープンソース LLM です。
WizardLM-2 70B はトップレベルの推論機能を備えており、この規模での最初の選択肢です。
WizardLM-2 7B は最速であり、10 倍大きい既存のオープンソースの主要モデルに匹敵するパフォーマンスを備えています。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

さらに、人間による好みの評価により、WizardLM-28x22B の機能は「GPT-4-1106 プレビューよりもわずかに遅れていますが、CommandRPlus や GPT4-0314 よりは大幅に強力です。」

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？ LLaMa 3 のような、新たなオープンソースのマイルストーンとなるでしょうか?

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

みんながモデルのダウンロードに忙しい中、チームは突然すべてを撤回しました。ブログ、GitHub、HuggingFace はすべて 404 になりました。

画像ソース: https://wizardlm.github.io/WizardLM2/

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

チームの説明は次のとおりです:

Huggingface の友人の皆さん、こんにちは!申し訳ありませんが、モデルを削除しました。数か月前のモデルをリリースしてからしばらく時間が経ったため、新しいリリースのプロセスに慣れていません。モデルのリリースプロセスで必要な項目である毒性試験を誤って省略してしまいました。これは、現在すべての新しいモデルが完了する必要があるステップです。

現在、このテストを迅速に完了しており、できるだけ早くモデルを再リリースする予定です。心配しないでください。ご心配とご理解をいただきありがとうございます。

しかし、WizardLM-2 に対する AI コミュニティの注目と議論は止まらない:

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

まず、削除されたオープンソースプロジェクトは WizardLM-2 だけではありません。チーム以前の WizardMath と WizardCoder を含む、すべての Wizard シリーズの作業が終了しました。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？次に、モデルの重みを削除すると、なぜブログも削除されるのかと疑問に思う人もいます。テスト部分が欠落しているだけの場合は、完全に撤回する必要はありません。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？チームの説明は、「関連する規定によると」です。具体的な規定は何ですか？まだ誰も知りません。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

第三に、WizardLM の背後にあるチームが解雇され、Wizard シリーズプロジェクトの撤退も余儀なくされたのではないかという憶測もあります。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

しかし、この推測はチームによって否定されました:

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

出典: https://x.com/_Mira___Mira_/status/1783716276944486751

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

画像出典：https ://x.com/DavidFSWD/status/1783682898786152470

そして今、著者の名前を検索すると、Microsoft の公式 Web サイトから完全には消えていません:

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

出典: https://www .microsoft.com/en-us/research/people/qins/

第 4 に、Microsoft がこのオープンソースモデルを撤回したのではないかと推測する人もいます。その理由は、第一にパフォーマンスが GPT-4 に近すぎるため、第二に技術的な問題が原因です。 OpenAI「Crash」のロードマップ。

具体的なルートは何ですか？元のブログページの技術的な詳細を確認できます。

チームは、LLM トレーニングを通じて、自然界で人間が生成したデータはますます枯渇しており、AI が慎重に作成したデータと AI ステップバイステップ教師付きモデルが、より強力な AI を実現する唯一の方法になると述べました。

過去 1 年間にわたり、Microsoft チームは、以下の図に示すように、人工知能を完全に活用した合成トレーニングシステムを構築してきました。

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

は、大きくいくつかのセクションに分かれています:

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

データ前処理:

データ分析: このパイプラインを使用して、新しいソースデータのさまざまな属性の分布を取得します。データを予備的に理解するのに役立ちます。
重み付けされたサンプリング: 最適なトレーニングデータの分布は、人間のチャットコーパスの自然な分布と一致しないことがよくあります。実験の経験に基づいて、トレーニングデータの各属性の重みを調整する必要があります。 Evol Lab:

「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？

初期の修正により、新しい方法により、さまざまなエージェントが高品質の指示を自動的に生成できるようになります。 Evol-Answer: モデルが応答を複数回生成して書き換えるようにガイドします。これにより、ロジック、正確性、親和性が向上します。

AI Align AI (AAA):

共同指導: WizardLM とさまざまな認可されたオープンソースおよび独自の最先端モデルを収集し、一緒に教えてそれぞれを改善します。その他、教育コンテンツには、シミュレーションチャット、品質レビュー、改善提案、スキルギャップの解消などが含まれます。

独習: WizardLM は、教師あり学習用の新しい進化的トレーニングデータと、活性化学習による強化学習用の優先データを生成できます。

学習:

教師あり学習。

フェーズ - DPO: オフライン強化学習をより効果的に実行するために、優先データがさまざまなフラグメントに分割され、モデルが段階的に改善されます。

RLEIF: 命令品質報酬モデル (IRM) とプロセス監視報酬モデル (PRM) を組み合わせた手法を使用して、オンライン強化学習でより正確な正しさを実現します。
最後に言いたいのは、どんな憶測も無駄だということです。WizardLM-2 のカムバックを楽しみにしましょう。

以上が「GPT-4に非常に近い」WizardLM-2がMicrosoftによって緊急廃止されたその裏話とは？の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

踊りましょう：私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク（C. elegansのものと同様）を広く研究してきました。ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced：Horizonの新しいサブスクリプションティア現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。ただし、Android Authorityのレポートは、今後の変更を示唆しています。最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます：データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます！Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット（ADK）のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ： Small Language Model（SLM）は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル（LLM）よりも優れています。特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能（AI）および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用：包括的なガイド大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini：GoogleはOpenaiよりもうまくやることができますか？Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。