リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた-AI-php.cn

ホームページ

テクノロジー周辺機器

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 23, 2024 pm 05:22 PM

gitデータ電車

先週、MicrosoftはGPT-4レベルともいえるWizardLM-2と呼ばれるオープンソースモデルを空輸しました。

意外なことに、投稿されてから数時間後にはすぐに削除されました。

一部のネチズンは、WizardLM のモデルの重みと発表の投稿がすべて削除され、Microsoft のコレクションになくなったことを突然発見しました。このサイトへの言及を除けば、この公式の Microsoft プロジェクトを証明する証拠は見つかりませんでした。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

GitHub プロジェクトのホームページが 404 になりました。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

プロジェクトアドレス: https://wizardlm.github.io/

HF上のモデルの重みも含めて全て消えました…

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

ネットワーク全体顔は混乱に満ちていますが、なぜ WizardLM はなくなったのですか?

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

しかし、Microsoft がこれを行ったのは、チームがモデルを「テスト」するのを忘れたからです。

その後、Microsoft チームが現れて謝罪し、数か月前に WizardLM がリリースされてからしばらく時間が経っていたため、新しいリリースのプロセスにまだ慣れていなかった、と説明しました。

モデルのリリースプロセスで必要な項目の 1 つを誤って見逃してしまいました:中毒テスト

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

Microsoft WizardLM が第 2 世代にアップグレードされました

昨年 6 月に微調整されましたLlaMA ベース第一世代の WizardLM がリリースされると、オープンソースコミュニティから大きな注目を集めました。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

論文アドレス: https://arxiv.org/pdf/2304.12244.pdf

その後、WizardCoder のコード版が誕生しました - Code Llama をベースにし、Evol を使用して微調整されたモデルです -指示する。

テスト結果は、HumanEval での WizardCoder の pass@1 が驚くべき 73.2% に達し、オリジナルの GPT-4 を上回ったことを示しています。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

時間が4月15日に進むにつれ、Microsoftの開発者は新世代のWizardLMを正式に発表しました。今回はMixtral 8x22Bから微調整されています。

これには、8x22B、70B、および 7B という 3 つのパラメーターバージョンが含まれています。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

最も注目に値するのは、MT-Bench ベンチマークテストにおいて、新モデルが圧倒的な優位性を達成したことです。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

具体的には、WizardLM 8x22B モデルの最大パラメーターバージョンのパフォーマンスは、GPT-4 および Claude 3 にほぼ近いです。

同じパラメータスケールでは、70B バージョンが 1 位にランクされます。

7Bバージョンは最も高速で、10倍のパラメータスケールで上位モデルと同等のパフォーマンスを実現することもできます。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

WizardLM 2 の優れたパフォーマンスの秘密は、Microsoft が開発した革新的なトレーニング方法論 Evol-Instruct にあります。

Evol-Instruct は、大規模な言語モデルを活用して、最初の命令セットをますます複雑なバリアントに繰り返し書き換えます。これらの進化した命令データは基本モデルを微調整するために使用され、複雑なタスクを処理する能力が大幅に向上します。

もう 1 つは、WizardLM 2 の開発プロセスでも重要な役割を果たした強化学習フレームワーク RLEIF です。

WizardLM 2のトレーニングでは、AI Align AI (AAA)手法も採用されており、複数の主要な大規模モデルが相互に指導し、改善することができます。

AAAのフレームワークは、「共指導」と「自習」という2つの主要な要素で構成されています。

この段階では、WizardLM と、ライセンスを取得したさまざまなオープンソースおよび独自の高度なモデルが、シミュレーションチャット、品質判断、改善提案、スキルギャップの解消を共同指導します。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

モデルは互いに通信し、フィードバックを提供することで、仲間から学び、能力を向上させることができます。

自己学習の場合、WizardLM は、積極的な自己学習を通じて、教師あり学習用の新しい進化的トレーニングデータと強化学習用の優先データを生成できます。

この自己学習メカニズムにより、モデルは独自に生成されたデータとフィードバック情報から学習することで、パフォーマンスを継続的に向上させることができます。

さらに、WizardLM 2 モデルは、生成された合成データを使用してトレーニングされました。

研究者の見解では、大規模モデルのトレーニングデータはますます枯渇しており、AI によって慎重に作成されたデータと、AI によって徐々に監視されるモデルが、より強力な人工知能を実現する唯一の方法になると考えられています。

そこで彼らは、WizardLM-2 を改善するために、完全に AI 主導の合成トレーニングシステムを作成しました。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

速いネチズンはすでにウェイトをダウンロードしています

しかし、データベースが削除される前に、多くの人がすでにモデルのウェイトをダウンロードしていました。

モデルが削除される前に、数人のユーザーがいくつかの追加のベンチマークでもテストしました。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

幸いなことに、それをテストしたネチズンは7Bモデルに感銘を受け、ローカルアシスタントタスクを実行するための最初の選択肢になるだろうと述べました。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

誰かが毒物検査も行ったところ、WizardLM-8x22Bのスコアは98.33、ベースのMixtral-8x22Bのスコアは89.46、Mixtral 8x7B-Indictのスコアは92.93であることがわかりました。

スコアが高いほど優れており、WizardLM-8x22B が依然として非常に強力であることを意味します。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

中毒検査が無い場合はモデルの発送は絶対に不可能です。

大きなモデルは幻覚を起こしやすいことは誰もが知っています。

WizardLM 2 が回答に「有害で偏った不正確な」コンテンツを出力する場合、大規模なモデルには適していません。

特に、これらのエラーはネットワーク全体の注目を集めており、マイクロソフト自体への批判も引き起こし、当局による調査を受ける可能性もあります。

一部のネチズンは混乱し、「中毒テスト」を通じて指標を更新できると言いました。なぜリポジトリとウェイト全体を削除するのでしょうか?

Microsoft の作成者は、最新の社内規定によれば、これはのみ実行できると述べています。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

「ロボトミー手術」のないモデルが欲しいと言う人もいます。

リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れた

ただし、開発者はまだ辛抱強く待つ必要があり、Microsoft チームはテストが完了したらオンラインに戻ることを約束しています。

以上がリリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープンソースモデルを数秒で削除しました。毒物検査を受けるのを忘れたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

踊りましょう：私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク（C. elegansのものと同様）を広く研究してきました。ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced：Horizonの新しいサブスクリプションティア現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。ただし、Android Authorityのレポートは、今後の変更を示唆しています。最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます：データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます！Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット（ADK）のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ： Small Language Model（SLM）は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル（LLM）よりも優れています。特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能（AI）および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用：包括的なガイド大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini：GoogleはOpenaiよりもうまくやることができますか？Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。