リリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープン ソース モデルを数秒で削除しました。毒物検査を受けるのを忘れた
先週、MicrosoftはGPT-4レベルともいえるWizardLM-2と呼ばれるオープンソースモデルを空輸しました。
意外なことに、投稿されてから数時間後にはすぐに削除されました。
一部のネチズンは、WizardLM のモデルの重みと発表の投稿がすべて削除され、Microsoft のコレクションになくなったことを突然発見しました。このサイトへの言及を除けば、この公式の Microsoft プロジェクトを証明する証拠は見つかりませんでした。
GitHub プロジェクトのホームページが 404 になりました。
プロジェクトアドレス: https://wizardlm.github.io/
HF上のモデルの重みも含めて全て消えました…
ネットワーク全体顔は混乱に満ちていますが、なぜ WizardLM はなくなったのですか?
しかし、Microsoft がこれを行ったのは、チームがモデルを「テスト」するのを忘れたからです。
その後、Microsoft チームが現れて謝罪し、数か月前に WizardLM がリリースされてからしばらく時間が経っていたため、新しいリリースのプロセスにまだ慣れていなかった、と説明しました。
モデルのリリースプロセスで必要な項目の 1 つを誤って見逃してしまいました:中毒テスト
Microsoft WizardLM が第 2 世代にアップグレードされました
昨年 6 月に微調整されましたLlaMA ベース 第一世代の WizardLM がリリースされると、オープンソース コミュニティから大きな注目を集めました。
論文アドレス: https://arxiv.org/pdf/2304.12244.pdf
その後、WizardCoder のコード版が誕生しました - Code Llama をベースにし、Evol を使用して微調整されたモデルです -指示する。
テスト結果は、HumanEval での WizardCoder の pass@1 が驚くべき 73.2% に達し、オリジナルの GPT-4 を上回ったことを示しています。
時間が4月15日に進むにつれ、Microsoftの開発者は新世代のWizardLMを正式に発表しました。今回はMixtral 8x22Bから微調整されています。
これには、8x22B、70B、および 7B という 3 つのパラメーター バージョンが含まれています。
最も注目に値するのは、MT-Bench ベンチマーク テストにおいて、新モデルが圧倒的な優位性を達成したことです。
具体的には、WizardLM 8x22B モデルの最大パラメーター バージョンのパフォーマンスは、GPT-4 および Claude 3 にほぼ近いです。
同じパラメータスケールでは、70B バージョンが 1 位にランクされます。
7Bバージョンは最も高速で、10倍のパラメータスケールで上位モデルと同等のパフォーマンスを実現することもできます。
WizardLM 2 の優れたパフォーマンスの秘密は、Microsoft が開発した革新的なトレーニング方法論 Evol-Instruct にあります。
Evol-Instruct は、大規模な言語モデルを活用して、最初の命令セットをますます複雑なバリアントに繰り返し書き換えます。これらの進化した命令データは基本モデルを微調整するために使用され、複雑なタスクを処理する能力が大幅に向上します。
もう 1 つは、WizardLM 2 の開発プロセスでも重要な役割を果たした強化学習フレームワーク RLEIF です。
WizardLM 2のトレーニングでは、AI Align AI (AAA)手法も採用されており、複数の主要な大規模モデルが相互に指導し、改善することができます。
AAAのフレームワークは、「共指導」と「自習」という2つの主要な要素で構成されています。
この段階では、WizardLM と、ライセンスを取得したさまざまなオープンソースおよび独自の高度なモデルが、シミュレーション チャット、品質判断、改善提案、スキル ギャップの解消を共同指導します。
モデルは互いに通信し、フィードバックを提供することで、仲間から学び、能力を向上させることができます。
自己学習の場合、WizardLM は、積極的な自己学習を通じて、教師あり学習用の新しい進化的トレーニング データと強化学習用の優先データを生成できます。
この自己学習メカニズムにより、モデルは独自に生成されたデータとフィードバック情報から学習することで、パフォーマンスを継続的に向上させることができます。
さらに、WizardLM 2 モデルは、生成された合成データを使用してトレーニングされました。
研究者の見解では、大規模モデルのトレーニング データはますます枯渇しており、AI によって慎重に作成されたデータと、AI によって徐々に監視されるモデルが、より強力な人工知能を実現する唯一の方法になると考えられています。
そこで彼らは、WizardLM-2 を改善するために、完全に AI 主導の合成トレーニング システムを作成しました。
速いネチズンはすでにウェイトをダウンロードしています
しかし、データベースが削除される前に、多くの人がすでにモデルのウェイトをダウンロードしていました。
モデルが削除される前に、数人のユーザーがいくつかの追加のベンチマークでもテストしました。
幸いなことに、それをテストしたネチズンは7Bモデルに感銘を受け、ローカルアシスタントタスクを実行するための最初の選択肢になるだろうと述べました。
誰かが毒物検査も行ったところ、WizardLM-8x22Bのスコアは98.33、ベースのMixtral-8x22Bのスコアは89.46、Mixtral 8x7B-Indictのスコアは92.93であることがわかりました。
スコアが高いほど優れており、WizardLM-8x22B が依然として非常に強力であることを意味します。
中毒検査が無い場合はモデルの発送は絶対に不可能です。
大きなモデルは幻覚を起こしやすいことは誰もが知っています。
WizardLM 2 が回答に「有害で偏った不正確な」コンテンツを出力する場合、大規模なモデルには適していません。
特に、これらのエラーはネットワーク全体の注目を集めており、マイクロソフト自体への批判も引き起こし、当局による調査を受ける可能性もあります。
一部のネチズンは混乱し、「中毒テスト」を通じて指標を更新できると言いました。なぜリポジトリとウェイト全体を削除するのでしょうか?
Microsoft の作成者は、最新の社内規定によれば、これはのみ実行できると述べています。
「ロボトミー手術」のないモデルが欲しいと言う人もいます。
ただし、開発者はまだ辛抱強く待つ必要があり、Microsoft チームはテストが完了したらオンラインに戻ることを約束しています。
以上がリリースから数時間以内に、Microsoft は GPT-4 に匹敵する大規模なオープン ソース モデルを数秒で削除しました。毒物検査を受けるのを忘れたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

Dreamweaver Mac版
ビジュアル Web 開発ツール

メモ帳++7.3.1
使いやすく無料のコードエディター
