ホームページ >テクノロジー周辺機器 >AI >ミストラルミディアムが誤って漏洩した?リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。
「私は今、Miqu と Perplexity Labs の Mistral-Medium が同じモデルであると 100% 確信しています。」
最近、「Mistral-Medium モデルの漏洩」に関するニュースがみんなの関心を集めました。注意。
噂によると、「Miqu」と呼ばれる新しいモデルに関するリークニュースは、言語モデルの心の知能指数を評価するためのベンチマークであるEQ-Benchに関連しているそうです。関連データによると、EQ-Bench と MMLU の相関は約 0.97、Arena Elo との相関は約 0.94 です。興味深いことに、このベンチマーク評価では、Miqu が GPT-4 を除くすべての大型モデルを直接上回り、そのスコアは Mistral-Medium に非常に近くなっています。このニュースは幅広い注目と議論を呼びました。
画像ソース: https://x.com/N8Programs/status/1752441060133892503?s=20
オープンソースのアドレス: https://huggingface.co/miqudev/miqu-1-70b
このような強力なモデルの場合、プロジェクトの発行者は謎の人物です:
誰かが「誰があなたを作ったのか」と尋ねたので、ミクは直接報告しました:「私はミストラル アル チームによって作成されました。」
ただし、この開発者のテストでは、Miqu のパフォーマンスは Mixtral-8x7B-Instruct-v0.1 (4 ビット) よりも悪く、それでも Mistral Small および Medium よりは優れていました。ただし、Mixtral 8x7B Instruct よりも優れているわけではありません。開発者は、Miqu が漏洩した MistralAI モデル、おそらく古い概念実証モデルである可能性があると推測しています。
これは、これまでに確認した中で 2 番目の主張を裏付ける最も詳細なテストです。
しかし、一部の開発者は、Miqu は MistralAI とは何の関係もなく、むしろ Llama 70B に似ていると信じています。そのアーキテクチャは Llama 70B と「まったく同じ」であり、「専門的なハイブリッド モデルではない」からです。
同様に、テストを行った結果、Miqu が実際にはラマに似ていることがわかった人もいます。
しかし、スコア差 ほら、Miqu と Llama 70B は明らかに同じモデルではありません。
つまり、Miqu は Llama の微調整されたバージョンであるか、Mistral-Medium の初期バージョンであると誰かが結論付けました:
前者が真の場合、Miqu は Mistral-Medium データセットで微調整された Llama 70B である可能性があります:
後者が真の場合、Miqu はミストラル API を抽出しただけですが、おそらく「米国が月面着陸を捏造した」レベルの茶番劇になるでしょう:
#最後の質問、誰ですか漏洩者?
多くの X プラットフォーム ユーザーから提供された手がかりによると、流出した疑いのあるモデルはもともと 4chan と呼ばれる Web サイトに投稿されたものです。この Web サイトは完全に匿名のリアルタイム メッセージング フォーラムで、ユーザーは登録せずにグラフィックやテキストのコメントを投稿できます。
参考リンク: https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
以上がミストラルミディアムが誤って漏洩した?リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。