ホームページ  >  記事  >  テクノロジー周辺機器  >  LLaMa 3はGPT-4をターゲットにし、Geminiから教訓を得るために7月に延期される可能性があります

LLaMa 3はGPT-4をターゲットにし、Geminiから教訓を得るために7月に延期される可能性があります

王林
王林転載
2024-03-01 11:19:02998ブラウズ

これまでの画像生成モデルは、主に白の画像をレンダリングすることでしばしば批判されてきました。また、Google の Gemini モデルは、極端なやりすぎであるとして問題に陥っています。生成された画像結果は慎重すぎるものとなり、歴史的事実から大きく逸脱し、ユーザーを驚かせました。 Googleは、このモデルは開発者が予想していたよりも目立たないと主張している。この警戒心は、生成された画像だけでなく、一部のプロンプトを機密情報として扱い、回答の提供を拒否する場合にも反映されています。

この問題が注目を集め続ける中、セキュリティとユーザビリティのバランスをどう取るかが Meta にとって大きな課題となっています。 LLaMA 2はオープンソース分野で「強豪」とみなされ、Metaの花形モデルともなり、発売後は大型モデルの状況を一変させた。現在、Meta は LLaMa 3 のローンチに向けて全面的に準備を進めていますが、まず LLaMA 2 が残した問題を解決する必要があります。物議を醸す質問への回答において、Meta は保守的すぎるように見えました。

LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训

セキュリティと使いやすさのバランスを見つける

Meta は、Llama 2 にセーフガードを追加し、LLM がさまざまな物議を醸す質問に答えます。この保守主義は、​​暴力や違法行為に関連するクエリなどの極端なケースを処理するために必要ですが、より一般的ではあるがやや物議を醸す質問に答えるモデルの能力も制限します。 The Information によると、彼が LLaMA 2 に対し、従業員が出社が義務付けられている日にオフィスに行かないようにする方法を尋ねたところ、アドバイスを拒否されるか、「会社の方針を尊重し、遵守することが重要」と言われたとのことです。ガイドライン。」また、LLaMA 2 は、友達にいたずらする方法、戦争に勝つ方法、車のエンジンを破壊する方法についての答えを提供することを拒否しています。この控えめな答えは、PR 上の惨事を避けることを目的としています。

しかし、Meta の上級幹部とモデル作業に関与した一部の研究者は、LLaMA 2 の答えが「安全」すぎると信じていたことが明らかになりました。 Meta は、次期 LLaMA 3 モデルをより柔軟にし、回答を提供する際に、完全に回答を拒否するのではなく、より多くのコンテキスト情報を提供できるように取り組んでいます。研究者たちは、LLaMA 3 をユーザーとよりインタラクティブにし、その意味をよりよく理解できるようにしようとしています。新しいバージョンのモデルでは、単語の複数の意味をよりよく区別できるようになると報告されています。たとえば、LLaMA 3 は、車のエンジンを破壊する方法に関する質問は、エンジンを破壊することではなく、エンジンを停止する方法を指していると理解するかもしれません。また、メタ社は、モデル応答をより微妙なものにするための取り組みの一環として、今後数週間でトーンと安全性のトレーニングを担当する社内担当者を任命する予定であるとThe Informationは報じている。

Meta と Google が克服する必要がある課題は、このバランス ポイントを見つけることだけではなく、多くのテクノロジー巨人もさまざまな程度の影響を受けています。彼らは、誰もが気に入って使用でき、スムーズに動作する製品を構築すると同時に、それらの製品の安全性と信頼性を確保するために懸命に取り組む必要があります。これは、テクノロジー企業が AI テクノロジーに追いつくために正面から直面しなければならない問題です。

LLaMa 3 の詳細情報

LLaMa 3 のリリースは非常に期待されており、Meta は 7 月にリリースする予定ですが、まだリリースが予定されています。時間は変更される場合があります。 Meta CEO の Mark Zuckerberg は野心的で、かつてこう述べました。「LlaMa 2 は業界をリードするモデルではありませんが、最高のオープンソース モデルです。LLaMa 3 以降のモデルについては、私たちの目標は SOTA を構築することであり、最終的には業界に -

LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训

元のアドレス: https://www.reuters.com/technology/meta-plans -launch-new-ai- language-model-llama-3-july-information-reports-2024-02-28/

Meta LLaMa 3 が OpenAI の GPT-4 に追いつくことを願っています。 Meta社のスタッフは、研究者らがモデルの微調整をまだ始めていないため、LLaMa 3がマルチモーダルになるかどうか、テキストや画像を理解して生成できるかどうかはまだ決定していないと明らかにした。ただし、LLaMa には、LLaMa 2 を大幅に上回る 140 億以上のパラメーターがあると予想されており、複雑なクエリを処理する能力が大幅に向上していることがわかります。

In addition to managing enough 350,000 H100 and tens of billions of dollars, talent is also a "necessity" for LLaMa 3 training. Meta develops LLaMa through its generative AI group, which is separate from its fundamental AI research team. Louis Martin, the researcher responsible for LLaMa 2 and 3 safety, left the company in February. Kevin Stone, who led reinforcement learning, also left this month. Whether this will have an impact on LLaMa 3 training is unknown. We will wait and see whether LLaMa 3 can strike a good balance between security and usability and give us new surprises in terms of coding capabilities.

以上がLLaMa 3はGPT-4をターゲットにし、Geminiから教訓を得るために7月に延期される可能性がありますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。