メタは、より効率的な人工知能を求める競争に挑戦しました。このテクノロジー巨人は水曜日、新しいマルチトークン予測アプローチを活用する事前トレーニング済みモデルをリリースしました。これにより、大規模言語モデル (LLM) の開発とデプロイの方法が変わる可能性があります。
Meta は水曜日、新しいマルチトークン予測アプローチは、大規模言語モデル (LLM) の開発と展開の方法を変える可能性があります。
このテクノロジー巨人の最新の製品は、メタ研究者によって発表された最近の論文をきっかけに提供されました。この論文では、LLM の新しいトレーニング方法の概要が説明されています。マルチトークン予測を活用します。この分野の研究をさらに推進するために、Meta は、Hugging Face でこのアプローチを活用して、コード補完用の事前トレーニング済みモデルをリリースしました
この技術は、次の単語のみを予測するように LLM をトレーニングする従来のアプローチからの脱却を示しています。シーケンスで。その代わりに、Meta のメソッドは複数の将来の単語を同時に予測するタスク モデルを作成し、パフォーマンスの向上とトレーニング時間の大幅な削減の両方を約束します。
この画期的な影響は広範囲に及ぶ可能性があります。 AI モデルの規模と複雑さが増大し続けるにつれて、計算能力に対する貪欲な欲求により、コストと環境への影響に関する懸念が高まっています。 Meta のマルチトークン予測手法は、この傾向を抑制し、高度な AI をよりアクセスしやすく持続可能なものにする方法を提供する可能性があります。
AI の民主化: 効率的な言語モデルの約束と危険
この新しいアプローチの可能性は、単なる効率向上を超えて広がります。これらのモデルは、複数のトークンを一度に予測することで、言語の構造と文脈をより微妙に理解できるようになります。これにより、コード生成からクリエイティブなライティングに至るまでのタスクの改善につながり、AI と人間レベルの言語理解の間のギャップを埋める可能性があります。
VB Transform 2024 へのカウントダウン
7 月 9 日から 11 日までサンフランシスコでエンタープライズ リーダーの皆様にご参加いただき、フラッグシップAIイベント。仲間とつながり、Generative AI の機会と課題を探り、AI アプリケーションを業界に統合する方法を学びましょう。今すぐ登録
以上がMeta がマルチトークン予測技術を発表、大規模言語モデル開発に革命を起こす可能性の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。