ホームページ >テクノロジー周辺機器 >AI >Microsoft、多くの大規模な言語モデルを上回る 27 億パラメータの Phi-2 モデルをデビュー

Microsoft、多くの大規模な言語モデルを上回る 27 億パラメータの Phi-2 モデルをデビュー

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2023-12-14 23:17:471386ブラウズ

Microsoft は、Phi-2 と呼ばれる人工知能モデルをリリースしました。これは、25 倍の大きさの、より大型で成熟したモデルと同等またはそれを超えるパフォーマンスを持つ、並外れた能力を実証しました。

最近 Microsoft はブログ投稿で、Phi-2 は 27 億のパラメータを持つ言語モデルであると発表しました。他の基本モデルと比較して、Phi-2 は、特に複雑なベンチマークテストで高度なパフォーマンスを示します。これらのテストは推論を評価します。、言語理解、数学、コーディング、および一般知識スキル。現在、Phi-2 は Microsoft Azure Artificial Intelligence Studio のモデルカタログを通じてリリースされており、研究者や開発者は Phi-2 をサードパーティアプリケーションに統合できます。

Phi-2 は Microsoft CEO Satya Nadella によって最初に発表されました11月のIgniteカンファレンスで発表した。この製品のパワーは、Microsoft が「教科書品質」と呼ぶ、知識を目的として構築されたデータから生まれており、他のモデルからの洞察テクノロジーも活用しています

Phi-2 のユニークな点は、以前は、大規模な言語モデルは、多くの場合、そのパラメータースケールと密接に関連していました。一般に、パラメーターが多いモデルは、より強力な機能を意味します。しかし、Phi-2 の登場により、この従来の概念は変わり、Microsoft は、Phi-2 がいくつかのベンチマークテストで、より大きな基本モデルに匹敵する、あるいはそれを上回る能力を実証したと述べています。これらのベンチマークには、Mistral AI の 70 億パラメータの Mistral、Meta Platforms の 130 億パラメータの Llama 2、さらに一部のベンチマークでは 700 億パラメータの Llama-2 を超えたものが含まれます。

驚きの議論は、Google の Gemini よりも優れているということかもしれません。先週発売されたGeminiシリーズの中で最も高性能なモデル、Nano。 Gemini Nano はオンデバイスタスク向けに設計されており、スマートフォン上で実行でき、テキストの要約、高度な校正、文法修正、状況に応じたスマートな返信などの機能を有効にします。

マイクロソフトの研究者によると、Phi-2 には広範囲にわたるテストが含まれています言語理解、推論、数学、コーディングの課題などが含まれます。

Microsoft、多くの大規模な言語モデルを上回る 27 億パラメータの Phi-2 モデルをデビュー同社は、Phi-2 が推論、知識、常識を教えるために厳選された教科書レベルのデータを使用してトレーニングされているため、このような優れた結果を達成していると述べています。少ない情報からより多くのことを学びます。 Microsoft の研究者は、より小さなモデルから知識を取得できる技術も使用しました。

研究者らは、強化学習や人間のフィードバックに基づく指導の微調整などの技術を使用しなくても、Phi-2 が依然として強力なパフォーマンスを達成できることは注目に値すると指摘しました。これらの手法は、人工知能モデルの動作を改善するためによく使用されます。これらの技術を使用していないにもかかわらず、Phi-2 は、使用している他のオープンソースモデルと比較して、偏見や有害なコンテンツを削減する点で優れたパフォーマンスを発揮します。同社は、これは最新バージョンのデータ照合におけるカスタマイズ作業の役割によるものであると考えています。シリーズの最初のモデルで今年初めにリリースされた Phi-1 には 13 億のパラメータがあり、基本的な Python コーディングタスク向けに微調整されています。今年 9 月、Microsoft は、13 億のパラメーターを備え、自然言語プログラミングで生成されたさまざまな合成テキストを含む新しいデータソースを使用してトレーニングされたモデルである Phi-1.5 を発表しました。

Microsoft は、Phi-2 の高効率により、これは、研究者が人工知能の安全性、解釈可能性、言語モデルの倫理的開発の強化などの分野を探索するための理想的なプラットフォームです。

以上がMicrosoft、多くの大規模な言語モデルを上回る 27 億パラメータの Phi-2 モデルをデビューの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Python 人工智能 azure llama

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：Douyin ダンスでは、実際の人間がカメラに映る必要はなく、写真だけで高品質のビデオを生成できます。偉そうなCTOもByteの新技術を体験している次の記事：Douyin ダンスでは、実際の人間がカメラに映る必要はなく、写真だけで高品質のビデオを生成できます。偉そうなCTOもByteの新技術を体験している

続きを見る