ホームページ > 記事 > テクノロジー周辺機器 > 「AI」の世界を再び変える、GPT-4 が長らく待たれていました。
最近、人工知能チャット ロボット ChatGPT がインターネットを席巻し、ネチズンはその超高度な感情知能と巨大なパワーを評価しようとしています。大学受験を受けたり、コードを変更したり、小説を考えたり...大多数のネチズンの「プロンプト」に従って自己侵入し続け、プログラム全体を使用して子犬をつなぎ合わせることさえできます。これらのスキルは GPT-3.5 に基づいてのみ開発されており、3 月 15 日に AI ワールドが再び更新され、最新バージョンの GPT-4 も OpenAI によってリリースされました。
以前と比較して、GPT-4 はより強力な言語理解能力を発揮するだけでなく、画像コンテンツを処理することもでき、試験のスコアは人間の 90% を超えることもあります。では、そのような「反抗的な」GPT-4 には他にどのような機能があるのでしょうか?どのように作られているのでしょうか?
GPT-4 のリリース後、OpenAI 公式 Web サイトは一時的に混雑し、多くのユーザーがすぐに Plus サービスに登録したとソーシャル メディアで表明しました。 GPT-4のリリース後、「GPT-4」という用語は米国、日本、その他の地域のホットリスト、国内のWeiboホット検索リスト、Douyinホットソーシャルリストなどにすぐに登場しました。
OpenAI の公式紹介によると、GPT-4 は画像とテキストの入力を受け取り、テキストを出力できる大規模なマルチモーダル モデルです。現実世界の多くのシナリオでは人間よりも能力が劣りますが、専門的および学術的なさまざまなベンチマークでは人間レベルのパフォーマンスを示します。たとえば、GPT-4 は模擬 SAT (American Scholastic Aptitude Test) に合格して上位 10% を達成できますが、GPT-3.5 は下位 10% を達成できます。
公式デモ ビデオでは、Open AI の社長兼共同創設者であるグレッグ ブロックマン氏が、最新の画像認識機能をユーザーに披露していました。システムのバージョンはまだ公開されておらず、Be My Eyes という会社によってのみテストされています。この機能により、GPT-4 はプロンプトとともに送信された画像を分析して応答し、質問に答えたり、それらの画像に基づいてタスクを実行したりできるようになります。 「GPT-4 は単なる言語モデルではなく、視覚モデルでもあります。GPT-4 は、ドキュメントに似た、任意の画像やテキストが散在する入力を柔軟に受け入れることができます。」とブロックマン氏は述べています。デモンストレーション 別の瞬間に、Greg Brockman が手書きの Web サイトの予備スケッチの写真を GPT-4 に送信すると、システムはその図面に基づいて実用的な Web サイトを作成しました。
## 業界では、ChatGPT-4 は GPT-3 の 571 倍強力であり、このことから最も恩恵を受ける 3 つの主要な職業があると考えています。最近の業績は作家、マーケター、起業家です。両者の比較に基づいて、業界関係者は、GPT-4 には、より多くのトレーニング データ、より多様で創造的な応答、1 秒という短い反応時間など、他の利点があることも指摘しました。
このアップグレードに反映されている主なトレンドの 1 つはマルチモダリティであると考えています。モデルはより複雑かつ大規模になりました。さまざまなタイプのデータをモデルに入れることができます。私たちの周囲の環境と現実世界をより深く理解することができます。
さらに、GPT-4は多言語という点でも優位性を示しています。テストされた 26 言語のうち、ラトビア語やウェールズ語などの低リソース言語を含む 24 言語において、GPT-4 は GPT-3.5 などの他の大規模言語モデルの英語パフォーマンスよりも優れたパフォーマンスを示しました。中国の場合、GPT-4 は 80.1% の精度を達成できます。ただし、OpenAI は公式 Web サイトで GPT-4 の欠点も列挙しており、社会的偏見、事実の捏造、対立の生成などの既知の制限が依然として存在します。 OpenAIは、社会がAIモデルを受け入れるにつれて、透明性が高まり、ユーザー教育と広範な人工知能リテラシーの向上を奨励および推進し、AIモデルの育成における人々のインプットチャンネルの拡大に努めると述べた。
GPT-4 の開発により、その機能は多くの現実世界のシナリオでは人間ほど優れていないものの、次のような環境では良好に機能することがわかりました。さまざまな専門的・学術的なベンチマークテストで人間と同等のレベルを示しており、GPT-4が実用化に向けて一歩前進したことを意味します。
これまで、専門分野における GPT-3 のパフォーマンスは満足のいくものではないと考えられており、米国の統一司法試験 (MBE MEE MPT) では、GPT-3.5 は下位 10% にしかランクされませんでした。 GPT-4 の結果はすでに上位 10% にランクされる可能性があります。 GPT-4は専門分野での能力が大幅に向上し、一部の専門分野では徐々に人間に近づき、あるいは人間を超えるまでになっており、多くのToBビジネス分野でGPT-4の可能性が広がります。
たとえば、専門スキルの補助ツール、知識検索アプリケーション、職業教育や訓練などの分野では、GPT-4 によってもたらされる機能は革命的になる可能性があります。
GPT-4 のリリース後、Microsoft はすぐに次のように述べました。「過去 5 週間以内に新しい Bing プレビュー バージョンを使用したことがあれば、OpenAI の最新モデルの能力を事前に理解しているはずです。 」。これは、新しい Bing がすでに GPT-4 を使用していることを意味します。過去数週間で、多くの人が GPT-4 によって強化され、テキスト機能のみの使用が可能になった Bing を体験しました。 Microsoftは「ワールドプレミア」という言葉を使って表現しなかったが、結局のところ、MicrosoftはOpenAPIに130億ドル(約900億元)を投資しており、その見返りの扱いは妥当なものだ。
Microsoft の New Bing に加えて、現在、言語学習ツール ソフトウェア Duolingo、視覚障害ユーザーを支援するソフトウェア BeMyEyes、モバイル決済会社 Stripe、国際金融サービス会社 Morgan Stanley など、多くの企業が GPT-4 を製品に組み込んでいます。 、など。
しかし、GPT-4 は大規模なモデルを実装できる商業化シナリオを大幅に広げましたが、大規模なモデルを実装するプロセスではコンピューティング能力と研究開発コストを克服するのは難しいと多くの人が依然として考えていることを認めなければなりません。モデル、障害物。結局のところ、現在、大規模モデルの研究開発と計算能力の支出は恐ろしく高額であるようです。以前は、ChatGPT によって開示された 1 回のトレーニングと毎日の運用費用は数百万ドル単位でした。短期的には商業利用のコストを制御するのは難しいかもしれません。学期。
ご存知のとおり、ChatGPT は OpenAI によって開発された大規模な自然言語処理モデルですが、その開発の歴史が2015年。 OpenAI は 2015 年にテスラのマスク氏、サム アルトマン氏、その他の投資家によって共同設立され、高度な人工知能技術を通じて人工知能分野の発展を促進することを目指しています。マスク氏は会社の発展方向の違いを理由に2018年に退社した。
以前、OpenAI は自然言語処理モデルの GPT シリーズを発表したことで有名でした。 OpenAIは2018年から、記事、コード、機械翻訳、Q&Aなどのさまざまなコンテンツの生成に使用できる生成事前トレーニング言語モデルGPT(Generative Pre-trained Transformer)のリリースを開始しました。
GPT モデルの各世代のパラメータ数は爆発的に増加しており、2019 年 2 月にリリースされた GPT-2 のパラメータ数は 15 億でしたが、OpenAI が GPT-3 をリリースした 2020 年 5 月には、すでに世界最先端の自然言語生成モデル。 GPT-3 には 1,750 億個のパラメータがあります。
GPT-3 が教師なしモデル (現在では自己教師ありモデルと呼ばれることが多い) として登場すると、問題指向検索、読解、意味論などの自然言語処理のタスクのほとんどを完了できました。 . 推論、機械翻訳、記事生成、自動質問応答など。
さらに、このモデルは、フランス語から英語、ドイツ語から英語の機械翻訳タスクにおいて現在の最先端レベルに達するなど、多くのタスクにおいて優れたパフォーマンスを発揮します。さらに驚くべきことは、2 桁の加算と減算のタスクでほぼ 100% の精度を達成し、タスクの記述に基づいてコードを自動生成することもできることです。教師なしモデルには多くの機能と優れた効果があり、一般的な人工知能への期待を抱かせることが、GPT-3 の影響が大きい主な理由かもしれません。
OpenAIは2021年に、画像を生成できる人工知能技術「DALL-E」という新しい名称を発売すると発表した。同時に、OpenAI はより高度な自然言語処理テクノロジーも開発しています。
その後のストーリーは皆さんご存知かと思いますが、2022年末、GPT-3.5をベースとしたChatGPTが光の速さで世界を席巻し、世界最大の「技術的ブレイクダウン」となりました。 GPT-4 は多くの国で取り上げられており、ホットサーチされています。
GPTの将来はどうなるのでしょうか?アルゴリズム技術と計算能力技術の継続的な進歩により、ChatGPT はより強力な機能を備えたより高度なバージョンにさらに移行し、より多くの分野に適用され、人間にとってより多くのより良い会話とコンテンツを生成することが予測されます。
もしかしたら、GPT は現在の「AI」からはまだ遠いかもしれませんが、それが出発点、新しい「AI」時代の出発点であると考えてもよいでしょう。
以上が「AI」の世界を再び変える、GPT-4 が長らく待たれていました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。