ホームページ >テクノロジー周辺機器 >AI >GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています
1956 年、ダートマス大学で開催されたセミナーで、人工知能の概念が正式に提案されました。
以来、この用語は定義が非常に難しいため、心理学者、哲学者、コンピューター科学者たちに挑戦を与えてきました。 1994年、52人の心理学者がその本質を捉えようとして共同論文を発表した。
時間が経つにつれて、研究者は、2016 年の AlphaGo で韓国のチャンピオン チェス プレーヤーに挑戦し、大勝利を収めたなど、特定の分野の AI システムに注目を移し始めました。その後、1990 年代後半から 2000 年代前半にかけて、研究者は特化した AI に満足できなくなり、より一般的な人工知能システムの開発を求める声が高まりました。これに伴い、汎用人工知能 (AGI) という用語が 2000 年代初頭に人気を集め始めました。
最近、ご覧のとおり、大規模言語モデル (LLM) が脚光を浴びています。これらのニューラル ネットワークは、Transformer アーキテクチャに基づいており、大規模なテキスト データ セットでトレーニングされています。特に、OpenAI の GPT-4 の最新リリースは、大規模言語モデルの多用途性を実証しており、数学、執筆、法律、医学、その他の分野に精通しています。
GPT-4 は AGI への重要なステップなのでしょうか?と尋ねずにはいられません。
Microsoft の答えは「はい」で、最近リリースされた論文でこの観点について詳しく説明されています。この記事では、GPT-4 の総合的な評価を提供します。 Microsoft は、「GPT-4 の機能の幅広さと奥深さを考慮すると、GPT-4 は汎用人工知能 (AGI) システムの初期の (ただしまだ不完全な) バージョンであると考えるのが合理的であると考えています。」
Microsoft はまた、「この記事の主な目的は、GPT-4 の機能と限界を調査することです。私たちは、GPT-4 のインテリジェンスがコンピューター サイエンスやその他の分野における真のパラダイム シフトを示すものであると信じています。」
論文アドレス: https://arxiv.org/pdf/2303.12712.pdf
興味深い 残念ながら、この人気のある論文にも多くの削除があることが判明したため、誰かがこの論文の要約されていないバージョンを見つけました。
このブロガーは、ノーカット バージョンで、多くの隠された詳細も明らかにしました。たとえば、GPT-4 の内部名は DV-3 ですが、これは実際には、 3 番目の著者は後に削除されましたが、これらのマイクロソフトの研究者は GPT-4 の技術的な詳細についてはあまり知らなかったようです。さらに、このブロガーは、この論文が公開されたときに有害なコンテンツに関する部分が削除されたことも明らかにしました(OpenAIへの悪影響を防ぐため?)。
興味のある方はチェックしていただけるよう、ブロガーの Twitter スレッドを以下に貼り付けました。
Twitter スレッド: https://twitter.com/DV2559106965076/status/1638769434763608064 ##記事自体に戻ります。
記事によると、AGI は推論、計画、問題解決、抽象的思考、複雑なアイデアの理解、迅速な学習、経験から学ぶための特別な能力です。この論文では、これらの機能を起点として、興味深い実験と評価を行っています。
この論文は 10 章に分かれています: 第 1 章は一般的な部分、第 2 章は主にビジュアル生成コンテンツに関連するマルチモダリティを紹介します、第 3 章はコードに従って生成されたコードです。 、既存のコードの理解; 第 4 章 数学的能力; 第 5 章 世界との相互作用; 第 6 章 人間との相互作用; 第 7 章 差別; 第 8 章 GPT-4 の制限; 第 9 章 社会的影響; 第 10 章: 将来の方向性と結論。
GPT-4 が本当に AGI 時代に入ったかどうかを具体的な例を使って見てみましょう。
マルチモーダルかつ学際的な構成
アートとプログラミングを組み合わせるモデルの能力をテストするために、研究では GPT-4 に JavaScript でカンディンスキーを生成するコードを書くように依頼しました。 -スタイルのランダム画像。以下の最初の画像は Wassily Kandinsky によって作成され、2 番目と 3 番目の画像はそれぞれ GPT-4 と ChatGPT によって生成されました:GPT-4 コードの実装プロセスは次のとおりです:
視覚的な概念の理解を実行する: この描画タスクでは、モデルに文字 Y、O、および H の形状を組み合わせて人物を描画させるように入力プロンプトを入力します。実際、GPT-4 のトレーニング プロセスでは、文字の形状についての知識はありません。関連するトレーニング データから、文字が特定の形状に関連していることを漠然と学習することしかできません。結果は、GPT-4 によって生成された結果が示しています。 4 つは悪くありません:
スケッチ生成の場合: GPT-4 を安定拡散と組み合わせることもできます。下の写真は 3D 都市モデリングのスクリーンショットで、入力プロンプトには左から右に流れる川、その川の隣にピラミッドが建つ砂漠、そして画面下部に 4 つのボタンがあり、色は緑、青、茶色と赤。生成された結果は次のとおりです:
## GPT-4 に ABC 記譜法を使用して曲を生成および変更するように依頼することもできます:
プログラミング能力GPT-4 は、指示に従ってコードを書くことや、既存のコードを理解することなど、非常に強力なプログラミング能力を備えています。この研究では、特に GPT-4 のプログラミング機能をテストしました。
コード記述
以下の図 3.1 は、GPT-4 に Python 関数を記述させる例です。 LeetCode を使用して、コードがオンラインで正しいかどうかを判断します。
研究では、GPT-4 に上記の表 2 の LeetCode の精度データをグラフとして視覚化させました。の結果を以下の図 3.2 に示します。
フロントエンド/ゲーム開発 ##以下の図 3.3 に示すように、この調査では GPT-4 に JavaScript を使用して HTML で 3D ゲームを作成するよう依頼し、GPT-4 はサンプルをまったく使用せずにすべての要件を満たすゲームを生成しました。
ディープ ラーニング プログラミング
ディープ ラーニングのコードを記述するには数学が必要です、統計知識、PyTorch、TensorFlow、Keras などのフレームワークやライブラリに精通していること。以下の図 3.4 に示すように、研究者はカスタム オプティマイザー モジュールを作成するために GPT-4 と ChatGPT を必要としていますが、これは人間の深層学習の専門家にとっても困難な作業です。研究者は、SVD の適用などの一連の重要な操作を含む GPT-4 と ChatGPT の自然言語記述を提供しています。
さらに、この研究では、コードを LaTex 式に変換する GPT-4 の機能もテストしました。その結果を以下の図 3.5 に示します。
コードの理解という観点から、この研究では、GPT-4 と ChatGPT に C/C プログラムを「理解」させ、プログラムの出力結果を予測させることを試みています。両者のパフォーマンスは次のとおりです。
#研究では、GPT-4 に Python コードの一部を解釈するよう依頼しました。
また、説明するための疑似コードもあります:
数学的能力長い間、大規模な言語モデルの数学的能力はあまり優れていないようです。では、この点で GPT-4 はどのように機能するのでしょうか?この記事で一連の評価を行った結果、GPT-4 は以前のモデルと比較して数学において質的進歩を遂げていることが示されましたが、それでも専門家レベルには程遠く、数学的研究を行う能力はありません。
#ChatGPT と比較すると、GPT-4 は解決策を正常に生成しましたが、ChatGPT は間違った答えを生成しました:
##AP の問題に関して、GPT-4 と ChatGPT の比較結果。 GPT-4 は正しいアプローチを使用していましたが、計算エラーにより間違った最終答えが得られましたが、ChatGPT は一貫性のない引数を生成しました。
さらに、この記事では、数学的思考とテクノロジーを使用して現実世界の問題を解決する GPT-4 の能力もテストします。以下の図は、その方法を示しています。 GPT-4 ChatGPT は、広範な学際的知識を必要とする複雑なシステムの合理的な数学モデルの構築に成功しましたが、有意義な進歩を遂げることができませんでした。
論文は 154 ページあるため、この記事では多数の評価結果のみを示します。詳細については、原文を参照してください。紙。
最後に、目次を添付します:
# #
以上がGPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。