GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています-AI-php.cn

ホームページ

テクノロジー周辺機器

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 01, 2023 am 09:25 AM

gpt-4評価

1956 年、ダートマス大学で開催されたセミナーで、人工知能の概念が正式に提案されました。

以来、この用語は定義が非常に難しいため、心理学者、哲学者、コンピューター科学者たちに挑戦を与えてきました。 1994年、52人の心理学者がその本質を捉えようとして共同論文を発表した。

時間が経つにつれて、研究者は、2016 年の AlphaGo で韓国のチャンピオンチェスプレーヤーに挑戦し、大勝利を収めたなど、特定の分野の AI システムに注目を移し始めました。その後、1990 年代後半から 2000 年代前半にかけて、研究者は特化した AI に満足できなくなり、より一般的な人工知能システムの開発を求める声が高まりました。これに伴い、汎用人工知能 (AGI) という用語が 2000 年代初頭に人気を集め始めました。

最近、ご覧のとおり、大規模言語モデル (LLM) が脚光を浴びています。これらのニューラルネットワークは、Transformer アーキテクチャに基づいており、大規模なテキストデータセットでトレーニングされています。特に、OpenAI の GPT-4 の最新リリースは、大規模言語モデルの多用途性を実証しており、数学、執筆、法律、医学、その他の分野に精通しています。

GPT-4 は AGI への重要なステップなのでしょうか?と尋ねずにはいられません。

Microsoft の答えは「はい」で、最近リリースされた論文でこの観点について詳しく説明されています。この記事では、GPT-4 の総合的な評価を提供します。 Microsoft は、「GPT-4 の機能の幅広さと奥深さを考慮すると、GPT-4 は汎用人工知能 (AGI) システムの初期の (ただしまだ不完全な) バージョンであると考えるのが合理的であると考えています。」

Microsoft はまた、「この記事の主な目的は、GPT-4 の機能と限界を調査することです。私たちは、GPT-4 のインテリジェンスがコンピューターサイエンスやその他の分野における真のパラダイムシフトを示すものであると信じています。」

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

論文アドレス: https://arxiv.org/pdf/2303.12712.pdf

興味深い残念ながら、この人気のある論文にも多くの削除があることが判明したため、誰かがこの論文の要約されていないバージョンを見つけました。

このブロガーは、ノーカットバージョンで、多くの隠された詳細も明らかにしました。たとえば、GPT-4 の内部名は DV-3 ですが、これは実際には、 3 番目の著者は後に削除されましたが、これらのマイクロソフトの研究者は GPT-4 の技術的な詳細についてはあまり知らなかったようです。さらに、このブロガーは、この論文が公開されたときに有害なコンテンツに関する部分が削除されたことも明らかにしました（OpenAIへの悪影響を防ぐため？）。

興味のある方はチェックしていただけるよう、ブロガーの Twitter スレッドを以下に貼り付けました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

Twitter スレッド: https://twitter.com/DV2559106965076/status/1638769434763608064 ##記事自体に戻ります。

記事によると、AGI は推論、計画、問題解決、抽象的思考、複雑なアイデアの理解、迅速な学習、経験から学ぶための特別な能力です。この論文では、これらの機能を起点として、興味深い実験と評価を行っています。

この論文は 10 章に分かれています: 第 1 章は一般的な部分、第 2 章は主にビジュアル生成コンテンツに関連するマルチモダリティを紹介します、第 3 章はコードに従って生成されたコードです。、既存のコードの理解; 第 4 章数学的能力; 第 5 章世界との相互作用; 第 6 章人間との相互作用; 第 7 章差別; 第 8 章 GPT-4 の制限; 第 9 章社会的影響; 第 10 章: 将来の方向性と結論。

GPT-4 が本当に AGI 時代に入ったかどうかを具体的な例を使って見てみましょう。

マルチモーダルかつ学際的な構成

アートとプログラミングを組み合わせるモデルの能力をテストするために、研究では GPT-4 に JavaScript でカンディンスキーを生成するコードを書くように依頼しました。 -スタイルのランダム画像。以下の最初の画像は Wassily Kandinsky によって作成され、2 番目と 3 番目の画像はそれぞれ GPT-4 と ChatGPT によって生成されました:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

GPT-4 コードの実装プロセスは次のとおりです:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

視覚的な概念の理解を実行する: この描画タスクでは、モデルに文字 Y、O、および H の形状を組み合わせて人物を描画させるように入力プロンプトを入力します。実際、GPT-4 のトレーニングプロセスでは、文字の形状についての知識はありません。関連するトレーニングデータから、文字が特定の形状に関連していることを漠然と学習することしかできません。結果は、GPT-4 によって生成された結果が示しています。 4 つは悪くありません:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

スケッチ生成の場合: GPT-4 を安定拡散と組み合わせることもできます。下の写真は 3D 都市モデリングのスクリーンショットで、入力プロンプトには左から右に流れる川、その川の隣にピラミッドが建つ砂漠、そして画面下部に 4 つのボタンがあり、色は緑、青、茶色と赤。生成された結果は次のとおりです:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

## GPT-4 に ABC 記譜法を使用して曲を生成および変更するように依頼することもできます:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

プログラミング能力

GPT-4 は、指示に従ってコードを書くことや、既存のコードを理解することなど、非常に強力なプログラミング能力を備えています。この研究では、特に GPT-4 のプログラミング機能をテストしました。

コード記述

以下の図 3.1 は、GPT-4 に Python 関数を記述させる例です。 LeetCode を使用して、コードがオンラインで正しいかどうかを判断します。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

研究では、GPT-4 に上記の表 2 の LeetCode の精度データをグラフとして視覚化させました。の結果を以下の図 3.2 に示します。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

フロントエンド/ゲーム開発 ##以下の図 3.3 に示すように、この調査では GPT-4 に JavaScript を使用して HTML で 3D ゲームを作成するよう依頼し、GPT-4 はサンプルをまったく使用せずにすべての要件を満たすゲームを生成しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

ディープラーニングプログラミング

ディープラーニングのコードを記述するには数学が必要です、統計知識、PyTorch、TensorFlow、Keras などのフレームワークやライブラリに精通していること。以下の図 3.4 に示すように、研究者はカスタムオプティマイザーモジュールを作成するために GPT-4 と ChatGPT を必要としていますが、これは人間の深層学習の専門家にとっても困難な作業です。研究者は、SVD の適用などの一連の重要な操作を含む GPT-4 と ChatGPT の自然言語記述を提供しています。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますさらに、この研究では、コードを LaTex 式に変換する GPT-4 の機能もテストしました。その結果を以下の図 3.5 に示します。

コードの理解という観点から、この研究では、GPT-4 と ChatGPT に C/C プログラムを「理解」させ、プログラムの出力結果を予測させることを試みています。両者のパフォーマンスは次のとおりです。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

#研究では、GPT-4 に Python コードの一部を解釈するよう依頼しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

また、説明するための疑似コードもあります:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

数学的能力

長い間、大規模な言語モデルの数学的能力はあまり優れていないようです。では、この点で GPT-4 はどのように機能するのでしょうか?この記事で一連の評価を行った結果、GPT-4 は以前のモデルと比較して数学において質的進歩を遂げていることが示されましたが、それでも専門家レベルには程遠く、数学的研究を行う能力はありません。

#ChatGPT と比較すると、GPT-4 は解決策を正常に生成しましたが、ChatGPT は間違った答えを生成しました:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

##AP の問題に関して、GPT-4 と ChatGPT の比較結果。 GPT-4 は正しいアプローチを使用していましたが、計算エラーにより間違った最終答えが得られましたが、ChatGPT は一貫性のない引数を生成しました。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

さらに、この記事では、数学的思考とテクノロジーを使用して現実世界の問題を解決する GPT-4 の能力もテストします。以下の図は、その方法を示しています。 GPT-4 ChatGPT は、広範な学際的知識を必要とする複雑なシステムの合理的な数学モデルの構築に成功しましたが、有意義な進歩を遂げることができませんでした。

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

論文は 154 ページあるため、この記事では多数の評価結果のみを示します。詳細については、原文を参照してください。紙。

最後に、目次を添付します:

GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています

# #

以上がGPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

敬意を表した技術：AIおよび先住民のコミュニティパワーApr 18, 2025 am 11:21 AM

答えは複雑です。 AIは、先住民族の自己決定、言語保存、気候管理をサポートする非常に大きな可能性を抱えています。しかし、それはまた、消去、搾取、除外の長年のパターンを深める危険を冒します - それがそうでない限り

デジタル製品エクスペリエンスに対する仮想AIエージェントの影響Apr 18, 2025 am 11:13 AM

カスタマーサービスの革新：統合情報システムにおける仮想AIエージェントの台頭今日の急速に進化するデジタル環境では、企業は顧客コミュニケーションを強化するための革新的な方法を常に求めています。の統合

Google Guilty Again、Meta on Trial、Openai Social、IRロールアップタッチキャストAIApr 18, 2025 am 11:10 AM

2025年4月17日、米国地区裁判官のレオニー・ブリンケマは、Googleがデジタル広告市場の重要なセグメントを違法に独占していると裁定しました。裁判所は、Googleが出版社の広告サーバーと広告交換を結びつけることでその支配を乱用したと判断しました。

AVバイト：SearchGpt、Llama 3.1などをフィーチャーした毎週のAIイノベーションApr 18, 2025 am 11:06 AM

今週、AIの分野での大きなブレークスルー！ AVバイトは、AIフィールドで最新の進歩をもたらします。興奮は見逃せません！検索エンジンの未来？ OpenaiのSearchGpt、Meta's Llama 3.1、およびMistral AIの大きな2モデルはすべて、すべてAIを新たな高みに押し上げます。さらに、AIは数学オリンピアードでメダルを獲得し、医療診断の分野で人間の医師を超えた可能性を示しました。これはすべて、サイエンスフィクションが徐々に現実になっていることを示しています！今週のハイライト： OpenaiのSearchGpt：高度な自然言語処理テクノロジーを使用して情報検索効率を向上させる新しい検索エンジンプロトタイプ。メタのllama 3.1：embrace

迅速なエンジニアリングの密度の連鎖は何ですか？ - 分析VidhyaApr 18, 2025 am 11:04 AM

プロンプトエンジニアリングで密度チェーンをマスターする：簡潔で効果的なプロンプトを作成する自然言語処理（NLP）と人工知能では、迅速なエンジニアリングのマスタリングが重要になっています。このスキルは科学と芸術を組み合わせており、AIモデルをガイドして目的の結果を生成するための正確な指示を慎重に設計することが含まれます。多くの技術の中で、密度の連鎖は、簡潔で効果的なヒントを作成する強力な方法として際立っています。この記事では、TIPSエンジニアリングにおける密度チェーンの概念、およびAI駆動型コンテンツ作成におけるそれらの重要性を深く探ります。概要エンジニアリングにおける密度チェーン法に関するヒントは、NLPおよびAIで非常に重要です。関連情報を圧縮して追加することにより、幅広い要約を繰り返し改善します。