GPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されています
1956 年、ダートマス大学で開催されたセミナーで、人工知能の概念が正式に提案されました。
以来、この用語は定義が非常に難しいため、心理学者、哲学者、コンピューター科学者たちに挑戦を与えてきました。 1994年、52人の心理学者がその本質を捉えようとして共同論文を発表した。
時間が経つにつれて、研究者は、2016 年の AlphaGo で韓国のチャンピオン チェス プレーヤーに挑戦し、大勝利を収めたなど、特定の分野の AI システムに注目を移し始めました。その後、1990 年代後半から 2000 年代前半にかけて、研究者は特化した AI に満足できなくなり、より一般的な人工知能システムの開発を求める声が高まりました。これに伴い、汎用人工知能 (AGI) という用語が 2000 年代初頭に人気を集め始めました。
最近、ご覧のとおり、大規模言語モデル (LLM) が脚光を浴びています。これらのニューラル ネットワークは、Transformer アーキテクチャに基づいており、大規模なテキスト データ セットでトレーニングされています。特に、OpenAI の GPT-4 の最新リリースは、大規模言語モデルの多用途性を実証しており、数学、執筆、法律、医学、その他の分野に精通しています。
GPT-4 は AGI への重要なステップなのでしょうか?と尋ねずにはいられません。
Microsoft の答えは「はい」で、最近リリースされた論文でこの観点について詳しく説明されています。この記事では、GPT-4 の総合的な評価を提供します。 Microsoft は、「GPT-4 の機能の幅広さと奥深さを考慮すると、GPT-4 は汎用人工知能 (AGI) システムの初期の (ただしまだ不完全な) バージョンであると考えるのが合理的であると考えています。」
Microsoft はまた、「この記事の主な目的は、GPT-4 の機能と限界を調査することです。私たちは、GPT-4 のインテリジェンスがコンピューター サイエンスやその他の分野における真のパラダイム シフトを示すものであると信じています。」
論文アドレス: https://arxiv.org/pdf/2303.12712.pdf
興味深い 残念ながら、この人気のある論文にも多くの削除があることが判明したため、誰かがこの論文の要約されていないバージョンを見つけました。
このブロガーは、ノーカット バージョンで、多くの隠された詳細も明らかにしました。たとえば、GPT-4 の内部名は DV-3 ですが、これは実際には、 3 番目の著者は後に削除されましたが、これらのマイクロソフトの研究者は GPT-4 の技術的な詳細についてはあまり知らなかったようです。さらに、このブロガーは、この論文が公開されたときに有害なコンテンツに関する部分が削除されたことも明らかにしました(OpenAIへの悪影響を防ぐため?)。
興味のある方はチェックしていただけるよう、ブロガーの Twitter スレッドを以下に貼り付けました。
Twitter スレッド: https://twitter.com/DV2559106965076/status/1638769434763608064 ##記事自体に戻ります。
記事によると、AGI は推論、計画、問題解決、抽象的思考、複雑なアイデアの理解、迅速な学習、経験から学ぶための特別な能力です。この論文では、これらの機能を起点として、興味深い実験と評価を行っています。
この論文は 10 章に分かれています: 第 1 章は一般的な部分、第 2 章は主にビジュアル生成コンテンツに関連するマルチモダリティを紹介します、第 3 章はコードに従って生成されたコードです。 、既存のコードの理解; 第 4 章 数学的能力; 第 5 章 世界との相互作用; 第 6 章 人間との相互作用; 第 7 章 差別; 第 8 章 GPT-4 の制限; 第 9 章 社会的影響; 第 10 章: 将来の方向性と結論。
GPT-4 が本当に AGI 時代に入ったかどうかを具体的な例を使って見てみましょう。
マルチモーダルかつ学際的な構成
アートとプログラミングを組み合わせるモデルの能力をテストするために、研究では GPT-4 に JavaScript でカンディンスキーを生成するコードを書くように依頼しました。 -スタイルのランダム画像。以下の最初の画像は Wassily Kandinsky によって作成され、2 番目と 3 番目の画像はそれぞれ GPT-4 と ChatGPT によって生成されました:GPT-4 コードの実装プロセスは次のとおりです:
視覚的な概念の理解を実行する: この描画タスクでは、モデルに文字 Y、O、および H の形状を組み合わせて人物を描画させるように入力プロンプトを入力します。実際、GPT-4 のトレーニング プロセスでは、文字の形状についての知識はありません。関連するトレーニング データから、文字が特定の形状に関連していることを漠然と学習することしかできません。結果は、GPT-4 によって生成された結果が示しています。 4 つは悪くありません:
スケッチ生成の場合: GPT-4 を安定拡散と組み合わせることもできます。下の写真は 3D 都市モデリングのスクリーンショットで、入力プロンプトには左から右に流れる川、その川の隣にピラミッドが建つ砂漠、そして画面下部に 4 つのボタンがあり、色は緑、青、茶色と赤。生成された結果は次のとおりです:
## GPT-4 に ABC 記譜法を使用して曲を生成および変更するように依頼することもできます:
GPT-4 は、指示に従ってコードを書くことや、既存のコードを理解することなど、非常に強力なプログラミング能力を備えています。この研究では、特に GPT-4 のプログラミング機能をテストしました。
コード記述
以下の図 3.1 は、GPT-4 に Python 関数を記述させる例です。 LeetCode を使用して、コードがオンラインで正しいかどうかを判断します。
研究では、GPT-4 に上記の表 2 の LeetCode の精度データをグラフとして視覚化させました。の結果を以下の図 3.2 に示します。
フロントエンド/ゲーム開発 ##以下の図 3.3 に示すように、この調査では GPT-4 に JavaScript を使用して HTML で 3D ゲームを作成するよう依頼し、GPT-4 はサンプルをまったく使用せずにすべての要件を満たすゲームを生成しました。
ディープ ラーニングのコードを記述するには数学が必要です、統計知識、PyTorch、TensorFlow、Keras などのフレームワークやライブラリに精通していること。以下の図 3.4 に示すように、研究者はカスタム オプティマイザー モジュールを作成するために GPT-4 と ChatGPT を必要としていますが、これは人間の深層学習の専門家にとっても困難な作業です。研究者は、SVD の適用などの一連の重要な操作を含む GPT-4 と ChatGPT の自然言語記述を提供しています。
さらに、この研究では、コードを LaTex 式に変換する GPT-4 の機能もテストしました。その結果を以下の図 3.5 に示します。
コードの理解という観点から、この研究では、GPT-4 と ChatGPT に C/C プログラムを「理解」させ、プログラムの出力結果を予測させることを試みています。両者のパフォーマンスは次のとおりです。
#研究では、GPT-4 に Python コードの一部を解釈するよう依頼しました。
また、説明するための疑似コードもあります:
長い間、大規模な言語モデルの数学的能力はあまり優れていないようです。では、この点で GPT-4 はどのように機能するのでしょうか?この記事で一連の評価を行った結果、GPT-4 は以前のモデルと比較して数学において質的進歩を遂げていることが示されましたが、それでも専門家レベルには程遠く、数学的研究を行う能力はありません。
#ChatGPT と比較すると、GPT-4 は解決策を正常に生成しましたが、ChatGPT は間違った答えを生成しました:
##AP の問題に関して、GPT-4 と ChatGPT の比較結果。 GPT-4 は正しいアプローチを使用していましたが、計算エラーにより間違った最終答えが得られましたが、ChatGPT は一貫性のない引数を生成しました。
さらに、この記事では、数学的思考とテクノロジーを使用して現実世界の問題を解決する GPT-4 の能力もテストします。以下の図は、その方法を示しています。 GPT-4 ChatGPT は、広範な学際的知識を必要とする複雑なシステムの合理的な数学モデルの構築に成功しましたが、有意義な進歩を遂げることができませんでした。
論文は 154 ページあるため、この記事では多数の評価結果のみを示します。詳細については、原文を参照してください。紙。
最後に、目次を添付します:
# #
以上がGPT-4 の完全な評価が完了した後、Microsoft のホットペーパーには、AGI の最初のバージョンが間もなくリリースされると記載されていますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

答えは複雑です。 AIは、先住民族の自己決定、言語保存、気候管理をサポートする非常に大きな可能性を抱えています。しかし、それはまた、消去、搾取、除外の長年のパターンを深める危険を冒します - それがそうでない限り

カスタマーサービスの革新:統合情報システムにおける仮想AIエージェントの台頭 今日の急速に進化するデジタル環境では、企業は顧客コミュニケーションを強化するための革新的な方法を常に求めています。 の統合

2025年4月17日、米国地区裁判官のレオニー・ブリンケマは、Googleがデジタル広告市場の重要なセグメントを違法に独占していると裁定しました。裁判所は、Googleが出版社の広告サーバーと広告交換を結びつけることでその支配を乱用したと判断しました。

今週、AIの分野での大きなブレークスルー! AVバイトは、AIフィールドで最新の進歩をもたらします。興奮は見逃せません!検索エンジンの未来? OpenaiのSearchGpt、Meta's Llama 3.1、およびMistral AIの大きな2モデルはすべて、すべてAIを新たな高みに押し上げます。さらに、AIは数学オリンピアードでメダルを獲得し、医療診断の分野で人間の医師を超えた可能性を示しました。これはすべて、サイエンスフィクションが徐々に現実になっていることを示しています! 今週のハイライト: OpenaiのSearchGpt:高度な自然言語処理テクノロジーを使用して情報検索効率を向上させる新しい検索エンジンプロトタイプ。 メタのllama 3.1:embrace

プロンプトエンジニアリングで密度チェーンをマスターする:簡潔で効果的なプロンプトを作成する 自然言語処理(NLP)と人工知能では、迅速なエンジニアリングのマスタリングが重要になっています。このスキルは科学と芸術を組み合わせており、AIモデルをガイドして目的の結果を生成するための正確な指示を慎重に設計することが含まれます。多くの技術の中で、密度の連鎖は、簡潔で効果的なヒントを作成する強力な方法として際立っています。この記事では、TIPSエンジニアリングにおける密度チェーンの概念、およびAI駆動型コンテンツ作成におけるそれらの重要性を深く探ります。 概要 エンジニアリングにおける密度チェーン法に関するヒントは、NLPおよびAIで非常に重要です。 関連情報を圧縮して追加することにより、幅広い要約を繰り返し改善します。

ElevenLabs:AIを使用した音声合成の革命 テキストを、ElevenLabsの最先端のAI音声合成とオーディオソリューションで簡単に魅惑的な声に変換します。 このガイドでは、ElevenLabsの主要な機能を調査し、実用的なAPIデモを提供します

迅速な画像検索:VGG16とFAISSを使用して高速類似性検索システムの構築 数え切れないほどの写真を手動で検索して特定の画像を見つけることを想像してみてください。 この記事では、解決策を探ります。稲妻の構築

導入 あなたがあなたの家族の安全を確保するので、煙の匂い、心臓のレースに目覚めることを想像してください。早期発見は非常に重要であり、深い学習駆動の火災検出システムである「Flame Guardian」は、


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

Dreamweaver Mac版
ビジュアル Web 開発ツール

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

WebStorm Mac版
便利なJavaScript開発ツール
