検索
ホームページテクノロジー周辺機器AIGPT-4に関する2つの噂と最新の予測!

GPT-4に関する2つの噂と最新の予測!

Apr 11, 2023 pm 06:07 PM
apigpt-4モデル

著者|Yun Zhao

3 月 9 日、マイクロソフト ドイツ最高技術責任者 (CTO) のアンドレアス ブラウン氏が AI キックオフ カンファレンスで待望のニュースを発表しました。来週のリリースに合わせて、ビデオなど、まったく異なる可能性を提供するマルチモーダル モードを開始する予定です。」

GPT-4に関する2つの噂と最新の予測!

##同氏は、大規模言語モデル (LLM) を「ゲームチェンジャー」に例えました。LLM は機械に自然言語を理解するよう教え、以前は人間しか読み取れなかったものを機械が統計的に理解するからです。同時に、このテクノロジーは「すべての言語で利用できる」ように進化しました。ドイツ語で質問し、イタリア語で答えることができます。マルチモダリティにより、Microsoft (-OpenAI) は「モデルを包括的なものにする」でしょう。

GPT-4 が大規模なマルチモーダル モデルになることは基本的に確実であるようです。しかし、GPT-4の正体を事前に知りたいのであれば、それを見つけることは不可能ではありません。

1. 予測: GPT-4 は以前のマルチモーダル大規模言語モデル Kosmos-1

実際に、3 月 1 日の時点で、私たちは次のことに気づきました。 Microsoft が公開したマルチモーダル大規模言語モデル Kosmos-1 が開発されました。 GPT-4 がマルチモーダルである場合、GPT-4 が何ができるかを合理的に予測できます。

GPT-4に関する2つの噂と最新の予測!

KOSMOS-1 は、マルチモーダル入力を認識できるマルチモーダル大規模言語モデル (MLLM) です。指示に従い、コンテキストに応じた実行を行います。学習タスク。これはマルチモーダル タスクである場合もあります。この取り組みでは、ビジョンを大規模言語モデル (LLM) と一致させ、LLM から MLLM への進化を推進します。

GPT-4に関する2つの噂と最新の予測!

## スタンフォード博士で Nvidia AI 科学者である Jim Fan は、これに基づいて 5 つの具体的な予測を立てました:

(1) 視覚的 IQ テスト: はい、人間のためのテストです。 (2) OCR による読み取り能力がない: スクリーンショット、スキャンした文書、道路標識、またはテキストを含むピクセルを入力します。明示的な OCR を使用せずに、コンテンツについて直接推論します。これは、マルチメディア Web ページ上の AI 駆動アプリケーションや、現実世界のカメラからの「野生のテキスト」のロックを解除するのに役立ちます。 (3) マルチモーダルチャット: 写真について会話します。途中で「フォローアップ」写真を提供することもできます。 (4) 字幕、視覚的な質疑応答、物体検出、シーンのレイアウト、常識的推論などの広範な視覚的理解機能。 (5) オーディオおよび音声認識: Kosmos-1 論文では言及されていませんが、Whisper はすでに OpenAI API であり、統合は簡単であるはずです。

GPT-4に関する2つの噂と最新の予測!

ジムは、アンドレアスの最近の発表に基づく予測にはいくつかの矛盾がある可能性があると考えています。しかし、Kosmos-1 はすでにこれを実現しています。 GPT-4 や Microsoft が次に提供するあらゆる AI サービスの機能を提供すると考える理由があります。 「Kosmos-1 が研究室に留まり、製品にならないとは信じがたいです。」

GPT-4に関する2つの噂と最新の予測!

マルチモーダル大規模モデルのアプリケーション例: 画像キャプチャ、画像質疑応答、OCR、ビジュアルダイアログ

Jim は実践者に、「マルチモーダル API の準備をしておいてください。それらは遅かれ早かれ登場します。」

2. GPT-4 は、アギ?十分とは程遠い

第一に、精度の問題はまだ十分ではありません。ドイツマイクロソフトの人工知能上級専門家であるシーブラー氏は、運用の信頼性と事実の忠実性について尋ねられたところ、AIが必ずしも正しく答えるとは限らず、検証が必要であると述べた。 Microsoft は現在、この問題に対処するための信頼度指標を作成中です。通常、顧客は独自のデータセットに対する AI サポートのみを使用し、モデルはすでに非常に正確であるため、主に在庫データの読解とクエリに使用します。ただし、モデルによって生成されたテキストはまだ生成的なものであるため、簡単に検証できません。 「私たちは、賛成派も反対派も含めて、フィードバック ループを構築しました。これは反復的なプロセスです」とシーブラー氏は語った。

第二に、十分なデータがありません。マルチモーダル GPT-4 は、強力な視覚、聴覚、読解力、推論能力を発揮しようとしていますが、これは AGI の氷山の一角にすぎず、人型ロボットを例にとると、制御データを統一することは困難です。ロボットの制御データ、および 、これらの制御データはロボットのハードウェアに関連しており、大きく異なります。したがって、異なる実際のロボットからの学習データを簡単に組み合わせることができず、テキスト、ビデオ、画像、音声などのデータとは質的に異なります。

3. GPT-4 に関する 2 つの噂

1. パラメータは 1 兆個?偽物!

GPT-4 は、OpenAI によって作成されている新しい言語モデルで、人間の音声に似たテキストを生成できます。これは、GPT-3.5 に基づいた ChatGPT で使用されるテクノロジーを進化させます。

業界の専門家は、2021 年 8 月の時点で、GPT-4 には 100 兆個のパラメータがあるだろうと推測していましたが、当時、一部の人々は次のように述べていました: より多くのパラメータを使用して AI を構築することが、必ずしもより良いパフォーマンスを保証するとは限らない応答性に影響を与える可能性があります。

GPT-4に関する2つの噂と最新の予測!

しかし、ChatGPT の父である Altman 氏は、すぐにこの噂に反論しました。ChatGPT の次のバージョンは AGI ではなく、またAGIでしょうか?パラメータは100兆個あります。それらの噂は間違いです。

2.Bing チャットは GPT-4 を使用しますか?

Microsoft は、新しい Bing または Bing Chat は ChatGPT よりも強力であると発表しました。 OpenAI のチャットは GPT-3.5 を使用しているため、Bing チャットでは GPT-4 が使用されているのではないかと推測する人もいます。これは確認されていません。

明らかに、Bing Chat はインターネット経由で現在の情報にアクセスできるようにアップグレードされました。これは、これまで 2021 年より前に受信したトレーニング データからしか恩恵を受けることができなかった ChatGPT に比べて大幅な改善です。

インターネット アクセスに加えて、Bing Chat に使用される AI モデルははるかに高速です。これは、研究室から持ち出されて検索エンジンに追加されるときに重要です。

しかし、これは OpenAI の GPT-4 モデルと同等である可能性は低いようです。 GPT-4 がすでに一般公開されている場合は、それを秘密にしておく必要はありません。

4. GPT-4: 革命ではなく進化

今後登場する GPT-4 が人々に深い印象を残すことは間違いありません。しかし、OpenAI CEO のサム・アルトマン氏は StrictlyVC とのインタビューで、「人々は失望することを『懇願』しており、彼らは失望するでしょう。」

アルトマン氏も以前 Twitter で次のように述べています。世界経済に大きな混乱を引き起こす可能性があるとし、世界に適応のチャンスをほとんど与えない衝撃的な進歩よりも、いくつかの小さな変更を迅速に展開する方が良いと述べた。

偶然にも、世界クラスの人工知能の達人である Ben Goertzel も GPT-3/GPT-4 に大量の冷や水を浴びせました:

もちろん、これらの「知識の整理」システム (ChatGPT など) に投資される資金と人的資源の量は、根拠のある自己修正的な認知の根っこをより尊重する代替 AI アプローチに投資される金額よりもはるかに大きいことに注意する必要があります。複雑。

1970 年代後半から 1990 年代前半にかけての、多層ニューラル ネットワークに対する広範な懐疑論とエキスパート システムの採用は、現在と同じように、素朴で古風で愚かなものに見えました。

#同様に、LLM に対する今日の厳しい目での熱意と、より巧妙な AGI アプローチの口先だけの無視は、2020 年代半ばから後半までにはばかばかしいものに見えるでしょう

##この投稿で私が言いたいのは、これらの LLM ベースのシステムがクールでも役に立たないと言っているわけではありません。単に、これらは、表面的に見えるほど AGI と密接に関連していない、流行の新しい狭い AI テクノロジである、ということです。請求。

つまり、GPT-4 は革命ではなく進化です。

5. 最後に書かれています

明らかに、ChatGPT 4 が OpenAI の次の製品の名前になる可能性は低いですが、ChatGPT の名前は創造的な想像力をもたらすでしょう。おそらく、その改善を推進する AI モデル GPT-4 と組み合わせられます。 AI 実務者とマネージャーは、GPT-4 と ChatGPT の現在の作業の進捗状況と、OpenAI が次のメジャー アップグレードをいつリリースするかに焦点を当てる必要があります。

最後に皆さんにお伝えしたいのは、来週リリースされる GPT-4 がこの記事の予測に一致するかどうかは重要ではないということです。を楽しみにしています。重要なのは、開発者またはその会社がマルチモーダルな大規模モデル API を受け入れる準備ができているかどうかです。これらすべてが 2024 年までに実現するとは、なんと幸運なことでしょう。

参考リンク:

https://arxiv.org/abs/2302.14045

https://www.heise.de/news/ GPT-4 は来週登場し、マルチモーダルになる予定です-Microsoft-Germany-7540972.html

https://t.co/JbtQvjoJ3W

以上がGPT-4に関する2つの噂と最新の予測!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Huggingface smollmであなたの個人的なAIアシスタントを構築する方法Huggingface smollmであなたの個人的なAIアシスタントを構築する方法Apr 18, 2025 am 11:52 AM

オンデバイスAIの力を活用:個人的なチャットボットCLIの構築 最近では、個人的なAIアシスタントの概念はサイエンスフィクションのように見えました。 ハイテク愛好家のアレックスを想像して、賢くて地元のAI仲間を夢見ています。

メンタルヘルスのためのAIは、スタンフォード大学でのエキサイティングな新しいイニシアチブによって注意深く分析されますメンタルヘルスのためのAIは、スタンフォード大学でのエキサイティングな新しいイニシアチブによって注意深く分析されますApr 18, 2025 am 11:49 AM

AI4MHの最初の発売は2025年4月15日に開催され、有名な精神科医および神経科学者であるLuminary Dr. Tom Insel博士がキックオフスピーカーを務めました。 Insel博士は、メンタルヘルス研究とテクノでの彼の傑出した仕事で有名です

2025年のWNBAドラフトクラスは、成長し、オンラインハラスメントの成長と戦いに参加します2025年のWNBAドラフトクラスは、成長し、オンラインハラスメントの成長と戦いに参加しますApr 18, 2025 am 11:44 AM

「私たちは、WNBAが、すべての人、プレイヤー、ファン、企業パートナーが安全であり、大切になり、力を与えられたスペースであることを保証したいと考えています」とエンゲルバートは述べ、女性のスポーツの最も有害な課題の1つになったものに取り組んでいます。 アノ

Pythonビルトインデータ構造の包括的なガイド-AnalyticsVidhyaPythonビルトインデータ構造の包括的なガイド-AnalyticsVidhyaApr 18, 2025 am 11:43 AM

導入 Pythonは、特にデータサイエンスと生成AIにおいて、プログラミング言語として優れています。 大規模なデータセットを処理する場合、効率的なデータ操作(ストレージ、管理、アクセス)が重要です。 以前に数字とstをカバーしてきました

Openaiの新しいモデルからの代替案からの第一印象Openaiの新しいモデルからの代替案からの第一印象Apr 18, 2025 am 11:41 AM

潜る前に、重要な注意事項:AIパフォーマンスは非決定論的であり、非常にユースケース固有です。簡単に言えば、走行距離は異なる場合があります。この(または他の)記事を最終的な単語として撮影しないでください。これらのモデルを独自のシナリオでテストしないでください

AIポートフォリオ| AIキャリアのためにポートフォリオを構築する方法は?AIポートフォリオ| AIキャリアのためにポートフォリオを構築する方法は?Apr 18, 2025 am 11:40 AM

傑出したAI/MLポートフォリオの構築:初心者と専門家向けガイド 説得力のあるポートフォリオを作成することは、人工知能(AI)と機械学習(ML)で役割を確保するために重要です。 このガイドは、ポートフォリオを構築するためのアドバイスを提供します

エージェントAIがセキュリティ運用にとって何を意味するのかエージェントAIがセキュリティ運用にとって何を意味するのかApr 18, 2025 am 11:36 AM

結果?燃え尽き症候群、非効率性、および検出とアクションの間の隙間が拡大します。これは、サイバーセキュリティで働く人にとってはショックとしてはありません。 しかし、エージェントAIの約束は潜在的なターニングポイントとして浮上しています。この新しいクラス

Google対Openai:学生のためのAIの戦いGoogle対Openai:学生のためのAIの戦いApr 18, 2025 am 11:31 AM

即時の影響と長期パートナーシップ? 2週間前、Openaiは強力な短期オファーで前進し、2025年5月末までに米国およびカナダの大学生にChatGpt Plusに無料でアクセスできます。このツールにはGPT ‑ 4o、Aが含まれます。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。