著者|Yun Zhao
3 月 9 日、マイクロソフト ドイツ最高技術責任者 (CTO) のアンドレアス ブラウン氏が AI キックオフ カンファレンスで待望のニュースを発表しました。来週のリリースに合わせて、ビデオなど、まったく異なる可能性を提供するマルチモーダル モードを開始する予定です。」
## スタンフォード博士で Nvidia AI 科学者である Jim Fan は、これに基づいて 5 つの具体的な予測を立てました:
(1) 視覚的 IQ テスト: はい、人間のためのテストです。 (2) OCR による読み取り能力がない: スクリーンショット、スキャンした文書、道路標識、またはテキストを含むピクセルを入力します。明示的な OCR を使用せずに、コンテンツについて直接推論します。これは、マルチメディア Web ページ上の AI 駆動アプリケーションや、現実世界のカメラからの「野生のテキスト」のロックを解除するのに役立ちます。 (3) マルチモーダルチャット: 写真について会話します。途中で「フォローアップ」写真を提供することもできます。 (4) 字幕、視覚的な質疑応答、物体検出、シーンのレイアウト、常識的推論などの広範な視覚的理解機能。 (5) オーディオおよび音声認識: Kosmos-1 論文では言及されていませんが、Whisper はすでに OpenAI API であり、統合は簡単であるはずです。
ジムは、アンドレアスの最近の発表に基づく予測にはいくつかの矛盾がある可能性があると考えています。しかし、Kosmos-1 はすでにこれを実現しています。 GPT-4 や Microsoft が次に提供するあらゆる AI サービスの機能を提供すると考える理由があります。 「Kosmos-1 が研究室に留まり、製品にならないとは信じがたいです。」
マルチモーダル大規模モデルのアプリケーション例: 画像キャプチャ、画像質疑応答、OCR、ビジュアルダイアログ
Jim は実践者に、「マルチモーダル API の準備をしておいてください。それらは遅かれ早かれ登場します。」
2. GPT-4 は、アギ?十分とは程遠い
第一に、精度の問題はまだ十分ではありません。ドイツマイクロソフトの人工知能上級専門家であるシーブラー氏は、運用の信頼性と事実の忠実性について尋ねられたところ、AIが必ずしも正しく答えるとは限らず、検証が必要であると述べた。 Microsoft は現在、この問題に対処するための信頼度指標を作成中です。通常、顧客は独自のデータセットに対する AI サポートのみを使用し、モデルはすでに非常に正確であるため、主に在庫データの読解とクエリに使用します。ただし、モデルによって生成されたテキストはまだ生成的なものであるため、簡単に検証できません。 「私たちは、賛成派も反対派も含めて、フィードバック ループを構築しました。これは反復的なプロセスです」とシーブラー氏は語った。
第二に、十分なデータがありません。マルチモーダル GPT-4 は、強力な視覚、聴覚、読解力、推論能力を発揮しようとしていますが、これは AGI の氷山の一角にすぎず、人型ロボットを例にとると、制御データを統一することは困難です。ロボットの制御データ、および 、これらの制御データはロボットのハードウェアに関連しており、大きく異なります。したがって、異なる実際のロボットからの学習データを簡単に組み合わせることができず、テキスト、ビデオ、画像、音声などのデータとは質的に異なります。
3. GPT-4 に関する 2 つの噂
1. パラメータは 1 兆個?偽物!
GPT-4 は、OpenAI によって作成されている新しい言語モデルで、人間の音声に似たテキストを生成できます。これは、GPT-3.5 に基づいた ChatGPT で使用されるテクノロジーを進化させます。
業界の専門家は、2021 年 8 月の時点で、GPT-4 には 100 兆個のパラメータがあるだろうと推測していましたが、当時、一部の人々は次のように述べていました: より多くのパラメータを使用して AI を構築することが、必ずしもより良いパフォーマンスを保証するとは限らない応答性に影響を与える可能性があります。
#同様に、LLM に対する今日の厳しい目での熱意と、より巧妙な AGI アプローチの口先だけの無視は、2020 年代半ばから後半までにはばかばかしいものに見えるでしょう
##この投稿で私が言いたいのは、これらの LLM ベースのシステムがクールでも役に立たないと言っているわけではありません。単に、これらは、表面的に見えるほど AGI と密接に関連していない、流行の新しい狭い AI テクノロジである、ということです。請求。
つまり、GPT-4 は革命ではなく進化です。
5. 最後に書かれています
明らかに、ChatGPT 4 が OpenAI の次の製品の名前になる可能性は低いですが、ChatGPT の名前は創造的な想像力をもたらすでしょう。おそらく、その改善を推進する AI モデル GPT-4 と組み合わせられます。 AI 実務者とマネージャーは、GPT-4 と ChatGPT の現在の作業の進捗状況と、OpenAI が次のメジャー アップグレードをいつリリースするかに焦点を当てる必要があります。
最後に皆さんにお伝えしたいのは、来週リリースされる GPT-4 がこの記事の予測に一致するかどうかは重要ではないということです。を楽しみにしています。重要なのは、開発者またはその会社がマルチモーダルな大規模モデル API を受け入れる準備ができているかどうかです。これらすべてが 2024 年までに実現するとは、なんと幸運なことでしょう。
参考リンク:
https://arxiv.org/abs/2302.14045
https://www.heise.de/news/ GPT-4 は来週登場し、マルチモーダルになる予定です-Microsoft-Germany-7540972.html
https://t.co/JbtQvjoJ3W
以上がGPT-4に関する2つの噂と最新の予測!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

オンデバイスAIの力を活用:個人的なチャットボットCLIの構築 最近では、個人的なAIアシスタントの概念はサイエンスフィクションのように見えました。 ハイテク愛好家のアレックスを想像して、賢くて地元のAI仲間を夢見ています。

AI4MHの最初の発売は2025年4月15日に開催され、有名な精神科医および神経科学者であるLuminary Dr. Tom Insel博士がキックオフスピーカーを務めました。 Insel博士は、メンタルヘルス研究とテクノでの彼の傑出した仕事で有名です

「私たちは、WNBAが、すべての人、プレイヤー、ファン、企業パートナーが安全であり、大切になり、力を与えられたスペースであることを保証したいと考えています」とエンゲルバートは述べ、女性のスポーツの最も有害な課題の1つになったものに取り組んでいます。 アノ

導入 Pythonは、特にデータサイエンスと生成AIにおいて、プログラミング言語として優れています。 大規模なデータセットを処理する場合、効率的なデータ操作(ストレージ、管理、アクセス)が重要です。 以前に数字とstをカバーしてきました

潜る前に、重要な注意事項:AIパフォーマンスは非決定論的であり、非常にユースケース固有です。簡単に言えば、走行距離は異なる場合があります。この(または他の)記事を最終的な単語として撮影しないでください。これらのモデルを独自のシナリオでテストしないでください

傑出したAI/MLポートフォリオの構築:初心者と専門家向けガイド 説得力のあるポートフォリオを作成することは、人工知能(AI)と機械学習(ML)で役割を確保するために重要です。 このガイドは、ポートフォリオを構築するためのアドバイスを提供します

結果?燃え尽き症候群、非効率性、および検出とアクションの間の隙間が拡大します。これは、サイバーセキュリティで働く人にとってはショックとしてはありません。 しかし、エージェントAIの約束は潜在的なターニングポイントとして浮上しています。この新しいクラス

即時の影響と長期パートナーシップ? 2週間前、Openaiは強力な短期オファーで前進し、2025年5月末までに米国およびカナダの大学生にChatGpt Plusに無料でアクセスできます。このツールにはGPT ‑ 4o、Aが含まれます。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。
