検索
ホームページテクノロジー周辺機器AIOpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

GPT-4 がついにリリースされました!

キャピタルマーケットカーニバルの後、脚光を浴びて誕生したGPT-4は、OpenAIが「GPT-4はより安全でより有用な応答を生成できるOpenAIの最も先進的なシステムです」というタイトルで公式サイトで公開した。この最新モデル。

ChatGPT はわずか 4 か月前にリリースされ、史上最も急速に成長しているコンシューマー アプリケーションとなっているため、この反復はまったく遅いものではありません。

一般に、GPT-4 は ChatGPT のコア テクノロジーを改善し、以前のバージョンよりも幅広い一般知識と問題解決能力を備え、チャット ソフトウェアがより高い精度で動作できるようにします。より困難な問題を解決できます。 。

さらに、画像を入力として受け入れる、タイトルを生成する、分類と分析など、いくつかの新機能も追加されています。

GPT-4 は 25,000 ワードを超えるテキストを処理することもできるため、長文コンテンツの作成、延長セッション、ドキュメントの検索と分析などの用途が可能になります。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

新しい機能: ミーム アクセシビリティを理解する

GPT-4 モデルの最大のアップデートの 1 つは、画像を入力として導入し、タイトルを生成することです。 GPT-3.5 はテキストのみを受け入れることができます。

たとえば、次の例:

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

質問: この写真のどこが面白いですか? 少しずつ説明してください。


GPT-4 回答: この画像は、「Lightning ケーブル」アダプターと 3 つの写真を示しています。


図 1: VGA コネクタ (コンピュータのモニタで一般的に使用される大きな青色の 15 ピン コネクタ) が充電ポートに接続されたスマートフォン。


図 2: 「Lightning ケーブル」アダプターのパッケージと、VGA コネクタの写真。


図 3: VGA コネクタの拡大図。最後に小さな Lightning コネクタ (iPhone やその他の Apple デバイスの充電に使用) が付いています。


この画像のユーモアは、大型の時代遅れの VGA コネクタを小型の最新のスマートフォンの充電ポートに差し込むという不条理から生まれています。

現時点では、GPT-4 はテキストからビデオへの生成やその他の動的に生成されるコンテンツを可能にするほど強力ではありませんが、将来の複数要素のチャットがどのようになるかを垣間見ることができます。将来、ビデオ、音声、画像、その他あらゆる形式のコンテンツがどのようにチャットに統合されるかは容易に想像できます。

古い機能: タスクが十分に複雑な場合、GPT-4 は GPT-3.5 よりも一歩上位になります。

GPT-4 は、深層学習の拡張における OpenAI の最新のマイルストーンであり、本質的には A大規模なマルチモーダル モデル (画像とテキストの入力を受け取り、テキストの出力を出力する) は、現実世界の多くのシナリオでは人間より劣るものの、その機能はさまざまな専門的および学術的なベンチマークで人間レベルのパフォーマンスに近づくか、さらにはそれを超えています。

たとえば、司法試験模擬試験では上位 10% 程度のスコアで合格しましたが、対照的に、GPT-3.5 は下位 10% 程度のスコアでした。

GPT-3.5 と GPT-4 の違いは、何気ない会話をしているだけでは微妙かもしれませんが、タスクの複雑さが十分なしきい値に達すると、違いが明らかになります。そして GPT を比較3.5 では、GPT-4 はより信頼性が高く、よりクリエイティブになり、より微妙な命令を処理できるようになりました。

2 つのモデルの違いを理解するために、OpenA は、もともと人間向けに設計された試験のシミュレーションを含むさまざまなベンチマークをテストしました。より高度なテストでは、GPT-4 のパフォーマンスが GPT -3.5 よりもはるかに優れていることがわかります。より良い。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

別の例として、GPT-4 はより優れた理解機能を備えていることがわかります。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

OMT: より多くの人によるフィードバックの導入

モデルの複雑性を高めるために、GPT-4 では、ChatGPT ユーザーを含むより多くの人によるフィードバックも追加しています。 GPT-4 の動作を改善するためのフィードバック。 OpenAIは、同社が「50人以上の専門家と協力して、AIの安全性やセキュリティなどの分野で早期フィードバックを提供している」と述べた。

発表の一環として、OpenAI は、Duolingo、Stripe、Morgan Stanley、アイスランド政府など、GPT-4 をテストしたいくつかの企業のユースケースを共有しました。同社は GPT-4 の研究ブログも共有し、「GPT-4 にはまだ多くの既知の制限があり、社会的偏見、幻覚、敵対的な手がかりなど、私たちが対処しようと懸命に取り組んでいる」と強調しました。ブラウン大学教授のスレシュ・ヴェンカタスブラマニアン氏は、このニュースについて慎重ながらも楽観的な見方をしている。 VentureBeat とのインタビューで、彼は次のように述べています:「公衆の注目を浴びるストレス テストで ChatGPT がどのように機能するかに興味があります。特に、それが一見本物に見えるコンテンツを作成できるかどうか、またどのように保護されるかに興味があります。」このような事態が起こらないようにするための措置が講じられています。」

以上がOpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaMeta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などAVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用:チャットボットは本当に気にすることができますか?マシンと話すための人的費用:チャットボットは本当に気にすることができますか?Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics Vidhyaラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

Dagsterでデータ品質チェックを自動化しますDagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか?メインフレームはAI時代に役割を果たしていますか?Apr 11, 2025 am 11:42 AM

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!