ホームページ >テクノロジー周辺機器 >AI >OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

WBOY
WBOY転載
2023-04-12 16:13:041703ブラウズ

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

GPT-4 がついにリリースされました!

キャピタルマーケットカーニバルの後、脚光を浴びて誕生したGPT-4は、OpenAIが「GPT-4はより安全でより有用な応答を生成できるOpenAIの最も先進的なシステムです」というタイトルで公式サイトで公開した。この最新モデル。

ChatGPT はわずか 4 か月前にリリースされ、史上最も急速に成長しているコンシューマー アプリケーションとなっているため、この反復はまったく遅いものではありません。

一般に、GPT-4 は ChatGPT のコア テクノロジーを改善し、以前のバージョンよりも幅広い一般知識と問題解決能力を備え、チャット ソフトウェアがより高い精度で動作できるようにします。より困難な問題を解決できます。 。

さらに、画像を入力として受け入れる、タイトルを生成する、分類と分析など、いくつかの新機能も追加されています。

GPT-4 は 25,000 ワードを超えるテキストを処理することもできるため、長文コンテンツの作成、延長セッション、ドキュメントの検索と分析などの用途が可能になります。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

新しい機能: ミーム アクセシビリティを理解する

GPT-4 モデルの最大のアップデートの 1 つは、画像を入力として導入し、タイトルを生成することです。 GPT-3.5 はテキストのみを受け入れることができます。

たとえば、次の例:

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

質問: この写真のどこが面白いですか? 少しずつ説明してください。


GPT-4 回答: この画像は、「Lightning ケーブル」アダプターと 3 つの写真を示しています。


図 1: VGA コネクタ (コンピュータのモニタで一般的に使用される大きな青色の 15 ピン コネクタ) が充電ポートに接続されたスマートフォン。


図 2: 「Lightning ケーブル」アダプターのパッケージと、VGA コネクタの写真。


図 3: VGA コネクタの拡大図。最後に小さな Lightning コネクタ (iPhone やその他の Apple デバイスの充電に使用) が付いています。


この画像のユーモアは、大型の時代遅れの VGA コネクタを小型の最新のスマートフォンの充電ポートに差し込むという不条理から生まれています。

現時点では、GPT-4 はテキストからビデオへの生成やその他の動的に生成されるコンテンツを可能にするほど強力ではありませんが、将来の複数要素のチャットがどのようになるかを垣間見ることができます。将来、ビデオ、音声、画像、その他あらゆる形式のコンテンツがどのようにチャットに統合されるかは容易に想像できます。

古い機能: タスクが十分に複雑な場合、GPT-4 は GPT-3.5 よりも一歩上位になります。

GPT-4 は、深層学習の拡張における OpenAI の最新のマイルストーンであり、本質的には A大規模なマルチモーダル モデル (画像とテキストの入力を受け取り、テキストの出力を出力する) は、現実世界の多くのシナリオでは人間より劣るものの、その機能はさまざまな専門的および学術的なベンチマークで人間レベルのパフォーマンスに近づくか、さらにはそれを超えています。

たとえば、司法試験模擬試験では上位 10% 程度のスコアで合格しましたが、対照的に、GPT-3.5 は下位 10% 程度のスコアでした。

GPT-3.5 と GPT-4 の違いは、何気ない会話をしているだけでは微妙かもしれませんが、タスクの複雑さが十分なしきい値に達すると、違いが明らかになります。そして GPT を比較3.5 では、GPT-4 はより信頼性が高く、よりクリエイティブになり、より微妙な命令を処理できるようになりました。

2 つのモデルの違いを理解するために、OpenA は、もともと人間向けに設計された試験のシミュレーションを含むさまざまなベンチマークをテストしました。より高度なテストでは、GPT-4 のパフォーマンスが GPT -3.5 よりもはるかに優れていることがわかります。より良い。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

別の例として、GPT-4 はより優れた理解機能を備えていることがわかります。

OpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!

OMT: より多くの人によるフィードバックの導入

モデルの複雑性を高めるために、GPT-4 では、ChatGPT ユーザーを含むより多くの人によるフィードバックも追加しています。 GPT-4 の動作を改善するためのフィードバック。 OpenAIは、同社が「50人以上の専門家と協力して、AIの安全性やセキュリティなどの分野で早期フィードバックを提供している」と述べた。

発表の一環として、OpenAI は、Duolingo、Stripe、Morgan Stanley、アイスランド政府など、GPT-4 をテストしたいくつかの企業のユースケースを共有しました。同社は GPT-4 の研究ブログも共有し、「GPT-4 にはまだ多くの既知の制限があり、社会的偏見、幻覚、敵対的な手がかりなど、私たちが対処しようと懸命に取り組んでいる」と強調しました。ブラウン大学教授のスレシュ・ヴェンカタスブラマニアン氏は、このニュースについて慎重ながらも楽観的な見方をしている。 VentureBeat とのインタビューで、彼は次のように述べています:「公衆の注目を浴びるストレス テストで ChatGPT がどのように機能するかに興味があります。特に、それが一見本物に見えるコンテンツを作成できるかどうか、またどのように保護されるかに興味があります。」このような事態が起こらないようにするための措置が講じられています。」

以上がOpenAIが質問解決能力を強化し、画像入力も可能なのでミームの理解が容易なGPT-4をリリース!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。