ホームページ  >  記事  >  テクノロジー周辺機器  >  OpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なります

OpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なります

WBOY
WBOY転載
2023-04-10 16:11:031431ブラウズ

OpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なります

# 3 月 16 日のニュース、人工知能研究会社 OpenAI は昨日、待望のテキスト生成 AI モデル GPT-4 をリリースしました。 OpenAIの共同創設者兼社長であるグレッグ・ブロックマン氏はインタビューで、GPT-4は完璧ではないが、明らかに違うと語った。

GPT-4 は、より真実に近い表現を提供し、開発者がそのスタイルと動作をより簡単に制御できるようにするなど、多くの重要な点で前身の GPT-3 を改良しています。 GPT-4 は、画像を理解したり、写真に注釈を追加したり、写真に写っているものを詳細に説明したりできるという意味でもマルチモーダルです。

しかし、GPT-4には重大な欠陥もあります。 GPT-3 と同様に、モデルは「錯覚」(つまり、モデルによって集約されたテキストがソース テキストと無関係であるか、十分に不正確である) に悩まされ、基本的な推論エラーを起こします。 OpenAIはブログで例を挙げ、GPT-4は「エルヴィス・プレスリー」を「俳優の息子」と表現したが、実際には両親も俳優ではなかった。

GPT-4 と GPT-3 を比較するよう求められたとき、ブロックマン氏は「違う」という 4 語の答えだけを返しました。彼は次のように説明しました。「GPT-4 は、まだ多くの問題やバグがありますが、明らかに異なります。しかし、微積分や法律などの科目のスキルが飛躍的に向上しているのがわかります。一部の領域ではパフォーマンスが非常に悪かったですが、現在は

テスト結果はブロックマンの見解を裏付けています。大学入学資格試験では、GPT-4 が 4 点(5 点満点)、GPT-3 が 1 点、GPT-3 と GPT-4 の間の GPT-3.5 も 4 点となります。 。司法模擬試験では、GPT-4 のスコアは上位 10% に入りましたが、GPT-3.5 のスコアは下位 10% 付近で推移していました。

同時に、GPT-4 は前述のマルチモードをより重視しています。 「キリンについての記事を書いてください」などのテキスト プロンプトのみを受け入れることができる GPT-3 および GPT-3.5 とは異なり、GPT-4 は画像とテキストの両方のプロンプトを受け入れて、画像内の人物の識別などの特定の操作を実行できます。セレンゲティで捕獲されたキリンとその内容の基本的な説明。

これは、GPT-4 が画像とテキスト データでトレーニングされていたのに対し、その前任者はテキストのみでトレーニングされていたためです。 OpenAIは、トレーニングデータは「法的に認可され、公開されているさまざまなデータソースから来ており、公開されている個人情報が含まれている可能性がある」と述べたが、詳細の提供を求められた際、ブロックマン氏は拒否した。 OpenAI は以前、トレーニング データによって法的トラブルに巻き込まれました。

GPT-4 の画像理解能力は人々に深い印象を残しました。たとえば、「この画像の何がそんなに面白いですか?」というプロンプトを入力すると、GPT-4 は画像全体を分解し、ジョークのオチを正しく説明します。

現在、GPT - 4 を使用できるパートナーは 1 人だけです。 、視覚障害者向けの支援アプリ「Be My Eyes」ブロックマン氏は、OpenAIがリスクとメリットとデメリットを随時評価するため、より広範な展開が進行中であると述べ、それは「ゆっくりと意図的に」行われるだろうと述べた。 # 彼はまた、「顔認識や人々の画像の処理方法など、対処する必要がある政策上の問題もあります。私たちは、危険ゾーンがどこにあるのか、赤い線がどこにあるのかを見つけ出し、時間をかけて解決策を見つける必要があります。 「

OpenAI は、テキストから画像への変換システム Dall-E 2 でも同様の倫理的ジレンマに直面しました。OpenAI は、最初にこの機能を無効にした後、顧客が AI を活用した画像生成システムで使用する顔をアップロードできるようにしました。」当時、OpenAI は、セキュリティ システムのアップグレードにより、ディープフェイクやポルノ、政治的、暴力的なコンテンツの作成の試みによる潜在的な害が最小限に抑えられるため、顔編集機能が可能になったと主張しました。長期的な問題は、GPT-4 が危害を引き起こす可能性のある方法で不注意に使用されることを防ぐことです。モデルがリリースされてから数時間後、イスラエルのサイバーセキュリティスタートアップ Adversa AI は、OpenAI のコンテンツ フィルターをバイパスすることを実証するブログ投稿を公開しました。また、GPT-4 にフィッシングメールを生成させます。同性愛者に対する攻撃的な説明やその他の不快なテキスト。

これは言語モデルの世界では新しい問題ではありません。Facebook の親会社 Meta のチャットボットである BlenderBot や OpenAI の ChatGPT も、不適切なコンテンツを出力する誘惑にさらされており、

GPT-4 の堅牢性について尋ねられたとき、ブロックマン氏は、このモデルは、GPT-4 の堅牢性について次のように強調しました。 「6か月のセキュリティトレーニングを受けている。内部テストでは、OpenAIの使用ポリシーで許可されていないコンテンツのリクエストには応答しなかった。GPTを理解するために多くの時間を費やした」とブロックマン氏は語った。私たちは、人々が求める個性やモードに合わせてモデルをさらに拡張できるように、さまざまな改善を含めてモデルを継続的に更新しています。 「

率直に言って、初期の実世界テストの結果はそれほど満足のいくものではありません。 Adversa AI テストに加えて、Microsoft のチャットボット Bing Chat も脱獄が非常に簡単であることが判明しました。ユーザーは慎重に作成された入力を使用して、チャットボットに愛情を表現したり、危害を加えると脅したり、大量殺人を正当化したり、陰謀論をでっち上げたりすることができます。

Brockman 氏は、GPT-4 がこの分野で不十分であることは否定しませんでしたが、「システム」メッセージと呼ばれる API レベルの機能を含む、このモデルの新しい制限ツールを強調しました。システム メッセージは基本的に、GPT-4 との対話の雰囲気を設定し、境界を確立する指示です。たとえば、システム メッセージは次のようになります。「あなたは常にソクラテス式で質問に答える家庭教師です。あなたは決して生徒に答えを与えることはありませんが、常に正しい質問をして、生徒が自分で考えることを学べるように努めています。」

システム メッセージが GPT-4 が軌道から外れることを防ぐガードレールとして機能するという考えです。 「GPT-4のトーン、スタイル、内容を本当に理解することが私たちの大きな焦点でした」とブロックマン氏は語った。

ブロックマン氏はまた、AI モデルのパフォーマンスを評価するための OpenAI の最新オープン ソース ソフトウェア フレームワークである Evals についても言及し、OpenAI はこのフレームワークの特徴を「強化」することに取り組んでいます。そのモデル。 Evals を使用すると、ユーザーはパフォーマンスをチェックしながらモデル (GPT-4 など) を評価するベンチマークを開発および実行できます。これはモデル テストへのクラウドソース アプローチです。

Brockman 氏は次のように述べています。「Evals を使用すると、ユーザーが関心のあるユースケースをよりよく確認でき、テストできるようになります。このフレームワークをオープンソース化した理由の 1 つは、3 回ごとに新しいモデルをリリースしなくなったことです。 」また、OpenAI は Evals でモデルをテストした人々に報酬を与えるかどうかも質問した。同氏はこれにコミットすることに消極的だったが、期間限定でOpenAIがGPT-4 APIを要求するEevalsユーザーにGPT-4 APIへの早期アクセスを許可していることには言及した。

ブロックマン氏は、追加のテキストを生成する前にモデルが考慮できるテキストを指す GPT-4 のコンテキスト ウィンドウについても話しました。 OpenAIは、通常のGPT-4の「メモリ」の5倍、GPT-3の「メモリ」の8倍である、約50ページのコンテンツを「記憶」できるバージョンのGPT-4をテストしている。

Brockman は、コンテキスト ウィンドウの拡大により、特に企業において、これまで未踏の新たなユースケースが生まれると考えています。彼は、さまざまな部門の従業員を含むさまざまなソースからの背景と知識を利用して、非常に知識豊富でありながら会話形式で質問に回答できる、企業向けに構築された AI チャットボットを構想していました。

これは新しい概念ではありません。しかし、ブロックマン氏は、GPT-4 の回答は、他のチャットボットや検索エンジンが現在提供している回答よりもはるかに役立つと信じています。 「以前は、モデルはあなたが誰なのか、何に興味があるのか​​などまったく知りませんでした。コンテキスト ウィンドウが大きくなったことで間違いなくモデルが強化され、モデルが人々に提供できるサポートが大幅に強化されました。」と彼は言いました。Xiaoxiao)

以上がOpenAI 社長: GPT-4 は完璧ではありませんが、明らかに異なりますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。