ホームページ > 記事 > テクノロジー周辺機器 > GPT-4o は GPT-4 を誰にでも提供します。これがその仕組みです
それで、GPT-4o とは何ですか?
GPT-4o は、ChatGPT 開発者の OpenAI の最新 AI モデルで、2024 年 5 月初旬の「Spring Update」イベントで公開されました。少なくとも現時点では、以前の最高性能モデルである GPT-4 Turbo と共存し、ツールに膨大な数のアップデートが行われます。
前任者とは異なり、GPT-4o は発売時から完全にマルチモーダルです (モデル名の「o」は「オムニモーダル」を表します)。 OpenAI の Spring Update イベントでは、GPT-4o がイベント主催者と流暢に会話し、インタラクション間を切り取って変更し、「個性」を披露し、ユーザーが夢見てきた仮想アシスタントになる方法を示しました。
オーディオ、テキスト、画像、ビデオの組み合わせを入出力として受け入れ、テキスト、オーディオ、画像で出力できます (ビデオはまだサポートされていませんが、少なくとも OpenAI の Sora テキストからビデオへのツールが起動すると変更されることが予想されます) 、これは私が推測していることです)。 OpenAI によって提供される生の数値に関しては、GPT-4o は、Claude 3 Opus、Gemini Pro 1.5 および Ultra 1.0、Llama 3 400B などの最も近い競合製品とともに、以前のモデルすべてを上回っています。
さて、数字はすべて非常に良好ですが、これは実際には何を意味するのでしょうか?さて、繰り返しになりますが、OpenAI の数値から考えると、GPT-4o は、英語の執筆とコーディングに関しては「GPT-4 Turbo のパフォーマンスに匹敵」し、「英語以外の言語」では大幅に高速であり、そして最も重要なことに、API の点では高速かつ安価です。使用。
GPT-4o のライブ機能は驚異的です
迅速に会話できるその能力により、さまざまな新しいアプリケーションが可能になります。 ChatGPT にはすでに音声機能がありましたが、最初に話しかけられる応答を作成する必要があるため、制限がありました。音声を使用して ChatGPT と対話することもできますが、リクエストの処理に時間がかかります。
現在、GPT-4o のリアルタイム音声はほぼシームレスです。さらに、感情や特定のスタイルを表現することもできますが、これもこのアップデート前には不可能でした。
これはライブ翻訳にも当てはまり、GPT-4o では大幅な改善が見られました。私は他の言語には詳しくありませんが、英語からイタリア語へのライブ翻訳は好評でした。海外にいるときのコミュニケーションを容易にするものは、特に翻訳のスピードを考えると大きな恩恵となるでしょう。
私は最近モロッコにいたのですが、Google 翻訳を使って意味をアラビア語に理解することはできましたが、翻訳の内容全体が完全に正確であるとは限りません。 GPT-4o のライブ翻訳は非常に便利だったでしょう。
コーディングと個別指導
音声だけを使用してコードをデバッグできる機能は注目に値します。ただし、その実際の用途は、実際のプログラマーや開発者がツールを使用し始めて初めて明らかになります。 ChatGPT のコーディング能力は便利ですが、ほとんどの生成 AI ツールと同様、ユーザーの知識と同じくらい役に立ちます。
GPT-4o はいつ発売されますか? GPT-4oは無料ですか?
GPT-4o が無料 ChatGPT 無料アカウントに公開される具体的な日付はありませんが、他のロールアウトの速度を考慮すると、それほど長くはかからないはずです。
新しいモデルの他の側面もまだ利用できません。たとえば、この記事用に新しいライブ音声機能の短いクリップを作成したいと思いましたが、この機能はまだ開始されておらず (私は ChatGPT Plus の長期購読者です)、同僚のどの機能にも導入されていません。アカウント。
GPT-4o では、macOS 以降で待望の ChatGPT デスクトップ バージョンも提供されますが、やはりまだリリースされていません。
以上がGPT-4o は GPT-4 を誰にでも提供します。これがその仕組みですの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。