ホームページ > 記事 > テクノロジー周辺機器 > Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成
Microsoft Bing は、テキストから画像を生成する機能を向上させました。また、Adobe も本日、生成 AI ゲームに参入するために Firefly をリリースしました。
昨夜はとても賑やかでした。
Nvidia GTC が進行中である一方で、Google は Bard のテストを正式にオープンしており、Microsoft Bing はここで孤独になるつもりはありません。
本日、Microsoft は、Bing 検索エンジンが OpenAI の DALL·E モデルにアクセスし、AI 生成画像の機能を追加したことを正式に発表しました。
言い換えれば、ChatGPT にアクセスした後、Bing は Bing Image Creator を再度強化し、ユーザーが DALL·E モデルを使用して画像を生成できるようにしました。
「Bing プレビュー アクセス権を持つユーザーの場合、Bing Image Creator は Bing チャット エクスペリエンスに完全に統合され、最初はクリエイティブ モードで起動されます。」と Microsoft の消費者マーケティング責任者の Yusuf Mehdi 氏は説明しました。 「画像の説明を入力し、場所やアクティビティなどの追加のコンテキストを提供し、アート スタイルを選択すると、Image Creator はユーザーの想像力に基づいて画像を生成します。」
# # Bing には、クリエイティブ モード、バランス モード、精密モードの 3 つの応答モードがあります。 Creative モードの Bing によって生成される結果は通常「独創的で想像力豊か」ですが、Precise モードでは正確さと関連性が重視され、より真実で簡潔な回答が得られます。現在、Image Creator はクリエイティブ モードでのみ使用できます。
Bing プレビュー バージョンにアクセスできない場合でも、ユーザーは bing.com/create に直接アクセスすることで Image Creator だけを使用して画像生成機能を試すことができることに注意してください。現在は英語のみです。入力がサポートされています。 Microsoft は、今後さらに多くの言語入力をサポートすると述べています。
さらに、Microsoft は、新しい AI を活用したビジュアル ストーリー (ビジュアル ストーリー) と Knowledge Cards 2.0 を Bing でリリースしました。
OpenAI テキスト生成画像に関する DALL・E シリーズの研究を簡単に紹介します。
2021 年 1 月 6 日、OpenAI ブログは、テキストと画像を接続する 2 つのニューラル ネットワーク、DALL・E と CLIP をリリースしました。 DALL・Eはテキストに基づいて画像を直接生成できますが、CLIPは画像とテキストのカテゴリのマッチングを完了できます。これら 2 つの研究結果の発表は、コミュニティに大きな懸念を引き起こしました。
ブログによれば、DALL・E は自然言語で表現された多数の概念を適切な画像に変換することができ、GPT-3 の 120 億パラメータ版とも言えるものです。テキストの説明に基づいて画像を生成します。
DALL・E 例。 「アボカドの形をした椅子」という文を考えると、さまざまな形の緑色のアボカド椅子の画像が得られます。
2 か月後、DALL・E の論文とコードが公開されました。
2022 年 4 月 7 日頃、DALL・E はアップグレードされたバージョン、DALL・E 2 を発表しました。 DALL・E と比較して、DALL・E 2 は解像度が高く、ユーザー記述画像を生成する際の遅延が短くなります。さらに新バージョンでは、オリジナル画像の編集などの新機能も追加されている。
OpenAI は、DALL・E 2 の研究論文「CLIP Latents を使用した階層的テキスト条件付き画像生成」も発表しました。
論文アドレス:https://cdn.openai.com/papers/dall-e-2.pdf
今回はBingアクセスDALL・E更新して反復する必要があります。これは、現在の ChatGPT のクロスモーダル生成の経験不足をある程度補います。しかし、GPT-4 のマルチモーダル機能が公開されると、さらに新しい体験がもたらされるかもしれません。
最後に、今日リリースされた生成 AI がもう 1 つあり、業界の人々の間で注目と議論を集めています。
このとき、Adobe は Firefly をリリースしました。これは、ユーザーがコマンドを入力することで画像をすばやく変更できる、創造的な表現のための一連の生成 AI モデルです。現在、Firefly はベータ版を公開しており、興味のある読者は体験を申し込むことができます。
現在、生成 AI のゲームに参入するプレーヤーがますます増えているようで、競争はますます激化しています。
以上がMicrosoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。