ホームページ >テクノロジー周辺機器 >AI >Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

PHPz転載: 2023-03-31 22:39:191674ブラウズ

Microsoft Bing は、テキストから画像を生成する機能を向上させました。また、Adobe も本日、生成 AI ゲームに参入するために Firefly をリリースしました。

昨夜はとても賑やかでした。

Nvidia GTC が進行中である一方で、Google は Bard のテストを正式にオープンしており、Microsoft Bing はここで孤独になるつもりはありません。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

本日、Microsoft は、Bing 検索エンジンが OpenAI の DALL·E モデルにアクセスし、AI 生成画像の機能を追加したことを正式に発表しました。

言い換えれば、ChatGPT にアクセスした後、Bing は Bing Image Creator を再度強化し、ユーザーが DALL·E モデルを使用して画像を生成できるようにしました。

「Bing プレビューアクセス権を持つユーザーの場合、Bing Image Creator は Bing チャットエクスペリエンスに完全に統合され、最初はクリエイティブモードで起動されます。」と Microsoft の消費者マーケティング責任者の Yusuf Mehdi 氏は説明しました。「画像の説明を入力し、場所やアクティビティなどの追加のコンテキストを提供し、アートスタイルを選択すると、Image Creator はユーザーの想像力に基づいて画像を生成します。」

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

# # Bing には、クリエイティブモード、バランスモード、精密モードの 3 つの応答モードがあります。 Creative モードの Bing によって生成される結果は通常「独創的で想像力豊か」ですが、Precise モードでは正確さと関連性が重視され、より真実で簡潔な回答が得られます。現在、Image Creator はクリエイティブモードでのみ使用できます。

Bing プレビューバージョンにアクセスできない場合でも、ユーザーは bing.com/create に直接アクセスすることで Image Creator だけを使用して画像生成機能を試すことができることに注意してください。現在は英語のみです。入力がサポートされています。 Microsoft は、今後さらに多くの言語入力をサポートすると述べています。

さらに、Microsoft は、新しい AI を活用したビジュアルストーリー (ビジュアルストーリー) と Knowledge Cards 2.0 を Bing でリリースしました。

OpenAI テキスト生成画像に関する DALL・E シリーズの研究を簡単に紹介します。

2021 年 1 月 6 日、OpenAI ブログは、テキストと画像を接続する 2 つのニューラルネットワーク、DALL・E と CLIP をリリースしました。 DALL・Eはテキストに基づいて画像を直接生成できますが、CLIPは画像とテキストのカテゴリのマッチングを完了できます。これら 2 つの研究結果の発表は、コミュニティに大きな懸念を引き起こしました。

ブログによれば、DALL・E は自然言語で表現された多数の概念を適切な画像に変換することができ、GPT-3 の 120 億パラメータ版とも言えるものです。テキストの説明に基づいて画像を生成します。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

DALL・E 例。「アボカドの形をした椅子」という文を考えると、さまざまな形の緑色のアボカド椅子の画像が得られます。

2 か月後、DALL・E の論文とコードが公開されました。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

プロジェクトアドレス: https://github.com/openai/DALL-E
論文アドレス: https://arxiv.org/ abs/2102.12092

2022 年 4 月 7 日頃、DALL・E はアップグレードされたバージョン、DALL・E 2 を発表しました。 DALL・E と比較して、DALL・E 2 は解像度が高く、ユーザー記述画像を生成する際の遅延が短くなります。さらに新バージョンでは、オリジナル画像の編集などの新機能も追加されている。

OpenAI は、DALL・E 2 の研究論文「CLIP Latents を使用した階層的テキスト条件付き画像生成」も発表しました。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

論文アドレス：https://cdn.openai.com/papers/dall-e-2.pdf

今回はBingアクセスDALL・E更新して反復する必要があります。これは、現在の ChatGPT のクロスモーダル生成の経験不足をある程度補います。しかし、GPT-4 のマルチモーダル機能が公開されると、さらに新しい体験がもたらされるかもしれません。

最後に、今日リリースされた生成 AI がもう 1 つあり、業界の人々の間で注目と議論を集めています。

このとき、Adobe は Firefly をリリースしました。これは、ユーザーがコマンドを入力することで画像をすばやく変更できる、創造的な表現のための一連の生成 AI モデルです。現在、Firefly はベータ版を公開しており、興味のある読者は体験を申し込むことができます。

Microsoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成

現在、生成 AI のゲームに参入するプレーヤーがますます増えているようで、競争はますます激化しています。

以上がMicrosoft Bing が再び強化されました。 OpenAI DALL・E モデルに接続してテキストから画像を生成の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Conditional github gpt-3 gpt-4 chatgpt bard https 搜索引擎 gpt

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：ロボット工学を応用するための 7 つのヒントとコツ次の記事：ロボット工学を応用するための 7 つのヒントとコツ

続きを見る