Heim >Technologie-Peripheriegeräte >KI >Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

PHPz
PHPznach vorne
2023-03-31 22:39:191573Durchsuche

Microsoft Bing hat seine Fähigkeit verbessert, Bilder aus Text zu generieren, und Adobe hat heute auch Firefly veröffentlicht, um in das generative KI-Spiel einzusteigen.

Gestern Abend war es richtig lebhaft.

Während Nvidia GTC in Arbeit ist, hat Google den Test von Bard offiziell eröffnet, und Microsoft Bing ist hier nicht allein.

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

Heute gab Microsoft offiziell bekannt, dass die Bing-Suchmaschine das DALL·E-Modell von OpenAI integriert und die Funktion von KI-generierten Bildern hinzugefügt hat.

Mit anderen Worten: Nach dem Zugriff auf ChatGPT hat Bing seinen Bing Image Creator erneut verbessert, um Benutzern die Generierung von Bildern mithilfe des DALL·E-Modells zu ermöglichen.

„Für Benutzer mit Bing Preview-Zugriff wird Bing Image Creator vollständig in das Bing-Chat-Erlebnis integriert und startet zunächst im Kreativmodus“, erklärte Yusuf Mehdi, Leiter Verbrauchermarketing bei Microsoft. „Durch Eingabe einer Beschreibung des Bildes, Bereitstellung zusätzlichen Kontexts wie Ort oder Aktivität und Auswahl eines künstlerischen Stils generiert Image Creator Bilder basierend auf der Fantasie des Benutzers

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

Bing verfügt über drei Reaktionsmodi: Kreativmodus, Ausgewogener Modus und präziser Modus. Die von Bing im Kreativmodus generierten Ergebnisse sind typischerweise „originell und einfallsreich“, während der Präzise-Modus Genauigkeit und Relevanz für wahrheitsgetreuere und prägnantere Antworten bevorzugt. Derzeit kann Image Creator nur im Kreativmodus verwendet werden.

Es ist erwähnenswert, dass Benutzer Image Creator auch dann verwenden können, wenn Sie keinen Zugriff auf die Bing-Vorschauversion haben, um die Funktion zur Bildgenerierung auszuprobieren, indem sie direkt auf bing.com/create zugreifen. Derzeit wird nur die englische Eingabe unterstützt. Microsoft sagt, dass es im Laufe der Zeit mehr Spracheingaben unterstützen wird.

Darüber hinaus hat Microsoft neue KI-gestützte visuelle Geschichten und Wissenskarten 2.0 in Bing eingeführt.

Wir stellen Ihnen kurz die DALL·E-Forschungsreihe zu textgenerierten OpenAI-Bildern vor.

Am 6. Januar 2021 veröffentlichte der OpenAI-Blog zwei neuronale Netze, die Text und Bilder verbinden: DALL・E und CLIP. DALL・E kann Bilder direkt basierend auf Text generieren, während CLIP den Abgleich von Bild- und Textkategorien durchführen kann. Die Veröffentlichung dieser beiden Studien hat in der Community große Besorgnis ausgelöst.

Laut dem Blog kann DALL・E eine große Anzahl von in natürlicher Sprache ausgedrückten Konzepten in geeignete Bilder umwandeln. Man kann sagen, dass es sich um die 12-Milliarden-Parameter-Version von GPT-3 handelt, auf deren Grundlage Bilder generiert werden können Textbeschreibungen.

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

DALL・E Beispiel. Mit dem Satz „Avocado-förmiger Stuhl“ können Sie Bilder von grünen Avocado-Stühlen mit unterschiedlichen Formen erhalten.

2 Monate später wurden die Papiere und der Code von DALL·E veröffentlicht.

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

  • Projektadresse: https://github.com/openai/DALL-E
  • Papieradresse: https://arxiv.org/abs/2102.12092

Um den 7. April 2022, DALL・E läutete eine aktualisierte Version ein – DALL・E 2. Im Vergleich zu DALL・E verfügt DALL・E 2 über eine höhere Auflösung und eine geringere Latenz bei der Generierung benutzerdefinierter Bilder. Darüber hinaus bietet die neue Version auch einige neue Funktionen, wie zum Beispiel die Bearbeitung von Originalbildern.

OpenAI kündigte außerdem die Forschungsarbeit von DALL・E 2 „Hierarchical Text-Conditional Image Generation with CLIP Latents“ an.

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

Papieradresse: https://cdn.openai.com/papers/dall-e-2.pdf

Das DALL・E, auf das Bing dieses Mal zugreift, hätte aktualisiert und iteriert werden sollen. Dies gleicht bis zu einem gewissen Grad die mangelnde Erfahrung des aktuellen ChatGPT mit der modalübergreifenden Generierung aus. Wenn jedoch die multimodalen Fähigkeiten von GPT-4 geöffnet werden, könnte es uns mehr neue Erfahrungen bringen.

Endlich gibt es heute eine weitere generative KI-Veröffentlichung, die unter Brancheninsidern für Aufmerksamkeit und Diskussion gesorgt hat.

Damals veröffentlicht Adobe Firefly. Hierbei handelt es sich um eine Reihe generativer KI-Modelle für den kreativen Ausdruck, die es Benutzern ermöglichen, Bilder schnell durch Eingabe von Befehlen zu ändern. Derzeit hat Firefly eine Beta-Version geöffnet, und interessierte Leser können sich bewerben, um sie zu testen.

Microsoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren

Heutzutage scheint es, dass immer mehr Spieler in das Spiel der generativen KI einsteigen und der Wettbewerb immer härter wird.

Das obige ist der detaillierte Inhalt vonMicrosoft Bing wurde erneut verbessert! Stellen Sie eine Verbindung zum OpenAI DALL·E-Modell her, um Bilder aus Text zu generieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen