検索
ホームページテクノロジー周辺機器AIMollickは、新しい画像生成モデルの意味を提示します

Mollickは、新しい画像生成モデルの意味を提示します

最近、GoogleとOpenaiがリリースした新しい画像生成モデルは、広範囲の注目を集めており、そのコアテクノロジーは以前のモデルとはまったく異なります。イーサン・モリックの1つの有用なものの記事は、これらの新しいモデルの作業メカニズムと人間のユーザーへの影響を探ります。この記事では、Mollickの見解を解釈します。

マルチモーダル画像生成の可能性

Mollickは、従来の画像生成システムは複数のモデルの共同作業の産物であり、すべてのタスクを完了する単一のモデルではないと指摘しました。

「過去には、LLMによって大規模な言語モデル(LLM)生成画像が直接行われませんでした。AIはテキストプロンプトを独立した画像生成ツールに送信し、結果を表示しました。AIはテキストプロンプトの作成を担当しました。

拡散モデルは過去のものになっています

古いモデルは、主に拡散モデルの作業に依存しています。拡散モデルの動作原理は次のとおりです。画像をノイズに導入し、抽象処理を実行し、ノイズを削除して、コンピューターの既知の画像ライブラリのプロンプトに一致する画像を生成します。

ただし、この方法の制限は、生成された画像にはモデル独自の推論と判断がなく、既存の画像ライブラリの単純な組み合わせであり、貴重な情報を提供できないことです。

マルチモーダル制御の利点

今日、マルチモーダル制御技術の出現により、この状況が完全に変わりました。

Mollickは例を示しました。モデルに「象のない部屋と理由をマークする」ように促します。従来のモデルは、プロンプトのコンテキストを理解できないため、象を含む画像を生成します。生成されたテキストは、モデルの文字の理解もトレーニングデータに由来するため、意味のない、または架空の文字を含むことさえあります。

マルチモーダルモデルは、要件を満たす画像を正確に生成し、「ドアが小さすぎる」などのコメントを追加して、部屋に象がいない理由を説明します。

従来のモデルからのヒントの課題

従来のモデルの重要な欠点は、要素を除外する必要があると、命令を理解できないため、代わりにその要素が含まれることです。さらに、各変更または調整は、画像の基本構造を変更します。たとえば、キャラクターの帽子を変更すると、キャラクターの画像が完全に変化する可能性があります。

マルチモーダル画像生成モデルは、元の結果を保持することに基づいて微妙な調整を行うことができます。

環境保守

Mollickは別の例も示しています:カワウソが片手で特定のアイテムを保持してから、別のコンテキストと別のスタイルで表示されます。これは、マルチモーダル画像ジェネレーターの微細な統合機能を示しています。

完全なプレゼンテーション

Mollickは、ワカモレに関する推奨事項など、マルチモーダルモデルを使用して完全なプレゼンテーションを設計する方法も示しています。簡単な指示を提供するだけで、モデルはインターネット上の関連情報を検索し、統合し、最終結果を生成できます。

Mollickが言ったように、これはすぐに多くの人間の仕事の交代につながります。対応するフレームワークの確立を真剣に検討する必要があります。

以上がMollickは、新しい画像生成モデルの意味を提示しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
迅速なエンジニアリングにおける思考のグラフは何ですか迅速なエンジニアリングにおける思考のグラフは何ですかApr 13, 2025 am 11:53 AM

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

Genaiエージェントとの電子メールマーケティングを組織に最適化しますGenaiエージェントとの電子メールマーケティングを組織に最適化しますApr 13, 2025 am 11:44 AM

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apr 13, 2025 am 11:40 AM

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

ChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますApr 13, 2025 am 11:23 AM

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaPIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaApr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

生成AIアプリケーションのエージェントフレームワーク - 分析Vidhya生成AIアプリケーションのエージェントフレームワーク - 分析VidhyaApr 13, 2025 am 11:13 AM

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

金融セクターにおける生成AIの応用金融セクターにおける生成AIの応用Apr 13, 2025 am 11:12 AM

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

オンライン学習とパッシブアグレッシブアルゴリズムのガイドオンライン学習とパッシブアグレッシブアルゴリズムのガイドApr 13, 2025 am 11:09 AM

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません