ホームページ >テクノロジー周辺機器 >AI >かつて人気だった InstantID には、オープンソース化された様式化された画像の生成という新しい遊び方があります。
InstantID 元のチームは、スタイル移行の新しい方法である InstantStyle を立ち上げました。
スタイル化された画像の生成はスタイル転送と呼ばれることがあり、その目標は、参照画像とスタイルが一致し、元の画像コンテンツと一致する画像を生成することです。このテクノロジーは、同じスタイル データのバッチ トレーニングのための拡散手法 (LoRA など) に基づいており、新しいスタイルに移行することはできません。または、反転操作 (StyleAlign など) に基づいて、スタイル イメージを潜在ノイズに復元することにより、順伝播によって取得された K と V を使用して、生成時にスタイル イメージを置き換えます。この方法では、反転操作により生成スタイルが劣化することがよくあります。
最近、InstantID の元のチームは、スタイル移行の新しい方法である InstantStyle を開始しました。 Face ID とは異なり、これは一般的な画像スタイル挿入フレームワークであり、2 つのシンプルだが非常に効果的な手法を使用して、参照画像からスタイルとコンテンツを効果的に分離します。この方法は、参照画像からスタイルとコンテンツを効果的に分離し、スタイルとコンテンツの効果的な融合を実現するための、シンプルですが非常に効果的な手法を提供します。
論文: InstantStyle: テキストから画像への生成におけるスタイル保持に向けた無料のランチ
論文のアドレス: https://huggingface.co/papers/2404.02733
プロジェクトのホームページ: https://instantstyle.github.io/
メソッドの紹介
上記の観察と実験に基づいて、著者は、図に示すように、InstantStyle メソッドを提案しました。このメソッドの中核には、次の 2 つのモジュールが含まれています。 (1) 特徴減算: CLIP のアイドル機能を使用して特徴減算を明示的に実行し、画像特徴内のコンテンツ情報を削除し、参照画像の影響を軽減します。生成された画像のコンテンツ。スタイルの決定が不十分である場合と比較して、コンテンツ情報はテキストを通じて単純に説明するのが簡単であることが多いため、CLIP のテキスト エンコーダーを使用してコンテンツの特徴を抽出し、分離することができます。 (2) スタイル レイヤー インジェクションのみ: 機能インジェクションは特定のスタイル レイヤー内でのみ完了し、暗黙的にスタイルとコンテンツの分離を実現します。 UNet の中間ブロック付近で、著者はスタイルと空間レイアウトをそれぞれ制御する 2 つの特定のレイヤーを発見し、一部のスタイルでは空間レイアウトもスタイルの一種である可能性があることを発見しました。 全体として、InstantStyle のアイデアは非常にシンプルで理解しやすく、わずか数行のコードで、スタイルの移行における最も厄介なコンテンツ漏洩の問題を軽減します。実験結果
著者は記事の中で 2 つの戦略の生成結果を示しています。これら 2 つの戦略は特定のモデルに限定されず、個別に使用できます。どちらも素晴らしい結果が得られました。 特徴減算の結果:スタイル レイヤー インジェクションのみ:
現在の主要な方法との比較:
元の画像に基づくスタイル化:
コミュニティ ゲームプレイ
InstantStyle Wenshengtu、Tushengtu、Inpainting などの豊富なコード実装が提供されており、開発者は GitHub を通じて直接それらを見つけることができます。最近では、ビデオ生成プロジェクト AnyV2V の推奨スタイル ツールとしても使用されています。コミュニティ ユーザーの場合、InstantStyle は ComfyUI もネイティブにサポートしており (このノードの作成者は InstantStyle の共同作成者でもあります)、ユーザーは IP アダプター ノードを更新することですぐにそれを試すことができます。
InstantID の作成者として、なぜ私たちは InstantID と共同ブランド化されていないのでしょうか? 生成されたスタイルを制御するためにテキストのみを使用する InstantID と比較して、InstantStyle は間違いなく、スタイルがより多様になります。 GitHub スターが 1,000 に達した後、作者チームは顔のスタイル化機能を正式にサポートする予定です。
#作者は、Huggingface Demo も公式にサポートしており、オンラインで試すことができます。
以上がかつて人気だった InstantID には、オープンソース化された様式化された画像の生成という新しい遊び方があります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。