Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動-AI-php.cn

ホームページ

テクノロジー周辺機器

Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 18, 2024 pm 05:15 PM

データモデル

今、写真を撮るのは本当に「ばかばかしいほど簡単」であると言わざるを得ません。 実際の人物がカメラに映る必要はなく、ポーズや髪型について心配する必要もありません。必要なのは自分の

画像を用意して、

数回待つだけです数秒で 7 つの完全に異なるスタイルを取得できます。 :

注意深く見てください。形やポーズはすべて明確に作成されており、元のイメージが何の影響もなくまっすぐに出てきます。編集の必要性。 Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

その前に、少なくとも一日中写真スタジオで過ごしてはなりません。そうすると、私たち写真家もメイクアップアーティストもほとんど疲れ果ててしまいます。

上記は、

InstantID

と呼ばれる AI の能力です。

リアルな写真に加えて、「人間以外」のものにすることもできます:

たとえば、猫の頭と猫の胴体を持っていますが、よく見ると、顔の特徴。

さまざまな仮想スタイルはもちろんのこと、 Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

#スタイル 2 のように、生身の人間が直接石に変身します。像。

Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動もちろん、石像を入力して直接変更することもできます:

ちなみに、

2人の顔の融合#を実行することもできます。 ## ハイパワーオペレーション、ヤンミーの 20% とテイラーの 80% がどのように見えるかを見てみましょう: Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

1 枚の写真には無制限の高品質の変換がありますが、あなたはそれを理解する必要があります。

それでは、これはどのように行われるのでしょうか? Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

拡散モデルに基づいて、SD とシームレスに統合できます

著者は、現在の画像様式化テクノロジが 1 回の前方推論のみですでにタスクを完了できることを紹介しています

(つまり、ベースID 埋め込みについて)

。

しかし、このテクノロジーには問題もあります。多数のモデルパラメーターの大規模な微調整が必要であるか、コミュニティが開発した事前トレーニング済みモデルとの互換性がないか、忠実度の高い顔の特徴を維持できないかのいずれかです。

これらの課題を解決するために、彼らは InstantID を開発しました。

InstantID は拡散モデルに基づいており、そのプラグアンドプレイ

(プラグアンドプレイ)

モジュールは、単一の顔画像だけを使用してさまざまな様式化された変換を巧みに処理できます。確かに。

最も注目すべき点は、一般的なテキストから画像への事前トレーニング済み拡散モデル

(SD1.5、SDXLなど)とシームレスに統合でき、プラグイン。

具体的には、InstantID は 3 つの主要コンポーネントで構成されます:

(1) 堅牢な意味論的な顔情報をキャプチャする ID 埋め込み;

(2) デカップリングを備えた軽量適応モジュール視覚的な手がかりとして画像を容易にするクロスアテンション;

(3) IdentityNet ネットワーク、追加の空間制御を通じて参照画像の詳細な特徴をエンコードし、最終的に画像生成を完了します。

業界のこれまでの成果と比較すると、InstantID にはいくつかの違いがあります。

第一に、UNet をトレーニングする必要がないため、オリジナルのテキストをそのまま使用できます。イメージモデル生成機能に保持されており、コミュニティ内の既存の事前トレーニング済みモデルおよび ControlNet と互換性があります。 Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

2 つ目は、テスト時の調整が必要ないため、特定のスタイルに対して、微調整のために複数の画像を収集する必要がなく、単一の画像に対して推論を行うだけで済みます。

3 番目に、顔の忠実度が向上することに加えて、テキストの編集機能も維持されます。下の図のように、ほんの少しの言葉で、画像の性別を変更したり、スーツを変更したり、髪型や髪の色を変更したりできます。

#繰り返しますが、上記の効果はすべて、1 つの参照画像だけで数秒で完了できます。

以下に示す実験は、 Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

あと数枚の参考画像はほとんど役に立たず、1 枚の画像で十分な効果を発揮できることを証明しています。

#以下は具体的な比較です。

比較対象は、チューニング不要の既存の SOTA メソッドです。IP-Adapter (IPA)、IP-Adapter-FaceID、および Tencent が 2 日前に作成したばかりの PhotoMaker です。

誰もがかなりの「ボリューム」であり、効果は悪くないことがわかります。しかし、注意深く比較すると、PhotoMaker と IP-Adapter-FaceID はどちらも忠実度は高いですが、テキストコントロール機能は明らかに劣っています。悪い。

Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

対照的に、InstantID の顔とスタイルはよりよく融合し、良好なテキスト編集性を維持しながら、より高い忠実度を実現します。

また、InsightFace Swapperモデルとの比較もありますが、どちらの方が良いと思いますか？

Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

著者の紹介

この記事には、謎の InstantX チームからの 5 人の著者がいます (オンラインではあまり情報が見つかりません) 。

しかし、最初の人物は、小红书の Qixun Wang です。

責任著者の Wang Haofan は Xiaohongshu のエンジニアでもあり、制御可能および条件付きコンテンツ生成 (AIGC) の研究に従事しており、CMU'20 の卒業生でもあります。

Yang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動

以上がYang Mi と Taylor の混合スタイル: Xiaohongshu AI が SD および ControlNet に適したスタイルを起動の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。