検索
ホームページテクノロジー周辺機器AIドリームブースとロラを使用した安定した拡散XLを微調整します

このチュートリアルでは、安定した拡散XL(SDXL)とDreamBoothを探り、画像生成とモデルの微調整のために

ライブラリを活用する方法を示しています。 個人的な写真を使用してSDXLを微調整し、結果を評価します。 AIの新人は、AIの基礎コースから始めることをお勧めします。 diffusers

安定した拡散xl

を理解する 安定性AIのSDXL 1.0は、AIテキストからイメージの生成の大幅な飛躍を表しています。 研究のみのSDXL 0.9に基づいて、現在では最も強力に公開されている画像作成モデルになっています。 広範なテストは、他のオープンソースの代替品と比較して、その優れた画質を確認します。

Fine-tuning Stable Diffusion XL with DreamBooth and LoRA arxiv.orgの画像

この改善された品質は、35億個のパラメーターベースジェネレーターと66億個のパラメーターリファイナーの2つのモデルのアンサンブルに由来します。この二重アプローチは、消費者GPUの効率を維持しながら、画質を最適化します。 SDXL 1.0は画像生成を簡素化し、簡潔なプロンプトから複雑な結果を生成します。 カスタムデータセットの微調整も合理化されており、画像構造、スタイル、および構成をきめぶき制御します。 dreambooth:パーソナライズされた画像生成

GoogleのDreambooth(2022)は、特に安定した拡散などのテキストから画像モデルの生成AIのブレークスルーです。 Googleの研究者が説明しているように、

「それは写真ブースのようなものですが、あなたの夢があなたを連れて行くところならどこでも合成できる方法で主題をキャプチャします。」

Dreamboothの画像

dreamboothはカスタムサブジェクトをモデルに注入し、特定の人、オブジェクト、またはシーン向けの専門的なジェネレーターを作成します。 トレーニングには、いくつかの(3〜5)の画像のみが必要です。 訓練されたモデルは、想像力によってのみ制限された、被験者を多様な設定とポーズに配置します。

dreamboothアプリケーションFine-tuning Stable Diffusion XL with DreamBooth and LoRA

Dreamboothのカスタマイズ可能な画像生成には、さまざまなフィールド:

クリエイティブインダストリーズ:

グラフィックデザイン、広告、エンターテイメントは、そのユニークな視覚コンテンツ作成機能から利益を得ています。

パーソナライズ:現実または純粋に架空の設定で複製するのが難しいまたは不可能なシナリオを作成します。

教育と研究:

視覚的表現を必要とするパーソナライズされた教育コンテンツとエイズ研究を生成します。
  1. 安定した拡散xl
  2. へのアクセス
  3. SDXLは、カスタムプロンプトの画像生成のためのハグのフェイススペースデモ(プロンプトから4つの画像を生成する)またはPythonライブラリを介してアクセスできます。

    diffusers

    のセットアップと画像生成

    CUDA対応GPUが利用可能であることを確認してください:

    !nvidia-smi

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    インストールdiffusers

    %pip install --upgrade diffusers[torch] -q

    モデルをロードします(GPUメモリ効率にFP16を使用):

    from diffusers import DiffusionPipeline, AutoencoderKL
    import torch
    
    vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
    pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", vae=vae, torch_dtype=torch.float16, variant="fp16", use_safetensors=True)
    pipe.to("cuda");

    画像の生成:

    prompt = "A man in a spacesuit is running a marathon in the jungle."
    image = pipe(prompt=prompt, num_inference_steps=25, num_images_per_prompt=4)

    ヘルパー関数を使用して画像を表示(オリジナルで提供):

    # ... (image_grid function from original code) ...
    image_grid(image.images, 2, 2)

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    リファイナー品質を向上させるには、SDXLリファイナーを利用してください:

    # ... (refiner loading and processing code from original) ...

    Fine-tuning Stable Diffusion XL with DreamBooth and LoRA

    AutoTrain Advancedを使用したSDXLを微調整します

    AutoTrain AdvancedはSDXL微調整を簡素化します。 使用してインストールしてください:

    (注:元のチュートリアルでは、代替方法のために現在時代遅れのコラブノートブックを使用しています。これは簡潔に省略されています。)
    %pip install -U autotrain-advanced

    dreambooth微調整(要約)

    このチュートリアルは、画像の個人的なデータセットにAutoTrain AdvancedのDreamboothスクリプトを使用して、微調整されたSDXLの詳細な例で進みます。このセクションでは、変数の設定、Kaggleデータセットの作成、AutoTrainスクリプトの実行が含まれます。 出力は、トレーニングプロセスと、結果として得られるLORAウェイトが顔にアップロードされたことを示しています。 次に、微調整されたモデルとの推論が実証され、さまざまなシナリオで指定された主題の生成された画像を紹介します。 最後に、微調整されたモデルを使用したリファイナーの使用が検討されます。 長さの制約により、この詳細なセクションはここで大幅に凝縮されています。 完全なコードと説明については、オリジナルを参照してください。

    結論

    このチュートリアルは、SDXLとDreamBoothの包括的な概要を提供し、ライブラリとAutoTrain Advancedでの能力と使いやすさを紹介します。 微調整プロセスは、パーソナライズされた画像生成の力を示しており、さらなる探索のための成功と領域の両方を強調しています(精製業者の微調整モデルとの相互作用など)。 チュートリアルは、AIの分野でさらに学習するための推奨事項で終了します。

以上がドリームブースとロラを使用した安定した拡散XLを微調整しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
LLMSでのツール呼び出しLLMSでのツール呼び出しApr 14, 2025 am 11:28 AM

大規模な言語モデル(LLM)は人気が急増しており、ツールコール機能は単純なテキスト生成を超えて機能を劇的に拡大しています。 これで、LLMSは動的なUI作成や自律的なaなどの複雑な自動化タスクを処理できます。

ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法ADHDゲーム、ヘルスツール、AIチャットボットがグローバルヘルスを変える方法Apr 14, 2025 am 11:27 AM

ビデオゲームは不安を緩和したり、ADHDの子供を焦点を合わせたり、サポートしたりできますか? ヘルスケアの課題が世界的に急増しているため、特に若者の間では、イノベーターはありそうもないツールであるビデオゲームに目を向けています。現在、世界最大のエンターテイメントインダスの1つです

AIに関する国連入力:勝者、敗者、および機会AIに関する国連入力:勝者、敗者、および機会Apr 14, 2025 am 11:25 AM

「歴史は、技術の進歩が経済成長を促進する一方で、それ自体が公平な所得分布を確保したり、包括的な人間開発を促進したりしないことを示しています」とUNCTADの事務総長であるRebeca Grynspanは前文で書いています。

生成AIを介した交渉スキルを学ぶ生成AIを介した交渉スキルを学ぶApr 14, 2025 am 11:23 AM

簡単な、Generative AIを交渉の家庭教師およびスパーリングパートナーとして使用してください。 それについて話しましょう。 革新的なAIブレークスルーのこの分析は、最新のAIに関する私の進行中のフォーブス列のカバレッジの一部であり、特定と説明を含む

テッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますテッドは、Openai、Google、Metaが法廷に向かい、自分自身とセルフィーから明らかにしますApr 14, 2025 am 11:22 AM

バンクーバーで開催されたTED2025会議は、昨日4月11日の第36版を締めくくりました。サム・アルトマン、エリック・シュミット、パーマー・ラッキーを含む60か国以上の80人の講演者が登場しました。テッドのテーマ「人類が再考された」は、仕立てられたものでした

ジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているジョセフ・スティグリッツは、AI独占権の中で迫り来る不平等を警告しているApr 14, 2025 am 11:21 AM

ジョセフ・スティグリッツは、2001年にノーベル経済賞を受賞した経済学者であり、2001年にノーベル経済賞を受賞しています。スティグリッツは、AIが既存の不平等を悪化させ、いくつかの支配的な企業の手に統合した力を悪化させ、最終的に経済を損なうと仮定しています。

グラフデータベースとは何ですか?グラフデータベースとは何ですか?Apr 14, 2025 am 11:19 AM

グラフデータベース:関係を通じてデータ管理に革命をもたらす データが拡大し、その特性がさまざまなフィールドで進化するにつれて、グラフデータベースは、相互接続されたデータを管理するための変換ソリューションとして浮上しています。伝統とは異なり

LLMルーティング:戦略、テクニック、およびPythonの実装LLMルーティング:戦略、テクニック、およびPythonの実装Apr 14, 2025 am 11:14 AM

大規模な言語モデル(LLM)ルーティング:インテリジェントタスク分布によるパフォーマンスの最適 LLMSの急速に進化する風景は、それぞれが独自の長所と短所を備えた多様なモデルを提供します。 創造的なコンテンツGenに優れている人もいます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。