FLUXor を無料で実行する方法: ステップバイステップガイド-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

FLUXor を無料で実行する方法: ステップバイステップガイド

PHPz

Sep 10, 2024 am 06:33 AM

Flux.1 は、Black Forest Labs によって提供された、市場で最新のテキストから画像への変換モデルです。複雑な説明を処理し、細部まで精細な高画質画像を生成するテキスト記述から高画質画像を生成できる最先端モデルです。

Flux.1 の背後にいるのは誰ですか?

Flux.1 は、Stability AI の元従業員のグループによって設立された会社、Black Forest Labs によって開発されました。

どのように機能するのでしょうか?

ランダムな開始点から徐々にノイズを除去して画像を作成する安定拡散などの他の拡散モデルとは異なり、Flux.1 は、より直接的なアプローチをとる「フローマッチング」と呼ばれる技術を使用して画像を生成し、必要な正確な変換を学習します。ノイズをリアルな画像に変換します。これにより、一般的な拡散モデルよりも少ない手順で高速に高品質の画像を生成できます。

また、この異なるアプローチにより、Flux.1 は以下のようなテキストを含む画像を処理できます。

How to Run FLUXor Free: A Step-by-Step Guide

モダンで洗練されたラップトップのフォトリアリスティックな画像。Web ページが開いており、クリーンでミニマルなデザインで「codestackme」というテキストが表示されています。ノートパソコンは、柔らかい照明が当たる白い机の上に置き、画面の輝きと金属製の筐体の微妙な反射を強調する必要があります。全体的な雰囲気は、革新性と技術の進歩の感覚を伝える、プロフェッショナルで魅力的なものである必要があります。

Flux.1 用の適切なプロンプトを作成するにはどうすればよいですか?

Flux.1 の傑出した機能の 1 つは、ユーザーフレンドリーなプロンプトメカニズムです。 CLIP (OpenAI 製) および T5 (GoogleAI 製) テキストエンコーダの統合により、モデルは高度なニュアンスで説明を解釈できます。 CLIP はテキストとビジュアルコンテンツの位置合わせに優れており、T5 は構造化テキスト入力を処理するモデルの機能を強化します。これらを組み合わせることで、Flux.1 はユーザーが提供する詳細なプロンプトに厳密に一致する画像を生成できるようになります。

Flux.1にはどのような種類のモデルがありますか?

Flux.1 には、Schnell、Dev、Pro の 3 つの異なるバージョンがあります。

Schnell は、速度と効率が最適化された最速のモデルです。 Apache 2.0 ライセンスに基づいてリリースされているため、商用利用が許可されています。
Dev は、より柔軟で実験的なフレームワークを提供し、モデルの特定の機能を微調整またはカスタマイズしたい開発者や研究者に焦点を当てています。非営利ライセンスでリリースされました。
Pro は、最も高度でリソースを大量に消費するバージョンです。これは高解像度の出力を提供し、より複雑な画像を生成できますが、Black Forest Labs API を通じてのみ利用可能です。

Flux.1を無料で使うには？

金銭的な負担をかけずに Flux.1 の機能を探索することに興味がある人にとって、リソースプロバイダーとして modal.com を使用することは実行可能なオプションです。 Modal.com では、毎月 30 ドルの計算能力許容量を提供しており、これにより毎月多数のイメージの生成をサポートできます。価格とサービスの詳細については、Modal.com Pricing をご覧ください。

この推奨事項はプラットフォームによって後援または承認されていません。

まず、GitHub 認証情報を使用してログインし、modal.com でアカウントを作成する必要があります。

次に、Modal CLI をインストールする必要があります。 Python がコンピュータにインストールされていることを確認してください。 Python がセットアップされたら、ターミナルを開いてコマンド pip install modal を実行します。インストールが完了したら、モーダルセットアップを実行して、CLI をモーダルアカウントにリンクします。

この GitHub リポジトリをコンピュータに複製して、複製されたディレクトリに移動します。

セキュリティのため、API_KEY という名前の環境変数を使用してモーダルダッシュボードに flux.1-secret というシークレットを作成し、それにランダムな文字列を割り当てます。

最後に、ターミナルで modaldeploy app.py --name flux1 を実行してサービスをデプロイします。デプロイが成功すると、モーダルは Web サービスにアクセスするための URL を提供します:

✓ Created objects.
├── ? Created mount PythonPackage:app
├── ? Created function Model.build.
├── ? Created function Model.*.
├── ? Created function Model._inference.
└── ? Created web function Model.web_inference => <public_url>
✓ App deployed in 3.206s! ?
</public_url>

サービスを使用するには、指定された PUBLIC URL に対して GET リクエストを実行します。ヘッダーに前に設定した x-api-key を含め、クエリパラメーターでプロンプトをエンコードします。クエリパラメーターを使用して、希望の画像サイズを指定することもできます。リクエストを構成する方法の例を次に示します:

curl -H "x-api-key: <api_key>" <public_url>?width=<width>&height=<height>&prompt=<prompt>
</prompt></height></width></public_url></api_key>

コードを理解する

app.py ファイルを分析してみましょう。このファイルは、モーダルのプラットフォームを使用して Flux.1 画像生成サービスを実行するために重要です。セットアップと機能の内訳は次のとおりです:

import modal

image = modal.Image.debian_slim(python_version="3.10").apt_install(
    "libglib2.0-0", 
    "libsm6", 
    "libxrender1", 
    "libxext6", 
    "ffmpeg", 
    "libgl1",
    "git"
).pip_install(
    "git+https://github.com/huggingface/diffusers.git",
    "invisible_watermark",
    "transformers",
    "accelerate",
    "safetensors",
    "sentencepiece",
)

このブロックは、OS、必要なライブラリ、Python パッケージを指定して、アプリケーションの Docker イメージを定義します。この環境は、Flux.1 モデルと関連ユーティリティの実行をサポートします。

app = modal.App('flux1')

with image.imports():
    import os
    import io
    import torch
    from diffusers import FluxPipeline
    from fastapi import Response, Header

Here, we initialize our app and import necessary Python libraries within the context of our previously defined Docker image. These imports are essential for image processing and handling web requests.

@app.cls(gpu=modal.gpu.A100(), container_idle_timeout=15, image=image, timeout=120, secrets=[modal.Secret.from_name("flux.1-secret")])
class Model:
    @modal.build()
    def build(self):
        from huggingface_hub import snapshot_download

        snapshot_download("black-forest-labs/FLUX.1-schnell")

    @modal.enter()
    def enter(self):
        print("Loading model...")
        self.pipeline = FluxPipeline.from_pretrained("black-forest-labs/FLUX.1-schnell", torch_dtype=torch.bfloat16).to('cuda')
        print("Model loaded!")

    def inference(self, prompt: str, width: int = 1440, height: int = 1440):
        print("Generating image...")
        image = self.pipeline(
            prompt, 
            output_type='pil', 
            width=width, 
            height=height, 
            num_inference_steps=8,
            generator=torch.Generator("cpu").manual_seed(
                torch.randint(0, 1000000, (1,)).item()
            )
        ).images[0]

        print("Image generated!")

        byte_stream = io.BytesIO()
        image.save(byte_stream, format="PNG")

        return byte_stream.getvalue()

    @modal.web_endpoint(docs=True)
    def web_inference(self, prompt: str, width: int = 1440, height: int = 1440, x_api_key: str = Header(None)):
        api_key = os.getenv("API_KEY")
        if x_api_key != api_key:
            return Response(content="Unauthorized", status_code=401)

        image = self.inference(prompt, width, height)
        return Response(content=image, media_type="image/png")

This section defines the main functionality of our service:

@modal.build(): Downloads the model when the application builds.
@modal.enter(): Loads the model into GPU memory the first time the service is invoked.
@modal.web_endpoint(): Serves as the web endpoint for our service using FastAPI.

If you just want to run it as a local service, you can add @modal.method() and define it as following inside the class.

        @modal.method()
    def _inference(self, prompt: str, width: int = 1440, height: int = 1440):
        return self.inference(prompt, width, height)

And outside it, define a local entry point

@app.local_entrypoint()
def main(prompt: str = "A beautiful sunset over the mountains"):
    image_bytes = Model()._inference.remote(prompt)

    with open("output.png", "wb") as f:
        f.write(image_bytes)

Local entry point will run locally on your machine calling the _inference method remotely, so you still using the modal’s service, without exposing it to the internet.

Conclusion

Flux.1 is not just another tech breakthrough - it's a game-changer for anyone who's ever dreamed of bringing their ideas to life visually. Imagine being able to describe a scene in words and watch as it materializes into a stunning, detailed image right before your eyes. That's the magic of Flux.1. It's like having a super-talented artist at your fingertips, ready to paint your thoughts with incredible precision. Whether you're an artist looking to speed up your creative process, a designer in need of quick visual concepts, or just someone who loves playing with new tech, Flux.1 opens up a world of possibilities. It's not about replacing human creativity - it's about enhancing it, making the journey from imagination to reality smoother and more exciting than ever before.

以上がFLUXor を無料で実行する方法: ステップバイステップガイドの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Python vs. C：比較されたアプリケーションとユースケースApr 12, 2025 am 12:01 AM

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間のPython計画：現実的なアプローチApr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Python：主要なアプリケーションの調査Apr 10, 2025 am 09:41 AM

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1）Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2）データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3）自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。

2時間でどのくらいのPythonを学ぶことができますか？Apr 09, 2025 pm 04:33 PM

2時間以内にPythonの基本を学ぶことができます。 1。変数とデータ型を学習します。2。ステートメントやループの場合などのマスター制御構造、3。関数の定義と使用を理解します。これらは、簡単なPythonプログラムの作成を開始するのに役立ちます。

プロジェクトの基本と問題駆動型の方法で10時間以内にコンピューター初心者プログラミングの基本を教える方法は？Apr 02, 2025 am 07:18 AM

10時間以内にコンピューター初心者プログラミングの基本を教える方法は？コンピューター初心者にプログラミングの知識を教えるのに10時間しかない場合、何を教えることを選びますか...

中間の読書にどこでもfiddlerを使用するときにブラウザによって検出されないようにするにはどうすればよいですか？Apr 02, 2025 am 07:15 AM

fiddlereveryversings for the-middleの測定値を使用するときに検出されないようにする方法

Python 3.6にピクルスファイルをロードするときに「__Builtin__」モジュールが見つからない場合はどうすればよいですか？Apr 02, 2025 am 07:12 AM

Python 3.6のピクルスファイルのロードレポートエラー：modulenotFounderror：nomodulenamed ...

風光明媚なスポットコメント分析におけるJieba Wordセグメンテーションの精度を改善する方法は？Apr 02, 2025 am 07:09 AM

風光明媚なスポットコメント分析におけるJieba Wordセグメンテーションの問題を解決する方法は？風光明媚なスポットコメントと分析を行っているとき、私たちはしばしばJieba Wordセグメンテーションツールを使用してテキストを処理します...

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、