Heim > Artikel > Backend-Entwicklung > Verwendung der Web-API für FLUX [pro]: Das neueste KI-Modell zur Bilderzeugung vom Originalteam von Stable Diffusion
Zuvor habe ich einen Artikel mit dem Titel „Ausführen des KI-Modells der Generation FLUX.1 Image ([dev]/[schnell]) von den Originalentwicklern von Stable Diffusion auf einem MacBook (M2)“ geschrieben. Es demonstrierte das Bilderzeugungsmodell FLUX.1 von Black Forest Labs, gegründet von den Machern von Stable Diffusion.
Jetzt, zwei Monate später, wurde FLUX 1.1 [pro] (Codename Blueberry) veröffentlicht, zusammen mit öffentlichem Zugriff auf seine Web-API, obwohl es sich noch in der Betaphase befindet.
Heute veröffentlichen wir FLUX1.1 [pro], unser bisher fortschrittlichstes und effizientestes Modell, zusammen mit der allgemeinen Verfügbarkeit der Beta-BFL-API. Diese Veröffentlichung stellt einen bedeutenden Schritt vorwärts in unserer Mission dar, Schöpfer, Entwickler und Unternehmen mit skalierbarer, hochmoderner generativer Technologie auszustatten.
Referenz: Ankündigung von FLUX1.1 [pro] und der BFL API – Black Forest Labs
In diesem Beitrag werde ich zeigen, wie man die FLUX 1.1 [pro] Web-API verwendet.
Alle Codebeispiele sind in Python geschrieben.
Registrieren Sie zunächst ein Konto und melden Sie sich auf der API-Seite unter der Option Registrieren an.
Credits kosten jeweils 0,01 $ und ich habe bei der Registrierung 50 Credits erhalten (dies kann variieren).
Basierend auf der Preisseite sind die Modellkosten wie folgt:
Sobald Sie angemeldet sind, generieren Sie einen API-Schlüssel, indem Sie Schlüssel hinzufügen auswählen und einen Namen Ihrer Wahl eingeben.
Ihr Schlüssel wird wie unten dargestellt angezeigt.
Ich verwende macOS 14 Sonoma als mein Betriebssystem.
Die Python-Version ist:
$ python --version Python 3.12.2
Um den Beispielcode auszuführen, habe ich Requests installiert:
$ pip install requests
Ich habe die installierte Version bestätigt:
$ pip list | grep -e requests requests 2.31.0
Um Hardcodierung zu vermeiden, habe ich den API-Schlüssel als Umgebungsvariable gespeichert, indem ich die zshrc-Datei bearbeitet habe.
$ open ~/.zshrc
Ich habe die Umgebungsvariable BFL_API_KEY:
benannt
export BFL_API_KEY=<Your API Key Here>
Unten finden Sie den Beispielcode aus „Erste Schritte“ mit einigen zusätzlichen Kommentaren. Im Idealfall sollte es Fehler mithilfe des Status behandeln, aber ich habe es der Einfachheit halber unverändert gelassen.
import os import requests import time # Request request = requests.post( 'https://api.bfl.ml/v1/flux-pro-1.1', headers={ 'accept': 'application/json', 'x-key': os.environ.get("BFL_API_KEY"), 'Content-Type': 'application/json', }, json={ 'prompt': 'A cat on its back legs running like a human is holding a big silver fish with its arms. The cat is running away from the shop owner and has a panicked look on his face. The scene is situated in a crowded market.', 'width': 1024, 'height': 768, }, ).json() print(request) request_id = request["id"] # Wait for completion while True: time.sleep(0.5) result = requests.get( 'https://api.bfl.ml/v1/get_result', headers={ 'accept': 'application/json', 'x-key': os.environ.get("BFL_API_KEY"), }, params={ 'id': request_id, }, ).json() if result["status"] == "Ready": print(f"Result: {result['result']['sample']}") break else: print(f"Status: {result['status']}")
In diesem Beispiel lautet die Eingabeaufforderung:
Eine Katze, die wie ein Mensch auf den Hinterbeinen rennt, hält mit ihren Armen einen großen silbernen Fisch. Die Katze rennt vor dem Ladenbesitzer davon und macht einen panischen Gesichtsausdruck. Die Szene befindet sich auf einem überfüllten Markt.
Das Format des endgültigen Ergebnisses sieht folgendermaßen aus. Die Reaktionszeit war schneller im Vergleich zu anderen APIs, die ich getestet habe.
$ python --version Python 3.12.2
Das Beispiel enthält die URL des generierten Bildes, das auf bflapistorage.blob.core.windows.net gehostet wurde, als ich es getestet habe.
Hier ist das generierte Bild:
Das Ergebnis entspricht genau der Aufforderung und spiegelt das Gefühl der Dringlichkeit wider.
Ich habe verschiedene Eingabeaufforderungen ausprobiert, um abwechslungsreiche Bilder zu erstellen.
Eingabeaufforderung: „Japanische Moe-Heldin“, im Anime-Stil.
$ pip install requests
Eingabeaufforderung: „Süßigkeiten, die in beliebten japanischen Animes vorkommen“, im Anime-Stil.
$ pip list | grep -e requests requests 2.31.0
Eingabeaufforderung: „Männlicher Gymnasiast auf Klassenfahrt“, im Anime-Stil.
$ open ~/.zshrc
Eingabeaufforderung: „Eine Prinzessin spielt Gitarre“, im Fantasy-Art-Stil.
export BFL_API_KEY=<Your API Key Here>
Eingabeaufforderung: „Eine süße Fee auf einem weißen Laptop“, im fotografischen Stil.
import os import requests import time # Request request = requests.post( 'https://api.bfl.ml/v1/flux-pro-1.1', headers={ 'accept': 'application/json', 'x-key': os.environ.get("BFL_API_KEY"), 'Content-Type': 'application/json', }, json={ 'prompt': 'A cat on its back legs running like a human is holding a big silver fish with its arms. The cat is running away from the shop owner and has a panicked look on his face. The scene is situated in a crowded market.', 'width': 1024, 'height': 768, }, ).json() print(request) request_id = request["id"] # Wait for completion while True: time.sleep(0.5) result = requests.get( 'https://api.bfl.ml/v1/get_result', headers={ 'accept': 'application/json', 'x-key': os.environ.get("BFL_API_KEY"), }, params={ 'id': request_id, }, ).json() if result["status"] == "Ready": print(f"Result: {result['result']['sample']}") break else: print(f"Status: {result['status']}")
Eingabeaufforderung: „28-jährige hübsche Japanerin mit schwarzem Bob-Haar“, im fotografischen Stil.
$ python --version Python 3.12.2
Eingabeaufforderung: „Hong Kong Downtown in den 1980er Jahren“, im fotografischen Stil.
$ pip install requests
Eingabeaufforderung: „Shinjuku Kabukicho im Jahr 2020“, unter Verwendung von fotografischem Stil.
$ pip list | grep -e requests requests 2.31.0
Alle generierten Bilder waren von außergewöhnlicher Qualität.
Nachdem so viele hochwertige KI-Bilder erstellt wurden, fühlt sich die Realität fast surreal an.
Black Forest Labs entwickelt und verbessert weiterhin seine KI-Modelle.
Ich freue mich auf die zukünftige Veröffentlichung der Videogenerierungsfunktionen.
Stabile Diffusion, AI, FLUX 1.1 [pro] und Web像を生成してみた
Das obige ist der detaillierte Inhalt vonVerwendung der Web-API für FLUX [pro]: Das neueste KI-Modell zur Bilderzeugung vom Originalteam von Stable Diffusion. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!