検索
ホームページテクノロジー周辺機器AI安定した拡散3 APIの使用方法

安定性AIは、2024年2月に安定した拡散3の早期プレビューを発表しました。AIモデルはまだプレビュー中ですが、2024年4月に、チームは、Firworks AIと提携した後、安定性AI開発者プラットフォームAPIで安定したAI開発者プラットフォームで安定した拡散3と安定した拡散3ターボを利用できると発表しました。

安定した拡散3は、単に一連のテキストからイメージまでの生成AIモデルであることに注意してください。 Stability AIのチームによると、モデルは、OpenaiのDall-E 3やMidjourney V6などの他のテキストからイメージまでのジェネレーターを

「タイポグラフィと迅速なアドヒアランス」に "なぜ安定した拡散3?

安定した拡散3は、特にテキスト生成の改善と迅速な能力の観点から、テキストからイメージの生成スペースでそれを非常に競争力のあるものにするいくつかの進歩と機能を紹介します。

これらの進歩を探りましょう:

拡張プロンプト

  • コンテキストの理解:安定した拡散3には、最先端の自然言語処理(NLP)手法が組み込まれているため、ユーザープロンプトをよりよく理解して解釈できます。これにより、ユーザー入力に対するより正確でコンテキストに関連する応答が可能になります。
  • プロンプトの連続性:以前のバージョンとは異なり、Stable Diffusion 3は次のプロンプトでより良い連続性を維持し、生成されたテキストがコヒーレントのままであり、会話全体でユーザーの入力と整列していることを確認します。 テキスト生成の改善

微調整された言語モデル:
    安定した拡散3は、大規模なデータセットで広範なトレーニングを受けた微調整された言語モデルを利用して、テキスト生成機能が強化されます。これらのモデルは、文法、構文、およびセマンティクスをよりよく理解し、より首尾一貫した自然な反応につながります。
  • 応答の変動の減少:トレーニング方法とモデルアーキテクチャの改善により、安定した拡散3は応答の変動性を低下させ、さまざまなプロンプトとコンテキストでより一貫した高品質の出力を生成します。
  • 高度なプロンプト拡張
マルチターンダイアログサポート:

安定した拡散3は、マルチターンダイアログをより効果的に処理でき、ユーザーとAIモデル間の複数の交換にわたって一貫性とコンテキストを維持できます。

    迅速な拡張手法:
  • モデルは、高度な迅速な拡張技術を採用して、より有益で文脈的に関連する応答を生成し、対話を豊かにし、ユーザーにクエリに対する包括的な回答を提供します。 微調整された制御メカニズム
  • パラメーターチューニング:
  • 安定した拡散3には、ユーザーが応答長、創造性レベル、トピックの関連性などのパラメーターを調整できるように、よりカスタマイズされたインタラクションエクスペリエンスを可能にする微調整された制御メカニズムを備えています。

バイアス緩和:

モデルには、テキスト生成にバイアスを緩和し、ユーザープロンプトへの応答における公平性と包括性を促進するための手段を組み込んでいます。
  • 安定した拡散3 APIを開始します このセクションは、安定性APIから始めるための手順を実行します。
  • ステップ1:アカウントを作成します。 安定性AIのAPIを使用する前に、アカウントを作成する必要があります。ユーザー名とパスワードを使用してサインアップできますが、新しいユーザーはGoogleアカウントを使用してサインアップするための25の無料クレジットを取得します。
  • ステップ2:APIキーを請求します。
アカウントを作成したら、API GETが必要になります。これは、APIキーページにあります。ドキュメントでは、安定性AIは、「このサイトでドキュメントされたすべてのAPIが同じ認証メカニズムを使用していると述べています。APIキーを承認ヘッダーで渡します。」

ステップ3:クレジットのトッピング。 APIをリクエストするクレジットが必要です。クレジットは、APIを呼び出すときに消費される通貨単位です。消費される量は、モデルとモダリティによって異なります。すべてのクレジットを使い果たした後、請求ダッシュボードから100クレジットごとに1ドルでさらに購入できます。 このチュートリアルでは、Google ColabとComfyuiを使用して、安定した拡散3 APIを使用して画像を生成する方法を示します。次のセクションでは、各ツールの使用を開始する手順をカバーします。 Google Colabを使用して、安定した拡散3 APIを使用して

Google Colabを開始するには、Googleアカウントを作成する必要があります。リンクをクリックして指示に従ってください。

すでにGoogleアカウントをお持ちの場合は、新しいノートブックを開き、以下の手順に従ってください。

注:この例で使用されているコードは、安定性AIによってSD3_APIチュートリアルから取得されます。

ステップ1:要件をインストールします

ステップ2:安定性APIに接続します ステップ3。関数を定義します

ステップ4。画像を生成します
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ドキュメントによると、安定した画像サービスには、現在生産されている1つの提供のみが含まれています。

sd3:

は6.5クレジットを使用します
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')

sd3ターボ:4クレジット

を使用します
def send_generation_request(
    host,
    params,
):
    headers = {
        "Accept": "image/*",
        "Authorization": f"Bearer {STABILITY_KEY}"
    }

    # Encode parameters
    files = {}
    image = params.pop("image", None)
    mask = params.pop("mask", None)
    if image is not None and image != '':
        files["image"] = open(image, 'rb')
    if mask is not None and mask != '':
        files["mask"] = open(mask, 'rb')
    if len(files)==0:
        files["none"] = ''

    # Send request
    print(f"Sending REST request to {host}...")
    response = requests.post(
        host,
        headers=headers,
        files=files,
        data=params
    )
    if not response.ok:
        raise Exception(f"HTTP {response.status_code}: {response.text}")

    return response

テストしましょう。 この例では、低地の熱帯地域にトゥーカンの鳥の画像を作成します。

これが作成されたものです:

  • 安定した拡散を使用して著者によって作成された画像3
  • さあ、SD3ターボを使用して果物で作られた車の画像を作成しましょう。 このコードを実行すると、次の画像が作成されました

# SD3

prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"}
negative_prompt = "" #@param {type:"string"}
aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"]
seed = 0 #@param {type:"integer"}
output_format = "jpeg" #@param ["jpeg", "png"]

host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3"

params = {
    "prompt" : prompt,
    "negative_prompt" : negative_prompt,
    "aspect_ratio" : aspect_ratio,
    "seed" : seed,
    "output_format" : output_format,
    "model" : "sd3",
    "mode" : "text-to-image"
}

response = send_generation_request(
    host,
    params
)

# Decode response
output_image = response.content
finish_reason = response.headers.get("finish-reason")
seed = response.headers.get("seed")

# Check for NSFW classification
if finish_reason == 'CONTENT_FILTERED':
    raise Warning("Generation failed NSFW classifier")

# Save and display result
generated = f"generated_{seed}.{output_format}"
with open(generated, "wb") as f:
    f.write(output_image)
print(f"Saved image {generated}")

output.no_vertical_scroll()
print("Result image:")
IPython.display.display(Image.open(generated))
安定した拡散を使用して著者によって作成された画像3ターボ

comfyui 安定した拡散3 APIの使用方法でAPIを使用します

comfyuiは、安定した拡散のための堅牢で柔軟なグラフィカルユーザーインターフェイス(GUI)です。グラフベースのインターフェイスを備えており、フローチャートスタイルのデザインを使用して、ユーザーが洗練された安定した拡散ワークフローを作成および実行できるようにします。

システム要件:

  • グラフィックスプロセシングユニット(GPU):RTX 3060 TI以上など、最低8GBのVRAMを備えた適切なNVIDIA GPU。
  • >>
  • 中央処理ユニット(CPU):Intel Xeon E5、I5、Ryzen 5などを含む現代プロセッサ。
  • ランダムアクセスメモリ(RAM):16GB以上。
  • オペレーティングシステム:Windows 10/11またはlinux。 モデルと生成された画像用のコンピューター上の適切なストレージスペース。
  • ステップ1:comfyui
  • をインストールします
WindowsにComfyuiをインストールするための最も簡単な方法には、リリースページにあるスタンドアロンインストーラーを使用することが含まれます。このインストーラーには、PytorchやHugging Face Transformersなどの重要な依存関係が含まれており、個別のインストールの必要性を排除します。

包括的なパッケージを提供し、複雑な構成を必要とせずにWindowsでcomfyuiの迅速なセットアップを可能にします。

単にダウンロード、抽出、モデルの追加、起動!

ステップ1.1:

このgithubリポジトリからcomfyuiのスタンドアロンバージョンをダウンロード - リンクをクリックすると、ダウンロードが開始されます。

ステップ1.2:

最新のcomfyui-windows.zipファイルをダウンロードしたら、7-zipやwinrarなどのユーティリティを使用して抽出します。 ステップ1.3:

Comfyuiの使用を開始するには、チェックポイントモデルが必要です。安定した拡散または抱きしめの顔からチェックポイントモデルをダウンロードできます。モデルをフォルダーに入れます:

ステップ1.4:

ここで、run_nvidia_gpu.bat(推奨)またはrun_cpu.batを実行するだけです。これにより、ブラウザでComfyuiを自動的に開始する必要があります コマンドラインは、ブラウザで開くことができるURL http://127.0.1:8188/を実行して生成します。 ステップ2:comfyuiマネージャー

をインストールします
from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
ファイルExplorerアプリケーション内で、インストールしたディレクトリを見つけます。 Windowsを使用していることを考えると、「comfyui_windows_portable」という名前にする必要があります。ここから、comfyuiに移動し、custom_nodesに移動します。この場所から、アドレスバーにCMDを入力し、Enterを押します。

これはコマンドプロンプト端末を開く必要があります。ここでは、次のコマンドを挿入する必要があります。 完了したら、Comfyuiを再起動します。新しい「

マネージャー

」ボタンがフローティングパネルに表示されます。

ステップ3:安定性AI APIノードをインストールします

[管理]ボタンを選択し、「

カスタムノードをインストールします。

」に移動して、「

stability api。

を検索します。
import getpass
# To get your API key, visit https://platform.stability.ai/account/keys
STABILITY_KEY = getpass.getpass('Enter your API Key')
「comfyuiの安定性APIノード」ノードを見つけ、右側にあるインストールボタンをクリックしてインストールプロセスを開始します。これに続いて、「」ボタンが表示されます。 「restart」をクリックして、comfyuiを再起動します。

ステップ4:システム全体のAPIキーを定義します

このステップはオプションですが、お勧めします。つまり、安定性AIカスタムノード内の各ノードの安定性AI APIキーを設定できます。これにより、すべてのワークフローでAPIキーを繰り返し入力する必要がなくなり、ワークフローJSONファイルを共有するときにAPIキーを不注意に共有するリスクが低下します。

そうするために、カスタムノードディレクトリに移動します:

from io import BytesIO
import IPython
import json
import os
from PIL import Image
import requests
import time
from google.colab import output
sai_platform_key.txtという名前の新しいファイルを作成します。 APIキーをファイルに貼り付け、ドキュメントを保存してから、comfyuiを再起動します。

ステップ5:ワークフローをロードして実行します

安定した拡散3テキストから画像へのワークフローをインストールし、comfyuiにドロップします。

あなたは今行くのがいいです!

トラブルシューティングとヒント

他のツールと同様に、途中でいくつかの問題に遭遇する可能性が常にあります。 APIまたはセットアッププロセスの問題に直面しているユーザーのための最も一般的な課題とトラブルシューティング手順は次のとおりです。

APIキーと認証の問題

チャレンジ:

ユーザーは、APIキーまたは誤った認証資格情報のためにAPIにアクセスするときに認証エラーに直面する可能性があります。

トラブルシューティング:APIキーをダブルチェックし、コピーして正しく貼り付けていることを確認します。キーに余分なスペースや文字がないことを確認してください。 Stable Diffusion 3サーバーによってAPIキーが適切に認証されていることを確認してください。 クレジット管理の問題

チャレンジ:ユーザーは、クレジットの不十分なクレジットや請求エラーなど、クレジット管理に関連する問題に遭遇する可能性があります。

トラブルシューティング:

安定した拡散3ダッシュボードのクレジット残高を確認して、十分なクレジットを確保してください。請求情報を確認し、サポートチームとの請求エラーまたは不一致に対応します。

接続性とネットワークの問題

チャレンジ:

ユーザーは、APIにアクセスできないように接続性の問題またはネットワーク中断を経験する場合があります。 トラブルシューティング:

安定したインターネット接続があり、ネットワークの中断がないことを確認してください。問題を分離するには、別のネットワークまたはデバイスからAPIにアクセスしてみてください。接続性の問題を引き続き経験している場合は、インターネットサービスプロバイダーにお問い合わせください。

互換性と依存関係エラー

チャレンジ:

ユーザーは、必要なツールとライブラリをインストールまたは使用する際に、互換性の問題や依存関係エラーに遭遇する場合があります。

トラブルシューティング:安定した拡散3 APIの互換性要件を確認し、互換性のあるバージョンのツールとライブラリを使用していることを確認してください。エラーを引き起こしている依存関係を更新または再インストールします。トラブルシューティングガイダンスについては、ドキュメントとコミュニティフォーラムを参照してください。

パフォーマンスと応答時間

チャレンジ:ユーザーは、特にピーク使用時間中にAPIと対話するときに、応答時間やパフォーマンスの問題が遅い場合があります。

トラブルシューティング: APIのパフォーマンスと追跡回答時間を監視して、パターンまたはトレンドを特定します。パフォーマンスと優先度の高いアクセスを改善するために、より高い層のサブスクリプション計画にアップグレードすることを検討してください。一貫して遅い応答時間がある場合は、サポートチームに連絡してください。

ドキュメントとサポート

チャレンジ:ユーザーは、APIドキュメントを理解するのが難しい場合や、特定の問題のトラブルシューティングの支援が必要な場合があります。

トラブルシューティング:

APIの使用、トラブルシューティング、ベストプラクティスに関するガイダンスについては、安定した拡散3ドキュメントを参照してください。未解決の問題や質問がある場合は、サポートチームまたはコミュニティフォーラムに連絡してください。 結論

安定した拡散3は、一連のテキストから画像への生成AIモデルです。この記事では、Google ColabとComfyuiでAPIを使用し始める実用的な手順について説明しました。これで、独自の画像を作成するスキルがあります。忘れないように、できるだけ早く学んだことを必ず適用してください。

お読みいただきありがとうございます!

さらなる学習

安定した拡散Web UI:初心者向けの包括的なユーザーガイド

ドリームブースとロラを使用した安定した拡散XLを微調整します

安定した拡散を実行する方法
  • PythonのDiffusersを使用したAIを使用して、フォトリアリックな画像を生成
  • faqs
  • 安定した拡散3 APIを効果的に使用するためのベストプラクティスは何ですか?

安定した拡散を使用するためのベストプラクティス3 APIには、明確かつ特定のプロンプトの提供、異なるパラメーターの実験、希望の結果を達成するためのクレジット使用量の監視、枯渇を避けるための監視、最新のドキュメントと機能の最新情報を維持することが含まれます。 安定した拡散3とは何ですか?

安定した拡散は、テキストプロンプトから画像を生成することに焦点を当てたAIモデルのコレクションで構成されています。ユーザーは目的の画像の説明を提供し、モデルはこれらのプロンプトに基づいて対応する視覚表現を生成します。

安定した拡散はどのように機能するのか?このイノベーションは、GPTなどの大規模な言語モデルで一般的に使用される変圧器アーキテクチャを拡散モデルで統合し、両方のアーキテクチャの強みを活用する可能性を提供します。

以上が安定した拡散3 APIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
AIが急上昇すると、企業はSEOからGEOに移行しますAIが急上昇すると、企業はSEOからGEOに移行しますMay 05, 2025 am 11:09 AM

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化(SEO)から生成エンジン最適化(GEO)に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。 これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか? 何十年もの間

これらの経路のどれが今日のAIをプッシュして賞賛されるAGIになることについての大きな賭けこれらの経路のどれが今日のAIをプッシュして賞賛されるAGIになることについての大きな賭けMay 05, 2025 am 11:08 AM

人工一般情報(AGI)への潜在的なパスを探りましょう。 この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態(ASI)を達成する複雑さを掘り下げています。 (関連するアートを参照してください

チャットボットを訓練しますか、それとも逆もありますか?チャットボットを訓練しますか、それとも逆もありますか?May 05, 2025 am 11:07 AM

ヒューマンコンピューターの相互作用:適応の繊細なダンス AIチャットボットと対話することは、相互の影響力の繊細なダンスに参加するようなものです。あなたの質問、回答、および好みは、あなたのニーズをよりよく満たすためにシステムを徐々に形作ります。現代の言語モデルは、明示的なフィードバックメカニズムと暗黙のパターン認識を通じて、ユーザーの好みに適応します。彼らはあなたのコミュニケーションスタイルを学び、あなたの好みを思い出し、あなたの期待に合わせて応答を徐々に調整します。 しかし、私たちはデジタルパートナーを訓練している間、同様に重要なことが逆方向に起こっています。これらのシステムとの相互作用は、私たち自身のコミュニケーションパターン、思考プロセス、さらには対人会話の期待さえ微妙に形作っています。 AIシステムとの相互作用は、対人相互作用に対する私たちの期待を再構築し始めています。インスタント応答に適応しました、

カリフォルニアは、AIをタップして、速い追跡の山火事回復許可を促進しますカリフォルニアは、AIをタップして、速い追跡の山火事回復許可を促進しますMay 04, 2025 am 11:10 AM

AIは、野火の回復許可を合理化します オーストラリアのハイテク企業ArchistarのAIソフトウェアは、機械学習とコンピュータービジョンを利用して、地域の規制に準拠するための建築計画の評価を自動化します。この前検証は重要です

米国がエストニアのAI駆動型デジタル政府から学ぶことができること米国がエストニアのAI駆動型デジタル政府から学ぶことができることMay 04, 2025 am 11:09 AM

エストニアのデジタル政府:米国のモデル? 米国は官僚的な非効率性と闘っていますが、エストニアは説得力のある代替品を提供しています。 この小さな国は、AIを搭載した、ほぼ100%デジタル化された市民中心の政府を誇っています。 これはそうではありません

生成AIによる結婚式の計画生成AIによる結婚式の計画May 04, 2025 am 11:08 AM

結婚式を計画することは記念碑的な仕事であり、しばしば最も組織化されたカップルでさえ圧倒されます。 この記事は、AIの影響に関する進行中のフォーブスシリーズの一部(こちらのリンクを参照)で、生成AIが結婚式の計画にどのように革命をもたらすことができるかを調べます。 結婚式のpl

デジタル防衛AIエージェントとは何ですか?デジタル防衛AIエージェントとは何ですか?May 04, 2025 am 11:07 AM

政府は、さまざまな確立されたタスクにそれらを利用している一方で、企業はAIエージェントを販売のためにますます活用しています。 ただし、消費者の支持者は、個人がターゲットのターゲットに対する防御として自分のAIエージェントを所有する必要性を強調しています

生成エンジン最適化に関するビジネスリーダーのガイド(GEO)生成エンジン最適化に関するビジネスリーダーのガイド(GEO)May 03, 2025 am 11:14 AM

Googleはこのシフトをリードしています。その「AIの概要」機能はすでに10億人以上のユーザーにサービスを提供しており、誰もがリンクをクリックする前に完全な回答を提供しています。[^2] 他のプレイヤーも速く地位を獲得しています。 ChatGpt、Microsoft Copilot、およびPE

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境