安定性AIは、2024年2月に安定した拡散3の早期プレビューを発表しました。AIモデルはまだプレビュー中ですが、2024年4月に、チームは、Firworks AIと提携した後、安定性AI開発者プラットフォームAPIで安定したAI開発者プラットフォームで安定した拡散3と安定した拡散3ターボを利用できると発表しました。
安定した拡散3は、単に一連のテキストからイメージまでの生成AIモデルであることに注意してください。 Stability AIのチームによると、モデルは、OpenaiのDall-E 3やMidjourney V6などの他のテキストからイメージまでのジェネレーターを「タイポグラフィと迅速なアドヒアランス」に "なぜ安定した拡散3?
安定した拡散3は、特にテキスト生成の改善と迅速な能力の観点から、テキストからイメージの生成スペースでそれを非常に競争力のあるものにするいくつかの進歩と機能を紹介します。これらの進歩を探りましょう:
拡張プロンプト
- コンテキストの理解:安定した拡散3には、最先端の自然言語処理(NLP)手法が組み込まれているため、ユーザープロンプトをよりよく理解して解釈できます。これにより、ユーザー入力に対するより正確でコンテキストに関連する応答が可能になります。
- プロンプトの連続性:
以前のバージョンとは異なり、Stable Diffusion 3は次のプロンプトでより良い連続性を維持し、生成されたテキストがコヒーレントのままであり、会話全体でユーザーの入力と整列していることを確認します。 テキスト生成の改善
- 安定した拡散3は、大規模なデータセットで広範なトレーニングを受けた微調整された言語モデルを利用して、テキスト生成機能が強化されます。これらのモデルは、文法、構文、およびセマンティクスをよりよく理解し、より首尾一貫した自然な反応につながります。
- 応答の変動の減少:トレーニング方法とモデルアーキテクチャの改善により、安定した拡散3は応答の変動性を低下させ、さまざまなプロンプトとコンテキストでより一貫した高品質の出力を生成します。
- 高度なプロンプト拡張
安定した拡散3は、マルチターンダイアログをより効果的に処理でき、ユーザーとAIモデル間の複数の交換にわたって一貫性とコンテキストを維持できます。
- 迅速な拡張手法:
- モデルは、高度な迅速な拡張技術を採用して、より有益で文脈的に関連する応答を生成し、対話を豊かにし、ユーザーにクエリに対する包括的な回答を提供します。 微調整された制御メカニズム
- パラメーターチューニング: 安定した拡散3には、ユーザーが応答長、創造性レベル、トピックの関連性などのパラメーターを調整できるように、よりカスタマイズされたインタラクションエクスペリエンスを可能にする微調整された制御メカニズムを備えています。
バイアス緩和:
モデルには、テキスト生成にバイアスを緩和し、ユーザープロンプトへの応答における公平性と包括性を促進するための手段を組み込んでいます。- 安定した拡散3 APIを開始します このセクションは、安定性APIから始めるための手順を実行します。
- ステップ1:アカウントを作成します。 安定性AIのAPIを使用する前に、アカウントを作成する必要があります。ユーザー名とパスワードを使用してサインアップできますが、新しいユーザーはGoogleアカウントを使用してサインアップするための25の無料クレジットを取得します。 ステップ2:APIキーを請求します。
ステップ3:クレジットのトッピング。 APIをリクエストするクレジットが必要です。クレジットは、APIを呼び出すときに消費される通貨単位です。消費される量は、モデルとモダリティによって異なります。すべてのクレジットを使い果たした後、請求ダッシュボードから100クレジットごとに1ドルでさらに購入できます。 このチュートリアルでは、Google ColabとComfyuiを使用して、安定した拡散3 APIを使用して画像を生成する方法を示します。次のセクションでは、各ツールの使用を開始する手順をカバーします。 Google Colabを使用して、安定した拡散3 APIを使用して
Google Colabを開始するには、Googleアカウントを作成する必要があります。リンクをクリックして指示に従ってください。
すでにGoogleアカウントをお持ちの場合は、新しいノートブックを開き、以下の手順に従ってください。注:この例で使用されているコードは、安定性AIによってSD3_APIチュートリアルから取得されます。
ステップ1:要件をインストールします
ステップ2:安定性APIに接続します ステップ3。関数を定義します
ステップ4。画像を生成します
from io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import outputドキュメントによると、安定した画像サービスには、現在生産されている1つの提供のみが含まれています。
sd3:
は6.5クレジットを使用しますimport getpass # To get your API key, visit https://platform.stability.ai/account/keys STABILITY_KEY = getpass.getpass('Enter your API Key')
sd3ターボ:4クレジット
を使用しますdef send_generation_request( host, params, ): headers = { "Accept": "image/*", "Authorization": f"Bearer {STABILITY_KEY}" } # Encode parameters files = {} image = params.pop("image", None) mask = params.pop("mask", None) if image is not None and image != '': files["image"] = open(image, 'rb') if mask is not None and mask != '': files["mask"] = open(mask, 'rb') if len(files)==0: files["none"] = '' # Send request print(f"Sending REST request to {host}...") response = requests.post( host, headers=headers, files=files, data=params ) if not response.ok: raise Exception(f"HTTP {response.status_code}: {response.text}") return response
テストしましょう。 この例では、低地の熱帯地域にトゥーカンの鳥の画像を作成します。
これが作成されたものです:
- 安定した拡散を使用して著者によって作成された画像3
- さあ、SD3ターボを使用して果物で作られた車の画像を作成しましょう。 このコードを実行すると、次の画像が作成されました
# SD3 prompt = "This dreamlike digital art captures a vibrant, Toucan bird in a lowland tropic area" #@param {type:"string"} negative_prompt = "" #@param {type:"string"} aspect_ratio = "1:1" #@param ["21:9", "16:9", "3:2", "5:4", "1:1", "4:5", "2:3", "9:16", "9:21"] seed = 0 #@param {type:"integer"} output_format = "jpeg" #@param ["jpeg", "png"] host = f"https://api.stability.ai/v2beta/stable-image/generate/sd3" params = { "prompt" : prompt, "negative_prompt" : negative_prompt, "aspect_ratio" : aspect_ratio, "seed" : seed, "output_format" : output_format, "model" : "sd3", "mode" : "text-to-image" } response = send_generation_request( host, params ) # Decode response output_image = response.content finish_reason = response.headers.get("finish-reason") seed = response.headers.get("seed") # Check for NSFW classification if finish_reason == 'CONTENT_FILTERED': raise Warning("Generation failed NSFW classifier") # Save and display result generated = f"generated_{seed}.{output_format}" with open(generated, "wb") as f: f.write(output_image) print(f"Saved image {generated}") output.no_vertical_scroll() print("Result image:") IPython.display.display(Image.open(generated))安定した拡散を使用して著者によって作成された画像3ターボ
comfyui でAPIを使用します
システム要件:
- グラフィックスプロセシングユニット(GPU):RTX 3060 TI以上など、最低8GBのVRAMを備えた適切なNVIDIA GPU。 >>
- 中央処理ユニット(CPU):Intel Xeon E5、I5、Ryzen 5などを含む現代プロセッサ。
- ランダムアクセスメモリ(RAM):16GB以上。
- オペレーティングシステム:Windows 10/11またはlinux。 モデルと生成された画像用のコンピューター上の適切なストレージスペース。
- ステップ1:comfyui をインストールします
包括的なパッケージを提供し、複雑な構成を必要とせずにWindowsでcomfyuiの迅速なセットアップを可能にします。
単にダウンロード、抽出、モデルの追加、起動!
ステップ1.1:
このgithubリポジトリからcomfyuiのスタンドアロンバージョンをダウンロード - リンクをクリックすると、ダウンロードが開始されます。 ステップ1.2:最新のcomfyui-windows.zipファイルをダウンロードしたら、7-zipやwinrarなどのユーティリティを使用して抽出します。 ステップ1.3:
Comfyuiの使用を開始するには、チェックポイントモデルが必要です。安定した拡散または抱きしめの顔からチェックポイントモデルをダウンロードできます。モデルをフォルダーに入れます:ステップ1.4:
ここで、run_nvidia_gpu.bat(推奨)またはrun_cpu.batを実行するだけです。これにより、ブラウザでComfyuiを自動的に開始する必要があります コマンドラインは、ブラウザで開くことができるURL http://127.0.1:8188/を実行して生成します。 ステップ2:comfyuiマネージャー
をインストールしますfrom io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import outputファイルExplorerアプリケーション内で、インストールしたディレクトリを見つけます。 Windowsを使用していることを考えると、「comfyui_windows_portable」という名前にする必要があります。ここから、comfyuiに移動し、custom_nodesに移動します。この場所から、アドレスバーにCMDを入力し、Enterを押します。
これはコマンドプロンプト端末を開く必要があります。ここでは、次のコマンドを挿入する必要があります。 完了したら、Comfyuiを再起動します。新しい「
マネージャー」ボタンがフローティングパネルに表示されます。
ステップ3:安定性AI APIノードをインストールします
[管理]ボタンを選択し、「
カスタムノードをインストールします。」に移動して、「
stability api。」
を検索します。import getpass # To get your API key, visit https://platform.stability.ai/account/keys STABILITY_KEY = getpass.getpass('Enter your API Key')「comfyuiの安定性APIノード」ノードを見つけ、右側にあるインストールボタンをクリックしてインストールプロセスを開始します。これに続いて、「
ステップ4:システム全体のAPIキーを定義します
このステップはオプションですが、お勧めします。つまり、安定性AIカスタムノード内の各ノードの安定性AI APIキーを設定できます。これにより、すべてのワークフローでAPIキーを繰り返し入力する必要がなくなり、ワークフローJSONファイルを共有するときにAPIキーを不注意に共有するリスクが低下します。
そうするために、カスタムノードディレクトリに移動します:
from io import BytesIO import IPython import json import os from PIL import Image import requests import time from google.colab import outputsai_platform_key.txtという名前の新しいファイルを作成します。 APIキーをファイルに貼り付け、ドキュメントを保存してから、comfyuiを再起動します。
ステップ5:ワークフローをロードして実行します
安定した拡散3テキストから画像へのワークフローをインストールし、comfyuiにドロップします。
あなたは今行くのがいいです!トラブルシューティングとヒント
他のツールと同様に、途中でいくつかの問題に遭遇する可能性が常にあります。 APIまたはセットアッププロセスの問題に直面しているユーザーのための最も一般的な課題とトラブルシューティング手順は次のとおりです。
APIキーと認証の問題
チャレンジ:ユーザーは、APIキーまたは誤った認証資格情報のためにAPIにアクセスするときに認証エラーに直面する可能性があります。
トラブルシューティング:APIキーをダブルチェックし、コピーして正しく貼り付けていることを確認します。キーに余分なスペースや文字がないことを確認してください。 Stable Diffusion 3サーバーによってAPIキーが適切に認証されていることを確認してください。 クレジット管理の問題
チャレンジ:ユーザーは、クレジットの不十分なクレジットや請求エラーなど、クレジット管理に関連する問題に遭遇する可能性があります。
トラブルシューティング:
安定した拡散3ダッシュボードのクレジット残高を確認して、十分なクレジットを確保してください。請求情報を確認し、サポートチームとの請求エラーまたは不一致に対応します。接続性とネットワークの問題
チャレンジ:ユーザーは、APIにアクセスできないように接続性の問題またはネットワーク中断を経験する場合があります。 トラブルシューティング:
安定したインターネット接続があり、ネットワークの中断がないことを確認してください。問題を分離するには、別のネットワークまたはデバイスからAPIにアクセスしてみてください。接続性の問題を引き続き経験している場合は、インターネットサービスプロバイダーにお問い合わせください。互換性と依存関係エラー
チャレンジ:
ユーザーは、必要なツールとライブラリをインストールまたは使用する際に、互換性の問題や依存関係エラーに遭遇する場合があります。トラブルシューティング:安定した拡散3 APIの互換性要件を確認し、互換性のあるバージョンのツールとライブラリを使用していることを確認してください。エラーを引き起こしている依存関係を更新または再インストールします。トラブルシューティングガイダンスについては、ドキュメントとコミュニティフォーラムを参照してください。
パフォーマンスと応答時間
チャレンジ:ユーザーは、特にピーク使用時間中にAPIと対話するときに、応答時間やパフォーマンスの問題が遅い場合があります。
トラブルシューティング: APIのパフォーマンスと追跡回答時間を監視して、パターンまたはトレンドを特定します。パフォーマンスと優先度の高いアクセスを改善するために、より高い層のサブスクリプション計画にアップグレードすることを検討してください。一貫して遅い応答時間がある場合は、サポートチームに連絡してください。
ドキュメントとサポートチャレンジ:ユーザーは、APIドキュメントを理解するのが難しい場合や、特定の問題のトラブルシューティングの支援が必要な場合があります。
トラブルシューティング:APIの使用、トラブルシューティング、ベストプラクティスに関するガイダンスについては、安定した拡散3ドキュメントを参照してください。未解決の問題や質問がある場合は、サポートチームまたはコミュニティフォーラムに連絡してください。 結論
安定した拡散3は、一連のテキストから画像への生成AIモデルです。この記事では、Google ColabとComfyuiでAPIを使用し始める実用的な手順について説明しました。これで、独自の画像を作成するスキルがあります。忘れないように、できるだけ早く学んだことを必ず適用してください。お読みいただきありがとうございます!
さらなる学習安定した拡散Web UI:初心者向けの包括的なユーザーガイド
ドリームブースとロラを使用した安定した拡散XLを微調整します
安定した拡散を実行する方法- PythonのDiffusersを使用したAIを使用して、フォトリアリックな画像を生成
- faqs
- 安定した拡散3 APIを効果的に使用するためのベストプラクティスは何ですか?
以上が安定した拡散3 APIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化(SEO)から生成エンジン最適化(GEO)に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。 これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか? 何十年もの間

人工一般情報(AGI)への潜在的なパスを探りましょう。 この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態(ASI)を達成する複雑さを掘り下げています。 (関連するアートを参照してください

ヒューマンコンピューターの相互作用:適応の繊細なダンス AIチャットボットと対話することは、相互の影響力の繊細なダンスに参加するようなものです。あなたの質問、回答、および好みは、あなたのニーズをよりよく満たすためにシステムを徐々に形作ります。現代の言語モデルは、明示的なフィードバックメカニズムと暗黙のパターン認識を通じて、ユーザーの好みに適応します。彼らはあなたのコミュニケーションスタイルを学び、あなたの好みを思い出し、あなたの期待に合わせて応答を徐々に調整します。 しかし、私たちはデジタルパートナーを訓練している間、同様に重要なことが逆方向に起こっています。これらのシステムとの相互作用は、私たち自身のコミュニケーションパターン、思考プロセス、さらには対人会話の期待さえ微妙に形作っています。 AIシステムとの相互作用は、対人相互作用に対する私たちの期待を再構築し始めています。インスタント応答に適応しました、

AIは、野火の回復許可を合理化します オーストラリアのハイテク企業ArchistarのAIソフトウェアは、機械学習とコンピュータービジョンを利用して、地域の規制に準拠するための建築計画の評価を自動化します。この前検証は重要です

エストニアのデジタル政府:米国のモデル? 米国は官僚的な非効率性と闘っていますが、エストニアは説得力のある代替品を提供しています。 この小さな国は、AIを搭載した、ほぼ100%デジタル化された市民中心の政府を誇っています。 これはそうではありません

結婚式を計画することは記念碑的な仕事であり、しばしば最も組織化されたカップルでさえ圧倒されます。 この記事は、AIの影響に関する進行中のフォーブスシリーズの一部(こちらのリンクを参照)で、生成AIが結婚式の計画にどのように革命をもたらすことができるかを調べます。 結婚式のpl

政府は、さまざまな確立されたタスクにそれらを利用している一方で、企業はAIエージェントを販売のためにますます活用しています。 ただし、消費者の支持者は、個人がターゲットのターゲットに対する防御として自分のAIエージェントを所有する必要性を強調しています

Googleはこのシフトをリードしています。その「AIの概要」機能はすでに10億人以上のユーザーにサービスを提供しており、誰もがリンクをクリックする前に完全な回答を提供しています。[^2] 他のプレイヤーも速く地位を獲得しています。 ChatGpt、Microsoft Copilot、およびPE


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

Dreamweaver Mac版
ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
