ホームページ >テクノロジー周辺機器 >AI >OpenAIテキストからスピーチAPIの使用方法
OpenaiのテキストからスピーチのAPIの力のロックを解除:包括的なガイド
魅力的なコンテンツを作成するために数え切れないほどの時間を費やすことを想像してください。 多くの読者は、長い記事の時間があるだけです。 ナレーターを雇うことは高価で時間がかかります。 Openaiのテキストからスピーチ(TTS)APIを入力します。このギャップを埋める技術的ソリューションです。 このチュートリアルでは、OpenaiのTTS API、その機能、実装、カスタマイズ、および多様なアプリケーションについて説明します。
OpenaiのTTS APIとは何ですか?OpenaiのTTS APIは、書かれたテキストを自然な音の音声に変換する強力なツールです。 このテキストからスピーチ(TTS)テクノロジーは、デジタルテキストを採用し、それを可聴ナレーションに変換します。 Openaiは、2つの最先端のモデルを提供しています
多言語オーディオコンテンツの作成。
資金提供されたOpenAIアカウント(以下の価格を参照)
python 3.7以降。 統合開発環境(IDE)。
ステップ2:仮想環境を設定します
仮想環境を作成して、プロジェクトの依存関係を分離します。 (詳細な手順については、Python仮想環境チュートリアルを参照してください。)
APIには、モデル名、テキスト、音声の3つの重要な入力が必要です。 Openaiのサンプル要求を基盤として使用してください:
ステップ4:APIキーを安全に管理してください
APIキーをハードコードする代わりに、ライブラリを使用して安全に管理します。
from pathlib import Path from openai import OpenAI from dotenv import load_dotenv import os load_dotenv() SECRET_KEY = os.getenv("SECRET_KEY") client = OpenAI(api_key=SECRET_KEY) speech_file_path = Path(__file__).parent / "speech.mp3" response = client.audio.speech.create( model="tts-1", voice="alloy", input="Today is a wonderful day to build something people love!" ) response.stream_to_file(speech_file_path)インストール
:
ファイルを作成します:python-dotenv
dotenv
OpenaiのAPIには、Alloy、Echo、Fable、Onyx、Nova、Shimmerの6つの多様な声があります。 voice
パラメーターを使用して、お好みの音声を選択します。 デフォルトの出力はMP3ですが、AAC、FLAC、OPUS、またはMP3の他の形式を指定できます。 各形式は、品質、ファイルサイズ、互換性のトレードオフを提供します。
OpenaiのTTS APIには多数のアプリケーションがあります:
標準TTS:1,000文字あたり0.015ドル。
TTS HD:1,000文字あたり0.030ドル。
以上がOpenAIテキストからスピーチAPIの使用方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。