如何使用OpenAI文本到语音API

Joseph Gordon-Levitt原创: 2025-03-09 10:25:18547浏览

>解锁Openai的文本到语音API的功能：综合指南

想象一下花费无数的时间制作引人注目的内容，只是因为观众参与度有限而意识到其巨大的潜力没有开发。许多读者根本没有时间进行冗长的文章。雇用叙述者是昂贵且耗时的。输入OpenAI的文本到语音（TTS）API - 一种弥合此差距的技术解决方案。本教程探讨了OpenAI的TTS API，其功能，实现，自定义和不同的应用程序。

什么是OpenAi的TTS API？

> OpenAI的TTS API是一种强大的工具，可将书面文本转换为自然的演讲。这种文本到语音（TTS）技术采用数字文本并将其转换为可听见的叙述。 Openai提供了两个尖端的型号：

> tts-1：针对实时语音生成进行了优化。>
> tts-1-HD：优先级优先音频质量。

API拥有六个不同的声音，并支持各种功能，包括：

叙述博客文章和文章。

创建多语言音频内容。
生成实时音频流。

开始使用OpenAi TTS API

这是使用OpenAI TTS API的分步指南：

>先决条件：

>一个资助的OpenAI帐户（请参见下面的定价）。 python 3.7或更高。

一个集成的开发环境（IDE）。

步骤1：获取您的API键
>

步骤2：设置虚拟环境

> How to use the OpenAI Text-to-Speech API 创建一个虚拟环境来隔离项目依赖性。（有关详细说明，请参阅Python虚拟环境教程。）

步骤3：python代码>

API需要三个关键输入：模型名称，文本和语音。使用OpenAI的样本请求作为基础：

>步骤4：安全管理您的API键

而不是硬编码您的API键，而是使用

库安全地管理它。

from pathlib import Path
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()
SECRET_KEY = os.getenv("SECRET_KEY")

client = OpenAI(api_key=SECRET_KEY)

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

> install：

python-dotenv创建一个

文件：

dotenv pip install python-dotenv自定义语音和输出

OpenAi的API提供了六种不同的声音：合金，回声，寓言，玛瑙，Nova和Shimmer。使用voice>参数选择您的首选语音。默认输出是mp3，但您可以指定其他格式：AAC，FLAC，OPUS或MP3。每种格式都在质量，文件大小和兼容性之间进行权衡。>

有声读物的创建：将书面书或博客文章转换为音频格式。
多语言内容：以各种语言生成音频（尽管对英语进行了优化的声音）。>
实时音频：功率沉浸式视频游戏，吸引聊天机器人和交互式虚拟助手。

付费帐户以50 rpm的限制开始。最大输入大小为4096个字符（大约有5分钟的音频）。定价：

>
结论

OpenAI的TTS API提供了一种功能强大且通用的解决方案，用于将文本转换为高质量的语音。本指南涵盖了其核心功能，实现，自定义选项，现实世界应用程序和定价细节。探索链接的资源以进行进一步学习。

以上是如何使用OpenAI文本到语音API的详细内容。更多信息请关注PHP中文网其他相关文章！

Python edge pip echo for select format using default this transform input ide Access Foundation Other

声明：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Jina Embeddings v2: Handling Long Documents Made Easy下一篇：Job Interview Preparation with ChatGPT Voice Mode

查看更多