首页 >科技周边 >人工智能 >如何使用OpenAI文本到语音API

如何使用OpenAI文本到语音API

Joseph Gordon-Levitt
Joseph Gordon-Levitt原创
2025-03-09 10:25:18547浏览

>解锁Openai的文本到语音API的功能:综合指南

>

想象一下花费无数的时间制作引人注目的内容,只是因为观众参与度有限而意识到其巨大的潜力没有开发。 许多读者根本没有时间进行冗长的文章。 雇用叙述者是昂贵且耗时的。 输入OpenAI的文本到语音(TTS)API - 一种弥合此差距的技术解决方案。 本教程探讨了OpenAI的TTS API,其功能,实现,自定义和不同的应用程序。

什么是OpenAi的TTS API?

> OpenAI的TTS API是一种强大的工具,可将书面文本转换为自然的演讲。 这种文本到语音(TTS)技术采用数字文本并将其转换为可听见的叙述。 Openai提供了两个尖端的型号:

  • > tts-1:针对实时语音生成进行了优化。>
  • > tts-1-HD:优先级优先音频质量。
API拥有六个不同的声音,并支持各种功能,包括:

叙述博客文章和文章。
  • 创建多语言音频内容。
  • 生成实时音频流。
  • 记住:OpenAI的用法策略要求用户明确披露音频是AI生成的。
开始使用OpenAi TTS API

这是使用OpenAI TTS API的分步指南:

>先决条件:

>一个资助的OpenAI帐户(请参见下面的定价)。 python 3.7或更高。

一个集成的开发环境(IDE)。
    >
  • >
  • 步骤1:获取您的API键
  • >
  • >登录您的OpenAI帐户,访问侧边栏菜单(通常通过OpenAI徽标),选择“ API密钥”,然后单击“创建新秘密键”。 分配一个描述性名称(例如,“ tts-example”),并安全地存储此密钥。

>

步骤2:设置虚拟环境

> How to use the OpenAI Text-to-Speech API 创建一个虚拟环境来隔离项目依赖性。 (有关详细说明,请参阅Python虚拟环境教程。)

步骤3:python代码>

API需要三个关键输入:模型名称,文本和语音。 使用OpenAI的样本请求作为基础:

>步骤4:安全管理您的API键

>

而不是硬编码您的API键,而是使用

库安全地管理它。
from pathlib import Path
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()
SECRET_KEY = os.getenv("SECRET_KEY")

client = OpenAI(api_key=SECRET_KEY)

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

> install

python-dotenv创建一个

文件:
  • dotenv pip install python-dotenv自定义语音和输出
  • OpenAi的API提供了六种不同的声音:合金,回声,寓言,玛瑙,Nova和Shimmer。 使用voice>参数选择您的首选语音。 默认输出是mp3,但您可以指定其他格式:AAC,FLAC,OPUS或MP3。 每种格式都在质量,文件大小和兼容性之间进行权衡。>

    现实世界应用

    OpenAI的TTS API有许多应用程序:

    • 有声读物的创建:将书面书或博客文章转换为音频格式。
    • 多语言内容:以各种语言生成音频(尽管对英语进行了优化的声音)。>
    • 实时音频:功率沉浸式视频游戏,吸引聊天机器人和交互式虚拟助手。
    api限制和定价

    付费帐户以50 rpm的限制开始。 最大输入大小为4096个字符(大约有5分钟的音频)。 定价:

    标准TTS:$ 0.015每1,000个字符。>
      > tts HD:每1,000个字符$ 0.030。
    • >
    • 结论
    OpenAI的TTS API提供了一种功能强大且通用的解决方案,用于将文本转换为高质量的语音。 本指南涵盖了其核心功能,实现,自定义选项,现实世界应用程序和定价细节。 探索链接的资源以进行进一步学习。

以上是如何使用OpenAI文本到语音API的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn