首页 >后端开发 >Python教程 >轻松开始使用 Amazon Transcribe

轻松开始使用 Amazon Transcribe

Mary-Kate Olsen
Mary-Kate Olsen原创
2024-12-04 02:27:10832浏览

介绍

Amazon Transcribe 是一项完全托管的自动语音识别 (ASR) 服务,使开发人员可以轻松地向其应用程序添加语音转文本功能。 [AWS]

Amazon Transcribe 的主要功能

  • 批量转录和实时转录均可
  • 支持多种语言
  • 说话人识别
  • 自定义语言模型
  • 自定义词汇

还有各种其他功能。您可以访问他们的网站,了解有关 Amazon Transcribe 功能和用例的更多信息。

先决条件

唯一的先决条件是您应该拥有一个 AWS 账户,并且拥有足够的权限来访问 Transcribe 和 S3。您可以从 AWS 控制台或通过适用于多种语言的 AWS 开发工具包使用 Transcribe。在本演示中,我将使用 Lambda 函数和 Python 3.10 运行时来调用 Transcribe API。

创建转录作业

步骤一:准备一个S3桶

在创建 Lambda 函数之前,请确保您已设置 S3 存储桶来存储要转录的媒体文件。

第 2 步:创建 Lambda 函数

  • 创建 Lambda 函数并附加具有以下权限的 IAM 角色:
    • AmazonTranscribeFullAccess(AWS 托管策略)
    • S3:GetObject 权限(或者如果需要,可以使用细粒度的自定义策略)。
  • 请参阅本文以获取有关设置 Lambda 函数的指南。
  • 从此 GitHub 存储库复制代码并将其粘贴到 Lambda 函数编辑器中。

第 3 步:创建测试事件

使用以下参数创建一个测试事件:

{
  "MediaFileUri": "s3://your-bucket-name/media-file.mp4"
}

第 4 步:部署并测试代码

部署 Lambda 函数。
执行测试事件。您将收到类似于以下内容的回复:

Get Started with Amazon Transcribe in Easy Steps

第 5 步:验证转录

导航到 AWS 管理控制台中的 AWS Transcribe 服务以验证并下载转录输出。

Get Started with Amazon Transcribe in Easy Steps

创建转录下载作业

第 1 步:创建另一个 Lambda 函数

  • 创建另一个 Lambda 函数并附加具有以下权限的 IAM 角色:
    • AmazonTranscribeFullAccess(AWS 托管策略)
    • 从此 GitHub 存储库复制代码并将其粘贴到 Lambda 函数编辑器中。

第 2 步:创建测试事件

使用以下参数创建一个测试事件:

{
  "MediaFileUri": "s3://your-bucket-name/media-file.mp4"
}

第 3 步:部署并测试代码

部署 Lambda 函数。
执行测试事件。您将收到类似于以下内容的回复:

Get Started with Amazon Transcribe in Easy Steps

结论

我们已经学习了如何使用 Amazon Transcribe 生成媒体文件的转录。
我们设置了两个 lambda 函数,用于创建存储在 S3 中的媒体文件的转录作业并下载转录。

希望您学到了新东西。
如果您喜欢这篇文章,请务必给它一颗心,并评论下您的建议/反馈。

参考

  • 转录网站
  • 转录 Boto3 文档
  • ChatGPT(用于校对。)

以上是轻松开始使用 Amazon Transcribe的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn