微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

May 10, 2023 am 09:13 AM

ai微软

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

1 月 10 日消息，微软最近发布了一款名为 VALL-E 的人工智能工具，只需 3 秒音频即可模仿人说话。

该工具经过 60000 小时英语语音数据的训练，并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同，VALL-E 可以复制说话者的情绪和语气，即使说话者本人从未说过的单词也可以模仿。

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

IT之家了解到，康奈尔大学的一篇论文使用 VALL-E 合成了几种声音，大家可以在 GitHub 上聆听这些 AI 合成的音频。

研究人员指出，在许多情况下，Vall-E 的性能优于当前的文本到语音转换模型。然而，该研究还写道，人工智能模型目前存在几个问题。例如，文本提示中的某些单词可能会发音不清晰、完全遗漏或在输出中出现两次。此外，该模型目前难以模仿某些声音，尤其是带有口音的声音。

像其他 AI 新技术一样，VALL-E 在安全、伦理等方面也引发了担忧。微软发布了关于使用 VALL-E 的道德声明，但未来的使用用途方面没有明确说明。

目前，微软 Vall-E 尚未开源。微软已经在 GitHub 上创建了一个 Vall-E 存储库，但目前只包含一个描述文件。

以上是微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话的详细内容。更多信息请关注PHP中文网其他相关文章！

声明

本文转载于：51CTO.COM。如有侵权，请联系admin@php.cn删除

阅读AI索引2025：AI是您的朋友，敌人还是副驾驶？

阅读AI索引2025：AI是您的朋友，敌人还是副驾驶？Apr 11, 2025 pm 12:13 PM

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它：认知（了解正在发生的事情）、欣赏（看到好处）、接纳（面对挑战）和责任（弄清我们的责任）。认知：人工智能无处不在，并且发展迅速我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进，在数学和复杂思维测试中取得了优异的成绩，而就在一年前，它们还在这些测试中惨败。想象一下，人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

开始使用Meta Llama 3.2 -Analytics Vidhya

开始使用Meta Llama 3.2 -Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta的Llama 3.2：多模式和移动AI的飞跃 Meta最近公布了Llama 3.2，这是AI的重大进步，具有强大的视觉功能和针对移动设备优化的轻量级文本模型。以成功为基础

AV字节：Meta＆＃039; llama 3.2，Google的双子座1.5等

AV字节：Meta＆＃039; llama 3.2，Google的双子座1.5等Apr 11, 2025 pm 12:01 PM

本周的AI景观：进步，道德考虑和监管辩论的旋风。 OpenAI，Google，Meta和Microsoft等主要参与者已经释放了一系列更新，从开创性的新车型到LE的关键转变

与机器交谈的人类成本：聊天机器人真的可以在乎吗？

与机器交谈的人类成本：聊天机器人真的可以在乎吗？Apr 11, 2025 pm 12:00 PM

连接的舒适幻想：我们在与AI的关系中真的在蓬勃发展吗？这个问题挑战了麻省理工学院媒体实验室“用AI（AHA）”研讨会的乐观语气。事件展示了加油

了解Python的Scipy图书馆

了解Python的Scipy图书馆Apr 11, 2025 am 11:57 AM

介绍想象一下，您是科学家或工程师解决复杂问题 - 微分方程，优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力，但是这些任务需要强大的工具

3种运行Llama 3.2的方法-Analytics Vidhya

3种运行Llama 3.2的方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2：多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步，具有增强的语言理解力，提高的准确性和出色的文本生成能力。它的能力t

使用dagster自动化数据质量检查

使用dagster自动化数据质量检查Apr 11, 2025 am 11:44 AM

数据质量保证：与Dagster自动检查和良好期望保持高数据质量对于数据驱动的业务至关重要。随着数据量和源的增加，手动质量控制变得效率低下，容易出现错误。

大型机在人工智能时代有角色吗？

大型机在人工智能时代有角色吗？Apr 11, 2025 am 11:42 AM

大型机：AI革命的无名英雄虽然服务器在通用应用程序上表现出色并处理多个客户端，但大型机是专为关键任务任务而建立的。这些功能强大的系统经常在Heavil中找到

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么（黄色晶体）

3 周前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最佳图形设置

3 周前By尊渡假赌尊渡假赌尊渡假赌

刺客信条阴影：贝壳谜语解决方案

2 周前ByDDD

R.E.P.O.如果您听不到任何人，如何修复音频

3 周前By尊渡假赌尊渡假赌尊渡假赌

WWE 2K25：如何解锁Myrise中的所有内容

3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序，非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具，帮助Web开发人员更好地理解保护Web应用程序的过程，并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞，难度各不相同。请注意，该软件中

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

EditPlus 中文破解版

EditPlus 中文破解版

体积小，语法高亮，不支持代码提示功能

Dreamweaver Mac版

Dreamweaver Mac版

视觉化网页开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

热门话题

gmail邮箱登陆入口在哪里

7461

15

1376

52

steam的账户名称是什么格式

77

11

win11激活密钥永久

44

19

NYT连接提示和答案

17

17