ホームページ

テクノロジー周辺機器

Microsoft、わずか 3 秒の音声で人間の音声を模倣できる AI 音声生成ツール VALL-E をリリース

Microsoft、わずか 3 秒の音声で人間の音声を模倣できる AI 音声生成ツール VALL-E をリリース

May 10, 2023 am 09:13 AM

aiマイクロソフト

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

1 月 10 日のニュース、マイクロソフトは最近、わずか 3 秒の音声で人間の音声を模倣できる VALL-E と呼ばれる人工知能ツールをリリースしました。

このツールは 60,000 時間の英語音声データでトレーニングされており、特定の音声の 3 秒間のクリップを使用してコンテンツを生成します。現在の多くの AI ツールとは異なり、VALL-E は、話者自身が話したことがない言葉であっても、話者の気分や口調を再現できます。

微软发布 AI 声音生成工具 VALL-E，只需 3 秒音频即可模仿人说话

IT House は、コーネル大学の論文で VALL-E を使用していくつかのサウンドを合成したことを知りました。GitHub で聴くことができます。これらの AI 合成オーディオ。

研究者らは、多くの場合、Vall-E が現在のテキスト読み上げモデルよりも優れたパフォーマンスを発揮したと指摘しました。ただし、この研究では、AI モデルには現在いくつかの問題があるとも書かれています。たとえば、テキストプロンプト内の一部の単語が不明瞭に発音されたり、完全に欠落したり、出力に 2 回表示されたりする場合があります。さらに、このモデルは現在、特定の音声、特にアクセントのある音声を模倣することが困難です。

他の新しい AI テクノロジーと同様、VALL-E も安全性と倫理の観点から懸念を引き起こしています。 MicrosoftはVALL-Eの使用に関する倫理声明を発表したが、今後の使用については不明だった。

現時点では、Microsoft Vall-E はまだオープンソース化されていません。 Microsoft は GitHub 上に

Vall-E リポジトリを作成しましたが、現時点では説明ファイルのみが含まれています。

以上がMicrosoft、わずか 3 秒の音声で人間の音声を模倣できる AI 音声生成ツール VALL-E をリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

ほとんどが使用されています10 Power BIチャート - 分析Vidhya

ほとんどが使用されています10 Power BIチャート - 分析VidhyaApr 16, 2025 pm 12:05 PM

Microsoft PowerBIチャートでデータ視覚化の力を活用する今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。データの視覚化は、このギャップを橋渡しし、生データを変換するi

AIのエキスパートシステム

AIのエキスパートシステムApr 16, 2025 pm 12:00 PM

エキスパートシステム：AIの意思決定力に深く飛び込みます医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。それが人工知能の専門家システムの力です。これらのシステムはプロを模倣します

3人の最高の雰囲気コーダーがこのAI革命をコードで分解する

3人の最高の雰囲気コーダーがこのAI革命をコードで分解するApr 16, 2025 am 11:58 AM

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

滑走路AIのGen-4：AIモンタージュはどのように不条理を超えることができますか

滑走路AIのGen-4：AIモンタージュはどのように不条理を超えることができますかApr 16, 2025 am 11:45 AM

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

5日間のISRO AI無料コースを登録する方法は？ - 分析Vidhya

5日間のISRO AI無料コースを登録する方法は？ - 分析VidhyaApr 16, 2025 am 11:43 AM

ISROの無料AI/MLオンラインコース：地理空間技術の革新へのゲートウェイインド宇宙研究機関（ISRO）は、インドのリモートセンシング研究所（IIRS）を通じて、学生と専門家に素晴らしい機会を提供しています。

AIのローカル検索アルゴリズム

AIのローカル検索アルゴリズムApr 16, 2025 am 11:40 AM

ローカル検索アルゴリズム：包括的なガイド大規模なイベントを計画するには、効率的なワークロード分布が必要です。従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。この記事では、Hill ClimbingとSimulについて説明します

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先します

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますApr 16, 2025 am 11:37 AM

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

プロンプト：ChatGptは偽のパスポートを生成します

プロンプト：ChatGptは偽のパスポートを生成しますApr 16, 2025 am 11:35 AM

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

もっと見る

人気の記事

R.E.P.O.説明されたエネルギー結晶と彼らが何をするか（黄色のクリスタル）

4週間前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.最高のグラフィック設定

4週間前By尊渡假赌尊渡假赌尊渡假赌

アサシンのクリードシャドウズ：シーシェルリドルソリューション

2週間前ByDDD

R.E.P.O.誰も聞こえない場合はオーディオを修正する方法

1 か月前By尊渡假赌尊渡假赌尊渡假赌

R.E.P.O.チャットコマンドとそれらの使用方法

1 か月前By尊渡假赌尊渡假赌尊渡假赌

もっと見る

ホットツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

もっと見る

ホットトピック

Gmailメールのログイン入り口はどこですか？

7529

15

CakePHP チュートリアル

1378

52

Steamのアカウント名の形式は何ですか

81

11

Win11 Activation Key Permanent

54

19

NYTの接続はヒントと回答です

21

76

もっと見る