1 月 10 日のニュース、マイクロソフトは最近、わずか 3 秒の音声で人間の音声を模倣できる VALL-E と呼ばれる人工知能ツールをリリースしました。
このツールは 60,000 時間の英語音声データでトレーニングされており、特定の音声の 3 秒間のクリップを使用してコンテンツを生成します。現在の多くの AI ツールとは異なり、VALL-E は、話者自身が話したことがない言葉であっても、話者の気分や口調を再現できます。
IT House は、コーネル大学の論文で VALL-E を使用していくつかのサウンドを合成したことを知りました。GitHub で聴くことができます。これらの AI 合成オーディオ 。
研究者らは、多くの場合、Vall-E が現在のテキスト読み上げモデルよりも優れたパフォーマンスを発揮したと指摘しました。ただし、この研究では、AI モデルには現在いくつかの問題があるとも書かれています。たとえば、テキスト プロンプト内の一部の単語が不明瞭に発音されたり、完全に欠落したり、出力に 2 回表示されたりする場合があります。さらに、このモデルは現在、特定の音声、特にアクセントのある音声を模倣することが困難です。 他の新しい AI テクノロジーと同様、VALL-E も安全性と倫理の観点から懸念を引き起こしています。 MicrosoftはVALL-Eの使用に関する倫理声明を発表したが、今後の使用については不明だった。 現時点では、Microsoft Vall-E はまだオープンソース化されていません。 Microsoft は GitHub 上にVall-E リポジトリ を作成しましたが、現時点では説明ファイルのみが含まれています。
以上がMicrosoft、わずか 3 秒の音声で人間の音声を模倣できる AI 音声生成ツール VALL-E をリリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

Dreamweaver Mac版
ビジュアル Web 開発ツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター
