ホームページ  >  記事  >  テクノロジー周辺機器  >  Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

PHPz
PHPzオリジナル
2024-06-07 17:10:54516ブラウズ
これが人々の間のコミュニケーションの未来の姿でしょうか?

最近、ChatTTSと呼ばれるテキスト読み上げプロジェクトが人気を集めており、皆から大きな注目を集めています。わずか 3 日間で、GitHub で 9.2,000 個のスターを獲得しました。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

プロジェクトアドレス: https://github.com/2noise/ChatTTS/tree/main

作者自身も x で ChatTTS がオープンソースの天井を突破したと述べました。ただし、現在オープンソースとして公開されているのは基本モデルのみであり、SFT による監修や微調整は行われていません。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

このプロジェクトはテキストを音声に変換します。効果は次のとおりです。Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しましたChatTTSは中国語だけでなく、英語も話すことができ、途中で笑い声を追加することもできます。ポーズやモーダルパーティクルは非常に再生可能です。 Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました絶版になった亡くなった人々の声をもう一度聞きたい場合はいつでも聞くことができます。スウィフトの音色を真似て聴いてみると、イントネーションも音色の変化も彼女に非常に近く、AIっぽさはほとんどありません。 Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しましたあなたは中国語と英語も上手に話すことができ、この半分英語と半分中国語のアクセントで、ChatTTS の言語能力は次のレベルに達しています。站 上記の音声はステーション B のものです: https://www.bilibili.com/video/bv1zn4y1o7iv/?share_source=copy_web&vd_source=983EC32A3036B1CF2699E4FDBCE3C28 表示中に、チャットが自然な滑らかさを実現できることがわかります 音声合成は同時に複数の話者をサポートしますChatTTS は、韻律の点でほとんどのオープンソース TTS モデルを上回っています。 Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました現在、ChatTTS は中国語と英語をサポートしています。最大のモデルは、100,000 時間以上の中国語と英語のデータを使用してトレーニングされました。 HuggingFace のオープンソース バージョンは、40,000 時間トレーニングされていますが、まだ SFT されていないバージョンです。

上記に表示されている音声はすべて音声合成技術に基づいて作成されており、技術的成果を紹介することを目的としており、他人の権利を侵害したり侵害したりすることを目的としたものではないことに注意してください。
このプロジェクトがリリースされるとすぐに、あらゆる階層のネチズンがそれを試してみたところ、音は本物と偽物を区別するのが確かに難しいことがわかりました。

GPT を使用してテキストを生成し、それを ChatTTS に「読み取らせる」人もいます。実際の人の口調とイントネーションの違いは非常に小さいです。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しましたHot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

その効果は非常に優れています。 、当然試してみたいと思います。 ChatTTSを口代わりとして使用するには、以下の操作方法を参考にしてください。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しましたオンライン体験アドレス:https://huggingface.co/spaces/Dzkaka/ChatTTSHot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

ChatTTS には主に 2 つのコア機能があり、1 つ目はテキスト読み上げで、2 つ目は大規模な言語モデルを使用したリアルタイム音声対話です。これらの機能に加えて、「オーディオシード」でデジタル的に指定したスピーカーの音色を調整したり、サイコロを振ってランダムにスピーカーを生成したりすることもできます。ただし、毎回同じパラメーターを使用すると、生成されるトーンが必ずしも固定されるとは限らないというテスターの意見も多かったです。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

2Noise は現在サウンドのクローン作成をサポートしているが、それにはより大量のデータが必要だと述べています。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

テキスト ボックスにテキストを入力すると、ChatTTS が韻とポーズを自動的に生成し、「その後」などのモーダル助詞も追加します。入力時にテキストに [笑い] と [uv_break] を追加すると、ChatTTS を手動で制御して、話すときに「笑い」を生み出すことができます。 Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

しかし、一部のネチズンはまだ比較的長いテキストを処理できず、オーディオブックに挑戦するよう要求し、初期バージョンでは30秒を超える音声を生成できず、手動で修復する必要があることがわかりました。比較的長いテキストに遭遇した場合、ChatTTS の単語分割にも問題が発生します。

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました

以上がHot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。