未來人與人的交流,難道是這個樣?
最近,一個名為ChatTTS的文字轉語音專案爆火出圈,引來大家極大的關注。短短三天時間,在GitHub上已經斬獲了9.2k的Star量。
專案網址:https://github.com/2noise/ChatTTS/tree/main
作者本人也在x 上表示,ChatTTS 突破了開源天花板。不過,目前開源的只是底模,沒有經過 SFT 監督微調。
該項目將文字轉換成語音,效果是這樣的:ChatTTS 不僅能說中文,英文也能hold 住,還支援一些細粒度控制,它允許你加入笑聲、說話間的停頓,還有語氣詞,可玩性很強。
它可以復刻已經逝去的人的絕版聲音,想要再聽到賈伯斯開發表會,隨時都可以。聽它模仿黴霉的音色,不論是語調還是語調的變化,都挺接近本人,幾乎聽不出來 AI 味兒。
中英文混說也能拿捏,這口半英半中的腔調勇闖留子圈,ChatTTS 的語言能力已達到 next level。
目前ChatTTS支援中文和英文。最大模型使用了超過10萬小時的中英文資料進行訓練。在HuggingFace中開源的版本為4萬小時訓練但尚未SFT的版本。
值得一提的是,上述展示的音訊都是基於語音合成技術製作,旨在展示技術成果,無意冒犯或侵犯他人權益。
項目一經發布,各路網友紛紛試用起來,給了聲音確實真假難辨。
還有人拿GPT 生成文本,讓ChatTTS「讀」出來,語氣語調和真人的差距非常小:
效果這麼好,自然想要上手試試。怎麼樣才能用 ChatTTS 當你的嘴替,可以參考以下方法來操作。
線上體驗網址:https://huggingface.co/spaces/Dzkaka/ChatTTS
ChatTTS 主要有兩種核心功能,第一種是文字轉語音,第二種是將與大語言模型即時語音對話。在這些功能之外,可以在「Audio Seed」處調整數字指定說話者的音色,或是搖骰子隨機產生一種。但有不少測試者表示,每次採用一樣的參數,產生的音色不一定固定。
2Noise 稱,目前支援音色克隆,但需要更大的資料量。
在文字方塊內輸入文字後,ChatTTS 會自動為你產生節奏和停頓,也會加入一些如「然後」之類的語氣字。如果你在輸入時在文字中加入 [laugh] 和 [uv_break],就能手動控制 ChatTTS 在說話間產生一些「笑果」。
不過ChatTTS 現在還不能搞定比較長的文本,有網友讓它挑戰了一下有聲書,發現初始版本不能生成超過30 秒的音頻,需要手動修復。遇到比較長的文字時,ChatTTS 的分詞也會出問題。
以上是爆火ChatTTS突破開源語音天花板,3天斬獲9k的Star量的詳細內容。更多資訊請關注PHP中文網其他相關文章!

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版
SublimeText3 Linux最新版

Dreamweaver Mac版
視覺化網頁開發工具