首頁 >科技週邊 >人工智慧 >標貝科技直播帶貨場景合成資料庫 協助打造優質'AI主播”

標貝科技直播帶貨場景合成資料庫 協助打造優質'AI主播”

WBOY
WBOY轉載
2023-06-08 10:49:321052瀏覽

「嗨,歡迎寶寶來到直播間,點擊關注不迷路,每晚都有直播福利哦~」

「618福利來了,直播間的粉絲寶寶們,12點整的時刻我們就最先抽免單了啊~」

當你走進直播間,看到「虛擬主播」跟你打招呼時,千萬不要驚訝。今年618平台正在重點推出的直播帶貨賽道“新亮點”,是各大平台越來越多的虛擬人員在直播間裡擔任主播的結果。

标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

事實上,如果不仔細觀察,你很難發現這些主播是AI虛擬主播。她們的外表不僅與真人相似,而且她們在聲音、情感和動作方面的表現非常逼真,在某些方面甚至具備跳舞和唱歌等多種才藝。

AI賦能數字人 打破直播帶貨次元壁

從以「一禪小和尚」、「我是不白吃」、「默默醬」等為代表的虛擬IP初探直播帶貨開始,AI數位人直播正逐漸改變傳統的零售業和電商行業。越來越多知名品牌已經開始嘗試利用AI虛擬人直播來推廣自己的產品,例如完美日記的“Stella”,自然堂的“堂小美”,花西子的“花小西”等虛擬主播。

相對於真人主播高昂的營運成本,虛擬主播不受時間、地點、環境限制,一鍵開播,24小時全天候在線的優勢,極大的降低了商家直播帶貨的成本。對平台而言,虛擬主播是電商平台生態佈局中不可忽略的一環,透過不斷降低直播門檻,增加平台對中小企業的吸引力。

高品質合成資料集 打造「能言善道」的優質主播

AI數位人直播帶貨,已然是大勢所趨。不過,要實現廣泛商業化落地也面臨不小挑戰。尤其是高配版的虛擬人,效果越逼真,成本也會水漲船高。

直播間裡,主播主要透過聲音和畫面兩種途徑來介紹產品資訊。其中聲音是不可忽視的「第一媒介」。首先,主播有一個自然流暢、情感豐富的音色,才能給用戶帶來舒適的聽感,反之,如果主播的聲音過於機械、冷漠,則會影響觀看慾望;其次是互動體驗,例如主播透過語音控制發紅包,粉絲透過語音連麥與主播溝通,都會增加與直播間用戶的黏著度。

因此,為了達到更好的直播效果和使用者體驗,商家需要對虛擬主播的語音互動能力不斷進行調試,打磨直播話術,完善與用戶互動的功能。

無論何種機器學習能力,都需要演算法和資料的累積來支撐它們的技術層面。要提昇在直播帶貨場景下的語音互動能力,需要有大量優質的直播場景資料支撐模型訓練。

標貝科技深耕AI資料服務領域多年,在資料蒐集與標註方面具備豐富的實務經驗。針對直播帶貨場景,標貝科技基於專業級錄音棚及優質聲優資源,精心建立了高品質語音合成資料庫,並完成對資料庫的音字標註、韻律標註、音素邊界標註、口語化標籤標註等,可供演算法最佳化直接使用,確保合成出來的音色更穩定、自然度更高。

基於直播帶貨場景的合成資料庫

語種:中文國語、中英混合

#採集環境:專業錄音棚,訊號雜訊比不低於35dB

資料長度:5小時中文,1小時中英混

錄音語料:主播直播帶貨話術

取樣格式:無壓縮PCM WAV格式

取樣率:48KHz 24bit

標註內容:音字標註、韻律標註、音素邊界標註,重音、拖音、笑聲等標籤標註

適用領域:直播帶貨

歡迎對以上資料集有興趣的產業夥伴聯絡我們~

如果以上數據無法滿足您目前的需求,標貝科技還可以針對特定人群、特定場景、特定語種提供相應的數據客製化服務,全力幫助企業客戶得到滿意的數據服務。

以上是標貝科技直播帶貨場景合成資料庫 協助打造優質'AI主播”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:sohu.com。如有侵權,請聯絡admin@php.cn刪除