首页 >科技周边 >人工智能 >标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

WBOY
WBOY转载
2023-06-08 10:49:321049浏览

“嗨,欢迎宝宝来到直播间,点击关注不迷路,每晚都有直播福利哦~”

“618福利来了,直播间的粉丝宝宝们,12点整的时刻我们就最先抽免单了啊~”

当你走进直播间,看到“虚拟主播”跟你打招呼时,千万不要惊讶。今年618平台正在重点推出的直播带货赛道“新亮点”,是各大平台越来越多的虚拟人员在直播间里担任主播的结果。

标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

事实上,如果不仔细观察,你很难发现这些主播是AI虚拟主播。她们的外貌不仅与真人相似,而且她们在声音、情感和动作方面的表现非常逼真,在一些方面甚至具备跳舞和唱歌等多种才艺。

AI赋能数字人 打破直播带货次元壁

从以“一禅小和尚”、“我是不白吃”、“默默酱”等为代表的虚拟IP初探直播带货开始,AI数字人直播正逐渐改变传统的零售业和电商行业。越来越多知名品牌已经开始尝试利用AI虚拟人直播来推广自己的产品,例如完美日记的“Stella”,自然堂的“堂小美”,花西子的“花小西”等虚拟主播。

相对于真人主播高昂的运营成本,虚拟主播不受时间、地点、环境限制,一键开播,24小时全天候在线的优势,极大的降低了商家直播带货的成本。对于平台而言,虚拟主播是电商平台生态布局中不可忽略的一环,通过不断降低直播门槛,增加平台对中小商家的吸引力。

高质量合成数据集 打造“能说会道”的优质主播

AI数字人直播带货,已然是大势所趋。不过,要实现广泛商业化落地也面临着不小挑战。尤其是高配版的虚拟人,效果越逼真,成本也会水涨船高。

直播间里,主播主要通过声音和画面两种途径来介绍产品信息。其中声音是不可忽视的“第一媒介”。首先,主播有一个自然流畅、情感丰富的音色,才能给用户带来舒适的听感,反之,如果主播的声音过于机械、冷漠,则会影响观看欲望;其次是互动体验,例如主播通过语音控制发红包,粉丝通过语音连麦与主播沟通,都会增加与直播间用户的粘性。

因此,为了达到更好的直播效果和用户体验,商家需要对虚拟主播的语音交互能力不断进行调试,打磨直播话术,完善与用户互动的功能。

无论何种机器学习能力,都需要算法和数据的累积来支撑它们的技术层面。要提高在直播带货场景下的语音交互能力,需要有大量优质的直播场景数据支撑模型训练。

标贝科技深耕AI数据服务领域多年,在数据采集和标注方面具备丰富的实践经验。针对直播带货场景,标贝科技基于专业级录音棚及优质声优资源,精心建立了高质量语音合成数据库,并完成对数据库的音字标注、韵律标注、音素边界标注、口语化标签标注等,可供算法优化直接使用,确保合成出来的音色更稳定、自然度更高。

基于直播带货场景的合成数据库

语种:中文普通话、中英混合

采集环境:专业录音棚,信噪比不低于35dB

数据时长:5小时中文,1小时中英混

录音语料:主播直播带货话术

采样格式:无压缩PCM WAV格式

采样率:48KHz 24bit

标注内容:音字标注、韵律标注、音素边界标注,重音、拖音、笑声等标签标注

适用领域:直播带货

欢迎对以上数据集感兴趣的行业伙伴联系我们~

如果以上数据不能满足您当前的需求,标贝科技还可以针对特定人群、特定场景、特定语种提供相应的数据定制化服务,全力帮助企业客户得到满意的数据服务。

以上是标贝科技直播带货场景合成数据库 助力打造优质“AI主播”的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文转载于:sohu.com。如有侵权,请联系admin@php.cn删除