"안녕하세요 베이비 생방송방에 오신 것을 환영합니다. 팔로우하고 헤매지 마세요. 매일 밤 생방송 혜택이 있습니다~"
"618혜택은 왔어요 팬분들 생방송실에서 12시 무료주문 선착순 추첨할게요~"
생방송실에 들어서면 '가상앵커'가 반겨주는 모습을 볼 수 있으니 놀라지 마세요. 올해 618 플랫폼이 중점을 두고 있는 라이브 스트리밍 전송 트랙의 '새로운 하이라이트'는 주요 플랫폼에서 라이브 방송실의 앵커 역할을 하는 가상 인력이 점점 더 많아진 결과입니다.
사실 주의깊게 관찰하지 않으면 이 앵커가 AI 가상 앵커인지 찾기 어려울 것입니다. 실제 사람과 닮았을 뿐만 아니라 목소리, 감정, 동작이 매우 현실적이며, 어떤 경우에는 춤, 노래 등 다재다능한 재능을 갖고 있기도 합니다.
AI는 디지털 사람들이 라이브 스트리밍의 차원 벽을 허물 수 있도록 지원합니다
"이젠소스님", "공짜로 먹지 않아요", "모모장" 등으로 대표되는 가상 IP의 라이브 스트리밍에 대한 예비 탐색을 시작으로 AI 디지털 휴먼 라이브 스트리밍은 점차 전통적인 소매업과 유통업을 변화시키고 있습니다. 전자상거래 산업. Perfect Diary의 'Stella', Nature Hall의 'Tang Xiaomei', Hua Xizi의 'Hua Xiaoxi' 및 기타 가상 앵커와 같이 점점 더 많은 유명 브랜드가 자사 제품을 홍보하기 위해 AI 가상 인간 라이브 방송을 사용하기 시작했습니다.
실제 라이브 앵커의 높은 운영 비용에 비해 가상 앵커는 시간, 장소, 환경에 제약을 받지 않고 한 번의 클릭으로 방송을 시작할 수 있으며 24시간 온라인 상태이므로 판매자의 라이브 스트리밍 비용이 크게 절감됩니다. . 플랫폼에 있어 가상 앵커는 전자상거래 플랫폼의 생태학적 레이아웃에서 무시할 수 없는 연결고리로서 실시간 방송 문턱을 지속적으로 낮추어 중소 가맹점에게 더욱 매력적인 플랫폼입니다.
“웅변적인” 고품질 앵커를 만들기 위한 고품질 합성 데이터 세트
AI 디지털 휴먼 라이브 스트리밍이 일반적인 트렌드가 되었습니다. 그러나 광범위한 상용화를 달성하는 것도 상당한 과제에 직면해 있습니다. 특히 가상 인간의 고급 버전의 경우 효과가 현실적일수록 비용이 높아집니다.
생방송실에서는 앵커가 주로 소리와 사진을 통해 제품정보를 소개합니다. 그 중에서도 소리는 무시할 수 없는 '최초의 매체'이다. 우선, 앵커는 사용자에게 편안한 청취 경험을 제공하기 위해 자연스럽고 부드러우며 감성적인 음색을 가져야 합니다. 반대로 앵커의 목소리가 너무 기계적이고 무관심하면 시청 욕구에 영향을 미치게 됩니다. 앵커의 음성 제어 등 빨간 봉투를 보내거나, 앵커와 음성채팅을 통해 소통하는 팬, 팬들이 라이브 방송실 내 이용자들과의 끈끈함을 높일 수 있다.
따라서 더 나은 라이브 방송 효과와 사용자 경험을 달성하기 위해 판매자는 가상 앵커의 음성 상호 작용 기능을 지속적으로 디버깅하고 라이브 방송 기술을 연마하며 사용자와의 상호 작용 기능을 개선해야 합니다.
어떤 종류의 머신러닝 기능이든 기술 수준을 뒷받침하려면 알고리즘과 데이터의 축적이 필요합니다. 라이브 스트리밍 시나리오에서 음성 상호 작용 기능을 향상하려면 모델 교육을 지원하기 위해 대량의 고품질 라이브 스트리밍 시나리오 데이터가 필요합니다.
Biaobei Technology는 수년간 AI 데이터 서비스 분야에 깊이 관여해 왔으며 데이터 수집 및 주석 분야에서 풍부한 실무 경험을 보유하고 있습니다. 생방송 전달 시나리오를 위해 Biaobei Technology는 전문 수준의 녹음 스튜디오와 고품질 성우 리소스를 기반으로 고품질 음성 합성 데이터베이스를 신중하게 구축했으며 음성 문자 주석, 운율 주석, 음소 경계 주석, 구어체 레이블을 완성했습니다. 데이터베이스의 주석 등을 알고리즘 최적화에 직접 사용하여 합성된 음색이 보다 안정적이고 자연스러울 수 있도록 합니다.
라이브 스트리밍 전송 시나리오를 기반으로 한 합성 데이터베이스
언어: 표준 중국어, 중국어와 영어 혼합
수집 환경: 전문 녹음 스튜디오, 신호 대 잡음비 35dB 이상
데이터 기간: 중국어 5시간, 중국어 및 영어 1시간
녹음자료: 앵커의 라이브 전달력
샘플링 형식: 비압축 PCM WAV 형식
샘플링 속도: 48KHz 24비트
주석 내용: 발음 문자 주석, 운율 주석, 음소 경계 주석, 강세, 드래그, 웃음 및 기타 레이블 주석
적용분야: 라이브 스트리밍
위 데이터 세트에 관심이 있는 업계 파트너는 언제든지 문의해 주세요~
위의 데이터가 현재 요구 사항을 충족할 수 없는 경우 Biaobei Technology는 특정 그룹, 특정 시나리오 및 특정 언어에 해당하는 데이터 맞춤 서비스를 제공하고 기업 고객이 만족스러운 데이터 서비스를 얻을 수 있도록 전적으로 지원합니다.
위 내용은 Biaobei Technology의 라이브 스트리밍 장면 합성 데이터베이스는 고품질 "AI 앵커"를 생성하는 데 도움이 됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!