IT House News 9월 12일자 Microsoft는 최근 '무료 디지털 도서관 프로젝트' 프로젝트 구텐베르크와 협력하여 AI를 사용하여 전자책 도서관을 위한 5,000개 이상의 무료 오디오북을 제작했습니다.
▲ 사진 출처 프로젝트 구텐베르크 홈페이지
이번 프로젝트에서 연구진은 머신러닝, 자동 텍스트 선택, 자연 음성 합성 등 다양한 인공지능 기술을 활용해 전자책을 자동으로 음성으로 변환하는 전 과정을 성공적으로 구현했다고 합니다
IT홈은 문의를 통해 프로젝트 팀이 먼저 전자책의 구조를 자동으로 분석하고 페이지 번호, 표 등 핵심이 아닌 부분과 본문을 구별한 후 텍스트를 텍스트로 변환할 수 있는 알고리즘을 개발했다는 사실을 알게 되었습니다. WaveNet, Tacotron 및 FastSpeech와 같은 음성 기술은 실제 사람과 유사한 자연스러운 읽기 음성을 생성합니다. 또한 팀은 책에 나오는 내레이터, 대화 및 다양한 캐릭터를 식별하고 그에 따라 음성을 조정하여 스토리라인의 음성 표현을 달성할 수 있는 시스템을 활성화했습니다.
마이크로소프트는 다양한 고전 문학, 드라마, 전기, 기타 작품을 포함해 35,000시간이 넘는 오디오북 음성 데이터를 수집하고 정리했다고 밝혔습니다. 이 음성 데이터는 오픈 소스로 무료로 제공됩니다. 사용자는 자신이 녹음한 음성을 소량 활용해 '자신의 목소리로 책 전체를 읽는' 효과를 낼 수도 있다. 이 프로젝트는 웹사이트의 오디오북 콘텐츠를 풍성하게 하고 시각 장애인에게도 편의를 제공합니다
원래 의미를 바꾸지 않고 내용을 다시 작성하려면 언어를 중국어로 변경해야 합니다. 원문이 나올 필요는 없습니다
위 내용은 Microsoft는 Project Gutenberg와 협력하여 AI를 사용하여 5,000개의 무료 오디오북을 만듭니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!