Google은 오늘 Translatotron 3이라는 새로운 인공 지능 모델을 공식적으로 소개하는 보도 자료를 발표했습니다. 이 모델은 병렬 음성 데이터가 필요하지 않으며 음성 대 음성 동시 통역이 가능합니다
Google은 2019년에 Translatotron S2ST 시스템을 출시했고 2021년 7월에 두 번째 버전을 출시했습니다. 2023년 5월 27일에 발표된 논문에서 Google은 Translatotron 3
을 훈련하기 위한 새로운 방법을 배포한다고 발표했습니다.연구원들은 Translatotron 2가 이미 탁월한 번역 품질, 음성 견고성(Robust) 및 음성 자연성을 제공하는 반면 Translatotron 3은 "직접 음성 대 음성 번역을 위한 최초의 완전 비지도 종단 간 모델"을 구현한다고 말합니다.
기존 S2ST는 자동 음성 인식 + 기계 번역 + 텍스트-음성 합성이라는 캐스케이드 방식을 통해 해결되지만, Translatotron 3는 새로운 end-to-end 아키텍처를 채택하여 소스 언어 음성을 대상 언어에 의존하지 않고 직접 매핑합니다. 중간 텍스트 표현
Translatotron 3 모델은 언어 장애가 있는 사람들을 돕기 위한 도구를 만들거나 보다 매력적이고 효과적인 맞춤형 언어 학습 도구를 개발하는 데에도 사용할 수 있습니다.
다시 작성해야 하는 내용은 다음과 같습니다. 출처: IT Home
위 내용은 AI 동시통역의 새로운 돌파구, Google, Translatotron 3 모델 출시: 텍스트 변환 단계를 우회할 수 있음의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!