Heim > Artikel > Technologie-Peripheriegeräte > Die technische Stärke von Huoshan Voice TTS wurde vom National Inspection and Quarantine Center mit einem MOS-Wert von bis zu 4,64 zertifiziert
Kürzlich hat das Sprachsyntheseprodukt Volcano Engine das „Zertifikat für verbesserte Inspektion und Prüfung der Sprachsynthese“ erhalten, das vom National Speech and Image Recognition Product Quality Inspection and Testing Center (im Folgenden als „AI National Inspection Center“ bezeichnet) ausgestellt wurde. die die grundlegenden Anforderungen und die Erweiterung der Sprachsynthese abdeckt. Die Anforderungen haben den höchsten Standard des AI National Inspection Center erreicht. Diese Bewertung wird anhand der Dimensionen Mandarin-Chinesisch, Multi-Dialekte, Multi-Sprachen, Multi-Timbrals und Personalisierung durchgeführt. Das technische Support-Team des Produkts – das Volcano Voice Team – stellt nach der Bewertung eine umfangreiche Klangbibliothek zur Verfügung hat die höchste MOS-Bewertung und kann 4,64 Punkte erreichen, was den Spitzenwert in der Branche darstellt.
Als erstes Qualitätskontrollsystem meines Landes im Bereich der künstlichen Intelligenz und die einzige nationale Inspektions- und Prüfstelle für die Qualität von Sprach- und Bildprodukten
hat sich das AI National Inspection Center der Förderung der Gesundheit verschrieben der intelligenten Sprachbranche entwickeln sich weiter. Die Erlangung der maßgeblichen Zertifizierung durch das AI National Inspection Center zeigt auch in vollem Umfang, dass die Fähigkeiten der Sprachsynthesetechnologie von Huoshan Voice das branchenführende Niveau erreicht haben.Spüren Sie die Wirkung der Vulkan-Sprachsynthese:
https://www.php.cn/link/8e0ce414531179ae9b7f60e20351ee8b Mehr Klangerlebnis:
Es wird davon ausgegangen, dass das Sprachsyntheseprodukt Volcano Engine , das an dieser Überprüfung teilgenommen hat, unabhängig vom Volcano Voice-Team entwickelt wurde und die branchenweit führende generative neuronale Netzwerktechnologie verwendet. Es besteht hauptsächlich aus akustischer Front-End-Textanalyse Modell und Vocoder. Die detaillierte Einführung des Moduls lautet wie folgt:
Front-End-Textanalyse: Hauptverantwortlich für die Verständlichkeit, z. B. Textregularisierung (z. B. Konvertieren von Zahlen in Jahreslesung, Zahlenlesung usw.), phonetische Konvertierung (z. B. chinesische phonetische Notation, insbesondere zur Lösung des Polyphonproblems) sowie Wortsegmentierung und Prosodievorhersage usw. Derzeit verlässt sich das Huoshan Voice-Team auf Multitask-Modelle und die Regularisierung neuronaler Netze, um 12 gängige Nebensprachen gleichzeitig zu unterstützen, mit bemerkenswerten Ergebnissen.
Derzeit wird Huoshan Voice seine seit vielen Jahren ausgefeilten Sprachtechnologiefunktionen auf den Markt bringen und sie über die Volcano-Engine für externe Unternehmen öffnen. Es deckt viele Anwendungsszenarien wie Automobile, Finanzen, Audio-Lesen und Video ab Synchronisation usw. und hat Hezhong Automobile und Book Chasing Artifact unterstützt. Viele führende Unternehmen der Branche haben die Anwendung und Erweiterung von KI-Sprachfunktionen erkannt. Huoshan Voice wird auch in Zukunft die effiziente Kombination von Spitzentechnologien erforschen Technologie- und Geschäftsszenarien und stecken weiterhin innovative Energie in die Benutzererfahrung und das Geschäftswachstum, um einen größeren Wert zu erzielen.
Das obige ist der detaillierte Inhalt vonDie technische Stärke von Huoshan Voice TTS wurde vom National Inspection and Quarantine Center mit einem MOS-Wert von bis zu 4,64 zertifiziert. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!