Heim > Artikel > Technologie-Peripheriegeräte > He Zhongjiang, General Manager von China Telecom Artificial Intelligence: Supernatural Voice 2.0 wird 2024 veröffentlicht
Am Nachmittag des 10. November erläuterte He Zhongjiang, General Manager von China Telecom Artificial Intelligence, die Produkte und Ideen des allgemeinen Großmodells auf dem Entwicklungskooperationsforum für künstliche Intelligenz und Datenindustrie
He Zhongjiang teilte zunächst seine Ansichten zur allgemeinen künstlichen Intelligenz mit. Er glaubte, dass sich allgemeine künstliche Intelligenz auf die Fähigkeit bezieht, wie Menschen zu sehen, zuzuhören und zu denken . Visuelle Informationen und Nachdem die Sprachinformationen im Gehirn gesammelt wurden, verarbeitet und beurteilt das Gehirn sie und liefert Entscheidungsideen. Das allgemeine große Modell spielt die Rolle des Gehirns. Die heutigen riesigen Datenmengen, fortschrittlichen Algorithmen und solide Rechenleistung werden auch die groß angelegte Entwicklung großer Modelle fördern.
Nachdem er die grundlegenden Ansichten erläutert hatte, gab He Zhongjiang eine detaillierte Erläuterung des semantischen Modells von China Telecom Star und des multimodalen Modells von China Telecom Star. Das Semantic Large Model von China Telecom Star ist der Kern der allgemeinen künstlichen Intelligenz. Es verfügt über bessere Fähigkeiten und kann mehrere Halluzinationsrunden lindern, wodurch die „Halluzinationsrate“ um 40 % gesenkt wird. In Zukunft kann das semantische Star-Großmodell von China Telecom 2B2G-Dienste extern stärken, Qualität und Effizienz verbessern und das Erlebnis optimieren, es kann vollständig intern angewendet werden, die Effizienz der Produktionszusammenarbeit verbessern und über umfassendere Anwendungen verfügen. He Zhongjiang gab außerdem bekannt, dass das KI-Team von China Telecom auch am Open-Source- und Open-Source-Prozess teilnehmen wird. Es wird das Zehn-Milliarden-Modell vor Ende dieses Jahres und das Hunderte-Milliarden-Modell im April nächsten Jahres veröffentlichen wird Open Source sein.
Als He Zhongjiang das multimodale Großmodell China Telecom Star vorstellte, sagte er, dass China Telecom derzeit mehr als 1,2 Milliarden Bild- und Textpaare trainiert und dabei eine gemischte Präzisionsstrategie verwendet habe, um die GPU-Effizienz deutlich zu verbessern und die Inferenz um das 4,5-fache zu beschleunigen. Das multimodale Großmodell wird als nächstes verwendet. Die grundlegende Fähigkeitsbasis einer Generation digitaler Menschen.
Beim Vergleich der intelligenten Kundendienststimme von Wanhao mit Supernatural TTS1.0 sagte He Zhongjiang, dass das Xingchen Voice Large Model 1.0 eine Natürlichkeit erreichen kann, die mit der von echten Menschen vergleichbar ist, und dass das Echtzeit-Streaming in eine wohlgeformte Stimme kürzer ist als 50 Millisekunden; unterstützt extrem kleine Datenmengen. Quantitative Tonkonvertierung und Anpassung für bessere, schnellere und größere Flexibilität. Er gab außerdem bekannt, dass Supernatural Speech Synthesis 2.0 Mitte 2024 veröffentlicht wird.
China Telecom HR basiert auf dem multimodalen Großmodell China Telecom Star und verwendet grundlegende digitale Avatare, um Funktionen wie die beliebige Kombination von Make-up-Accessoires, die personalisierte Generierung und die individuelle Anpassung anzuzeigen. He Zhongjiang sagte, dass mit der kontinuierlichen Verbesserung der Großmodelltechnologie und der kontinuierlichen Bereicherung des Wissens digitale Menschen im virtuellen Raum und Roboter in der realen Welt einen zunehmenden Einfluss auf die Produktion, den Betrieb und das Leben der Menschen sowie auf die Ära von haben werden Künstliche Intelligenz steht vor der Tür!
Operator Finance (offizielles öffentliches WeChat-Konto yyscjrd) – eine Mainstream-Finanz-Website, eine Website, die umfassend Technologie, Finanzen, Wertpapiere, Automobile, Immobilien, Lebensmittel, Medizin, tägliche Chemikalien, Wein und andere Konsumgüter abdeckt.
Das obige ist der detaillierte Inhalt vonHe Zhongjiang, General Manager von China Telecom Artificial Intelligence: Supernatural Voice 2.0 wird 2024 veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!