Heim >Technologie-Peripheriegeräte >KI >Da Fälschungen wie echte aussehen, bietet das große Modell von Tiangong Music ein subversives KI-Erlebnis

Da Fälschungen wie echte aussehen, bietet das große Modell von Tiangong Music ein subversives KI-Erlebnis

王林nach vorne: 2024-04-03 21:25:102448Durchsuche

Gestern startete Kunlun Wanweis groß angelegtes KI-Musikgenerierungsmodell „Tiangong SkyMusic“ eine kostenlose Betatestveranstaltung. Die Medien, Branchenexperten und interessierte Musikpraktiker sind herzlich eingeladen, die Musikmodellprodukte von SOTA kennenzulernen. Dieses Produkt ermöglicht Benutzern ein immersives Erlebnis, während sie gemeinsam den emotionalen Ausdruck menschlicher Stimmen erleben.

Nachdem der Einladungstest gestartet ist, hat die Mehrheit der Nutzer hohe Erwartungen an das große Modell der KI-Musikgeneration „Tiangong SkyMusic“. Die Belegschaft erhielt in kürzester Zeit Hunderttausende Testbewerbungen, darunter viele professionelle Musikschaffende, Medien- und Branchenexperten. Gleichzeitig wird kontinuierlich eine Vielzahl von Testanwendungen an das Backend gesendet. Unter den Bewerbungen befinden sich viele professionelle Musikschaffende, Medien- und Branchenexperten, aber auch eine Vielzahl von Testanträgen, die kontinuierlich gesichtet und überprüft werden müssen. Zu den Bewerbern zählen viele professionelle Musikschaffende, Medien- und Branchenexperten, die während des Testprozesses weiterhin wertvolles Feedback und Meinungen lieferten

Gleichzeitig haben wir auch viel echtes Feedback und großes Lob von den Nutzern erhalten :

„Der Gesang ist sehr klar und die lyrische Melodie ist gut“

„Das Lied ist großartig!“ „Wukong“ wird mit einem Gespür für den Atem gesungen und die Emotionen sind auf den Punkt gebracht. Es stellt im Grunde den Höhepunkt der Fähigkeit dar, Emotionen zu erzeugen und sie echt aussehen zu lassen. „

, sehr gut. „

“Es ist so mächtig 1. Die KI-Musiknutzerbasis ist sehr groß; 2. Die generierte Musik kann wiederholt verwendet werden;

„Der Refrain ist aus Seide, der Beat ist so gut.“ Das begeisterte Feedback der meisten Benutzer hat es uns ermöglicht, die Reaktion der Branche auf „Heaven“ zu sehen. Die hohen Erwartungen an das große KI-Musikgenerationsmodell „SkyMusic“ lassen uns auch die Bedeutung von „emotionalem AGI“ in der Erkundungsrichtung erkennen AGI-Großmodelle mit Schwerpunkt auf „Intelligenz“.

Im Vergleich zu Text und Bildern sind Audioinhalte der beste Weg, menschliche Emotionen zu verstehen, und Musik ist der Inhaltsträger, der menschliche Emotionen am häufigsten zum Ausdruck bringt und nicht durch Geographie und Kultur eingeschränkt ist, unabhängig von den sich ändernden Zeiten, sei es Krieg Ob im Katastrophenfall, Menschen können durch Musik immer ihre Gefühle zum Ausdruck bringen und emotionalen Trost finden. Dies ist die ursprüngliche Absicht von „Tiangong SkyMusic“ und auch eine wichtige Richtung, die Kunlun Wanwei Emotional AGI weiterhin erforscht.

Wir danken allen Benutzern, die aktiv teilgenommen und begeistertes Feedback gegeben haben. Vielen Dank für Ihre Unterstützung, Ermutigung und Begleitung. Wir werden die Fähigkeiten von „Tiangong SkyMusic“ weiter verbessern, um das Modell stärker zu machen . Die Fähigkeit zu verstehen und auszudrücken kann Benutzern ein besseres KI-Musikerlebnis bieten.

Abschließend werden wir in Kürze den Leitfaden zur Musikerstellung „Tiangong SkyMusic“ herausgeben und weitere KI-Musikdemos und Nutzungstechniken bereitstellen, um den kraftvollen Charme der KI-Musik mit Benutzern zu erkunden!

Über „Tiangong SkyMusic“ und „Tiangong 3.0“

Das große KI-Musikgenerationsmodell „Tiangong SkyMusic“ basiert auf dem supergroßen Modell von Kunlun Wanweis „Tiangong 3.0“. Am 17. April wird „Tiangong SkyMusic“ gleichzeitig mit „Tiangong 3.0“ die öffentliche Beta starten.

Anwendungswebseite: https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md „Tiangong 3.0“ übernimmt ein MoE-Hybrid-Expertenmodell mit 400 Milliarden Parametern und wählt gleichzeitig Open Source, das ist ein globales Modell. Eines der MoE-Modelle mit den größten Parametern und der stärksten Leistung. Im Vergleich zum MoE-Großmodell „Tiangong 2.0“ der vorherigen Generation weist „Tiangong 3.0“ erstaunliche Leistungsverbesserungen in Bereichen wie semantisches Verständnis des Modells, logisches Denken, Vielseitigkeit, Verallgemeinerung, Unsicherheitswissen und Lernfähigkeiten auf um mehr als 20 %, und seine mathematischen/logischen Denkfähigkeiten/Programmierfähigkeiten sowie seine kulturellen und kreativen Fähigkeiten sind um mehr als 30 % gestiegen. Gleichzeitig hat „Tiangong 3.0“ die Möglichkeit hinzugefügt, Sucherweiterungen, Recherchemodi, Aufrufcodes und das Zeichnen von Diagrammen, mehrfache Aufrufe von Online-Suchen usw. durchzuführen und die Agentenfähigkeiten des Modells gezielt zu trainieren dass „Tiangong 3.0“ externe Tools und Informationen unabhängig planen, aufrufen und kombinieren kann, um verschiedene komplexe Anforderungen wie Industrieanalysen und Produktvergleiche genau und effizient zu erfüllen und so ein neues, bahnbrechendes Erlebnis mit künstlicher Intelligenz zu schaffen.

„Tiangong SkyMusic“ ist derzeit das erste und einzige öffentlich verfügbare große KI-Musikgenerierungsmodell in China

Es übernimmt eine Sora-ähnliche Modellarchitektur im Musik-Audiobereich, und der Large-Scale Transformer ist für das Komponieren von Musik verantwortlich Erlernen Sie die Kontextabhängigkeiten der Musik-Patches-Beziehung und erreichen Sie gleichzeitig die Steuerbarkeit von Musik. Der Diffusion Transformer ist für das Singen und Wiederherstellen von Musik-Patches in hochwertiges Audio durch LDM verantwortlich, sodass „Tiangong SkyMusic“ die Erzeugung einer 80-Sekunden-Abtastrate von 44100 Hz unterstützen kann Zweikanal-Stereo-Songs. Diese Modellarchitektur funktioniert hervorragend in den Bereichen Video, Audio und Musik. Das Kunlun Wanwei-Team wird in Zukunft auch schrittweise iterieren und neue Funktionen hinzufügen, sodass das Modell über multimodale emotionale Verständnis- und Ausdrucksfähigkeiten verfügt.

Website der Testanwendung „Tiangong SkyMusic“: https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

„Tiangong SkyMusic“ hat die folgenden fünf Eigenschaften:

1. Hochwertige KI-Musik

„Tiangong SkyMusic“ kann Zweikanal-Stereo-KI-Songs mit einer Abtastrate von 80 Sekunden und einer Abtastrate von 44100 Hz generieren und entsprechende Songstile basierend auf dem vom Benutzer eingegebenen Textstil generieren.

2. Die menschliche Stimme ist „falsch und echt“

Die Stimmsynthese ist die wichtigste Dimension bei der KI-Musikerzeugung, die den Erzeugungseffekt und die Qualität am besten widerspiegelt. Die KI-Gesangssynthese von „Tiangong SkyMusic“ kann das höchste SOTA-Niveau der Branche erreichen und seine Chinesischkenntnisse sind extrem gut, mit klarer Aussprache und ohne ungewöhnliche Geräusche. Sein chinesischer Gesangseffekt ist deutlich besser als der ausländischer Produkte und liegt weltweit an der Spitze. 3. Steuerung von Textabsätzen .

4. Mehrere Musikstile

„Tiangong SkyMusic“ unterstützt Rap, Folk, Funk, alten Stil, elektronische und andere Musikstile, indem Benutzer den gewünschten Musikstil festlegen.

5. Intelligenter Ausdruck von Musik – Erlernen von Gesangsfähigkeiten

„Tiangong SkyMusic“ kann auch eine Vielzahl von Gesangsfähigkeiten wie Vibrato, Oper, Gesang, männliche und weibliche Duette, automatische Harmonie usw. erlernen Die von Benutzern erstellten Songs können einen passenderen emotionalen Ausdruck bieten.

Im Jahr 2023 hat Kunlun Wanwei, angetrieben von der Strategie „Alles in AGI und AIGC“, große Fortschritte auf dem Gebiet der künstlichen Intelligenz gemacht und nach und nach große KI-Modelle, KI-Suche, KI-Musik, KI-Animation und soziale KI entwickelt , KI-KI-Geschäftsmatrix wie Spiele. Derzeit hat Kunlun Wanwei ein umfassendes Set für KI-Suche, KI-Schreiben, KI-Langtextlesen, KI-Dialog, KI-Sprachsynthese, KI-Bildgenerierung, KI-Comic-Erstellung, KI-Bilderkennung, KI-Musikgenerierung, KI-Code-Schreiben erstellt. KI Das multimodale „Supermodell“ „Tiangong 3.0“, das mehrere Funktionen wie die Tabellengenerierung integriert, ist zu einem neuen Meilenstein in der KI-Branche geworden.

Das obige ist der detaillierte Inhalt vonDa Fälschungen wie echte aussehen, bietet das große Modell von Tiangong Music ein subversives KI-Erlebnis. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

架构人工智能 transformer https AIGC prompt agi

Stellungnahme：

Dieser Artikel ist reproduziert unter:jiqizhixin.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen

Vorheriger Artikel：Was ist generative KI? Welche Feature-Typen gibt es?Nächster Artikel：Was ist generative KI? Welche Feature-Typen gibt es?

In Verbindung stehende Artikel

Mehr sehen