Maison  >  Article  >  Périphériques technologiques  >  Le faux ressemble au vrai, le grand modèle de Tiangong Music apporte une expérience d'IA subversive

Le faux ressemble au vrai, le grand modèle de Tiangong Music apporte une expérience d'IA subversive

王林
王林avant
2024-04-03 21:25:102383parcourir

Hier, le modèle de génération de musique IA à grande échelle de Kunlun Wanwei, « Tiangong SkyMusic », a lancé un événement de test bêta gratuit. Les médias, les experts de l'industrie et les praticiens de la musique intéressés sont sincèrement invités à découvrir les produits de modèles musicaux de SOTA. Ce produit permet aux utilisateurs de vivre une expérience immersive tout en expérimentant ensemble l’expression émotionnelle des voix humaines.

Après le début du test d'invitation, la majorité des utilisateurs ont des attentes élevées à l'égard du grand modèle de génération de musique AI « Tiangong SkyMusic ». Le personnel a reçu des centaines de milliers de candidatures de test en très peu de temps, parmi lesquelles de nombreux créateurs de musique professionnels, experts des médias et de l'industrie. Dans le même temps, un grand nombre d’applications de test sont envoyées en permanence au backend. Parmi les applications, il existe de nombreux créateurs de musique professionnels, experts des médias et de l'industrie, ainsi qu'un grand nombre d'applications de test qui doivent être continuellement examinées et examinées. Parmi les candidats figurent de nombreux créateurs de musique professionnels, experts des médias et de l'industrie, qui ont continué à fournir de précieux commentaires et opinions pendant le processus de test.

Dans le même temps, nous avons également reçu de nombreux commentaires réels et des éloges de la part des utilisateurs. :

"Le chant est très clair et la mélodie lyrique est bonne"

"Ça sonne bien!"

"C'est fait par le ciel ?? C'est incroyable!" "Wukong" est chanté avec une sensation de souffle et les émotions sont au rendez-vous. Il représente fondamentalement le summum de la capacité à générer des émotions et à les rendre réelles. "

"Tiangong SkyMusic me surpasse dans les compétences de chant aigu. Imaginez. , très bien. "

"C'est tellement puissant. 1. La base d'utilisateurs de musique AI est très large ; "La partie du refrain est en soie Slippery, le rythme est tellement bon"

"Je ne m'attendais pas à ce que l'équipe chinoise puisse faire mieux que les étrangères"

La génération de musique par l'IA utilisateur fonctionne

Les retours enthousiastes de la majorité des utilisateurs nous ont permis de voir la réponse de l'industrie à « Heaven ». Les attentes élevées envers le grand modèle de génération de musique AI « SkyMusic » nous permettent également de voir l'importance de « l'AGI émotionnelle » dans le sens de l'exploration de Grands modèles AGI axés sur "l'intelligence".

Comparé au texte et aux images, le contenu audio est le meilleur moyen de comprendre les émotions humaines, et la musique est le support de contenu qui exprime le plus abondamment les émotions humaines et n'est pas limité par la géographie et la culture, peu importe les temps changeants, qu'il s'agisse de guerre. En cas de catastrophe, les gens peuvent toujours exprimer leurs sentiments et obtenir un réconfort émotionnel grâce à la musique. C'est l'intention originale de "Tiangong SkyMusic" et aussi une direction importante que Kunlun Wanwei Emotional AGI continue d'explorer.

Nous remercions tous les utilisateurs qui ont participé activement et ont donné des commentaires enthousiastes. Merci pour votre soutien, vos encouragements et votre camaraderie. Nous continuerons à itérer, optimiser et élargir les capacités de "Tiangong SkyMusic" pour que le modèle ait des émotions multimodales plus fortes. La capacité de comprendre et d'exprimer peut offrir aux utilisateurs une meilleure expérience musicale IA. Le faux ressemble au vrai, le grand modèle de Tiangong Music apporte une expérience dIA subversiveEnfin, nous publierons bientôt le guide de création musicale « Tiangong SkyMusic » et fournirons davantage de démos de musique IA et de techniques d'utilisation, afin d'explorer le charme puissant de la musique IA avec les utilisateurs !

À propos de "Tiangong SkyMusic" et "Tiangong 3.0"

Le grand modèle de génération de musique AI "Tiangong SkyMusic" est basé sur le très grand modèle de "Tiangong 3.0" de Kunlun Wanwei. Le 17 avril, "Tiangong SkyMusic" ouvrira une version bêta publique en même temps que "Tiangong 3.0".

Page Web de l'application : https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md"Tiangong 3.0" adopte un modèle expert hybride MoE de 400 milliards de paramètres et choisira simultanément l'open source, qui est un modèle global L'un des modèles MoE avec les paramètres les plus importants et les performances les plus élevées. Par rapport au grand modèle MoE de la génération précédente « Tiangong 2.0 », « Tiangong 3.0 » présente des améliorations de performances étonnantes dans des domaines tels que la compréhension sémantique du modèle, le raisonnement logique, la polyvalence, la généralisation, la connaissance de l'incertitude et les capacités d'apprentissage. Sa capacité de connaissance technique du modèle a augmenté. de plus de 20 %, et ses capacités mathématiques/raisonnement/codage/culturelles et créatives ont augmenté de plus de 30 %. Dans le même temps, "Tiangong 3.0" a ajouté la possibilité de rechercher des améliorations, des modes de recherche, des codes d'appel et de dessiner des graphiques, d'appeler plusieurs fois des recherches en ligne, etc., et a formé les capacités d'agent du modèle de manière ciblée. que « Tiangong 3.0 » peut compléter indépendamment la planification, l'appel et la combinaison d'outils et d'informations externes pour répondre avec précision et efficacité à divers besoins complexes tels que l'analyse industrielle et la comparaison de produits, apportant une nouvelle expérience d'intelligence artificielle perturbatrice.

« Tiangong SkyMusic » est actuellement le premier et le seul grand modèle de génération de musique IA accessible au public en Chine Il adopte une architecture de modèle de type Sora dans le domaine audio musical, et le transformateur à grande échelle est responsable de la composition musicale. apprendre les dépendances contextuelles de la relation entre les patchs musicaux, tout en obtenant la contrôlabilité de la musique ; Diffusion Transformer est responsable du chant et de la restauration des patchs musicaux en audio de haute qualité via LDM, afin que « Tiangong SkyMusic » puisse prendre en charge la génération d'un taux d'échantillonnage de 80 secondes à 44 100 Hz. chansons stéréo à deux canaux. Cette architecture modèle fonctionne extrêmement bien dans les domaines de la vidéo, de l'audio et de la musique. L'équipe de Kunlun Wanwei itérera également progressivement et ajoutera de nouvelles capacités à l'avenir, afin que le modèle dispose de capacités de compréhension et d'expression émotionnelles multimodales.

Site Web de l'application de test « Tiangong SkyMusic » : https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md

« Tiangong SkyMusic » présente les cinq caractéristiques suivantes :

1. « Tiangong SkyMusic » peut générer des chansons AI stéréo à deux canaux d'une fréquence d'échantillonnage de 80 secondes à 44 100 Hz, et peut générer des styles de chansons correspondants en fonction du style de paroles saisi par l'utilisateur.

2. La voix humaine est « fausse et réelle »

La synthèse vocale est la dimension la plus importante dans la génération de musique IA qui reflète le mieux l'effet et la qualité de la génération. La synthèse vocale IA de « Tiangong SkyMusic » peut atteindre le niveau SOTA le plus élevé de l'industrie, et sa maîtrise du chinois est extrêmement bonne, avec une prononciation claire et aucun bruit anormal. Son effet de chant chinois est nettement meilleur que celui des produits étrangers, en tête du niveau mondial.

3. Contrôle des paragraphes de paroles

"Tiangong SkyMusic" peut contrôler les chansons à travers les paroles, de sorte que les chansons générées puissent clairement distinguer les changements émotionnels des différents paragraphes de paroles, reflétant les différences entre la chanson principale et le refrain, l'intro et les paragraphes de la chanson principale. .

4. Plusieurs styles de musique

"Tiangong SkyMusic" prend en charge le rap, le folk, le funk, le style ancien, l'électronique et d'autres styles de musique. Lors de la création de musique, les utilisateurs peuvent définir le style de musique souhaité en se référant à l'audio.

5. Expression intelligente de la musique - apprentissage des compétences en chant

"Tiangong SkyMusic" peut également apprendre une variété de compétences en chant telles que le vibrato, l'opéra, le chant, les duos masculins et féminins, l'harmonie automatique, etc. les chansons créées par les utilisateurs peuvent constituer une expression émotionnelle plus appropriée.

En 2023, porté par la stratégie « All in AGI et AIGC », Kunlun Wanwei a fait de nombreux progrès dans le domaine de l'intelligence artificielle, formant progressivement des grands modèles d'IA, la recherche d'IA, la musique d'IA, l'animation d'IA, l'IA sociale , Matrice commerciale AI AI telle que les jeux.

Actuellement, Kunlun Wanwei a créé un ensemble complet de recherche IA, d'écriture IA, de lecture de textes longs IA, de dialogue IA, de synthèse vocale IA, de génération d'images IA, de création de bandes dessinées IA, de reconnaissance d'images IA, de génération de musique IA, d'écriture de code IA, IA Le « Super Modèle » multimodal « Tiangong 3.0 » qui intègre plusieurs capacités telles que la génération de tables est devenu une nouvelle étape dans l'industrie de l'IA.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer