Maison > Article > Périphériques technologiques > Le propriétaire de Bilibili a utilisé l’analyse de l’IA pour découvrir que ces chanteurs se sont synchronisés sur les lèvres pendant le concert du réveillon du Nouvel An.
Les compétences en chant et le timbre sont des critères importants pour mesurer les capacités d'un chanteur, mais l'évaluation des compétences en chant par le public a des opinions différentes, non seulement parce que leurs préférences ne sont pas assez objectives, mais aussi parce qu'ils rencontrent de temps en temps un accordage et une synchronisation labiale. . Par conséquent, pendant longtemps, lorsqu’il s’agira de comparer les compétences de chant de différents chanteurs, cela suscitera toujours une énorme controverse.
Lors d'un concert en direct, personne ne peut chanter « parfaitement » car il est séparé de l'environnement parfait du studio d'enregistrement. Cependant, avec les progrès de la technologie, les chanteurs choisissent parfois de s'accorder et de se synchroniser sur les lèvres. Depuis lors, des millions de tuners se sont moqués des lecteurs de CD humains.
L'accordage faisant appel à des moyens techniques de plus en plus avancés, le niveau de chant devrait effectivement pouvoir être quantifié et comparé à l'aide de moyens techniques. Ces « semblants » inaudibles pour les oreilles amateurs pâlissent devant les données.
Hier, le sujet de l'identification de la synchronisation labiale lors des concerts du réveillon du Nouvel An s'est classé en premier dans la recherche la plus recherchée de Zhihu, et quelqu'un a fait une recherche approfondie en utilisant cette idée.
Le 7 janvier, le propriétaire de Bilibili Up, "Coder Gao Tian", un programmeur qui travaille chez Microsoft, a utilisé un programme pour analyser le ton des chanteurs lors du concert du réveillon du Nouvel An afin de voir qui était désaccordé. Au fait, j’ai aussi trouvé des personnes soupçonnées de synchronisation labiale.
Lien : https://www.bilibili.com/video/BV123411m77L/
En tant que maître technique de l'Up, le codeur Gao Tian n'a principalement pas évalué le niveau du chanteur, mais a présenté l'analyse méthode.
Jetons un coup d'œil à la méthode du maître UP pour identifier la « synchronisation labiale ».
Tout d'abord, interceptez un court morceau du son original chanté par le chanteur. Ici, UP prend comme exemple "Reverse War" de Zhang Jie, utilisant un logiciel pour séparer les voix humaines afin d'éviter les interférences des instruments de musique. Le spleeter est utilisé ici, et derrière lui se trouve un réseau neuronal construit avec le framework TensorFlow.
Adresse du projet : https://github.com/deezer/spleeter
Utilisez ensuite la bibliothèque vocale Python Fourcheslmouth pour analyser la hauteur de la voix humaine.
L'audio est visualisé sous forme de nuage de points :
UP En fonction de la tonalité, ajoutez la ligne diatonique de la chanson au graphique, et la fréquence correspondant à la ligne est la ainsi -appelé précision prononcer. La plupart des personnes qui n'ont pas reçu de formation professionnelle ne sont en réalité pas très sensibles à la hauteur (seuls Jay Chou et Leehom Wang ont une hauteur absolue), ce qui signifie que sans interprétation numérique, il est difficile de dire si le chanteur chante avec précision ou non. Après visualisation, la conclusion est claire.
Le pitch de Zhang Jie est toujours très bon
Mais d'un autre côté, les gens ne sont pas des machines, il y a toujours des hauts et des bas dans le statut, et il est difficile d'atteindre la perfection dans le chant live (même si certains chanteurs sont évalués pour "manger des CD"). Zhang Jie peut déjà être considéré comme étant au plus haut niveau de la scène musicale chinoise. Au même niveau se trouvent également Deng Ziqi, Sun Nan (pas besoin d'analyser les grands), Tan Weiwei, Zhou Shen, etc.
Deng Ziqi "Compte à rebours"
Sun Nan "À bientôt ou se séparer"
Tan Weiwei "Montagnes et mer "
La "Lumière" de Zhou Shen
En entendant ces noms et en voyant leurs tableaux d'analyse de pitch, vous pourrez peut-être également comprendre pourquoi ces personnes peuvent représenter le plus haut niveau du Scène musicale chinoise.
En suivant la même méthode, l'animateur de UP a analysé la scène de Xue Zhiqian et a présenté un "nuage de points" :
C'est "The Lonely Warrior" que Xue Zhiqian a chanté cette année, qui a été critiqué par toutes sortes de gens…
Pourquoi sa performance est-elle la pire parmi tant de concerts du réveillon du Nouvel An ?
La raison est simple, parce que les gens qui chantent moins bien que lui semblent "synchroniser les lèvres"...
C'est comme un examen de classe, le niveau de Xue Zhiqian est à l'origine au-dessus de la moyenne, mais depuis tout. les étudiants, à l'exception des vrais meilleurs étudiants, ont "trompé", il n'a pu obtenir que le "dernier" classement.
Bien sûr, cette conclusion n'est pas sans fondement, et le propriétaire de l'UP a également témoigné.
La synchronisation labiale peut être complètement distinguée du son. Tout d’abord, si une personne ne vit pas du chant, mais que sa performance live est comparable, voire meilleure, à celle d’un chanteur professionnel, il est alors très probable qu’elle fasse de la synchronisation labiale. Par exemple :
C'est aussi "The Lonely Warrior", et chaque note d'un certain artiste tombe parfaitement et avec précision.
Alors une question intéressante se pose. Pour une personne qui ne gagne pas sa vie en chantant, quel est l'effet du chant ?
Un tel matériel devrait être très précieux. Heureusement, vous pouvez encore en trouver, comme celui-ci :
Analyser un chanteur avec de nombreux fans lors d'un concert suscitera naturellement la controverse. Le 11 janvier, le codeur Gao Tian a déclaré dans la deuxième vidéo qu'il avait reçu une autre lettre d'un avocat protestant.
Vidéo : https://www.bilibili.com/video/BV12Y411y7Hr/
L'auteur a déclaré que le pitch parfait ne peut pas refléter avec précision que la scène est une synchronisation labiale, car la scène et les gens ne sont pas diffusés en direct. J'ai vu qu'il y avait encore de la place pour la correction audio entre les vidéos, même si certaines personnes l'ont fait et d'autres non.
Ce son a peut-être été enregistré et modifié en studio, et la position correcte des lèvres sur place était une synchronisation labiale ; ou il se peut qu'il ait été chanté en direct puis modifié après avoir chanté.
Cela signifie également qu'il y a une injustice. La modification de la hauteur de ton et même la synchronisation labiale abaissent le seuil des chanteurs, ce qui rend difficile la comparaison pour les auditeurs ordinaires. Pour nous, même si chacun a des préférences différentes en matière de styles de chanteur, au moins ils ont la même quête du vrai chant. Cette analyse nous permet de voir les différences dans les compétences en chant.
Peu importe le type de chanteur ou la difficulté de la chanson, il est fondamentalement impossible de maintenir un pitch parfait pendant 5 minutes dans un grand stade. Alors que le phénomène du « pitch parfait » devient de plus en plus courant, avons-nous également perdu davantage d’opportunités d’apprécier le charme du live ?
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!