Rumah > Artikel > Peranti teknologi > Pemilik Bilibili menggunakan analisis AI untuk mengetahui bahawa penyanyi-penyanyi ini menyegerakan bibir semasa konsert Malam Tahun Baru.
Kemahiran nyanyian dan timbre adalah kriteria penting untuk mengukur keupayaan penyanyi, tetapi penonton mempunyai pendapat yang berbeza tentang kemahiran menyanyi, bukan sahaja kerana pilihan mereka tidak cukup objektif, tetapi juga kerana mereka menghadapi penalaan dan lip-sync dari masa ke masa. kepada masa. Oleh itu, untuk masa yang lama, apabila membandingkan kemahiran nyanyian penyanyi yang berbeza, ia akan sentiasa menimbulkan kontroversi besar.
Semasa konsert secara langsung, tiada siapa yang boleh menyanyi dengan "sempurna" kerana dipisahkan dari persekitaran yang sempurna di studio rakaman Namun, dengan kemajuan teknologi, pada beberapa kesempatan, penyanyi Dia tahu bagaimana untuk menala dan menyegerakkan bibir, dan sejak itu berjuta-juta penala telah mengejeknya kerana membandingkannya dengan pemain CD manusia.
Memandangkan penalaan menggunakan cara teknikal yang lebih maju, tahap nyanyian sebenarnya harus dikira dan dibandingkan menggunakan cara teknikal. "Berpura-pura" yang tidak dapat didengari oleh telinga amatur adalah pucat di hadapan data.
Semalam, topik mengenal pasti penyegerakan bibir pada konsert Malam Tahun Baharu menduduki tempat pertama pada carian hangat Zhihu, dan seseorang melakukan penyelidikan menyeluruh menggunakan idea ini.
Pada 7 Januari, pemilik Station B Up, "Coder Gao Tian", seorang pengaturcara yang bekerja di Microsoft menganalisis rentas sempadan Semak padang daripada penyanyi di konsert tahunan untuk melihat siapa yang tidak selaras, saya juga menemui beberapa orang yang disyaki lip-sync.
Pautan: https://www.bilibili.com/video/BV123411m77L/
Sebagai sarjana teknikal Up, pengaturcara Gao Tian terutamanya tidak menilai tahap penyanyi, tetapi memperkenalkan kaedah analisis.
Mari kita lihat kaedah induk UP untuk mengenal pasti "penyegerakan bibir".
Mula-mula, memintas sepotong pendek bunyi asal yang dinyanyikan oleh penyanyi. Di sini, UP mengambil "Perang Songsang" Zhang Jie sebagai contoh, menggunakan perisian untuk memisahkan suara manusia untuk mengelakkan gangguan daripada alat muzik Spleeter digunakan di sini, dan di belakangnya adalah rangkaian saraf yang dibina dengan rangka kerja TensorFlow.
Alamat projek: https://github.com/deezer/spleeter
Kemudian gunakan perpustakaan pertuturan Python Parselmouth untuk melakukan analisis pic pada suara manusia.
Audio divisualisasikan sebagai plot berselerak:
UP Berdasarkan kekunci, tambahkan garis skala semula jadi lagu pada gambar Frekuensi yang sepadan dengan baris itu ialah sebutan yang tepat. Kebanyakan orang yang belum menerima latihan profesional sebenarnya tidak begitu sensitif terhadap nada (hanya Jay Chou dan Leehom Wang mempunyai nada mutlak), yang bermaksud bahawa tanpa tafsiran digital, sukar untuk mengetahui sama ada penyanyi itu menyanyi dengan tepat atau tidak. Selepas visualisasi, kesimpulannya jelas.
Intonasi Zhang Jie masih sangat bagus
Tetapi di sebaliknya hand , orang bukan mesin, mereka sentiasa ada pasang surut, dan sukar untuk mencapai kesempurnaan dalam nyanyian secara langsung (walaupun sesetengah penyanyi dinilai sebagai "makan CD"). Zhang Jie sudah boleh dianggap berada di peringkat teratas muzik Cina Juga pada tahap yang sama ialah Deng Ziqi, Sun Nan (tidak perlu menganalisis orang besar), Tan Weiwei, Zhou Shen, dll.
Deng Ziqi "Countdown"
Sun Nan "Jumpa atau Berpisah"
Tan Weiwei "Gunung dan Laut"
Zhou Shen "Cahaya"
Mengikut kaedah yang sama, hos UP menganalisis adegan Joker Xue dan membentangkan "rajah taburan":
Ini adalah "The Lonely Brave Man" yang dinyanyikan Xue Zhiqian tahun ini, yang telah dikritik oleh semua jenis orang...
Mengapa terdapat begitu banyak konsert malam tahun baru antaranya, nyanyiannya adalah yang paling teruk untuk didengari?
Sebabnya mudah sahaja, kerana orang yang menyanyi lebih teruk daripada dia nampaknya "lip-sync"...Ini seperti In the peperiksaan kelas, tahap Xue Zhiqian pada asalnya dalam julat pertengahan ke atas, tetapi kerana semua pelajar kecuali pelajar terbaik sebenar "menipu", dia hanya boleh mendapat ranking "terakhir".
Sudah tentu, kesimpulan ini tidak berasas, dan pemilik UP juga memberikan bukti.
Penyegerakan bibir boleh dibezakan sepenuhnya daripada bunyi. Pertama sekali, jika seseorang itu tidak mencari rezeki daripada menyanyi, tetapi persembahannya secara langsung adalah setanding atau lebih baik daripada penyanyi profesional, maka besar kemungkinan dia sedang lip-sync. Contohnya:
Ia juga merupakan "The Lonely Warrior", dan setiap nota artis tertentu tercatat dengan sempurna dan tepat pada baris.
Timbul persoalan menarik bagi seseorang yang tidak mencari rezeki dengan menyanyi, apakah kesan menyanyi?Bahan sebegini sepatutnya sangat berharga. Nasib baik, anda masih boleh menemui beberapa, seperti ini:
Pencetus. Kontroversi
Menganalisis penyanyi dengan ramai peminat di konsert secara semula jadi akan menimbulkan kontroversi. Pada 11 Januari, pengkod Gao Tian menyatakan dalam video kedua bahawa dia telah menerima satu lagi surat daripada seorang peguam yang membantah.
Video: https://www.bilibili.com/video/BV12Y411y7Hr/
Penulis mengatakan bahawa padang yang sempurna tidak dapat mencerminkan fakta bahawa adegan itu adalah bibir, kerana masih ada ruang untuk mengubah suai bunyi antara siaran tidak hidup dan video yang dilihat oleh orang. membetulkan bunyi, sesetengah orang tidak . Bunyi ini mungkin telah dirakam dan diubah suai di studio, dan kedudukan bibir yang betul di tempat kejadian ialah lip-sync; atau mungkin ia sebenarnya dinyanyikan secara langsung dan kemudian diubah suai selepas menyanyi. Ini juga bermakna terdapat ketidakadilan dalam pengubahsuaian nada malah penyegerakan bibir merendahkan ambang penyanyi, menyukarkan pendengar biasa untuk membuat perbandingan. Bagi kami, walaupun setiap orang mempunyai pilihan yang berbeza untuk gaya penyanyi, sekurang-kurangnya mereka mempunyai cita-cita nyanyian yang sama Daripada analisis ini, kami dapat melihat perbezaan dalam kemahiran menyanyi. Tidak kira apa jenis penyanyi atau betapa sukarnya lagu itu, pada dasarnya mustahil untuk mengekalkan nada yang sempurna selama 5 minit di stadium yang besar. Apabila fenomena "nada sempurna" menjadi semakin biasa, adakah kita juga kehilangan lebih banyak peluang untuk menghargai daya tarikan secara langsung?
Atas ialah kandungan terperinci Pemilik Bilibili menggunakan analisis AI untuk mengetahui bahawa penyanyi-penyanyi ini menyegerakan bibir semasa konsert Malam Tahun Baru.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!