ホームページ > 記事 > テクノロジー周辺機器 > Bilibili のオーナーは AI 分析を使用して、これらの歌手が大晦日のコンサート中に口パクしていたことを発見しました。
歌唱スキルと音色は、歌手の能力を測定するための重要な基準ですが、聴衆は歌のスキルについてさまざまな意見を持っています。これは、好みが十分に客観的ではないだけでなく、時間の経過とともにチューニングや口パクに遭遇するためでもあります時間に。したがって、長い間、さまざまな歌手の歌唱力を比較することになると、常に大きな論争を引き起こします。
ライブコンサート中、レコーディングスタジオの完璧な環境から離れているため、誰も「完璧に」歌うことはできません。彼はチューニングとリップシンクの方法を知っており、それ以来、何百万ものチューナーが彼を人間の CD プレーヤーと比較して嘲笑しました。
チューニングにはますます高度な技術的手段が使用されるため、実際には歌唱レベルを数値化し、技術的手段を使用して比較する必要があります。素人の耳には聞こえないその「ふり」も、データの前では青ざめてしまう。
昨日、大晦日のコンサートでの口パクの特定に関するトピックが Zhihu のホット検索リストで 1 位になりました。誰かがこのアイデアを使用して徹底的な調査を行いました。
1 月 7 日、Station B Up のオーナーであるマイクロソフト社のプログラマー「コーダー ガオ ティアン」が国境を越えたピッチを分析しました。ちなみに、口パクの疑いのある人も何人か見つけました。
リンク: https://www.bilibili.com/video/BV123411m77L/ ##テクニカルアップの達人として、プログラマーのGao Tianは主に歌手のレベルを評価するのではなく、分析方法を紹介しました。
口パクしているのは誰ですか?
UP による「口パク」を見分ける方法を見てみましょう。まず、歌手が歌うオリジナルのサウンドの短い部分を傍受します。ここでは、UP は Zhang Jie の「Reverse War」を例として、楽器からの干渉を避けるために人間の声を分離するソフトウェアを使用しています。ここではスプリーターが使用されており、その背後には TensorFlow フレームワークで構築されたニューラル ネットワークがあります。
プロジェクトアドレス: https://github.com/deezer/spleeter
次に、Python 音声ライブラリ Parselmouth を使用して、人間の声のピッチ分析を実行します。
#オーディオは散布図として視覚化されます:
UP キーを元に、曲の自然な音階線を画像に追加し、その線に対応する周波数がいわゆる正確な発音となります。専門的な訓練を受けていない人のほとんどは、実際には音程にそこまで敏感ではありません (絶対音感を持っているのは周杰倫と王李棠だけです)。つまり、デジタル解釈がなければ、歌手が正確に歌っているかどうかを判断するのは困難です。視覚化すると、結論は明らかです。
張潔のイントネーションは相変わらずとても良いです
しかしその一方で、手、人間は機械ではありません、常に浮き沈みがあり、生歌で完璧を達成することは困難です(たとえ「CDを食べる」と評価される歌手もいます)。 Zhang Jieはすでに中国の音楽シーンのトップレベルにあると考えられますが、Deng Ziqi、Sun Nan(大物を分析する必要はありません)、Tan Weiwei、Zhou Shenなども同じレベルにいます。
Deng Ziqi の「カウントダウン」 ##スン・ナンの「会うか別れるか」 ## タン・ウェイウェイ「山と海」 ## ジョウ・シェン「光」 これらの名前を聞いてピッチ分析チャートを見れば、なぜ彼らが中国の音楽シーンのトップレベルを代表できるのかがわかるかもしれません。 同じ方法に従って、UP ホストはジョーカー シュエのシーンを分析し、「散布図」を提示しました。 なぜそうなるのか大晦日のコンサートはたくさんありますが、その中でも彼の歌は聴くのに最悪ですか? 理由は簡単です。彼より歌が下手な人は「口パク」しているように見えるからです... これは、クラス分け試験では、Xue Zhiqian のレベルはもともと中位から上位の範囲にありましたが、本物のトップ生徒以外の生徒全員が「カンニング」したため、彼は「最下位」の順位しか獲得できませんでした。 もちろん、この結論は根拠がないわけではなく、UP主も証拠を示しています。 リップシンクは音から完全に区別できます。まず、歌で生計を立てていない人でも、ライブパフォーマンスがプロの歌手と同等かそれ以上である場合、その人は口パクである可能性が非常に高くなります。例:
これは「The Lonely Warrior」でもあり、特定のアーティストのすべての音符が完璧かつ正確に一致しています。 そこで興味深い質問が生まれますが、歌で生計を立てていない人にとって、歌うことの効果は何でしょうか? このような資料は非常に貴重なはずですが、幸いなことに、次のような資料はまだ見つかります:
トリガー論争
ビデオ: https://www.bilibili.com/video/BV12Y411y7Hr/ ##著者は、生放送以外のシーンと人々が見るビデオの間には音を修正する余地がまだあるため、絶対音感はそのシーンが口パクであるという事実を正確に反映することはできないと述べました。音声を修正しましたが、修正していない人もいます。 この音はスタジオで録音して修正したもので、その場で口パクしたのかもしれないし、あるいは実際に生で歌って歌い終わった後に修正したのかもしれない。 これは不公平を意味しており、ピッチ修正や口パクさえも歌手の敷居を下げており、一般のリスナーが比較することは困難です。私たちにとって、歌手のスタイルの好みは人それぞれですが、少なくとも真の歌唱を追求する点は同じであり、この分析から、歌唱スキルの違いがわかります。 あなたがどんな歌手であっても、曲の難易度がどんなに高くても、大規模な演奏で 5 分間絶対音感を維持することは基本的に不可能です。スタジアム。 「絶対音感」という現象が一般的になるにつれて、私たちはライブの魅力を味わう機会も減ってしまったのではないでしょうか? コンサートで多くのファンを持つ歌手を分析すると、当然のことながら論争が起こります。 1月11日、プログラマーのガオ・ティエン氏は2本目のビデオで、弁護士から抗議の別の手紙を受け取ったと述べた。
以上がBilibili のオーナーは AI 分析を使用して、これらの歌手が大晦日のコンサート中に口パクしていたことを発見しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。