ホームページ >テクノロジー周辺機器 >AI >Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

WBOY
WBOY転載
2023-04-09 23:51:041591ブラウズ

7月3日の夜、DouyinはユニバーサルミュージックのレーベルPolyGramと協力して、火山エンジンによって超鮮明に復元されたBeyond Live 1991ライフコンタクトコンサートと記念コンサートの厳選されたコンテンツをライブブロードキャストし、注目を集めました。 1.4億回以上の再生回数。

Beyond は 1983 年に設立されたロック バンドです。広東音楽の隆盛とともに、Beyond バンドの名前は時代の文化的な痕跡となりました。 「Beyond Live 1991」は、Beyond が紅磡競技場で開催した最初のコンサートで、その後ポリグラムからリリースされた DVD は 1990 年代にはほとんど入手困難でした。以来 31 年が経ち、このコンサートは何世代にもわたるファンの音楽的啓蒙と青春の思い出となっています。

当時の撮影機材、記憶媒体、録​​音機器の技術の制限により、インターネット上で流通したコンサートマスターテープやさまざまなバージョンの音声や映像の品質は低かった。視聴体験を向上させ、クラシックな Beyond を再現するために、Volcano Engine は画質と音質の点で復元されました。

火山エンジン マルチメディア研究所によると、初期のソフトウェアとハ​​ードウェア機器は後進的であり、その結果、制作、圧縮、送信中にぼやけた画像、テクスチャの損失、ノイズ欠陥などの問題が発生しました。映画の。可能な限り細部を復元しながら画質を向上させ、色の最適化とレトロな雰囲気を維持し、さまざまなサイズや姿勢のポートレートの復元効果を調整することが、この復元の難しさです。

「私たちの目標は、全体的な画像の鮮明さ、顔の特徴の復元、色の明るさ、流暢さ、美しさの点で画質を向上させることです。」 画質に関しては、この本は次のとおりです。 2 番目の修復では、明瞭度向上、欠陥修復、局所的な色の明るさ向上などのアルゴリズムを使用して、初期段階で旧バージョンのソフトウェアおよびハードウェア機器によって引き起こされる問題に対処します。ビデオ解像度は 540p 未満から 4K レベル近くまで向上し、フレーム レートは 25fps から 60fps に向上しました。

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

ポートレート強化アルゴリズムにより、Huang Jiaju の顔のアイライン、毛穴、その他の細部がはっきりと見えます

さらに、Volcano Engine Multimedia Laboratory は、顔の圧縮損傷、ぼやけ、低解像度などの問題を修復および強化するための自己適応型ポートレート強化アルゴリズムも開発しています。この技術はディープラーニングに基づいており、顔全体のぼやけや圧縮ダメージを除去するだけでなく、顔の主要な特徴を詳細に再構築します。修復後は、キャラクターの顔のひげや毛穴がはっきりと見えるようになり、視聴者により良い視覚体験を提供します。

音質修復の観点から、Volcano Engine オーディオ テクノロジー チームは、オーディオ ノイズ リダクション、オーディオ超解像度、およびラウドネス アルゴリズムを使用して、ノイズを除去し、音質を向上させ、次のような問題を解決します。音量、ノイズ干渉、帯域幅不足。

従来のノイズリダクションソリューションとは異なり、音楽シーンやボーカルシーンに対応したAIノイズリダクションアルゴリズムを実装したノイズリダクションアルゴリズムで、音楽やボーカルを残すことを前提に周囲の騒音を抑制します。オーディオ超解像アルゴリズムは、コンサートのボーカル部分の周波数帯域を拡張し、高周波情報を豊かにし、ボーカルをよりクリアにします。スペクトログラムからは、超解像モジュールの処理により、元の音声の高周波部分が拡張され強化されていることがわかります。

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

音声超解像アルゴリズムの処理により、オリジナルの音声が再生されます。 12kHz以上 音声情報はある程度完成し修復されています

コンサートの集音条件の違いにより、コンサート中の歌声が乱れることがあります。楽器の音や環境音に比べて小さすぎるため、Volcano Engine オーディオ テクノロジー チームは、ラウドネス アルゴリズムを使用して、最初に歌っている部分を個別に抽出し、次に歌っている部分の音量を調整し、最後にそれをミックスして全体的な人間のサウンドを作成します。声がもっと快適に。

コンサートのこれらの復元機能は、Volcano Engine インテリジェント処理およびオーディオ技術製品を通じて外部の世界に提供されていることがわかります。さらに、Volcano Engine は、アップロード、トランスコーディング、送信、消費、その他のリンクをカバーする、画質に関するフルリンクのエンドツーエンド ソリューションを外部に公開し、ビデオ コンテンツの総合的な最適化を実現します。画質、ビットレート、エクスペリエンス。

デジタルテクノロジーは文化継承を推進する原動力になりつつあります。関連報道によると、2021年10月にXigua VideoとVolcano Engineは「クラシックビデオ4K復元計画」を立ち上げ、技術的手段を通じて合計71点の古典漫画が復元されたとのこと。復元されたコンテンツはXigua VideoとFreshで無料でダウンロードできるタイムテレビウォッチ。

Volcano Engine の担当者は、将来的には、より高度な技術を使用して古典的な画像を復元し、新たな生命を吹き込むだろうと述べています。



#

以上がVolcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。