ホームページ >テクノロジー周辺機器 >AI >Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?
著者|蘇暁瑠
AIGC は非常に人気がありますが、メタバースは忘れられてしまったのでしょうか?
Apple の新しい AR メガネ Vision Pro (価格 24,000 元) のリリースにより、しばらく休眠状態にあった AR と VR が再び注目の的となっています。
AR と VR の準備を最初に行い、再び興奮するのは誰ですか?もちろん、バーチャルピープルやデジタルピープルを作っている一連の会社です。バーチャルヒューマン技術は、エンターテインメントと非常に密接に融合した技術です。初期のメタバースの概念と現在の AIGC 時代では、バーチャル ヒューマンにはホット スポットと統合できる場所が数多くあります。
AIGC構想と合わせて、今年上半期の業界最大のテーマとなる。今月初めには、ネット有名人「フォレスト・ハンゾー」のデジタルクローンが公開され、ユーザーは月単位や年単位で音声や通話などのサービスを楽しめるようになる。 AI が人間のドライバーに取って代わるため、デジタル ヒューマンは 24 時間 365 日働くことができ、生産能力が大幅に向上します。
ここで説明するライブ ブロードキャスト プロセスは、現実の人々、つまり仮想人物の「伝統的なジャンル」の 1 つである「中間の人々」のパフォーマンスによって駆動されます。完全にプログラムまたは AI によって駆動される人工知能の継続的な進化に伴い、適応ベースで質問と回答を提供することが、バーチャル ヒューマン産業のもう 1 つの主要な発展方向となっています。
AI バーチャル ヒューマンを実現するための技術的ルートは、現在 2 つのタイプに分かれています。1 つは大規模なモデルを民営化して展開する方法、もう 1 つは既存のオープンソース モデルに基づいてターゲットを絞った二次開発を行う方法です。
表 1 この記事でインタビューしたバーチャル ヒューマン企業 3 社のタイプ分類 集計/エンターテイメント キャピタリズム
この記事では、Entertainment Capitalism が 3 人の典型的なバーチャル ヒューマン テクノロジー開発者を紹介し、AI が製品開発とビジネス モデルにもたらした変化を探ります。
AIGC バーチャル コンテンツ プラットフォーム Yunbo は、ライブ配信者向けの「Little K Live Broadcaster」をキャリアとして使用し、ゲーム的な方法でディープなライブ ブロードキャスト エコシステムを探索および構築します。
Zhongke Shenzhi は、エンドツーエンドの生成 AI バーチャル ヒューマン テクノロジーに焦点を当てており、販売業者向けの商品の「自動ブロードキャスト」に焦点を当てており、バーチャル ヒューマンの質疑応答の効果を大幅に向上させる独自の大型モデルをリリースしました。交流; ###クロスモーダル インテリジェント ソフトウェア サービス会社 Mejike は、企業に完全自動の仮想アンカーを提供するだけでなく、企業の内部データを使用して独自のモデルをトレーニングし、企業の内部データベースと検索エンジンを育成します。
AIGC を開く 4 つの方法
「基礎となるアルゴリズムを構築し、プライベート トレーニング データ セットを用意するのに 3 年かかりました。そして、この製品は初期の結果を達成しました。」
2017 年、メイ ソンは Linekong Interactive Game のプロデューサーの職を辞し、人工知能業界に参入し、Xiao K Live Ji の開発者である Yunbo Technology を設立しました。ゲーム業界と AI 業界という二重の背景も、ユンボのビジネス モデルを非常にユニークなものにしています。
Entertainment Capital による AI マッピング「当社の事業範囲は、ToB と ToC の両方をカバーしています。製品には、Xiao K AI モーション キャプチャ、AI 描画、バーチャル ヒューマン エンジンなどが含まれます。また、自主運営の MCN ギルドとアンカー ベースもあります。また、同社はまた、電子商取引の 3 つの核となるシナリオであるライブ ブロードキャストとゲームに直面し、企業に仮想人物と仮想コンテンツ サービスを提供します。」
Zhongke GenSense は、エンドツーエンドの生成 AI バーチャル ヒューマン テクノロジーに注力しており、5 月 10 日に「GenSense Digital Intelligence Jiang Shang」と呼ばれる独自の大型モデルを正式にリリースしました。
「Open AI がトレーニング方法を発表して以来、大規模モデルへの参入の難易度は低くなりました。企業が独自の大規模モデルを構築したいかどうかは、主に大規模モデルの商業スペースによって決まります。」 の創設者兼 CEO Zhongke Shenzhi Cheng Wei Zhong氏は言いました。 「2020 年の初めに、Transformer に基づいたクロスモーダル トレーニング作業を開始し、データ クリーニングの経験もあります。」
「私たちは大規模なモデルを構築するために主に 2 つの側面に焦点を当てています。まず、将来のマルチモーダル トレーニングは大規模な言語モデルに基づくことになり、垂直分野の基礎となるアルゴリズムは大規模なモデルに依存する必要があります。第 2 に、多くの顧客が提案していることです。 「民営化された展開です。これは、計算能力を削減する必要があります。他の大きなモデルが接続されている場合、ソース コードとデータ セットを取得できなくなります。」
中科深志の事業範囲には、バーチャル生放送、デジタル従業員などに加え、金融、医療、政府、大企業向けのBサイド民営化展開事業も含まれます。同社のバーチャルヒューマンリアルタイムインタラクションおよび応答システム「Yun Xiaoqi」、Yuanverseの電子商取引およびバーチャルヒューマンライブブロードキャストツール「Treasure Box Auto Broadcast & Virtual Assist Broadcast」、およびAI高速アニメーション生成システム「AutomaticAnimation」 』がすべて発売されました。
現在、中科深志の「自動ブロードキャスト」顧客は、天猫、淘宝網、JD.comなどのプラットフォームでAIバーチャルヒューマンを使用しているミドルウエストブランド販売者の70%以上を占めています。彼らは最近、現実の人物と仮想の人物を同時に登場させることができる仮想アシスタント製品を発売しました。
「私たちの目標は、エンドツーエンドの仮想人間作品を作成することです。ユーザーがテキストを入力すると、それは直接かつ自動的に 3D キャラクターにモデリングされ、アクション表現をリアルタイムで生成してコンテンツ出力を形成できます。 Cheng Weizhong 氏は、企業にフルリンク ソリューションを提供する必要があると指摘しました。
Maijike Technology が自らに与えたラベルは「クロスモーダル」です。同社はインテリジェント デジタル アセットとインテリジェント生成の分野に焦点を当てています。その主な製品は、インテリジェント コンテンツ制作、インテリジェントな仮想ライブ ブロードキャスト、および数千人向けのパーソナライズされたインテリジェンスです。インタラクション、そして最近中関村フォーラムで発表された新製品であるデジタル インテリジェンス宇宙ステーションと同様に、3 次元、リアルタイム、インテリジェンスがそのハイライトです。
創業者兼会長のフー・インナ氏によると、舞池科技は2016年にはAIGC分野に参入し始めたという。
「私たちはデータ コーパスの手動調整を使用しませんが、非構造化テクノロジーに基づいてデータを構築します。たとえば、企業内のさまざまなデータ ドキュメントを階層的に処理し、企業向けのクロスモーダル検索エンジンを構築し、企業向けの検索エンジンを構築することができます。データ インテリジェント コンテンツを生成し、簡単に操作できます。」
企業向けに民営化展開を行っている企業は数多くありますが、中小企業が大規模モデルを構築するのは困難です。フー・インナ氏は、彼らの堀はオープンソースの大規模モデルに基づく組み合わせイノベーションにあると信じています。」 「アルゴリズムとモデルは並列または直列に適用できます。」の組み合わせ。舞地家テクノロジーの基盤技術は階層型アルゴリズムです。このようなアルゴリズムの組み合わせは、低計算能力を必要とし、低コストかつ高効率で構築できます。小さなリソースに基づいて反復されます。データをサンプリングし、最終的には進化可能なインテリジェンスを形成します。」
バーチャルヒューマンライブブロードキャストは、主にエンターテイメントブロードキャスト、ゲームブロードキャスト、および電子商取引ライブブロードキャストの3種類に分類されます。 Yunbo の Mei Song 氏は、「価値の観点から見ると、バーチャル ヒューマンは最初の 2 つに適しています。物品を運ぶシナリオの中心は物品です。何かが安い限り、誰かが必ずそれを購入します。何かが高価であれば、それを購入します。」 「誰でも販売するのは難しいでしょう。バーチャルピープル ライブ配信ではグッズの問題は解決できません。」
「バーチャル ライブ ブロードキャストは、ライブ ブロードキャスト中にファンと瞬時に交流できない問題を改善できます。ファンはいつでもバーチャル アンカーに報酬を与えたり、着替えたりすることができ、バーチャル ライブ ブロードキャストのコンテンツはよりインタラクティブでリッチになります。」と Mei Song 氏は言いました。 「Gao Quality のライブ コンテンツには、必ず実際の人々の参加が必要です。」
ステーション B を開くと、Xiao K の「水道水」ユーザーがいたるところで見られます。 Mei Song 氏は、3D 仮想アンカーの分野における Xiao K Live Ji の市場維持率が 90% に達し、ネットワーク全体で 400,000 人以上のアンカーがサービスを提供し、毎日アクティブなブロードキャストを行うアンカーが 5,000 人以上であることを明らかにしました。すべてのモーション キャプチャ ライブ ブロードキャスト ツールの中で、C サイドが完全に無料なのは Xiao K だけです。
「私は、Xiao K Live Ji の製品に依存してお金を請求するつもりはありません。将来的には、この製品を使用して、より多くのアンカーを引きつけて使用してもらいたいと考えています。これらの人々には独自のファンとトラフィックが付いています。後で、宇宙シーンを使用してインタラクティブ ゲームを作成し、ゲームのインターモーダル モデルと同様にコンテンツ トラフィックを収益化できます。」
Mei Song は、バーチャル ライブ インタラクションは 3 つの段階に分かれると考えています。 1.0 の時代は、実際の人々による毎日の生放送で、ギフトを贈ったり、特殊効果を再生したり、集中砲火を行ったりしていました。 2.0 ファンはライブ ブロードキャスト ルームの仮想コンテンツに影響を与えたり、弾幕ギフトを通じてキャラクターを作成したりできますが、コントロールすることはできません。 3.0 はメタバース スペースで、ファンとアンカーがライブ ブロードキャストで自由に対話でき、ファンは仮想ジョイスティックを持ち、コンサートの開催や PK のプレイなど、完全に独立した制御を行うことができます。今年下半期、ユンボは「メタバース」に似た「リトルK宇宙ステーション」を打ち上げ、第3世代のライブインタラクティブシーンを実装する予定だ。Maijike Technology の Fu Yingna 氏は、プラットフォームが異なれば、仮想ライブ ブロードキャストに対するポリシーも異なると考えています。 「Douyinはそれを奨励しませんが、Bilibiliはおそらくそれを奨励するでしょう。結局のところ、ユーザーは異なります。将来的には、プラットフォームに別の仮想ライブブロードキャストエリアを設けることができます。結局のところ、視聴者がいるのです。」
一方、「長期的には、仮想の人々が現実の人々に取って代わることは、プラットフォームを悪用しようとしており、プラットフォームの利益を侵害していることになります。彼らは将来的には間違いなく禁止されるでしょう。」Cheng Weizhong、中科の賢人は、以前のデジタル担当者が商品を持ってきたと述べました。Douyin が地元の生活をサポートしたいと考えたため、ライブ放送が人気になりました。
「将来的には、バーチャル パーソンのライブ ブロードキャストは、プラットフォームと Win-Win の関係にある必要があります。バーチャル パーソン テクノロジーのサプライヤーは、プラットフォーム、ユーザー、ビジネスが何を必要としているのかを明確に考える必要があります。バーチャル アンカーは推論と分析の能力を備えている必要があります」生身の人間にはない、例えば弾幕の雰囲気が良いか悪いかを瞬時に分析・判断できる、これが人工知能の価値です。」
ChatGPT の波に加えて、Cheng Weizhong は Apple Glasses にも注目しています。 「Apple の AR メガネが長期的に前進できるかどうかは、技術的に AR と VR を統合できるかどうかだけでなく、より重要なのはビジネス モデル、つまり開発者を引き付けて資金を共有できるかどうかにかかっています。一緒にエコシステムを作りましょう。”
「AR メガネの発展により、コンテンツの表現方法も変わり、3D コンテンツの生成やバーチャル ヒューマンを行う企業にも大きなチャンスがもたらされるでしょう。起業家にとっては良い機会です。」
Apple Glasses について語るとき、Mei Song 氏は、VR とメタバースの初期実装シナリオに最適なのはゲームであると考えています。 「なぜ VR の普及率とユーザー数が増えないのでしょうか? 根本的な理由は、VR をベースにした優れたコンテンツがないことです。」
Yunbo 氏は、Xiao K Live Broadcast Ji Zhong の 3D アセットの作成に 3,000 万元を投資しました。「一方ではコストがかかります。他方では、Xiao K ビデオ エンジンなどの自社開発技術もあります」 「6 年かかりました。私たちは独自の堀を築きました。」
「今年下半期には、AI 音楽や AI 音声などの AIGC マルチモーダル変換製品の開発を開始します。Xiao K Live Ji はシングルカメラの全身モーション キャプチャ バージョンを発売します。 「これらの製品は、ゲームのアニメーション制作プロセスにも統合されます。ユーザーが使用可能なアニメーション データを生成できるよう支援します。さらに、Little K の絵の電子商取引およびゲーム版も開始されます。」
もちろん、これらの計画には大規模なモデルのサポートも必要であるため、Yunbo はモデルのトレーニングに大量のデータも使用します。同社にはすでに数十人のラベル付けチームがいます。
Fu Yingna 氏は、AR/VR が普及した後の状況を説明するために、アップグレードという用語も使用しました。 「インターネットの第 1 世代では、すべての企業が独自の Web サイトを持っていました。第 2 世代のインターネットでは、すべての企業が独自の APP を持っていました。第 3 世代のインターネットは 4 次元の時空体験となり、 3D コンテンツのインテリジェントな生成にアップグレードされ、時間と空間の折りたたみを統合することで、リアルタイムのインテリジェントなインタラクションが可能になります。3D コンテンツは、軽量な方法で H5 形式で出力でき、Web ページ、クライアント、その他の場所に同時に表示できます。 -時間のやり取り。」
まいじけテクノロジーが開発した最新の「デジタルスペースステーション」は、仮想空間上に企業向けの「デジタル名刺」を構築し、現実の時間と空間の制限を超えて、立体的、視覚的、知的に提示することができます。 、何千人ものユーザーに 1 対 1 のパーソナライズされたインテリジェント サービスを提供します。このコンテンツ操作は、プライベート展開または SaaS を通じて実現できます。これは、新世代のコンテンツ生産性と没入型エクスペリエンスを構築するための鍵であり、デジタル経済時代における重要なツールおよびプラットフォームでもあります。
AIGC テクノロジーは業界の認識を革新し続ける一方で、バーチャル ヒューマン テクノロジーにも革命をもたらします。バーチャル ヒューマン テクノロジーの実践者にとって、ChatGPT によって引き起こされた AI ブームは、AR/VR の新たなホットスポットと相まって、二重の興奮を生み出しています。
新しいものが多すぎて、やるべきことが多すぎるとき、AI を使用して無限のコンテンツ消費者向け製品を生成し、新しい世界への扉を開くにはどうすればよいでしょうか。残念ながら、それを担当するのはテクノロジー プロバイダーと B サイドです。一緒に解決する必要があるお客様の問題。
以上がApple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。