ホームページ  >  記事  >  テクノロジー周辺機器  >  AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

王林
王林転載
2023-06-09 22:58:291201ブラウズ

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

世界的な大流行が起こる前に、人工知能は長年にわたって醸成されてきました。将来の AI イノベーションを適切に予測するために、私たちは原点に立ち返り、AI アプリケーションに関する特許とベンチャーキャピタルの取引活動を調査しました。

私たちは、2012 年から 2022 年の間に 193 の世界知的所有権機関 (WIPO) 加盟国によって公開された 175,072 件の人工知能特許を収集し、5 つの主要なカテゴリに分類しました。ベンチャー キャピタルへの投資については、OECD 人工知能データベースの 2012 年から 2022 年までの 92 か国における 24,310 件の取引データを使用しました。

絶対的な観点から見ると、人工知能分野におけるベンチャー キャピタルの活動と特許の数は 2012 年以来急増しています。この期間中、ベンチャーキャピタルの取引件数は10倍の3,884件に増加し、2022年の取引額は2012年のほぼ50倍の830億ドルに達しました。同時に、人工知能の特許数は 2022 年に 7 倍に増加し、37,000 件近くに達しました。

ベンチャーキャピタルの取引と特許から判断すると、過去 10 年間の人工知能のイノベーションの 3 分の 2 以上が、運輸、産業、消費者産業のアプリケーションに集中しています。

次に、ジェネレーティブ オーディオが 2024 年に大規模に出現し、ゲームや映画制作などの業界に破壊的影響を与えると予想されます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能が冬眠から目覚める

2022 年 11 月に OpenAI の ChatGPT がリリースされたことにより、一般の人々だけでなく企業の間でも人工知能への関心が高まっています。 2022 年には、企業文書内で「人工知能」が 715,000 回以上言及されましたが、2020 年にはわずか 135,000 回でした。私たちの調査によると、2023 年 4 月までに、アメリカ人の 41% が ChatGPT について聞いたことがあり、60% 近くが自分の仕事ですでに ChatGPT をある程度使用していると回答しています。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

さらに、5 月 18 日のニュースでは、米国で最初のアプリ バージョンがリリースされた後、ChatGPT が iPhone でも利用できるようになりました。 Googleは5月5日、同社の検索製品に統合された生成人工知能ツールの展開を開始するとも発表した。先に進む前に、人工知能を簡単に定義しましょう。人工知能は、人間によって与えられた一連の目標を与えられて、現実または仮想環境に影響を与える可能性のある予測、推奨、さらには決定を行うことができるマシンベースのシステムです。

人工知能は実際には数年前から開発されてきました。 AI 関連のベンチャーキャピタルの取引活動と公開された特許は、2012 年以来静かに急増しています。たとえば、ベンチャーキャピタルへの投資件数は、2012 年の 332 件から 2022 年には 3,884 件に増加しました。 2022 年には、ベンチャーキャピタルの取引額は 830 億ドルに達し、2012 年の 18 億ドルから増加すると予想されます。同時に、人工知能に関する特許の数は 2012 年以来 7 倍に増加しました。

人工知能業界への参入障壁が低くなり、この分野でのビジネス革新が促進されました。たとえば、2018 年以降、画像分類システムのトレーニング コストは 64% 削減され、トレーニング時間は 94% 削減されました。 OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney、Cohere など、多くのスタートアップやベンチャーキャピタル企業も登場しています。 Anthropic は最近、Alphabet、Salesforce、Zoom の参加を得て、シリーズ C 資金で 4 億 5,000 万ドルを調達したと伝えられています。さらに、ロンドンを拠点とする人工知能企業 Builder.Ai は、最新の資金調達ラウンドで 2 億 5,000 万ドルを調達しました。

人工知能で何が起こるかを正確に予測するために、私たちはこの分野の特許も研究しました。ベンチャー支援を受けた企業が製品を市場に投入するまでに約 2 ~ 3 年、特許の承認までにはさらに 7 ~ 10 年かかると予想されます。特許に関して言えば、企業は特許を保護した後、マーケティングや取引先の選定などを行う必要があり、それには1~3年程度かかります。

世界知的所有権機関のパテントスコープを通じて、2012 年から 2022 年の間に同機関のメンバー 193 名が公開した 175,072 件の人工知能特許エントリを収集しました。これらの特許は、分野別アプリケーション、サービス プラットフォーム (水平プラットフォーム) を含む 5 つの主要カテゴリに分類されています。 、自動機械(自律機械)と半導体(半導体)。ベンチャーキャピタル側では、OECD AI データベースがカバーする 92 の経済圏にわたる 24,310 件の取引を使用しました。

1. 人工知能の展望 - 創造性を現実化する

株式市場はどう反応しましたか?

ChatGPT やその他の新しい人工知能をいち早く導入した企業の株価は急騰しました。たとえば、2023 年 1 月 31 日、人工知能ソフトウェア会社 C3.ai は、OpenAI、Google、学術研究、その他の人工知能テクノロジーを統合した「生成人工知能製品スイート」を発売しました。同社の株価は同日、22%近く上昇し、年初からは143%上昇した。

人工知能オーディオおよび音声認識ソフトウェア会社である SoundHound の株価は、年初から 66% 上昇しています。

人工知能ソフトウェア企業だけでなく、人工知能はバリューチェーンのほぼすべての企業に影響を与えます。人工知能モデルを実行できるコンピューターチップを製造する半導体会社エヌビディアの株価は110%上昇した。メタ社は、大手ハイテク企業間の人工知能競争でも好成績を収めている。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能に流れる資金

2022 年には、世界のベンチャーキャピタルによる人工知能への投資は、2012 年の 18 億米ドルから 830 億米ドルのピークに達すると予想されます。 Databricks と MIT は、ほとんどの企業がすでに AI を広く導入していることを発見しました。このサンプルでは、​​2022 年までに人工知能を使用しない企業の割合は 6% 未満です。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

企業は人工知能の成長から恩恵を受けるでしょう

長年にわたり、人工知能の研究は学術界に限定されてきましたが、現在では商業分野でも応用され始めています。先駆者は学術界であり、学術論文の発表から特許を取得するまでには通常 15 年かかります。

しかし、人工知能の革新が爆発的に起こる時期が来たことがますます明らかになりつつあります。 2012 年から 2022 年まで、ベンチャーキャピタル取引の 49% が過去 3 年間に完了しました。同様に、データベース内の AI 関連特許の 52% は 3 年以内に発行されました。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

2. 応用分野: 2023 年には人工知能が主流になるでしょう

Amazon 創設者兼執行会長のジェフ・ベゾスは、「私たちは現在、機械学習と人工知能を使用して問題を解決しています。そして、今起こっていることは、SF 小説で描かれているようなものです。」

過去 10 年間、人工知能に関連するベンチャー キャピタル取引のほぼ 5 分の 4 は、産業アプリケーションの分野で行われていました。さらに 8% は自動機械と自動車で発生し、13% は半導体で発生しました。 AI関連特許の割合も同様だ。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

業界への応用: 人工知能は 1 つの業界に限定されません

現在、ベンチャーキャピタル取引の 79% と特許の 61% が、私たちが「産業応用」と考えるもので発生しています。当社の定義では、これには消費者、産業、情報技術、輸送、ヘルスケア、金融サービスが含まれます。

2012 年から 2022 年にかけて、ベンチャー キャピタルの取引件数は 270 件から 3,006 件に増加し、10 倍以上に増加しました。 2022 年の総取引高は 620 億米ドルに達し、2012 年の 13 億米ドルを大きく上回ります。これらの分野で発行された特許も急増しています。 2012 年以降、関連特許の数は 6 倍に増加しました。最も多くの特許を取得している企業は、IBM、サムスン、インテル、LG エレクトロニクス、クアルコムなどの有名なテクノロジー大手です。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

サービスプラットフォーム:AIツール

2012 年以来、人工知能コア (AI コア)、自然言語技術 (自然言語技術)、人工知能自動化プラットフォーム (AI 自動化プラットフォーム)、コンピューターなどの水平プラットフォームの特許数が 6 倍近く増加しました。ビジョンソフトウェア。サービス指向アプリケーション (水平アプリケーション) は、人工知能の開発と展開における重要なモジュールであり、このような特許を取得している企業には、AT&T、IBM、LG Electronics、Baidu、および確立されたテクノロジー企業が含まれます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

自然言語処理 (自然言語処理) は、ChatGPT の出現とともに普及した大規模言語モデル (LLM) 用の人工知能ツールです。自然言語処理の例には、翻訳、自動エラー修正、自動テキスト要約、チャットボット、金融分野での情報ニーズの処理などがあります。

コンピューター ビジョンには、人工知能を使用して視覚データを分析し、顔認識や地理空間分析などの有意義な予測を行うことが含まれます。

Microsoft の Inner Eye テクノロジーは、すでに腫瘍や異常細胞の検出に役立ちます。 Microsoft は最新の研究で、自社のテクノロジーが臨床医にどのように役立つかを示しています。コンピュータビジョンの特許を最も多く保有している 5 社のうち、2 社は中国企業、すなわち Baidu と Huawei です。

運転免許証が必要なのは誰ですか?自動運転の到来

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

過去 10 年間で、ベンチャーキャピタル取引の 8% と特許の 16% が「自動機械」の分野で発生しました。このタイプのテクノロジーは、自動運転車とインテリジェント ロボットという 2 つの主要分野をカバーしています。この分野は過去 10 年にわたって大きな注目を集めてきました。これは、自動運転車システムの実験を行っているテスラの成功とほぼ一致している。

2012 年から 2022 年にかけて、自動機械分野のベンチャーキャピタル取引の数は 22 件から 363 件に増加しました。知能ロボットはこのカテゴリーに分類されます。これらのロボットは、人間の介入や入力を必要とせずに、ある程度の動作が可能です。人工知能は、ロボット モデルのトレーニングと適応を支援するためによく使用されます。サムスン、LGエレクトロニクス、インテル、中国のDJIや滴滴出行などの企業は、ロボット工学の特許で強い地位を​​築いている。

ここ数年、自動運転車も議論の焦点となってきました。テスラに加えて、他の企業も自動運転車に必要な技術の研究や投資を拡大しており、これを背景にベンチャーキャピタルの投資や特許出願も大幅に増加するとみられる。

半導体チップ

NVIDIA CEO ジェンセン フアン氏は次のように述べています。「人工知能があらゆる業界に影響を与えることは明らかです。どの国も人工知能が国家戦略の一部であることを確認する必要があると思います。そうすれば、どの国も影響を受けるでしょう。」

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

半導体は、AI 関連のベンチャー キャピタル取引の 13%、公開特許 (プロセッサ設計、エッジ AI ソフトウェア、インテリジェント センサーおよび機器デバイスを含む) の 4% を占めています。

2012 年から 2022 年にかけて、半導体分野のベンチャーキャピタル取引は 40 件から 515 件に増加しました。 2022 年には、この分野の取引総額は 94 億米ドルに達し、2012 年の 2 億米ドルから増加すると予想されます。同様に、この分野の特許数は 2012 年から 2022 年にかけて 7 倍に増加しました。

1970 年代以来、チップは急速な革新を経験し、チップの性能は数年ごとに 2 倍になりました。生産者は開発についていく必要があり、そうしないと取り残される危険があります。テクノロジーがより複雑になるにつれて、新しいツールが必要になりますが、ここで人工知能が役立ちます。

3. 2024 年以降の新たな機会

ジェネレーティブ オーディオは次の大きなものになる可能性があります

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能は、さまざまな言語、アクセント、方言で入力されたテキストに基づいて人間の声や合成音声を作成できるようになりました。 ChatGPT で人気のある生成人工知能を使用します。

2020 年の第 1 四半期から 2022 年の第 4 四半期にかけて、「ジェネレーティブ オーディオ」について言及した企業文書の数は 13 倍以上に増加しました。

音楽とサウンドの研究開発が深まるにつれ、新たな競合他社が急増する可能性があります。まもなく、オーディオの専門家やコンピューターの専門家を必要とせずに、テキストや画像を入力してオーディオ コンテンツを生成できるようになるでしょう。

これは、ゲーム、通信、音楽、ジャーナリズム、ヘルスケアなどの幅広い分野に影響を与える可能性があります。最も生成的なオーディオ関連の特許を保有している企業には、ソニー、アマゾン、ファーウェイ、バイトダンス、アドビ、アップル、テンセントなどが含まれます。

どのような音声を生成できますか?

生成オーディオは、合成音声、音声インタラクション、音楽生成、オーディオ編集を含む 4 つの主要なカテゴリに分類されます。まず、人工知能は深層学習を通じて、ピッチ、トーン、リズムを含む実際の人間の声を高品質で合成できます。音声インタラクションには、Apple の Siri や Amazon の Alexa などの仮想アシスタントなどのテクノロジーが含まれます。テクノロジーが発展するにつれて、人間と人工知能の間の「自然な」相互作用がますます増える可能性があります。

音楽生成テクノロジーにより、さまざまな新しい音楽を簡単に作成できます。例としては、Spotify の DJ や Aimi Studio などが挙げられます。人工知能音楽はすでに音楽業界に課題をもたらしています。

最後に、オーディオ編集者は人工知能を使用してオーディオ録音の品質を向上させることができます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

######結論は######

人工知能が登場し、新しいイノベーションがすぐそこまで来ています。特許やベンチャー キャピタルなどの指標で測定されるように、人工知能分野のイノベーションは過去 10 年間で爆発的に増加しました。ベンチャーキャピタルの活動と特許から判断すると、過去 10 年間の人工知能のイノベーションの 3 分の 2 以上は、輸送、産業、消費者向けアプリケーションに集中しており、次に自動機械やサービス アプリケーション、半導体産業が続きます。 2023 年以降、ジェネレーティブ オーディオのイノベーションが急増すると予想されます。 ChatGPT と DALL-E の登場により、生成 AI が世界の注目を集めるようになりました。これらのテクノロジーが連携すると、ゲームや映画制作などの業界に変革がもたらされます。

著者 | BT ファイナンス

出典 | ドイツ銀行

以上がAI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。