検索
ホームページテクノロジー周辺機器AIAI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

世界的な大流行が起こる前に、人工知能は長年にわたって醸成されてきました。将来の AI イノベーションを適切に予測するために、私たちは原点に立ち返り、AI アプリケーションに関する特許とベンチャーキャピタルの取引活動を調査しました。

私たちは、2012 年から 2022 年の間に 193 の世界知的所有権機関 (WIPO) 加盟国によって公開された 175,072 件の人工知能特許を収集し、5 つの主要なカテゴリに分類しました。ベンチャー キャピタルへの投資については、OECD 人工知能データベースの 2012 年から 2022 年までの 92 か国における 24,310 件の取引データを使用しました。

絶対的な観点から見ると、人工知能分野におけるベンチャー キャピタルの活動と特許の数は 2012 年以来急増しています。この期間中、ベンチャーキャピタルの取引件数は10倍の3,884件に増加し、2022年の取引額は2012年のほぼ50倍の830億ドルに達しました。同時に、人工知能の特許数は 2022 年に 7 倍に増加し、37,000 件近くに達しました。

ベンチャーキャピタルの取引と特許から判断すると、過去 10 年間の人工知能のイノベーションの 3 分の 2 以上が、運輸、産業、消費者産業のアプリケーションに集中しています。

次に、ジェネレーティブ オーディオが 2024 年に大規模に出現し、ゲームや映画制作などの業界に破壊的影響を与えると予想されます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能が冬眠から目覚める

2022 年 11 月に OpenAI の ChatGPT がリリースされたことにより、一般の人々だけでなく企業の間でも人工知能への関心が高まっています。 2022 年には、企業文書内で「人工知能」が 715,000 回以上言及されましたが、2020 年にはわずか 135,000 回でした。私たちの調査によると、2023 年 4 月までに、アメリカ人の 41% が ChatGPT について聞いたことがあり、60% 近くが自分の仕事ですでに ChatGPT をある程度使用していると回答しています。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

さらに、5 月 18 日のニュースでは、米国で最初のアプリ バージョンがリリースされた後、ChatGPT が iPhone でも利用できるようになりました。 Googleは5月5日、同社の検索製品に統合された生成人工知能ツールの展開を開始するとも発表した。先に進む前に、人工知能を簡単に定義しましょう。人工知能は、人間によって与えられた一連の目標を与えられて、現実または仮想環境に影響を与える可能性のある予測、推奨、さらには決定を行うことができるマシンベースのシステムです。

人工知能は実際には数年前から開発されてきました。 AI 関連のベンチャーキャピタルの取引活動と公開された特許は、2012 年以来静かに急増しています。たとえば、ベンチャーキャピタルへの投資件数は、2012 年の 332 件から 2022 年には 3,884 件に増加しました。 2022 年には、ベンチャーキャピタルの取引額は 830 億ドルに達し、2012 年の 18 億ドルから増加すると予想されます。同時に、人工知能に関する特許の数は 2012 年以来 7 倍に増加しました。

人工知能業界への参入障壁が低くなり、この分野でのビジネス革新が促進されました。たとえば、2018 年以降、画像分類システムのトレーニング コストは 64% 削減され、トレーニング時間は 94% 削減されました。 OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney、Cohere など、多くのスタートアップやベンチャーキャピタル企業も登場しています。 Anthropic は最近、Alphabet、Salesforce、Zoom の参加を得て、シリーズ C 資金で 4 億 5,000 万ドルを調達したと伝えられています。さらに、ロンドンを拠点とする人工知能企業 Builder.Ai は、最新の資金調達ラウンドで 2 億 5,000 万ドルを調達しました。

人工知能で何が起こるかを正確に予測するために、私たちはこの分野の特許も研究しました。ベンチャー支援を受けた企業が製品を市場に投入するまでに約 2 ~ 3 年、特許の承認までにはさらに 7 ~ 10 年かかると予想されます。特許に関して言えば、企業は特許を保護した後、マーケティングや取引先の選定などを行う必要があり、それには1~3年程度かかります。

世界知的所有権機関のパテントスコープを通じて、2012 年から 2022 年の間に同機関のメンバー 193 名が公開した 175,072 件の人工知能特許エントリを収集しました。これらの特許は、分野別アプリケーション、サービス プラットフォーム (水平プラットフォーム) を含む 5 つの主要カテゴリに分類されています。 、自動機械(自律機械)と半導体(半導体)。ベンチャーキャピタル側では、OECD AI データベースがカバーする 92 の経済圏にわたる 24,310 件の取引を使用しました。

1. 人工知能の展望 - 創造性を現実化する

株式市場はどう反応しましたか?

ChatGPT やその他の新しい人工知能をいち早く導入した企業の株価は急騰しました。たとえば、2023 年 1 月 31 日、人工知能ソフトウェア会社 C3.ai は、OpenAI、Google、学術研究、その他の人工知能テクノロジーを統合した「生成人工知能製品スイート」を発売しました。同社の株価は同日、22%近く上昇し、年初からは143%上昇した。

人工知能オーディオおよび音声認識ソフトウェア会社である SoundHound の株価は、年初から 66% 上昇しています。

人工知能ソフトウェア企業だけでなく、人工知能はバリューチェーンのほぼすべての企業に影響を与えます。人工知能モデルを実行できるコンピューターチップを製造する半導体会社エヌビディアの株価は110%上昇した。メタ社は、大手ハイテク企業間の人工知能競争でも好成績を収めている。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能に流れる資金

2022 年には、世界のベンチャーキャピタルによる人工知能への投資は、2012 年の 18 億米ドルから 830 億米ドルのピークに達すると予想されます。 Databricks と MIT は、ほとんどの企業がすでに AI を広く導入していることを発見しました。このサンプルでは、​​2022 年までに人工知能を使用しない企業の割合は 6% 未満です。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

企業は人工知能の成長から恩恵を受けるでしょう

長年にわたり、人工知能の研究は学術界に限定されてきましたが、現在では商業分野でも応用され始めています。先駆者は学術界であり、学術論文の発表から特許を取得するまでには通常 15 年かかります。

しかし、人工知能の革新が爆発的に起こる時期が来たことがますます明らかになりつつあります。 2012 年から 2022 年まで、ベンチャーキャピタル取引の 49% が過去 3 年間に完了しました。同様に、データベース内の AI 関連特許の 52% は 3 年以内に発行されました。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

2. 応用分野: 2023 年には人工知能が主流になるでしょう

Amazon 創設者兼執行会長のジェフ・ベゾスは、「私たちは現在、機械学習と人工知能を使用して問題を解決しています。そして、今起こっていることは、SF 小説で描かれているようなものです。」

過去 10 年間、人工知能に関連するベンチャー キャピタル取引のほぼ 5 分の 4 は、産業アプリケーションの分野で行われていました。さらに 8% は自動機械と自動車で発生し、13% は半導体で発生しました。 AI関連特許の割合も同様だ。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

業界への応用: 人工知能は 1 つの業界に限定されません

現在、ベンチャーキャピタル取引の 79% と特許の 61% が、私たちが「産業応用」と考えるもので発生しています。当社の定義では、これには消費者、産業、情報技術、輸送、ヘルスケア、金融サービスが含まれます。

2012 年から 2022 年にかけて、ベンチャー キャピタルの取引件数は 270 件から 3,006 件に増加し、10 倍以上に増加しました。 2022 年の総取引高は 620 億米ドルに達し、2012 年の 13 億米ドルを大きく上回ります。これらの分野で発行された特許も急増しています。 2012 年以降、関連特許の数は 6 倍に増加しました。最も多くの特許を取得している企業は、IBM、サムスン、インテル、LG エレクトロニクス、クアルコムなどの有名なテクノロジー大手です。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

サービスプラットフォーム:AIツール

2012 年以来、人工知能コア (AI コア)、自然言語技術 (自然言語技術)、人工知能自動化プラットフォーム (AI 自動化プラットフォーム)、コンピューターなどの水平プラットフォームの特許数が 6 倍近く増加しました。ビジョンソフトウェア。サービス指向アプリケーション (水平アプリケーション) は、人工知能の開発と展開における重要なモジュールであり、このような特許を取得している企業には、AT&T、IBM、LG Electronics、Baidu、および確立されたテクノロジー企業が含まれます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

自然言語処理 (自然言語処理) は、ChatGPT の出現とともに普及した大規模言語モデル (LLM) 用の人工知能ツールです。自然言語処理の例には、翻訳、自動エラー修正、自動テキスト要約、チャットボット、金融分野での情報ニーズの処理などがあります。

コンピューター ビジョンには、人工知能を使用して視覚データを分析し、顔認識や地理空間分析などの有意義な予測を行うことが含まれます。

Microsoft の Inner Eye テクノロジーは、すでに腫瘍や異常細胞の検出に役立ちます。 Microsoft は最新の研究で、自社のテクノロジーが臨床医にどのように役立つかを示しています。コンピュータビジョンの特許を最も多く保有している 5 社のうち、2 社は中国企業、すなわち Baidu と Huawei です。

運転免許証が必要なのは誰ですか?自動運転の到来

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

過去 10 年間で、ベンチャーキャピタル取引の 8% と特許の 16% が「自動機械」の分野で発生しました。このタイプのテクノロジーは、自動運転車とインテリジェント ロボットという 2 つの主要分野をカバーしています。この分野は過去 10 年にわたって大きな注目を集めてきました。これは、自動運転車システムの実験を行っているテスラの成功とほぼ一致している。

2012 年から 2022 年にかけて、自動機械分野のベンチャーキャピタル取引の数は 22 件から 363 件に増加しました。知能ロボットはこのカテゴリーに分類されます。これらのロボットは、人間の介入や入力を必要とせずに、ある程度の動作が可能です。人工知能は、ロボット モデルのトレーニングと適応を支援するためによく使用されます。サムスン、LGエレクトロニクス、インテル、中国のDJIや滴滴出行などの企業は、ロボット工学の特許で強い地位を​​築いている。

ここ数年、自動運転車も議論の焦点となってきました。テスラに加えて、他の企業も自動運転車に必要な技術の研究や投資を拡大しており、これを背景にベンチャーキャピタルの投資や特許出願も大幅に増加するとみられる。

半導体チップ

NVIDIA CEO ジェンセン フアン氏は次のように述べています。「人工知能があらゆる業界に影響を与えることは明らかです。どの国も人工知能が国家戦略の一部であることを確認する必要があると思います。そうすれば、どの国も影響を受けるでしょう。」

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

半導体は、AI 関連のベンチャー キャピタル取引の 13%、公開特許 (プロセッサ設計、エッジ AI ソフトウェア、インテリジェント センサーおよび機器デバイスを含む) の 4% を占めています。

2012 年から 2022 年にかけて、半導体分野のベンチャーキャピタル取引は 40 件から 515 件に増加しました。 2022 年には、この分野の取引総額は 94 億米ドルに達し、2012 年の 2 億米ドルから増加すると予想されます。同様に、この分野の特許数は 2012 年から 2022 年にかけて 7 倍に増加しました。

1970 年代以来、チップは急速な革新を経験し、チップの性能は数年ごとに 2 倍になりました。生産者は開発についていく必要があり、そうしないと取り残される危険があります。テクノロジーがより複雑になるにつれて、新しいツールが必要になりますが、ここで人工知能が役立ちます。

3. 2024 年以降の新たな機会

ジェネレーティブ オーディオは次の大きなものになる可能性があります

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

人工知能は、さまざまな言語、アクセント、方言で入力されたテキストに基づいて人間の声や合成音声を作成できるようになりました。 ChatGPT で人気のある生成人工知能を使用します。

2020 年の第 1 四半期から 2022 年の第 4 四半期にかけて、「ジェネレーティブ オーディオ」について言及した企業文書の数は 13 倍以上に増加しました。

音楽とサウンドの研究開発が深まるにつれ、新たな競合他社が急増する可能性があります。まもなく、オーディオの専門家やコンピューターの専門家を必要とせずに、テキストや画像を入力してオーディオ コンテンツを生成できるようになるでしょう。

これは、ゲーム、通信、音楽、ジャーナリズム、ヘルスケアなどの幅広い分野に影響を与える可能性があります。最も生成的なオーディオ関連の特許を保有している企業には、ソニー、アマゾン、ファーウェイ、バイトダンス、アドビ、アップル、テンセントなどが含まれます。

どのような音声を生成できますか?

生成オーディオは、合成音声、音声インタラクション、音楽生成、オーディオ編集を含む 4 つの主要なカテゴリに分類されます。まず、人工知能は深層学習を通じて、ピッチ、トーン、リズムを含む実際の人間の声を高品質で合成できます。音声インタラクションには、Apple の Siri や Amazon の Alexa などの仮想アシスタントなどのテクノロジーが含まれます。テクノロジーが発展するにつれて、人間と人工知能の間の「自然な」相互作用がますます増える可能性があります。

音楽生成テクノロジーにより、さまざまな新しい音楽を簡単に作成できます。例としては、Spotify の DJ や Aimi Studio などが挙げられます。人工知能音楽はすでに音楽業界に課題をもたらしています。

最後に、オーディオ編集者は人工知能を使用してオーディオ録音の品質を向上させることができます。

AI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?

######結論は######

人工知能が登場し、新しいイノベーションがすぐそこまで来ています。特許やベンチャー キャピタルなどの指標で測定されるように、人工知能分野のイノベーションは過去 10 年間で爆発的に増加しました。ベンチャーキャピタルの活動と特許から判断すると、過去 10 年間の人工知能のイノベーションの 3 分の 2 以上は、輸送、産業、消費者向けアプリケーションに集中しており、次に自動機械やサービス アプリケーション、半導体産業が続きます。 2023 年以降、ジェネレーティブ オーディオのイノベーションが急増すると予想されます。 ChatGPT と DALL-E の登場により、生成 AI が世界の注目を集めるようになりました。これらのテクノロジーが連携すると、ゲームや映画制作などの業界に変革がもたらされます。

著者 | BT ファイナンス

出典 | ドイツ銀行

以上がAI 産業調査レポート: ジェネレーティブ テキストの次にジェネレーティブ オーディオが間もなく登場する?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
モデルコンテキストプロトコル(MCP)とは何ですか?モデルコンテキストプロトコル(MCP)とは何ですか?Mar 03, 2025 pm 07:09 PM

モデルコンテキストプロトコル(MCP):AIとデータのユニバーサルコネクタ 私たちは皆、毎日のコーディングにおけるAIの役割に精通しています。 Replit、Github Copilot、Black Box AI、およびCursor IDEは、AIがワークフローを合理化する方法のほんの一部です。 しかし、想像してみてください

Omniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築するOmniparser V2とOmnitoolを使用して地元のビジョンエージェントを構築するMar 03, 2025 pm 07:08 PM

MicrosoftのOmniparser V2とOmnitool:AIでGUIオートメーションに革命をもたらす 味付けされた専門家のように、Windows 11インターフェースと相互作用するだけでなく、熟練したプロのように相互作用するAIを想像してください。 MicrosoftのOmniparser V2とOmnitoolはこれを再生します

レプリットエージェント:実用的な例を備えたガイドレプリットエージェント:実用的な例を備えたガイドMar 04, 2025 am 10:52 AM

アプリ開発の革新:レプリットエージェントに深く潜ります 複雑な開発環境と不明瞭な構成ファイルとの格闘にうんざりしていませんか? Replit Agentは、アイデアを機能的なアプリに変換するプロセスを簡素化することを目的としています。 このai-p

カーソルAIでバイブコーディングを試してみましたが、驚くべきことです!カーソルAIでバイブコーディングを試してみましたが、驚くべきことです!Mar 20, 2025 pm 03:34 PM

バイブコーディングは、無限のコード行の代わりに自然言語を使用してアプリケーションを作成できるようにすることにより、ソフトウェア開発の世界を再構築しています。 Andrej Karpathyのような先見の明に触発されて、この革新的なアプローチは開発を許可します

Runway Act-One Guide:私はそれをテストするために自分自身を撮影しましたRunway Act-One Guide:私はそれをテストするために自分自身を撮影しましたMar 03, 2025 am 09:42 AM

このブログ投稿では、Runway MLの新しいAct-One Animationツールの経験をテストし、WebインターフェイスとPython APIの両方をカバーしています。約束しますが、私の結果は予想よりも印象的ではありませんでした。 生成AIを探索したいですか? PでLLMSを使用することを学びます

オブジェクト検出にYolo V12を使用する方法は?オブジェクト検出にYolo V12を使用する方法は?Mar 22, 2025 am 11:07 AM

Yolo(あなたは一度だけ見ています)は、前のバージョンで各反復が改善され、主要なリアルタイムオブジェクト検出フレームワークでした。最新バージョンYolo V12は、精度を大幅に向上させる進歩を紹介します

2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など!2025年2月のトップ5 Genai発売:GPT-4.5、Grok-3など!Mar 22, 2025 am 10:58 AM

2025年2月は、生成AIにとってさらにゲームを変える月であり、最も期待されるモデルのアップグレードと画期的な新機能のいくつかをもたらしました。 Xai’s Grok 3とAnthropic's Claude 3.7 SonnetからOpenaiのGまで

Elon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突しますElon Musk&Sam Altmanは、5,000億ドルを超えるスターゲートプロジェクトを超えて衝突しますMar 08, 2025 am 11:15 AM

Openai、Softbank、Oracle、Nvidiaなどのハイテク大手に支援され、米国政府が支援する5,000億ドルのStargate AIプロジェクトは、アメリカのAIリーダーシップを固めることを目指しています。 この野心的な仕事は、AIの進歩によって形作られた未来を約束します

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。