在爆發全球熱潮之前,人工智慧是經過了多年醞釀的。為了正確預測未來的人工智慧創新,我們回到源頭,研究了人工智慧應用的專利和創投交易活動。
我們收集了193個世界智慧財產權組織(WIPO)成員在2012年至2022年期間公佈的17,5072項人工智慧專利,分為五大類。對於創投投資,我們使用了經合組織(OECD)人工智慧資料庫2012年至2022年92個經濟體的24,310筆交易資料。
以絕對值計算,自2012年以來,人工智慧領域的創投活動和專利數量激增。期間,創投交易數量增加了10倍,達到3,884筆,2022年的交易價值幾乎是2012年的50倍,達到830億美元。同時,人工智慧專利數量在2022年成長了7倍,達到近3.7萬個。
從創投交易和專利來看,過去10年,超過三分之二的人工智慧創新集中在交通、工業和消費等產業應用。
接下來,我們預期生成式音訊(generative audio)將在2024年大規模出現,並顛覆遊戲和電影製作等產業。
人工智慧走出冬眠
#隨著OpenAI的ChatGPT於2022年11月發布,人們對人工智慧的興趣激增,不僅是普通人,企業也是如此。 2022年,公司文件中提到「人工智慧」的次數超過71.5萬次,而2020年僅13.5萬次。根據我們的調查,到2023年4月,41%的美國人已經聽說過ChatGPT,而近60%的人表示他們的工作已經在某種程度上開始使用ChatGPT。
此外,在5月18日的新聞中,ChatGPT在美國發布了第一個應用程式版本後,現在可以在iPhone上使用。谷歌也於5月5日宣布,將開始推出整合到搜尋產品中的生成式人工智慧工具。在進一步研究之前,我們先對人工智慧進行簡單的定義——人工智慧是一種基於機器的系統,人類給出一組給定的目標,它可以做出預測、建議甚至決定,這可能會影響現實或虛擬環境。
人工智慧其實已經醞釀好幾年了。自2012年以來,與人工智慧相關的創投交易活動和已公佈的專利一直在悄悄飆升。例如,創投數量從2012年的332筆增加到2022年的3884筆。 2022年,創投交易價值達830億美元,高於2012年的18億美元。同時,自2012年以來,人工智慧的專利數量增加了7倍。
人工智慧產業的進入門檻一直在降低,這刺激了該領域的商業創新。例如,自2018年以來,影像分類系統的訓練成本降低了64%,而訓練時間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內的眾多新創公司和創投公司也紛紛湧現。據報道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(Salesforce)和Zoom。此外,一家倫敦的人工智慧公司Builder. Ai在最新一輪融資中籌集了2.5億美元。
為了正確預測人工智慧即將到來的情況,我們也研究了該領域的專利。我們預計,獲得創投的公司大約需要兩到三年才能將產品推向市場,甚至需要更長的時間等待專利批准,例如七至十年。就專利而言,在公司專利獲得保護後,他們則需要行銷,選擇商業夥伴等,這大概需要一到三年時間。
透過世界智慧財產權組織Patentscope,我們收集了193個該組織成員在2012年至2022年期間公佈的175072項人工智慧專利條目,這些專利分為五大類,其中包括部門應用(sectoral applications)、服務平台(horizontal platforms)、自動化機器(autonomous machines)和半導體(semiconductors)。在創投方面,我們使用的是經合組織人工智慧資料庫涵蓋的92個經濟體的24310筆交易。
1. 人工智慧景觀-將創意帶入生活
股市反應如何
#迅速採用ChatGPT和其他新的人工智慧的公司股價飆升。例如,2023年1月31日,人工智慧軟體企業C3. ai推出了集OpenAI、Google、學術研究等人工智慧技術於一體的「生成式人工智慧產品套件」。當日,該公司股價上漲近22%,自今年初以來已累計上漲143%。
人工智慧音訊和語音辨識軟體公司SoundHound的股價今年迄今已上漲66%。
不只是人工智慧軟體公司,人工智慧幾乎影響了價值鏈上的所有公司。英偉達是一家半導體公司,其生產的電腦晶片可以運行人工智慧模型,該公司股價上漲了110%。在大型科技公司之間的人工智慧競賽中,Meta也表現出色。
資金流向人工智慧
#2022年,全球對人工智慧的創投達到830億美元的峰值,高於2012年的18億美元。 Databricks和麻省理工學院發現,大多數公司已經開始廣泛部署人工智慧。在樣本中,到2022年未使用人工智慧的公司比例不到6%。
企業將從人工智慧成長中受益
多年來,人工智慧研究一直局限於學術界,如今正被應用於商業領域。學術界是先行者,從學術發表到獲得專利通常需要15年的時間。
然而,越來越明顯的是,人工智慧創新爆發的時機已經成熟。從2012年到2022年,49%的創投交易是在過去三年達成的。同樣,我們的資料庫中有52%的人工智慧相關專利在三年內發布。
2. 應用領域:人工智慧將在2023年成為主流
亞馬遜創辦人兼執行主席Jeff Bezos表示:「我們現在正在用機器學習和人工智慧來解決問題,現在發生的這一切都猶如科幻小說中所描述的內容。」
過去10年,與人工智慧相關的創投交易中,近五分之四是在產業應用領域。另有8%發生在自動化機器和汽車領域,還有13%發生在半導體領域。人工智慧相關專利的比例也類似。
產業應用:人工智慧不限於一個產業
目前,79%的創投交易和61%的專利發生在我們認為的「產業應用」。根據我們的定義,這包括消費、工業、資訊科技、運輸、醫療保健、金融服務業。
從2012年到2022年,創投交易數量從270筆增加到3006筆,增加了10倍多。 2022年,交易總額達620億美元,遠高於2012年的13億美元。在這些領域發布的專利也在蓬勃發展。自2012年以來,相關專利數量增加了6倍。擁有最多專利的公司都是公認的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。
服務平台:AI工具
#自2012年以來,我們看到服務平台(horizontal platforms)的專利數量增加了近6倍,包括人工智慧主核(AI core)、自然語言技術(natural language technology)、人工智慧自動化平台( AI automation platforms)、電腦視覺軟體(computer vision software)。服務型應用(Horizontal applications)是人工智慧開發和部署的重點模組,擁有這類專利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業。
自然語言處理(Natural language processing)是一種用於大型語言模型(LLMs)的人工智慧工具,隨著ChatGPT的出現而變得流行。自然語言處理的一些例子包括翻譯、自動糾錯、自動文字摘要、聊天機器人,以及金融領域的資訊需求等處理方式。
電腦視覺涉及使用人工智慧來分析視覺數據,並做出有意義的預測,包括臉部辨識、地理空間分析等。
微軟的Inner Eye技術已經可以幫助檢測腫瘤和異常細胞。在他們的最新研究中,微軟展示了其技術如何幫助臨床醫生。在電腦視覺專利數量最多的五家公司中,有兩家是中國公司,分別是百度和華為。
誰還需要駕照?自動駕駛已經到來
在過去十年中,8%的創投交易和16%的專利都發生在「自動化機器」領域。這類技術涵蓋兩個關鍵領域,分別是自動駕駛汽車和智慧機器人。在過去的十年裡,這個領域受到了許多關注。這在很大程度上與特斯拉的成功相吻合,特斯拉一直在試驗自動駕駛汽車系統。
從2012年到2022年,自動化機器領域的創投交易數量從22筆增加到363筆。智慧機器人就屬於這一類。這些機器人能夠在不需要人類幹預和輸入的情況下進行一定程度的操作。人工智慧通常用於協助機器人機型訓練和適應。三星、LG電子、英特爾以及中國的大疆公司和滴滴等公司在機器人專利方面地位穩固。
幾年來,自動駕駛汽車也一直是人們討論的焦點。除了特斯拉之外,其他公司也在擴大對自動駕駛汽車所需技術的研究和投資,因此,創投和專利申請的大幅增加很可能是在這個背景下發生的。
半導體晶片
#英偉達執行長黃仁勳表示:「很明顯,人工智慧將影響每個產業。我認為每個國家都需要確保人工智慧是其國家戰略的一部分,每個國家都會受到影響。」
半導體佔人工智慧相關風投交易的13%,佔已公佈專利的4%,包括處理器設計(processor design)、邊緣人工智慧軟體(edge AI software)、智慧感測器和裝置(intelligent sensors & devices)。
從2012年到2022年,半導體領域的創投交易從40筆增加到515筆。 2022年,該領域交易總額達94億美元,高於2012年的2億美元。同樣,從2012年到2022年,該領域專利數量增加了7倍。
自1970年代以來,晶片經歷了快速的創新,晶片性能每隔幾年就會翻倍。生產商必須跟上發展的步伐,否則就有被甩在後面的風險。隨著科技變得越來越複雜,新工具是必要的,這正是人工智慧可以發揮作用的地方。
3. 2024年及以後的新機會
生成式音訊可能是下一個大熱門
人工智慧現在能夠根據不同語言、口音和方言的文字輸入創造人類的聲音和合成音訊。它使用了在ChatGPT中流行的生成式人工智慧。
從2020年第一季到2022年第四季,提到「生成式音訊(generative audio)」的公司檔案數量增加了13倍以上。
隨著音樂和聲音研發的深入,我們可能會看到新競爭者的爆炸性增長。很快,人們可以輸入文字或圖像來產生音訊內容,而不需要音訊專家或電腦專家。
這可能會影響遊戲、通訊、音樂、新聞和醫療保健等一系列領域。擁有生成式音訊相關專利最多的公司包括索尼(Sony)、亞馬遜、華為、位元組跳動、Adobe、蘋果和騰訊。
可以產生什麼音訊?
生成式音訊分為四個主要類別,包括合成聲音(synthetic voice)、語音互動(speech interaction)、音樂生成(music generation)和音訊編輯(audio editing)。首先,透過深度學習,人工智慧可以高品質地合成真實的人聲,包括音高、音調和節奏。語音互動包括虛擬助理等技術,例如蘋果的Siri和亞馬遜的Alexa。隨著科技的發展,人類與人工智慧之間的「自然」互動可能會越來越多。
音樂生成技術可以輕鬆創造出種類繁多的新音樂。例如Spotify的DJ和Aimi Studio。人工智慧音樂已經對音樂產業構成了挑戰。
最後,音訊編輯可以使用人工智慧來提高音訊錄製品質。
結論
人工智慧來了,新的創新就在眼前。以專利和創投等指標進行衡量,人工智慧領域的創新在過去10年呈現爆炸性成長。從創投活動和專利來看,過去十年中,超過三分之二的人工智慧創新集中在交通、工業和消費者應用等領域,其次是自動化機器和服務型應用、半導體產業。
在2023年後,我們預期生成音訊創新將會激增。隨著ChatGPT和DALL-E的到來,我們已經看到生成式人工智慧引起了世界的關注。這些技術將共同改變遊戲和電影製作等產業。
作 者 | BT財經
來 源 | 德意志銀行
以上是AI產業研發:生成式文字後即將爆發生成式音訊?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

由於AI的快速整合而加劇了工作場所的迅速危機危機,要求戰略轉變以外的增量調整。 WTI的調查結果強調了這一點:68%的員工在工作量上掙扎,導致BUR

約翰·塞爾(John Searle)的中國房間論點:對AI理解的挑戰 Searle的思想實驗直接質疑人工智能是否可以真正理解語言或具有真正意識。 想像一個人,對下巴一無所知

與西方同行相比,中國的科技巨頭在AI開發方面的課程不同。 他們不專注於技術基準和API集成,而是優先考慮“屏幕感知” AI助手 - AI T

MCP:賦能AI系統訪問外部工具 模型上下文協議(MCP)讓AI應用能夠通過標準化接口與外部工具和數據源交互。由Anthropic開發並得到主要AI提供商的支持,MCP允許語言模型和智能體發現可用工具並使用合適的參數調用它們。然而,實施MCP服務器存在一些挑戰,包括環境衝突、安全漏洞以及跨平台行為不一致。 Forbes文章《Anthropic的模型上下文協議是AI智能體發展的一大步》作者:Janakiram MSVDocker通過容器化解決了這些問題。基於Docker Hub基礎設施構建的Doc

有遠見的企業家採用的六種策略,他們利用尖端技術和精明的商業敏銳度來創造高利潤的可擴展公司,同時保持控制。本指南是針對有抱負的企業家的,旨在建立一個

Google Photos的新型Ultra HDR工具:改變圖像增強的遊戲規則 Google Photos推出了一個功能強大的Ultra HDR轉換工具,將標準照片轉換為充滿活力的高動態範圍圖像。這種增強功能受益於攝影師

技術架構解決了新興的身份驗證挑戰 代理身份集線器解決了許多組織僅在開始AI代理實施後發現的問題,即傳統身份驗證方法不是為機器設計的

(注意:Google是我公司的諮詢客戶,Moor Insights&Strateging。) AI:從實驗到企業基金會 Google Cloud Next 2025展示了AI從實驗功能到企業技術的核心組成部分的演變,


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

ZendStudio 13.5.1 Mac
強大的PHP整合開發環境

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

記事本++7.3.1
好用且免費的程式碼編輯器

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),