>  기사  >  기술 주변기기  >  AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

王林
王林앞으로
2023-06-09 22:58:291143검색

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

인공 지능은 세계적인 열풍으로 폭발하기 전까지 수년 동안 양조되어 왔습니다. 미래의 AI 혁신을 제대로 예측하기 위해 우리는 근원으로 돌아가 AI 애플리케이션에 대한 특허 및 벤처 캐피탈 거래 활동을 조사했습니다.

우리는 2012년부터 2022년 사이에 193개 세계지적재산권기구(WIPO) 회원이 발행한 175,072개의 인공지능 특허를 5개 주요 범주로 분류하여 수집했습니다. 벤처 캐피털 투자의 경우 OECD 인공 지능 데이터베이스에서 2012년부터 2022년까지 92개 국가에서 24,310건의 거래에 대한 데이터를 사용했습니다.

절대적으로 보면 인공지능 분야의 벤처캐피탈 활동과 특허 건수는 2012년부터 급증했습니다. 이 기간 벤처캐피털 거래 건수는 3,884건으로 10배 증가했고, 2022년 거래액은 2012년 대비 거의 50배 증가한 830억 달러에 달한다. 동시에, 2022년에는 인공지능 특허 수가 7배 증가하여 거의 37,000개에 이르렀습니다.

벤처캐피탈 거래와 특허로 판단하면 지난 10년 동안 인공지능 혁신의 3분의 2 이상이 운송, 산업, 소비자 산업 분야의 응용 분야에 집중되었습니다.

다음으로 2024년에는 생성 오디오가 대규모로 등장하여 게임, 영화 제작 등 산업에 큰 변화를 가져올 것으로 예상됩니다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

인공지능이 최대 절전 모드에서 나옵니다

2022년 11월 OpenAI의 ChatGPT가 출시되면서 일반인뿐만 아니라 기업에서도 인공지능에 대한 관심이 급증했습니다. 2022년에는 회사 문서에서 '인공지능'이 715,000번 이상 언급되었는데, 2020년에는 135,000번만 언급되었습니다. 설문조사에 따르면 2023년 4월까지 미국인의 41%가 ChatGPT에 대해 들어본 적이 있으며 거의 ​​60%가 자신의 업무에서 이미 ChatGPT를 어느 정도 사용하고 있다고 답했습니다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

또한 5월 18일 뉴스에 따르면 ChatGPT는 미국에서 첫 번째 앱 버전을 출시한 후 이제 iPhone에서 사용할 수 있습니다. 구글은 또한 5월 5일 검색 제품에 통합된 생성 인공 지능 도구를 출시하기 시작할 것이라고 발표했습니다. 더 나아가기 전에 인공 지능을 간략하게 정의하겠습니다. 인공 지능은 인간이 주어진 일련의 목표를 바탕으로 현실이나 가상 환경에 영향을 미칠 수 있는 예측, 권장 사항, 심지어 결정을 내릴 수 있는 기계 기반 시스템입니다.

인공지능은 실제로 수년 동안 양조되어 왔습니다. AI 관련 벤처 캐피탈 거래 활동과 공개 특허는 2012년부터 조용히 급증해 왔습니다. 예를 들어 벤처캐피탈 투자 건수는 2012년 332건에서 2022년 3,884건으로 증가했다. 2022년에는 벤처 캐피탈 거래 규모가 2012년 18억 달러에서 830억 달러로 증가할 것입니다. 동시에 인공지능 관련 특허 건수도 2012년 이후 7배 증가했다.

인공지능 산업의 진입 장벽이 낮아지면서 이 분야의 비즈니스 혁신이 촉진되었습니다. 예를 들어, 2018년부터 이미지 분류 시스템에 대한 교육 비용은 64% 감소하고 교육 시간은 94% 단축되었습니다. OpenAI, Anthropic, Stability AI, A121 Labs, Midjourney 및 Cohere를 비롯한 많은 스타트업 및 벤처 캐피탈 회사도 등장했습니다. Anthropic은 최근 Alphabet, Salesforce 및 Zoom의 참여를 통해 시리즈 C 자금에서 4억 5천만 달러를 모금한 것으로 알려졌습니다. 또한, 런던에 본사를 둔 인공 지능 회사인 Builder.Ai는 최근 자금 조달 라운드에서 2억 5천만 달러를 모금했습니다.

인공지능의 미래를 정확하게 예측하기 위해 이 분야의 특허도 살펴봤습니다. 벤처기업이 제품을 시장에 내놓는 데는 약 2~3년이 걸릴 것으로 추산되며, 특허 승인에는 7~10년 정도 더 오랜 시간이 걸릴 것으로 예상된다. 특허의 경우 기업의 특허가 보호된 후 마케팅, 비즈니스 파트너 선정 등의 과정을 거쳐야 하는데 약 1~3년 정도 소요됩니다.

세계지식재산권기구의 특허범위를 통해 우리는 2012년부터 2022년까지 조직의 193개 회원이 발행한 175,072개의 인공지능 특허 항목을 수집했습니다. 이러한 특허는 부문별 애플리케이션 및 서비스 플랫폼(수평 플랫폼)을 포함하여 5가지 주요 범주로 분류됩니다. 자동화된 기계(자율 기계)와 반도체(반도체). 벤처 캐피털 측면에서 우리는 OECD AI 데이터베이스에 포함된 92개 국가에서 24,310개의 거래를 사용했습니다.

1. 인공 지능 환경 - 창의성을 생활화합니다

주식시장은 어떻게 반응했나

ChatGPT와 기타 새로운 AI를 빠르게 도입한 기업의 주가는 급등했습니다. 예를 들어, 2023년 1월 31일 인공지능 소프트웨어 회사인 C3.ai는 OpenAI, Google, 학술 연구 및 기타 인공지능 기술을 통합한 '생성 인공지능 제품군'을 출시했습니다. 이날 회사 주가는 약 22% 상승했고, 올해 초 이후 143% 상승했다.

인공 지능 오디오 및 음성 인식 소프트웨어 회사인 SoundHound의 주가는 현재까지 66% 상승했습니다.

인공지능 소프트웨어 회사뿐만 아니라 가치 사슬에 있는 거의 모든 회사에 인공지능이 영향을 미칩니다. 인공지능 모델을 구동할 수 있는 컴퓨터 칩을 만드는 반도체 회사 엔비디아의 주가는 110% 상승했다. 메타는 대기업 간 인공지능 경쟁에서도 좋은 성적을 낸다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

인공지능으로 흘러가는 자금

인공지능에 대한 글로벌 벤처캐피탈 투자는 2012년 18억 달러에서 2022년 830억 달러로 정점에 이를 것으로 예상된다. Databricks와 MIT는 대부분의 기업이 이미 AI를 광범위하게 배포하고 있음을 발견했습니다. 표본에서 2022년까지 인공지능을 사용하지 않는 기업의 비율은 6% 미만이다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

기업은 AI 성장의 혜택을 누릴 것입니다

수년 동안 인공지능 연구는 학계에만 국한되어 있었지만 이제는 상업 분야에도 적용되고 있습니다. 학계는 퍼스트 무버(First Mover)로, 학술 출판부터 특허 획득까지 보통 15년이 걸린다.

그러나 AI 혁신이 폭발적으로 증가할 때가 무르익었다는 것이 점점 더 분명해지고 있습니다. 2012년부터 2022년까지 벤처 캐피탈 거래의 49%가 지난 3년 동안 완료되었습니다. 마찬가지로, 우리 데이터베이스에 있는 AI 관련 특허의 52%가 3년 이내에 발행되었습니다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

2. 응용 분야: 2023년에는 인공지능이 주류가 될 것입니다

Amazon 창립자이자 회장인 Jeff Bezos는 "우리는 이제 문제를 해결하기 위해 기계 학습과 인공 지능을 사용하고 있으며 지금 일어나고 있는 일은 공상 과학 소설에 묘사된 것과 같습니다."라고 말했습니다.

지난 10년 동안 인공지능 관련 벤처 캐피털 거래의 거의 4/5가 산업 애플리케이션에서 이루어졌습니다. 또 자동화된 기계와 자동차에서 8%가 발생했고, 반도체에서 13%가 발생했다. AI 관련 특허 비중도 비슷하다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

산업 적용: 인공 지능은 하나의 산업에만 국한되지 않습니다

현재 VC 거래의 79%와 특허의 61%가 "산업 애플리케이션"으로 간주되는 분야에서 발생합니다. 우리의 정의에 따르면 여기에는 소비자, 산업, 정보 기술, 운송, 의료 및 금융 서비스가 포함됩니다.

2012년부터 2022년까지 벤처캐피탈 거래 건수는 270건에서 3006건으로 10배 이상 증가했습니다. 2022년에는 총 거래 규모가 620억 달러에 달해 2012년 13억 달러보다 훨씬 높아질 것입니다. 이 분야에서 발행된 특허도 호황을 누리고 있습니다. 2012년 이후 관련 특허 수가 6배 증가했다. 특허를 가장 많이 보유한 기업은 IBM, 삼성, 인텔, LG전자, 퀄컴 등 인정받는 기술 대기업들이다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

서비스 플랫폼: AI 도구

2012년 이후 인공지능 코어(AI 코어), 자연어 기술(자연어 기술), 인공지능 자동화 플랫폼(AI 자동화) 플랫폼), 컴퓨터 비전 등 수평적 플랫폼에 대한 특허 수가 거의 6배 증가했습니다. 소프트웨어. 서비스 지향 애플리케이션(수평 애플리케이션)은 인공 지능 개발 및 배포의 핵심 모듈입니다. 이러한 특허를 보유한 회사에는 AT&T, IBM, LG 전자, Baidu 및 기존 기술 회사가 포함됩니다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

자연어 처리는 ChatGPT의 등장과 함께 인기를 얻은 LLM(대형 언어 모델)을 위한 인공 지능 도구입니다. 자연어 처리의 예로는 번역, 자동 오류 수정, 자동 텍스트 요약, 챗봇, 금융 부문의 정보 요구 처리 등이 있습니다.

컴퓨터 비전에는 인공 지능을 사용하여 시각적 데이터를 분석하고 얼굴 인식, 지리 공간 분석 등을 포함한 의미 있는 예측을 수행하는 작업이 포함됩니다.

Microsoft의 Inner Eye 기술은 이미 종양과 비정상 세포를 감지하는 데 도움을 줄 수 있습니다. 최신 연구에서 Microsoft는 자사의 기술이 임상의에게 어떻게 도움이 될 수 있는지 보여줍니다. 컴퓨터 비전 특허를 가장 많이 보유한 5개 기업 중 바이두(Baidu)와 화웨이(Huawei) 등 2개 기업이 중국 기업이다.

더 이상 운전면허증이 필요한 사람은 누구인가요? 자율주행이 도래했습니다

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

지난 10년 동안 벤처 캐피탈 거래의 8%와 특허의 16%가 "자동화 기계" 분야에서 발생했습니다. 이러한 유형의 기술은 자율주행차와 지능형 로봇이라는 두 가지 핵심 영역을 포괄합니다. 이 분야는 지난 10년 동안 많은 주목을 받아왔습니다. 이는 자율주행차 시스템을 실험해온 테슬라의 성공과 크게 일치한다.

2012년부터 2022년까지 자동화 기계 분야 벤처캐피털 거래 건수는 22건에서 363건으로 늘어났습니다. 지능형 로봇이 이 범주에 속합니다. 이 로봇은 인간의 개입이나 입력 없이도 어느 정도 작동할 수 있습니다. 인공 지능은 종종 로봇 모델 훈련 및 적응을 지원하는 데 사용됩니다. 삼성, LG전자, 인텔, 중국의 DJI, 디디 등의 기업이 로봇 특허 분야에서 강력한 입지를 점하고 있다.

자율주행차 역시 수년째 화제의 대상이었습니다. 테슬라 외에도 다른 기업들도 자율주행차에 필요한 기술에 대한 연구와 투자를 확대하고 있어 벤처캐피털 투자와 특허출원도 크게 늘어날 가능성이 크다.

반도체 칩

Nvidia CEO Jensen Huang은 다음과 같이 말했습니다. "인공지능이 모든 산업에 영향을 미칠 것은 분명합니다. 모든 국가는 인공지능이 국가 전략의 일부임을 보장해야 하며 모든 국가가 영향을 받을 것입니다."

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

반도체는 프로세서 설계, 엣지 AI 소프트웨어, 지능형 센서 및 장치를 포함하여 AI 관련 벤처 캐피탈 거래의 13%, 공개 특허의 4%를 차지합니다.

2012년부터 2022년까지 반도체 분야 벤처캐피탈 거래가 40건에서 515건으로 늘어났습니다. 2022년에는 이 분야의 총 거래 건수는 2012년 2억 달러에서 94억 달러로 증가할 것입니다. 마찬가지로, 이 분야의 특허 수는 2012년부터 2022년까지 7배 증가했습니다.

1970년대부터 칩은 빠른 혁신을 경험해 왔으며, 칩 성능은 몇 년마다 두 배로 향상되었습니다. 생산자는 개발 상황을 따라잡지 않으면 뒤쳐질 위험이 있습니다. 기술이 더욱 복잡해짐에 따라 새로운 도구가 필요하며, 인공지능이 이를 도울 수 있습니다.

3. 2024년 이후의 새로운 기회

제너레이티브 오디오가 차세대 기술이 될 수 있습니다

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

AI는 이제 다양한 언어, 억양 및 방언으로 입력된 텍스트를 기반으로 사람의 음성과 합성 오디오를 생성할 수 있습니다. ChatGPT에서 널리 사용되는 생성 인공 지능을 사용합니다.

2020년 1분기부터 2022년 4분기까지 '제너레이티브 오디오'를 언급한 회사 문서 수가 13배 이상 증가했습니다.

음악과 사운드 연구 및 개발이 심화됨에 따라 새로운 경쟁자가 폭발적으로 증가할 수도 있습니다. 머지않아 사람들은 오디오 전문가나 컴퓨터 전문가 없이도 텍스트나 이미지를 입력하여 오디오 콘텐츠를 생성할 수 있게 될 것입니다.

이는 게임, 통신, 음악, 뉴스, 의료 등 다양한 분야에 영향을 미칠 수 있습니다. 가장 생성적인 오디오 관련 특허를 보유한 회사로는 Sony, Amazon, Huawei, ByteDance, Adobe, Apple 및 Tencent가 있습니다.

어떤 오디오를 생성할 수 있나요?

생성 오디오는 합성 음성, 음성 상호 작용, 음악 생성 및 오디오 편집을 포함한 네 가지 주요 범주로 나뉩니다. 첫째, 인공지능은 딥러닝을 통해 실제 사람의 목소리를 높낮이, 톤, 리듬 등 고품질로 합성할 수 있습니다. 음성 상호 작용에는 Apple의 Siri 및 Amazon의 Alexa와 같은 가상 비서와 같은 기술이 포함됩니다. 기술이 발전함에 따라 인간과 인공 지능 사이의 "자연스러운" 상호 작용이 점점 더 많아질 수 있습니다.

음악 생성 기술을 사용하면 다양한 새로운 음악을 쉽게 만들 수 있습니다. 예를 들면 Spotify의 DJ와 Aimi Studio가 있습니다. 인공지능 음악은 이미 음악산업에 도전장을 던지고 있다.

마지막으로 오디오 편집자는 인공 지능을 사용하여 오디오 녹음 품질을 향상시킬 수 있습니다.

AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?

결론

인공지능이 여기에 있고, 새로운 혁신이 곧 다가옵니다. 특허, 벤처캐피탈 등 지표로 측정해 보면 지난 10년 동안 인공지능 분야의 혁신이 폭발적으로 늘어났다. 벤처캐피탈 활동과 특허로 판단하면 지난 10년 동안 인공지능 혁신의 3분의 2 이상이 운송, 산업 및 소비자 애플리케이션에 집중되었고, 자동화된 기계 및 서비스 애플리케이션, 반도체 산업이 그 뒤를 이었습니다.

2023년 이후에는 제너레이티브 오디오 혁신이 급증할 것으로 예상됩니다. ChatGPT와 DALL-E의 등장으로 생성 AI가 전 세계의 주목을 받는 것을 보았습니다. 이러한 기술은 함께 게임 및 영화 제작과 같은 산업을 변화시킬 것입니다.

저자 BT금융

출처 도이체방크

위 내용은 AI 산업 연구 보고서: 생성 오디오가 곧 생성 텍스트 이후에 등장하게 될까요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 sohu.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제