Rumah > Artikel > Peranti teknologi > Laporan Penyelidikan Industri AI: Adakah audio generatif akan keluar selepas teks generatif?
Kecerdasan buatan telah berkembang selama bertahun-tahun sebelum ia meletup menjadi kegilaan global. Untuk meramalkan inovasi AI masa depan dengan betul, kami kembali ke sumber dan meneliti aktiviti perjanjian paten dan modal teroka untuk aplikasi AI.
Kami mengumpul 175,072 paten kecerdasan buatan yang diterbitkan oleh 193 ahli Pertubuhan Harta Intelek Dunia (WIPO) antara 2012 dan 2022, dibahagikan kepada lima kategori utama. Untuk pelaburan modal teroka, kami menggunakan data mengenai 24,310 transaksi dalam 92 ekonomi dari 2012 hingga 2022 daripada Pangkalan Data Kepintaran Buatan OECD.
Dalam istilah mutlak, aktiviti modal teroka dan bilangan paten dalam bidang kecerdasan buatan telah meningkat sejak 2012. Dalam tempoh ini, bilangan urus niaga modal teroka meningkat sepuluh kali ganda kepada 3,884, dan nilai urus niaga pada 2022 hampir 50 kali ganda berbanding 2012, mencecah AS$83 bilion. Pada masa yang sama, bilangan paten kecerdasan buatan meningkat tujuh kali ganda pada 2022, mencecah hampir 37,000.
Berdasarkan urus niaga modal teroka dan paten, lebih daripada dua pertiga daripada inovasi kecerdasan buatan dalam tempoh 10 tahun yang lalu telah tertumpu dalam aplikasi dalam industri pengangkutan, industri dan pengguna.
Seterusnya, kami menjangkakan bahawa audio generatif akan muncul secara besar-besaran pada tahun 2024 dan mengganggu industri seperti permainan dan penerbitan filem.
Kecerdasan buatan keluar daripada hibernasi
Dengan keluaran OpenAI's ChatGPT pada November 2022, minat orang ramai terhadap kecerdasan buatan telah melonjak, bukan sahaja daripada orang biasa, tetapi juga daripada perusahaan. Pada 2022, "kecerdasan buatan" disebut lebih daripada 715,000 kali dalam dokumen syarikat, berbanding hanya 135,000 kali pada 2020. Menurut tinjauan kami, menjelang April 2023, 41% rakyat Amerika telah mendengar tentang ChatGPT, dan hampir 60% mengatakan kerja mereka sudah menggunakan ChatGPT sedikit sebanyak.
Selain itu, dalam berita pada 18 Mei, ChatGPT kini tersedia pada iPhone selepas mengeluarkan versi apl pertamanya di Amerika Syarikat. Google juga mengumumkan pada 5 Mei bahawa ia akan mula melancarkan alat kecerdasan buatan generatif yang disepadukan ke dalam produk cariannya. Sebelum melangkah lebih jauh, mari kita takrifkan secara ringkas kecerdasan buatan - kecerdasan buatan ialah sistem berasaskan mesin yang, berdasarkan set matlamat tertentu oleh manusia, boleh membuat ramalan, pengesyoran dan juga keputusan yang mungkin menjejaskan realiti atau persekitaran maya.
Kecerdasan buatan sebenarnya telah dibuat selama beberapa tahun. Aktiviti perjanjian modal teroka berkaitan AI dan paten yang diterbitkan telah melonjak secara senyap-senyap sejak 2012. Sebagai contoh, bilangan pelaburan modal teroka meningkat daripada 332 pada 2012 kepada 3,884 pada 2022. Pada 2022, nilai urus niaga modal teroka akan mencecah $83 bilion, meningkat daripada $1.8 bilion pada 2012. Pada masa yang sama, bilangan paten dalam kecerdasan buatan telah meningkat tujuh kali ganda sejak 2012.
Halangan kemasukan dalam industri kecerdasan buatan telah diturunkan, yang telah merangsang inovasi perniagaan dalam bidang ini. Sebagai contoh, sejak 2018, kos latihan untuk sistem klasifikasi imej telah dikurangkan sebanyak 64%, manakala masa latihan telah dikurangkan sebanyak 94%. Banyak syarikat permulaan dan modal teroka juga telah muncul, termasuk OpenAI, Anthropic, Stability AI, A121 Labs, Midjourney dan Cohere. Anthropic dilaporkan baru-baru ini mengumpulkan $450 juta dalam pembiayaan Siri C, dengan penyertaan daripada Alphabet, Salesforce dan Zoom. Selain itu, Builder.Ai, sebuah syarikat kecerdasan buatan yang berpangkalan di London, mengumpul $250 juta dalam pusingan pembiayaan terkininya.
Untuk meramalkan dengan betul perkara yang akan datang dalam kecerdasan buatan, kami juga melihat paten dalam bidang tersebut. Kami menganggarkan bahawa ia akan mengambil masa kira-kira dua hingga tiga tahun untuk syarikat yang disokong usaha niaga untuk membawa produk ke pasaran, dan lebih lama lagi, seperti tujuh hingga sepuluh tahun, untuk kelulusan paten. Setakat paten berkenaan, selepas paten syarikat dilindungi, mereka perlu memasarkan, memilih rakan kongsi perniagaan, dsb., yang mengambil masa kira-kira satu hingga tiga tahun.
Melalui Patentscope of the World Intellectual Property Organization, kami mengumpul 175,072 entri paten kecerdasan buatan yang diterbitkan oleh 193 ahli organisasi antara 2012 dan 2022. Paten ini dibahagikan kepada lima kategori utama, termasuk aplikasi sektoral, platform perkhidmatan (platform mendatar) , mesin automatik (mesin autonomi) dan semikonduktor (konduktor). Dari segi modal teroka, kami menggunakan 24,310 tawaran merentasi 92 ekonomi yang diliputi oleh pangkalan data AI OECD.
1. Landskap Kepintaran Buatan - Menghidupkan Kreativiti
Bagaimana reaksi pasaran saham
Harga saham syarikat yang cepat mengguna pakai ChatGPT dan AI baharu yang lain melambung tinggi. Contohnya, pada 31 Januari 2023, syarikat perisian kecerdasan buatan C3 ai melancarkan "suite produk kecerdasan buatan generatif" yang menyepadukan OpenAI, Google, penyelidikan akademik dan teknologi kecerdasan buatan yang lain. Harga saham syarikat meningkat hampir 22% pada hari itu, dan telah meningkat 143% sejak awal tahun ini.
Saham SoundHound, sebuah syarikat perisian pengecaman audio dan pertuturan kecerdasan buatan, meningkat 66% tahun setakat ini.
Bukan hanya syarikat perisian kecerdasan buatan, kecerdasan buatan mempengaruhi hampir semua syarikat dalam rantaian nilai. Saham Nvidia, sebuah syarikat semikonduktor yang membuat cip komputer yang boleh menjalankan model kecerdasan buatan, meningkat 110%. Meta juga berprestasi baik dalam perlumbaan kecerdasan buatan di kalangan syarikat teknologi besar.
Dana mengalir ke kecerdasan buatan
Pelaburan modal teroka global dalam kecerdasan buatan akan memuncak pada AS$83 bilion pada 2022, meningkat daripada AS$1.8 bilion pada 2012. Databricks dan MIT mendapati bahawa kebanyakan syarikat sudah menggunakan AI secara meluas. Dalam sampel, bahagian syarikat yang tidak menggunakan kecerdasan buatan menjelang 2022 adalah kurang daripada 6%.
Perniagaan akan mendapat manfaat daripada pertumbuhan AI
Selama bertahun-tahun, penyelidikan kecerdasan buatan terhad kepada akademik, tetapi kini ia digunakan dalam bidang komersial. Akademia adalah penggerak pertama, dan biasanya mengambil masa 15 tahun dari penerbitan akademik untuk mendapatkan paten.
Walau bagaimanapun, semakin jelas bahawa masanya sudah tiba untuk ledakan inovasi AI. Dari 2012 hingga 2022, 49% daripada urus niaga modal teroka telah diselesaikan dalam tempoh tiga tahun yang lalu. Begitu juga, 52% daripada paten berkaitan AI dalam pangkalan data kami telah dikeluarkan dalam tempoh tiga tahun.
2. Bidang aplikasi: Kepintaran buatan akan menjadi arus perdana pada 2023
Pengasas dan pengerusi eksekutif Amazon Jeff Bezos berkata: "Kami kini menggunakan pembelajaran mesin dan kecerdasan buatan untuk menyelesaikan masalah, dan apa yang berlaku sekarang adalah seperti sesuatu yang diterangkan dalam novel fiksyen sains."
Dalam 10 tahun yang lalu, hampir empat perlima daripada urus niaga modal teroka berkaitan kecerdasan buatan adalah dalam aplikasi industri. 8% lagi berlaku dalam mesin dan kereta automatik, dan 13% berlaku dalam semikonduktor. Perkadaran paten berkaitan AI adalah serupa.
Aplikasi Industri: Kepintaran Buatan tidak terhad kepada satu industri
Pada masa ini, 79% daripada tawaran VC dan 61% daripada paten berlaku dalam perkara yang kami anggap sebagai "aplikasi industri." Mengikut definisi kami, ini termasuk perkhidmatan pengguna, perindustrian, teknologi maklumat, pengangkutan, penjagaan kesihatan dan kewangan.Dari 2012 hingga 2022, bilangan urus niaga modal teroka meningkat daripada 270 kepada 3,006, peningkatan lebih daripada 10 kali ganda. Pada 2022, jumlah volum urus niaga akan mencecah AS$62 bilion, jauh lebih tinggi daripada AS$1.3 bilion pada 2012. Paten yang dikeluarkan di kawasan ini juga berkembang pesat. Sejak 2012, bilangan paten yang berkaitan telah meningkat enam kali ganda. Syarikat yang mempunyai paten terbanyak adalah gergasi teknologi yang diiktiraf seperti IBM, Samsung, Intel, LG Electronics dan Qualcomm.
Platform perkhidmatan: alatan AI
Sejak 2012, kami telah melihat bilangan paten untuk platform mendatar meningkat hampir 6 kali ganda, termasuk teras kecerdasan buatan (teras AI), teknologi bahasa semula jadi (teknologi bahasa semula jadi), platform automasi kecerdasan buatan (platform automasi AI), komputer perisian penglihatan. Aplikasi berorientasikan perkhidmatan (aplikasi mendatar) ialah modul utama dalam pembangunan dan penggunaan kecerdasan buatan Syarikat yang mempunyai paten seperti itu termasuk AT&T, IBM, LG Electronics, Baidu dan syarikat teknologi yang sudah mantap.
Pemprosesan bahasa semula jadi ialah alat kecerdasan buatan untuk model bahasa besar (LLM) yang menjadi popular dengan kemunculan ChatGPT. Beberapa contoh pemprosesan bahasa semula jadi termasuk terjemahan, pembetulan ralat automatik, ringkasan teks automatik, chatbots dan pemprosesan keperluan maklumat dalam sektor kewangan.
Penglihatan komputer melibatkan penggunaan kecerdasan buatan untuk menganalisis data visual dan membuat ramalan yang bermakna, termasuk pengecaman muka, analisis geospatial dan banyak lagi.
Teknologi Inner Eye Microsoft sudah boleh membantu mengesan tumor dan sel abnormal. Dalam penyelidikan terbaru mereka, Microsoft menunjukkan bagaimana teknologinya boleh membantu doktor. Antara lima syarikat yang mempunyai bilangan paten penglihatan komputer terbesar, dua adalah syarikat China, iaitu Baidu dan Huawei.
Siapa yang memerlukan lesen memandu lagi? Pemanduan autonomi telah tiba
Dalam dekad yang lalu, 8% daripada urus niaga modal teroka dan 16% daripada paten berlaku dalam bidang "mesin automatik." Teknologi jenis ini merangkumi dua bidang utama, iaitu kereta pandu sendiri dan robot pintar. Kawasan ini telah mendapat banyak perhatian sejak sedekad yang lalu. Ini sebahagian besarnya bertepatan dengan kejayaan Tesla, yang telah bereksperimen dengan sistem kereta pandu sendiri.
Dari 2012 hingga 2022, bilangan tawaran modal teroka dalam bidang mesin automatik meningkat daripada 22 kepada 363. Robot pintar termasuk dalam kategori ini. Robot ini mampu beroperasi pada tahap tertentu tanpa campur tangan dan input manusia. Kecerdasan buatan sering digunakan untuk membantu latihan dan penyesuaian model robot. Syarikat seperti Samsung, LG Electronics, Intel, dan DJI dan Didi China mempunyai kedudukan yang kukuh dalam paten robotik.
Kereta autonomi juga menjadi tumpuan perbincangan selama beberapa tahun. Selain Tesla, syarikat lain juga mengembangkan penyelidikan dan pelaburan dalam teknologi yang diperlukan untuk kereta pandu sendiri, jadi peningkatan ketara dalam pelaburan modal teroka dan aplikasi paten mungkin berlaku dalam konteks ini.
Cip Semikonduktor
Ketua Pegawai Eksekutif Nvidia Jensen Huang berkata: "Jelas bahawa kecerdasan buatan akan memberi kesan kepada setiap industri. Saya fikir setiap negara perlu memastikan bahawa kecerdasan buatan adalah sebahagian daripada strategi nasionalnya, dan setiap negara akan terjejas
Semikonduktor menyumbang 13% daripada urus niaga modal teroka berkaitan AI dan 4% daripada paten yang diterbitkan, termasuk reka bentuk pemproses, perisian AI tepi, penderia pintar & peranti).
Dari 2012 hingga 2022, urus niaga modal teroka dalam bidang semikonduktor meningkat daripada 40 kepada 515. Pada 2022, jumlah urus niaga dalam bidang ini akan mencecah AS$9.4 bilion, meningkat daripada AS$200 juta pada 2012. Begitu juga, bilangan paten dalam bidang ini meningkat tujuh kali ganda dari 2012 hingga 2022.
Sejak tahun 1970-an, cip telah mengalami inovasi pesat, dengan prestasi cip meningkat dua kali ganda setiap beberapa tahun. Pengeluar mesti mengikuti perkembangan atau risiko ketinggalan. Apabila teknologi menjadi lebih kompleks, alat baharu diperlukan, dan di sinilah kecerdasan buatan boleh membantu.
3. Peluang baharu pada tahun 2024 dan seterusnya
Audio generatif mungkin perkara besar seterusnya
AI kini mampu mencipta suara manusia dan audio yang disintesis berdasarkan input teks dalam bahasa, aksen dan dialek yang berbeza. Ia menggunakan kecerdasan buatan generatif yang popular di ChatGPT.
Dari suku pertama 2020 hingga suku keempat 2022, bilangan dokumen syarikat yang menyebut "audio generatif" meningkat lebih daripada 13 kali ganda.
Apabila muzik dan penyelidikan serta pembangunan yang mantap, kita mungkin melihat ledakan pesaing baharu. Tidak lama lagi, orang akan dapat memasukkan teks atau imej untuk menjana kandungan audio tanpa memerlukan pakar audio atau pakar komputer.
Ini boleh memberi kesan kepada pelbagai sektor termasuk permainan, komunikasi, muzik, berita dan penjagaan kesihatan. Syarikat yang mempunyai paten berkaitan audio paling generatif termasuk Sony, Amazon, Huawei, ByteDance, Adobe, Apple dan Tencent.
Apakah audio yang boleh dijana?
Audio generatif dibahagikan kepada empat kategori utama, termasuk suara sintetik, interaksi pertuturan, penjanaan muzik dan penyuntingan audio. Pertama, melalui pembelajaran mendalam, kecerdasan buatan boleh mensintesis suara manusia sebenar dengan kualiti tinggi, termasuk pic, nada dan irama. Interaksi suara termasuk teknologi seperti pembantu maya, seperti Siri Apple dan Alexa Amazon. Apabila teknologi berkembang, mungkin terdapat lebih banyak interaksi "semula jadi" antara manusia dan kecerdasan buatan.
Teknologi penjanaan muzik memudahkan anda mencipta pelbagai jenis muzik baharu. Contohnya termasuk DJ Spotify dan Aimi Studio. Muzik kecerdasan buatan sudah pun memberi cabaran kepada industri muzik.
Akhir sekali, editor audio boleh menggunakan kecerdasan buatan untuk meningkatkan kualiti rakaman audio.
Kesimpulan
Kecerdasan buatan ada di sini, dan inovasi baharu hampir tiba. Seperti yang diukur oleh penunjuk seperti paten dan modal teroka, inovasi dalam bidang kecerdasan buatan telah meletup sejak sedekad yang lalu. Berdasarkan aktiviti modal teroka dan paten, lebih daripada dua pertiga daripada inovasi kecerdasan buatan dalam dekad yang lalu telah tertumpu dalam aplikasi pengangkutan, perindustrian dan pengguna, diikuti oleh mesin automatik dan aplikasi perkhidmatan, dan industri semikonduktor.
Melebihi 2023, kami menjangkakan lonjakan dalam inovasi audio generatif. Dengan ketibaan ChatGPT dan DALL-E, kami telah melihat AI generatif menarik perhatian dunia. Bersama-sama, teknologi ini akan mengubah industri seperti permainan dan pengeluaran filem.
Pengarang |. BT Finance
Sumber |. Deutsche Bank
Atas ialah kandungan terperinci Laporan Penyelidikan Industri AI: Adakah audio generatif akan keluar selepas teks generatif?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!