Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

王林
王林nach vorne
2023-06-09 22:58:291177Durchsuche

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Künstliche Intelligenz braute sich viele Jahre lang zusammen, bevor sie zu einem weltweiten Hype wurde. Um zukünftige KI-Innovationen richtig vorherzusagen, sind wir zur Quelle zurückgekehrt und haben die Patent- und Risikokapitalgeschäftsaktivitäten für KI-Anwendungen untersucht.

Wir haben 175.072 Patente für künstliche Intelligenz gesammelt, die zwischen 2012 und 2022 von 193 Mitgliedern der Weltorganisation für geistiges Eigentum (WIPO) veröffentlicht wurden, unterteilt in fünf Hauptkategorien. Für Risikokapitalinvestitionen haben wir Daten zu 24.310 Transaktionen in 92 Volkswirtschaften von 2012 bis 2022 aus der OECD-Datenbank für künstliche Intelligenz verwendet.

In absoluten Zahlen sind die Risikokapitalaktivitäten und die Zahl der Patente im Bereich der künstlichen Intelligenz seit 2012 sprunghaft angestiegen. In diesem Zeitraum hat sich die Zahl der Risikokapitaltransaktionen auf 3.884 verzehnfacht, und der Wert der Transaktionen im Jahr 2022 ist fast 50-mal so hoch wie im Jahr 2012 und erreicht 83 Milliarden US-Dollar. Gleichzeitig hat sich die Zahl der Patente für künstliche Intelligenz im Jahr 2022 versiebenfacht und erreicht fast 37.000.

Nach Risikokapitaltransaktionen und Patenten zu urteilen, konzentrierten sich mehr als zwei Drittel der Innovationen im Bereich der künstlichen Intelligenz in den letzten 10 Jahren auf Anwendungen in der Transport-, Industrie- und Verbraucherindustrie.

Als nächstes gehen wir davon aus, dass generatives Audio im Jahr 2024 in großem Umfang auftauchen und Branchen wie Gaming und Filmproduktion revolutionieren wird.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Künstliche Intelligenz erwacht aus dem Winterschlaf

Mit der Veröffentlichung von OpenAIs ChatGPT im November 2022 ist das Interesse an künstlicher Intelligenz stark gestiegen, nicht nur bei einfachen Menschen, sondern auch bei Unternehmen. Im Jahr 2022 wurde „Künstliche Intelligenz“ mehr als 715.000 Mal in Unternehmensdokumenten erwähnt, verglichen mit nur 135.000 Mal im Jahr 2020. Laut unserer Umfrage haben bis April 2023 41 % der Amerikaner von ChatGPT gehört und fast 60 % geben an, dass ihre Arbeit ChatGPT bereits in gewissem Umfang nutzt.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Zu den Neuigkeiten vom 18. Mai gehört außerdem, dass ChatGPT jetzt auf dem iPhone verfügbar ist, nachdem seine erste App-Version in den USA veröffentlicht wurde. Google kündigte am 5. Mai außerdem an, mit der Einführung generativer künstlicher Intelligenz-Tools zu beginnen, die in seine Suchprodukte integriert sind. Bevor wir fortfahren, definieren wir kurz künstliche Intelligenz: Künstliche Intelligenz ist ein maschinenbasiertes System, das bei vorgegebenen Zielen des Menschen Vorhersagen, Empfehlungen und sogar Entscheidungen treffen kann, die sich auf die Realität oder die virtuelle Umgebung auswirken können.

Künstliche Intelligenz braut sich tatsächlich schon seit mehreren Jahren zusammen. Seit 2012 nehmen die KI-bezogenen Venture-Capital-Transaktionsaktivitäten und die veröffentlichten Patente stillschweigend zu. So stieg beispielsweise die Zahl der Venture-Capital-Investitionen von 332 im Jahr 2012 auf 3.884 im Jahr 2022. Im Jahr 2022 wird der Wert von Risikokapitaltransaktionen 83 Milliarden US-Dollar erreichen, gegenüber 1,8 Milliarden US-Dollar im Jahr 2012. Gleichzeitig hat sich die Zahl der Patente im Bereich Künstliche Intelligenz seit 2012 versiebenfacht.

Die Eintrittsbarrieren in die Branche der künstlichen Intelligenz wurden gesenkt, was die Geschäftsinnovation in diesem Bereich stimuliert hat. Beispielsweise konnten seit 2018 die Schulungskosten für Bildklassifizierungssysteme um 64 % und die Schulungszeit um 94 % gesenkt werden. Es sind auch viele Startups und Risikokapitalfirmen entstanden, darunter OpenAI, Anthropic, Stability AI, A121 Labs, Midjourney und Cohere. Berichten zufolge hat Anthropic kürzlich eine Serie-C-Finanzierung in Höhe von 450 Millionen US-Dollar eingesammelt, an der sich Alphabet, Salesforce und Zoom beteiligten. Darüber hinaus hat Builder.Ai, ein in London ansässiges Unternehmen für künstliche Intelligenz, in seiner jüngsten Finanzierungsrunde 250 Millionen US-Dollar eingesammelt.

Um richtig vorherzusagen, was in der Künstlichen Intelligenz auf uns zukommt, haben wir uns auch Patente in diesem Bereich angeschaut. Wir schätzen, dass es etwa zwei bis drei Jahre dauern wird, bis ein Venture-Capital-Unternehmen ein Produkt auf den Markt bringt, und sogar noch länger, etwa sieben bis zehn Jahre, bis zur Patentgenehmigung. Was Patente betrifft, so muss ein Unternehmen nach dem Schutz seines Patents die Vermarktung durchführen, Geschäftspartner auswählen usw., was etwa ein bis drei Jahre dauert.

Über Patentscope der Weltorganisation für geistiges Eigentum haben wir zwischen 2012 und 2022 175.072 Patenteinträge für künstliche Intelligenz gesammelt, die von 193 Mitgliedern der Organisation veröffentlicht wurden. Diese Patente sind in fünf Hauptkategorien unterteilt, darunter sektorale Anwendungen und Serviceplattformen (horizontale Plattformen). automatisierte Maschinen (autonome Maschinen) und Halbleiter (Halbleiter). Auf der Risikokapitalseite haben wir 24.310 Deals in 92 Volkswirtschaften genutzt, die in der OECD-KI-Datenbank abgedeckt sind.

1. Künstliche Intelligenzlandschaft – Kreativität zum Leben erwecken

Wie hat die Börse reagiert

Unternehmen, die ChatGPT und andere neue KI schnell einführten, verzeichneten einen Höhenflug ihrer Aktienkurse. Beispielsweise hat das Softwareunternehmen für künstliche Intelligenz C3 ai am 31. Januar 2023 eine „Produktsuite für generative künstliche Intelligenz“ auf den Markt gebracht, die OpenAI, Google, akademische Forschung und andere Technologien für künstliche Intelligenz integriert. Der Aktienkurs des Unternehmens stieg an diesem Tag um fast 22 % und ist seit Jahresbeginn um 143 % gestiegen.

Die Aktien von SoundHound, einem Unternehmen für Audio- und Spracherkennungssoftware für künstliche Intelligenz, sind seit Jahresbeginn um 66 % gestiegen.

Künstliche Intelligenz betrifft nicht nur Softwareunternehmen für künstliche Intelligenz, sondern fast alle Unternehmen in der Wertschöpfungskette. Die Aktien von Nvidia, einem Halbleiterunternehmen, das Computerchips herstellt, die Modelle für künstliche Intelligenz ausführen können, stiegen um 110 %. Auch im Wettlauf um künstliche Intelligenz unter den großen Technologieunternehmen schneidet Meta gut ab.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Mittel fließen in künstliche Intelligenz

Im Jahr 2022 werden die weltweiten Risikokapitalinvestitionen in künstliche Intelligenz einen Höchststand von 83 Milliarden US-Dollar erreichen, gegenüber 1,8 Milliarden US-Dollar im Jahr 2012. Databricks und MIT haben herausgefunden, dass die meisten Unternehmen KI bereits umfassend einsetzen. In der Stichprobe beträgt der Anteil der Unternehmen, die bis 2022 keine künstliche Intelligenz einsetzen, weniger als 6 %.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Unternehmen werden vom KI-Wachstum profitieren

Während viele Jahre die Forschung im Bereich der künstlichen Intelligenz auf die akademische Welt beschränkt war, wird sie nun auch im kommerziellen Bereich angewendet. Die Wissenschaft ist der Vorreiter, und von der wissenschaftlichen Veröffentlichung bis zur Erlangung eines Patents vergehen in der Regel 15 Jahre.

Es wird jedoch immer deutlicher, dass die Zeit reif für eine Explosion von KI-Innovationen ist. Von 2012 bis 2022 wurden 49 % der Venture-Capital-Deals in den letzten drei Jahren abgeschlossen. Ebenso wurden 52 % der KI-bezogenen Patente in unserer Datenbank innerhalb von drei Jahren erteilt.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

2. Anwendungsfelder: Künstliche Intelligenz wird im Jahr 2023 zum Mainstream werden

Amazon-Gründer und Vorstandsvorsitzender Jeff Bezos sagte: „Wir nutzen jetzt maschinelles Lernen und künstliche Intelligenz, um Probleme zu lösen, und was jetzt passiert, ähnelt etwas, das in einem Science-Fiction-Roman beschrieben wird

.“

In den letzten 10 Jahren fanden fast vier Fünftel der Risikokapitaltransaktionen im Zusammenhang mit künstlicher Intelligenz in Industrieanwendungen statt. Weitere 8 % entfielen auf automatisierte Maschinen und Automobile und 13 % auf Halbleiter. Der Anteil KI-bezogener Patente ist ähnlich.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Branchenanwendung: Künstliche Intelligenz ist nicht auf eine Branche beschränkt

Derzeit erfolgen 79 % der VC-Deals und 61 % der Patente in dem, was wir als „Industrieanwendungen“ bezeichnen. Nach unserer Definition umfasst dies Verbraucher-, Industrie-, Informationstechnologie-, Transport-, Gesundheits- und Finanzdienstleistungen.

Von 2012 bis 2022 stieg die Zahl der Risikokapitalgeschäfte von 270 auf 3006, was einer Steigerung um mehr als das Zehnfache entspricht. Im Jahr 2022 wird das Gesamttransaktionsvolumen 62 Milliarden US-Dollar erreichen, deutlich mehr als die 1,3 Milliarden US-Dollar im Jahr 2012. Auch die Patenterteilung in diesen Bereichen boomt. Seit 2012 hat sich die Zahl der relevanten Patente versechsfacht. Die Unternehmen mit den meisten Patenten sind anerkannte Technologieriesen wie IBM, Samsung, Intel, LG Electronics und Qualcomm.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Serviceplattform: KI-Tools

Seit 2012 ist die Zahl der Patente für horizontale Plattformen fast um das Sechsfache gestiegen, darunter der Kern der künstlichen Intelligenz (KI-Kern), die Technologie der natürlichen Sprache (Technologie der natürlichen Sprache), die Automatisierungsplattform der künstlichen Intelligenz (KI-Automatisierungsplattformen) und die Computer Vision Software. Serviceorientierte Anwendungen (horizontale Anwendungen) sind Schlüsselmodule bei der Entwicklung und dem Einsatz künstlicher Intelligenz. Zu den Unternehmen mit solchen Patenten gehören AT&T, IBM, LG Electronics, Baidu und etablierte Technologieunternehmen.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Natürliche Sprachverarbeitung ist ein künstliches Intelligenztool für große Sprachmodelle (LLMs), das mit dem Aufkommen von ChatGPT populär wurde. Einige Beispiele für die Verarbeitung natürlicher Sprache umfassen Übersetzung, automatische Fehlerkorrektur, automatische Textzusammenfassung, Chatbots und die Verarbeitung von Informationsbedürfnissen im Finanzsektor.

Computer Vision beinhaltet den Einsatz künstlicher Intelligenz, um visuelle Daten zu analysieren und aussagekräftige Vorhersagen zu treffen, einschließlich Gesichtserkennung, Geodatenanalyse und mehr.

Die Inner Eye-Technologie von Microsoft kann bereits dabei helfen, Tumore und abnormale Zellen zu erkennen. In ihrer neuesten Studie zeigt Microsoft, wie seine Technologie Ärzten helfen kann. Unter den fünf Unternehmen mit der größten Anzahl an Computer-Vision-Patenten sind zwei chinesische Unternehmen, nämlich Baidu und Huawei.

Wer braucht noch einen Führerschein? Autonomes Fahren ist angekommen

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Im letzten Jahrzehnt fanden 8 % der Venture-Capital-Deals und 16 % der Patente im Bereich „Automatisierte Maschinen“ statt. Diese Art von Technologie deckt zwei Schlüsselbereiche ab, nämlich selbstfahrende Autos und intelligente Roboter. Dieser Bereich hat im letzten Jahrzehnt viel Aufmerksamkeit erhalten. Dies deckt sich weitgehend mit dem Erfolg von Tesla, das mit Systemen für selbstfahrende Autos experimentiert.

Von 2012 bis 2022 stieg die Zahl der Venture-Capital-Deals im Bereich automatisierter Maschinen von 22 auf 363. Intelligente Roboter fallen in diese Kategorie. Diese Roboter sind in der Lage, bis zu einem gewissen Grad ohne menschliches Eingreifen und Eingaben zu agieren. Künstliche Intelligenz wird häufig eingesetzt, um das Training und die Anpassung von Robotermodellen zu unterstützen. Unternehmen wie Samsung, LG Electronics, Intel und die chinesischen Unternehmen DJI und Didi haben starke Positionen bei Robotikpatenten.

Seit einigen Jahren stehen auch selbstfahrende Autos im Fokus der Diskussion. Neben Tesla bauen auch andere Unternehmen die Forschung und Investitionen in die für selbstfahrende Autos erforderlichen Technologien aus, sodass in diesem Zusammenhang mit einem deutlichen Anstieg der Risikokapitalinvestitionen und Patentanmeldungen zu rechnen ist.

Halbleiterchip

Nvidia-CEO Jensen Huang sagte: „Es ist klar, dass künstliche Intelligenz jede Branche beeinflussen wird. Ich denke, jedes Land muss sicherstellen, dass künstliche Intelligenz Teil seiner nationalen Strategie ist, und jedes Land wird davon betroffen sein.“

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Halbleiter machen 13 % der KI-bezogenen Risikokapitaltransaktionen und 4 % der veröffentlichten Patente aus, darunter Prozessordesign, Edge-KI-Software sowie intelligente Sensoren und Geräte.

Von 2012 bis 2022 stiegen die Venture-Capital-Deals im Halbleiterbereich von 40 auf 515. Im Jahr 2022 wird die Gesamtzahl der Transaktionen in diesem Bereich 9,4 Milliarden US-Dollar erreichen, gegenüber 200 Millionen US-Dollar im Jahr 2012. Ebenso hat sich die Zahl der Patente in diesem Bereich von 2012 bis 2022 versiebenfacht.

Seit den 1970er Jahren erlebten Chips rasante Innovationen, wobei sich die Chipleistung alle paar Jahre verdoppelte. Die Produzenten müssen mit den Entwicklungen Schritt halten, sonst riskieren sie, ins Hintertreffen zu geraten. Da die Technologie immer komplexer wird, sind neue Werkzeuge erforderlich, und hier kann künstliche Intelligenz helfen.

3. Neue Möglichkeiten im Jahr 2024 und darüber hinaus

Generatives Audio könnte das nächste große Ding sein

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

KI ist jetzt in der Lage, menschliche Stimmen und synthetisiertes Audio basierend auf Texteingaben in verschiedenen Sprachen, Akzenten und Dialekten zu erzeugen. Es nutzt generative künstliche Intelligenz, die in ChatGPT beliebt ist.

Vom ersten Quartal 2020 bis zum vierten Quartal 2022 ist die Zahl der Unternehmensdokumente, in denen „generatives Audio“ erwähnt wird, um mehr als das 13-fache gestiegen.

Da sich die Musik- und Klangforschung und -entwicklung vertieft, werden wir möglicherweise eine Explosion neuer Wettbewerber erleben. Bald werden Menschen in der Lage sein, Text oder Bilder einzugeben, um Audioinhalte zu generieren, ohne dass sie einen Audio- oder Computerexperten benötigen.

Dies könnte Auswirkungen auf eine Reihe von Sektoren haben, darunter Spiele, Kommunikation, Musik, Nachrichten und Gesundheitswesen. Zu den Unternehmen mit den generativsten Patenten im Audiobereich gehören Sony, Amazon, Huawei, ByteDance, Adobe, Apple und Tencent.

Welches Audio kann generiert werden?

Generatives Audio ist in vier Hauptkategorien unterteilt, darunter synthetische Stimme, Sprachinteraktion, Musikgenerierung und Audiobearbeitung. Erstens kann künstliche Intelligenz durch Deep Learning echte menschliche Stimmen mit hoher Qualität, einschließlich Tonhöhe, Ton und Rhythmus, synthetisieren. Zur Sprachinteraktion gehören Technologien wie virtuelle Assistenten wie Siri von Apple und Alexa von Amazon. Mit der Weiterentwicklung der Technologie kann es zu immer mehr „natürlichen“ Interaktionen zwischen Menschen und künstlicher Intelligenz kommen.

Musikgenerierungstechnologie macht es einfach, eine große Vielfalt an neuer Musik zu erstellen. Beispiele hierfür sind Spotifys DJ und Aimi Studio. Musik mit künstlicher Intelligenz stellt bereits jetzt eine Herausforderung für die Musikindustrie dar.

Endlich können Audio-Editoren künstliche Intelligenz nutzen, um die Qualität der Audioaufnahme zu verbessern.

Forschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?

Fazit

Künstliche Intelligenz ist da und neue Innovationen stehen vor der Tür. Gemessen an Indikatoren wie Patenten und Risikokapital hat die Innovation im Bereich der künstlichen Intelligenz im letzten Jahrzehnt explosionsartig zugenommen. Gemessen an Risikokapitalaktivitäten und Patenten konzentrierten sich mehr als zwei Drittel der Innovationen im Bereich der künstlichen Intelligenz im letzten Jahrzehnt auf Transport-, Industrie- und Verbraucheranwendungen, gefolgt von automatisierten Maschinen und Serviceanwendungen sowie der Halbleiterindustrie.

Über 2023 hinaus erwarten wir einen Anstieg generativer Audio-Innovationen. Mit der Einführung von ChatGPT und DALL-E haben wir gesehen, wie generative künstliche Intelligenz die Aufmerksamkeit der Welt auf sich gezogen hat. Zusammen werden diese Technologien Branchen wie die Spiele- und Filmproduktion verändern.

Autor |. BT Finance

Quelle |. Deutsche Bank

Das obige ist der detaillierte Inhalt vonForschungsbericht der KI-Branche: Wird generatives Audio nach generativem Text durchbrechen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:sohu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen