Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Sind digitale Menschen nach dem Segen großer Modelle „menschlicher“?

Sind digitale Menschen nach dem Segen großer Modelle „menschlicher“?

PHPz
PHPznach vorne
2024-04-12 19:04:10820Durchsuche

Anker der virtuellen künstlichen Gebärdensprache der Olympischen Winterspiele in Peking, digitale menschliche Zündung der Asienspiele in Hangzhou, digitaler Reporter der Nachrichtenagentur Xinhua, digitaler Astronaut Xiaowei ... Da immer mehr digitale Menschen im Leben der Menschen auftauchen, ist auch die gesamte digitale menschliche Industrie betroffen Entwicklung in Richtung diversifizierter und umfangreicher Anwendungen, schnelle Expansion in verschiedene Branchen und Szenarien.

Sind digitale Menschen nach dem Segen großer Modelle „menschlicher“?

Für die C-Seite helfen digitale Menschen den Benutzern bei der Erstellung von Inhalten und helfen bei der Arbeit, wie zum Beispiel: Digitale Menschen üben gesprochene Sprache, spielen Spiele mit digitalen Menschen usw.; für die B-Seite sind digitale Menschen die „Werkzeugleute“ des Unternehmens und werden in den Bereichen Finanzen, Film und Fernsehen, E-Commerce, Live-Übertragung und anderen Branchen eingesetzt, um die Produktions- und Betriebseffizienz der Branche zu verbessern.

Digital People ist ein gutes Geschäft, aber seine groß angelegte Umsetzung stößt immer noch auf Schwierigkeiten in Bezug auf Talent, Kosten, Szenarien, Technologie usw. Der kritischste davon ist der technische Engpass. Es ist ein großes Problem, digitale Menschen dazu zu bringen, die Markteinschätzung „eine gute Haut für nichts zu haben“ loszuwerden.

Mit dem Aufkommen großer Modelle scheint die Entwicklung digitaler Menschen jedoch neue Möglichkeiten zu eröffnen.

1. Große Modelle stärken digitale Menschen

Für die Branche sind digitale Menschen selbst nichts Neues. Lange Zeit lagen die Produktionskosten nicht unter denen für die Produktion eines Films auf professionellem Niveau, um eine möglichst originalgetreue Darstellung im Hinblick auf das digitale menschliche Erscheinungsbild anzustreben.

Ein von UBS veröffentlichter digitaler Forschungsbericht wies darauf hin, dass die durchschnittlichen Vorabinvestitionskosten für fortgeschrittene virtuelle Charaktere 30 Millionen Yuan betragen und später ein echtes Team für die Aufnahme, Synchronisierung und Bearbeitung erforderlich ist. Am Beispiel der virtuellen Girlgroup A-SOUL von Lehua Entertainment beliefen sich die Produktionskosten einer Single auf 2 Millionen Yuan und die Kosten eines Offline-Konzerts auf 20 Millionen Yuan.

Dieses hohe Kostenproblem löst jedoch nicht das Problem digitaler menschlicher Interaktionseffekte. Aufgrund seiner mangelnden Intelligenz ähnelt es eher einer seelenlosen digitalen Ledertasche als einem digitalen Menschen.

Hohe Kosten gepaart mit schlechten Interaktionseffekten haben den Einsatz digitaler Menschen auf experimentelle Projekte bei Herstellern oder großen Unternehmenskunden beschränkt.

Da daher generative große Modelle mit Lernfähigkeiten das Paradigma der Inhaltsproduktion anführen, sind billige digitale Menschen, die auf ein breiteres Spektrum kleiner und mittlerer Unternehmensbenutzer abzielen und der Implementierung in großem Maßstab Vorrang einräumen, zu einer praktikablen Lösung geworden.

Laut einem Forscher für künstliche Intelligenz spiegelt sich die Umgestaltung und Stärkung digitaler Menschen durch große Modelle hauptsächlich in Kostensenkungen und Effizienzsteigerungen wider.

Aus technischer Sicht ist der Aufbau eines digitalen Menschen hauptsächlich in Modellierung, Steuerung und Rendering unterteilt. Herkömmliche digitale Menschen verlassen sich hauptsächlich auf Computergrafiktechnologie + Bewegungserfassung realer Personen, was die Erfassung einer großen Menge realer Daten und eine detaillierte Modellierung erfordert, was zeitaufwändig, wenig effizient und teuer ist.

Mit der Unterstützung großer Modelle, durch KI-Algorithmen und basierend auf Deep-Learning-Modellen, Aktionssimulation, Emotionssimulation und anderen Technologien sind jetzt nur noch wenige Minuten realer Videos und mehrere Stunden Training mit großen Modellen erforderlich Durch die Generierung realistischer digitaler Menschen werden die Produktionskosten erheblich gesenkt.

Während die Kosten für digitale Menschen sinken, wird auch die Effizienz erheblich verbessert.

Vor dem Aufkommen großer Modelle hatten digitale Menschen kleine Unterschiede im Aussehen und konnten Fragen nur „skriptgesteuert“ beantworten, basierend auf vereinheitlichten Eingabeskripten.

Mit der Ermächtigung großer Modelle haben digitale Menschen nicht nur eine „Seele“, sondern können nicht nur ihr Aussehen und ihre Funktionen anpassen, sondern auch ihre Intelligenz und Interaktivität erheblich verbessern. Beispielsweise können digitale Personen in einigen Live-Übertragungsszenarien bereits grundlegende Interaktionen mit dem Publikum durchführen.

Zum Beispiel kann der von Baidu Smart Cloud veröffentlichte digitale Mensch Xilin mit Unterstützung großer Modelle den Bau eines Live-Übertragungsraums in 15 Minuten schnell abschließen, automatisch Reden generieren, die zu Produktmerkmalen passen, und intelligente interaktive Fragen und Antworten ermöglichen.

Im Live-Übertragungsraum einer bestimmten Catering-Marke generieren die digitalen menschlichen Moderatoren von Xilin automatisch Live-Übertragungs-Sprachfähigkeiten, einschließlich Eröffnungs-Eisbrecher, Wohlfahrtsübertragungen, Aufwärmreden, Fähigkeiten zum Auffordern von Bestellungen usw. Bei dieser Live-Übertragung zwischen realen Menschen und digitalen Menschen von Xi Ling bemerkten die Benutzer überhaupt nichts.

Was noch überraschender ist, ist, dass digitale Moderatoren bei einem echten 6-Stunden-Live-Übertragungsvergleich 85 % des GMV echter Moderatoren zu nur 15 % der Kosten echter Moderatoren erzielen können.

Neben dem Live-Streaming von Waren kann Baidu Intelligent Cloud Xiling als erste digitale Menschenplattform in China, die große Modelle vollständig rekonstruiert, Unternehmen auch 2D-echte Menschen, 3D-realistische und 3D-hyperrealistische Porträts zur Verfügung stellen und so die Videoproduktion ermöglichen , digitale Mitarbeiter, digitaler menschlicher Sprecher und andere Anwendungen.

Auf der XiLing-Plattform sind beispielsweise nur 5 Minuten Live-Video erforderlich, um Porträts in einer halben Stunde zu trainieren, 100 Sätze aufzuzeichnen und 24 Stunden am Tag eine exklusive Soundbibliothek zu erstellen 30 % der Vergangenheit und die Aufnahmeeffizienz wird um das 20-fache verbessert.

Es ist nicht schwer festzustellen, dass digitale Menschen, die von großen Modellen umgestaltet und gestärkt wurden, Probleme wie hohe Preise und schlechte Interaktivität bis zu einem gewissen Grad beseitigt haben und zunehmend in Kurzvideos und Live-Übertragungsräumen auftauchen.

Gleichzeitig beginnen digitale Menschen, sich mehr „Identitäten“ zuzuwenden – Finanzplaner von Banken, Anwälte, Lehrer, verstorbene Prominente … Digitale Menschen werden zu dem, was sie sein wollen, und auch dies ist ein zunehmend überfüllter Weg . Brachte neue Möglichkeiten.

2. Machen Sie digitale Menschen mehr zu „Menschen“

Das Aufkommen großer Modelle hat digitale Menschen „wiedergeboren“ gemacht und ist heute zu einem der angesagtesten unternehmerischen Wege geworden.

Es gibt derzeit zwei Hauptkategorien von Herstellern digitaler Menschen auf dem Markt: Die eine sind Technologiegiganten, vertreten durch Baidu, Tencent, Huawei usw., die digitale Menschenprodukte basierend auf ihren eigenen Vorteilen in großen Modellen entwickeln und auf den Markt bringen; die andere ist Silizium -basierte kleine und mittlere Hersteller, vertreten durch Smart, Mobvoi und Xiangxin Technology.

Viele Investoren im Bereich der künstlichen Intelligenz sagten, dass sich AIGC (generative künstliche Intelligenz) noch in einem frühen Stadium befinde und nicht viele zur Erzielung von Gewinnen eingesetzt werden könnten. Dies sei einer der wenigen profitablen Kommerzialisierungswege.

Aber mit dem Zustrom einer großen Zahl von Unternehmern ist der Branchenwettbewerb hart und homogen geworden, und die Strecke ist nach und nach überfüllt und verwickelt geworden.

Eine Manifestation der Involution ist, dass die Preise immer tiefer fallen. Derzeit ist der Preis für die meisten digitalen 2D-Modelle auf das Niveau von tausend Yuan gesunken, und einige kosten sogar nur ein paar hundert Yuan.

Der digitale Human-Marketing-Service der 360 Group zeigt auch, dass er bei Kunden über den unterstützenden SaaS-Service der intelligenten Marketing-Cloud-Plattform beworben wird. Gemäß dem monatlichen Zahlungsstandard der Mitgliedsbenutzer ist der Preis für einen digitalen Menschen so niedrig wie Dutzende Yuan und so hoch wie ein oder mehr, etwa zweihundert Yuan.

Mit dem Zustrom einer großen Zahl kostengünstiger digitaler Menschen auf den Markt werden Hunderte von digitalen Klonen auf Yuan-Ebene schnell zu einem äußerst profitablen „Vermögensbuch“ hochgejubelt.

Jede späte Nacht, wenn Mainstream-Plattformen geöffnet sind, bleiben viele digitale Menschen im Live-Übertragungsraum. In der Folge kamen nach und nach Zweifel an digitalen Menschen auf, etwa weil die Effekte zu falsch seien, der Markt chaotisch sei usw., was zu einer schlechten Benutzererfahrung führe.

Einige Leute in der Branche glauben, dass einige Unternehmer aufgrund des Zustroms von immer mehr Spielern über begrenzte technische Fähigkeiten verfügen und die Qualität der von ihnen hergestellten digitalen menschlichen Produkte schwankt, was leicht dazu führen kann, dass schlechte Münzen gute Münzen verdrängen.

Einerseits werden digitale Menschen meist in einfacheren Umgebungen eingesetzt, um grundlegendere Probleme zu lösen. Beim Szenenwechsel oder bei mehreren Dialogrunden kann es sein, dass sie nicht die richtigen Fragen beantworten oder in eine Endlosschleife geraten, was das Benutzererlebnis einschränkt .

Andererseits unterscheidet sich das interaktive Erlebnis digitaler Menschen unter großen Vorbildern immer deutlich von dem realer Menschen. Beispielsweise weisen die von Sora generierten Inhalte Probleme wie die Missachtung physikalischer Prinzipien und das Fehlen menschlicher Finger auf wurde vielfach kritisiert, was den psychologischen „Uncanny-Valley-Effekt“ weiter auslösen könnte.

In diesem Zusammenhang sind einige Experten der Ansicht, dass es notwendig ist, die technologischen Innovationsfähigkeiten und das Benutzererlebnis weiter zu verbessern und gleichzeitig den externen anthropomorphen Effekt digitaler Menschen sicherzustellen und gleichzeitig das Benutzerinteraktionserlebnis zu optimieren, wobei der Schwerpunkt auf Echtzeit-Rendering und optischer Erfassung liegt. dreidimensionale Rekonstruktion und intelligente Mensch-Computer-Interaktion. Erforschung und Anwendung neuer Technologien wie Verarbeitung natürlicher Sprache, Spracherkennung, Computer Vision, generative KI und andere Technologien.

„Das aktuelle technische Ziel, das die Branche gemeinsam durchbricht, besteht darin, digitale Menschen dazu zu bringen, mehr wie ein Mensch zu werden und wie ein Mensch zu denken“, sagte ein Brancheninsider und beschleunigte die technologische Zusammenarbeit zwischen Unternehmen, um das Problem zu lösen Der nächste Schwerpunkt liegt auf technischen Problemen der emotionalen Wahrnehmung, des semantischen Verständnisses usw.

Diese Reihe von Herausforderungen weist alle auf die technische Seite hin.

Der „China Virtual Digital Human Influence Index Report“ 2024 wies darauf hin, dass die „Patent Search“-Daten des staatlichen Amtes für geistiges Eigentum Ende Februar 2024 zeigten, dass die Zahl der Patentanmeldungen im Bereich Digital Human im Jahr 2023 gestiegen sei lag bei 544, was die starke Dynamik und tiefgreifende Innovation der Branche in der Kerntechnologieforschung und -entwicklung widerspiegelt.

Gemessen an den Institutionen, die im Jahr 2023 digitale, menschenbezogene Patente beantragen, sind dies die alten Internetgiganten, vertreten durch Baidu und Tencent, führende Kommunikations- und Finanzinstitute, vertreten durch China Mobile and Industrial and Commercial Bank of China, Xiaobing Company, Shiyou Technology, Leading Die von Black Mirror Technology vertretenen digitalen Unternehmen haben auf der Technologieseite eine Multi-Mächte-Struktur gebildet.

Obwohl die führenden Hersteller der Branche Vorreitervorteile in der KI-Technologie haben, gibt es im Prozess der schnellen Branchenentwicklung kein absolutes Hindernis für die Technologie selbst. Im Wesentlichen stehen Menschen hinter der Technologie. Für alle Hersteller digitaler Menschen bietet AIGC zwar Chancen, wird aber auch zum Ausgangspunkt für die Bewältigung von Herausforderungen.

3. Fazit

Digitale Menschen stehen im Vordergrund und ziehen einen großen Zustrom von Unternehmern an, die ein Stück vom Kuchen wollen. Es ist jedoch unbestreitbar, dass sich der digitale Mensch als junge Technologie noch in einem frühen Stadium befindet und der Markt noch bearbeitet wird.

Für Digital-Human-Unternehmen, die sich ebenfalls im selben roten Ozean befinden, müssen sie möglicherweise nicht darüber nachdenken, wie sie „niedrige Preise erzielen“ können, sondern wie sie digitale Menschen durch kontinuierliche Weiterentwicklung und Verbesserung der Technologie „menschenähnlicher“ machen können das Gesamtniveau der Branche. Lassen Sie digitale Menschen „leben“ und schaffen Sie mehr Wert.

Das obige ist der detaillierte Inhalt vonSind digitale Menschen nach dem Segen großer Modelle „menschlicher“?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen