Heim > Artikel > Technologie-Peripheriegeräte > Mobvoi trat auf der Weltkonferenz für künstliche Intelligenz 2023 auf, um seine AI CoPilot-Lösung vorzustellen
2023-07-10 17:20:22 Autor: Song Junyi
Vom 6. bis 8. Juli 2023 findet in Shanghai die World Artificial Intelligence Conference (WAIC) statt. Mobvoi bringt das interne Beta-Modell „Sequence Monkey“, die AIGC-Kunstausstellung, die AIGC-Produktmatrix – den KI-Synchronisationsassistenten „Magic Sound Workshop“, den KI-Schreibassistenten „Wonderful Wen“, den KI-Malassistenten „Yihua“ und den KI-Digitalavatar „Wonderful Yuan“ mit " und die digitale, menschlich-interaktive Großbildlösung wurden auf der Konferenz vorgestellt und lockten ein großes Publikum an, die Veranstaltung zu erleben, und die Resonanz war sehr enthusiastisch.
Die Person, nach der ich mich erkundigte, war ein Unternehmen für künstliche Intelligenz, dessen Hauptgeschäft generative KI und Sprachinteraktionstechnologie ist. Laut dem CIC Consulting Industry Report ist Mobvoi das erste und größte Unternehmen für künstliche Intelligenz in Asien, das sich auf generative KI konzentriert. Es ist eines der wenigen Unternehmen in Asien mit allgemeinen Fähigkeiten für große Modelle und auch führend bei der Anwendung der AI CoPilot-Technologie in Asien Pioniere und Pioniere.
Bereits im Jahr 2021 hat Mobvoi das selbst entwickelte großformatige Universalmodell „UCLAI“ auf den Markt gebracht, das später im Jahr 2023 zum „Sequence Monkey“ aufgewertet wurde. Mobvoi ist bestrebt, personalisierte KI-Lösungen bereitzustellen und stützt sich dabei auf die Kernfunktionen allgemeiner Großmodelle als Unterstützung.
"Sequence Monkey": multimodales allgemeines großes Sprachmodell
Das große Modell „Sequence Monkey“, das in internen Tests von Mobvoi untersucht wurde, ist ein allgemeines großes Sprachmodell mit multimodalen Generierungsfunktionen. Das sprachzentrierte Fähigkeitssystem des Modells deckt „Wissen, Dialog, Mathematik, Logik, Argumentation und Planung“ ab „Sechs Dimensionen können gleichzeitig verschiedene Aufgaben wie Textgenerierung, Bildgenerierung, 3D-Inhaltsgenerierung, Sprachgenerierung und Spracherkennung unterstützen.“
„Sequence Monkey“ kann exklusive große Modelle für Unternehmen anpassen, Modellanpassungen, Bildanpassungen, Tonanpassungen und andere Dienste bereitstellen, Bildung, medizinische Versorgung, Automobil, Finanzen und andere Bereiche stärken und exklusives CoPilot für Unternehmen erstellen. Auf dem Ausstellungsgelände trat „Sequence Monkey“ abwechselnd in Rollen wie dem intelligenten Finanzassistenten, dem intelligenten Hausarzt und dem intelligenten Anwalt auf und lockte so viele Zuschauer vor Ort zum Erleben und Interagieren an.
Darüber hinaus vereint „Sequence Monkey“ über einen interaktiven Großbildschirm ein hochintelligentes Gehirn, eine schöne Stimme und ein gut aussehendes Erscheinungsbild. Es nutzt intelligente Hardware als Träger, um das digitale Zeitalter des Menschen 3.0 einzuläuten.
AIGC-Kunstausstellung, die die Integration von Kunst und Technologie erforscht
Basierend auf dem großen Modell „Sequence Monkey“ erkundete Mobvoi eine Vielzahl von AIGC-Produkten und -Anwendungen für Schöpfer, darunter den KI-Schreibassistenten „Qiaowen“, den KI-Malassistenten „Yihua“ und die KI-Synchronisation Assistent „Moyin Gong“ „Fang“ und die KI-Plattform für digitale Menschen „Wonderful Yuan“ erstellen eine AIGC CoPilot-Produktmatrix aus einer Hand für Entwickler, um den gesamten Prozess der Inhaltserstellung zu öffnen. Diese Produkte und Anwendungen wurden dem Publikum durch die AIGC-Kunstausstellung, digitale menschliche Interaktion mit Bewegungserfassung und ein interaktives Produkterlebnis vorgestellt.
Der AIGC-Kunstausstellungsbereich von Mobvoi steht unter dem Motto „Symphonie“. Der Galeriebereich besteht aus 5 Teilen, darunter das „Chaos-Universum“ der Schule für abstrakte Kunst, „Enos: Solar Utopia“ voller romantischer Fantasie, Der „Impressionist“. Flüstern“ des harmonischen Dialogs zwischen impressionistischer Kunst und der Revolution der künstlichen Intelligenz sowie der „verflochtenen Symbiose“ und dem „intelligenten Traum“ der Integration von Technologie und Kunst.
Darüber hinaus nutzten zwei Künstler, AI Monet und AI Mondrian, die digitalen Menschen des jeweils anderen, um auf dem Ausstellungsgelände Zeit und Raum zu durchqueren, und führten einen Dialog zwischen Technologie und Kunst, um die Seele und Bedeutung der Kunst eingehend zu erforschen. Die dieses Mal gezeigten KI-Gemälde wurden alle von Mobvois KI-Malprodukt „Word Painting“ erstellt, während der digitale menschliche Dialog zwischen Monet und Mondrian von Mobvois digitalem KI-Produkt „Miaoyuan“ erstellt wurde.
Die KI-Malanwendung „Yihua“ verfügt über KI-Zeichenfunktionen wie Vincentian-Zeichnungen, Tusheng-Zeichnungen, Zeichnungskontrollzeichnungen, die Erstellung von Avataren, Kurzvideos, GIFs usw. Sie kann eine ultraklare 2K-Bildqualität und 8 Stilmodelle erreichen Unterstützt mehrere Szenen, sodass Benutzer problemlos hochwertige Bildarbeiten erstellen und unternehmensspezifische benutzerdefinierte Modelle unterstützen können, um den Zeichnungsanforderungen verschiedener Branchen und Unternehmensmerkmale gerecht zu werden.
Motion-Capture-Interaktion in Echtzeit, Reisen durch die dimensionale Welt
In diesem Frage-und-Antwort-Ausstellungsbereich ist der Motion-Capture-Erlebnisbereich ein beliebter Bereich, der viele Besucher anzieht, um im Ausstellungsbereich das erstaunliche digitale menschliche Produkt „Wonderful Yuan“ zu erleben. Durch Echtzeitfahren brachte Zhongzhiren das virtuelle 3D-Bild auf der Stelle zum Tanzen und demonstrierte Funktionen wie die digitale Zuordnung von Mensch und Kleidung, Szenenwechsel und interaktives Gameplay. Angetrieben von den „Menschen in der Mitte“ war der Tanz des Avatars auf der großen Leinwand so lebensecht, dass viele Zuschauer nicht anders konnten, als vorzutreten und Motion-Capture-Anzüge anzuziehen, um das Vergnügen zu erleben, den digitalen Avatar flexibel zu steuern.
Miaoyuan ist eine Software zur digitalen Bilderstellung und Live-Übertragung, die Hunderten von Branchenkunden erfolgreich personalisierte digitale Bildanpassungsdienste bereitgestellt hat. „Wonderful Yuan“ bietet eine Vielzahl von Lösungen zum Klonen digitaler Bilder, darunter „ein Fototreiber“, „2,5D-Klonen realer Personen“, „3D-Anpassung und IP-Aktivierung“ usw., und nutzt dabei einen digitalen Bildeditor aus einer Hand, der es Unternehmen ermöglicht um PPT zu erstellen. Erstellen Sie genauso einfach digitale menschliche Videos und Live-Übertragungen.
KI-Erstellung und -Synchronisierung, eine Inspirationsbasis für Content-Ersteller
Im Bereich KI-Erstellung und KI-Synchronisation stellte Mobvoi auf dieser Ausstellung auch „Wonderful Text“ und „Magic Sound Workshop“ aus und lockte damit viele Gruppen an, die Content-Erstellung benötigen, um innezuhalten und zu interagieren. Einige Zuschauer haben die Schreibfunktionen von „Qiaowen“ einzeln in neuen Medien, beim kreativen Schreiben, am Arbeitsplatz und in anderen Szenarien erlebt und gesagt, dass der Generierungseffekt und das interaktive Schnittstellenerlebnis jenseits aller Vorstellungskraft liegen.
„Qiaowen“ ist eine KI-Schreibanwendung, die Schreibanforderungen in verschiedenen Szenarien und Gelegenheiten unterstützt. Sie kann die KI während des Schreibvorgangs mit einem Klick aktivieren, und der flexible und übersichtliche Bearbeitungsmodus unterstützt „Fortsetzung“, „Umschreiben“ und „Erweiterung“. „ und „Abkürzung“ Acht wichtige KI-Schreibfunktionen, darunter „Verfeinerung wichtiger Punkte“, „Stilkonvertierung“, „Fehlerkorrektur“ und „Übersetzung“, helfen Inhaltserstellern, Inhalte schneller und besser zu erstellen und erleichtern so die Erstellung von Inhalten. Ihr idealer KI-Schreibassistent sollte in der Lage sein, automatisch Bilder zu generieren und diese mit Text zu kombinieren, um zum Denken und zur Inspiration anzuregen, sodass beim Schreiben die Wirkung von Bildern und Text erzielt werden kann.
„Moyin Workshop (Überseeversion von DupDub)“ ist die weltweit führende KI-Software aus einer Hand, die Texterstellung, Synchronisierung und Bearbeitung integriert. „Magic Sound Workshop“ verfügt über Tausende von KI-Soundstilen, unterstützt 37 Sprachen und 15 Dialekte und ist ein Sound-Store mit ständig wechselnden Stilen, die für verschiedene Videoerstellungs- und Synchronisationsszenen geeignet sind, sowie die originale Präzisions-Tuning-Plattform „Word Editor für“. Sound, der mehrere Erstellungsmethoden wie Soundsuche, Soundklonen und generatives TTS „Pinch Sound“ unterstützt und die Teamzusammenarbeit mit mehreren Personen und Terminals unterstützt, sodass Benutzer immer den am besten geeigneten Sound finden können.
Mobvoi wird sich auch in Zukunft weiter mit der Forschung und Entwicklung der KI-Technologie befassen, KI in weiteren Bereichen und Szenarien anwenden und danach streben, die digitale Transformation in allen Lebensbereichen umfassend zu unterstützen.
Das obige ist der detaillierte Inhalt vonMobvoi trat auf der Weltkonferenz für künstliche Intelligenz 2023 auf, um seine AI CoPilot-Lösung vorzustellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!