Heim > Artikel > Technologie-Peripheriegeräte > Mobvois interne Beta erforscht das Großmodell „Sequence Monkey', um exklusive Produkte für Privatpersonen und Unternehmen zu entwickeln
Am 20. April veranstaltete Mobvoi in Peking die AIGC-Strategiekonferenz 2023 mit dem Thema „AGI·Advent“. Bei dem Treffen kündigte Mobvoi einen internen Test zur Erkundung des großen Modells „Sequence Monkey“ an und schlug vor, dass CoPilot überall verfügbar sein wird. Gleichzeitig wurde basierend auf den Funktionen des großen Modells auch eine CoPilot-Produktmatrix für Entwickler und ein Upgrade eingeführt Version für die C-Seite. Fragen zur Sprachassistenten-Magie sowie interne Tests und Erkundung unternehmensspezifischer Großmodelle für die B-Seite. Darunter umfasst die CoPilot-Produktmatrix für Entwickler vier AIGC-Produkte, nämlich die KI-Schreibplattform „Qiaowen“, die KI-Malplattform „Yihua“, die KI-Synchronisationsplattform „Magic Sound Workshop“ und die digitale menschliche Video- und Live-Übertragungsplattform „Wonderful Yuan“.
Selbst entwickeltes großes Modell „Sequence Monkey“, um AGI beim „Ankommen“ zu helfen
Mobvois großes Sprachmodell „Sequence Monkey“ ist ein großes Sprachmodell mit multimodalen Generierungsfunktionen. Das Modell basiert auf der Sprache The Das Kernfähigkeitssystem deckt die sechs Dimensionen „Wissen, Dialog, Mathematik, Logik, Argumentation und Planung“ ab und kann gleichzeitig verschiedene Aufgaben wie Textgenerierung, Bildgenerierung, 3D-Inhaltsgenerierung, Sprachgenerierung und Spracherkennung unterstützen.
Das große Modell „Sequence Monkey“ verfügt bereits über bestimmte Fähigkeiten zum Verstehen natürlicher Sprache, Wissen, Logik und Argumentation. Es kann schnell Antworten auf komplexere Fragen liefern, wie zum Beispiel „Welche Provinzhauptstadt hat eine größere Bevölkerung, Hunan oder Hubei?“ „Erhalten Sie genaue Ergebnisse.
Berichten zufolge wurde der chinesische Name von Mobvois selbstentwickeltem Großmodell „Sequence Monkey“ vom „Infinite Monkey“-Theorem des Mathematikers Emile Borel im frühen 20. Jahrhundert inspiriert. Nach diesem Theorem würde eine Gruppe von Affen, wenn sie zufällig eine Schreibmaschine treffen würden, schließlich ein vollständiges Werk von Shakespeare produzieren. Dieser Satz basiert auf Wahrscheinlichkeitstheorie und kombinatorischer Mathematik und veranschaulicht die Einheit der Wahrscheinlichkeit. Das Konstruktionsprinzip des von Mobvoi selbst entwickelten großen Modells ähnelt dem von „Infinite Monkey“. Massive Textsequenzen werden vom unabhängigen Algorithmus von Mobvoi kontinuierlich trainiert und durch große Rechenleistung verdaut und verstanden und werden zum „Sequence Monkey“.
Li Zhifei, Gründer und CEO von Mobvoi, sagte, dass es bei großen Modellen nicht nur um große Parameter geht kognitives Modell. Es ist die Modellierung der Sprache. Sprache ist die Grenze des Denkens, daher haben große Modelle unbegrenzten Raum für Fantasie. „Sequence Monkey“ hat während des Trainingsprozesses seine „emergenten“ Fähigkeiten unter Beweis gestellt. Es befindet sich derzeit in der „Aufklärungsphase“ und wird sich in Zukunft immer schneller verbessern. Er glaubt auch, dass es der beste „Job“ für große Models sein wird, ein menschlicher CoPilot zu sein, und dass CoPilot in Zukunft überall sein wird.
One-Stop-CoPilot-Produktmatrix, die den gesamten Prozess der Inhaltserstellung ermöglicht
Basierend auf dem großen Modell „Sequence Monkey“ hat Mobvoi in internen Tests eine Vielzahl von AIGC-Produkten und -Anwendungen für Ersteller untersucht und für Tausende erstellt der Ersteller Eine CoPilot-Produktmatrix aus einer Hand, die den gesamten Prozess der Inhaltserstellung ermöglicht. Derzeit hat Mobvoi mit mehr als 5 Millionen registrierten Benutzern und mehr als einer Million zahlenden Benutzern weltweit die „Dreifaltigkeit“ aus Technologie, Produkten und Kommerzialisierung erreicht.
Mobvoi – Ihr KI-Schreibassistent (write.mobvoi.com)
Als erstes CoPilot-Produkt, das auf der Pressekonferenz vorgestellt wurde, decken die KI-Schreibfunktionen von „Mobvoi“ das Büro am Arbeitsplatz, Marketing und neue Medien ab Kreatives Schreiben, das Benutzern kontinuierlich Inspiration und kreative Richtung beim Verfassen von Jahresendzusammenfassungen, Kundenservice-Worten, Skripten, Werbetexten und anderen Inhalten bieten kann.
Um Benutzern besser dabei zu helfen, die Effizienz der Inhaltserstellung zu verbessern, hat „Qiaowen“ acht wichtige KI-Bearbeitungsfunktionen eingeführt, nämlich Stiltransformation, Extraktion wichtiger Punkte, Korrekturlesen und Fehlerkorrektur, Fortsetzung, Umschreiben, Erweiterung, Abkürzung und Übersetzung. „Qiaowen“ kann beim Schreiben auch automatisch Bilder generieren und bietet Benutzern so ein Schreiberlebnis, das sowohl Bilder als auch Text umfasst.
Zhihua – Ihr KI-Malassistent (paint.mobvoi.com)
Für Designer, Illustratoren und andere Kreative, die neben Text auch einen starken Bedarf an Design haben, hat die interne Beta von Mobvoi die KI-Malplattform „Yihua“ untersucht. „Word Painting“ unterstützt 8 kreative Stile, darunter zweidimensional, Steampunk und Illustration. Benutzer müssen nur Text eingeben, und „Yihuahua“ kann gleichzeitig 8 hochauflösende 2K-Bilder mit realistischem Licht und Schatten und reichhaltigen Details erzeugen.
Zusätzlich zur Verwendung von Text zum Erstellen von Bildern verfügt es auch über KI-Zeichenfunktionen wie Zeichnungen zum Erstellen von Bildern, Animationsgenerierung und personalisierte Avatargenerierung, was die kreativen Methoden der Benutzer erheblich bereichert. Für Unternehmensbenutzer unterstützt „Yihua“ auch die exklusive Modellanpassung, sodass Unternehmensbenutzer den Modellstil an ihre eigenen Bedürfnisse anpassen können, und unterstützt die kollaborative Produktion mehrerer Personen, um den Zeichnungsanforderungen von Unternehmen besser gerecht zu werden.
Derzeit hat „Yiyanhua“ mit der Heimdekorations-Designplattform Kujiale ein Forschungsziel erreicht. Auf der Kujiale-Plattform können Benutzer „Yiyanhua“ verwenden, um ihre Bedürfnisse in Worten zu beschreiben und sie einfach zu ändern und die Position von Möbeln anzupassen usw. und entwerfen Sie dann einen Dekorationsplan, der Ihnen gefällt.
Moyin Workshop – Ihr KI-Synchronisationsassistent (moyin.com)
Für KI-Synchronisationsszenarien hat Mobvoi eine neue Generation von KI-Synchronisationsprodukten „Moyin Workshop“ auf den Markt gebracht. „Magic Sound Workshop“ (Überseeversion von DupDub) ist die weltweit führende Komplett-KI-Synchronisationsplattform aus einer Hand. Sie bietet Benutzern mehr als 1.000 Klangfarben, mehr als 2.000 Stimmstile und mehr als 20 Dialekte und Fremdsprachen.
Mit der Unterstützung der Großmodelltechnologie ist „Magic Sound Workshop“ die weltweit erste Synchronisierungsplattform, die mit Großmodell-KI-Schreibfunktionen ausgestattet ist und mehrere Szenarien wie KI-Schreiben, KI-Überspielen und Bearbeiten abdeckt. Mit seiner Hilfe können Benutzer ganz einfach Inhalte erstellen, die Texterstellung und Synchronisation integrieren, beispielsweise Film- und Fernsehkommentare, Hörbücher, Online-Bildung und Nachrichtensendungen. Derzeit hat „Magic Sound Workshop“ eine Zusammenarbeit mit führenden Unternehmen in vielen Branchen wie WeChat Reading, Juvenile Get und Volkswagen erreicht.
Um Benutzern ein besseres Synchronisationserlebnis zu bieten, unterstützt „Magic Sound Workshop“ die Anpassung von 7 Emotionen, darunter Ruhe, Traurigkeit, Freude usw. für ausgewählte Geräusche, einschließlich Frauen mittleren Alters, Jungen usw. 10 Arten von Charaktere wurden migriert und es wurden auch personalisierte Bearbeitungsfunktionen für AI-Sound wie Rhythmusanpassung, lokale Geschwindigkeitsänderung und Synchronisation mit mehreren Personen geöffnet, sodass Benutzer Sounds wie das Bearbeiten von Dokumenten mit Word bearbeiten können.
Zusätzlich zur Auswahl und Bearbeitung von Sounds wird der „Magic Sound Workshop“ auch eine „Pinch Sound“-Funktion starten, die auf Funktionen zur Generierung umfangreicher Modellsprachen basiert. Benutzer können Geschlecht, Alter, Sprache, Stil und Emotionen frei wählen Klangeigenschaften, von 0 bis 1. Erstellen Sie den gewünschten Klang.
Wunderbarer Yuan – Ihr digitaler KI-Klon (weta365.com)
Basiert auf den Generierungsfähigkeiten von Text, Bildern, Tönen usw., damit Videoinhaltsersteller schneller und schneller neuartige, lebendige und interessante Werke erstellen können Besser gesagt, Mobvois interne Tests untersuchten die KI-Plattform für die Erstellung digitaler Bilder und die Live-Übertragung „Wonderful Yuan“.
Berichten zufolge verfügt die Plattform „Wonderful Yuan“ derzeit über 100 digitale Personen, über 1.000 digitale 3D-Assets und über 1.000 Sounds. Mit der multimodalen Generierungstechnologie unterstützt die „Wonderful Yuan“-Plattform derzeit drei verschiedene Formen der digitalen Humangenerierung: Bildmodellierung (2D digitaler Mensch), Videomodellierung (2,5D digitaler Mensch) und 3D-Modellierung (3D digitaler Mensch). Die Funktion zum Klonen von Bildern erfordert lediglich ein 5-minütiges Live-Videomaterial, um das Bild und Verhalten des Benutzers 1:1 wiederzugeben und so einen digitalen Klon für den Benutzer mit konsistenter Stimme und natürlichen Bewegungen zu erstellen.
Von Privatpersonen bis hin zu Unternehmen wird CoPilot überall präsent sein
Mobvoi verfügt über eine umfassende Erfahrung im Bereich der Sprachassistenten. Die Forschung zu KI-Sprache lässt sich bis vor zehn Jahren zurückverfolgen Der Assistent „Xiaowen Assistant“ wiederholte 2015 den „Xiaowen Secretary“, startete 2017 ein VPA mit vollständigem Szenario und aktualisierte das VPA im Jahr 2019. Nach zehn Jahren der Akkumulation und Entwicklung kann CoPilot-Magic Xiaowen, das von Mobvoi auf dieser Konferenz in internen Tests untersucht wurde, als Synthese von Siri und ChatGPT verstanden werden.
„Hallo, hallo, wo ist das nächste Hot-Pot-Restaurant?“, „Hallo, können Sie mir sagen, wie das Wetter morgen in Peking ist?“ – die Menschen sind es gewohnt, relevante Informationen nachzuschlagen, bevor sie Essen, Kleidung, Unterkunft usw. benötigen Als Entwicklung für einzelne Benutzer kann „Magic Xiaowen“ Benutzern helfen, Enzyklopädieinformationen zu überprüfen, das Wetter zu überprüfen, Restaurants zu überprüfen und Hotels zu überprüfen, und kann auch frei mit Benutzern chatten, sodass Benutzer Informationen bequemer und einfacher erhalten können schnell
Laut der Einleitung basiert „CoPilot“ auf dem Konzept eines Superassistenten. Es wird über ein Gehirn mit hohem IQ verfügen, das auf einem großen Modell basiert und in der Lage ist, riesige Datenmengen zu analysieren und mit Menschen in der Realität zu kommunizieren Es wird auch eine schöne Stimme und ein schönes Bild haben und kann mit jeder Hardware-Plattform wie Mobiltelefonen, Uhren, Automaschinen usw. ausgestattet werden - Hochwertige Lehrkräfte, sachkundige Anwälte, professionelle Ärzte, Kundendienst für Finanzmanagement usw., um bei Bedarf jederzeit und überall den Druck zu demonstrieren. „Sequence Monkey“ öffnet das Ökosystem und stärkt mehr Branchen
Basierend auf den zugrunde liegenden Fähigkeiten des großen Modells „Sequence Monkey“ bietet „Mobvoi Copilot“ für B-End-Benutzer und vertikale Bereiche nicht nur universelle Fähigkeitsunterstützungsdienste und digitale Anpassungsdienste für menschliche Bilder eröffnen auch ihre eigene Rolle Funktionen erweitern und Datenschnittstellen weiter iterieren. Bedürftige Unternehmensbenutzer können sich im Web anmelden, um API-Dienste aufzurufen, und durch Hochladen von Dokumenten branchenspezifische Inhalte trainieren, um eine individuelle Sprachinteraktion zu erreichen. Die URL von Sequence Monkey lautet openapi.mobvoi.com.
Derzeit hat Mobvoi eine Zusammenarbeit mit der ersten Gruppe interner Beta-Explorationspartner in zehn großen Branchen erreicht, darunter Automobil, Bildung, Anwaltskanzleien, Finanzen, medizinische Versorgung, Tourismus usw. In der Zukunft wird Mobvoi „CoPilot“ schrittweise verstärkt Mehrere Branchen helfen mehr Unternehmen dabei, ihre eigenen exklusiven Großmodelle zu haben und ihren eigenen exklusiven „CoPilot“ zu erstellen.Das obige ist der detaillierte Inhalt vonMobvois interne Beta erforscht das Großmodell „Sequence Monkey', um exklusive Produkte für Privatpersonen und Unternehmen zu entwickeln. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!