Heim > Artikel > Technologie-Peripheriegeräte > Das große Hunyuan-Modell von Tencent wurde offiziell vorgestellt und wir übernahmen die Führung bei der Erprobung seiner Produktivität
Vergangene Woche wurden die ersten inländischen Zulassungen für Großmodelle genehmigt und die Dienstleistungen wurden für die gesamte Gesellschaft geöffnet. Dies markiert, dass Großmodelle in eine neue Phase der Großmodellanwendung eingetreten sind. Unter den Unternehmen, die bereits Anwendungen veröffentlicht haben, scheinen einige Technologiegiganten noch keine Maßnahmen ergriffen zu haben
Am 7. September 2023 stellte Tencent das Hunyuan-Großmodell auf der Tencent Global Digital Ecology Conference offiziell vor und öffnete Tencent Cloud für die Außenwelt
Als großes Modell mit über 100 Milliarden Parametern verwendet Hunyuan mehr als 2 Billionen Token im Pre-Training-Korpus. Es stützt sich auf eine Reihe einzigartiger technischer Fähigkeiten, um starke chinesische Erstellungsfähigkeiten, logische Denkfähigkeiten in komplexen Kontexten und eine zuverlässige Aufgabenausführung zu erlangen Fähigkeiten.
Tencent Group Vice President Jiang Jie sagte: „Das große Modell von Tencent Hunyuan wird vom ersten Token an von Grund auf trainiert. Wir beherrschen die gesamte Kette vom Modellalgorithmus über das Framework für maschinelles Lernen bis hin zur KI-Infrastruktur. Road selbst entwickelte Technologie.“ . „
Öffnen Sie das große Modell, es geht um Produktivität.“
Was ist das Niveau dieses großen Modells, wenn es sich nicht um „neue Technologie“ handelt? Auf der Konferenz enthüllte Jiang Jie einige grundlegende Informationen, indem er direkt nach dem Hunyuan-Modell fragte. Sein Parametervolumen hat Hunderte von Milliarden erreicht, und die für das Training verwendeten Daten stammen aus dem Juli dieses Jahres. Darüber hinaus gab Tencent an, dass das Wissen über das große Modell jeden Monat aktualisiert wird. Zu den vor Ort angezeigten Inhalten gehören das große Modell-Applet Tencent Hunyuan, der KI-Assistent in Tencent-Dokumenten und die Funktionen der Tencent-Konferenz KI-AssistentDiese Seite ist die erste, die dies tut. Nachdem ich die Testqualifikation erhalten hatte, probierte ich zunächst einmal das WeChat-Applet aus.Als wir das Miniprogramm betraten, waren wir angenehm überrascht, dass der darin enthaltene Inhalt nicht geringer war als bei anderen großen Anwendungen. Hier können wir uns inspirieren lassen und sehen, welche Funktionen Hunyuan bieten kann
Von Produktivität, Leben, Unterhaltung bis hin zur Programmentwicklung kann man sagen, dass seine offenen Fähigkeiten sehr umfassend sind und der Identität von Hundert Milliarden entsprechen. Ebene Großmodell. Kann Hunyuan diese Aufgaben also wirklich effektiv erledigen?
Ich muss eine PPT vorbereiten. Ich habe mich für das Thema entschieden, weiß aber nicht, wo ich anfangen soll. Ich habe dem Hunyuan-Modell eine Frage gestellt, und es dauerte nur wenige Sekunden, bis die KI einen Überblick über sieben Teile gab, wobei jeder Teil auch die wichtigsten Aufschlüsselungspunkte enthielt. Geben Sie im September einen Artikel auf arXiv ein Der von Google eingereichte Zusammenfassungs- und Einführungsteil „RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback“ besteht aus mehreren langen Absätzen. Viele große Modelle unterstützen überhaupt nicht so viele Eingabeinhalte es ins Chinesische.
Wahrscheinlich bedeutet dies, dass künstliche Intelligenz die Rolle des Human Reinforcement Learning Feedback (RLHF) im groß angelegten Modelltraining ersetzen kann
Ein großes Modell, das das praktische Stadium erreicht hat, kann uns beim Schreiben von Code helfen. Jetzt geben wir der KI einen Code und lassen sie den Inhalt erklären, den sie nicht verstehen kann und der keine klaren Kommentare enthält:
Es erklärt ausführlich die Bedeutung der Zahlen im Quadratwurzel-Reziprok-Algorithmus (aber es versteht nicht (Lesen Sie die Kommentare gründlich durch). Vielleicht wird es nicht mehr lange dauern, bis wir ohne große Modelle keine Entwicklung mehr machen können.
Dann gibt es Tencent-Dokumente. Viele Menschen haben große Modelltools wie GPT-4 in ihren eigenen Arbeitsabläufen verwendet, und das große Hunyuan-Modell wurde in der von Tencent Documents eingeführten intelligenten Assistentenfunktion verwendet. Erstellen Sie ein neues Smart-Dokument auf dem PC und geben Sie „/“ ein, um die Inhaltserstellung, Übersetzung, Aufbereitung und andere Vorgänge entsprechend Ihren Anforderungen durchzuführen.Dann geben Sie den Befehl für natürliche Sprache ein, und die Generierungsfähigkeit des großen Modells kann Ihnen dabei helfen, den Langtext in Tencent-Dokumenten zusammenzufassen:
Es scheint beim Schreiben einer Arbeit sehr nützlich zu sein
Natürlich, wenn Sie geben ein Thema vor, es kann Text erstellen, und dann wählen Sie einen Teil des generierten Inhalts aus, und die KI kann ihn mehrmals verfeinern und bearbeiten. Nachdem Sie mit dem Schreiben fertig sind, können Sie es mit einem Klick übersetzen:
Darüber hinaus erfolgen die Tabellendatenberechnung und die Diagrammerstellung in einem Satz.
Diese Funktionen befinden sich derzeit in der internen Testphase und stehen Benutzern zur Verfügung, wenn sie ausgereift sind.
Bei Tencent-Meetings kann die Anwendung des Hunyuan-Großmodells dazu beitragen, dass Sie während des Meetings nicht mehr abgelenkt werden. Sie können den KI-Assistenten beispielsweise jederzeit fragen, was gerade gesagt wurde oder worum es bei dem Streit zwischen diesen beiden Personen ging. KI kann den Inhalt ruhig in ein paar kurzen Sätzen zusammenfassen und eins, zwei oder drei klar auflisten
Natürlich kann das Hunyuan-Großmodell nach dem Meeting auch den Meeting-Inhalt schneller und umfassender zusammenfassen und markieren -do items
hat mehr als 50 Unternehmen von Tencent abgedeckt
Jiang Jie fasste die drei Hauptmerkmale des Hunyuan-Modells zusammen: starke chinesische Kreativität, Fähigkeit zum logischen Denken in komplexen Kontexten und Zuverlässigkeit bei der Aufgabenausführung.
Derzeit sind viele große Modelle in der Branche noch nur begrenzt in Szenen einsetzbar. Das Hauptproblem besteht darin, dass sie eine hohe Fehlertoleranz aufweisen und nur für Gelegenheitsszenen mit einfachen Aufgaben geeignet sind. Tencent hat eine Reihe von Selbstforschungsinnovationen auf Algorithmusebene durchgeführt, um die Modellzuverlässigkeit und -reife zu verbessern.
Tencent Group-Vizepräsident Jiang Jie erschien auf der Veranstaltung
Angesichts des Problems, dass große Modelle anfällig für „Kauderwelsch“ sind, hat Tencent den Algorithmus und die Strategie vor dem Training optimiert, und zwar selbst -Entwickelte „Wahrheitserkennungs“-Technologie. Die „Illusion“ der großen Hunyuan-Modelle wird im Vergleich zu Mainstream-Open-Source-Großmodellen um 30-50 % reduziert.
„Der Ansatz der Branche besteht darin, Suchverbesserungen, Wissensdiagramme und andere „Plug-Ins“ bereitzustellen, um die Fähigkeit von Open-Book-Prüfungen mit großen Modellen zu verbessern. Diese Methode erhöht das Wissen über das Modell, es gibt jedoch viele Einschränkungen in der praktischen Anwendung „, sagte Jiang Jie. „In den frühen Entwicklungsstadien des Hunyuan-Großmodells haben wir über eine Methode nachgedacht, die überhaupt nicht auf externen Daten basiert, und viele Forschungsversuche durchgeführt. Die von uns gefundene Vortrainingsmethode hat das Problem der Halluzinationen weitgehend gelöst.“ "
Tencent verwendet auch Verstärkungslernen. Mit dieser Methode kann das Modell lernen, Trap-Probleme zu identifizieren, und durch die Optimierung der Positionscodierung werden die Wirkung und Leistung des Modells bei der Verarbeitung ultralanger Texte verbessert. In Bezug auf die Logik hat Tencent eine neue Strategie der Denkkette vorgeschlagen, die es großen Modellen ermöglicht, auf der Grundlage tatsächlicher Anwendungsszenarien zu argumentieren und Entscheidungen zu treffen. Sie verfügen über Textspeicherfähigkeiten und können fließend mehrere Gesprächsrunden in beruflichen Bereichen führen. Darüber hinaus können auch Inhalte wie literarische Kreationen, Textzusammenfassungen und Rollenspiele erstellt werden, um die Absichten der Benutzer vollständig zu verstehen und zeitnahe Antworten effizient und genau zu geben. Nur wenn eine solche Technologie implementiert wird, kann die Produktivität wirklich verbessert werden.
Der Inhalt, der neu geschrieben werden muss, ist: Das Schreiben eines Artikels mit 4000 Wörtern kann die Anforderungen nicht erfüllen, aber das große Hunyuan-Modell kann es tunIm „Großformatigen Vortraining“. Modelltechnologie“ der China Academy of Information and Communications Technology Im Standardkonformitätstest „Bewertungsmethoden für Anwendungen und Anwendungen“ bewertete das Hunyuan-Großmodell insgesamt 66 Fähigkeitselemente und erzielte bei beiden die höchste Punktzahl in der umfassenden Bewertung Bereichen „Modellentwicklung“ und „Modellfähigkeit“. In den Mainstream-Bewertungssätzen MMLU, CEval und AGI-eval weist das große Hunyuan-Modell hervorragende Leistungen auf, insbesondere in den chinesischen Naturwissenschaften, Fragen zu Hochschulaufnahmeprüfungen und Mathematik.
Die Bedeutung des Baus großer Modelle liegt in industriellen Anwendungen. Es wird davon ausgegangen, dass mehr als 50 Unternehmen und Produkte innerhalb von Tencent auf das Tencent Hunyuan-Modell zugegriffen und es getestet haben, darunter Tencent Cloud, Tencent Advertising, Tencent Games, Tencent Financial Technology, Tencent Conference, Tencent Documents, WeChat Souyisou, QQ Browser usw. und erste Ergebnisse erzielt. Tencent-Programmierer haben begonnen, große Modelltools zu verwenden, um die Entwicklungseffizienz zu verbessern
Darüber hinaus hat Tencent auch sein eigenes Framework für maschinelles Lernen Angel entwickelt, um die Trainingsgeschwindigkeit des Modells zu verdoppeln und die Inferenzgeschwindigkeit im Vergleich zum Mainstream-Framework der Branche zu erhöhen. 1,3 Mal.
Auch die Infrastruktur für den Bau großer Modelle wurde nicht abgerissen. Tencent hat bereits erklärt, dass es Anfang dieses Jahres ein großes Rechenzentrum gebaut hat. Kürzlich haben die großen Modelle von MiniMax und Baichuan Intelligence die Rechenleistung von Tencent genutzt.
Tencent arbeitet außerdem intensiv daran, Branchendaten mit seinen eigenen Fähigkeiten zu kombinieren, indem es branchenspezifische Daten externer Kunden nutzt, um Probleme in bestimmten Branchen zu lösen, und sich in die reale Branche integriert, um die sozialen, wirtschaftlichen Vorteile und den Geschäftswert großer Unternehmen kontinuierlich zu fördern -maßstabsgetreue Modelle
„Öffentlichen Daten zufolge wurden in China 130 große Modelle veröffentlicht. Es gibt sowohl allgemeine Modelle als auch professionelle Feldmodelle. Als allgemeines Modell kann Hunyuan die meisten internen Geschäfte von Tencent unterstützen. Heute zeige ich mehrere tief miteinander verbundene Modelle. Das Geschäft.“ hat eine große Anzahl von Benutzern und große Modelle wurden in unseren Kernbereichen intensiv eingesetzt“, sagte Jiang Jie. „Mein großes Modell dient erstens dem Unternehmen selbst und wird zweitens über Tencent Cloud für die Außenwelt geöffnet. Wenn es für Kunden geöffnet wird, wird Hunyuan Big Model als Basis für Tencent Cloud Model as a Service MaaS dienen.“ Kunden können die Hunyuan-API entweder direkt aufrufen oder Hunyuan als Basismodell verwenden, um exklusive Anwendungen für verschiedene Industrieszenarien zu erstellen.
Es ist ersichtlich, dass die Strategie von Tencent im Bereich der großen Modelle auf Stabilität ausgerichtet ist: Konzentrieren Sie sich darauf, ein solides Fundament zu legen und sich nicht zu beeilen, halbfertige Produkte zur Schau zu stellen. Und dieser Zug zeigte hervorragende Stärke.
Die Entwicklung großer Modelle ist immer noch im Gange, wie Jiang Jie sagte: „Es ist keine Übertreibung zu sagen, dass Tencent große Modelle voll und ganz angenommen hat. Unsere Fähigkeiten haben sich ständig weiterentwickelt und ich glaube, dass das Potenzial von AIGC unbegrenzt ist.“ . Wir sind bereits auf diesem Weg.“
Das obige ist der detaillierte Inhalt vonDas große Hunyuan-Modell von Tencent wurde offiziell vorgestellt und wir übernahmen die Führung bei der Erprobung seiner Produktivität. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!