Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?

WBOY
WBOYnach vorne
2023-09-26 13:57:111481Durchsuche

Der „Battle of Hundertes of Models“ hat kürzlich einen weiteren Teilnehmer hinzugefügt. Nach der Einführung von Wenshengwens großem Sprachmodell „Ruyi“ im letzten Monat hat Kuaishou kürzlich ein selbst entwickeltes großes Modell „Ketu“ im Bereich „Wenshengtu“ auf den Markt gebracht. Kolors). Als Kurzvideoplattform wird Kuaishous „Ketu“ natürlich in seiner eigenen App verwendet. Basierend auf dem Ketu-Großmodell hat Kuaishou auch damit begonnen, die Funktion „AI Play Review“ im Kurzvideokommentarbereich zu testen und diese freizuschalten AIGC+ Kurzvideo Neue Spielmöglichkeiten.

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?

Es wird berichtet, dass Kuaishous „AI Play Review“ das erste Mal in der Branche ist, dass AIGC-Funktionen im Kommentarbereich des Kerngeschäftsszenarios einer groß angelegten App angewendet werden. Diese Funktion soll das interaktive Erlebnis der Benutzer verbessern Im Kommentarbereich können Benutzer ganz einfach kreativen Text generieren, indem sie eine große Anzahl von Bildern in verschiedenen Stilen eingeben, um die Kommentarinteraktion zu bereichern. Benutzer müssen lediglich einen Textkommentar mit mindestens 6 Wörtern in den Kommentarbereich des kurzen Videos eingeben und auf das „AI“-Logo in der unteren rechten Ecke des Kommentarfelds klicken, um mit einem Klick ein Kommentarbild zu generieren Sie können auch auf „Ansicht ändern“ klicken, um zu weiteren Stilen zu wechseln.

Laut dem Kuaishou AI-Team können Benutzer durch die Funktion „AI Play Review“ ihre Meinungen und Emotionen genauer und interessanter ausdrücken und im Kommentarbereich bequemere und interessantere Interaktionen durchführen, ohne nach geeigneten Bildern oder Bildern suchen zu müssen Ausdrücke. Paket, kann aber direkt ein Bild generieren. Es versteht sich, dass die Überprüfung von KI-Spielen Bilder erzeugen kann, die von gängigen Stilen wie Cyberpunk, Pixel und realistischer Animation bis hin zu Bildern mit starken persönlichen Stilen wie Makoto Shinkai, Hayao Miyazaki und Katsuhiro Otomo reichen

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?

Durch die Analyse der vom Benutzer eingegebenen Inhalte ist das Zeichnen semantischer Bilder zu einer Standardfunktion von Stable Diffusio, Midjourney und verschiedenen großen KI-Modellen mit Vincentschen Diagrammfunktionen auf dem heimischen Markt geworden. Mit anderen Worten, Kuaishous KI-Rezension ist im Wesentlichen ein KI-Malwerkzeug. Die Technologie dahinter basiert hauptsächlich auf der natürlichen semantischen NLP-Verarbeitung, und die genaue Identifizierung dessen, was der Benutzer ausdrücken möchte, ist ein Schlüsselelement

Der Effekt der KI-Spielrezension hängt vom Aufforderungswort (Eingabeaufforderung) ab. Nach der Erfahrung von Internetnutzern stimmen die generierten Bilder besser mit der tatsächlichen Situation überein, wenn die Textkommentare beschreibendere Inhalte über Personen, Landschaften, Räume, Aktionen usw. enthalten. Im Gegenteil, wenn es in den Kommentaren vage Beschreibungen gibt, denen ein konkreter Verweis fehlt, wie zum Beispiel „666“ oder „Oh mein Gott! Schwester ist so großartig!“, sind die von der KI generierten Ergebnisse nicht sichtbar. Daher führt diese Realität direkt dazu, dass KI-Spielrezensionen von den meisten Benutzern möglicherweise nicht geliebt werden

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?Die Frage ist, was ist der Kommentarbereich der Kurzvideoplattform zu diesem Zeitpunkt? Tatsächlich ist dies eine Szene voller Witze, Witze, geistreicher Bemerkungen und anderer emotionaler Inhalte. Aufgrund der Eigenschaften kurzer Videos, einschließlich magischer Gehirnwäsche-Hintergrundmusik, intensiv anregender Bilder und ungewisser Belohnungsmechanismen, geben Benutzer das Denken auf und versinken darin. Daher handelt es sich bei Kommentaren im Kommentarbereich meist nur um einen einfachen Satz, mit dem Nutzer ihre Vorlieben, Abneigungen oder Meinungen klar zum Ausdruck bringen

Die Folge dieser Realität ist, dass die von Nutzern im Kurzvideo-Kommentarbereich ausgegebenen Inhalte grundsätzlich emotional sind und es an qualitativen Inhalten mangelt. Stellen Sie sich vor, wenn es sich nur um einen Stapel von Adjektiven handelt, wird die KI mit der Verwirrung konfrontiert sein, dass ihnen ein Subjekt fehlt, was bedeutet, dass der von der KI generierte Endinhalt sich möglicherweise stark von dem unterscheidet, was der Benutzer ausdrücken möchte. Ich glaube, Freunde, die Tools wie Stable Diffusio und Midjourney verwendet haben, wissen, dass, wenn Prompt hauptsächlich aus Adjektiven besteht, das Fehlen von Substantiven dazu führt, dass die KI sich gehen lässt.

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?Selbst das fortschrittlichste GPT-4 weist tatsächlich Mängel bei der Wahrnehmung menschlicher Emotionen auf. Tatsächlich ist die emotionale Wahrnehmungsfähigkeit der KI zum jetzigen Zeitpunkt immer noch ein Problem, mit dem alle KI-Forscher konfrontiert sind. Derzeit zielen viele große KI-Modelle entweder auf ernsthafte Produktivitätsszenarien oder Gespräche mit Menschen ab, und fast keine KI beinhaltet den emotionalen Ausdruck. Auf diese Weise ist es für Kuaishous KI-Spielerezensenten tatsächlich schwierig, ihre Arbeit gut zu machen. Es könnte gut sein, Benutzerrezensionen nicht zu behindern.

Wenn das also der Fall ist, warum veröffentlicht Kuaishou dann eine KI-Spielrezension? Der Zweck besteht natürlich darin, das große Modell von Vincents Bild „vorstellbar“ zu machen und eine realistische Szene zu erhalten. Die Kuaishou-App selbst ist fast das einzige verbraucherorientierte Produkt von Kuaishou, daher ist „AIGC + Kurzvideo“ fast die einzige Karte, die sie ausspielen können. Tatsächlich können wir hier erkennen, dass Kuaishou als neuer Gigant im Zeitalter des mobilen Internets traditionellen Giganten wie BAT in Bezug auf den Hintergrund immer noch unterlegen ist.

Im Gegensatz zu BAT, das sich fast zu einem Internet-Wasser-, Kohle- und Stromunternehmen entwickelt hat, weisen Kuaishou, eine Gruppe neuer Giganten, die im Zeitalter des mobilen Internets entstanden sind, derzeit fast alle die Merkmale eines einzigen Geschäftsbereichs von „starken Stämmen“ auf und schwache Branchen“, wie z. B. Kuaishous Kerngeschäft basiert im Wesentlichen auf der Kuaishou-App, während andere Geschäfte fast noch nicht verfügbar sind. Bevor diese Runde von KI-Konzepten ausbrach, entwickelte Baidu, das einst von der Außenwelt als einsam galt, neben einer Suchmaschine auch eine Eingabemethode, sodass Baidus native KI-Anwendungen auf der Baidu-Eingabemethode ausgeführt werden können.

Wenn ich auf Kuaishou zurückblicke: Wo außer der Kuaishou-App kann das „tutuierbare“ große Modell sonst noch verwendet werden? Wenn Kuaishou eine App ausschließlich für große KI-Modelle entwickeln möchte, könnte Kuaishou die Chance verpassen. Die aktuelle Situation ist, dass es zwischen den wichtigsten KI-Modellen auf dem heimischen Markt tatsächlich keinen Generationsunterschied in der Leistung gibt. Die tatsächliche Nutzungserfahrung jedes Modells ist grundsätzlich gleich und die Wahl des Benutzers ist oft so lange wie nützlich. Selbst für Benutzer, die den Charme großer KI-Modelle erleben möchten, haben viele Baidu Wenxinyiyan heruntergeladen, was einen First-Mover-Vorteil bietet.

Interne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?

Wenn es um die Kombination von AIGC mit Video geht, könnte Station B tatsächlich ein besseres Beispiel gegeben haben. Zuvor in diesem Sommer hat Station B das Konto „AI Video Assistant“ eingeführt. Benutzer müssen lediglich im Kommentarbereich des entsprechenden Videos @AI Video Assistant eingeben, und dieser kann automatisch eine Textzusammenfassung des Videos generieren. Bei den langen Videos von Station B kann die Zusammenfassung und Organisation des KI-Videoassistenten Benutzern helfen, die Informationsextraktion in kurzer Zeit abzuschließen, was natürlich von vielen Benutzern begrüßt wird.

Da es sich bei der Kuaishou App um ein Produkt mit ausgeprägteren Unterhaltungsmerkmalen handelt, das sich besser in AIGC integrieren lässt, muss es natürlich die Unterhaltungsbedürfnisse der Benutzer erfüllen. Beispielsweise könnte die intelligente Generierung von Emoticons auf Basis von Kommentaren weitaus besser zur Atmosphäre der Plattform passen als die Erstellung von Bildern von Personen im Kommentarbereich.

Das obige ist der detaillierte Inhalt vonInterne Beta-KI-Spielbewertung von Kuaishou: Was ist der Kollisionseffekt zwischen großen Modellen und kurzen Videos?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:sohu.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen