Heim >Technologie-Peripheriegeräte >KI >Anwendung des ereignisbewussten Clustering-Gain-Netzwerks im kreativen Ranking von Fliggy Insurance
Wenn es um Kreativität geht, denkt jeder zuerst an Werbekreativität. Tatsächlich ist die kreative Empfehlung von Versicherungen auch ein vertikales Anwendungsprodukt der Werbekreativität.
Das durch Computational Advertising gelöste Problem besteht darin, entsprechende Anzeigen für bestimmte Benutzer auszuwählen, um den besten kreativen Grafiken und Texten unter einer bestimmten Semantik zu entsprechen. Im Hilfsversicherungsempfehlungsmodul bezieht sich der Kontext auf einige kontextbezogene Informationen über den Benutzer, der Flugtickets oder Bahntickets kauft. Im Suchszenario bezieht sich der Kontext auf einige benutzerbezogene Informationen in der Suchmaschine Informationen wie Alter und Geschlecht usw.; Anzeigen sind Versicherungsprodukte, Hotelkosmetik und andere Produkte der Größenordnung N; die Anzahl der kreativen Grafiken und Texte beträgt die Größenordnung N*M. Die Herausforderungen für Computational Advertising liegen in groß angelegten Optimierungs- und Suchproblemen unter komplexen Randbedingungen.
In diesem Artikel geht es hauptsächlich um die Empfehlung kreativer Bilder und Texte. Die Auswahl und Reihenfolge von Anzeigen wird nicht berücksichtigt. Als nächstes stellen wir vor, wie Fliggy Insurance kreative Empfehlungen nutzt.
Erstens ist die Reiseversicherung als Nebengeschäft in der OTP-Branche derzeit eine relativ wichtige kommerzielle Einnahmequelle. In Versicherungsempfehlungen werden neben Produktempfehlungen und Preisempfehlungen auch Kreativempfehlungen als sehr wichtiger personalisierter Empfehlungsbaustein eingesetzt. Wenn Sie beispielsweise persönliche Daten eingeben, können Sie einige Komponenten sehen, und wenn Sie zur Kasse gehen, werden Ihnen auch Popup-Fenster angezeigt. 2. Herausforderungen bei der kreativen Empfehlung von Versicherungen
DatensparseDie zweite Kategorie sind kontrafaktische Beispieldaten. Jeder Benutzer kann nur eine eindeutige Creative-Kopie sehen, d. h. er kann nur Creative A oder B sehen. Mehrere kreative Ideen können nicht im gleichen Zeitraum und zum gleichen Zeitpunkt demselben Benutzer zugänglich gemacht werden.
Die dritte Kategorie ist Branchenübergreifender kreativer Kaltstart. Fliggy Insurance erstreckt sich über mehrere Branchen. Wenn wir beginnen, in neue Branchen einzugreifen, ist es auch ein Problem, wie wir Wissen in bestehenden Bereichen wiederverwenden können, z. B. die Migration einiger Ideen, die in Branche A gut funktionieren.
Lassen Sie mich kurz die aktuelle Situation der Branche vorstellen.
Werbekreativität wird in zwei Hauptkategorien von Algorithmen unterteilt: Die eine sind kontextunabhängige Algorithmen wie Epsilon Greedy oder Thompson Sampling und einige elegantere E&E-Algorithmen, die von Alimama-Studenten entwickelt wurden, wie die Bayesianische lineare Regressionskorrelation. Die andere Art sind kontextbezogene Algorithmen, die Benutzer- und Kontextinformationen als Empfehlungen hinzufügen. Um das Problem der Datenspärlichkeit zu lösen, verwenden wir hauptsächlich domänenübergreifendes Lernen, um zwei Probleme und zwei verwandte Aufgaben zu lösen, indem wir Daten in Rich-Data-Domänen verwenden, um Probleme in knappen Datendomänen zu lösen, und Daten in mehreren Domänen kombinieren, um Probleme in zu lösen jede Domäne. Zunächst können wir anhand der Datenerkenntnisse erkennen, dass unsere kreativen historischen Präferenzdaten für einzelne Benutzer vorliegen relativ spärlich, aber für Gruppen können Benutzer tatsächlich einige Charakterisierungen durchführen. Aus den Daten geht beispielsweise hervor, dass ältere Menschen Beschreibungen bevorzugen, die sich auf die Familie beziehen. Wenn am Abflugtag schlechtes Wetter herrscht, reagiert die Flugticketbranche empfindlicher auf Materialien, die den Wettervorhersagen ähneln. Dann können wir unser Denken von individuellen Benutzerdaten dahingehend umwandeln, wie wir das Verständnis von Gruppen, verwandten Ereignissen und Kreativität vereinheitlichen und nach der Assoziationsmarkierung Gruppenempfehlungen abgeben können. Nach systematischem Verständnis kann die Erstellung eines Kausalbeziehungsdiagramms zwischen den dreien einige der Probleme spärlicher individueller Benutzerdaten lösen. Um das Problem spärlicher kreativer Daten anzugehen, besteht unsere Lösung darin, neue Materialien nach dem Zufallsprinzip online zu stellen, wenn sie online gehen. Ein weiteres Problem ist der Kaltstart branchenübergreifender Kreativität. Wir haben beispielsweise festgestellt, dass in Bezug auf Wetterereignisfaktoren unabhängig von den verschiedenen Branchen die Präferenzen aller relativ ähnlich sind. Insbesondere im Bus- oder Bahnticketgeschäft sind die Kaufgewohnheiten aller sehr ähnlich, sodass einige kreative Kenntnisse empfohlen werden können Migration kann sein erfolgt durch die gerade erwähnte Kennzeichnung und das systematische Verständnis und die Kennzeichnungsvereinigung. Durch die Ausrichtung der Bezeichnungen verschiedener Branchen unter demselben Wissenssystem wird ein gewisser generalisierender Wissenstransfer durch die Generalisierungsfähigkeit des Graphfaltungsmodells durchgeführt. Um die drei Herausforderungen zu lösen, hat unser Team einige Lösungsideen vorgelegt:
Das gerade erwähnte systematische Verständnis und die standardisierte Markierung gliedern sich hauptsächlich in drei Teile:
Einer ist auf der Benutzerseite, wir werden einige Szenen und Ereignisse verstehen; der andere Ein Teil besteht darin, die grundlegenden Eigenschaften der Benutzer zu verstehen. Der letzte Teil besteht darin, einige Grafik- und Textmaterialien im Hinblick auf Kreativität zu verstehen. Schließlich werden alle drei unter dem Etikettensystem vereinheitlicht und standardisiert, was später dabei hilft, die Beziehung zwischen Diagrammen herzustellen.
Das Bild oben ist ein offensichtlicheres Bild. Darunter sind die Dreieckssymbole einige Attribute auf der Benutzerseite, wie z. B. Frauen oder alte Menschen; die Kreissymbole dienen der Klassifizierung von Ereignissen oder dem Kontextverständnis, wie z. B. Donner oder nächtliches Reisen, und die quadratischen Symbole dienen der Klassifizierung von Materialien.
Die gerade erwähnte dritte Herausforderung besteht darin, dass es in der Stichprobe ein kontrafaktisches Phänomen gibt. Um dieses Problem zu lösen, denken wir über die Verwendung der Uplift-Idee nach verschiedene Marketingmaterialien, um individuelle Vorlieben abzuschätzen.
Durch die Kombination der drei oben genannten Lösungstypen haben wir einen Modellentwurf der Netzwerkstruktur vorgeschlagen. Definieren Sie zunächst das Problem: Die Eingabe besteht aus Benutzerinformationen, Kontextinformationen und strukturierten Informationen zum kreativen Texten, um Werbekreative zu sortieren und zu bewerten, und wählen Sie dann das Motiv mit der höchsten Bewertung aus, das an den Benutzer ausgegeben werden soll.
Das Bild oben zeigt den kreativen grafischen Empfehlungsprozessrahmen für Versicherungen.
Erstens: Wie oben erwähnt, greifen wir im Kreativmodul nicht in die Sortierung nach Versicherungsarten oder Preisen ein. Die Sortierung kreativer Grafiken und Texte ist die finale Sortierlogik von Links. Wenn eine Benutzeranfrage eingeht, werden vier Vereinbarungen getroffen. Verständnis auf Ereignisebene, z. B. ob es gerade regnet; Verständnis der Szene, z. B. ob es sich bei dem Benutzer um mehrere Personen mit Kindern oder um eine ältere Person handelt, und Verständnis der grundlegenden Eigenschaften des Benutzers. Nachdem auch die Materialbibliothek mit den eben genannten Tags gekennzeichnet wurde, erfolgt der Label-Recall der Materialien und die anschließende Sortierung nach Materialkreativität. Auf der Sortierseite wird ein Teil des Traffics für die gleichmäßige Online-Präsenz bereitgestellt.
Der andere Teil besteht darin, die Arbeit der kreativen Optimierung zu erledigen. Die kreative Auswahlarbeit ist in zwei Schritte unterteilt:
Ein Schritt besteht darin, sich anhand von Bildmaterialien zu erinnern und grob zu sortieren, der andere darin, anhand von Textmaterialien grob zu sortieren, und schließlich wird zur Produktion eine kartesische Kombination verwendet ähnlich kreative Texterstellung, die wir anzeigen möchten, und priorisieren sie schließlich über ECUNet.
Basierend auf den drei eben genannten Lösungsideen wurde die ECUNet-Lösung entworfen. Es ist hauptsächlich in drei Teile unterteilt:
Der erste Teil basiert auf einem ereignisbezogenen Diagramm Vektorextraktion, hauptsächlich der Prozess des Vortrainings auf der Offline-Seite, um Diagrammvektoren für jede benutzerseitige Information, Kontextinformation oder kreative Information zu extrahieren; der zweite Teil ist das adaptive Clustering-Gain-Netzwerk, das in diesem Teil gelöst wird besteht darin, die Idee des Uplifts zu kombinieren, um Gruppenweisheit zur Lösung individueller Probleme zu nutzen. Der dritte Teil besteht darin, die Merkmale der drei Teile Benutzer und Szenario, Benutzerereignis und Kreativität zu nutzen, um die gemeinsame Aufmerksamkeit zwischen Paaren umfassender Vektoren zu erzielen Der Zweck besteht darin, ihre gegenseitigen Eigenschaften zu extrahieren und sie schließlich zu bewerten.
#🎜 🎜 #Die Konstruktion heterogener Diagramme gliedert sich hauptsächlich in zwei Teile: Der eine ist die Knotenkonstruktion und der andere die Kantenkonstruktion.
Die Knotenkonstruktion erfolgt hauptsächlich, wenn Benutzerbeispiele eingehen, die drei Arten von Knoten zugeordnet werden können: Benutzerknoten, Ereignisknoten und Kreativknoten. Nach der Zuordnung zu drei Knotentypen können Kanten zwischen Knoten konstruiert werden. Die Kante stellt die Bedeutung von Knoten a dar, der aufgrund von Grund b zu einer Versicherungsumwandlung führt. Beispielsweise ist die Gewichtung des Studentenknotens a im Schlechtwetterknoten b höher als die Gewichtung des Studentenknotens a im Normalwetterknoten. Gemäß der obigen Methode wurde ein heterogener Graph erstellt. Basierend auf diesem Diagramm wird die Knotendarstellung der drei Szenen jedes Knotens durch Vergleich der herkömmlichen Knoteneinbettung extrahiert.
Hauptsächlich durch die Bilder Kantenvorhersageaufgabe des überwachten Lernens, der Verlust verwendet eine marginbasierte Verlustfunktion, und die endgültige gelernte Knotendarstellung ist eine bestimmte Szene, beispielsweise die Knotendarstellung der drei Szenen Maschine/Feuer/Dampf.
Aber um Wissen aus verschiedenen Branchen zu übertragen und in andere Szenebranchen zu integrieren, haben wir das Lernen zur Darstellung von Shared-Domain-Einbettungsknoten durchgeführt. Beispielsweise sind Bahntickets und Bustickets ähnlich. Wenn eine Benutzerstichprobe nun aus Bustickets stammt, kann die Einbettung der Bahnticketszene auch gewichtet und für Benutzer freigegeben werden. Basierend auf dieser Annahme wurde das Share-Domain-Representation-Learning durchgeführt. Es stellt hauptsächlich die Knoten von drei Arten von Szenen dar und erhält durch die Gewichtung des Aufmerksamkeitsmechanismus eine spezifische Einbettung.
Durch dieses EAGT-Netzwerk können wir drei Hauptkategorien von Knotendarstellungen extrahieren. Nachdem jede Stichprobe die Knotendarstellungen der drei Hauptkategorien erhalten kann, kann der Durchschnittswert innerhalb der Kategorie ermittelt werden, um die drei Knotendarstellungen von Benutzern, Ereignissen und kreativen Ideen zu erhalten. Schließlich erfolgt die gemeinsame Darstellung von Benutzerereignissen und die gemeinsame Darstellung von Jede kreative Kopie wird in Teil 2 – Adaptive Clustering Gain Network – eingegeben.
Nutzen Sie die Weisheit der Masse, um individuelle Vorlieben vorherzusagen, und der Prozess wird durch Operationen innerhalb der Charge ausgeführt. In jedem Stapel werden Benutzer in jedem Stapel durch einen erlernbaren Klassifikator in k Hauptkategorien eingeteilt, in der Hoffnung, dass ähnliche Benutzer in dieselbe Kategorie eingeteilt werden können. Unter der Garantie des Zufallsstichprobenmechanismus können Benutzer in der inneren Kategorie über ähnliche kreative Werbetexte abstimmen, um herauszufinden, an welchen kreativen Werbetexten die Benutzer in der inneren Kategorie mehr interessiert sind. Schließlich werden die Präferenzen der In-Group verwendet, um die Präferenzen einzelner Benutzer darzustellen, und dann kann jede Stichprobe neu beschriftet werden. Beispielsweise reagiert G1 empfindlicher auf die dritte Idee und G2 empfindlicher auf die zweite Idee. Benutzer in der inneren Kategorie werden sie erneut kennzeichnen. Führen Sie nach Erhalt der neu beschriftbaren Probe eine MLP-Vorhersage durch, um den vorhergesagten Wert zu erhalten.
Multiperspektivisches Aufmerksamkeitsnetzwerk, der Hauptzweck besteht darin, den dreidimensionalen Co-Aufmerksamkeitsmechanismus zu nutzen, um die inneren Vektoren zwischen Benutzern und Ereignissen, Ereignissen und Ideen sowie Benutzern und zu verbinden Ideen Relevante Interessen werden extrahiert und als wichtige Merkmale für die Vorhersage verwendet.
Wir haben auch einige Designs in der Verlustfunktion des Trainings erstellt. Insgesamt werden vier Verlustfunktionen entworfen.
Die erste Verlustfunktion ist der Intraverlust. Hauptsächlich im Clustering-Block, um dem Populationsklassifikator die Ausgabe eines ungleichmäßig verteilten Werts zu ermöglichen. Aus dieser Formel können wir ersehen, dass wir hoffen, dass ähnliche Benutzer in einer bestimmten Kategorie einen Spitzenausdruck und in anderen Kategorien einen relativ niedrigen Ausdruck erhalten.
Die zweite Möglichkeit besteht darin, Kreuzentropie als Verlust des Clustering-Gain-Netzwerks zu verwenden.
Der dritte ist der globale Verlust, der ebenfalls Kreuzentropie ist.
Führen Sie abschließend die drei Verluste zusammen, um einen Fusionsverlust zu erhalten.
Ein Teil unseres Datensatzes stammt aus der Industrie und wir sammeln Datensätze von Fliggy. Der andere Teil ist der öffentliche Datensatz von Tianchi Advertising Creative.
Wir haben es auch mit dem Werbe-Kreativ-Ranking-Algorithmus in der Branche sowie einigen Benutzerinteressen und szenarioübergreifenden Lerngrundlagen verglichen. Die Metriken sind hauptsächlich AUC.
Aus den experimentellen Daten ist ersichtlich, dass es nach dem Entwurf unserer Netzwerkstruktur zu einer gewissen Verbesserung der AUC gekommen ist. Unter diesen ist die Verbesserung von Multi-View-Netzwerken offensichtlicher, gefolgt von Verstärkungsnetzwerken und dann der Struktur heterogener Diagrammnetzwerke.
Wir haben auch einige Fälle online gesammelt, damit wir etwas über die Szenarien der Benutzer erfahren können. Zum Beispiel Wetterinformationen oder lange und kurze Bilder und andere Szenen. Wir haben es auch online gemacht. In einigen Experimenten hat es sich im Vergleich zum Base2-Zufallsmodell um 10 % verbessert. Im Vergleich zum gerade erwähnten Werbekreativ-HPM-Modell hat es sich um 5 verbessert %
. 5. Zusammenfassung und Ausblick# 🎜🎜#In dieser Arbeit gibt es zwei Hauptaspekte von Innovation:
Adaptives Clustering-Gain-Netzwerk:
Im Vergleich zu herkömmlichen Ranking-Problemen Kreative Empfehlungen sind ein Top-1-Problem und stehen einigen kontrafaktischen Phänomenen gegenüber, die bei kausalen Schlussfolgerungen auftreten. Wir können es auch durch Gruppenlernen besser lindern. 6. Frage- und Antwortsitzung Szenenverständnis? A1: Das Ereignisverständnis basiert hauptsächlich auf der Zusammenarbeit mit dem Betrieb. Wir werden uns mit den Daten befassen. Ereignisse sind manchmal unvorhersehbar. Wenn es vorhersehbar ist, kann es in ein Etikettensystem eingespeist werden. Wenn es unvorhersehbar ist, müssen wir eine Anomalieerkennung durchführen, um es herauszufinden.
Szenarioverständnis: Im Suchszenario können Sie beispielsweise einige Absichten in Query verwenden, um zu analysieren, was der Benutzer kaufen möchte Dieses Mal ist es bei der Versicherungsempfehlung jedoch schwierig, anhand der Kontextinformationen herauszufinden, welche Versicherung der Benutzer kaufen möchte. Daher erfolgt das Verständnis des Szenarios zunächst durch eine Datenanalyse und dann durch einige Funktionen. Oben können wir sehen, welche Szenarien einen Transformationseffekt auf Benutzer haben, die eine Versicherung abschließen, oder auf Benutzer, die Ideen kaufen, und diese dann in Tags integrieren . Im System erledigen wir hauptsächlich einige Dinge auf der Etikettierungsseite. F2: Welche Form der Einbettung hat der kreative Texter zuerst vorgenommen?
A3: In Bezug auf Kanten führen wir hauptsächlich einen Prozess durch, der der bedingten Transformationswahrscheinlichkeit ähnelt. Beispielsweise kann die Conversion-Rate eines Studentenknotens bei schlechten Wetterbedingungen höher sein. In einigen Fällen werden Randbeschneidungsvorgänge durchgeführt. Das Lernen der Kantendarstellung ist nicht beteiligt, dies geschieht hauptsächlich im Lernprozess von Knoten.
A4: Eventtexte zu schreiben ist immer noch ein bisschen manuell. Da es dieses Jahr viele Vorfälle in der Versicherungsbranche gab, werfen wir auch einen Blick auf den Wirkungszeitraum jedes Vorfalls. Der ungefähre Zyklus wird etwa eine Woche bis zwei Wochen betragen, sodass auch der Zeitzyklus dieses Bereichs innerhalb dieses Bereichs gesteuert wird.
Was die Aktualität des Copywritings betrifft, binden wir das Copywriting in eine strenge Regel ein. Zum Beispiel ist das Mittherbstfest gerade erst vorbei. Wenn wir Text für das Mittherbstfest haben, wird dieses Texten erst während des Mittherbstfestes wirksam. Wenn Ihre Abreise beispielsweise während des Mittherbstfestes oder Ihr Einkauf während des Mittherbstfestes erfolgt, wird dies zu anderen Zeitpunkten definitiv nicht berücksichtigt.
Das war's für das heutige Teilen, vielen Dank an alle.
Das obige ist der detaillierte Inhalt vonAnwendung des ereignisbewussten Clustering-Gain-Netzwerks im kreativen Ranking von Fliggy Insurance. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!