Maison > Article > Périphériques technologiques > Application d'un réseau de gain de clustering sensible aux événements dans le classement créatif de Fliggy Insurance
Quand il s'agit de créativité, tout le monde pensera d'abord à la créativité publicitaire. En fait, la recommandation créative de l'assurance est aussi un produit d'application verticale de la créativité publicitaire.
Le problème résolu par la publicité informatique est de sélectionner les publicités correspondantes pour des utilisateurs spécifiques afin de faire correspondre les meilleurs graphiques et textes créatifs sous une sémantique spécifique. Dans le module de recommandation d'assurance auxiliaire, le contexte fait référence à certaines informations contextuelles sur l'utilisateur achetant des billets d'avion ou des billets de train ; dans le scénario de recherche, le contexte fait référence à certains mots de requête dans le moteur de recherche ; Les informations, telles que l'âge et le sexe, etc. ; les publicités sont des produits d'assurance, des cosmétiques hôteliers et d'autres produits de grandeur N, le nombre de graphiques et de textes créatifs est de grandeur N*M ; Les défis auxquels est confrontée la publicité informatique résident dans des problèmes d'optimisation et de recherche à grande échelle sous des contraintes complexes.
Cet article parle principalement de la recommandation d'images et de textes créatifs. La sélection et l'ordre des publicités ne seront pas pris en compte. Ensuite, nous présenterons comment Fliggy Insurance utilise les recommandations créatives.
Tout d'abord, dans l'industrie OTP, l'assurance voyage en tant qu'activité auxiliaire est actuellement une source de revenus commerciaux relativement importante. Dans les recommandations d'assurance, en plus des recommandations de produits et des recommandations de prix, les recommandations créatives ont été utilisées comme module de recommandation personnalisée très important. Par exemple, lorsque vous remplissez des informations personnelles, vous pouvez voir certains composants, et lorsque vous déroulez la caisse, vous verrez également des fenêtres contextuelles.
Les défis rencontrés par la recommandation créative en assurance peuvent être résumés en trois grandes catégories :
Une catégorie est data Sparse, y compris la rareté des données utilisateur et la rareté des données créatives. La rareté des données créatives fait référence au fait que les étudiants en opérations ou en UI répètent des idées créatives, ou que certaines idées créatives sont mises et retirées des étagères pour des raisons saisonnières, de sorte que l'exposition créative en ligne n'est pas répartie uniformément. De plus, étant donné que les voyages, l'assurance et la créativité sont des transactions à faible fréquence, nous obtenons rarement trois éléments de données d'achat associés, tels que les données personnelles de l'historique des achats de l'utilisateur. Dans le même temps, comme l'assurance est un produit auxiliaire, contrairement à la recherche, vous pouvez clairement connaître l'intention d'achat de l'utilisateur. Il manque également un système unifié et structuré entre la compréhension créative et la compréhension des utilisateurs.
La deuxième catégorie concerne les exemples de données contrefactuelles. Chaque utilisateur ne peut voir qu'une copie de création unique, c'est-à-dire qu'il ne peut voir que la création A ou B. Plusieurs idées créatives ne peuvent pas être exposées au même utilisateur au même moment et au même moment.
La troisième catégorie est Démarrage à froid créatif intersectoriel. Fliggy Insurance couvre plusieurs secteurs. Lorsque nous commençons à intervenir dans de nouveaux secteurs, la manière de réutiliser les connaissances dans des domaines existants, comme la migration de certaines idées qui fonctionnent bien dans le secteur A vers le secteur B, est également un problème que nous résoudrons plus tard.
Permettez-moi de vous présenter brièvement la situation actuelle de l'industrie.
La créativité publicitaire est divisée en deux grandes catégories d'algorithmes : l'une est constituée d'algorithmes indépendants du contexte, tels que l'échantillonnage glouton d'Epsilon ou l'échantillonnage de Thompson, et certains algorithmes E&E plus élégants créés par les étudiants d'Alimama, tels que la corrélation de régression linéaire bayésienne. L'autre type est des algorithmes liés au contexte, qui ajoutent des informations utilisateur et contextuelles sous forme de recommandations.
Pour résoudre le problème de la rareté des données, nous utilisons principalement l'apprentissage inter-domaines pour résoudre deux problèmes, deux tâches liées, en utilisant les données de domaines de données riches pour résoudre des problèmes dans des domaines de données rares et en combinant des données dans plusieurs domaines pour résoudre des problèmes dans chaque domaine.
Tout d'abord, nous pouvons voir à partir des informations sur les données que nos données de préférences historiques créatives pour les utilisateurs individuels sont relativement clairsemé, mais pour les groupes, les utilisateurs peuvent effectivement effectuer certaines caractérisations. Par exemple, il ressort des données que les personnes âgées préfèrent les descriptions liées à la famille ; en cas de mauvais temps le jour du départ, le secteur des billets d'avion est plus sensible aux documents similaires aux prévisions météorologiques. Nous pouvons ensuite transformer notre réflexion des données des utilisateurs individuels sur la manière d'unifier la compréhension des groupes, des événements associés et de la créativité, et formuler des recommandations de groupe après le marquage des associations. Après une compréhension systématique, l'établissement d'un diagramme de relation causale entre les trois peut résoudre certains des problèmes liés à la rareté des données utilisateur individuelles.
Visant le problème de la rareté des données créatives, notre solution consiste à exposer de manière aléatoire les nouveaux matériaux en ligne lorsqu'ils sont mis en ligne.
Un autre problème est le démarrage à froid de la créativité intersectorielle. Par exemple, nous avons constaté qu'en ce qui concerne les facteurs liés aux événements météorologiques, quel que soit le secteur d'activité, les préférences de chacun sont en fait relativement similaires, en particulier dans le secteur des billets de bus ou de train, les habitudes d'achat de chacun sont très similaires, donc certaines connaissances créatives recommandées sont La migration peut être réalisée à travers l’étiquetage et la compréhension systématique et l’association d’étiquetage qui vient d’être évoquée. En alignant les étiquettes de différentes industries sous le même système de connaissances, un certain transfert de connaissances par généralisation est effectué grâce à la capacité de généralisation du modèle de convolution graphique.
La compréhension systématique et le marquage standardisé que nous venons de mentionner sont principalement divisés en trois parties :
L'une est du côté de l'utilisateur, nous ferons une certaine compréhension des scènes et des événements ; la première partie consiste à comprendre les attributs de base des utilisateurs ; la dernière partie consiste à comprendre certains éléments graphiques et textuels en termes de créativité. Enfin, tous les trois sont unifiés et standardisés sous le système d’étiquettes, ce qui permettra d’établir ultérieurement la relation entre les graphiques.
L'image ci-dessus est une image plus évidente. Parmi eux, les symboles triangulaires représentent certains attributs du côté utilisateur, comme les femmes ou les personnes âgées ; les symboles circulaires servent à classer la compréhension d'événements ou de contextes, comme le tonnerre ou les voyages de nuit ; matériels.
Le troisième défi que nous venons de mentionner est qu'il existe un phénomène contrefactuel dans l'échantillon. Pour résoudre ce problème, nous pensons utiliser l'idée d'élévation causale consiste à utiliser le taux de conversion moyen du groupe sous. différents supports marketing pour estimer les préférences individuelles.
En combinant les trois types de solutions que nous venons de mentionner, nous avons proposé un modèle de conception de la structure du réseau. Définissez d'abord le problème : l'entrée est constituée d'informations utilisateur, d'informations contextuelles et d'informations structurées de rédaction de créations, pour trier et noter les créations publicitaires, puis sélectionner la création avec le score le plus élevé à envoyer à l'utilisateur.
L'image ci-dessus est le cadre du processus de recommandation de graphiques et de textes de création d'assurance.
Tout d'abord, comme mentionné précédemment, dans le module créatif, nous n'intervenons pas dans le tri des types d'assurance ou des prix. Le tri des graphiques créatifs et du texte est utilisé comme logique de tri final du lien. Lorsqu'une demande d'utilisateur arrive, quatre compréhensions sont effectuées. Compréhension au niveau de l'événement, par exemple s'il pleut actuellement ; compréhension de la scène, par exemple si l'utilisateur est plusieurs personnes avec des enfants ou une personne âgée et compréhension des attributs de base de l'utilisateur ; Une fois que la bibliothèque de matériaux est également marquée avec les balises qui viennent d'être mentionnées, le rappel des étiquettes des matériaux et le tri ultérieur de la créativité matérielle seront effectués. Du côté du tri, une partie du trafic sera également réservée à l'exposition en ligne.
L'autre partie est de faire le travail d'optimisation créative. Le travail de sélection créative est divisé en deux étapes :
Une étape consiste à rappeler et à trier grossièrement à l'aide de matériel d'image, l'autre consiste à trier grossièrement à l'aide de matériel de rédaction, et enfin une combinaison cartésienne est utilisée pour afficher la rédaction créative que nous souhaitons, et enfin via ECUNet passe en premier.
La solution ECUNet est conçue sur la base des trois idées de solutions qui viennent d'être évoquées. Il est principalement divisé en trois parties :
La première partie est basée sur l'extraction de vecteurs de graphiques sensibles aux événements. Il s'agit principalement d'un processus de pré-formation côté hors ligne pour fournir à chaque utilisateur des informations contextuelles. informations ou Il s'agit de l'extraction de vecteurs graphiques basés sur des informations créatives ; la deuxième partie est le réseau de gain de clustering adaptatif. Le problème résolu dans cette partie est de combiner l'idée d'élévation pour utiliser la sagesse de groupe pour résoudre des problèmes individuels. Combinez les utilisateurs, les scénarios et les événements utilisateur. En plus des caractéristiques des trois parties de la créativité, le vecteur complet obtenu grâce à l'extraction de vecteurs graphiques est utilisé pour effectuer une co-attention entre les deux. Le but est d'extraire leurs caractéristiques mutuelles et enfin. faire la notation.
La construction d'un graphe hétérogène est principalement divisée en deux parties : l'une est la construction de nœuds et l'autre est la construction de bords.
La construction de nœuds se produit principalement lorsque des échantillons d'utilisateurs arrivent et peuvent être mappés à trois types de nœuds : les nœuds utilisateur, les nœuds d'événement et les nœuds créatifs. Après avoir mappé trois types de nœuds, des arêtes peuvent être construites entre les nœuds.
L'arête représente l'importance du nœud a menant à la conversion d'assurance pour la raison b. Par exemple, le poids du nœud étudiant a dans le nœud mauvais temps b sera supérieur au poids du nœud étudiant a dans le nœud temps normal.
Selon la méthode ci-dessus, un graphe hétérogène a été construit. Sur la base de ce graphique, la représentation des trois scènes de chaque nœud est extraite en comparant l'intégration de nœuds conventionnelle.
est principalement une tâche de prédiction de bord grâce à l'apprentissage auto-supervisé de graphiques. L'apprentissage final concerne des scénarios spécifiques, tels que avion/incendie/. steam. représentation de nœud d’une scène.
Mais afin de transférer les connaissances de différentes industries et de les intégrer dans d'autres industries de la scène, nous avons effectué un apprentissage de la représentation des nœuds d'intégration de domaines partagés. Par exemple, les billets de train et les billets de bus sont similaires. Si un échantillon d'utilisateur provient désormais de billets de bus, l'intégration de la scène des billets de train peut également être pondérée et partagée pour que les utilisateurs puissent l'utiliser. Sur la base de cette hypothèse, un apprentissage de la représentation du domaine de partage a été effectué. Il représente principalement les nœuds de trois types de scènes et obtient un intégration spécifique grâce à la pondération du mécanisme d'attention.
Grâce à ce réseau EAGT, nous pouvons extraire trois grandes catégories de représentations de nœuds. Une fois que chaque échantillon peut obtenir les représentations de nœuds de trois catégories principales, la valeur moyenne au sein de la catégorie peut être obtenue pour obtenir les trois représentations de nœuds des utilisateurs, des événements et des idées créatives. Enfin, la représentation conjointe des événements utilisateur et la représentation conjointe des. chaque copie créative est entrée dans la partie 2 - Réseau de gain de clustering adaptatif.
Utilisez la sagesse de la foule pour prédire les préférences individuelles, et le processus est effectué par opérations au sein du lot. Dans chaque lot, les utilisateurs de chaque lot sont classés en k catégories principales via un classificateur apprenable, en espérant que les utilisateurs similaires pourront être classés dans la même catégorie. Sous la garantie du mécanisme d'échantillonnage aléatoire, les utilisateurs de la catégorie interne peuvent voter pour une rédaction créative similaire afin de déterminer la rédaction créative qui intéresse le plus les utilisateurs de la catégorie interne. Enfin, les préférences du groupe sont utilisées pour représenter les préférences des utilisateurs individuels, puis chaque échantillon est ré-étiqueté. Par exemple, G1 est plus sensible à la troisième idée créative et G2 est plus sensible à la seconde. Les utilisateurs de la catégorie interne la re-étiqueteront à nouveau. Après avoir obtenu l’échantillon re-étiquetable, effectuez une prédiction MLP pour obtenir la valeur prédite.
Réseau d'attention multi-perspective, l'objectif principal est d'utiliser le mécanisme de co-attention tridimensionnelle pour connecter les vecteurs internes entre les utilisateurs et les événements, les événements et les idées, et les utilisateurs et idées Les intérêts pertinents sont extraits et utilisés comme caractéristiques importantes pour la prédiction.
Nous avons également réalisé quelques conceptions dans la fonction de perte de formation. Au total, quatre fonctions de perte sont conçues.
La première fonction de perte est la perte intra. Principalement dans le bloc de clustering, afin de permettre au classificateur de population de produire une valeur non uniformément distribuée. À partir de cette formule, nous pouvons voir que nous espérons que des utilisateurs similaires pourront obtenir une expression maximale dans une certaine catégorie et une expression relativement faible dans d'autres catégories.
La seconde consiste à utiliser l'entropie croisée comme perte du réseau de gain de clustering.
Le troisième est la perte globale, qui est également une entropie croisée.
Enfin, fusionnez les trois pertes ensemble pour obtenir une perte de fusion.
Une partie de notre ensemble de données provient de l'industrie et nous collectons l'ensemble de données de Fliggy. L'autre partie est l'ensemble de données publiques de Tianchi Advertising Creative.
Nous l'avons également comparé à l'algorithme de classement des créations publicitaires du secteur, ainsi qu'à certaines bases d'intérêts des utilisateurs et à l'apprentissage inter-scénarios. Les métriques sont principalement AUC.
Les données expérimentales montrent qu'après la conception de notre structure de réseau, l'AUC a été améliorée dans une certaine mesure. Parmi eux, l'amélioration des réseaux multi-vues est la plus évidente, suivie par les réseaux à gain, puis par la structure des réseaux de graphes hétérogènes.
Nous avons également récupéré quelques cas en ligne afin de pouvoir apprendre certaines choses sur les scénarios des utilisateurs. Par exemple, des informations météorologiques ou des images longues et courtes et d'autres scènes.
Nous avons également fait quelques expériences en ligne. Par rapport au modèle aléatoire Base2, il s'est amélioré de 10% Par rapport au modèle HPM créatif publicitaire que nous venons de mentionner, il s'est amélioré de . 5%.
Dans ce travail, il y a deux innovations principales :
Extracteur de graphe sensible aux événements : Actuel dans l'industrie La perception de l'événement est moins prise en compte, notamment dans le module de recommandation créative. Notre travail est relativement innovant. En intégrant certaines informations cross-scénarios, comme les préférences des utilisateurs pour certains types d'assurance, certains graphiques et textes, ou encore la migration des événements entre cross-scénarios. Parallèlement, cet événement est utilisé comme nœud d’influence pour modéliser la relation entre les utilisateurs et la créativité sous forme de graphique.
Réseau de gain de clustering adaptatif : Par rapport aux problèmes de classement traditionnels, la recommandation créative est un problème Top1 et fait face à certains phénomènes contrefactuels rencontrés dans l'inférence causale. Nous pouvons également mieux l’atténuer grâce à un apprentissage en groupe.
A1 : La compréhension des événements implique principalement la coopération avec les opérations. Nous allons creuser dans les données. Les événements sont parfois imprévisibles. Si c'est prévisible, cela peut être précipité dans un système d'étiquettes. Si c'est imprévisible, nous devons procéder à une détection d'anomalies pour les découvrir.
Compréhension des scénarios. Par exemple, dans les scénarios de recherche, vous pouvez utiliser certaines intentions dans Query pour analyser ce que l'utilisateur veut acheter cette fois-ci. Cependant, dans les recommandations d'assurance, il est difficile d'obtenir ce que l'utilisateur veut. acheter à partir des informations contextuelles. Quelle assurance. Par conséquent, la compréhension des scénarios passe davantage par le raisonnement. Il s'agit d'abord d'un aperçu de l'analyse des données, puis, grâce à certaines fonctionnalités ci-dessus, nous pouvons voir quels scénarios ont un effet de transformation sur l'achat d'une assurance par les utilisateurs ou sur l'achat d'idées par les utilisateurs, puis les intégrer dans des balises. Dans le système, nous faisons principalement certaines choses du côté de l'étiquetage.
A2 : Cela se fait principalement sous la forme recommandée. La multimodalité ne se reflète pas dans ce travail. Nous avons du travail dans d'autres travaux. L'incorporation vient d'être évoquée, principalement par exemple, certaines représentations de type ID, ou certaines représentations statistiques, puis ces représentations seront dans ce réseau de graphe, et enfin l'incorporation d'un nœud de graphe sera réalisée. L’un des avantages de l’intégration de nœuds graphiques est que, par exemple, si un certain type d’utilisateur est sensible à une rédaction créative, il peut y avoir une situation similaire entre l’utilisateur et la rédaction créative.
A3 : Concernant les arêtes, nous effectuons principalement un processus similaire à la probabilité de transformation conditionnelle. Par exemple, le taux de conversion d’un nœud étudiant peut être plus élevé en cas de mauvaises conditions météorologiques. Dans certains cas, des opérations de recadrage des bordures seront effectuées. L'apprentissage de la représentation des bords n'est pas impliqué, il s'agit principalement du processus d'apprentissage des nœuds.
A4 : La rédaction événementielle est encore un peu manuelle. Parce qu'il y a eu de nombreux incidents dans le secteur des assurances cette année, nous examinerons également la période d'impact de chaque incident. Le cycle approximatif sera d'environ une à deux semaines, donc le cycle temporel de cette zone sera également contrôlé dans cette plage.
Concernant la rapidité de la rédaction, lions la rédaction à une règle forte. Par exemple, la Fête de la Mi-Automne vient de passer il y a quelque temps. Si nous avons une rédaction pour la Fête de la Mi-Automne, alors cette rédaction ne prendra effet que pendant la Fête de la Mi-Automne. Par exemple, si votre heure de départ est pendant la Fête de la Mi-Automne, ou si votre heure d'achat est pendant la Fête de la Mi-Automne, elle sera rappelée. Elle ne le sera certainement pas à d'autres moments.
C'est tout pour le partage d'aujourd'hui, merci à tous.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!