ホームページ >テクノロジー周辺機器 >AI >Fliggy Insurance のクリエイティブランキングにおけるイベント対応クラスタリングゲインネットワークの適用
創造性というと、誰もがまず広告の創造性を思い浮かべます。 、保険クリエイティブが推奨されています。広告クリエイティビティの垂直アプリケーション製品でもあります。
コンピューテーショナル広告によって解決される問題は、特定のセマンティクスの下で特定のユーザーにサービスを提供することです。適切なものを選択してください最高のクリエイティブなグラフィックにマッチする広告。補助保険推奨モジュールでは、コンテキストは航空券や鉄道チケットを購入するユーザーに関するコンテキスト情報を指します。検索シナリオでは、コンテキストは検索エンジンのいくつかのクエリ語を指します。ユーザー関連情報はユーザーのベースを指します。年齢や性別などの情報、広告は保険商品、ホテルの化粧品、その他の N 個の商品、クリエイティブなグラフィックとテキストの数は N*M 個です。コンピュテーショナル広告が直面する課題は、複雑な制約の下での大規模な最適化と検索の問題にあります。
この記事では、主にクリエイティブな写真やテキストの推奨について説明します。広告の選択や順序については考慮されていません。次に、Fliggy Insurance の仕組みについて紹介します。クリエイティブな推奨事項を使用します。
第一に、OTP 業界では、補助事業としての旅行保険が現在、比較的重要な収益源となっています。所得。 。保険の推奨では、商品の推奨や価格の推奨に加えて、クリエイティブな推奨が非常に重要なパーソナライズされた推奨モジュールとして使用されています。たとえば、個人情報を入力するときにいくつかのコンポーネントが表示され、チェックアウトをプルダウンするとポップアップ ウィンドウも表示されます。
保険のクリエイティブな推奨保険 直面する課題は、次の 3 つの主要なカテゴリに要約できます。
最初のカテゴリは データです。 sparseness (スパース ユーザー データとスパース クリエイティブ データを含む)。クリエイティブ データの希薄性とは、運用や UI の学生がクリエイティブなアイデアを繰り返したり、季節的な理由で一部のクリエイティブなアイデアが棚に置かれたり棚から消えたりするため、オンラインでのクリエイティブな露出が均等に分散されていないという事実を指します。さらに、旅行、保険、クリエイティブは低頻度のトランザクションであるため、ユーザーの個人購入履歴データなど、関連する 3 つの購入データを取得することはほとんどありません。同時に、保険は検索とは異なり補助的な商品であるため、ユーザーの購入意図を明確に知ることができます。また、クリエイティブの理解とユーザーの理解の間には、統一的で構造化されたシステムも不足しています。
#2 番目のカテゴリは、サンプル データの反事実です。各ユーザーは、一意のクリエイティブ コピーのみを表示できます。つまり、クリエイティブ A または B のみを表示できます。複数の創造的なアイデアを同じ期間および時点で同じユーザーに公開することはできません。
#3 番目のカテゴリは #異業種クリエイティブ コールド スタート。 Fliggy Insurance は複数の業界にまたがっており、新たな業界に参入する場合、A 業界でうまくいったアイデアを B 業界に移行するなど、既存分野の知識をどのように再利用するかということも今後の課題となります。
# 業界の現状を簡単にご紹介します。
広告の創造性は、アルゴリズムの 2 つの大きなカテゴリに分類されます。1 つは、Epsilon グリーディやトンプソン サンプリングなどのコンテキストに依存しないアルゴリズムで、もう 1 つはベイジアン線形回帰関連など、Alimama の学生によって作成されたよりエレガントな E&E アルゴリズムです。もう 1 つのタイプは、ユーザー情報とコンテキスト情報を推奨事項として追加するコンテキスト関連アルゴリズムです。
データの希薄性の問題を解決するために、クロスドメイン学習は主に 2 つの問題、2 つの関連タスクを解決し、豊富なデータ ドメインのデータを使用して希少なデータ ドメインの問題を解決し、複数のドメインのデータを組み合わせます。さまざまな領域の問題を解決します。
まず第一に、データの洞察から、個々のユーザーのクリエイティブな履歴の好みに関するデータは比較的少ないことがわかりますが、実際にグループ ユーザーの特徴をいくつか明らかにすることができます。例えば、高齢者は家族に関する記述を好むことがデータからわかりますし、出発日に悪天候の場合、航空券業界は天気予報のような内容に敏感になることがわかります。そうすれば、個々のユーザーデータから、グループ、関連するイベント、創造性の理解を統一し、関連付けのマーキング後にグループの推奨事項を作成する方法に考え方を変えることができます。体系的に理解した後、3 つの間の因果関係図を確立すると、個別のユーザー データがまばらであるという問題の一部を解決できます。
クリエイティブ データがまばらであるという問題に対処するため、私たちの解決策は、新しい素材がオンラインになったときにランダムに公開することです。
もう 1 つの問題は、業界を超えた創造性のコールド スタートです。たとえば、気象要因に関しては、さまざまな業界に関係なく、実際には全員の好みが比較的似ていることがわかりました。特にバスのチケットや電車のチケットのビジネスでは、全員の購買習慣が非常に似ているため、創造的に推奨される知識としては、移行が可能であることがわかりました。先ほど述べたラベル付け、体系的な理解、およびラベルの関連付けを通じて実行されます。同じ知識システムの下で異なる業界のラベルを調整することにより、グラフ畳み込みモデルの一般化機能を通じて知識の一般化移転が実行されます。
##今述べた体系的な理解と標準化された採点は、主に 3 つの部分に分かれています。
1 つの部分はユーザー側で、シナリオとイベントについての理解を行います。もう 1 つの部分はユーザーの基本的な属性について行い、最後にクリエイティブ側で次のことを行います。ある程度の理解 いくつかのグラフィックおよびテキスト資料を理解します。最後に、3 つすべてがラベル システムの下で統一および標準化されます。これは、後でグラフ間の関係を確立するのに役立ちます。
#上の図は、より明らかな図です。このうち、三角記号は女性や老人などのユーザー側の属性、丸記号は雷や夜間移動などの出来事や文脈理解、四角記号は素材の分類を示しています。
#先ほど述べた 3 番目の課題は、サンプルに反事実的な現象があるということです。この問題を解決するために私たちが考えているのは、高揚思考を使用することです。原因と結果 推論とは、さまざまなマーケティング資料の下でのグループの平均コンバージョン率を使用して、個人の好みを推定することです。
3. ソリューション
##先ほど述べた 3 種類のアイデアのソリューションを組み合わせて、A モデルを作成します。ネットワーク構造の設計を提案します。まず問題を定義します。入力はユーザー情報、コンテキスト情報、およびクリエイティブのコピーライティングの構造化情報であり、広告クリエイティブを並べ替えてスコア付けし、最も高いスコアを持つクリエイティブを選択してユーザーに出力します。
#上の図は、保険のクリエイティブなグラフィックとテキストの推奨プロセスのフレームワークです。 #まず、上で述べたように、クリエイティブ モジュールでは、保険の種類や価格の並べ替えには干渉しません。テキストはリンクの最終的な順序付けロジックとして使用されます。ユーザーからのリクエストが来ると、4つの理解が行われます。今雨が降っているかどうかなどのイベントレベルの理解、子供連れの複数人か高齢者かなどのシーンレベルの理解、そしてユーザーの基本的な属性の理解。素材ライブラリーにも先ほどのタグが付けられた後、素材のラベルリコールとその後の素材クリエイティビティのソートが行われ、ソート側ではトラフィックの一部がオンライン公開にも割り当てられます。 もう 1 つの部分は、クリエイティブの最適化の作業を行うことです。クリエイティブ選択作業は 2 つのステップに分かれています: 1 つは画像素材を呼び出して大まかに分類することであり、もう 1 つはコピーライティング素材を大まかに分類することであり、最後にデカルトの組み合わせを使用して、希望するクリエイティブなコピーライティングを表示します。 . 、最終的には ECUNet を通じて優先順位を付けます。 先ほど述べた 3 つのソリューションのアイデアに基づいて、設計を行います。 ECUNet ソリューション。これは主に 3 つの部分に分かれています: 最初の部分 は、主にオフライン側のイベント対応グラフ ベクトル抽出に基づいています。トレーニング プロセスは、ユーザー側の情報、コンテキスト情報、またはクリエイティブ情報ごとにグラフ ベクトルを抽出することであり、2 番目の部分は適応クラスタリング ゲイン ネットワークです。この部分で解決される問題は、グループを活用するためのアップリフトのアイデアを使用することです。 3 番目の部分は、ユーザーとシーン、ユーザー イベントとクリエイティビティの 3 つの部分の特性を使用し、グラフ ベクトル抽出によって得られた包括的なベクトルを使用して、2 つの間の Co-Attending を行い、抽出することを目的としています。それらの相互関係や特徴を把握し、最後にスコアリングを行います。 異種グラフの構築は主に 2 つに分かれますParts : 一部はノード構築であり、一部はエッジ構築です。 ノードの構築は主にユーザー サンプルが到着したときに行われ、ユーザー ノード、イベント ノード、クリエイティブ ノードの 3 種類のノードにマッピングできます。 3 種類のノードにマッピングした後、ノード間にエッジを構築できます。 エッジは、理由 b によるノード a の保険変換の重要性を表します。たとえば、悪天候ノード b の生徒ノード a の重みは、通常天候ノードの生徒ノード a の重みよりも高くなります。 1. 全体構造 ECUNet
2. EAGT: 異種グラフの構築
上記の方法に基づいて、異種グラフが構築されました。このグラフに基づいて、従来のノード埋め込みを比較することによって、各ノードの 3 つのシーンのノード表現が抽出されます。
# は主に、グラフの自己教師あり学習によるエッジ予測と損失のタスクです。マージンベースの損失関数を使用すると、最終的に学習されるのは、機械/火災/蒸気シーンなどの特定のシーンのノード表現です。
しかし、さまざまな業界からの知識を移転し、他のシーン業界に統合するために、共有ドメイン埋め込みノード表現学習を行いました。たとえば、電車の切符とバスの切符は似ており、ユーザー サンプルがバスの切符から取得されている場合、電車の切符のシーンの埋め込みにも重み付けを行い、ユーザーが使用できるように共有することができます。この仮定に基づいて、共有ドメイン表現学習が実行されました。主に 3 種類のシーンのノードを表現し、アテンション メカニズムの重み付けを通じて特定の埋め込みを取得します。
#この EAGT ネットワークを通じて、ノード表現の 3 つの主要なカテゴリを抽出できます。各サンプルが 3 つの主要なカテゴリのノード表現を取得できた後、カテゴリ内の平均値を取得して、ユーザー、イベント、創造的なアイデアの 3 つのノード表現を取得できます。各クリエイティブ コピーは、パート 2 - 適応クラスタリング ゲイン ネットワークに入力されます。
#集団の知恵を活用して個人の好みを推定する、 process バッチ内の操作に基づいて実行されます。各バッチでは、類似したユーザーが同じカテゴリに分類されることを期待して、各バッチ内のユーザーが学習可能な分類子によって k 個の主要カテゴリに分類されます。ランダム サンプル サンプリング メカニズムの保証の下、内部カテゴリのユーザーは、同様のクリエイティブ コピーライティングに投票して、どのクリエイティブ コピーライティングに内部カテゴリーのユーザーがより興味があるかを知ることができます。最後に、グループ内の好みを使用して個々のユーザーの好みを表現し、各サンプルを再ラベル付けします。たとえば、G1 は 3 番目の創造的なアイデアに対してより敏感であり、G2 は 2 番目のクリエイティブなアイデアに対してより敏感であり、内側のカテゴリのユーザーは再びラベルを付け直します。リラベルサンプルを取得した後、MLP 予測を実行して予測値を取得します。
多視点アテンション ネットワーク、主な目的は3 次元の Co-attention メカニズムにより、ユーザーとイベント、イベントとアイデア、ユーザーとアイデアの間の本質的な関連関心を、予測のための重要な特徴として抽出できます。
トレーニングの損失関数でもいくつかの設計を行いました。合計 4 つの損失関数が設計されています。
最初の損失関数は内部損失です。主にクラスタリング ブロック内で、母集団分類器が不均一に分布した値を出力できるようにするためです。この式から、同様のユーザーが特定のカテゴリでピークの表現を取得し、他のカテゴリでは比較的低い表現を取得できることを期待していることがわかります。 2 番目の方法は、クラスタリング ゲイン ネットワークの損失としてクロス エントロピーを使用することです。 3 番目はグローバル損失で、これもクロスエントロピーです。 最後に、3 つの損失を融合して融合損失を作成します。4. 実験と分析
また、業界の広告クリエイティブのランキング アルゴリズムと、ユーザーの興味やクロスのベースラインについても調査しました。 -シナリオ学習 比較のために、メトリクスは主に AUC です。
実験データから、ネットワーク構造の設計後、AUC に一定の改善が見られたことがわかります。その中で、マルチビュー ネットワークの改善がより明白で、次にゲイン ネットワーク、そして異種グラフ ネットワークの構造が続きます。
オンラインでもいくつかの事例を収集しており、ユーザーのシナリオについていくつかのことを学ぶことができます。たとえば、天気情報や長短の写真、その他のシーンなどです。
#オンラインでいくつかの実験も行いましたが、Base2 ランダム モデルと比較して、改善が見られました。先ほど述べた広告クリエイティブの HPM モデルと比較すると、 10% 増加しています。 ##5. 概要と展望
## この記事では
イベント対応グラフ抽出機能:
現在業界では、次の 2 つの主な革新があります。特に創造的な推奨モジュールでは、イベントの認識はあまり考慮されていません。私たちの仕事は比較的革新的です。特定の保険タイプ、特定のグラフィックスやテキストに対するユーザー設定、または複数のシナリオ間でのイベントの移行など、いくつかの複数のシナリオ間の情報を統合することによって。同時に、このイベントはユーザーとクリエイティビティの関係をグラフの形でモデル化するための影響ノードとして使用されます。 適応クラスタリング ゲイン ネットワーク:
従来のランキング問題と比較して、クリエイティブなレコメンデーションがトップ 1 であるという問題が直面しています。因果推論で遭遇するいくつかの反事実的な現象を伴います。また、グループゲイン学習を通じてそれをより効果的に軽減することもできます。 #6. 質疑応答
シナリオの理解。たとえば、検索シナリオでは、クエリでいくつかの意図を使用して、ユーザーが今回購入したいものを分析できますが、保険の場合は推奨事項 ユーザーがどのような保険に加入したいのかをコンテキスト情報から取得することは困難です。したがって、シナリオの理解は推論によって行われます。最初にデータ分析の洞察があり、次にいくつかの機能を通じて行われます。上記では、どのシナリオが保険を購入するユーザーやアイデアを購入するユーザーに変革効果をもたらすかを確認し、それらをタグに統合します. システムでは主にラベル付け側でいくつかのことを行います。
#Q2: クリエイティブなコピーライターは最初にどのような形式の埋め込みを行いますか?
A3: エッジに関しては主に条件変換確率と同様の処理を行っています。たとえば、学生ノードのコンバージョン率は、悪天候下では高くなる可能性があります。場合によっては、エッジ トリミング操作が実行されます。エッジ表現の学習は含まれていません。これは主にノードの学習プロセスにあります。
#A4: イベントのコピーライティングはまだ少し手作業です。今年は保険業界で多くの事件が発生したため、各事件の影響期間についても見ていきます。おおよその周期は1週間から2週間程度となりますので、このエリアの時間周期もこの範囲内に制御されることになります。
# コピーライティングの適時性について、コピーライティングを強力なルールにまとめてみましょう。たとえば、少し前に中秋節が過ぎましたが、中秋節のコピーライティングがある場合、そのコピーライティングは中秋節の間のみ有効になります。たとえば、出発時刻が中秋節の場合、または購入時刻が中秋節の場合はリコールされますが、それ以外の場合は絶対にリコールされません。
今日の共有はこれで終わりです。皆さん、ありがとうございました。以上がFliggy Insurance のクリエイティブランキングにおけるイベント対応クラスタリングゲインネットワークの適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。