ホームページ >テクノロジー周辺機器 >AI >Ant Marketing の推奨シナリオにおける因果関係修正手法の適用
推奨システムでは、データは、ユーザーに適切なアイテムを推奨するための推奨モデルをトレーニングするために収集されます。ユーザーが推奨アイテムを操作すると、収集されたデータはモデルをさらにトレーニングするために使用され、閉ループが形成されます。ただし、この閉ループにはさまざまな影響要因が存在し、エラーが発生する可能性があります。エラーの主な理由は、モデルのトレーニングに使用されるデータのほとんどが理想的なトレーニング データではなく観測データであり、露出戦略やユーザーの選択などの要因の影響を受けることです。このバイアスの本質は、経験的なリスク推定値の期待値と真の理想的なリスク推定値の期待値の違いにあります。
推奨されるマーケティング システムにおけるより一般的な逸脱には、主に次のようなものがあります。 3 つの種:
#他にも位置偏差、一貫性偏差などの偏差があります。
例を使用してみましょう。偏差を理解する モデリング プロセスへの影響。コーヒー摂取と心臓病の関係を研究したいとします。コーヒーを飲む人は心臓病を発症する可能性が高いことがわかったので、コーヒー摂取と心臓病の間に直接の因果関係があると結論付けることができるかもしれません。 ただし、交絡因子の存在に注意する必要があります。たとえば、コーヒーを飲む人は喫煙者である可能性が高いとします。喫煙自体は心臓病と関連しています。したがって、コーヒー摂取と心臓病との関係を単純に因果関係とみなすことはできませんが、交絡因子としての喫煙の存在が原因である可能性があります。 コーヒー摂取と心臓病の関係をより正確に研究するには、喫煙の影響を制御する必要があります。アプローチの 1 つは、喫煙者と非喫煙者をペアにして、コーヒー摂取と心臓病との関係を比較するマッチング研究を実施することです。これにより、結果に対する喫煙の交絡的な影響が排除されます。 因果関係とは、もし他の条件が変わらない場合、コーヒーの飲み方の変化が心臓病の発生の変化につながるかどうかという問題です。交絡因子の影響を制御した後にのみ、コーヒー摂取と心臓病の間に因果関係があるかどうかをより正確に判断することができます。
この問題を回避するにはどうすればよいでしょうか? 最も一般的な方法の 1 つは、不偏データを導入し、不偏データを使用してモデルが不偏表現を学習できるようにすることです。もう 1 つは、次の方法から開始することです。特性特性図の観点から確認し、後で観測データを調整することでずれを修正します。因果補正とは、バイアスの影響を取り除くために因果関係のある手段によってデータまたはモデルを処理することです。
原因 -アンドエフェクト図は有向図と無向図であり、リング図はシーン内のノード間の因果関係を記述するために使用されます。チェーン構造、分岐構造、衝突構造から構成されます。
バックドア パスとバックドア基準を決定するには、上記の例を参照してください。バックドア パスは、X を Y にリンクするパスを指しますが、Z から始まり、最終的に Y を指します。前の例と同様に、新型コロナウイルス感染症と死亡率の関係は純粋に因果関係があるわけではありません。新型コロナウイルス感染症は年齢に影響され、高齢者は新型コロナウイルス感染症に感染する可能性が高く、死亡率も高くなります。ただし、X と Y の間のすべてのバックドア パスをブロックするのに十分なデータがある場合、つまり Z が与えられた場合、X と Y を独立した関係としてモデル化できるため、実際の因果関係を取得できます。
以下では、SIGIR2023 の Industry Track で公開されている、データ融合修正に基づく Ant チームの成果を紹介します。この研究のアイデアは、不偏データを使用してデータ拡張を行い、モデルの修正をガイドすることです。
不偏データの全体的な分布は、偏りのあるデータの分布とは異なります。偏りのあるデータはサンプル空間全体の特定の部分に集中します。サンプルは比較的偏りの少ないデータを持つ一部の領域に集中するため、拡張サンプルがより偏りのない領域を持つ領域に近い場合、偏りのないデータはより重要な役割を果たします。拡張サンプルが領域に近い場合、偏りのないデータはより重要な役割を果たします。偏ったデータ領域を使用すると、偏ったデータがより多くの役割を果たすようになります。この目的のために、この論文では、データ拡張のために不偏データと偏りデータをより効果的に利用できる MDI モデルを設計します。
#上の図はアルゴリズムのフレームワーク図を示しています。MDI モデルはメタ学習を使用して、不偏データと重み付けされたデータのサンプルの重みを調整します。係数。まず、MDI モデルのトレーニングには 2 つのステージがあります。
L(fd) の動作損失を最適化して核融合デバイアス モデル fd をトレーニングします。最終的な損失には主に 2 つの項目があり、1 つは L-IPS、もう 1 つはL-IMP。 L-IPS は、元のサンプルを使用した最適化に使用する IPS モジュールです。R-UI は、任意のモデルを使用して傾向スコアを導出します (サンプルが偏りのないサンプルに属する確率、または偏りのあるサンプルに属する確率を決定します)。 ; 2 番目の項目 L-IMP はプリセット拡張モジュールの重み、R-UI はプリセット拡張モジュールによって生成されたテール インデックス、P-UI と 1-P-UI は現在の不偏教師モデルと融合モデルです。サンプル. より複雑なパターン情報を学習する手法の傾向スコア fp は、メタ学習によって解決されます。
以下は、アルゴリズムの完全なトレーニング プロセスです:
私たちは、Yahoo R3 と Coat という 2 つの公開データセットに対して評価を実施しました。 Yahoo R3 は、1,000 曲について 15,000 人のユーザーの評価を収集し、合計 310,000 件の偏りのあるデータ # と 5,400 件の不偏データを収集しました。 Coat データ セットは、290 人のユーザーによる 300 点の衣類の評価を通じて、6,900 個の偏りのあるデータと 4,600 個の偏りのないデータを収集します。両方のデータ セットのユーザーの評価の範囲は 1 から 5 です。偏ったデータはプラットフォームのデータ ユーザーから取得され、偏っていないサンプルはユーザーに評価をランダムに割り当てることによって収集されます。
2 つの公開データ セットに加えて、Ant は実際の業界シナリオからのデータ セットも使用しました。偏りのないデータ サンプルが非常に少ない状況をシミュレートするために、すべての偏りのあるデータ セットを組み合わせました。データセット データと不偏データの 10% がトレーニングに使用され、不偏データの 10% が検証として保持され、残りの 80% がテスト セットとして使用されます。私たちが使用するベースライン比較方法は主に次のとおりです。最初の方法は、それぞれ不偏データ、単一偏りデータ、直接データ融合を使用してトレーニングされたモデルを使用することです。2 番目の方法最初の方法少量の不偏データを使用して、偏りのあるデータと不偏データによって表される類似性を制約する正規表現を設計して修正演算を実行する方法であり、3 番目の方法は逆確率重み法、傾向スコアの逆確率です。ダブル ロバストも一般的な補正方法です。傾向のないダブル ロバストはデータ拡張方法であり、最初に不偏サンプルを使用して拡張モデルを学習し、次に拡張サンプルを使用してモデル全体のバイアス修正を支援します。自動デバイアスも一部を使用します。モデルのバイアスを修正するのに役立つ拡張のための不偏データ。
MSE と MAE の 2 つの指標を使用してパフォーマンスを評価しました。図に示すように、私たちが提案した MDI メソッドは、Coat データセットと Product データセットの両方の指標で比較的良好なパフォーマンスを示します。
Yahoo R3 データセットでは、私たちが提案した方法は MAE で最高のパフォーマンス インデックスを持ち、IPS を除く MSE で最高のパフォーマンスを示します。 3 つのデータ拡張手法 (PFDR、自動デバイアス、および私たちが提案する MDI) は、ほとんどの場合、より優れたパフォーマンスを発揮しますが、PFDR は不偏データを使用して拡張モデルを事前にトレーニングするため、不偏データに大きく依存します。 Coat モデルには 464 個の不偏トレーニング データ サンプルしかありません。不偏サンプルが少ないと、拡張モジュールが貧弱になり、データ パフォーマンスが比較的悪くなります。
AutoDebias は、さまざまなデータに対して PFDR とはまったく逆の動作を行います。 MDI は、不偏データと偏りのあるデータの両方を利用する拡張方法を設計しているため、より強力なデータ拡張モジュールを備えているため、不偏データが少ない場合でも、不偏データが十分にある場合でも、どちらの場合でもより良い結果を得ることができます。
また、2 つの公開データ セット上のさまざまな割合の不偏データ (不偏データの 50% ~ 40% とすべての偏りデータをそれぞれ使用) の下で、これらのモデルのパフォーマンスを評価しました。トレーニングでは、他のロジックが検証されます。不偏データの最初の 10%、残りのデータはテストに使用されます。この設定は前の実験と同じです。
上の図は、不偏データのさまざまな割合でさまざまな方法を使用した MAE のパフォーマンスを示しています。横軸は不偏データの割合を表し、縦軸は不偏データに対する各メソッドの効果を表しています。不偏データの割合が増加しても、AutoDebias、IPS、DoubleRubus の MAE には明らかな低下プロセスはありません。ただし、Debias 法に従う代わりに、元のデータ フュージョンを学習に直接使用する方法では、比較的明らかな低下が見られます。これは、不偏データのサンプル比率が高いほど、全体的なデータ品質が向上するためです。より良いパフォーマンスを学びましょう。
Yahoo R3 データがトレーニングに 30% 以上の不偏データを使用する場合、
この方法は、MDI を除く他のすべてのバイアス補正方法をも上回ります。ただし、MDI メソッドは比較的優れたパフォーマンスを達成できます。これは、MDI メソッドがさまざまなサイズの不偏データの下で比較的堅牢な結果をもたらすことも証明できます。#同時に、拡張モジュールの各部の設定が 3 つのデータセットに対して有効であるかどうかを検証するアブレーション実験も実施しました。 。
λ=0 の設定は、拡張モジュールが直接削除されることを意味します。Pu,i = 1 は、拡張データ モジュールのモデル化に偏りのないデータのみが使用されることを意味します。Pu,i = 0 は、偏りのあるデータのみが使用され、拡張モジュールは、Fusion データ モデリングの拡張データ モジュールを使用します。 上図はアブレーション実験の結果を示しており、MDI 法が 3 つのデータセットで比較的良好な結果を達成していることがわかり、拡張モジュールが必要であることがわかります。 公開データ セットであっても、実際のビジネス シナリオのデータ セットであっても、偏りのないデータと偏りのあるデータを融合するために私たちが提案した拡張方法は、以前のデータよりも優れています。すべてのスキームでより良い結果が得られ、MDI の堅牢性もパラメータ感度実験やアブレーション実験を通じて検証されています。
## チームのもう一つの作業であるバックドアによる調整と修正を紹介しましょう。この作品は SIGIR2023 の Industry Track にも掲載されています。バックドア調整・修正適用のシナリオは、マーケティング推奨のシナリオであり、下図に示すように、ユーザーとクーポン、あるいはユーザーと広告や商品とのインタラクションには一切の介入が発生せず、同等の可能性が存在します。あらゆるインタラクションの可能性があり、各クーポンも同様の機会を持ち、どのユーザーにも公開される可能性があります。 #しかし、実際のビジネス シナリオでは、一部の小規模販売者を保護または支援してトラフィックを増加させ、全体的なユーザー参加エクスペリエンスを確保するには、通常、一連の戦略的制約が設定されると、この状況により、一部のユーザーは特定のクーポンにさらされるようになり、他のユーザーは別のクーポンにさらされるようになります。この種の介入は、前述の共同創設者です。 この種の介入は、電子商取引マーケティング シナリオにおいてどのような問題を引き起こすでしょうか?上の図にあるように、わかりやすくするために、ユーザーを参加意欲の高いものと低いものの 2 つのカテゴリに、クーポンを大きな割引と小さな割引の 2 つのカテゴリに単純に分類します。図のヒストグラムの高さは、対応するサンプルの全体的な割合を表しており、ヒストグラムが高いほど、トレーニング データ全体における対応するサンプルの割合が大きくなります。図に示す少額の割引クーポンと参加意向の高いユーザーサンプルが多数を占めるため、モデルは図のような分布を学習し、参加意向の高いユーザーは少額の割引クーポンを好むと考えます。しかし実際には、同じ使用量の基準に直面した場合、ユーザーはより多くのお金を節約できるよう、より割引率の高いクーポンを間違いなく好むでしょう。写真のモデルは、少額割引クーポンの実際の変換確率が大規模割引クーポンよりも低いことを示していますが、特定のサンプルに対するモデルの推定では、少額割引クーポンの償却確率が高いと考えられるため、モデルもこのスコアを推奨するため、クーポンに対応して、これにより矛盾が生じます。 この矛盾の理由を因果関係図の観点から分析し、非修正的な推奨モデルを現在の環境に適用します。その因果関係図の構造 上の図に示すように、U はユーザーの表現を表し、I はアイテムの表現を表します。 D と K は、それぞれユーザーの観点と資本の観点の間の過去の相互作用です。T は、現在のビジネスによって設定されたいくつかのルール制約を表します。T を直接定量化することはできませんが、D と K を通じて間接的にユーザーとアイテムへの影響を確認できます。インパクト。 y はユーザーとアイテムの間のインタラクションを表し、その結果はアイテムがクリックされたか、削除されたかなどです。 因果関係図で表される条件付き確率式は図の右上に示されており、式の導出はベイズ確率式に従います。 U と I の与えられた条件の下で、P|Y ui の最終的な導出は U と I だけに関係するわけではありません。U は du の影響を受けるからです。つまり、p に u が与えられたときの p (du) の確率です。のものも存在します。 I が与えられると同様に、I も ki の影響を受けます。なぜこのような状況になるかというと、D と K の存在がシーン内のバックドア パスの存在につながるからです。つまり、U から始まらず、最終的に y を指すバックドア パス (U-D-T-Y または I-K-T-Y パス) は誤った概念を表します。つまり、U は y から T に影響を与えるだけでなく、y から D にも影響を与える可能性があります。 調整方法は、D から U へのパスを人為的に遮断し、U が U-T-Y および U-Y を通じてのみ y に直接影響できるようにすることです。偽の相関関係、それによって真の因果関係をモデル化します。バックドア調整は、観測データに対して do 計算を実行し、次に do 演算子を使用してすべての D とすべての K のパフォーマンスを集計し、U と I が D と K の影響を受けないようにすることです。このようにして、真の因果関係がモデル化されます。この式から導出された近似形式を次の図に示します。 4a は前の 3b と同じ形式で、4b はサンプル空間の近似です。理論的には、D と K のサンプル空間は無限であるため、近似は収集されたデータを通じてのみ行うことができます (サンプル空間の D と K にはサイズがかかります)。図4cおよび図4dはいずれも、最終的に1つの追加の不偏表現Tのみをモデル化する必要があるような方法で、所望の近似を導出したものである。 T は、モデルが最終的な不偏データ推定値を取得できるように、すべての状況におけるユーザーとアイテムの表現確率分布の合計をたどることにより、不偏表現 T の追加モデルです。 実験では、Tianchi データ セットと 84.51 (クーポン) データ セットという 2 つのオープン ソース データ セットを使用します。サンプリングを通じて、このルール戦略がデータ全体に及ぼす影響をシミュレートします。同時に、実際の電子商取引マーケティング活動シナリオから生成されたデータを使用して、アルゴリズムの品質を共同評価しました。逆確率重み付けを使用してバイアスを補正する IPW など、いくつかの主流の補正方法を比較しました。無認識はバイアス特徴を除去することでバイアスの影響を軽減します。FairCo は誤差項制約表現を導入することで比較的偏りのない推定値を取得します。MACR は複数のフレームワークを使用します。タスクはユーザーの一貫性とアイテムの人気をそれぞれ推定し、予測段階で一貫性と人気を差し引いて不偏推定を実現します; PDA は因果関係介入を通じて損失アイテムを調整することで人気を除去します バイアスの影響; DecRS も使用情報の偏りを取り除くためのバックドア調整ですが、それはユーザーの視点の偏りを修正するだけです。 #実験の評価指標は AUC です。販促シナリオには推奨クーポンまたは推奨候補商品が 1 つしかないため、本質的には2 カテゴリーの問題であるため、AUC を使用して評価する方が適切です。異なるアーキテクチャの下で DNN と MMOE のパフォーマンスを比較すると、提案した DMBR モデルが元の無補正方法や他の補正方法よりも優れた結果を示していることがわかります。同時に、Ds_A と Ds_B は、実際のビジネス データ セットよりもシミュレートされたデータ セットで高い改善効果を達成しました。これは、実際のビジネス データ セットのデータがより複雑であり、ルールの影響を受けるだけではないためです。およびポリシーだけでなく、他の要因の影響を受ける可能性もあります。 現在のモデルは、e コマース マーケティング イベント シナリオで開始されました。上の図は、オンライン効果を示しています。ベースライン モデルと比較すると、 DMBR モデルは、販売率と販売量に一定の改善が見られました。 4. Ant でのアプリケーション3. バックドア調整に基づく修正
因果関係修正の方法は、ルールやポリシーの制約があるシナリオで主に使用されます。たとえば、広告シナリオでは、異なる広告を配信できる人に制限がある場合があります。ペット向けの広告もあるペットユーザーを持つ人々をよりターゲットにするでしょう。電子商取引のマーケティング シナリオでは、小規模販売者のトラフィックを確保し、すべてのトラフィックが大規模販売者によって消費されるのを回避するために、いくつかの戦略が設定されます。アクティビティに参加するユーザーエクスペリエンスを確保するだけでなく、アクティビティ全体の予算には限りがあるため、一部の悪質なユーザーがアクティビティに繰り返し参加すると、大量のリソースが占有され、アクティビティへの参加エクスペリエンスが低下します。他のユーザー。このようなシナリオでは、原因と結果の修正が適用されます。
以上がAnt Marketing の推奨シナリオにおける因果関係修正手法の適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。