CTR 推定では、主流の方法では特徴埋め込み MLP が使用され、特徴が非常に重要です。ただし、同じ特徴量については、異なるサンプルでも表現が同じになるため、下流モデルにこのように入力すると、モデルの表現力が制限されてしまいます。
この問題を解決するために、CTR 推定の分野で、機能拡張モジュールと呼ばれる一連の関連研究が提案されています。特徴強化モジュールは、さまざまなサンプルに基づいて埋め込み層の出力結果を修正し、さまざまなサンプルの特徴表現に適応させ、モデルの表現能力を向上させます。
最近、復旦大学とマイクロソフト リサーチ アジアは共同で、さまざまな機能強化モジュールの実装方法と効果を比較した、機能強化作業に関するレビューを発表しました。ここで、いくつかの機能強化モジュールの実装方法と、この記事で行われた関連する比較実験を紹介します。
論文のタイトル: CTR 予測のための機能強化モジュールの包括的な要約と評価
ダウンロード アドレス: https://arxiv.org/pdf/2311.04625v1.pdf
1. 機能拡張モデリングのアイデア
機能拡張モジュールは、CTR を向上させるように設計されています。予測モデル 埋め込み層の表現力により、異なるサンプル内の同じ特徴の表現を区別することができます。機能拡張モジュールは次の統一式で表現でき、元の Embedding を入力し、関数を渡した後、このサンプルのパーソナライズされた Embedding を生成します。
画像
この方法の一般的な考え方は、各特徴の初期埋め込みを取得した後、サンプル自体の表現を埋め込みに使用することです。この機能は、現在のサンプルのパーソナライズされた埋め込みを取得するために変換を行います。ここでは、いくつかの古典的な機能拡張モジュールのモデリング方法を紹介します。
2. 特徴強化の古典的な方法
スパース予測のための入力認識因数分解マシン (IJCAI 2019) この記事では、埋め込み層の後に再重み付け層を追加し、埋め込み層の初期埋め込みを入力します。サンプルへの変換 サンプルを表すベクトルが MLP で取得され、ソフトマックスが正規化に使用されます。 Softmax の後の各要素は、この特徴の重要性を表す特徴に対応します。このソフトマックスの結果に、対応する各特徴の初期埋め込みが乗算されて、サンプル粒度での特徴埋め込み重み付けが実現されます。
写真
FiBiNET: 機能の重要性と二次機能の相互作用を組み合わせたクリックスルー率予測モデル (RecSys 2019) も同様の考え方を採用しています。モデルは、各サンプルの特徴のパーソナライズされた重みを学習します。プロセス全体は、圧搾、抽出、再重量の 3 つのステップに分かれています。スクイーズ段階では、プーリング法により各特徴の埋め込みベクトルが統計スカラーとして取得されます。抽出段階では、これらのスカラーが多層パーセプトロン (MLP) に入力され、各特徴の重みが取得されます。最後に、これらの重みに各特徴の埋め込みベクトルを乗算して、重み付けされた埋め込み結果を取得します。これは、サンプル レベルでの特徴の重要度のフィルター処理と同等です。
Picture
A Dual Input-aware Factorization Machine for CTR Prediction (IJCAI 2020) は前の記事と似ており、セルフアテンションを使用して機能を強化しています。全体は、ベクトルごととビットごとの 2 つのモジュールに分かれています。ベクトル単位では、各特徴の埋め込みをシーケンス内の要素として扱い、それを Transformer に入力して、融合された特徴表現を取得します。ビット単位の部分では、マルチレイヤー MLP を使用して元の特徴をマッピングします。 2 つの部分の入力結果が加算された後、各特徴要素の重みが取得され、対応する元の特徴の各ビットと乗算されて、強化された特徴が取得されます。
画像
GateNet: クリックスルー率予測のための強化されたゲート型ディープ ネットワーク (2020) は、MLP とシグモイドを通じて各特徴の初期埋め込みベクトルを利用しますこの関数は、MLP を使用してすべての特徴をビットごとの重みスコアにマップし、その 2 つを組み合わせて入力特徴に重みを付けながら、独立した特徴重みスコアを生成します。フィーチャ レイヤーに加えて、MLP の隠れレイヤーでも同様の方法が各隠れレイヤーの入力の重み付けに使用されます
Picture
Interpretable Click-Through Rate Prediction through Hierarchical Attendant (WSDM 2020) も自己注意を使用して特徴変換を実現しますが、高次の特徴の生成が追加されます。ここでは階層的セルフ アテンションが使用されています。セルフ アテンションの各層は、セルフ アテンションの前の層の出力を入力として受け取ります。各層は、1 次の高次特徴の組み合わせを追加して、階層的な多次特徴抽出を実現します。具体的には、各層がセルフアテンションを実行した後、生成された新しい特徴行列をソフトマックスに通して各特徴の重みを取得し、新しい特徴は元の特徴の重みに従って重み付けされ、ドット積が実行されます。元の特徴を使用して 1 つの特徴を増加させる レベルの特徴的な交差。
図
ContextNet: コンテキスト情報を使用して機能埋め込みを調整するクリックスルー率予測フレームワーク (2021) も同様のアプローチであり、MLP を使用してすべての特徴は、各特徴埋め込みサイズの次元にマッピングされ、元の特徴はスケーリングされます。この記事では、特徴ごとにパーソナライズされた MLP パラメーターを使用します。このようにして、サンプル内の他の特徴を上位ビットと下位ビットとして使用して、各特徴が強化されます。
図
コンテキスト認識型特徴表現学習による CTR 予測の強化 (SIGIR 2022) では、一連の入力特徴に対する自己注意を特徴強化に使用します, 各特徴は他の特徴に異なる程度の影響を及ぼします。自己注意を通じて、各特徴の埋め込みに対して自己注意が実行され、サンプル内の特徴間の情報相互作用が実現されます。機能間の相互作用に加えて、この記事ではビットレベルの情報の相互作用にも MLP を使用しています。上記で生成された新しいエンベディングは、ゲート ネットワークを通じて元のエンベディングとマージされ、最終的な洗練された特徴表現が得られます。
写真
3. 実験結果
さまざまな機能拡張方法の効果を比較した結果、次のような全体的な結論に達しました。多くの機能拡張モジュールである GFRL、FRNet-V、FRNetB は最高のパフォーマンスを発揮し、他の機能拡張方法よりも優れています
## ###### ###写真### ################################### ##
以上がこの記事では、CTR 推定における機能強化とパーソナライゼーションの古典的な方法と効果の比較をまとめます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。
![WLAN扩展模块已停止[修复]](https://img.php.cn/upload/article/000/465/014/170832352052603.gif)
如果您的Windows计算机上的WLAN扩展模块出现问题,可能会导致您与互联网断开连接。这种情况常常让人感到困扰,但幸运的是,本文提供了一些简单的建议,可以帮助您解决这个问题,让您的无线连接重新正常运行。修复WLAN扩展模块已停止如果您的Windows计算机上的WLAN可扩展性模块已停止工作,请按照以下建议进行修复:运行网络和Internet故障排除程序禁用并重新启用无线网络连接重新启动WLAN自动配置服务修改电源选项修改高级电源设置重新安装网络适配器驱动程序运行一些网络命令现在,让我们来详细看

本文详细介绍了解决事件ID10000的方法,该事件表明无线局域网扩展模块无法启动。在Windows11/10PC的事件日志中可能会显示此错误。WLAN可扩展性模块是Windows的一个组件,允许独立硬件供应商(IHV)和独立软件供应商(ISV)为用户提供定制的无线网络特性和功能。它通过增加Windows默认功能以扩展本机Windows网络组件的功能。在操作系统加载网络组件时,WLAN可扩展性模块作为初始化的一部分启动。如果无线局域网扩展模块遇到问题无法启动,您可能会在事件查看器的日志中看到错误消

一、sys模块简介前面介绍的os模块主要面向操作系统,而本篇的sys模块则主要针对的是Python解释器。sys模块是Python自带的模块,它是与Python解释器交互的一个接口。sys 模块提供了许多函数和变量来处理 Python 运行时环境的不同部分。二、sys模块常用方法通过dir()方法可以查看sys模块中带有哪些方法:import sys print(dir(sys))1.sys.argv-获取命令行参数sys.argv作用是实现从程序外部向程序传递参数,它能够获取命令行参数列

前言本文继续来介绍Python集合模块,这次主要简明扼要的介绍其内的命名元组,即namedtuple的使用。闲话少叙,我们开始——记得点赞、关注和转发哦~ ^_^创建命名元组Python集合中的命名元组类namedTuples为元组中的每个位置赋予意义,并增强代码的可读性和描述性。它们可以在任何使用常规元组的地方使用,且增加了通过名称而不是位置索引方式访问字段的能力。其来自Python内置模块collections。其使用的常规语法方式为:import collections XxNamedT

所有数据在开始时都会自动分配一个“DOB”(出生日期)。因此,在某些时候处理数据时不可避免地会遇到日期和时间数据。本教程将带您了解Python中的datetime模块以及使用一些外围库,如pandas和pytz。在Python中,任何与日期和时间有关的事情都由datetime模块处理,它将模块进一步分为5个不同的类。类只是与对象相对应的数据类型。下图总结了Python中的5个日期时间类以及常用的属性和示例。3个有用的片段1.将字符串转换为日期时间格式,也许是使用datet

你好,我是somenzz,可以叫我征哥。Python的import是非常直观的,但即使这样,有时候你会发现,明明包就在那里,我们仍会遇到ModuleNotFoundError,明明相对路径非常正确,就是报错ImportError:attemptedrelativeimportwithnoknownparentpackage导入同一个目录的模块和不同的目录的模块是完全不同的,本文通过分析使用import经常遇到的一些问题,来帮助你轻松搞定import,据此,你可以轻松创建属

Ansible工作原理从上面的图上可以了解到:管理端支持local、ssh、zeromq三种方式连接被管理端,默认使用基于ssh的连接,这部分对应上面架构图中的连接模块;可以按应用类型等方式进行HostInventory(主机清单)分类,管理节点通过各类模块实现相应的操作,单个模块,单条命令的批量执行,我们可以称之为ad-hoc;管理节点可以通过playbooks实现多个task的集合实现一类功能,如web服务的安装部署、数据库服务器的批量备份等。playbooks我们可以简单的理解为,系统通过

在CTR预估中,主流都采用特征embedding+MLP的方式,其中特征非常关键。然而对于相同的特征,在不同的样本中,表征是相同的,这种方式输入到下游模型,会限制模型的表达能力。为了解决这个问题,CTR预估领域提出了一系列相关工作,被称为特征增强模块。特征增强模块根据不同的样本,对embedding层的输出结果进行一次矫正,以适应不同样本的特征表示,提升模型的表达能力。最近,复旦大学和微软亚洲研究院合作发布了一篇关于特征增强工作的综述,对比了不同特征增强模块的实现方法及其效果。现在,我们来介绍一


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

ドリームウィーバー CS6
ビジュアル Web 開発ツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ホットトピック



