ホームページ > 記事 > テクノロジー周辺機器 > ポアソン行列分解: データなしでレコメンデーション システムのコールド スタート問題を解決する行列分解アルゴリズム
著者 | Wang Hao
査読者 | Sun Shujuan
レコメンデーション システムは、インターネット業界で最も人気のあるテクノロジーの 1 つです。過去 10 年間、インターネット業界は何百万もの反復バージョンの推奨システム モデルを作成してきました。さまざまなシナリオに最適化されたレコメンデーション システム モデルは数多くありますが、古典的なモデルはほとんどありません。行列分解は、レコメンデーション システムの分野の黎明期に登場し、Netflix の競争で頭角を現したレコメンデーション システム アルゴリズムであり、過去 10 年間で最も成功したレコメンデーション システム アルゴリズムでもあります。 2023 年の現在、レコメンデーション システムの分野は長らくディープ ラーニングによって独占されてきましたが、行列分解は依然として大手企業の研究開発プロセスで広く使用されており、関連するアルゴリズムに取り組んでいる科学研究者も依然として数多くいます。
行列因数分解アルゴリズムに関する最も古典的な論文は、2007 年の確率的行列因数分解です。これに基づいて、後の世代は、2021 年の RankMat (論文ダウンロード アドレス: https://arxiv.org/abs/2204.13016)、ZeroMat (論文ダウンロード アドレス: https://arxiv. org /abs/2112.03084)、2022 年の DotMat (論文のダウンロード アドレス: https://arxiv.org/abs/2206.00151)、KL-Mat (論文のダウンロード アドレス: https://arxiv.org/abs/2204.13583/ コードのダウンロード)アドレス:https://github.com/haow85/KL-Mat)などレコメンデーション システムは、そのシンプルさ、使いやすさ、スピードの速さから、インターネット業界のエンジニアに深く愛されています。
レコメンデーション システムのコールド スタート問題は、今年多くの注目を集めたもう 1 つの研究ホットスポットです。レコメンデーション システムを解決するための多くの実践者のアイデアは、転移学習とメタ学習です。しかし、このアイデアには致命的な欠陥があります。それは、他の知識分野からのデータが必要であるということです。多くの企業はこの条件を満たしていません。実際にはデータを必要としないコールド スタート アルゴリズムは、2021 年に ZeroMat が提案された後に登場しました。代表的なアルゴリズムとしては、前節で述べた ZeroMat や DotMat などがあります。この記事で紹介するポアソン行列分解アルゴリズム(PoissonMat)は、2022年の国際学術会議MLISE 2022で発表された論文です。論文の名前は、「PoissonMat: Remodeling Matrix Factorization using Poisson Distribution and Solving the Cold Start 問題を入力データなしで解決する」です (論文のダウンロード アドレス: https://arxiv.org/abs/2212.10460)。
まず、確率的行列因数分解の MAP 定義を確認しましょう:
次に、項目をスコアリングするユーザーの行動を MAP として定義します。ゆるく配布されています。ポアソン分布の定義によれば、次の式が得られます。
ポアソン式のパラメータの定義によれば、次のとおりです。
Zipf 分布によると、次の式を取得できます:
上記の式に基づいて、ポアソン行列分解 (PoissonMat) の解析形式を取得します。
確率的勾配降下法アルゴリズムを使用して、上記の式を解くと、次のアルゴリズム フローが得られます。
著者は、MovieLens 100 万データセットでアルゴリズムの精度と公平性の実験的な比較を実施しました。および LDOS-CoMoDa データセット:
図 1 ポアソン行列分解の比較実験MovieLens で 100 万件のデータセット
図 2 LDOS-CoMoDa データセットのポアソン行列分解の比較実験
実験的な比較結果によれば、次の結論を導き出すことができます。 : ポアソン行列因数分解 (PoissonMat) は、精度と公平性の両方の指標において他のアルゴリズムよりも優れています。賞賛に値するのは、ポアソン行列分解アルゴリズムが入力データを一切使用せず、完全なゼロショット学習アルゴリズムであるため、コールド スタート問題をうまく解決できることです。
最後に、著者は 16G RAM と Intel Core i5 を搭載した Lenovo 家庭用ノートブックで実験を行いました。アルゴリズムは非常に高速に実行され、実装は非常に簡単です。
レコメンデーション システムのコールド スタート問題を解決することを目的としたゼロショット学習アルゴリズムは、現在研究のホットスポットです。 2021 年の ZeroMat アルゴリズムから始まる、ゼロショット学習問題を解くためにデータを必要としない真のゼロショット学習アルゴリズム。この記事で紹介したポアソン行列分解アルゴリズム (PoissonMat) は、ZeroMat およびその後継アルゴリズム DotMat よりも優れたパフォーマンスを発揮し、現在この分野で最高のアルゴリズムの 1 つです。関連する研究はまだ初期段階にあるため、大多数の科学技術関係者の注目と注目を集めることが期待されます。
Wang Hao、Funplus人工知能研究所の元所長、恒昌理通ビッグデータ部門の元所長。米国ユタ大学を学士号(2008年)、修士号(2010年)を取得して卒業。国際商経大学非常勤MBA(2016年)。レコメンデーション システム (公平性/シナリオベースの推奨/コールド スタート/解釈可能性/ランキング学習)、コンピュータ グラフィックス (幾何学的モデリング/視覚化)、自然言語処理 (産業での実装アプリケーション)、リスク管理と不正行為対策 (金融/医療)長年の経験と独自の洞察を備えたその他の方向性。彼は、インターネット (Douban、Baidu、Sina、NetEase など)、金融テクノロジー (Hengchang Litong)、およびゲーム会社 (Funplus など) でテクノロジーの研究開発と管理に 12 年間の経験を持っています。国際学会やジャーナルに30本の論文を発表し、国際会議最優秀論文賞/最優秀論文レポート賞を3回受賞(IEEE SMI 2008 Best Paper Award/ICBDT 2020 Best Oral Presentation Award/ICISCAE 2021 Best Oral Presentation Award)。 2006 年 ACM/ICPC 北米ロッキーマウンテン地域大会金メダル。 2004 年全国大学英語能力コンテストのスピーキング決勝で銅メダル。 2003年、済南大学入学試験の理工英語部門で1位を獲得した。
以上がポアソン行列分解: データなしでレコメンデーション システムのコールド スタート問題を解決する行列分解アルゴリズムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。