ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム-AI-php.cn

ホームページ

テクノロジー周辺機器

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 14, 2023 am 10:31 AM

アルゴリズム推奨システム行列因数分解アルゴリズム

著者 | Wang Hao

査読者 | Sun Shujuan

レコメンデーションシステムは、インターネット業界で最も人気のあるテクノロジーの 1 つです。過去 10 年間、インターネット業界は何百万もの反復バージョンの推奨システムモデルを作成してきました。さまざまなシナリオに最適化されたレコメンデーションシステムモデルは数多くありますが、古典的なモデルはほとんどありません。行列分解は、レコメンデーションシステムの分野の黎明期に登場し、Netflix の競争で頭角を現したレコメンデーションシステムアルゴリズムであり、過去 10 年間で最も成功したレコメンデーションシステムアルゴリズムでもあります。 2023 年の現在、レコメンデーションシステムの分野は長らくディープラーニングによって独占されてきましたが、行列分解は依然として大手企業の研究開発プロセスで広く使用されており、関連するアルゴリズムに取り組んでいる科学研究者も依然として数多くいます。

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

行列因数分解アルゴリズムに関する最も古典的な論文は、2007 年の確率的行列因数分解です。これに基づいて、後の世代は、2021 年の RankMat (論文ダウンロードアドレス: https://arxiv.org/abs/2204.13016)、ZeroMat (論文ダウンロードアドレス: https://arxiv. org /abs/2112.03084)、2022 年の DotMat (論文のダウンロードアドレス: https://arxiv.org/abs/2206.00151)、KL-Mat (論文のダウンロードアドレス: https://arxiv.org/abs/2204.13583/ コードのダウンロード)アドレス：https://github.com/haow85/KL-Mat）などレコメンデーションシステムは、そのシンプルさ、使いやすさ、スピードの速さから、インターネット業界のエンジニアに深く愛されています。

レコメンデーションシステムのコールドスタート問題は、今年多くの注目を集めたもう 1 つの研究ホットスポットです。レコメンデーションシステムを解決するための多くの実践者のアイデアは、転移学習とメタ学習です。しかし、このアイデアには致命的な欠陥があります。それは、他の知識分野からのデータが必要であるということです。多くの企業はこの条件を満たしていません。実際にはデータを必要としないコールドスタートアルゴリズムは、2021 年に ZeroMat が提案された後に登場しました。代表的なアルゴリズムとしては、前節で述べた ZeroMat や DotMat などがあります。この記事で紹介するポアソン行列分解アルゴリズム（PoissonMat）は、2022年の国際学術会議MLISE 2022で発表された論文です。論文の名前は、「PoissonMat: Remodeling Matrix Factorization using Poisson Distribution and Solving the Cold Start 問題を入力データなしで解決する」です (論文のダウンロードアドレス: https://arxiv.org/abs/2212.10460)。

まず、確率的行列因数分解の MAP 定義を確認しましょう:

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

次に、項目をスコアリングするユーザーの行動を MAP として定義します。ゆるく配布されています。ポアソン分布の定義によれば、次の式が得られます。

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

ポアソン式のパラメータの定義によれば、次のとおりです。

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

Zipf 分布によると、次の式を取得できます:

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

上記の式に基づいて、ポアソン行列分解 (PoissonMat) の解析形式を取得します。

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

確率的勾配降下法アルゴリズムを使用して、上記の式を解くと、次のアルゴリズムフローが得られます。

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

著者は、MovieLens 100 万データセットでアルゴリズムの精度と公平性の実験的な比較を実施しました。および LDOS-CoMoDa データセット:

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

図 1 ポアソン行列分解の比較実験MovieLens で 100 万件のデータセット

ポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズム

図 2 LDOS-CoMoDa データセットのポアソン行列分解の比較実験

実験的な比較結果によれば、次の結論を導き出すことができます。 : ポアソン行列因数分解 (PoissonMat) は、精度と公平性の両方の指標において他のアルゴリズムよりも優れています。賞賛に値するのは、ポアソン行列分解アルゴリズムが入力データを一切使用せず、完全なゼロショット学習アルゴリズムであるため、コールドスタート問題をうまく解決できることです。

最後に、著者は 16G RAM と Intel Core i5 を搭載した Lenovo 家庭用ノートブックで実験を行いました。アルゴリズムは非常に高速に実行され、実装は非常に簡単です。

レコメンデーションシステムのコールドスタート問題を解決することを目的としたゼロショット学習アルゴリズムは、現在研究のホットスポットです。 2021 年の ZeroMat アルゴリズムから始まる、ゼロショット学習問題を解くためにデータを必要としない真のゼロショット学習アルゴリズム。この記事で紹介したポアソン行列分解アルゴリズム (PoissonMat) は、ZeroMat およびその後継アルゴリズム DotMat よりも優れたパフォーマンスを発揮し、現在この分野で最高のアルゴリズムの 1 つです。関連する研究はまだ初期段階にあるため、大多数の科学技術関係者の注目と注目を集めることが期待されます。

著者紹介

Wang Hao、Funplus人工知能研究所の元所長、恒昌理通ビッグデータ部門の元所長。米国ユタ大学を学士号（2008年）、修士号（2010年）を取得して卒業。国際商経大学非常勤MBA（2016年）。レコメンデーションシステム (公平性/シナリオベースの推奨/コールドスタート/解釈可能性/ランキング学習)、コンピュータグラフィックス (幾何学的モデリング/視覚化)、自然言語処理 (産業での実装アプリケーション)、リスク管理と不正行為対策 (金融/医療)長年の経験と独自の洞察を備えたその他の方向性。彼は、インターネット (Douban、Baidu、Sina、NetEase など)、金融テクノロジー (Hengchang Litong)、およびゲーム会社 (Funplus など) でテクノロジーの研究開発と管理に 12 年間の経験を持っています。国際学会やジャーナルに30本の論文を発表し、国際会議最優秀論文賞/最優秀論文レポート賞を3回受賞(IEEE SMI 2008 Best Paper Award/ICBDT 2020 Best Oral Presentation Award/ICISCAE 2021 Best Oral Presentation Award)。 2006 年 ACM/ICPC 北米ロッキーマウンテン地域大会金メダル。 2004 年全国大学英語能力コンテストのスピーキング決勝で銅メダル。 2003年、済南大学入学試験の理工英語部門で1位を獲得した。

以上がポアソン行列分解: データなしでレコメンデーションシステムのコールドスタート問題を解決する行列分解アルゴリズムの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用：チャットボットは本当に気にすることができますか？Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想：私たちはAIとの関係において本当に繁栄していますか？この質問は、MIT Media Labの「AI（AHA）で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2：マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。その能力t

Dagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証：ダグスターと大きな期待でチェックを自動化するデータ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか？Apr 11, 2025 am 11:42 AM

MainFrames：AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーションサーバーと統合します。

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。