搜尋
首頁科技週邊人工智慧泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

作者 | 汪昊

審校 | 孫淑娟

推薦系統是目前網路產業最熱門的技術之一。在過去的十年中,互聯網產業誕生了數以百萬計的推薦系統模型迭代版本。儘管針對不同場景進行最佳化的推薦系統模型非常之多,但是經典的模型非常少。矩陣分解是推薦系統領域勃興早期,在 Netflix 競賽中展露頭角的推薦系統演算法,也是過去十年最為成功的推薦系統演算法。儘管到 2023 年的今天,推薦系統領域早已是深度學習的天下,矩陣分解仍然廣泛應用於各大公司研發過程中,並且仍有許多科研人員在從事相關演算法的研究工作。

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

矩陣分解演算法最為經典的論文是 2007 年的 Probabilistic Matrix Factorization 。在此基礎上,後人進行了大量的擴展工作,例如2021 年的RankMat(論文下載地址:https://arxiv.org/abs/2204.13016)、ZeroMat (論文下載地址:https://arxiv.org /abs/2112.03084) 和2022 年的DotMat (論文下載網址:https://arxiv.org/abs/2206.00151)、KL-Mat(論文下載網址:https://arxiv.org/abs/2204.13583/ 代碼下載網址:https://arxiv.org/abs/2204.13583/ 代碼下載地址:https://arxiv.org/abs/2204.13583/ 代碼下載地址地址:https://github.com/haow85/KL-Mat)等。推薦系​​統因其簡單易用性,以及速度快等原因,深受網路產業廣大工程師的喜愛。

推薦系統冷啟動問題是今年來備受關注的另一個研究熱點。許多從業者解決推薦系統的想法都是遷移學習和元學習。然而這個思路有個致命的缺點,就是需要其他知識領域的數據。而許多公司是不具備這項條件的。真正不需要任何資料的冷啟動演算法,是在 2021 年 ZeroMat 提出以後出現的。代表演算法包括上一節提到的 ZeroMat 和 DotMat。本文將要介紹的泊松矩陣分解演算法(PoissonMat)是 2022 年國際學術會議MLISE 2022所發表的論文。論文的名稱是PoissonMat:Remodeling Matrix Factorization using Poisson Distribution and Solving the Cold Start Problem without Input Data(論文下載網址:https://arxiv.org/abs/2212.10460)。

我們先回顧一下Probabilistic Matrix Factorization的MAP定義:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

我們接著定義使用者為物品評分這一行為為泊松分佈。根據泊松分佈的定義,我們得到以下公式:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

#根據泊松公式中參數的定義,我們有:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

#根據齊夫分佈,我們可以得到以下公式:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

##綜合以上公式,我們得到泊松矩陣分解(PoissonMat)的解析形式:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

#採用隨機梯度下降演算法求解以上公式,我們得到如下演算法流程:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

作者隨後在MovieLens 1 Million Dataset 和LDOS-CoMoDa Dataset 上進行了演算法準確率和公平性的實驗對比:

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

#圖1 泊松矩陣分解在MovieLens 1 Million Dataset 上的對比實驗

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

#

泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法

圖2 泊松矩陣分解在LDOS-CoMoDa Dataset 上的對比實驗

根據實驗對比效果,我們可以得出以下結論:泊松矩陣分解(PoissonMat)在準確率和公平性指標方面都優於其他演算法。而且難能可貴的是,泊松矩陣分解演算法沒有用到任何輸入數據,是徹頭徹尾的零樣本學習演算法,很好的解決了冷啟動問題。

最後,作者是在 16G RAM 和 Intel Core i5 的聯想家用筆記本上做的實驗,演算法運行速度飛快,實現也非常簡單。

以解決推薦系統冷啟動問題為目標的零樣本學習演算法,目前是研究熱點。而不需要任何資料解決零樣本學習問題的真正的零樣本學習演算法,始自 2021 年的 ZeroMat 演算法。本文介紹的泊松矩陣分解演算法(PoissonMat)效能優於 ZeroMat 及其後續演算法 DotMat,是目前這一領域最優秀的演算法之一。由於相關研究仍處於起步階段,希望能引起廣大科技從業人員的注意與重視。

作者介紹

汪昊,前 Funplus 人工智慧實驗室負責人,前恆昌利通大數據部負責人。本科 (2008 年)和碩士(2010年)畢業於美國猶他大學(University of Utah)。對外經貿大學在職 MBA (2016年)。在推薦系統(公平性/基於場景的推薦/冷啟動/可解釋性/排序學習)、電腦圖形學(幾何建模/視覺化)、自然語言處理(工業界的落地應用)、風控反詐欺(金融/醫療)等方向有多年的經驗和獨特的見解。在網路(豆瓣、百度、新浪、網易等)、金融科技(恆昌利通)和遊戲公司(Funplus等)有 12 年的技術研發和管理經驗。在國際學術會議和期刊發表論文 30 篇,獲得國際會議最佳論文獎 / 最佳論文報告獎 3 次 (IEEE SMI 2008 Best Paper Award / ICBDT 2020 Best Oral Presentation Award / ICISCAE 2021 Best Oral Presentation Award)。 2006 年 ACM/ICPC 北美落磯山脈區域賽金牌。 2004 年全國大學生英語能力競賽口語決賽銅牌。 2003 年濟南市高考科英語狀元。

以上是泊松矩陣分解:無需資料解決推薦系統冷啟動問題的矩陣分解演算法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI技能差距正在減慢供應鏈AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞,但是在供應鏈行業中確實意味著什麼? 供應鏈管理協會(ASCM)首席執行官安倍·埃什肯納齊(Abe Eshkenazi)表示,它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AI一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。 本週五在德克薩斯州奧斯汀,Bittensor最終遊戲峰會標誌著一個關鍵時刻,將分散的AI(DEAI)從理論轉變為實際應用。 與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰 企業AI的應用面臨一項重大挑戰:構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題,允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。 這個新推出的工具包包含五個關鍵微服務: NeMo Customizer 處理大型語言模型的微調,具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制,以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI:藝術與設計的未來畫卷 人工智能(AI)正以前所未有的方式改變藝術與設計領域,其影響已不僅限於業餘愛好者,更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師,例如廣告、社交媒體圖片生成和網頁設計。 然而,專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具,探索新的美學可能性,融合不同的風格,創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務,提出不同的設計元素並提供創意輸入。 AI支持風格遷移,即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名,它通過創新使用Agentic AI來引領工作場所革命。 最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。 定義代理AI 黃d

對大學的存在威脅對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎? 這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。 正如科技Edvocate的馬修·林奇(Matthew Lynch)所指出的那樣

原型:美國科學家正在國外尋找工作原型:美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰,這或許是由於預算削減導致的。據《自然》雜誌報導,2025年1月至3月期間,美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示,75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。 過去幾個月,數百項NIH和NSF的撥款被終止,NIH今年的新撥款減少了約23億美元,下降幅度接近三分之一。洩露的預算提案顯示,特朗普政府正在考慮大幅削減科學機構的預算,削減幅度可能高達50%。 基礎研究領域的動盪也影響了美國的一大優勢:吸引海外人才。 35

所有有關打開AI最新的GPT 4.1家庭的信息 - 分析Vidhya所有有關打開AI最新的GPT 4.1家庭的信息 - 分析VidhyaApr 26, 2025 am 10:19 AM

Openai推出了強大的GPT-4.1系列:一個專為現實世界應用設計的三種高級語言模型家族。 這種巨大的飛躍提供了更快的響應時間,增強的理解和大幅降低了成本

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。