作者| 汪昊
#審查| 重樓
新聞App是人們日常生活中獲取資訊來源的重要方式。在2010年左右,國外比較火的新聞App包括Zite和Flipboard等,而國內比較火的新聞App主要是四大門戶。而隨著今日頭條為代表的新時代新聞推薦產品的火爆,新聞App進入了全新的時代。而科技公司,不管哪一家,只要掌握了高精尖的新聞推薦演算法技術,就基本在技術層面掌握了主動權和話語權。
今天,我們來看一篇RecSys 2023 的最佳長論文提名獎論文—— Going Beyond Local: Global Graph-Enhanced Personalized News Recommendations (論文下載地址:https://www.php.cn/link/195d221c982e47eb58347e5d06ce3180
該演算法的整體架構圖如下圖所示:
#我們先以以下方式定義新聞文本內容(我們這裡只利用新聞標題)的詞向量X :
#新聞的局部詞向量特徵可以如下表示:
這個公式是使用者側的特徵表示。我們下面定義, 也就是局部實體特徵。其實就是把所有的新聞標題拼成一個數組,然後再用上面的公式計算出來。
#上面我們介紹的是局部特徵表達和用戶側的特徵表達。我們下面用GNN來表達全域的新聞側特徵向量:
全域新聞側特徵向量的最終表達其實就是把這些特徵向量拼在一起:
。整個新聞推薦系統的最終訓練損失函數如下:
#下面,我們來看看實驗對比效果:
#經過對比(上表) ,我們發現我們新設計的演算法(GLORY)在許多指標上都要優於同類演算法,因此是不可多得的優秀的新聞推薦演算法。整個演算法設計思路非常簡單,但是卻用到了重量級的深度學習技術。想必作者在設計演算法的過程中做了很多手藝類的工作,使得演算法最終的效果達到了出類拔萃的程度。
以下是利用不同的Graph Encoder 給新聞類別文本編碼的實驗對比效果。可以看到,使用GNN 得到的效果最優:
#GLORY 是近年來出現的非常優秀的新聞推薦演算法。雖然該演算法沒有逃脫基於內容的相似度計算的老舊框架,但是新瓶裝舊酒,作者充分利用了新的技術,套在老的套娃裡,產生了新的價值。這篇論文,非常值得我們認真學習。
汪昊,前 Funplus 人工智慧實驗室負責人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司擔任技術和技術主管。在網路公司和金融科技、遊戲等公司任職13 年,針對人工智慧、電腦圖形學、區塊鏈和數位博物館等領域有著深刻的見解和豐富的經驗。在國際學術會議和期刊發表論文39 篇,獲得IEEE SMI 2008 最佳論文獎、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 #/ ICSIM 2024 最佳論文報告獎。
以上是基於全域的圖增強的新聞推薦演算法的詳細內容。更多資訊請關注PHP中文網其他相關文章!