作者 | 汪昊
審校 | 孫淑娟
推薦系統公平性是 2017 年以來爆火的人工智慧研究領域。知名的人工智慧公司如 Twitter, Google, IBM和百度,都創立了人工智慧倫理團隊或研發了人工智慧倫理產品。然而讓人遺憾的是,人工智慧倫理研究在國內起步較晚,跟國外相比,目前仍有一定差距。
排序學習是在 2010 年左右爆發的機器學習技術,在推薦系統和資訊檢索領域都得到了廣泛的應用。在最近幾年,排序學習成為了熱門的人工智慧倫理研究演算法基準。
本文將要介紹的是 2022 年在國際學術會議 CISAT 2022 (International Conference on Computer Information Science and Application Technology) 發表的論文 Pareto Pairwise Ranking for Fairness Enhancement of Recommender Systems。本文主要說明如何結合帕累托分佈和排序學習實現公平的排序學習推薦演算法。
圖1. MovieLens 資料集觀影評分差機率分佈
我們根據觀察(圖1)和統計理論(齊夫分佈的統計估計)可以得到以下結論: 同一個使用者對不同物品的評分差的機率分佈正比於評分差。我們修改機率矩陣分解的損失函數,得到我們發明的新演算法帕累托排序學習(Pareto Pairwise Ranking)的損失函數公式:
把我們剛才的觀察帶入損失函數公式中,我們得到以下損失函數公式:
我們把L 取對數,得到以下公式:
我們利用隨機梯度下降公式來解損失函數對數,得到以下公式:
#帕累托排序學習的演算法流程如下:
圖4 和圖5 顯示的是帕累托排序學習在LDOS-CoMoDa 資料集上的測試結果。帕累托排序學習演算法在公平性指標上的表現依然最好。
以上是帕累托排序學習:基於推薦系統公平性的排序學習的詳細內容。更多資訊請關注PHP中文網其他相關文章!