首頁 >科技週邊 >人工智慧 >復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

WBOY
WBOY轉載
2023-06-12 11:57:431287瀏覽

理解網路新聞社群的演進對於設計更有效的新聞推薦系統至關重要,但由於缺乏適當的資料集和平台,現有研究在理解推薦系統如何影響社群演化方面存在局限,導致了可能影響長期效用的次優系統設計。

針對這個問題,復旦大學電腦學院CISL研究團隊研發了新聞推薦生態系統演化模擬平台SimuLine。

SimuLine基於預訓練語言模型(Pretrained Language Models)和逆傾向得分(Inverse Propensity Score)從真實資料中建立了一個反映人類行為的潛在空間,然後透過基於代理模型的模擬(Agent-based Modeling)模擬出新聞推薦生態系的演化動態。

SimuLine支援在單一伺服器(256G內存,消費級顯示卡)上對10000 名讀者和1000 名創作者進行100 輪次的創作-推薦-交互模擬,同時提供包括定量指標、視覺化和文本解釋在內的綜合分析架構。

廣泛的模擬實驗顯示SimuLine在理解社群演化過程、測試推薦演算法等方面具有巨大潛力。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

作者:張光平,李東勝,顧寒蘇,盧暾,尚笠,顧寧

論文網址:https://arxiv.org/abs/2305.14103

新聞推薦生態系演化模擬平台

隨著社群媒體(Social Media)的普及,人們越來越依賴線上新聞社群來發布和獲取新聞,每天都會有數以百萬計的新聞被內容創作者發佈到各種類型的線上新聞社區,並在推薦系統的分發下被海量用戶閱讀。

隨著新聞內容的生產和消費,網路新聞社群處於一種不間斷的動態演化過程中。

與其他類型的線上社群相同,網路新聞社群的發展也符合著名的生命週期理論,也即依序經歷「啟動」-「成長」-「成熟」-“衰退”的階段。

透過生命週期理論的視角,大量的研究工作探討了線上社群的演化模式,並對生命週期中每個階段的運作提出了建議。

然而,作為線上新聞社群最重要的技術基礎設施之一的推薦系統對網路新聞社群的演化有何影響仍迷霧重重。

為了解開這一謎團,來自復旦大學電腦學院的CISL研究團隊重點關注了以下三個研究問題,並試圖透過模擬實驗來找到它們的答案:

1)新聞推薦生態系統(News Recommendation Ecosystems, NREs)生命週期的每個階段有什麼特色?

2)驅動NREs演化的關鍵因素有哪些,這些因素是如何彼此作用進而影響演化過程的?

3)如何透過推薦系統的設計策略,實現更好的長期多方效用,從而避免社群陷入「衰退」?

為了回答這三個研究問題,CISL研究團隊研發了新聞推薦生態系演化模擬平台SimuLine。

SimuLine首先根據真實世界的資料集進行合成資料的產生。為了解決原始資料集固有的暴露偏差問題(Exposure Bias), SimuLine引入了逆傾向分數(Inverse Propensity Score)來消除偏差。

為了建立一個貼近人類決策過程的潛在空間,SimuLine引入了基於大規模語料庫的預訓練語言模型(Pretrained Language Models)來進行隱空間的構建,最後,SimuLine透過基於代理模型的仿真(Agent-based Modeling)模擬了使用者、內容創作者和推薦系統在新聞推薦生態系統中的行為和互動。

合成資料產生

當試圖動手建立一個代表使用者的模擬器時,撲面而來的第一個問題就是「使用者的各種行為應該如何刻畫?」

這個問題其實有一個十分直接而且被推薦系統領域廣泛採用的解決思路,那便是構建一個隱空間(Latent Space),然後把用戶的興趣和新聞的內容通通映射到這個空間去。

如此一來,便可以十分方便地透過隱空間中向量的相似度,來衡量使用者對新聞的喜愛程度,進而定義出一系列行為的邏輯和規則。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

建構

##那麼該如何構建這個隱空間呢?

有的同學便說了:「這有何難!?推薦演算法不就是用來幹這個活的嘛!直接用推薦演算法學一個出來不就好了? 」

這的確不失為一種方法,但也有一些明顯的問題。

其中最令CISC研究團隊百思不得其解的是一個叫做「Algorithm Confounding」的邏輯漏洞,也就是說假如使用推薦演算法A來建構隱空間並映射用戶和新聞作為它們真實的行為決策依據,那麼在後面模擬過程中使用的算法B豈不成了在擬合算法A(了解一些蒸餾學習的同學是不是很眼熟)?

此外,目前大多數的推薦演算法仍是黑盒模型,就算睜一隻眼閉一隻眼放過了Algorithm Confounding,在對模擬資料進行分析的時候也會是一頭霧水(這個維度在變大,可是這個維度代表啥啊???)。

正當研究團隊一籌莫展之際,一道白色的閃光劃過:好像之前看到過一篇文章說,基於大規模語料庫訓練出來的語言模型(當時還是Bert的天下,ChatGPT尚未呱呱墜地)可以表現出一些基本的人類認知(也就是著名的King – male Female = Queen)。

那這個東西用來建構隱空間豈不是非常適合:

1. 它可以編碼使用者和新聞;

2. 透過從大規模語料庫中學習全局的文本表徵,它所體現的人類認知應該是基礎而普遍的,從而規避了Algorithm Confounding的問題;

#3. 雖然不太清楚它的隱空間裡每一個維度代表了什麼,但這並不影響這個空間的可理解性,完全可以透過相似向量檢索來為空間中每一個點提供文本的大致解釋。

這簡直太美妙了!就決定是你了!

映射

解決了隱空間的構造問題,下一步就是將使用者和新聞映射到這個空間了。

新聞好說,本來新聞就一定會有豐富的文字訊息,直接編碼就可以了,但是用戶該怎麼去處理呢?利用用戶歷史記錄裡喜歡的新聞求個均值行不行?

不行!

可惡的Algorithm Confounding換了個名字又來了,這次它叫做Exposure Bias,也就是用戶的點讚記錄並不一定能夠完全體現出用戶的興趣,因為用戶點讚的新聞一定是用戶看到的新聞,而用戶看到的新聞本身就是經過推薦系統的一次篩選的,完全存在一種可能性那就是用戶沒點讚是因為沒看到。

還好經過這麼多年的高歌猛進,推薦系統領域的軍火庫彈藥充足,研究團隊從Unbiased Recommendation這個倉庫中找到了解決這個問題的趁手兵刃:Inverse Propensity Score (IPS)。

簡單來講,那便是透過估計推薦樣本的曝光密度對其進行加權,從而抵消掉它在模型學習過程中帶來的Bias,如此一來用戶的編碼問題也就解決了。

至於最後的內容創作者,他們發佈內容的行為沒有受到Exposure Bias的干擾,直接對其歷史記錄進行加權就行了。其實經過上面的一通操作,資料準備工作已經基本完成了,但是仍有兩點美中不足:

· 首先是資料規模尚未調整,可能會和計算資源不適配(小驢拉大磨/大驢磨洋工);

· 其次是使用者的隱私沒有被尊重。因此研究團隊在原始資料集使用者編碼的基礎上又套接了一層生成模型。

考慮到新聞平台總是設計有分區導航(財經、運動、科技等等),而用戶在各分區的聚集現像也比較明顯,研究團隊便提拔了高斯混合模型(GMM)來負責這個任務。

代理建模

完成了前期的資料準備工作之後,便可以開始建模使用者的行為了。

研究團隊這裡採用了Agent-based Modelling的方式,也就是建模個體的行為以及個體之間的交互,然後透過部署大量Agents來模擬出群體的動態。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦


#簡單回想使用者的線上新聞閱讀流程(例如大家刷今日頭條的時候),用戶首先會在某一個頁面看到推薦系統推薦的一系列新聞,然後用戶簡單瀏覽一下各個新聞的標題、配圖和摘要,如果某條新聞激起了用戶的興趣,便會點進去看看具體講了些什麼,讀完這則新聞之後,如果用戶覺得這則新聞不錯、值得大家一讀或是符合自己的觀點,用戶便會透過點讚等方式表達自己對這則新聞的認同。

定義

在這個過程中,使用者和新聞之間的互動可以被分割成三個層級(曝光、點擊和按讚),其中點擊和按讚是用戶的主動行為,需要在User Agent中定義一番。

在這裡研究團隊將使用者的點擊行為歸納為一種機率選擇行為,也就是依據使用者和新聞之間的匹配度(可以用兩者隱空間內的相似度衡量),用戶有一定機率從清單中選擇一些自己感興趣的新聞點開閱讀。

這個定義相比於直接點擊最匹配的新聞具有更好的彈性,也就是說並不一定匹配度高就會被閱讀,更符合真實情況一些。

至於點讚行為,就不能簡單的只考慮新聞的匹配度了,畢竟眾所周知,標題黨的現像在新聞中還是屢見不鮮的。

因此研究團隊引入了一個抽象的「新聞品質」的概念來總體上代表一篇新聞報道的價值,如此一來,用戶的點讚行為便可以透過主觀的興趣和客觀的品質共同刻畫。

研究團隊採用了期望模型來進行Agent點讚行為的控制,具體來講,首先基於興趣匹配程度和新聞質量計算出一個用戶閱讀某條新聞的效用(Utility),如果這個效用超過了使用者的期待(研究團隊用一個超參數Threshold來代表這個期待的具體值),那便觸發點讚行為。

這個設計的直覺解釋就是,如果一則新聞有讓我爽到,不管是因為它迎合了我還是它本身的報道十分客觀全面,我便會毫不吝嗇的為他按讚。

此外在新聞閱讀過程中,使用者的興趣或觀點顯然也不會是一成不變的。

比如說用戶看到了一篇很喜歡的新聞報道,就有可能激發用戶對相關新聞的深入挖掘慾望,與之相反的,如果一篇報道令用戶感覺完全是滿紙荒唐言,用戶以後再看到類似的報道就不太會再點進去看它的報道細節了。

這個現像被研究團隊建模為了一個使用者偏好漂移模型(User-drift Model)。

創作行為建模

接下來建模新聞創作者的創作行為。

真實世界中的新聞創作會受各種因素的影響,研究團隊這裡將其簡化為一個貪心過程,也就是作者總是希望自己創作的新聞能夠得到更多位讀者的認同。

具體的Agent行為控制研究團隊採用了類似於用戶點擊的方案,創作者根據自己創作的新聞在上一輪的點讚情況進行概率抽樣,選出新一輪創作的主題,然後圍繞主題進行新聞創作。新聞創作的過程類似的也被建模為隱空間中從以主題為中心的高斯分佈中抽樣的過程。

除了新聞的內容(隱空間表徵),還需要對新聞的品質進行建模。這裡基於兩個符合現實法則的基本假設:

#1. 作者的獲讚數與收入存在一個邊際遞減的正相關關係,也就是作者收到的讚越多收入閱讀,但是隨著讚數的提升,單一讚帶來的收益會逐漸減少;

2. 收入高的創作者由於預算更充足,會創作出質量更高的新聞。基於此可以建立一個從上一輪獲贊數到下一輪新聞品質的映射函數,用於控制新聞創作的品質。

推薦系統建模

#最後對推薦系統的行為進行建模。

演算法推薦和冷啟動推薦是新聞推薦系統的兩個基本元件。為了提供個人化的演算法推薦,推薦系統首先利用推薦演算法,如BPR等,從歷史互動資料中學習使用者和新聞在嵌入空間中的表示(研究團隊用隱空間Latent Space指涉大規模語言模型編碼的真實使用者興趣空間,用嵌入空間Embedding Space指涉推薦演算法學習得到的用於產生推薦清單的空間)。

但是由於用戶點讚行為的不確定性和新聞有效性窗口的限制,演算法推薦不能保證覆蓋所有用戶,對於這部分缺口,可以透過簡單的隨機推薦予以補全。

由於缺乏歷史互動記錄,新創作的新聞同樣無法參與到演算法推薦中,SimuLine應用隨機推薦和啟發式推薦演算法(如歷史上喜歡的創作者的新報道)等策略來推薦冷啟動新聞。

此外,SimuLine也支持了其他啟發式新聞推薦策略,如突發新聞,基於內容創作者的推廣,以及基於主題的推廣等。

所有的推薦策略均擁有獨立的推送額度,推薦系統將來自所有管道的新聞推薦合併形成最終的推薦清單。

模擬實驗

資料已就位!模型已搭建!接下來進行一番緊張刺激的實驗!

研究團隊選用了新聞推薦領域廣泛使用的Adressa資料集,這個資料集提供了挪威新聞網站www.adressa.no在2017年二月某一週的完整網誌,與其他優秀的新聞推薦資料集(例如微軟的MIND)相比,它原生提供了十分關鍵的新聞作者資訊。相對應的,語言模型選用了原生支持挪威語的BPEmb。更多的部署細節各位可以參考論文中的第四章第一小節。

那麼該如何分析SimuLine的模擬結果呢? SimuLine提供了一套多個視角的全面分析架構供君參考。

首先是最常用的量化指標評估系統。

為了全面反映新聞推薦生態系統的演化過程,研究團隊總結了已有文獻中出現過的量化指標,從以下五個面向建構了一套較為完整的評估體系:

1)互動性,包括按讚獲讚的數量及其基尼指數,較低的基尼指數代表更好的公平性;

#2)覆蓋率,包括演算法推薦所涵蓋的用戶和新聞的數量;

3) 質量,包括時效期新聞的平均質量、獲讚量加權的時效期新聞平均品質以及新聞品質與獲讚量之間的皮爾遜相關係數;

4)同質化,包括用戶間的Jaccard指數,數值越高代表使用者之間的新聞閱讀重疊程度越高;

5)匹配度,包括使用者和他們喜歡的新聞之間的隱空間表徵餘弦相似度。

1. 生命週期

下面三張圖分別展示了在不同Agent超參數條件下,使用者、創作者、推薦系統的量化評估結果。


復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

可以看到,模擬的過程和結果在各種超參數下都是比較穩定的,並且大約以第十輪和第二十輪為分界線(不同指標存在一定的前後浮動),系統的演化呈現出了明顯的階段性(在圖中用藍色的豎線畫出了發生階段轉換的輪次),這與著名的生命週期理論相一致。 由此得到第一個發現:

推薦系統驅動的線上新聞社群在不同的使用者群體下均自然呈現出「啟動」-「成長」-「成熟&衰退”的生命週期。

2. 使用者分化

#除了量化指標,視覺化也是輔助理解社群演化過程的重要工具。

###研究團隊透過PCA降維視覺化得到了下面這一組系統演化過程的快照(新聞用藍色標示,有點讚記錄的用戶用綠色標示,沒有點讚記錄的使用者以紅色標示。節點大小代表按讚/獲讚的數量)。 ######

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

可以看到,雖然量化指標表現出了多階段的模式,但隱空間表徵的演化趨勢卻是一致的,即使用者逐漸分化為圈內使用者(in-the-loop users)和圈外使用者(out-the-loop users)。

圈內使用者形成了一個興趣趨同的穩定社區,而圈外使用者則呈現出零散的興趣。

在第10輪和第20輪之間的演化過程中,使用者基本上完成了分化,這顯示成長階段對使用者參與有至關重要的決定作用。

由此得到第二個發現:推薦系統驅動的線上新聞社群將不可避免地產生社群話題的趨同,並導致用戶的分化,其中決定用戶參與的關鍵時期是成長階段。

3. 興趣同化

如前文所說,由於SimuLine透過大規模預訓練語言模型來建構隱空間,因此空間中的每個向量都可以透過相似詞檢索來進行文本解釋,這有助於透過案例研究了解單一使用者的演變。

研究團隊分別從圈內用戶和圈外用戶中隨機抽取了3名用戶,以下的表格展示了他們的興趣演化過程。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

#對於圈內用戶來說,他們的興趣癒發抽象、廣泛和概括,例如從“演員”到“工作”,從“奧斯陸”到“挪威”到“歐洲”。不同使用者的演化速度各不相同,但都在第50輪時趨於一致。這一現象反映了作為不斷與推薦系統互動的結果,使用者的偏好從個人化的小眾話題逐漸遷移到平台上廣泛討論的趨勢性話題。

而對於圈外用戶來說,他們的興趣略有變化,但總是集中在特定的和個人化的話題上。例如4號和6號用戶在整個模擬過程中分別對「運動員」、「茶」和「帳單」保持興趣。

由此得到第三個發現:在推薦系統驅動的線上新聞社群中,使用者的個人化興趣在與推薦系統的持續互動過程中被同化了。

4. 啟動階段

#借助上述量化指標、視覺化、文本翻譯三大利器,SimuLine可以對系統的演化過程進行一次全面體檢。

既然推薦系統驅動的網路新聞社群的演化過程符合生命週期理論,那就從生命週期的視角分析一下,在各個生命階段,社群到底是怎麼演化的。

先分析大致對應前10輪的啟動階段。

由於系統是白手起家從零做起,所以在最開始的階段推薦系統是缺乏資料訓練推薦演算法的。相對應的,在這一階段利用隨機推薦和啟發式推薦解決用戶的冷啟動問題便是首要任務。

由於無法使用更準確的演算法推薦,該階段的推薦結果往往在興趣匹配上不盡人意,因此該階段的點讚行為主要由新聞品質驅動,反映在量化指標上那便是品質和熱度的較強的正相關關係。

更進一步,便可以定位出啟動階段社群演化的兩個主要驅動力量:

1)品質回饋迴路(Quality feedback loops),即品質與熱度在正相關關係基礎上的相互促進,也就是東西越好點讚的人越多,點讚的人越多作者收益越高,作者收益越高越有動力產出品質較好的新聞報道;

2)興趣-品質混淆,也就是在累積到足夠準確估計用戶興趣的在資料量之前,推薦演算法會將品質驅動的讚行為混淆為因為使用者感興趣而觸發的行為。這兩個驅動力量相互促進,使得受歡迎的內容創作者獲得逐漸增強的超量曝光(體現為創作者和新聞基尼指數的上升),並近一步擠壓用戶個性化興趣的滿足(體現為用戶與其按讚新聞之間隱空間相似度的下降)。但大多數用戶仍可以從增強的新聞品質中受益(體現為不斷降低的用戶點讚行為的基尼指數)。

總結一下,可以得到第四個發現:在啟動階段,系統從隨機推薦和高品質新聞中累積用於估計用戶興趣的數據,進而解決冷啟動用戶問題。品質回饋循環和興趣-品質混淆透過過度曝光促成了極受歡迎的內容創作者的出現。

5. 成長階段

#隨著數據的積累,推薦演算法對用戶興趣的估計越來越準確,點讚行為從品質驅動逐漸轉向興趣驅動,品質和熱門程度之間的相關性逐漸減弱。隨著模擬輪次的增長,啟動期創作的新聞逐漸過期並退出推薦候選,興趣-品質混淆率先開始消散,並逐漸導致品質回饋循環的最終結束。

在成長階段,每個圈內用戶臨域內的新聞密度是不均勻的,朝向主流新聞主題的方向密度較高,而其他方向的密度相對較低。

其結果便是用戶喜歡的新聞在統計上更多的會向主流新聞主題靠攏,這一點讚行為上的細微偏差不斷出現,用戶興趣在持續的強化作用下也逐漸向主流新聞主題逼近。

與之相反的是,圈外用戶陷入了「不按讚-演算法推薦無法覆蓋-推薦準確度低-更不會點讚」的僵局。他們偶爾也會因為新聞品質而點贊,但推薦演算法無法在數據時效內累積到足夠的數據來估計他們的興趣。更頻繁且均衡的讚行為刺激了新聞品質的成長,但由於高品質新聞的受歡迎程度下降,按獲讚數量加權的新聞品質總體上保持了穩定。

隨著品質回饋循環的終止,內容創作者無法再獲得超量關注,進而導致新聞品質的下降。對品質敏感的用戶可能會因此而不再按讚,進而導致用戶覆蓋率的下滑。

總結起來,可以得到第五個發現:在成長階段,圈內用戶在分佈偏差的作用下向共同話題演化,而圈外用戶則陷入僵局,導致了用戶分化。越來越準確的演算法推薦導致品質回饋循環的結束,社群因此而喪失了部分品質敏感的使用者。
6. 成熟與衰退階段

在第20輪左右,社區進入了成熟和衰退階段,此時大多數關鍵指標趨於穩定。

在此階段,圈內用戶動態地保持在共同話題的氣泡中,雖然他們的興趣可能會因為點擊一些不同的新聞而轉移到氣泡的邊緣,但他們很快就會因為密度差而回到中心。

######新聞獲讚的基尼指數較高,而內容創作者的獲贊基尼指數較低,說明即使是同一創作者創作的新聞,其受歡迎程度也存在很大差異。 ############除了貪婪的創作機制,新聞創作的過程本身俱有高度隨機性,因此氣泡也呈現出自然的擴張趨勢。 ######

擴張的氣泡帶來了更多樣化的新聞候選,也導致了部分對話題敏感的用戶逐漸退出。

由此可以得到第六個發現:在成熟和衰退階段,圈內用戶共享共同的話題,內容創作者圍繞這些話題發佈各種新聞。社群保持了穩定且緩慢的擴張,但同時也流失了部分對興趣敏感的使用者。

7. 演化是如何發生的?

發現一到發現六回答了研究團隊關注的第一個研究問題:新聞推薦生態系統(News Recommendation Ecosystems, NREs)生命週期的每個階段有何特色?

接下來把所有的知識攏起來,試著回答第二個研究問題:驅動NREs演化的關鍵因素有哪些,這些因素是如何彼此作用進而影響演化過程的?

下面這張圖總結了網路新聞社群演化的關鍵因素和影響機制,從中可以發現,重新出現的曝光偏差和死鎖是導致圈內用戶和圈外用戶不同演化趨勢的直接原因,並進一步導致了使用者的分化和話題的趨同。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

重新出現的曝光偏差是由多種因素共同造成的。

首先,從資訊理論的角度來看,推薦演算法可以解釋為一個資訊壓縮的過程,不可避免地導致流行度偏差,其中在資料集中高頻出現的新聞(也就是按讚多的新聞)被更有效地編碼以提高推薦表現。反映到社群的演化過程上,便體現為廣泛討論的共同話題會在演算法推薦管道上搶佔個人化話題的曝光資源。

其次,由於內容創作者的逐利性,他們更有動力圍繞公眾感興趣的話題創作新聞,這自然而然的會導致新聞發佈密度從大眾話題向個性化話題的降低。從這個意義上來看,即使全程採用隨機推薦,社群也可能由於分佈的偏差而朝著主題收斂的方向發展。

最後,過濾氣泡和曝光偏差相互促進,共同導致了使用者潛移默化的興趣轉移。演算法推薦根據用戶歷史上按讚過的新聞推薦類似的報道,受限的新聞曝光使得曝光偏差更加難以被用戶感知。

此外,推薦系統對流行新聞的偏向在不同的演化階段表現出了不同的影響。

在啟動階段,有興趣-品質混淆,新聞品質與流行度之間存在較強的相關性,流行偏向具體表現為高品質新聞曝光度的增強。

隨著數據的累積和演算法推薦性能的提升,與品質驅動相比,點讚行為越來越受興趣驅動,進而削弱了興趣-品質混淆和品質-流行度相關性。流行偏向也從推薦優質新聞逐漸演變為單純的推薦高熱度新聞。

在這個新舊動能轉換的過程中,培育出一些高人氣同時高品質的新聞主題,對促進用戶參與具有重要作用。

總結下來,便可以得到第七個發現:流行偏向、新聞分佈偏差和過濾氣泡共同導致了曝光偏差這一影響用戶差異化和話題收斂的關鍵因素。高人氣的優質新聞對於打破圈外用戶的僵局至關重要。

8. 如何避免社群衰退?

最後,借助SimuLine強大的模擬能力和分析能力,再探索一番第三個研究問題:如何透過推薦系統的設計策略,實現更好的長期多方效用,從而避免社群陷入「衰退」?

研究團隊測試了四種最基礎最常見的啟發式推薦方法:基於訂閱制的新聞冷啟動、熱搜榜、主題推廣和創作者推廣。下面三張圖呈現了在基礎推薦系統之上應用上述四種方法的社群演化結果。

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦

(1)基於訂閱制的新聞冷啟動試圖在使用者和內容創作者之間形成穩定的跨輪曝光關係,從而增強啟動階段出現的品質回饋循環。

但是這種做法導致了嚴重的壟斷,沒有取得先發優勢的內容創作者反而會被質量反饋迴路壓制,破壞了演算法覆蓋率和新聞的平均質量,進而使整個社區生態的多樣性受到嚴重挑戰。

(2)熱搜榜是最常見的線上社群元件,依靠新聞品質和流行度之間的正相關關係,這種方式可以為使用者提供更高品質的新聞推薦。同時從利用和探索(Exploit&Explore)的角度來看,閱讀突發新聞也可以看作是一種突破用戶現有興趣限制的用戶探索,有助於減輕過濾氣泡的負面影響。

然而,這種方法無法阻止前文中討論的流行度和品質之間相關性的崩潰,這會導致推薦突發新聞的有效性下降。

(3)最後是平台推廣,透過提供特定主題或特定作者額外的曝光額度,平台也可以主動地調控推薦的內容。針對內容創作者的推廣可以建立起穩定的曝光關係,進而利用品質回饋迴路培養高人氣的優質新聞。

但與基於訂閱制的新聞冷啟動策略不同的是,可以在當前質量反饋循環培育出有害的壟斷之前主動終止推廣,從而保障了用戶的體驗和創作者的創造力。作為一個獨立於興趣匹配的新聞傳播管道,它同樣可以減輕過濾泡沫的負面影響。此外,透過重建品質回饋迴路,它還將推薦系統對流行新聞的偏向導向對高品質新聞的有益推薦。

SimuLine在針對特定話題推廣的實驗中隨機選擇話題,也就是說熱門話題與個人化話題有同等的機會被推廣,因此對於曝光度相對較低的個性化話題,推廣的影響相對較大。

這個方法理論上可以用來提升圈外用戶的參與度,但由於推廣新聞的品質無法得到保證,曝光量難以轉化為獲讚數,導致了該方法效果有限。 總結起來,便可以得到第八個發現:

在常見的推薦系統設計策略中,針對內容創作者的周期性推廣是最有效的。透過積極建立品質回饋迴路,它可以在整個社區中營造一波接一波的高人氣高品質的新聞話題,同時平台可以透過定期的重置來控制壟斷。

小結

在這篇文章中,CISL研究團隊設計並開發了用於剖析新聞推薦生態系統演化過程的模擬平台SimuLine,並基於SimuLine對線上新聞社群的演化過程進行了詳細分析。

###SimuLine 建構了一個很好地反映人類行為的可理解的隱空間,並在此基礎上透過基於代理的建模對新聞推薦生態系統進行了細緻的模擬。 ######

研究團隊剖析了網路新聞社群演化的整個生命週期,包括啟動、成長、成熟和衰退階段,並分析了每個階段的特徵,同時提出了一個關係圖來說明演化過程中的關鍵因素和影響機制。

最後,研究團隊探討了推薦系統設計策略對社群演化的影響,包括對訂閱制新聞冷啟動、熱門新聞和平台推廣的利用。

未來,CISL研究團隊會考慮新聞的文字內容產生和社群網路活動的行為建模,以進行更強大更真實的模擬。

研究團隊認為SimuLine也可以作為推薦系統評估的一大利器,提供線上使用者實驗和基於資料集的離線實驗之外的第三種選擇(這也是給它取名為SimuLine的主要原因)。

研究團隊也注意到最近推薦系統研究社群也提出了一系列的糾偏推薦演算法,旨在處理推薦中的曝光偏差問題,這也是用戶分化和主題收斂的直接原因。

由於本文著重於討論推薦系統的系統設計而不是具體的推薦演算法,研究團隊將這個問題留作一個開放的主題,並希望SimuLine 能夠促進未來在這個方向的研究。

以上是復旦發布「新聞推薦生態系統模擬器」SimuLine:單機支援萬名讀者、千名創作者、100+輪次推薦的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除