新一代資訊與智慧科技的快速發展推動人類逐步邁入智慧社會。在數位科技和智慧推薦演算法的加持下,媒體和平台越來越貼心,總是能最快、最準的地契合人們的個人化偏好和需求。
然而,同時,智能精準推薦致使「資訊繭房」現像不斷發酵,觀點相似的人群在網路空間組成團體,特定價值偏好在群體中匯集放大,逐漸形成極端的觀點。
針對名人或社會事件的每一種極端觀點都能夠被利用成為意識形態加入和影響的工具,在網絡空間和現實世界中推波助瀾,掀起“洶洶民意” 。
然而,即便如此,我們對於資訊繭房仍知之甚少:真實線上系統中的資訊繭房究竟有多嚴重?缺乏大規模實證研究;資訊繭房的形成機制是什麼?缺乏基礎理論支撐;如何解決資訊繭房問題?缺乏行之有效的手段。
最近,清華大學電子系城市科學與計算研究中心與公管學院跨學科合作,透過大規模實證研究與資訊動力學理論建模,首次大規模資料實證及理論揭示了資訊媒體上資訊繭房湧現的內在機理與相變邊界,為理解當下智能社會中人-智交互複雜社會系統提供了全新思路。
此成果以「人智自適應動力學驅動資訊繭房湧現」(Human–AI adaptive dynamics drives the emergence of information cocoons)為題在《自然·機器智能》(Nature Machine Intelligence)上線上發表。
論文連結:https://www.nature.com/articles/s42256-023-00731-4
#程式碼及資料連結:https://github.com/tsinghua-fib-lab/Adaptive-Information-Dynamic-Model
此成果聚焦於新聞與視頻兩個典型場景,透過分析5.7億用戶行為數據和使用資訊熵度量資訊繭房嚴重程度,發現在一年交互後,超過57%的活躍用戶均經歷了不同程度的信息熵下降,標誌著現實系統中資訊繭房的嚴重性。
在實證發現的基礎上,該成果提出了人-智自適應資訊動力學模型,以建模人類與推薦演算法之間的關鍵回饋迴路,並通過系統資訊熵的演化規律來刻畫訊息繭房相變過程。
該模型從非平衡態統計力學視角揭示了「多樣化-部分資訊繭房-深度資訊繭房」複雜系統的相變過程及相變邊界,為控制人-智交互複雜社會系統中的信息繭房問題提供了理論基礎,並啟發後續設計通過平衡系統正反饋與負反饋以及算法精準推送與用戶自由探索,破除信息繭房,進而實現負責任的推薦演算法.
人工智慧作為一種新興顛覆性技術,正在深刻改變人類的生產、生活方式和思維方式,對經濟發展與社會進步產生著重大而深遠的影響。其中,推薦演算法作為人工智慧技術最廣泛應用的一種,能夠有效緩解資訊過載問題,極大程度地影響著人們的所見所聞與所想。
然而,推薦演算法也是一把雙面刃,其所提供的個人化推薦會使人們所接觸的資訊變得越來越同質化,逐漸困於訊息繭房之中。而這些同質化的信息,不但會限制人們的眼界,使其遠離集體、疏離社會,還會助長社會矛盾與分裂。
因此,為了遏制資訊繭房的產生,理解其背後的產生機制是首要一步。
已有對資訊同質化問題的研究[1-5],多聚焦於人類行為或是智慧演算法。透過實證研究方法,研究指出社群媒體上同質人群聚集的潛在因素或是演算法濾波效應,然而由於數據與方法論的限制,僅能提供相關性結論。
最近,一些實證研究[25,26]進行了因果性的分析。然而,這些研究仍未提供內在機理性的分析與解釋。更進一步地,目前推薦演算法大多基於黑盒的人工智慧深度學習方法,而背後的數以億計的參數量,使得我們更難以洞察資訊繭房的根源。
針對資訊繭房根源未知的問題,研究團隊聚焦於新聞與影片兩個典型場景,透過大規模實證研究發現,在一年互動過程中,超過57%的活躍用戶均經歷了不同程度的資訊多樣性的下降,並指出基於相似度配對與正負回饋是影響資訊同質化過程的關鍵要素。
進一步,基於實證發現與推薦演算法領域實踐,研究團隊受隨機熱力學思想啟發,創造性地提出了人-智自適應資訊動力學模型。
此模型透過刻畫基於相似度匹配與回饋利用兩個基本機制,機理性地建模了人類與推薦演算法之間的關鍵回饋迴路,並透過系統資訊熵的演化來刻畫系統相變過程。
透過模擬實驗與理論分析,揭示了「多樣化-部分資訊繭房-深度資訊繭房」複雜系統的相變過程及相變邊界,為控制人-智交互複雜社會系統中資訊繭房的問題提供了理論基礎與實用方法。
人-智自適應資訊動力學模型
研究團隊聚焦於新聞與影片兩個內容推薦典型場景,透過大規模真實資料的實證分析,刻畫了真實世界資訊繭房的嚴重程度及其影響因素。
具體而言,研究團隊使用資訊熵來刻畫使用者所接收資訊的多樣性,發現超過57%的活躍使用者都經歷了不同程度的資訊多樣性的下降,其視野被推薦演算法逐漸侷限於狹窄的資訊繭房。
透過進一步分析,研究團隊發現推薦演算法基於相似度匹配的強度以及正負回饋是影響資訊繭房產生的關鍵要素。這項實證研究不僅首次量化了真實大規模線上資訊系統中資訊繭房的嚴重程度,也為後續理論模型的提出奠定了基礎。
#(a-c)聚焦於新聞與影片兩個典型場景,量化真實世界訊息繭房嚴重程度;(d-f)相似度匹配強度、正負回饋是影響訊息繭房形成的重要因素。
基於實證結論與推薦演算法領域實踐,結合隨機熱力學理論,研究團隊創造性地提出了人-智自適應資訊動力學模型。
此模型採用資訊熵來表示使用者所接觸資訊的多樣性,並使用系統資訊熵分佈來表示系統所處狀態。
與依靠數以億計參數的深度學習模型不同,所提出的模型僅依靠基於相似度匹配與用戶反饋兩個基本機制,機理性地建模了人類與推薦演算法之間的關鍵回饋迴路,並使用隨機動力學方程式刻畫人-智複雜動力學互動過程。
其中,#代表使用者l已被觀測到的興趣分佈,代表物品k的特徵分佈,分別代表基於相似度匹配強度、正回饋利用率、負回饋利用率、自由探索強度。
基於上式能夠推導出描述關於用戶在各類主題上已被觀測到的偏好的福克-普朗克方程,進一步通過平均場近似方法,最終能夠推導出使用者所接收的資訊熵在人群上的分佈。
研究團隊指出,在不同參數空間下,該人-智交互複雜社會系統存在多樣化、部分資訊繭房與深度資訊繭房三種狀態,而這三種系統狀態分別被三種不同的資訊熵分佈所刻畫。
大規模的模擬實驗與實證分析進一步驗證了所提出模型的解釋力與效度。
#隨著(a)基於相似度匹配強度或(b)正向回饋利用率的增加,人-智互動複雜社會系統經歷了從多樣化狀態到部分資訊繭房狀態,再到深度資訊繭房狀態的相變過程。紅色虛線為理論線,長條圖為仿真線。
研究團隊發現,隨著基於相似度匹配強度或正回饋利用率的增加,該複雜系統呈現出了從多樣化狀態到部分資訊繭房狀態,再到深度資訊繭房狀態的相變過程。
然而,如果提升負回饋利用率或自由探索強度,系統則會經歷一個逆相變過程,即從深度資訊繭房到部分資訊繭房,最後到多樣化化狀態。上述四個相變過程經過理論分析與大規模模擬實驗的一致驗證。
隨著(a)負回饋利用率的增加或(b)自由探索強度的增加,人-智交互複雜社會系統經歷了從深度資訊繭房狀態到部分資訊繭房狀態,再到多樣化狀態的逆相變過程。紅色虛線為理論線,長條圖為仿真線。
透過聯合分析,研究團隊展示了在基於相似度推薦、正負回饋利用以及自由探索四個要素聯合驅動下的整體系統的相變圖,並揭示了在資訊繭房湧現的內在機理。
具體而言,基於相似性配對作為有效力場,推動複雜互動系統從多樣化走向同質化。正回饋進一步放大了這一力場,導致資訊多樣性下降。
而負回饋和自由探索透過抵制有效力場的作用,為系統引入擾動,從而促進資訊多樣性。
關於相變邊界,理論預測結果與模擬實驗結果呈現高度一致性,同時,透過大量模擬實驗與實證分析,例如替換函數、測量資訊熵分佈等,進一步驗證了所提出模型的穩健性與有效性。
系統相變圖,(a-b)基於視訊與新聞場景資料的三維係統相變圖,(c-e)基於視訊場景資料的二維系統相變圖,(f-h )基於新聞場景資料的二維系統相變圖。
隨著人工智慧技術的廣泛應用,人類與智慧系統之間的複雜互動構成了一個涉及多個實體與多種回饋的複雜人智互動系統。
目前人工智慧大多基於深度學習技術,而其黑盒子屬性進一步阻礙了深入理解該類別複雜互動系統中的動態特性和湧現行為。
研究團隊所提出的自適應資訊動力學模型透過提供資訊繭房湧現行為的機理性建模,為深入研究各類複雜人-智互動系統提供了有力的理論工具。此外,所提出的理論模型對於負責任的推薦演算法設計具有實際指導意義。
該研究指出兩個資訊繭房的有效方法,即促進負回饋的有效利用,從學習用戶的負回饋這一全新視角來建模用戶偏好;以及促進使用者自由探索,透過增大使用者對於自身內容消費的自由度與自主權,來拓寬資訊視野。
綜上所述,該研究成果不僅為推薦演算法設計指明了實際改進方向,也為理解人-智交互複雜社會系統提供了理論工具,以啟發後續Complex System for AI的相關研究。
清華大學電子系城市科學與計算研究中心博士生樸景華與博士後劉家臻為論文共同第一作者,李勇副教授為通訊作者;清華公共管理學院張芳助理教授、蘇竣教授為共同作者。
此研究成果獲得科技創新2030—「新一代人工智慧」重大計畫與自然科學基金計畫的支持。
以上是清華新研究解密資訊繭房!全新資訊動力學理論,登Nature子刊的詳細內容。更多資訊請關注PHP中文網其他相關文章!