【導讀】最近,,復旦大學的研究人員提出了一種新聞推薦生態(tài)系統(tǒng)演化模擬平臺SimuLine,可以從真實數(shù)據(jù)中構建一個反映人類行為的潛在空間,,然后通過基于代理模型的仿真模擬出新聞推薦生態(tài)系統(tǒng)的演化動態(tài),。
理解在線新聞社區(qū)的演變對于設計更有效的新聞推薦系統(tǒng)至關重要,但由于缺乏適當?shù)臄?shù)據(jù)集和平臺,,現(xiàn)有研究在理解推薦系統(tǒng)如何影響社區(qū)演化方面存在局限,,導致了可能影響長期效用的次優(yōu)系統(tǒng)設計。
針對這一問題,,復旦大學計算機學院CISL研究團隊研發(fā)了新聞推薦生態(tài)系統(tǒng)演化模擬平臺SimuLine,。
SimuLine基于預訓練語言模型(Pretrained Language Models)和逆傾向得分(Inverse Propensity Score)從真實數(shù)據(jù)中構建了一個反映人類行為的潛在空間,然后通過基于代理模型的仿真(Agent-based Modeling)模擬出新聞推薦生態(tài)系統(tǒng)的演化動態(tài),。
SimuLine支持在單服務器(256G內(nèi)存,,消費級顯卡)上對10000+名讀者和1000+名創(chuàng)作者進行100+輪次的創(chuàng)作-推薦-交互模擬,同時提供包括定量指標,、可視化和文本解釋在內(nèi)的綜合分析框架,。
廣泛的仿真實驗表明SimuLine在理解社區(qū)演化過程、測試推薦算法等方面具有巨大潛力,。
作者:張光平,,李東勝,顧寒蘇,,盧暾,,尚笠,顧寧
論文地址:https://arxiv.org/abs/2305.14103
新聞推薦生態(tài)系統(tǒng)演化模擬平臺
隨著社交媒體(Social Media)的普及,,人們越來越依賴在線新聞社區(qū)來發(fā)布和獲取新聞,,每天都會有數(shù)以百萬計的新聞被內(nèi)容創(chuàng)作者發(fā)布到各種類型的在線新聞社區(qū),并在推薦系統(tǒng)的分發(fā)下被海量用戶閱讀,。
隨著新聞內(nèi)容的生產(chǎn)和消費,,在線新聞社區(qū)處于一種不間斷的動態(tài)演化過程中。
與其他類型的在線社區(qū)相同,,在線新聞社區(qū)的發(fā)展也符合著名的生命周期理論,,也即依次經(jīng)歷「啟動」-「成長」-「成熟」-「衰退」的階段。
透過生命周期理論的視角,,大量的研究工作探討了在線社區(qū)的演化模式,并對生命周期中每個階段的運作提出了建議,。
然而,,作為在線新聞社區(qū)最重要的技術基礎設施之一的推薦系統(tǒng)對在線新聞社區(qū)的演化有何影響仍迷霧重重,。
為了解開這一謎團,來自復旦大學計算機學院的CISL研究團隊重點關注了以下三個研究問題,,并試圖通過模擬實驗來找到它們的答案:
1)新聞推薦生態(tài)系統(tǒng)(News Recommendation Ecosystems, NREs)生命周期的每個階段有什么特點,?
2)驅動NREs演化的關鍵因素有哪些,這些因素是如何彼此作用進而影響進化過程的,?
3)如何通過推薦系統(tǒng)的設計策略,,實現(xiàn)更好的長期多方效用,從而避免社區(qū)陷入「衰落」,?
為了回答這三個研究問題,,CISL研究團隊研發(fā)了新聞推薦生態(tài)系統(tǒng)演化模擬平臺SimuLine。
SimuLine首先根據(jù)真實世界的數(shù)據(jù)集進行合成數(shù)據(jù)的生成,。為了解決原始數(shù)據(jù)集固有的暴露偏差問題(Exposure Bias),, SimuLine引入了逆傾向得分(Inverse Propensity Score)來消除偏差。
為了建立一個貼近人類決策過程的潛在空間,,SimuLine引入了基于大規(guī)模語料庫的預訓練語言模型(Pretrained Language Models)來進行隱空間的構建,,最后,SimuLine通過基于代理模型的仿真(Agent-based Modeling)模擬了用戶,、內(nèi)容創(chuàng)作者和推薦系統(tǒng)在新聞推薦生態(tài)系統(tǒng)中的行為和交互,。
合成數(shù)據(jù)生成
當試圖動手構建一個代表用戶的模擬器時,撲面而來的第一個問題就是「用戶的各種行為應當如何刻畫,?」
這個問題其實有一個十分直接而且被推薦系統(tǒng)領域廣泛采用的解決思路,,那便是構建一個隱空間(Latent Space),然后把用戶的興趣和新聞的內(nèi)容通通映射到這個空間里去,。
如此一來,,便可以十分方便地通過隱空間中向量的相似度,來衡量用戶對新聞的喜愛程度,,進而定義出一系列行為的邏輯和規(guī)則,。
構建
那么該如何構建這個隱空間呢?
有的同學便說了:「這有何難???推薦算法不就是用來干這個活的嘛!直接用推薦算法學一個出來不就好了,?」
這的確不失為一種方法,,但也有一些明顯的問題。
其中最令CISC研究團隊百思不得其解的是一個叫做「Algorithm Confounding」的邏輯漏洞,,也就是說假如使用推薦算法A來構建隱空間并映射用戶和新聞作為它們真實的行為決策依據(jù),,那么在后面模擬過程中使用的算法B豈不成了在擬合算法A(了解一些蒸餾學習的同學是不是很眼熟)?
此外,,目前大多數(shù)的推薦算法仍是黑盒模型,,就算睜一只眼閉一只眼放過了Algorithm Confounding,,在對模擬數(shù)據(jù)進行分析的時候也會是一頭霧水(這個維度在變大,可是這個維度代表啥????,?),。
正當研究團隊一籌莫展之際,一道白色的閃光劃過:好像之前看到過一篇文章說,,基于大規(guī)模語料庫訓練出來的語言模型(當時還是Bert的天下,,ChatGPT尚未呱呱墜地)可以表現(xiàn)出一些基本的人類認知(也就是著名的King – male + Female = Queen)。
那這個東西用來構建隱空間豈不是非常合適:
1. 它可以編碼用戶和新聞,;
2. 通過從大規(guī)模語料庫中學習全局的文本表征,,它所體現(xiàn)的人類認知應該是基礎而普遍的,從而規(guī)避了Algorithm Confounding的問題,;
3. 雖然不太清楚它的隱空間里每一個維度代表了什么,,但這并不影響這個空間的可理解性,完全可以通過相似向量檢索來為空間中每一個點提供文本的大致解釋,。
這簡直太美妙了,!就決定是你了!
映射
解決了隱空間的構造問題,,下一步就是將用戶和新聞映射到這個空間了,。
新聞好說,本來新聞就一定會有豐富的文本信息,,直接編碼就可以了,,但是用戶該怎么去處理呢?利用用戶歷史記錄里喜歡的新聞求個均值行不行,?
不可以,!
可惡的Algorithm Confounding換了個名字又來了,這次它叫做Exposure Bias,,也就是用戶的點贊記錄并不一定能夠完全體現(xiàn)出用戶的興趣,,因為用戶點贊的新聞一定是用戶看到過的新聞,而用戶看到的新聞本身就是經(jīng)過推薦系統(tǒng)的一次篩選的,,完全存在一種可能性那就是用戶沒點贊是因為沒看到,。
還好經(jīng)過這么多年的高歌猛進,推薦系統(tǒng)領域的軍火庫彈藥充足,,研究團隊從Unbiased Recommendation這個倉庫中找到了解決這個問題的趁手兵刃:Inverse Propensity Score (IPS),。
簡單來講,那便是通過估計推薦樣本的曝光密度對其進行加權,從而抵消掉它在模型學習過程中帶來的Bias,,如此一來用戶的編碼問題也就解決了,。
至于最后的內(nèi)容創(chuàng)作者,他們發(fā)布內(nèi)容的行為沒有受到Exposure Bias的干擾,,直接對其歷史記錄進行加權就行了。其實經(jīng)過上面的一通操作,,數(shù)據(jù)準備工作已經(jīng)基本完成了,,但是仍有兩點美中不足:
· 首先是數(shù)據(jù)規(guī)模尚未調整,可能會和計算資源不適配(小驢拉大磨/大驢磨洋工),;
· 其次是用戶的隱私?jīng)]有得到尊重,。因此研究團隊在原始數(shù)據(jù)集用戶編碼的基礎上又套接了一層生成模型。
考慮到新聞平臺總是設計有分區(qū)導航(財經(jīng),、體育,、科技等等),而用戶在各個分區(qū)的聚集現(xiàn)象也比較明顯,,研究團隊便提拔了高斯混合模型(GMM)來負責這個任務,。
代理建模
完成了前期的數(shù)據(jù)準備工作之后,便可以開始建模用戶的行為了,。
研究團隊這里采用了Agent-based Modelling的方式,,也就是建模個體的行為以及個體之間的交互,然后通過部署大量Agents模擬出群體的動態(tài),。
簡單回憶一下用戶的在線新聞閱讀流程(比如大家刷今日頭條的時候),,用戶首先會在某一個頁面看到推薦系統(tǒng)推薦的一系列新聞,然后用戶簡單瀏覽一下各個新聞的標題,、配圖和摘要,,如果某條新聞激起了用戶的興趣,便會點進去看看具體講了些什么,,讀完這條新聞之后,,如果用戶覺得這條新聞不錯、值得大家一讀或是符合自己的觀點,,用戶便會通過點贊等方式表達自己對這條新聞的認同,。
定義
在這個過程中,用戶和新聞之間的交互可以被劃分為三個層級(曝光,、點擊和點贊),,其中點擊和點贊是用戶的主動行為,需要在User Agent中定義一番,。
在這里研究團隊將用戶的點擊行為歸納為一種概率選擇行為,,也就是依據(jù)用戶和新聞之間的匹配度(可以用兩者隱空間內(nèi)的相似度衡量),用戶有一定概率從列表中選擇一些自己感興趣的新聞點開閱讀。
這個定義相比于直接點擊最匹配的新聞具有更好的彈性,,也就是說并不一定匹配度高就會被閱讀,,更符合真實情況一些。
至于點贊行為,,就不能簡單的只考慮新聞的匹配度了,,畢竟眾所周知,標題黨的現(xiàn)象在新聞中還是屢見不鮮的,。
因此研究團隊引入了一個抽象的「新聞質量」的概念來總體上代表一篇新聞報道的價值,,如此一來,用戶的點贊行為便可以通過主觀的興趣和客觀的質量共同刻畫,。
研究團隊采用了期望模型來進行Agent點贊行為的控制,,具體來講,首先基于興趣匹配程度和新聞質量計算出一個用戶閱讀某條新聞的效用(Utility),,如果這個效用超過了用戶的期待(研究團隊用一個超參數(shù)Threshold來代表這個期待的具體值),,那便觸發(fā)點贊行為。
這個設計的直觀解釋就是,,如果一條新聞有讓我爽到,,不管是因為它迎合了我還是它本身的報道十分客觀全面,我便會毫不吝嗇的為他點贊,。
此外在新聞閱讀過程中,,用戶的興趣或者說觀點顯然也不會是一成不變的。
比如說用戶看到了一篇很喜歡的新聞報道,,就有可能激發(fā)用戶對相關新聞的深入挖掘欲望,,與之相反的,如果一篇報道令用戶感覺完全是滿紙荒唐言,,用戶以后再看到類似的報道就不太會再點進去看它的報道細節(jié)了,。
這個現(xiàn)象被研究團隊建模為了一個用戶偏好漂移模型(User-drift Model)。
創(chuàng)作行為建模
接下來建模新聞創(chuàng)作者的創(chuàng)作行為,。
真實世界中的新聞創(chuàng)作會受各種因素的影響,,研究團隊這里將其簡化為一個貪心過程,也就是作者總是希望自己創(chuàng)作的新聞能夠得到更多讀者的認同,。
具體的Agent行為控制研究團隊采用了類似于用戶點擊的方案,,創(chuàng)作者根據(jù)自己創(chuàng)作的新聞在上一輪的點贊情況進行概率抽樣,選出新一輪創(chuàng)作的主題,,然后圍繞主題進行新聞創(chuàng)作,。新聞創(chuàng)作的過程類似的也被建模為隱空間中從以主題為中心的高斯分布中抽樣的過程。
除了新聞的內(nèi)容(隱空間表征),,還需要對新聞的質量進行建模,。這里基于兩條符合現(xiàn)實規(guī)律的基本假設:
1. 作者的獲贊數(shù)與收入存在一個邊際遞減的正相關關系,,也就是作者收到的贊越多收入閱讀,但是隨著贊數(shù)量的提升,,單個贊帶來的收益會逐漸減少,;
2. 收入高的創(chuàng)作者由于預算更充足,會創(chuàng)作出質量更高的新聞,?;诖丝梢詷嫿ㄒ粋€從上一輪獲贊數(shù)到下一輪新聞質量的映射函數(shù),用于控制新聞創(chuàng)作的質量,。
推薦系統(tǒng)建模
最后對推薦系統(tǒng)的行為進行建模,。
算法推薦和冷啟動推薦是新聞推薦系統(tǒng)的兩個基本組件。為了提供個性化的算法推薦,,推薦系統(tǒng)首先利用推薦算法,如BPR等,,從歷史交互數(shù)據(jù)中學習用戶和新聞在嵌入空間中的表示(研究團隊用隱空間Latent Space指代大規(guī)模語言模型編碼的真實用戶興趣空間,,用嵌入空間Embedding Space指代推薦算法學習得到的用于生成推薦列表的空間)。
但是由于用戶點贊行為的不確定性和新聞有效性窗口的限制,,算法推薦不能保證覆蓋所有用戶,,對于這部分缺口,可以通過簡單的隨機推薦予以補全,。
由于缺乏歷史交互記錄,,新創(chuàng)作的新聞同樣無法參與到算法推薦中,SimuLine應用隨機推薦和啟發(fā)式推薦算法(如歷史上喜歡的創(chuàng)作者的新報道)等策略來推薦冷啟動新聞,。
此外,,SimuLine還支持了其他啟發(fā)式新聞推薦策略,如突發(fā)新聞,,基于內(nèi)容創(chuàng)作者的推廣,,以及基于主題的推廣等。
所有的推薦策略均擁有獨立的推送額度,,推薦系統(tǒng)將來自所有渠道的新聞推薦合并形成最終的推薦列表,。
模擬實驗
數(shù)據(jù)已就位!模型已搭建,!接下來進行一番緊張刺激的實驗,!
研究團隊選用了新聞推薦領域廣泛使用的Adressa數(shù)據(jù)集,這個數(shù)據(jù)集提供了挪威新聞網(wǎng)站www.adressa.no在2017年二月某一周的完整網(wǎng)絡日志,,與其他優(yōu)秀的新聞推薦數(shù)據(jù)集(例如微軟的MIND)相比,,它原生提供了十分關鍵的新聞作者信息。相對應的,,語言模型選用了原生支持挪威語的BPEmb,。更多的部署細節(jié)諸位可以參考論文中的第四章第一小節(jié),。
那么該如何去分析SimuLine的模擬結果呢?SimuLine提供了一套多個視角的全面分析框架供君參考,。
首先是最常用的量化指標評估體系,。
為了全面反映新聞推薦生態(tài)系統(tǒng)的演化過程,研究團隊總結了已有文獻中出現(xiàn)過的量化指標,,從以下五個方面構建了一套較為完整的評估體系:
1)互動性,,包括點贊獲贊的數(shù)量及其基尼指數(shù),較低的基尼指數(shù)代表更好的公平性,;
2)覆蓋率,,包括算法推薦所覆蓋的用戶和新聞的數(shù)量;
3) 質量,,包括時效期新聞的平均質量,、獲贊量加權的時效期新聞平均質量以及新聞質量與獲贊量之間的皮爾遜相關系數(shù);
4)同質化,,包括用戶間的Jaccard指數(shù),,數(shù)值越高代表用戶之間的新聞閱讀重合程度越高;
5)匹配度,,包括用戶和他們喜歡的新聞之間的隱空間表征余弦相似度,。
1.生命周期
下面三張圖分別展示了在不同Agent超參數(shù)條件下,用戶,、創(chuàng)作者,、推薦系統(tǒng)的量化評估結果。
可以看到,,模擬的過程和結果在各種超參數(shù)下都是比較穩(wěn)定的,,并且大約以第十輪和第二十輪為分界線(不同指標存在一定的前后浮動),系統(tǒng)的演化呈現(xiàn)出了明顯的階段性(在圖中用藍色的豎線畫出了發(fā)生階段轉換的輪次),,這與著名的生命周期理論相一致,。
由此得到第一個發(fā)現(xiàn):推薦系統(tǒng)驅動的在線新聞社區(qū)在不同的用戶群體下均自然呈現(xiàn)出「啟動」-「成長」-「成熟&衰退」的生命周期。
2.用戶分化
除了量化指標,,可視化也是輔助理解社區(qū)演化過程的重要工具,。
研究團隊通過PCA降維可視化得到了下面這一組系統(tǒng)演化過程的快照(新聞用藍色標示,有點贊記錄的用戶用綠色標示,,沒有點贊記錄的用戶用紅色標示,。節(jié)點大小代表點贊/獲贊的數(shù)量)。
可以看到,,雖然量化指標表現(xiàn)出了多階段的模式,,但隱空間表征的演化趨勢卻是始終如一的,即用戶逐漸分化為圈內(nèi)用戶(in-the-loop users)和圈外用戶(out-the-loop users),。
圈內(nèi)用戶形成了一個興趣趨同的穩(wěn)定社區(qū),,而圈外用戶則呈現(xiàn)出零散的興趣,。
在第10輪和第20輪之間的演化過程中,用戶基本完成了分化,,這表明成長階段對用戶參與有至關重要的決定作用,。
由此得到第二個發(fā)現(xiàn):推薦系統(tǒng)驅動的在線新聞社區(qū)將不可避免地產(chǎn)生社區(qū)話題的趨同,并導致用戶的分化,,其中決定用戶參與的關鍵時期是成長階段,。
3.興趣同化
如前文所說,由于SimuLine通過大規(guī)模預訓練語言模型來構建隱空間,,空間中的每個向量都可以通過相似詞檢索來進行文本解釋,,這有助于通過案例研究了解單個用戶的演變。
研究團隊分別從圈內(nèi)用戶和圈外用戶中隨機抽取了3名用戶,,下面的表格展示了他們的興趣演化過程,。
對于圈內(nèi)用戶來說,他們的興趣愈發(fā)抽象,、廣泛和概括,,例如從「演員」到「工作」,從「奧斯陸」到「挪威」到「歐洲」,。不同用戶的演化速度各不相同,但都在第50輪時趨于一致,。這一現(xiàn)象反映了作為不斷與推薦系統(tǒng)互動的結果,,用戶的偏好從個性化的小眾話題逐漸遷移到平臺上廣泛討論的趨勢性話題。
而對于圈外用戶來說,,他們的興趣略有變化,,但總是集中在特定的和個性化的話題上。例如4號和6號用戶在整個模擬過程中分別對「運動員」,、「茶」和「賬單」保持興趣,。
由此得到第三個發(fā)現(xiàn):在推薦系統(tǒng)驅動的在線新聞社區(qū)中,用戶的個性化興趣在與推薦系統(tǒng)的持續(xù)互動過程中被同化了,。
4.啟動階段
借助上述量化指標,、可視化、文本翻譯三大利器,,SimuLine可以對系統(tǒng)的演化過程進行一次全面體檢,。
既然推薦系統(tǒng)驅動的在線新聞社區(qū)的演化過程符合生命周期理論,那就從生命周期的視角分析一下,,在各個生命階段,,社區(qū)到底是怎么演化的。
首先分析一下大致對應前10輪的啟動階段,。
由于系統(tǒng)是白手起家從零做起,,所以在最開始的階段推薦系統(tǒng)是缺乏數(shù)據(jù)訓練推薦算法的,。相對應的,在這一階段利用隨機推薦和啟發(fā)式推薦解決用戶的冷啟動問題便是首要任務,。
由于無法使用更為準確的算法推薦,,該階段的推薦結果往往在興趣匹配上不盡人意,因此該階段的點贊行為主要由新聞質量驅動,,反映在量化指標上那便是質量和熱度的較強的正相關關系,。
更進一步,便可以定位出啟動階段社區(qū)演化的兩個主要驅動力量:
1)質量反饋回路(Quality feedback loops),,即質量與熱度在正相關關系基礎上的相互促進,,也就是東西越好點贊的人越多,點贊的人越多作者收益越高,,作者收益越高越有動力產(chǎn)出質量更好的新聞報道,;
2)興趣-質量混淆,也就是在積累到足夠準確估計用戶興趣的數(shù)據(jù)量之前,,推薦算法會將質量驅動的點贊行為混淆為因為用戶感興趣而觸發(fā)的行為,。這兩個驅動力量相互促進,使得受歡迎的內(nèi)容創(chuàng)作者獲得逐漸增強的超量曝光(體現(xiàn)為創(chuàng)作者和新聞基尼指數(shù)的上升),,并近一步擠壓用戶個性化興趣的滿足(體現(xiàn)為用戶與其點贊新聞之間隱空間相似度的下降),。但是大多數(shù)用戶仍可以從增強的新聞質量中受益(體現(xiàn)為不斷降低的用戶點贊行為的基尼指數(shù))。
總結一下,,可以得到第四個發(fā)現(xiàn):在啟動階段,,系統(tǒng)從隨機推薦和高質量新聞中積累用于估計用戶興趣的數(shù)據(jù),進而解決冷啟動用戶問題,。質量反饋循環(huán)和興趣-質量混淆通過過度曝光促成了極受歡迎的內(nèi)容創(chuàng)作者的出現(xiàn),。
5.成長階段
隨著數(shù)據(jù)的積累,推薦算法對用戶興趣的估計越來越準確,,點贊行為從質量驅動逐漸轉向興趣驅動,,質量和熱門程度之間的相關性逐漸減弱。隨著模擬輪次的增長,,啟動期創(chuàng)作的新聞逐漸過期并退出推薦候選,,興趣-質量混淆率先開始消散,并逐漸導致質量反饋循環(huán)的最終結束,。
在成長階段,,每個圈內(nèi)用戶臨域內(nèi)的新聞密度是不均勻的,朝向主流新聞主題的方向密度較高,,而其他方向的密度相對較低,。
其結果便是用戶喜歡的新聞在統(tǒng)計上更多的會向主流新聞主題靠攏,這一點贊行為上的細微偏差不斷出現(xiàn),,用戶興趣在持續(xù)的強化作用下也逐漸向主流新聞主題逼近,。
與之相反的是,,圈外用戶陷入了「不點贊-算法推薦無法覆蓋-推薦準確度低-更不會點贊」的僵局。他們偶爾也會因為新聞質量而點贊,,但推薦算法無法在數(shù)據(jù)時效內(nèi)積累到足夠的數(shù)據(jù)估計他們的興趣,。更頻繁和均衡的點贊行為刺激了新聞質量的增長,但由于高質量新聞的受歡迎程度下降,,按獲贊數(shù)量加權的新聞質量總體上保持了穩(wěn)定,。
隨著質量反饋循環(huán)的終止,內(nèi)容創(chuàng)作者無法再獲得超量關注,,從而導致新聞質量的下降,。對質量敏感的用戶可能會因此而不再點贊,進而導致用戶覆蓋率的下滑,。
總結起來,,可以得到第五個發(fā)現(xiàn):在成長階段,圈內(nèi)用戶在分布偏差的作用下向共同話題演化,,而圈外用戶則陷入僵局,,導致了用戶分化。越來越準確的算法推薦導致質量反饋循環(huán)的結束,,社區(qū)因此而喪失了部分質量敏感的用戶,。
6.成熟和衰退階段
在第20輪左右,社區(qū)進入了成熟和衰退階段,,此時大多數(shù)關鍵指標趨于穩(wěn)定,。
在此階段,圈內(nèi)用戶動態(tài)地保持在共同話題的氣泡中,,雖然他們的興趣可能會因為點擊一些不同的新聞而轉移到氣泡的邊緣,但他們很快就會因為密度差而回到中心,。
新聞獲贊的基尼指數(shù)較高,,而內(nèi)容創(chuàng)作者的獲贊基尼指數(shù)較低,說明即使是同一創(chuàng)作者創(chuàng)作的新聞,,其受歡迎程度也存在很大差異,。
除了貪婪的創(chuàng)作機制,新聞創(chuàng)作的過程本身具有高度隨機性,,因此氣泡也呈現(xiàn)出自然的擴張趨勢,。
擴張的氣泡帶來了更多樣化的新聞候選,也導致了部分對話題敏感的用戶逐漸退出,。
由此可以得到第六個發(fā)現(xiàn):在成熟和衰退階段,,圈內(nèi)用戶共享共同的話題,內(nèi)容創(chuàng)作者圍繞這些話題發(fā)布各種新聞,。社區(qū)保持了穩(wěn)定且緩慢的擴張,,但同時也流失了部分對興趣敏感的用戶,。
7.演化是如何發(fā)生的?
發(fā)現(xiàn)一到發(fā)現(xiàn)六回答了研究團隊關注的第一個研究問題:新聞推薦生態(tài)系統(tǒng)(News Recommendation Ecosystems, NREs)生命周期的每個階段有什么特點,?
接下來把所有的知識攏起來,,嘗試回答一下第二個研究問題:驅動NREs演化的關鍵因素有哪些,這些因素是如何彼此作用進而影響進化過程的,?
下面這張圖總結了在線新聞社區(qū)演化的關鍵因素和影響機制,,從中可以發(fā)現(xiàn),重新出現(xiàn)的曝光偏差和死鎖是導致圈內(nèi)用戶和圈外用戶不同演化趨勢的直接原因,,并進一步導致了用戶的分化和話題的趨同,。
重新出現(xiàn)的曝光偏差是由多種因素共同造成的。
首先,,從信息論的角度來看,,推薦算法可以解釋為一個信息壓縮的過程,不可避免地導致流行度偏差,,其中在數(shù)據(jù)集中高頻出現(xiàn)的新聞(也就是點贊多的新聞)被更有效地編碼以提高推薦性能,。反映到社區(qū)的演化過程上,便體現(xiàn)為廣泛討論的共同話題會在算法推薦渠道上搶占個性化話題的曝光資源,。
其次,,由于內(nèi)容創(chuàng)作者的逐利性,他們更有動力圍繞公眾感興趣的話題創(chuàng)作新聞,,這自然而然的會導致新聞發(fā)布密度從大眾話題向個性化話題的降低,。從這個意義上來看,即使全程采用隨機推薦,,社區(qū)也可能由于分布的偏差而朝著主題收斂的方向發(fā)展,。
最后,過濾氣泡和曝光偏差相互促進,,共同導致了用戶潛移默化的興趣轉移,。算法推薦根據(jù)用戶歷史上點贊過的新聞推薦類似的報道,受限的新聞曝光使得曝光偏差更加難以被用戶感知,。
此外,,推薦系統(tǒng)對流行新聞的偏向在不同的演化階段表現(xiàn)出了不同的影響。
在啟動階段,,存在興趣-質量混淆,,新聞質量與流行度之間存在較強的相關性,流行偏向具體表現(xiàn)為高質量新聞曝光度的增強,。
隨著數(shù)據(jù)的積累和算法推薦性能的提升,,與質量驅動相比,點贊行為越來越受興趣驅動,進而削弱了興趣-質量混淆和質量-流行度相關性,。流行偏向也從推薦優(yōu)質新聞逐漸演變?yōu)閱渭兊耐扑]高熱度新聞,。
在這個新舊動能轉換的過程中,培育出一些高人氣同時高質量的新聞話題,,對促進用戶參與具有重要作用,。
總結下來,便可以得到第七個發(fā)現(xiàn):流行偏向,、新聞分布偏差和過濾氣泡共同導致了曝光偏差這一影響用戶差異化和話題收斂的關鍵因素,。高人氣的優(yōu)質新聞對于打破圈外用戶的僵局至關重要。
8.如何避免社區(qū)衰落,?
最后,,借助SimuLine強大的模擬能力和分析能力,再探索一番第三個研究問題:如何通過推薦系統(tǒng)的設計策略,,實現(xiàn)更好的長期多方效用,,從而避免社區(qū)陷入「衰落」?
研究團隊測試了四種最基礎最常見的啟發(fā)式推薦方法:基于訂閱制的新聞冷啟動,、熱搜榜,、話題推廣和創(chuàng)作者推廣。下面三張圖呈現(xiàn)了在基礎推薦系統(tǒng)之上應用上述四種方法的社區(qū)演化結果,。
(1)基于訂閱制的新聞冷啟動試圖在用戶和內(nèi)容創(chuàng)作者之間形成穩(wěn)定的跨輪曝光關系,,從而增強啟動階段出現(xiàn)的質量反饋循環(huán)。但是這種做法導致了嚴重的壟斷,,沒有取得先發(fā)優(yōu)勢的內(nèi)容創(chuàng)作者反而會被質量反饋回路壓制,,破壞了算法覆蓋率和新聞的平均質量,進而使整個社區(qū)生態(tài)的多樣性受到嚴重挑戰(zhàn),。
(2)熱搜榜是最常見的在線社區(qū)組件,,依靠新聞質量和流行度之間的正相關關系,這種方式可以為用戶提供更高質量的新聞推薦,。同時從利用和探索(Exploit&Explore)的角度來看,,閱讀突發(fā)新聞也可以看作是一種突破用戶現(xiàn)有興趣局限的用戶探索,有助于減輕過濾氣泡的負面影響,。
然而,這種方法無法阻止前文中討論的流行度和質量之間相關性的崩潰,,這會導致推薦突發(fā)新聞的有效性下降,。
(3)最后是平臺推廣,通過給特定話題或者特定作者提供額外的曝光額度,,平臺也可以主動地調控推薦的內(nèi)容,。針對內(nèi)容創(chuàng)作者的推廣可以建立起穩(wěn)定的曝光關系,進而利用質量反饋回路培養(yǎng)高人氣的優(yōu)質新聞,。
但與基于訂閱制的新聞冷啟動策略不同的是,,可以在當前質量反饋循環(huán)培育出有害的壟斷之前主動終止推廣,,從而保障了用戶的體驗和創(chuàng)作者的創(chuàng)造力。作為一個獨立于興趣匹配的新聞傳播渠道,,它同樣可以減輕過濾泡沫的負面影響,。此外,通過重建質量反饋回路,,它還將推薦系統(tǒng)對流行新聞的偏向導向對高質量新聞的有益推薦,。
SimuLine在針對特定話題推廣的實驗中隨機選擇話題,也就是說熱門話題與個性化話題有同等的機會被推廣,,因此對于曝光度相對較低的個性化話題,,推廣的影響相對較大。
這個方法理論上可以用于提升圈外用戶的參與度,,但由于推廣新聞的質量無法得到保證,,曝光量難以轉化為獲贊數(shù),導致了該方法效果有限,。
總結起來,,便可以得到第八個發(fā)現(xiàn):在常見的推薦系統(tǒng)設計策略中,針對內(nèi)容創(chuàng)作者的周期性推廣是最有效的,。通過積極構建質量反饋回路,,它可以在整個社區(qū)中營造一波接一波的高人氣高質量的新聞話題,同時平臺可以通過定期的重置來控制壟斷,。
小結
在這篇文章中,,CISL研究團隊設計并開發(fā)了用于剖析新聞推薦生態(tài)系統(tǒng)演化過程的仿真平臺SimuLine,并基于SimuLine對在線新聞社區(qū)的演化過程進行了詳細分析,。
SimuLine 構建了一個很好地反映人類行為的可理解的隱空間,,并在此基礎上通過基于代理的建模對新聞推薦生態(tài)系統(tǒng)進行了細致的模擬。
研究團隊剖析了在線新聞社區(qū)演化的整個生命周期,,包括啟動,、成長、成熟和衰退階段,,并分析了每個階段的特征,,同時提出了一個關系圖來說明演化過程中的關鍵因素和影響機制。
最后,,研究團隊探討了推薦系統(tǒng)設計策略對社區(qū)演化的影響,,包括對訂閱制新聞冷啟動、熱點新聞和平臺推廣的利用,。
未來,,CISL研究團隊會考慮新聞的文本內(nèi)容生成和社交網(wǎng)絡活動的行為建模,以進行更強大更真實的模擬。
研究團隊認為SimuLine也可以作為推薦系統(tǒng)評估的一大利器,,提供在線用戶實驗和基于數(shù)據(jù)集的離線實驗之外的第三種選擇(這也是給它起名為SimuLine的主要原因),。
研究團隊也注意到最近推薦系統(tǒng)研究社區(qū)也提出了一系列的糾偏推薦算法,旨在處理推薦中的曝光偏差問題,,這也是用戶分化和主題收斂的直接原因,。
由于本文側重于討論推薦系統(tǒng)的系統(tǒng)設計而不是具體的推薦算法,研究團隊將這個問題留作一個開放的主題,,并希望 SimuLine 能夠促進未來在這個方向的研究,。
參考資料:https://arxiv.org/abs/2305.14103
轉載自:微信公眾號“新智元”