日前,,實(shí)驗(yàn)室博士生劉家豪作為第一作者的論文Filtering Discomforting Recommendations with Large Language Models被The ACM Web Conference 2025 會(huì)議錄用。
個(gè)性化算法可能會(huì)無(wú)意中將用戶(hù)暴露于令人不適的推薦內(nèi)容中,,從而可能引發(fā)負(fù)面后果,。不適感的主觀性及算法的黑箱特性使得有效識(shí)別和過(guò)濾此類(lèi)內(nèi)容頗具挑戰(zhàn)。為解決這一問(wèn)題,,我們首先開(kāi)展了一項(xiàng)形成性研究,,以了解用戶(hù)在過(guò)濾不適推薦內(nèi)容方面的實(shí)踐與期望。隨后,,我們?cè)O(shè)計(jì)了一款基于大語(yǔ)言模型的工具 DiscomfortFilter,。該工具可為用戶(hù)構(gòu)建可編輯的偏好畫(huà)像,并通過(guò)對(duì)話幫助用戶(hù)表達(dá)過(guò)濾需求,,從而在畫(huà)像中屏蔽不適的偏好,。基于編輯后的畫(huà)像,,DiscomfortFilter以即插即用的方式實(shí)現(xiàn)不適推薦過(guò)濾,,同時(shí)保持靈活性與透明度。構(gòu)建的偏好畫(huà)像能提升大語(yǔ)言模型的推理能力并簡(jiǎn)化用戶(hù)對(duì)齊,,使一個(gè)38 億參數(shù)的開(kāi)源大語(yǔ)言模型在離線代理任務(wù)中可與頂尖商業(yè)模型媲美,。為期一周、包含 24 名參與者的用戶(hù)研究驗(yàn)證了DiscomfortFilter的有效性,,同時(shí)表明該工具通過(guò)調(diào)控內(nèi)容暴露,,有效減少了平臺(tái)推薦結(jié)果中的不適內(nèi)容。最后,,我們討論了當(dāng)前面臨的挑戰(zhàn),,強(qiáng)調(diào)其與更廣泛研究領(lǐng)域的關(guān)聯(lián)性,評(píng)估對(duì)各利益相關(guān)方的影響,,并展望未來(lái)的研究方向,。
會(huì)議簡(jiǎn)介
The ACM Web Conference (WWW) 是一年一度的國(guó)際會(huì)議,探討萬(wàn)維網(wǎng)的未來(lái)發(fā)展方向,,是中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦的交叉/新興/綜合領(lǐng)域的 A 類(lèi)國(guó)際學(xué)術(shù)會(huì)議,。該會(huì)議旨在為全球提供一個(gè)頂級(jí)論壇,以討論和辯論 Web 的演進(jìn),、相關(guān)技術(shù)的標(biāo)準(zhǔn)化,,以及這些技術(shù)對(duì)社會(huì)和文化的影響,。大會(huì)匯聚了研究人員、開(kāi)發(fā)者,、用戶(hù)和商業(yè)機(jī)構(gòu)——所有對(duì) Web 及其潛力充滿(mǎn)熱情的人士,。今年,該會(huì)議計(jì)劃于 2025 年 4 月 28 日至 5 月 2 日在澳大利亞悉尼召開(kāi),。本屆WWW會(huì)議共收到2062篇有效投稿,,其中409篇論文被接收,錄用率19.8%,。
論文簡(jiǎn)介
用大語(yǔ)言模型過(guò)濾令人不適的推薦內(nèi)容
論文鏈接:https://arxiv.org/abs/2410.05411
代碼倉(cāng)庫(kù):https://github.com/Hsyy04/PersonaBuddy
個(gè)性化算法通過(guò)分析用戶(hù)偏好來(lái)提供定制化內(nèi)容,,從而支持用戶(hù)決策,在各類(lèi)網(wǎng)絡(luò)平臺(tái)上已成為不可或缺的工具,。盡管這些算法旨在提升用戶(hù)體驗(yàn),,但它們可能無(wú)意間向用戶(hù)推薦令人不適的內(nèi)容。例如,,如果用戶(hù)搜索與健康相關(guān)的敏感話題,,算法可能會(huì)推薦相關(guān)的健康產(chǎn)品,這可能被用戶(hù)視為對(duì)隱私的侵犯,,從而引發(fā)不適,。同樣,當(dāng)用戶(hù)處于情緒低落的狀態(tài)(如剛經(jīng)歷分手),,缺乏情境感知能力的算法可能會(huì)推薦喚起痛苦回憶的內(nèi)容,從而加劇用戶(hù)的情緒困擾,。這些推薦不僅可能無(wú)法吸引用戶(hù),,甚至可能帶來(lái)焦慮、不安或痛苦等負(fù)面情緒后果,。不適感的感知極具主觀性,,也就是說(shuō),一個(gè)用戶(hù)認(rèn)為有趣的內(nèi)容,,可能會(huì)讓另一個(gè)用戶(hù)感到不適,。這種主觀性凸顯了對(duì)不適內(nèi)容識(shí)別方法的迫切需求,即方法需要更加細(xì)致入微,,并能更好地貼合個(gè)體用戶(hù)的體驗(yàn),。
在本文中,我們旨在設(shè)計(jì)一款幫助用戶(hù)過(guò)濾不適推薦內(nèi)容的工具,。這一任務(wù)面臨兩個(gè)關(guān)鍵挑戰(zhàn):(1) 用戶(hù)對(duì)不適內(nèi)容的感知高度主觀,;(2) 推薦此類(lèi)內(nèi)容的算法通常是黑箱系統(tǒng)。如圖 1 所示,,我們將問(wèn)題形式化如下:黑箱個(gè)性化算法根據(jù)推測(cè)的用戶(hù)偏好畫(huà)像(通常隱含在嵌入表示中)向用戶(hù)推薦內(nèi)容,,我們的目標(biāo)是識(shí)別并過(guò)濾用戶(hù)主觀認(rèn)為不適的內(nèi)容,。由于算法系統(tǒng)的不透明性,用戶(hù)的偏好畫(huà)像既難以理解也無(wú)法編輯,,使用戶(hù)難以影響算法的決策,。
圖1 問(wèn)題定義
形成性研究
為指導(dǎo)設(shè)計(jì)過(guò)程,我們首先開(kāi)展了一項(xiàng)形成性研究,,以深入了解當(dāng)前現(xiàn)狀及用戶(hù)的需求與期待,。通過(guò)半結(jié)構(gòu)化訪談,我們識(shí)別了導(dǎo)致不適推薦的幾個(gè)關(guān)鍵因素,,包括:(1) 用戶(hù)行為的偏離,。用戶(hù)的搜索和點(diǎn)擊行為可能受到好奇心驅(qū)動(dòng)或點(diǎn)擊誘導(dǎo)(如標(biāo)題黨)的影響,導(dǎo)致推薦算法誤判其長(zhǎng)期興趣,,從而構(gòu)建出偏差的用戶(hù)偏好模型,。例如,一位參與者提到:“出于好奇,,我曾經(jīng)搜索過(guò)成人用品,,現(xiàn)在這些內(nèi)容一直出現(xiàn)在我的推薦里,太尷尬了,。”(2) 算法建模偏差,。個(gè)性化算法難以全面捕捉用戶(hù)的細(xì)微興趣和實(shí)際使用情境,可能導(dǎo)致推薦內(nèi)容在不合適的時(shí)間出現(xiàn),。例如,,有參與者表示:“晚上刷到恐怖內(nèi)容太嚇人了,雖然我白天會(huì)看,。”(3) 不同利益相關(guān)方的沖突,。平臺(tái)通常會(huì)優(yōu)先推薦能夠提高用戶(hù)參與度的內(nèi)容,即使這些內(nèi)容可能引發(fā)不適,。有多名參與者提到,,他們察覺(jué)到平臺(tái)在個(gè)性化推薦中的商業(yè)目標(biāo)可能與用戶(hù)的舒適體驗(yàn)存在沖突。
在此基礎(chǔ)上,,我們進(jìn)一步分析了當(dāng)前反饋機(jī)制(即“不感興趣”按鈕)的局限性,,主要體現(xiàn)在以下三個(gè)方面:(1) 個(gè)性化程度不足。由于反饋選項(xiàng)過(guò)于模糊,,用戶(hù)難以準(zhǔn)確表達(dá)具體的過(guò)濾原因,,可能導(dǎo)致本可以接受的內(nèi)容被誤刪。(2) 缺乏靈活性,。用戶(hù)可能只是暫時(shí)希望隱藏某類(lèi)內(nèi)容,,但使用反饋后,這些內(nèi)容可能會(huì)被永久性移除。(3) 透明度缺失,。用戶(hù)無(wú)法確定平臺(tái)是否真正采納了自己的反饋,,導(dǎo)致對(duì)反饋機(jī)制的有效性缺乏信任。
基于上述發(fā)現(xiàn),,我們通過(guò)參與式設(shè)計(jì)討論,,總結(jié)并提出了四個(gè)關(guān)鍵設(shè)計(jì)目標(biāo),以指導(dǎo)工具的開(kāi)發(fā):(1) 支持對(duì)話式配置,。多數(shù)參與者表示,,他們更傾向于使用自然語(yǔ)言表達(dá)過(guò)濾需求,因?yàn)檫@樣“不會(huì)受到預(yù)設(shè)選項(xiàng)的限制”,,并且“可以更準(zhǔn)確,、更個(gè)性化地表達(dá)”。此外,,多名參與者希望能夠通過(guò)與工具對(duì)話的方式配置過(guò)濾規(guī)則,,因?yàn)檫@種方式“更加自然”。(2) 提供偏好解釋,。當(dāng)輸入方式從預(yù)設(shè)選項(xiàng)轉(zhuǎn)向開(kāi)放式對(duì)話時(shí),,部分參與者表示,他們?cè)谥鲃?dòng)表達(dá)過(guò)濾需求時(shí)會(huì)感到困難,。然而,,所有參與者都認(rèn)同,如果能夠理解平臺(tái)推薦所反映的偏好以及自身的行為模式,,就更容易精準(zhǔn)表達(dá)過(guò)濾需求,。例如,一位參與者提到:“如果我能先查看自己的偏好,,再對(duì)不準(zhǔn)確的部分進(jìn)行有針對(duì)性的反饋,,那就太好了。”(3) 提供反饋渠道,。所有參與者均希望工具具備透明性,并允許用戶(hù)對(duì)過(guò)濾結(jié)果提出異議,。能夠查看被過(guò)濾內(nèi)容及其原因,,有助于“增強(qiáng)對(duì)工具的信任”,而支持用戶(hù)調(diào)整過(guò)濾規(guī)則則可以“優(yōu)化過(guò)濾需求”,。(4) 以即插即用的方式運(yùn)行,。即插即用模式意味著該工具可以獨(dú)立于特定的個(gè)性化算法運(yùn)行,并直接影響算法的輸出,。支持該模式的關(guān)鍵因素包括:參與者意識(shí)到他們的過(guò)濾需求是動(dòng)態(tài)變化的,,因?yàn)?ldquo;不同情境下,不適內(nèi)容的標(biāo)準(zhǔn)也會(huì)變化”;多名參與者強(qiáng)調(diào),,該工具應(yīng)由用戶(hù)自主掌控,,使其能夠“跨平臺(tái)使用”;參與者更關(guān)注個(gè)性化推薦所帶來(lái)的不適,,而非算法的具體工作機(jī)制,。
系統(tǒng)設(shè)計(jì)
鑒于大語(yǔ)言模型(LLM)在自然語(yǔ)言理解、推理和生成方面的能力,,我們認(rèn)為 LLM 為實(shí)現(xiàn)這些設(shè)計(jì)目標(biāo)提供了有前景的解決方案,。為此,我們?cè)O(shè)計(jì)了一款基于 LLM 的工具 DiscomfortFilter,,專(zhuān)門(mén)用于幫助用戶(hù)過(guò)濾不適推薦內(nèi)容,。圖 2 展示了 DiscomfortFilter 的工作流程:(1) DiscomfortFilter 根據(jù)用戶(hù)的個(gè)性化感知識(shí)別算法推薦的內(nèi)容,整合用戶(hù)的成對(duì)偏好,,并對(duì)其進(jìn)行排序,,以構(gòu)建可理解且可編輯的個(gè)性化偏好畫(huà)像;(2) 通過(guò)引導(dǎo)式對(duì)話,,DiscomfortFilter 幫助用戶(hù)表達(dá)個(gè)性化的過(guò)濾需求,,并在畫(huà)像中屏蔽不適的偏好;(3) 基于編輯后的偏好畫(huà)像,,DiscomfortFilter 以即插即用的方式過(guò)濾不適推薦,,確保用戶(hù)所見(jiàn)內(nèi)容不再包含令人不適的元素。此外,,DiscomfortFilter 還向用戶(hù)提供過(guò)濾日志(步驟 3),,幫助用戶(hù)進(jìn)一步完善過(guò)濾需求,類(lèi)似于步驟 2,??傮w而言,DiscomfortFilter 使用戶(hù)能夠主動(dòng)影響個(gè)性化算法的決策,,增強(qiáng)對(duì)算法的掌控力,。
圖2 DiscomfortFilter的工作流程
圖 3 展示了在引入DiscomfortFilter之前,個(gè)性化算法向用戶(hù)呈現(xiàn)內(nèi)容的流程,。這些算法會(huì)分析用戶(hù)行為,,以推薦內(nèi)容,其中可能包含讓用戶(hù)感到不適的內(nèi)容,。最終,,系統(tǒng)將個(gè)性化推薦的內(nèi)容直接呈現(xiàn)在用戶(hù)設(shè)備上,供用戶(hù)被動(dòng)消費(fèi),。
圖3 引入DiscomfortFilter前個(gè)性化算法向用戶(hù)呈現(xiàn)內(nèi)容的流程
圖 4 的上半部分展示了在引入 DiscomfortFilter 之后,,個(gè)性化算法如何向用戶(hù)呈現(xiàn)內(nèi)容。通過(guò)在原有的推薦流程中集成內(nèi)容過(guò)濾模塊(Content Filter Module),DiscomfortFilter 能夠移除不適內(nèi)容,,確保最終呈現(xiàn)給用戶(hù)的僅為非不適內(nèi)容,。不適內(nèi)容的識(shí)別依據(jù)用戶(hù)自定義的過(guò)濾規(guī)則,使用戶(hù)能夠?qū)?nèi)容推薦過(guò)程進(jìn)行控制,。過(guò)濾規(guī)則以自然語(yǔ)言形式存在,,對(duì) DiscomfortFilter 的運(yùn)行至關(guān)重要。圖 4 的下半部分展示了用戶(hù)如何配置這些規(guī)則,。用戶(hù)可以直接管理這些規(guī)則(綠色箭頭),,或者使用過(guò)濾需求發(fā)現(xiàn)模塊(Filtering Needs Discovery Module)通過(guò)對(duì)話方式進(jìn)行規(guī)則配置(藍(lán)色箭頭)。該對(duì)話代理采用兩種策略來(lái)幫助用戶(hù)識(shí)別過(guò)濾需求:第一種策略基于偏好畫(huà)像構(gòu)建模塊(Preference Profile Construction Module)構(gòu)建的偏好畫(huà)像,,第二種策略基于內(nèi)容過(guò)濾模塊(Content Filter Module)的過(guò)濾記錄,。候選規(guī)則生成模塊(Candidate Rule Generation Module)通過(guò)對(duì)話分析用戶(hù)的過(guò)濾需求,并將其轉(zhuǎn)換為管理過(guò)濾規(guī)則的操作,,用戶(hù)隨后可以編輯和確認(rèn)這些規(guī)則,。
圖4 DiscomfortFilter的細(xì)節(jié)設(shè)計(jì)
各模塊具體的細(xì)節(jié)請(qǐng)參考原文,這里,,我們僅介紹偏好畫(huà)像構(gòu)建模塊,。該模塊通過(guò)分析用戶(hù)按時(shí)間順序?qū)ν扑]內(nèi)容的點(diǎn)擊行為來(lái)構(gòu)建用戶(hù)偏好畫(huà)像。該過(guò)程與傳統(tǒng)的個(gè)性化算法研究有三個(gè)關(guān)鍵區(qū)別:(1) 它僅基于單個(gè)用戶(hù)的行為建模偏好,,而不是所有用戶(hù)的行為,;(2) 它通過(guò)捕捉用戶(hù)點(diǎn)擊的內(nèi)容以及用戶(hù)選擇忽略的推薦項(xiàng),提供更全面的隱式反饋,;(3) 它必須實(shí)時(shí)執(zhí)行,,能夠即時(shí)響應(yīng)用戶(hù)的點(diǎn)擊。該過(guò)程的關(guān)鍵在于,,將用戶(hù)對(duì)推薦內(nèi)容的點(diǎn)擊行為總結(jié)為由特征組成的偏好畫(huà)像,,并在一段時(shí)間內(nèi)保持該畫(huà)像的更新。如圖 5 所示,,我們提出了一種基于 LLM 的多智能體流水線來(lái)完成這一過(guò)程,。我們采用了成對(duì)排序?qū)W習(xí)(pairwise rank learning)的一般假設(shè)——當(dāng)兩個(gè)內(nèi)容同時(shí)展示時(shí),被點(diǎn)擊的內(nèi)容對(duì)用戶(hù)更具吸引力,。對(duì)于每個(gè)被點(diǎn)擊的內(nèi)容(記為 pos,,表示正樣本),該模塊會(huì)隨機(jī)抽取一個(gè)同時(shí)出現(xiàn)但未被點(diǎn)擊的內(nèi)容作為負(fù)樣本(記為 neg),,然后構(gòu)造一個(gè)有序?qū)?,。需要注意的是,,pos 和 neg 均為未經(jīng)處理的原始內(nèi)容,。隨后,該有序?qū)?huì)進(jìn)入流水線進(jìn)行處理。
圖5 偏好畫(huà)像構(gòu)建模塊
處理流程:(1)感知代理(Perceive Agent)從用戶(hù)的角度識(shí)別 pos 和 neg,,并基于當(dāng)前的偏好畫(huà)像分析用戶(hù)為何點(diǎn)擊 pos 而忽略 neg,。不同用戶(hù)對(duì)同一內(nèi)容的關(guān)注點(diǎn)不同,因此,,結(jié)合用戶(hù)的偏好畫(huà)像,,感知代理能夠準(zhǔn)確識(shí)別對(duì)用戶(hù)最重要的特征。(2)摘要代理(Summary Agent)從感知代理的分析中提取用戶(hù)選擇 pos 而非 neg 的原因,,并歸納出 m 個(gè) pos feature 和 n 個(gè) neg feature,。然后,通過(guò)笛卡爾積構(gòu)造 m×n 個(gè)有序?qū)?,,表示在每個(gè)特征對(duì)中,,用戶(hù)更傾向于 pos feature 而非 neg feature。這些有序?qū)γ枋隽颂卣髦g的偏好排序關(guān)系,,是用戶(hù)偏好建模的基礎(chǔ),。(3)反思代理(Reflect Agent)維護(hù)一個(gè)有向圖,其中邊的方向從 neg feature 指向 pos feature,,邊的權(quán)重表示每個(gè)對(duì)的出現(xiàn)頻率,。當(dāng)收到摘要代理傳遞的特征對(duì)時(shí),它首先合并相似的特征節(jié)點(diǎn),,然后將它們整合進(jìn)圖中,。在合并過(guò)程中,首先基于語(yǔ)義相似性識(shí)別候選特征,,隨后利用 LLM 生成最終的合并結(jié)果,。這個(gè)有向圖將每次用戶(hù)點(diǎn)擊產(chǎn)生的獨(dú)立有序?qū)M(jìn)行整合,從而通過(guò)全面的結(jié)構(gòu)信息建模用戶(hù)偏好,。(4)通過(guò) PageRank 算法對(duì)特征節(jié)點(diǎn)進(jìn)行排序,,以得到全面的偏好排名。排名較高的特征通常更符合用戶(hù)興趣,,而排名較低的特征則可能不那么相關(guān),。
該模塊具有三個(gè)特性:(1)偏好畫(huà)像是基于特征構(gòu)建的(而非原始內(nèi)容)。(2)通過(guò)個(gè)性化的內(nèi)容感知來(lái)提取特征,。(3)采用 PageRank 算法對(duì)特征進(jìn)行全局排序,。這種偏好畫(huà)像能夠優(yōu)化 LLM 的推理過(guò)程,并顯著降低 LLM 對(duì)齊用戶(hù)偏好的難度,。最終,,構(gòu)建的偏好畫(huà)像會(huì)被存儲(chǔ),并發(fā)送至過(guò)濾需求發(fā)現(xiàn)模塊,,以增強(qiáng)對(duì)話代理的個(gè)性化能力,,并向用戶(hù)提供清晰的解釋,。
評(píng)估
我們?cè)陔x線代理任務(wù)中驗(yàn)證了構(gòu)建的偏好畫(huà)像的有效性。結(jié)果如圖 6 所示,,構(gòu)造的偏好畫(huà)像能夠增強(qiáng) LLM 的推理能力,,顯著降低用戶(hù)對(duì)齊的難度,使一個(gè) 38 億參數(shù)的開(kāi)源LLM在離線任務(wù)中可與頂級(jí)商業(yè)模型媲美,。
圖6 線下代理實(shí)驗(yàn)結(jié)果
此外,,我們還在知乎上開(kāi)展了一項(xiàng)為期一周的用戶(hù)研究,共有 24 名參與者,。研究結(jié)果表明,,我們的設(shè)計(jì)目標(biāo)能夠有效幫助用戶(hù)表達(dá)過(guò)濾需求,并成功過(guò)濾不適推薦內(nèi)容,,而 DiscomfortFilter 在這些方面表現(xiàn)良好,。我們進(jìn)一步分析了 DiscomfortFilter 如何通過(guò)影響不適內(nèi)容的曝光來(lái)改變平臺(tái)推薦結(jié)果。假設(shè) DiscomfortFilter 使用過(guò)濾規(guī)則處理 N 個(gè)內(nèi)容,,其中 n 個(gè)內(nèi)容被識(shí)別為令人不適,,我們定義 n/N 為該規(guī)則的過(guò)濾負(fù)擔(dān)。在為期七天的用戶(hù)研究中,,我們計(jì)算了所有在五天以上仍然有效的過(guò)濾規(guī)則的每日平均過(guò)濾負(fù)擔(dān),。從配置這些規(guī)則的當(dāng)天起,日均過(guò)濾負(fù)擔(dān)的趨勢(shì)如圖 7 所示,。隨著時(shí)間的推移,,過(guò)濾負(fù)擔(dān)穩(wěn)步下降,這表明平臺(tái)逐漸減少了推薦令人不適的內(nèi)容,。這一下降可以歸因于 DiscomfortFilter 的引入,,它減少了用戶(hù)接觸令人不適的推薦,從而導(dǎo)致用戶(hù)與此類(lèi)內(nèi)容的互動(dòng)減少,。因此,,平臺(tái)的推薦系統(tǒng)能夠動(dòng)態(tài)調(diào)整以適應(yīng)用戶(hù)不斷變化的偏好,進(jìn)一步降低推薦令人不適內(nèi)容的可能性,。需要強(qiáng)調(diào)的是,,從用戶(hù)的角度來(lái)看,令人不適的推薦會(huì)立即消失,,因?yàn)樗鼈儽煌耆^(guò)濾掉了,。
圖7 平均過(guò)濾負(fù)擔(dān)變化
討論
① 使用LLM過(guò)濾令人不適推薦的挑戰(zhàn)
我們的評(píng)估發(fā)現(xiàn),在利用大語(yǔ)言模型(LLMs)過(guò)濾令人不適的推薦內(nèi)容時(shí),,存在兩個(gè)主要挑戰(zhàn):(1)LLMs 的錯(cuò)誤關(guān)聯(lián),。盡管經(jīng)過(guò)精心設(shè)計(jì),LLMs 有時(shí)仍會(huì)將本不令人不適的推薦誤判為包含令人不適的元素,,從而導(dǎo)致意外的排除,。LLMs 的聯(lián)想能力雖然提升了創(chuàng)造力,,但在為用戶(hù)做決策時(shí)需要更加謹(jǐn)慎的控制。(2)感知對(duì)齊不足,。盡管我們?cè)谄卯?huà)像構(gòu)建模塊上下了很大功夫,LLMs 仍難以充分理解用戶(hù)的主觀體驗(yàn),,從而削弱了偏好解釋的有效性,。讓 LLMs 從“看到用戶(hù)所見(jiàn)”過(guò)渡到“感知用戶(hù)所感”之間,仍存在顯著差距,。
② 與推薦系統(tǒng)研究的相關(guān)性
近期的推薦系統(tǒng)研究日益重視用戶(hù)體驗(yàn),。推薦遺忘(recommendation unlearning)是一種使模型遺忘特定用戶(hù)興趣的過(guò)程,有助于提升透明性與可控性,。上下文感知推薦通過(guò)更準(zhǔn)確地建模上下文因素來(lái)提升用戶(hù)滿(mǎn)意度,。減偏推薦則通過(guò)強(qiáng)化多樣性與公平性來(lái)應(yīng)對(duì)信息繭房的問(wèn)題。我們的研究強(qiáng)調(diào)了推薦系統(tǒng)設(shè)計(jì)中的“以人為本”理念,,進(jìn)一步擴(kuò)展了以往以算法設(shè)計(jì)為主的研究方向,。當(dāng)前的大多數(shù)推薦遺忘技術(shù)只能實(shí)現(xiàn)近似遺忘,而將其與 DiscomfortFilter 相結(jié)合后,,可以實(shí)現(xiàn)精確的興趣遺忘,。傳統(tǒng)的上下文感知推薦通常只依賴(lài)被動(dòng)收集的數(shù)據(jù)(如時(shí)空信息),而與 DiscomfortFilter 結(jié)合后,,更能滿(mǎn)足用戶(hù)的個(gè)性化需求,。近期研究還表明,用戶(hù)所感知的多樣性并不能僅通過(guò)提供多樣化推薦來(lái)實(shí)現(xiàn),,而是依賴(lài)于用戶(hù)的主動(dòng)探索,。盡管我們尚無(wú)法確定本研究對(duì)信息繭房的具體影響,但我們相信,,在適當(dāng)?shù)囊龑?dǎo)下,,DiscomfortFilter 有助于提升用戶(hù)對(duì)推薦內(nèi)容的理解,從而主動(dòng)跳出信息繭房,。
③ 對(duì)平臺(tái)的潛在影響
盡管 DiscomfortFilter 并不直接修改平臺(tái)的推薦算法,,但它會(huì)影響用戶(hù)所接觸到的內(nèi)容。這種影響可能會(huì)改變用戶(hù)行為,,進(jìn)而間接影響平臺(tái)的數(shù)據(jù)收集和用戶(hù)建模,。我們認(rèn)為這種影響是積極的,主要基于兩個(gè)原因:第一,,研究表明,,即使是對(duì)推薦內(nèi)容的輕微控制,也能顯著提升用戶(hù)的參與意愿,。DiscomfortFilter 賦予用戶(hù)更大的控制權(quán),,有助于建立信任,,并提升他們使用平臺(tái)的意愿。第二,,避免記錄用戶(hù)與令人不適推薦內(nèi)容的交互行為,,可以幫助平臺(tái)更準(zhǔn)確地建模用戶(hù)畫(huà)像。
④ 研究的局限性與未來(lái)方向
我們從以下四個(gè)方面闡述了研究的局限性與潛在改進(jìn)方向:(1)性能方面:兩個(gè)挑戰(zhàn)主要源于大語(yǔ)言模型(LLMs)與用戶(hù)之間缺乏對(duì)齊,。一個(gè)可能的解決方案是引入交互式驗(yàn)證過(guò)程,,根據(jù)用戶(hù)反饋調(diào)整 LLMs 的行為,使其更貼合用戶(hù)需求,。(2)功能方面:本研究目前僅關(guān)注用戶(hù)的點(diǎn)擊行為和文本內(nèi)容,。未來(lái)可以拓展至其他用戶(hù)行為和多模態(tài)內(nèi)容的整合。同時(shí),,也亟需一個(gè)高效的規(guī)則管理機(jī)制來(lái)支持更復(fù)雜的個(gè)性化需求,。(3)評(píng)估方面:本次研究的參與者大多具有本科學(xué)歷,且僅在單一平臺(tái)上進(jìn)行了為期一周的評(píng)估,。因此,,需要開(kāi)展更大規(guī)模的部署,進(jìn)行更長(zhǎng)期,、覆蓋更廣泛人群與多平臺(tái)的評(píng)估,。(4)應(yīng)用方面:DiscomfortFilter 有潛力擴(kuò)展至其他場(chǎng)景,例如家長(zhǎng)監(jiān)管和兒童網(wǎng)絡(luò)內(nèi)容控制,。這類(lèi)應(yīng)用需要進(jìn)行有針對(duì)性的設(shè)計(jì),,并充分考慮法律與倫理問(wèn)題。
總結(jié)
本研究的主要貢獻(xiàn)如下:
- 我們通過(guò) 15 名參與者的形成性研究,,分析了當(dāng)前不適推薦過(guò)濾的現(xiàn)狀及用戶(hù)期望,。
- 我們?cè)O(shè)計(jì)了一款基于 LLM 的工具 DiscomfortFilter 來(lái)幫助用戶(hù)過(guò)濾不適推薦內(nèi)容。據(jù)我們所知,,這是首次在這一重要任務(wù)中利用 LLM,。
- 我們通過(guò)離線代理實(shí)驗(yàn)和用戶(hù)研究評(píng)估了 DiscomfortFilter,結(jié)果表明該工具能夠有效幫助用戶(hù)表達(dá)過(guò)濾需求并成功過(guò)濾不適推薦內(nèi)容,。
- 我們討論了使用 LLM 過(guò)濾不適推薦的挑戰(zhàn)與機(jī)遇,,并探討了其更廣泛的影響。
作者信息
如果您對(duì)本文內(nèi)容感興趣的話,,可以與作者聯(lián)系:
劉家豪 復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院協(xié)同信息與系統(tǒng)實(shí)驗(yàn)室 博士研究生
研究方向:推薦系統(tǒng),,人機(jī)交互,大語(yǔ)言模型
聯(lián)系方式:[email protected]
實(shí)驗(yàn)室相關(guān)論文
[1] Jiahao Liu, Dongsheng Li, Hansu Gu, Peng Zhang, Tun Lu, Li Shang and Ning Gu. Unbiased Collaborative Filtering with Fair Sampling. SIGIR 2025.
[2] Jiahao Liu*, Xueshuo Yan*, Dongsheng Li, Guangping Zhang, Hansu Gu, Peng Zhang, Tun Lu, Li Shang and Ning Gu. Improving LLM-powered Recommendations with Personalized Information. SIGIR 2025.
[3] Jiahao Liu, Dongsheng Li, Hansu Gu, Tun Lu, Peng Zhang, Li Shang and Ning Gu. Triple Structural Information Modelling for Accurate, Explainable and Interactive Recommendation. SIGIR 2023.
[4] Yubo Shu, Haonan Zhang, Hansu Gu, Peng Zhang, Tun Lu, Dongsheng Li, Ning Gu. RAH! RecSys–Assistant–Human: A Human-Centered Recommendation Framework With LLM Agents. TCSS 2024.
[5] Yaqiong Li, Peng Zhang, Hansu Gu, Tun Lu, Siyuan Qiao, Yubo Shu, Yiyang Shao, Ning Gu. DeMod: A Holistic Tool with Explainable Detection and Personalized Modification for Toxicity Censorship. CSCW 2025.
[6] Wenxin Zhao, Fangyu Yu, Peng Zhang, Hansu Gu, Lin Wang, Siyuan Qiao, Tun Lu, Ning Gu. YouthCare: Building a Personalized Collaborative Video Censorship Tool to Support Parent-Child Joint Media Engagement. CHI 2025.
[7] Baoxi Liu, Peng Zhang, Yubo Shu, Zhengqing Guan, Tun Lu, Hansu Gu, Ning Gu. Building a Personalized Model for Social Media Textual Content Censorship. CSCW 2022.
如果您對(duì)我們實(shí)驗(yàn)室的相關(guān)工作感興趣,,歡迎訪問(wèn)我們的網(wǎng)站:
協(xié)同信息與系統(tǒng)(CISL)實(shí)驗(yàn)室
實(shí)驗(yàn)室網(wǎng)站主頁(yè):https://cscw.fudan.edu.cn/
實(shí)驗(yàn)室Github主頁(yè):https://github.com/FudanCISL
評(píng)論 0