隨著大模型技術(shù)的不斷發(fā)展,,人工智能領(lǐng)域?qū)σ蚬P(guān)系理解和推理的需求日益增長,。大模型在識別因果關(guān)系、判斷因果方向,、提供解釋以及進行推薦等方面展現(xiàn)出巨大潛力,。然而,如何準確實現(xiàn)和應(yīng)用這些能力仍面臨諸多挑戰(zhàn),,如數(shù)據(jù)偏見,、模型可解釋性以及跨領(lǐng)域適應(yīng)性等。為了深入探討這一前沿話題,中國計算機學(xué)會(CCF)青年計算機科技論壇(YOCSEF)廣州分論壇于2025年3月22日舉辦了題為“大模型與因果推斷”的技術(shù)論壇,。論壇邀請了大模型與因果推斷領(lǐng)域的資深學(xué)者,,分享他們在相關(guān)科技前沿取得的最新成果,并圍繞可解釋性在大模型技術(shù)的應(yīng)用,、知識推理與多智能體協(xié)同以及因果推斷在工業(yè)界的應(yīng)用等熱點話題展開深入探討,,為人工智能的發(fā)展探索新的方向。
本次論壇由CCF主辦,,YOCSEF廣州學(xué)術(shù)委員會組織,YOCSEF廣州現(xiàn)任AC委員陳炳豐(廣東工業(yè)大學(xué))和YOCSEF廣州現(xiàn)任AC委員,、候任副主席朱鑒(廣東工業(yè)大學(xué))共同擔(dān)任執(zhí)行主席,,廣州唐邦信息科技有限公司、荔峰科技(廣州)有限公司提供贊助支持,。此次論壇邀請了華南理工大學(xué)教授黃翰,、上海交通大學(xué)長聘副教授張拳石、中山大學(xué)副教授王可澤擔(dān)任引導(dǎo)嘉賓,;廣東工業(yè)大學(xué)教授蔡瑞初,、中山大學(xué)教授權(quán)小軍、廣東外語外貿(mào)大學(xué)副教授顏學(xué)明擔(dān)任思辨嘉賓,。
汕頭大學(xué)校長郝志峰教授,,廣東金融學(xué)院副校長、CCF廣州分部主席黃瓊,、YOCSEF總部候任主席賀瑞君(人民郵電出版社),,YOCSEF總部候任副主席鄢興雨(北京智譜華章科技有限公司),YOCSEF南京主席吳天星(東南大學(xué)),,YOCSEF廈門主席周奕毅(廈門大學(xué)),,CCF廣州分部副主席楊育斌,CCF廣州分部秘書長吳一冰(賽爾網(wǎng)絡(luò)),,YOCSEF廣州往屆主席譚臺哲(廣東工業(yè)大學(xué)),、黃書強(暨南大學(xué))、黃棟(華南農(nóng)業(yè)大學(xué)),、龍錦益(暨南大學(xué)),,現(xiàn)任主席李冠彬(中山大學(xué)),往屆副主席高靜(廣東恒電信息科技股份有限公司),、許正強(廣州職贏未來信息科技有限公司),,往屆優(yōu)秀AC劉雷(廣東科技報),現(xiàn)任副主席,、候任主席蘇申(廣州大學(xué)),,現(xiàn)任副主席黃培濤(廣州唐邦信息科技有限公司),現(xiàn)任學(xué)術(shù)秘書陳俊穎(華南理工大學(xué))、姜思羽(廣東外語外貿(mào)大學(xué)),,往屆AC委員藍連濤(華南農(nóng)業(yè)大學(xué)),,現(xiàn)任AC委員劉偉莉(廣東技術(shù)師范大學(xué))、張帆(云米),、李雯霖(廣東財經(jīng)大學(xué)),,候任AC委員崔金榮(華南農(nóng)業(yè)大學(xué)),廣州大學(xué)教授仇晶,、荔峰科技(廣州)有限公司總經(jīng)理肖茂財,,廣東灣聚科技發(fā)展有限公司總經(jīng)理蔡少東,香港中文大學(xué)(深圳)李鎮(zhèn),,劉陽,、陳澤川、劉名威,、呂子鈺,、湯子逸、萬文韜,、吳賀豐,、張巨聲、廖巧麗,、閆恩亮,、李勇軍、林浚,、張祺,、張峻濤、龐科健,、海鈺佳,、雷浩等來自廣東地區(qū)多所高校及企事業(yè)單位共70多人參加了此次論壇。
在論壇開幕環(huán)節(jié),,首先由本次論壇執(zhí)行主席陳炳豐和朱鑒逐一介紹與會嘉賓,,并詳細闡述了本次論壇的背景。論壇聚焦于探討大模型與因果推理之間的相互關(guān)系,,以及二者如何能夠相輔相成,、互相促進。論壇的最終目標是從這些討論中提煉出有助于技術(shù)邁進通用人工智能的高質(zhì)量見解與建議,。
隨后,,汕頭大學(xué)校長郝志峰教授,廣東金融學(xué)院副校長,、CCF廣州分部主席黃瓊教授和廣東工業(yè)大學(xué)計算機學(xué)院院長李小平教授代表會議主辦方對與會者表示歡迎,。
郝志峰教授和黃瓊教授致歡迎辭
在引導(dǎo)報告環(huán)節(jié),首先由華南理工大學(xué)軟件學(xué)院黃翰教授以“可見的‘帥’,潛藏的‘才’——關(guān)于大模型與因果推斷的一點思考“為題,,深入探討了因果推斷在大模型技術(shù)應(yīng)用領(lǐng)域的核心挑戰(zhàn),。黃教授指出,當前大模型本質(zhì)是顯式變量的序列生成器,,缺乏因果推斷能力,,難以應(yīng)對現(xiàn)實世界中普遍存在的隱變量問題。他形象地將大模型的“帥”(強大的生成能力)與“才”(基于因果推斷來挖掘深層規(guī)律)進行對比,。在技術(shù)實踐方面,,黃教授團隊聚焦因果建模領(lǐng)域,研發(fā)了結(jié)構(gòu)方程自動生成與分析系統(tǒng),,該系統(tǒng)已服務(wù)全球200多個國家和地區(qū)的科研用戶,,覆蓋15個應(yīng)用領(lǐng)域,展現(xiàn)出廣闊的應(yīng)用前景,。
黃翰教授作引導(dǎo)報告
上海交通大學(xué)張拳石副教授以“神經(jīng)網(wǎng)絡(luò)是否可以被嚴謹?shù)亟忉屒宄?rdquo;為題,分享了模型面臨的可解釋性挑戰(zhàn),,指出法律,、醫(yī)療等領(lǐng)域是典型應(yīng)用場景。他提出基于博弈交互的可解釋性理論體系,,證明神經(jīng)網(wǎng)絡(luò)決策邏輯可分解為稀疏符號化概念,,突破長期經(jīng)驗性悲觀論調(diào)。該理論通過公理體系確保符號化解釋的嚴謹性,,實現(xiàn)對多種歸因算法的統(tǒng)一解釋,,并揭示交互復(fù)雜度與模型泛化性、魯棒性的數(shù)學(xué)關(guān)系,。
張拳石副教授作引導(dǎo)報告
中山大學(xué)王可澤副教授以“大模型知識推理與多智能體研究”為題,,分享了在ChatGPT、DeepSeek等大模型技術(shù)快速發(fā)展的背景下,,模型面臨的幻覺生成,、多模態(tài)融合等垂直落地挑戰(zhàn),還指出健康,、氣象等領(lǐng)域是典型應(yīng)用場景,。王教授提出基于人類認知雙通道理論的計算框架,結(jié)合三段論推理思維鏈與多智能體協(xié)同技術(shù),,突破單向預(yù)測架構(gòu)限制,,實現(xiàn)事實性與邏輯性提升。相關(guān)成果成功應(yīng)用于廣東省氣象預(yù)報自動化生成,、數(shù)說故事百億級商業(yè)大模型SocialGPT優(yōu)化及視頻因果干預(yù)分析,,顯著提升服務(wù)效率與生成質(zhì)量,為大模型在垂直領(lǐng)域的深度應(yīng)用提供了創(chuàng)新解決方案。
王可澤副教授作引導(dǎo)報告
引導(dǎo)報告結(jié)束后,,由YOCSEF總部候任主席賀瑞君,、南京分論壇主席吳天星、廈門分論壇主席周奕毅分別為三位引導(dǎo)嘉賓頒發(fā)感謝牌,,以示對他們的誠摯謝意,。
引導(dǎo)發(fā)言結(jié)束后,論壇進入思辨環(huán)節(jié),,該環(huán)節(jié)由執(zhí)行主席陳炳豐和朱鑒共同主持,。思辨嘉賓包括:廣東工業(yè)大學(xué)計算機學(xué)院的蔡瑞初教授、中山大學(xué)計算機學(xué)院的權(quán)小軍教授,、廣東外語外貿(mào)大學(xué)的顏學(xué)明副教授等眾多與會嘉賓,。會場嘉賓圍繞“大模型究竟是記憶的產(chǎn)物還是泛化的結(jié)果?”,、“大模型是否需要具備因果理解能力,?”、“如何引導(dǎo)大模型理解因果關(guān)系,?”三個核心議題,,展開激烈思辨。
思辨議題1:大模型究竟是記憶的產(chǎn)物還是泛化的結(jié)果,?
針對此議題,,一些嘉賓認為大模型在很大程度上是記憶的產(chǎn)物。蔡瑞初提出,,大模型主要是基于記憶的基礎(chǔ)知識和推理模式,,這給人一種它具備泛化能力的錯覺;然而,,在面對新場景時,,其泛化能力可能不足。周奕毅補充道,,大模型主要通過記憶來體現(xiàn)所謂的“泛化能力”,,例如在處理簡單的數(shù)學(xué)加法時也可能出錯,這表明大模型只是記住了數(shù)學(xué)知識,,并未真正理解數(shù)學(xué)原理,。
另一方面,也有嘉賓強調(diào)大模型的能力更多體現(xiàn)在泛化上,。黃棟表示,,在實際交互中,大模型經(jīng)常需要處理訓(xùn)練集中未曾出現(xiàn)的情況,,并根據(jù)已有的訓(xùn)練進行泛化以做出回應(yīng),。譚臺哲同意此觀點,,并指出雖然因果關(guān)系能夠帶來更好的泛化效果,但它并非提升泛化的唯一途徑,。
此外,,一些嘉賓認為應(yīng)綜合看待大模型的記憶與泛化能力,不宜孤立思考,。鄢興雨介紹了業(yè)界的一種測試方法:對于一種新的游戲規(guī)則,,若大模型在學(xué)習(xí)后能作為游戲角色提出合理策略,則表明其具有泛化能力,;反之則說明它是基于記憶,。張拳石強調(diào),大模型對不同知識點的泛化能力存在差異,,特別是在復(fù)雜交互中,,這種能力可能會顯著下降。劉陽認為記憶和泛化不可分割,,兩者之間存在交集,,且因果關(guān)系有助于解釋事務(wù)邏輯,從而大幅提升大模型的泛化能力,。吳天星總結(jié)說,,大模型在推理過程中既表現(xiàn)出記憶特性也展示了泛化能力,但討論這個問題時不能脫離具體的應(yīng)用場景,、數(shù)據(jù)集及任務(wù)需求,并建議建立詳細的評測體系來驗證模型的表現(xiàn)是基于記憶還是泛化,。
思辨議題2:大模型是否需要具備因果理解能力,?
針對此議題,部分嘉賓認為大模型需要具備因果理解能力,。權(quán)小軍認為大模型應(yīng)當具有邏輯推理的能力,,而因果推理作為一種合理的推理形式,表明大模型確實需要具備因果理解能力,。黃棟則強調(diào)應(yīng)更關(guān)注于大模型解決問題的實際效果,,即使缺乏完全的可解釋性,大模型仍能作為強大的工具使用,;不過他也指出,,只有當大模型具備因果能力時,才能被視為邁向通用人工智能的重要一步,。蔡瑞初進一步闡述了引入因果的重要性,,認為這不僅是為了改進大模型本身,更是為了更好地改造世界,。劉陽支持因果推理能夠增強系統(tǒng)的可解釋性,、穩(wěn)定性和可靠性,。蘇申補充說,僅靠現(xiàn)有的語料無法使大模型達到理想的表現(xiàn),,還需要通過歸因分析來提升其性能,,因此不能忽略因果邏輯。
另一方面,,一些嘉賓則認為因果理解能力不一定是大模型的基礎(chǔ)能力,,更多地依賴于邏輯推理能力。陳俊穎提出,,雖然大模型需要實現(xiàn)可解釋性,,但這不一定非要通過因果理解來達成,邏輯或規(guī)則同樣可以實現(xiàn)這一目標,。
此外,,還有嘉賓從不同角度探討了大模型與因果推理的關(guān)系。鄢興雨表示,,盡管在技術(shù)層面上實現(xiàn)通用人工智能不一定需要因果推理,,但為了讓公眾接受和信任通用人工智能,因果推理是必要的,。吳賀豐認為大模型本身就包含了一定程度的因果理解和推理能力,。劉偉莉則指出,在某些特定應(yīng)用場景如醫(yī)療和金融領(lǐng)域中,,因果理解能力對大模型來說至關(guān)重要,,但在其他場景下可能并非如此必要。
思辨議題3:如何引導(dǎo)大模型理解因果關(guān)系,?
針對這一議題,,部分嘉賓提出了以數(shù)據(jù)為中心的方法。蔡瑞初認為,,靜態(tài)數(shù)據(jù)不足以使大模型理解因果關(guān)系,;相反,通過與現(xiàn)實世界的交互產(chǎn)生的動態(tài)數(shù)據(jù)可以賦予大模型這種能力,。張拳石強調(diào),,人類對因果的理解源于自我反思的過程,因此,,為了提升大模型的因果理解能力,,也需要開發(fā)一套方法來促進其進行類似的反思和總結(jié)。鄢興雨則建議,,可以通過識別長鏈邏輯內(nèi)容中的共性部分作為歸因,,生成因果數(shù)據(jù),并將其反饋給大模型,,從而輔助其理解因果關(guān)系,。
另一些嘉賓對于以數(shù)據(jù)為中心的研究范式是否足以幫助大模型理解因果關(guān)系表示懷疑,。周奕毅指出,由于大模型本質(zhì)上是一個條件概率模型,,主要用于解決概率分布問題,,因此讓大模型像人類一樣理解原因或原理是相當具有挑戰(zhàn)性的。陳俊穎補充道,,雖然數(shù)據(jù)本身并不包含因果關(guān)系,,但通過將人類對因果關(guān)系的理解融入數(shù)據(jù)設(shè)計中,并結(jié)合考慮因果關(guān)系的模型設(shè)計,,然后將這些數(shù)據(jù)輸入模型進行訓(xùn)練,,可以在一定程度上增強模型對因果關(guān)系的理解。
此外,,顏學(xué)明提到,,大模型的應(yīng)用已經(jīng)對傳統(tǒng)的自然語言處理教學(xué)和科研帶來了革命性的變化,使得許多傳統(tǒng)任務(wù)得以更高效地解決,。黃棟認為,,某些大模型之所以能夠進行因果推理和邏輯推理,并不一定是因為它們從嵌入了因果關(guān)系的數(shù)據(jù)中學(xué)習(xí),,而是因為這些模型的結(jié)構(gòu)本身就適合此類任務(wù),。權(quán)小軍進一步指出,盡管傳統(tǒng)的機器學(xué)習(xí)特征選擇方法和自然語言處理中的句法結(jié)構(gòu)分析等研究思路可能已不再適用,,但在當前環(huán)境下,,無論是深度學(xué)習(xí)還是大模型,數(shù)據(jù)驅(qū)動的范式依然顯示出其有效性,。
嘉賓熱議
在思辨環(huán)節(jié)之后,,由郝志峰教授依次為各位思辨嘉賓頒發(fā)了感謝牌。此次論壇歷時四個多小時,,最后賀瑞君對此次論壇進行總結(jié)并表示肯定,。
頒發(fā)思辨特邀嘉賓感謝牌留念
候任主席賀瑞君對論壇作總結(jié)
與會嘉賓合影留念
本次論壇圍繞“大模型與因果推斷”這一主題,,匯聚了來自學(xué)術(shù)界與業(yè)界的眾多專家,。與會者圍繞大模型和因果推理的協(xié)同發(fā)展機制展開深入探討,重點分析了二者如何相互促進,、融合發(fā)展,,并為實現(xiàn)通用人工智能提煉出一些高質(zhì)量的觀點和建議。期待在各領(lǐng)域?qū)<覍W(xué)者的共同推動下,,繼續(xù)深化大模形與因果技術(shù)的融合,,擴大影響力,為產(chǎn)業(yè)實踐指明發(fā)展方向,。
評論 0