再見2023,! 你好2024,!
2023年,我們共同經(jīng)歷了無數(shù)挑戰(zhàn)和機遇,,也收獲了無數(shù)的成功和成長,,實驗室在科研探索、師生成長,、項目合作等方面都取得了長足的進步,。在這里,我們對過去一年實驗室所取得的成果進行總結和回顧,,也為即將到來的龍年拉開帷幕,。感謝每一位關注我們的朋友,!
【榮譽獎項】
2023年1月,,我組2017級博士苗旭鵬獲得2022年度ACM中國“優(yōu)秀博士論文獎”。
ACM中國“優(yōu)秀博士論文獎”由ACM中國理事會從2014年設立,,為表彰中國計算機領域的青年學者和博士生所取得的優(yōu)秀研究成果和高水平博士論文,,并進一步推動青年學者在科研領域的發(fā)展和進步。2022年全國共有2位博士榮獲該獎項,。
苗旭鵬獲得2022年度ACM中國“優(yōu)秀博士論文獎”
2022年度ACM中國“優(yōu)秀博士論文獎獲得者”展覽
【論文錄用】
2023年2月,,我組碩士生王子威的一篇論文被ICDE 2023錄用。
【論文簡介】
Ziwei Wang, Zheng Zhong, Jiarui Guo, Yuhan Wu, Haoyu Li, Tong Yang, Yaofeng Tu, Huanchen Zhang, Bin Cui. REncoder: A Space-Time Efficient Range Filter with Local Encoder,ICDE 2023.
范圍過濾器是一種用于回答范圍成員查詢的數(shù)據(jù)結構,。范圍查詢在現(xiàn)代應用程序中很常見,,范圍過濾器可以通過濾除空范圍查詢來提高范圍查詢的性能,因此受到越來越多的關注,。目前最先進的范圍過濾器,,如SuRF和Rosetta,分別存在高誤報率和低吞吐量的缺陷,。因此,,論文提出了一種新的范圍濾波器(REncoder)。它將所有鍵的前綴組織成一棵線段樹,,并將線段樹局部地編碼至布隆過濾器中以加速查詢,。REncoder可自適應地選擇要存儲的線段樹的層數(shù)來支持不同的工作負載。論文從理論上證明了REncoder的誤差是有界的,,并推導出了其在有界誤差下的漸近空間復雜度,。論文在合成數(shù)據(jù)集和真實數(shù)據(jù)集上進行了實驗,結果表明,,REncoder優(yōu)于全部現(xiàn)有范圍濾波器,。
【學術活動】
2023年4月3日至7日,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會議ICDE 2023召開,,我組博士生謝旭,、碩士生王子威在大會上為錄用論文進行了學術報告。
【論文錄用】
2023年4月,,我組科研實習生姜友和,、博士生符芳誠等同學合作的一篇論文被IJCAI 2023錄用。
Youhe Jiang, Fangcheng Fu, Xupeng Miao, Xiaonan Nie, Bin Cui. OSDP: Optimal Sharded Data Parallel for Distributed Deep Learning,,IJCAI 2023.
大規(guī)模深度學習模型在多個人物場景中展現(xiàn)出了顯著的提升,。數(shù)據(jù)并行和模型并行分別是基于模型的復制和劃分來支持超大規(guī)模模型分布式訓練的常見范式。本文提出了最優(yōu)分塊數(shù)據(jù)并行范式(OSDP),,一種結合了數(shù)據(jù)并行和模型并行優(yōu)點的自動并行訓練框架,。給定模型描述和設備信息,OSDP在顯存占用量和計算利用率之間進行權衡,,從而自動生成分布式計算圖,,并最大化整體訓練吞吐。此外,,OSDP引入了算子切分技術,,以進一步降低訓練過程中的峰值顯存占用,從而提升可支撐的模型規(guī)模,。在多類大規(guī)模模型上的實驗表明,,OSDP相比現(xiàn)有方法具有顯著的提升。
【論文錄用】
2023年5月,實驗室共有5篇論文被國際頂級學術會議或期刊錄用:
【論文簡介】
【學術活動】
2023年6月18日至23日,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會議SIGMOD 2023召開,,我組博士生聶小楠,、黃世悅、張心怡在大會上為錄用論文進行了學術報告,。
【學術活動】
2023年8月29日至9月1日,,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會議VLDB 2023召開,我組博士生聶小楠,、2017級博士苗旭鵬在大會上為錄用論文進行了學術報告,。
【榮譽獎項】
2023年9月,我組2018級博士符芳誠入選2023年度博士后創(chuàng)新人才支持計劃,。
【論文錄用】
2023年9月,,實驗室共有3篇論文被國際頂級學術會議或期刊錄用:
【論文簡介】
【榮譽獎項】
2023年10月,我組2017級博士黎洋獲得2023年度ACM中國北京分會“優(yōu)秀博士論文獎”,。
【榮譽獎項&學術活動】
2023年10月7日,,在武漢舉辦的國際數(shù)據(jù)挖掘與數(shù)據(jù)管理會議APWeb-WAIM 2023(Asia Pacific Web and Web-Age Information Management Joint International Conference on Web and Big Data,簡稱APWeb-WAIM)上,,北京大學計算機學院崔斌教授課題組的論文“一種基于顯式捕獲多樣圖信息的多任務屬性圖聚類方法(Graph-Enforced Neural Network for Attributed Graph Clustering)”獲得大會最佳論文提名獎(Best Paper Runner Up),。
Zeang Sheng, Wentao Zhang, Wen Ouyang, Yangyu Tao, Zhi Yang and Bin Cui. Graph-Enforced Neural Network for Attributed Graph Clustering,APWeb-WAIM 2023.
該論文對現(xiàn)有的基于GAE的屬性圖聚類方法做了定量實驗分析,,發(fā)現(xiàn)這些方法受三類圖信息缺失問題的影響,。在此基礎上,該論文提出了三類具有創(chuàng)新性的圖信息維持任務,,包括圖結構,、圖中節(jié)點特征以及全局聚類結構,并綜合到一個多任務學習框架中,,最終取得了顯著的性能提升,。該論文有助于屬性圖社區(qū)推進對于聚類算法的研究,為新算法的提出提供了新的思考方向,。
【論文錄用】
2023年10月,,實驗室共有2篇論文被國際頂級學術會議或期刊錄用:
【論文簡介】
【榮譽獎項】
2023年10月, 我組博士研究生張心怡通過層層遴選,,以卓越的學術成果,、優(yōu)異的個人實踐,榮獲2023年度字節(jié)跳動獎學金,。
字節(jié)跳動獎學金計劃是字節(jié)跳動公司發(fā)起的一項年度人才培養(yǎng)項目,。該計劃面向中國大陸地區(qū)高等院校的在校生,每年支持10余名學生,,為每位獲獎學生提供10萬元人民幣獎學金,,旨在幫助具有創(chuàng)新精神的科技人才用專業(yè)知識解決實際難題,用技術回饋社會,,引領未來,。2023年共有13人榮獲該獎學金。
2023年度字節(jié)跳動獎學金頒獎儀式
【榮譽獎項】
2023年11月,,國際電氣和電子工程師協(xié)會(IEEE)公布了 2024 年度新晉 Fellow 名單,,由于對大規(guī)模數(shù)據(jù)管理、處理和分析的貢獻,,崔斌教授入選為IEEE Fellow,。
IEEE,全稱Institute of Electrical and Electronics Engineers,,是國際性的電子技術與信息科學工程師的協(xié)會,,在160多個國家中,擁有42萬多會員,。IEEE Fellow,,為協(xié)會最高等級會員,是該組織授予的最高榮譽,,當選人需要對工程科學技術的進步或應用做出重大貢獻,,為社會帶來重大價值。每年由同行專家在有突出貢獻的會員中評選,,當選人數(shù)不超過IEEE會員總人數(shù)的千分之一,。
【新聞動態(tài)】
2023年11月,我組2017級博士張文濤入職北京大學國際機器學習研究中心,,擔任助理教授,、研究員和博士生導師。
【論文錄用】
2023年11月,,實驗室共有4篇論文被國際頂級學術會議或期刊錄用:
【論文簡介】
【榮譽獎項】
2023年12月,我組2017級博士張文濤獲得2023年北京市優(yōu)秀博士學位論文,。
【學術活動】
2023年12月10日至12月16日,,國際機器學習與人工智能頂級會議NeurIPS 2023召開,我組博士生張海林,、楊靈在大會上為錄用論文進行了講解,。
【學術活動】
2023年12月3日至6日,2023國際測試委員會智能計算與芯片聯(lián)邦大會召開,,我組開源項目河圖(Hetu)被評為BenchCoucil年度世界開源杰出成果之一,,我組2018級博士符芳誠受邀在大會上進行題為“河圖:高效可擴展的分布式深度學習系統(tǒng)/Hetu: An efficient and scalable distributed deep learning system”的演講報告。
河圖(Hetu)被評為BenchCoucil年度世界Top100開源成果
【論文錄用】
2024年1月,,我組博士生楊靈共有3篇論文被ICLR 2024錄用,。
【論文簡介】
【榮譽獎項】
2024年2月,,我組2017級博士張文濤獲得2023 年度吳文俊人工智能科學技術獎“優(yōu)秀博士學位論文獲獎論文 ”,。
【論文錄用】
2024年2月,我組2017級博士張文濤的一篇論文被SIGMOD 2024錄用,。
【論文簡介】
Wentao Zhang, Guochen Yan, Yu Shen, Yang Ling, Yaoyu Tao, Bin Cui, Jian Tang. NPA: Improving Large-scale Graph Neural Networks with Non-parametric Attention,,SIGMOD 2024 (Industry)
非參數(shù)化的圖神經(jīng)網(wǎng)絡(GNN)在大規(guī)模圖數(shù)據(jù)上取得了廣泛的使用。例如,,Open Graph Benchmark中大部分排名靠前的方法都是非參數(shù)化GNN,。盡管非參數(shù)GNN具有很高的預測性能和可擴展性,但仍面臨兩個限制,。1)由于過平滑特征的傳播,,它們會隨著傳播深度而遭受嚴重的性能退化。2)忽略了非參數(shù)傳播過程中的特征影響,,導致傳播特征次優(yōu),。本文提出了非參數(shù)注意力插件來解決這些限制,取得了ogbn-papers100M的最好性能,,在騰訊實際應用中部署實現(xiàn)并取得良好效果,。
2023年的征途與榮光已屬于過去,2024年的挑戰(zhàn)與機遇已經(jīng)開始,。兔去龍來喜氣濃,,家家戶戶慶豐功。祝福新老朋友們,,龍年行大運,,龍飛鳳舞生活樂,魚躍龍門事業(yè)興,!新春快樂,!