再見2023,! 你好2024,!
2023年,我們共同經(jīng)歷了無數(shù)挑戰(zhàn)和機(jī)遇,,也收獲了無數(shù)的成功和成長,,實(shí)驗(yàn)室在科研探索,、師生成長、項(xiàng)目合作等方面都取得了長足的進(jìn)步,。在這里,,我們對過去一年實(shí)驗(yàn)室所取得的成果進(jìn)行總結(jié)和回顧,也為即將到來的龍年拉開帷幕,。感謝每一位關(guān)注我們的朋友,!
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年1月,我組2017級博士苗旭鵬獲得2022年度ACM中國“優(yōu)秀博士論文獎(jiǎng)”,。
ACM中國“優(yōu)秀博士論文獎(jiǎng)”由ACM中國理事會(huì)從2014年設(shè)立,,為表彰中國計(jì)算機(jī)領(lǐng)域的青年學(xué)者和博士生所取得的優(yōu)秀研究成果和高水平博士論文,并進(jìn)一步推動(dòng)青年學(xué)者在科研領(lǐng)域的發(fā)展和進(jìn)步,。2022年全國共有2位博士榮獲該獎(jiǎng)項(xiàng),。
苗旭鵬獲得2022年度ACM中國“優(yōu)秀博士論文獎(jiǎng)”
2022年度ACM中國“優(yōu)秀博士論文獎(jiǎng)獲得者”展覽
【論文錄用】
2023年2月,我組碩士生王子威的一篇論文被ICDE 2023錄用,。
【論文簡介】
Ziwei Wang, Zheng Zhong, Jiarui Guo, Yuhan Wu, Haoyu Li, Tong Yang, Yaofeng Tu, Huanchen Zhang, Bin Cui. REncoder: A Space-Time Efficient Range Filter with Local Encoder,,ICDE 2023.
范圍過濾器是一種用于回答范圍成員查詢的數(shù)據(jù)結(jié)構(gòu)。范圍查詢在現(xiàn)代應(yīng)用程序中很常見,,范圍過濾器可以通過濾除空范圍查詢來提高范圍查詢的性能,,因此受到越來越多的關(guān)注。目前最先進(jìn)的范圍過濾器,,如SuRF和Rosetta,,分別存在高誤報(bào)率和低吞吐量的缺陷。因此,,論文提出了一種新的范圍濾波器(REncoder),。它將所有鍵的前綴組織成一棵線段樹,并將線段樹局部地編碼至布隆過濾器中以加速查詢,。REncoder可自適應(yīng)地選擇要存儲的線段樹的層數(shù)來支持不同的工作負(fù)載,。論文從理論上證明了REncoder的誤差是有界的,并推導(dǎo)出了其在有界誤差下的漸近空間復(fù)雜度,。論文在合成數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),,結(jié)果表明,REncoder優(yōu)于全部現(xiàn)有范圍濾波器,。
【學(xué)術(shù)活動(dòng)】
2023年4月3日至7日,,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會(huì)議ICDE 2023召開,我組博士生謝旭,、碩士生王子威在大會(huì)上為錄用論文進(jìn)行了學(xué)術(shù)報(bào)告,。
【論文錄用】
2023年4月,我組科研實(shí)習(xí)生姜友和,、博士生符芳誠等同學(xué)合作的一篇論文被IJCAI 2023錄用,。
Youhe Jiang, Fangcheng Fu, Xupeng Miao, Xiaonan Nie, Bin Cui. OSDP: Optimal Sharded Data Parallel for Distributed Deep Learning,,IJCAI 2023.
大規(guī)模深度學(xué)習(xí)模型在多個(gè)人物場景中展現(xiàn)出了顯著的提升。數(shù)據(jù)并行和模型并行分別是基于模型的復(fù)制和劃分來支持超大規(guī)模模型分布式訓(xùn)練的常見范式,。本文提出了最優(yōu)分塊數(shù)據(jù)并行范式(OSDP),,一種結(jié)合了數(shù)據(jù)并行和模型并行優(yōu)點(diǎn)的自動(dòng)并行訓(xùn)練框架。給定模型描述和設(shè)備信息,,OSDP在顯存占用量和計(jì)算利用率之間進(jìn)行權(quán)衡,,從而自動(dòng)生成分布式計(jì)算圖,并最大化整體訓(xùn)練吞吐,。此外,,OSDP引入了算子切分技術(shù),以進(jìn)一步降低訓(xùn)練過程中的峰值顯存占用,,從而提升可支撐的模型規(guī)模,。在多類大規(guī)模模型上的實(shí)驗(yàn)表明,OSDP相比現(xiàn)有方法具有顯著的提升,。
【論文錄用】
2023年5月,,實(shí)驗(yàn)室共有5篇論文被國際頂級學(xué)術(shù)會(huì)議或期刊錄用:
【論文簡介】
【學(xué)術(shù)活動(dòng)】
2023年6月18日至23日,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會(huì)議SIGMOD 2023召開,,我組博士生聶小楠,、黃世悅,、張心怡在大會(huì)上為錄用論文進(jìn)行了學(xué)術(shù)報(bào)告,。
【學(xué)術(shù)活動(dòng)】
2023年8月29日至9月1日,,國際數(shù)據(jù)庫與數(shù)據(jù)管理頂級會(huì)議VLDB 2023召開,我組博士生聶小楠,、2017級博士苗旭鵬在大會(huì)上為錄用論文進(jìn)行了學(xué)術(shù)報(bào)告。
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年9月,,我組2018級博士符芳誠入選2023年度博士后創(chuàng)新人才支持計(jì)劃,。
【論文錄用】
2023年9月,實(shí)驗(yàn)室共有3篇論文被國際頂級學(xué)術(shù)會(huì)議或期刊錄用:
【論文簡介】
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年10月,我組2017級博士黎洋獲得2023年度ACM中國北京分會(huì)“優(yōu)秀博士論文獎(jiǎng)”,。
【榮譽(yù)獎(jiǎng)項(xiàng)&學(xué)術(shù)活動(dòng)】
2023年10月7日,,在武漢舉辦的國際數(shù)據(jù)挖掘與數(shù)據(jù)管理會(huì)議APWeb-WAIM 2023(Asia Pacific Web and Web-Age Information Management Joint International Conference on Web and Big Data,簡稱APWeb-WAIM)上,,北京大學(xué)計(jì)算機(jī)學(xué)院崔斌教授課題組的論文“一種基于顯式捕獲多樣圖信息的多任務(wù)屬性圖聚類方法(Graph-Enforced Neural Network for Attributed Graph Clustering)”獲得大會(huì)最佳論文提名獎(jiǎng)(Best Paper Runner Up),。
Zeang Sheng, Wentao Zhang, Wen Ouyang, Yangyu Tao, Zhi Yang and Bin Cui. Graph-Enforced Neural Network for Attributed Graph Clustering,APWeb-WAIM 2023.
該論文對現(xiàn)有的基于GAE的屬性圖聚類方法做了定量實(shí)驗(yàn)分析,,發(fā)現(xiàn)這些方法受三類圖信息缺失問題的影響,。在此基礎(chǔ)上,該論文提出了三類具有創(chuàng)新性的圖信息維持任務(wù),,包括圖結(jié)構(gòu),、圖中節(jié)點(diǎn)特征以及全局聚類結(jié)構(gòu),并綜合到一個(gè)多任務(wù)學(xué)習(xí)框架中,,最終取得了顯著的性能提升,。該論文有助于屬性圖社區(qū)推進(jìn)對于聚類算法的研究,為新算法的提出提供了新的思考方向,。
【論文錄用】
2023年10月,,實(shí)驗(yàn)室共有2篇論文被國際頂級學(xué)術(shù)會(huì)議或期刊錄用:
【論文簡介】
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年10月, 我組博士研究生張心怡通過層層遴選,,以卓越的學(xué)術(shù)成果,、優(yōu)異的個(gè)人實(shí)踐,榮獲2023年度字節(jié)跳動(dòng)獎(jiǎng)學(xué)金,。
字節(jié)跳動(dòng)獎(jiǎng)學(xué)金計(jì)劃是字節(jié)跳動(dòng)公司發(fā)起的一項(xiàng)年度人才培養(yǎng)項(xiàng)目,。該計(jì)劃面向中國大陸地區(qū)高等院校的在校生,每年支持10余名學(xué)生,,為每位獲獎(jiǎng)學(xué)生提供10萬元人民幣獎(jiǎng)學(xué)金,,旨在幫助具有創(chuàng)新精神的科技人才用專業(yè)知識解決實(shí)際難題,用技術(shù)回饋社會(huì),,引領(lǐng)未來,。2023年共有13人榮獲該獎(jiǎng)學(xué)金。
2023年度字節(jié)跳動(dòng)獎(jiǎng)學(xué)金頒獎(jiǎng)儀式
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年11月,,國際電氣和電子工程師協(xié)會(huì)(IEEE)公布了 2024 年度新晉 Fellow 名單,,由于對大規(guī)模數(shù)據(jù)管理、處理和分析的貢獻(xiàn),,崔斌教授入選為IEEE Fellow,。
IEEE,全稱Institute of Electrical and Electronics Engineers,,是國際性的電子技術(shù)與信息科學(xué)工程師的協(xié)會(huì),,在160多個(gè)國家中,擁有42萬多會(huì)員,。IEEE Fellow,,為協(xié)會(huì)最高等級會(huì)員,是該組織授予的最高榮譽(yù),,當(dāng)選人需要對工程科學(xué)技術(shù)的進(jìn)步或應(yīng)用做出重大貢獻(xiàn),,為社會(huì)帶來重大價(jià)值。每年由同行專家在有突出貢獻(xiàn)的會(huì)員中評選,當(dāng)選人數(shù)不超過IEEE會(huì)員總?cè)藬?shù)的千分之一,。
【新聞動(dòng)態(tài)】
2023年11月,,我組2017級博士張文濤入職北京大學(xué)國際機(jī)器學(xué)習(xí)研究中心,擔(dān)任助理教授,、研究員和博士生導(dǎo)師,。
【論文錄用】
2023年11月,實(shí)驗(yàn)室共有4篇論文被國際頂級學(xué)術(shù)會(huì)議或期刊錄用:
【論文簡介】
【榮譽(yù)獎(jiǎng)項(xiàng)】
2023年12月,我組2017級博士張文濤獲得2023年北京市優(yōu)秀博士學(xué)位論文,。
【學(xué)術(shù)活動(dòng)】
2023年12月10日至12月16日,,國際機(jī)器學(xué)習(xí)與人工智能頂級會(huì)議NeurIPS 2023召開,我組博士生張海林,、楊靈在大會(huì)上為錄用論文進(jìn)行了講解,。
【學(xué)術(shù)活動(dòng)】
2023年12月3日至6日,2023國際測試委員會(huì)智能計(jì)算與芯片聯(lián)邦大會(huì)召開,,我組開源項(xiàng)目河圖(Hetu)被評為BenchCoucil年度世界開源杰出成果之一,,我組2018級博士符芳誠受邀在大會(huì)上進(jìn)行題為“河圖:高效可擴(kuò)展的分布式深度學(xué)習(xí)系統(tǒng)/Hetu: An efficient and scalable distributed deep learning system”的演講報(bào)告。
河圖(Hetu)被評為BenchCoucil年度世界Top100開源成果
【論文錄用】
2024年1月,,我組博士生楊靈共有3篇論文被ICLR 2024錄用,。
【論文簡介】
【榮譽(yù)獎(jiǎng)項(xiàng)】
2024年2月,,我組2017級博士張文濤獲得2023 年度吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)“優(yōu)秀博士學(xué)位論文獲獎(jiǎng)?wù)撐?/span> ”,。
【論文錄用】
2024年2月,我組2017級博士張文濤的一篇論文被SIGMOD 2024錄用,。
【論文簡介】
Wentao Zhang, Guochen Yan, Yu Shen, Yang Ling, Yaoyu Tao, Bin Cui, Jian Tang. NPA: Improving Large-scale Graph Neural Networks with Non-parametric Attention,,SIGMOD 2024 (Industry)
非參數(shù)化的圖神經(jīng)網(wǎng)絡(luò)(GNN)在大規(guī)模圖數(shù)據(jù)上取得了廣泛的使用。例如,,Open Graph Benchmark中大部分排名靠前的方法都是非參數(shù)化GNN,。盡管非參數(shù)GNN具有很高的預(yù)測性能和可擴(kuò)展性,但仍面臨兩個(gè)限制,。1)由于過平滑特征的傳播,,它們會(huì)隨著傳播深度而遭受嚴(yán)重的性能退化。2)忽略了非參數(shù)傳播過程中的特征影響,,導(dǎo)致傳播特征次優(yōu),。本文提出了非參數(shù)注意力插件來解決這些限制,取得了ogbn-papers100M的最好性能,,在騰訊實(shí)際應(yīng)用中部署實(shí)現(xiàn)并取得良好效果,。
2023年的征途與榮光已屬于過去,2024年的挑戰(zhàn)與機(jī)遇已經(jīng)開始,。兔去龍來喜氣濃,,家家戶戶慶豐功。祝福新老朋友們,,龍年行大運(yùn),,龍飛鳳舞生活樂,,魚躍龍門事業(yè)興!新春快樂,!