PKU-DAIR實驗室新手科研入門指南Repo重磅上線,!
北京大學數(shù)據(jù)與智能實驗室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR )致力于數(shù)據(jù)庫系統(tǒng),、大數(shù)據(jù)管理與分析以及人工智能等領域的前沿研究,。團隊長期在理論和技術創(chuàng)新上不斷探索,已在國際頂級學術會議或期刊發(fā)表論文200余篇,,并推出多個開源項目,,與多家知名企業(yè)開展了卓有成效的合作。
為幫助新手快速熟悉和進入相關科研領域,,PKU-DAIR 實驗室特別推出了新手入門指南Repo,。本倉庫基于課題組的科研積累,提供全面的入門論文,、開源文檔和技術指南等分享,,旨在幫助初學者快速熟悉數(shù)據(jù)管理(Data Management, DM) 和 人工智能 (Artificial Intelligence, AI) 等前沿領域,具體包括AI系統(tǒng),、DB+AI,、自動化機器學習、AI Agent等方向,搭建堅實的技術基礎,。無論你是剛入門的小白,,還是希望加深理解的探索者,這里的資源將為你的學習與研究之旅提供有力支持,。
資源亮點:
Repo Github鏈接:https://github.com/PKU-DAIR/Starter-Guide
- 科研入門指南
從基礎到進階,,掌握高效閱讀論文的技巧,以及如何做好研究的相關知識,,幫助你更快融入學術環(huán)境,,獨立開展研究。具體包含以內(nèi)容:
- "Crafting Your Research Future", Charles X. Ling and Qiang Yang
- "The Most Common Habits from English papers written by Chinese students", Felicia Brittman
- Advice on how to succeed in graduate school", Marie desJardins
- "Letter to research students" , Duane Bailey
- "Efficient Reading of Papers in Science and Technology", Michael J. Hanson
- "The Task of the Referee", A. J. Smith
- "How to do Research At the MIT AI Lab", MIT AI Lab
- 科研入門指南--如何做好科研, 如何寫好論文?
- 如何讀好學術論文?
- 研究方向一覽
- AI系統(tǒng)方向:涵蓋人工智能的基礎知識,、機器學習和深度學習系統(tǒng)框架,,以及分布式訓練和推理服務等關鍵技術。具體包含以下子方向:
- AI基礎入門
- ML/DL系統(tǒng)框架
- 分布式訓練
- LLM推理服務
- Diffusion(文生圖,、文生視頻)推理服務
2. AutoML方向 :專注于自動化機器學習,,涉及超參數(shù)優(yōu)化、網(wǎng)絡結構搜索和模型壓縮等主題,,提升機器學習的效率,。具體包含以下子方向:
- AutoML與超參數(shù)優(yōu)化
- 網(wǎng)絡結構搜索(NAS)
- 模型壓縮
- 大語言模型與AutoML
3. Database方向 :探索數(shù)據(jù)庫系統(tǒng)的基礎及其與人工智能的融合,包括經(jīng)典數(shù)據(jù)庫,、AI4DB和向量數(shù)據(jù)庫等內(nèi)容,。具體包含以下子方向:
- Classical Database System
- AI4DB
- Vector database
4. AI Agent方向 :研究智能代理的規(guī)劃、感知和執(zhí)行等能力,,幫助構建更智能的系統(tǒng),。具體包含以下子方向:
- 綜述
- Agent規(guī)劃
- 數(shù)據(jù)獲取與感知
- 執(zhí)行與工具使用
- Agent Benchmark
5. Data-Centric ML方向:關注數(shù)據(jù)驅動的機器學習方法,包括ML,、LLM的基礎知識,、算法和針對特定領域的應用。具體包含以下子方向:
- Data Centric ML Basic
- LLM and VLM Basic
- Data Centric LLM and VLM Algorithms
- Data Centric LLM and VLM Systems
- Data-Centric Domain-Specific LLMs
6. 擴散模型方向:介紹擴散模型的基本原理和應用,,包括圖像和視頻生成,、3D/4D生成技術。具體包含以下子方向:
- 擴散模型基礎
- 擴散模型加速
- 文生圖/視頻
- 3D/4D生成
7. AI for Science方向:結合人工智能與科學研究,,涵蓋蛋白質建模,、小分子建模和生物數(shù)據(jù)分析等重要領域。具體包含以下子方向:
- 綜述
- 蛋白質建模
- 小分子建模
- DNA/RNA/Cell
8. Graph方向 :研究圖神經(jīng)網(wǎng)絡及其在數(shù)據(jù)中心學習和圖學習中的應用,,推動圖數(shù)據(jù)處理的發(fā)展。具體包含以下子方向:
- GNN基礎
- 異構圖GNN
- 以數(shù)據(jù)為中心的圖學習
- GNN加速
- GNN與LLM結合
我們希望通過這些豐富的資源,,幫助有志科研的同學盡快找到自己的方向和興趣,,在科研道路上更順利地前行。
歡迎大家積極關注我們的Repo,,提出寶貴的意見和issue,,也歡迎加入我們課題組共同進行探索和創(chuàng)新,,在科研的旅途中不斷成長!期待在知識的海洋中與你相遇,,共同迎接未來的挑戰(zhàn)與機遇,!
實驗室簡介
北京大學數(shù)據(jù)與智能實驗室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR實驗室)由北京大學計算機學院崔斌教授領導,,長期從事數(shù)據(jù)庫系統(tǒng),、大數(shù)據(jù)管理與分析、人工智能等領域的前沿研究,,在理論和技術創(chuàng)新以及系統(tǒng)研發(fā)上取得多項成果,,已在國際頂級學術會議和期刊發(fā)表學術論文100余篇,發(fā)布多個開源項目,。課題組同學曾數(shù)十次獲得包括CCF優(yōu)博,、ACM中國優(yōu)博、北大優(yōu)博,、微軟學者,、蘋果獎學金、谷歌獎學金等榮譽,。PKU-DAIR實驗室持續(xù)與工業(yè)界展開卓有成效的合作,,與騰訊、阿里巴巴,、蘋果,、微軟、百度,、快手,、中興通訊等多家知名企業(yè)開展項目合作和前沿探索,解決實際問題,,進行科研成果的轉化落地,。
評論 0