該課程分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘?qū)嵺`兩大部分。數(shù)據(jù)挖掘理論部分的主要內(nèi)容包括數(shù)據(jù)挖掘的基本概念,、數(shù)據(jù)預(yù)處理,、聚類分析,、分類與回歸,、關(guān)聯(lián)規(guī)則挖掘,、離群點(diǎn)檢測,。數(shù)據(jù)挖掘?qū)嵺`部分討論了數(shù)據(jù)挖掘在文本挖掘,、金融等領(lǐng)域中的應(yīng)用,;通過基于內(nèi)容的垃圾郵件識別,、虛假新聞檢測、新冠疫情的情緒分析等案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應(yīng)用,;通過潛在貸款客戶挖掘,、貸款違約等案例展示了數(shù)據(jù)挖掘在金融領(lǐng)域的應(yīng)用。