(一)課程的性質(zhì),、地位,、作用和任務(wù)
《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論》課程是運(yùn)用概率統(tǒng)計(jì),、分布式計(jì)算、現(xiàn)代軟件等綜合知識(shí)探索來自商業(yè)貿(mào)易,,生物醫(yī)療,,金融證券,,社交網(wǎng)絡(luò)等眾多領(lǐng)域的較大規(guī)模或結(jié)構(gòu)復(fù)雜數(shù)據(jù)集的高效存儲(chǔ),、高效管理,、高效概括、深入分析和精準(zhǔn)預(yù)測(cè)的科學(xué)和藝術(shù),。它是現(xiàn)代計(jì)算機(jī)科學(xué)教育中的一門核心課程,,是一門跨計(jì)算機(jī)、統(tǒng)計(jì)學(xué)和數(shù)學(xué)領(lǐng)域的學(xué)科,,它是計(jì)算機(jī)各專業(yè),、信息專業(yè)和其他一些與計(jì)算機(jī)技術(shù)關(guān)系密切專業(yè)的必修的基礎(chǔ)課程。
它的任務(wù)是討論現(xiàn)實(shí)世界中的各種邏輯結(jié)構(gòu),、在計(jì)算機(jī)中的存儲(chǔ)結(jié)構(gòu)以及實(shí)現(xiàn)各種操作的算法問題,,為今后進(jìn)一步學(xué)習(xí)后續(xù)專業(yè)課程、進(jìn)行軟件開發(fā)和應(yīng)用打好基礎(chǔ),。
(二)教學(xué)目的和要求
《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論》是一門理論和實(shí)踐緊密結(jié)合的基礎(chǔ)課,,也是大數(shù)據(jù)技術(shù)應(yīng)用的基石課程,其教學(xué)目標(biāo)是運(yùn)用統(tǒng)計(jì)分析,、機(jī)器學(xué)習(xí),、分布式處理等技術(shù),能從大量數(shù)據(jù)中提取對(duì)科學(xué)研究和生產(chǎn)實(shí)踐有意義的信息,,以可視化等技術(shù)通過通俗易懂的形式傳達(dá)給決策者,,為后續(xù)大數(shù)據(jù)技術(shù)的相關(guān)專業(yè)課學(xué)習(xí)打良好基礎(chǔ)。
(三)課程教學(xué)方法與手段
本課程應(yīng)采用面授講解為主,、指導(dǎo)學(xué)生自學(xué)為輔的教學(xué)方法,,利用多媒體教學(xué)手段,制作條理清晰的PPT投影和動(dòng)態(tài)的算法跟蹤動(dòng)畫,,加強(qiáng)學(xué)生對(duì)算法的理解,。同時(shí),開始對(duì)應(yīng)的實(shí)驗(yàn)指導(dǎo)課程,,提高學(xué)生的動(dòng)手操作能力。
(四)課程與其它課程的聯(lián)系
《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論》課程的先修課程是《概率論和數(shù)理統(tǒng)計(jì)》 ,、《數(shù)據(jù)結(jié)構(gòu)》和《操作系統(tǒng)》,,其中,《概率論和數(shù)理統(tǒng)計(jì)》提供了數(shù)據(jù)分析所需用到的基本數(shù)學(xué)模型和分析方法,,為學(xué)生數(shù)據(jù)分析提供重要的理論基礎(chǔ),。《數(shù)據(jù)結(jié)構(gòu)》闡釋了數(shù)據(jù)在計(jì)算機(jī)中的組織結(jié)構(gòu),讓學(xué)生在進(jìn)行數(shù)據(jù)分析時(shí)能通過結(jié)構(gòu)的轉(zhuǎn)換了解數(shù)據(jù)的本質(zhì),?!恫僮飨到y(tǒng)》讓學(xué)生了解計(jì)算機(jī)基本存儲(chǔ)結(jié)構(gòu)和進(jìn)程調(diào)度原理,為學(xué)生學(xué)習(xí)分布式計(jì)算提供重要的理論依據(jù),。本課程是后續(xù)課程如《機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘》,、《分布式數(shù)據(jù)庫(kù)》、《大數(shù)據(jù)處理和數(shù)據(jù)分析技術(shù)》的基礎(chǔ),,這些專業(yè)課中涉及的數(shù)據(jù)的組織和處理方法正是本課程的內(nèi)容,。
(五) 教材與教學(xué)參考書
教材:朝樂門,《數(shù)據(jù)科學(xué)理論與實(shí)踐》,,清華大學(xué)出版社,,2017年10月。
教學(xué)參考書:
托馬斯.埃爾,,《大數(shù)據(jù)導(dǎo)論》,,機(jī)械工業(yè)出版社,2017年6月,。
美國(guó)EMC教育服務(wù)團(tuán)隊(duì),,《數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析:數(shù)據(jù)發(fā)現(xiàn) 分析 可視化表示》,人民郵電出版社,,2016年7月,。
第1章緒論
1.1術(shù)語定義
1.2研究目的
1.3發(fā)展簡(jiǎn)史
1.4理論體系
1.5基本原則
1.6如何成為數(shù)據(jù)科學(xué)家
重點(diǎn):掌握數(shù)據(jù)科學(xué)的理論體系,了解數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的發(fā)展歷史,。
難點(diǎn):據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的跨學(xué)科特性,,掌握本門學(xué)科的學(xué)習(xí)方法。
第2章數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的理論基礎(chǔ)
2.1數(shù)據(jù)科學(xué)的學(xué)科地位
2.2統(tǒng)計(jì)學(xué)
2.3機(jī)器學(xué)習(xí)
2.4數(shù)據(jù)可視化
重點(diǎn):重溫《概率論與數(shù)理統(tǒng)計(jì)》的基本原理,。
難點(diǎn):理解監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的基本原理,,掌握基本算法的編程。
第3章大數(shù)據(jù)加工和分析流程與方法
3.1基本流程
3.2數(shù)據(jù)加工
3.3數(shù)據(jù)審計(jì)
3.4數(shù)據(jù)分析
3.5數(shù)據(jù)可視化
3.6數(shù)據(jù)故事化
3.7項(xiàng)目管理
重點(diǎn):掌握數(shù)據(jù)預(yù)處理的基本流程,,掌握數(shù)據(jù)加工,、數(shù)據(jù)審計(jì)、數(shù)據(jù)分析,、數(shù)據(jù)可視化等常見處理手段,。
難點(diǎn):掌握數(shù)據(jù)預(yù)處理的基本流程,掌握數(shù)據(jù)加工,、數(shù)據(jù)審計(jì),、數(shù)據(jù)分析、數(shù)據(jù)可視化等常見處理手段,。
第4章大數(shù)據(jù)加工和分析所用到的技術(shù)與工具
4.1技術(shù)體系
4.2MapReduce
4.3Hadoop
4.4Spark
4.5NoSQL與NewSQL
4.6R與Python
4.7發(fā)展趨勢(shì)
重點(diǎn):掌握Python,、R,、MapReduce、Spark等大數(shù)據(jù)加工和分析的使用,。
難點(diǎn):理解分布式計(jì)算的優(yōu)勢(shì),,掌握Python、R,、MapReduce,、Spark等大數(shù)據(jù)加工和分析的使用,并利用這些工具進(jìn)行基本大數(shù)據(jù)分析,。
第5章大數(shù)據(jù)產(chǎn)品的設(shè)計(jì)與開發(fā)
5.1定義
5.2主要特征
5.3關(guān)鍵活動(dòng)
5.4數(shù)據(jù)柔術(shù)
5.5數(shù)據(jù)能力
5.6數(shù)據(jù)戰(zhàn)略
5.7數(shù)據(jù)治理
重點(diǎn):掌握大數(shù)據(jù)應(yīng)用設(shè)計(jì)和開發(fā)方法,,理解數(shù)據(jù)治理的基本原理。
難點(diǎn):掌握大數(shù)據(jù)應(yīng)用設(shè)計(jì)和開發(fā)方法,,理解數(shù)據(jù)治理的基本原理,。
第6章大數(shù)據(jù)典型案例分析及實(shí)踐
6.12012年美國(guó)總統(tǒng)大選
6.2統(tǒng)計(jì)分析
6.3機(jī)器學(xué)習(xí)
6.4數(shù)據(jù)可視化
6.5SparkR編程
重點(diǎn):掌握前面學(xué)到的工具、算法進(jìn)行基本數(shù)據(jù)分析,,并完成數(shù)據(jù)可視化操作,。
難點(diǎn):工具、算法與應(yīng)用相結(jié)合的大數(shù)據(jù)應(yīng)用應(yīng)用開發(fā),。