隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、社交網(wǎng)絡(luò),、物聯(lián)網(wǎng),、云計(jì)算等新一代信息技術(shù)的應(yīng)用和推廣,人類產(chǎn)生的數(shù)據(jù)成倍增長,,數(shù)據(jù)種類繁多,,數(shù)據(jù)在寬帶網(wǎng)絡(luò)中高速流動,數(shù)據(jù)的待開發(fā)價(jià)值越來越大,,毫無疑問,,我們已經(jīng)進(jìn)入了大數(shù)據(jù)(Massive Datasets)時(shí)代,。
大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進(jìn)行分析,,通常被理解為將網(wǎng)絡(luò)中現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識,幫助用戶做出明智的業(yè)務(wù)決策的工具,。實(shí)時(shí)大數(shù)據(jù)分析是指對大數(shù)據(jù)高效,、快速地完成分析,達(dá)到近似實(shí)時(shí)的效果,,更及時(shí)的反映數(shù)據(jù)的價(jià)值和意義,。
本課程詳細(xì)介紹了支持大規(guī)模數(shù)據(jù)挖掘的分布式文件系統(tǒng)及MapReduce分布式計(jì)算框架,以及大數(shù)據(jù)分析的基本概念,、方法,、理論體系。實(shí)時(shí)大數(shù)據(jù)分析的經(jīng)典算法,、應(yīng)用技術(shù),、工具及目前面臨的挑戰(zhàn)會被重點(diǎn)講述。