數(shù)據(jù)挖掘是人工智能和數(shù)據(jù)庫領域研究的熱點問題,,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的,、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能,、機器學習,、模式識別,、統(tǒng)計學,、數(shù)據(jù)庫、可視化技術等,,高度自動化地分析企業(yè)的數(shù)據(jù),,作出歸納性的推理,從中挖掘出潛在的模式,,幫助決策者調整市場策略,,減少風險,作出正確的決策,。知識發(fā)現(xiàn)過程由以下三個階段組成:①數(shù)據(jù)準備,;②數(shù)據(jù)挖掘;③結果表達和解釋,。數(shù)據(jù)挖掘可以與用戶或知識庫交互,。
數(shù)據(jù)挖掘是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術,,主要有數(shù)據(jù)準備,、規(guī)律尋找和規(guī)律表示三個步驟。數(shù)據(jù)準備是從相關的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集,;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來,;規(guī)律表示是盡可能以用戶可理解的方式(如可視化)將找出的規(guī)律表示出來。數(shù)據(jù)挖掘的任務有關聯(lián)分析,、聚類分析,、分類分析、異常分析,、特異群組分析和演變分析等,。