数据挖掘简介
?
???????由于數據挖掘是一門受到來自各種不同領域的研究者關注的交叉性學科,因此導致了很多不同的術語名稱。其中,最常用的術語是"知識發現"和"數據挖掘"。相對來講,數據挖掘主要流行于統計界(最早出現于統計文獻中)、數據分析、數據庫和管理信息系統界;而知識發現則主要流行于人工智能和機器學習界。
??????數據挖掘可粗略地理解為三部曲:數據準備(data?preparation)、數據挖掘,以及結果的解釋評估(interpretation?and?evaluation)。?
??????根據數據挖掘的任務分,有如下幾種:分類或預測模型數據挖掘、數據總結、數據聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等等。
??????根據數據挖掘的對象分,有如下若干種數據源:關系數據庫、面向對象數據庫、空間數據庫、時態數據庫、文本數據源、多媒體數據、異質數據庫、遺產(legacy)數據庫,以及Web數據源。
??????根據數據挖掘的方法分,可粗分為:統計方法、機器學習方法、神經網絡方法和數據庫方法。統計方法中,可細分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數判別等)、聚類分析(系統聚類、動態聚類等)、探索性分析(主元分析法、相關分析法等)、以及模糊集、粗糙集、支持向量機等。機器學習中,可細分為:歸納學習方法(決策樹、規則歸納等)、基于范例的推理CBR、遺傳算法、貝葉斯信念網絡等。神經網絡方法,可細分為:前向神經網絡(BP算法等)、自組織神經網絡(自組織特征映射、競爭學習等)等。數據庫方法主要是基于可視化的多維數據分析或OLAP方法,另外還有面向屬性的歸納方法。?
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
- 上一篇: USB鼠标失灵的解决办法
- 下一篇: 常用计算机文章搜索方法总结