数据挖掘能做什么
數據挖掘不僅能對過去的數據進行查詢和遍歷,并且能夠對將來的趨勢和行為進行預測,并自動探測以前未發現的模式,從而很好地支持人們的決策。
被挖掘出來的信息,能夠用于信息管理、查詢處理、決策支持、過程控制以及許多其它應用。數據挖掘按其功能劃分主要包括以下幾類:
??? (1) 分類
??? 分類是數據挖掘中應用的最多的方法。分類是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,一般用規則或決策樹模式表示。一個類的內涵描述分為特征性描述和區別性描述。特征性描述是對類中對象的共同特征的描述,區別性描述是對兩個或多個類之間區別的描述。
??? (2) 關聯分析
??? 若兩個或多個數據項的取值重復出現且概率很高時,它就存在著某種關聯,可以建立起這些數據項的關聯規則。關聯分析的目的是找出數據庫中隱藏的關聯網。在大型數據庫中,這種關聯規則是很多的,一般用“支持度”,“可信度”兩個閾值來淘汰那些無用的關聯規則。
??? (3) 聚類
??? 數據庫中的數據可分為一系列有意義的子集或稱為類。在同一類別中,個體之間的距離較小,而不同類別的個體之間的距離偏大。聚類增強了人們對客觀現實的認識,即通過聚類建立宏觀概念。
??? (4)序列模式
??? 通過時間序列搜索出重復發生概率較高的模式,這里強調時間序列對挖掘結果的影響。
??? (5)偏差檢驗
??? 數據庫中的數據常有一些異常記錄,從數據庫中檢測出這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是尋找觀測結果與參照之間的差別。
??? (6) 預測
??? 預測是利用歷史數據找出變化規律,即建立模型,并用此模型來預測未來數據的種類、特征等。
總結
- 上一篇: 教你保存在线视频文件
- 下一篇: 关联规则研究现状