三、数据挖掘的类型
1.挖掘的數據類型
數據挖掘能被應用于任何對目標應用有意義的數據類型最基本的形式有:
- 數據庫數據
- 數據倉庫數據
- 事務處理數據庫數據
- 其他類型的數據
1.1 數據庫數據
1.2 數據倉庫數據
數據倉庫是一個從多個數據源收集的信息存儲庫,存放在一致的模式下,并且通常駐留在單個站點上。數據倉庫通過數據清理、數據變換、數據集成、數據裝入和定期數據刷新來構造。
1.3 數據立方體
通常,數據倉庫用稱作“數據立方體”的多維數據結構建模。其中,每個維對應模式中的一個或一組屬性,而每個單元存放某種聚集度量值。數據立方體的操作還包括切片、切塊兒、旋轉等。
在數據挖掘中 ,允許在各種力度進行多維組合探查,因此更有可能發現代表知識的有趣模式。
1.4 事務處理數據庫數據
通常事務處理數據庫的每個記錄代表一個事務,如顧客的一次購物、一個航班訂票,或一個用戶的網頁點擊。一般情況下一個事務包含一個唯一的事務標識號,以及一個組成事務的項的列表。
傳統的數據庫系統不能做這種商業分析。但是基于交易數據的數據挖掘能夠發現這種頻繁模式,即發現那些商品會被一起經常購買。
1.5 其他類型的數據
其他類型的數據包括:
- 時間相關的數據和序列數據(歷史記錄,股票交易)
- 數據流(視頻監控和傳感器數據)
- 空間數據(地圖)
- 工程設計數據(系統部件和集成電路)
- 超鏈接和多媒體數據(文本、圖像、音頻和視頻)
- 圖數據和網絡數據(社會和信息網絡)
- web數據等等(HTML等)
圖數據和網絡數據(社會和信息網絡)
- web數據等等(HTML等)
總結
- 上一篇: 二、数据挖掘的工具
- 下一篇: 四、数据挖掘中常见的挖掘模式