二、数据挖掘的工具
數據挖掘的工具介紹
1.工具的分類
一般來說,數據挖掘工具根據其適用的范圍分為以下兩類。
1.1 通用數據挖掘工具
通用數據挖掘工具不區分具體數據的含義,采用通用的挖掘算法,處理常見的數據類型。
1.2 專用數據挖掘工具
針對某個特定領域的問題提供解決方案,在設計算法的時候充分考慮了數據、需求的特性。
2 數據挖掘工具選擇
2.1 數據挖掘工具選擇參考指標
- 功能性:一個好的數據挖掘工具應該能夠為每個步驟體哦那個相應的功能集;
- 可伸縮性:指的是解決負責問題的能力;
- 操作的簡易性:提供友好的用戶界面;
- 可視化程度:數據源的可視化、模型的可視化、結果的可視化;
- 開放性:數據挖掘工具與數據庫(其它數據資源)的結合能力。
2.2 企業如何選擇數據挖掘工具
- 企業的數據挖掘需求;
- 企業的數據挖掘經驗和水平;
- 企業的數據狀態
- 企業的預算和工具的性能
3 商用的工具
3.1 SAS Enterprise Miner
- SAS Enterprise Miner是一種通用的數據挖掘工具,按照“抽樣-探索-轉換-建模-評估”的方法進行數據挖掘。可以與SAS數據倉庫和OLAP集成,實現從提出數據、抓住數據到得到解答的“端到端”的知識發現.
3.2 DBMiner
- DBminer是一個多任務數據挖掘系統,目的是把關系數據庫和數據挖掘集成在一起;
- 能完成多種知識發現:泛化、特性、關聯、分類等規則;
- 多種數據挖掘技術:面向屬性的歸納、統計分析、機器學習等;
- 提供交互式的類SQL語言——數據挖掘查詢語言DMQL;
- 能與關系數據庫平滑集成。
- https://www2.cs.sfu.ca/CourseCentral/459/han/tutorial/tutorial.html
4 數據挖掘開源工具
4.1 Weka
Weka是一款可視化的機器學習和數據挖掘軟件,高級用戶可以通過Java編程和命令行來調用其分析組件。同時,Weka也為普通用戶提供了圖形化界面。
4.2 KNIME
KNIME提供了友好的開源數據集成、數據處理、數據分析和數據勘探平臺。KNIME基于Eclipse并通過插件的方式來提供多種功能,并可以集成到各種各樣的開源項目中。
4.3 Orange
Orange提供了友好的界面,Orange的強項在于提供了大量的可視化方法,可以對數據和模型進行多種圖像化展示,而且支持智能 搜索合適的可視化形式,支持對數據的交互式探索。
5 總結
- 數據挖掘工具分類
- 數據挖掘工具選擇
- 數據挖掘商用工具
- 數據挖掘開源工具
挖掘商用工具
- 數據挖掘開源工具
總結