二、数据挖掘的工具
數(shù)據(jù)挖掘的工具介紹
1.工具的分類
一般來說,數(shù)據(jù)挖掘工具根據(jù)其適用的范圍分為以下兩類。
1.1 通用數(shù)據(jù)挖掘工具
通用數(shù)據(jù)挖掘工具不區(qū)分具體數(shù)據(jù)的含義,采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。
1.2 專用數(shù)據(jù)挖掘工具
針對(duì)某個(gè)特定領(lǐng)域的問題提供解決方案,在設(shè)計(jì)算法的時(shí)候充分考慮了數(shù)據(jù)、需求的特性。
2 數(shù)據(jù)挖掘工具選擇
2.1 數(shù)據(jù)挖掘工具選擇參考指標(biāo)
- 功能性:一個(gè)好的數(shù)據(jù)挖掘工具應(yīng)該能夠?yàn)槊總€(gè)步驟體哦那個(gè)相應(yīng)的功能集;
- 可伸縮性:指的是解決負(fù)責(zé)問題的能力;
- 操作的簡(jiǎn)易性:提供友好的用戶界面;
- 可視化程度:數(shù)據(jù)源的可視化、模型的可視化、結(jié)果的可視化;
- 開放性:數(shù)據(jù)挖掘工具與數(shù)據(jù)庫(其它數(shù)據(jù)資源)的結(jié)合能力。
2.2 企業(yè)如何選擇數(shù)據(jù)挖掘工具
- 企業(yè)的數(shù)據(jù)挖掘需求;
- 企業(yè)的數(shù)據(jù)挖掘經(jīng)驗(yàn)和水平;
- 企業(yè)的數(shù)據(jù)狀態(tài)
- 企業(yè)的預(yù)算和工具的性能
3 商用的工具
3.1 SAS Enterprise Miner
- SAS Enterprise Miner是一種通用的數(shù)據(jù)挖掘工具,按照“抽樣-探索-轉(zhuǎn)換-建模-評(píng)估”的方法進(jìn)行數(shù)據(jù)挖掘。可以與SAS數(shù)據(jù)倉(cāng)庫和OLAP集成,實(shí)現(xiàn)從提出數(shù)據(jù)、抓住數(shù)據(jù)到得到解答的“端到端”的知識(shí)發(fā)現(xiàn).
3.2 DBMiner
- DBminer是一個(gè)多任務(wù)數(shù)據(jù)挖掘系統(tǒng),目的是把關(guān)系數(shù)據(jù)庫和數(shù)據(jù)挖掘集成在一起;
- 能完成多種知識(shí)發(fā)現(xiàn):泛化、特性、關(guān)聯(lián)、分類等規(guī)則;
- 多種數(shù)據(jù)挖掘技術(shù):面向?qū)傩缘臍w納、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等;
- 提供交互式的類SQL語言——數(shù)據(jù)挖掘查詢語言DMQL;
- 能與關(guān)系數(shù)據(jù)庫平滑集成。
- https://www2.cs.sfu.ca/CourseCentral/459/han/tutorial/tutorial.html
4 數(shù)據(jù)挖掘開源工具
4.1 Weka
Weka是一款可視化的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘軟件,高級(jí)用戶可以通過Java編程和命令行來調(diào)用其分析組件。同時(shí),Weka也為普通用戶提供了圖形化界面。
4.2 KNIME
KNIME提供了友好的開源數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)分析和數(shù)據(jù)勘探平臺(tái)。KNIME基于Eclipse并通過插件的方式來提供多種功能,并可以集成到各種各樣的開源項(xiàng)目中。
4.3 Orange
Orange提供了友好的界面,Orange的強(qiáng)項(xiàng)在于提供了大量的可視化方法,可以對(duì)數(shù)據(jù)和模型進(jìn)行多種圖像化展示,而且支持智能 搜索合適的可視化形式,支持對(duì)數(shù)據(jù)的交互式探索。
5 總結(jié)
- 數(shù)據(jù)挖掘工具分類
- 數(shù)據(jù)挖掘工具選擇
- 數(shù)據(jù)挖掘商用工具
- 數(shù)據(jù)挖掘開源工具
挖掘商用工具
- 數(shù)據(jù)挖掘開源工具
總結(jié)