数据分析步骤
數(shù)據(jù)挖掘的過程可以分成以下 6 個步驟。
商業(yè)理解:數(shù)據(jù)挖掘不是我們的目的,我們的目的是更好地幫助業(yè)務(wù)決策;所以的從實(shí)際商業(yè)需求出發(fā),在這個基礎(chǔ)上,再對數(shù)據(jù)挖掘的目標(biāo)進(jìn)行定義。
數(shù)據(jù)理解:嘗試收集部分?jǐn)?shù)據(jù),然后對數(shù)據(jù)進(jìn)行探索,包括數(shù)據(jù)描述、數(shù)據(jù)質(zhì)量驗(yàn)證等。這有助于你對收集的數(shù)據(jù)有個初步的認(rèn)知。
數(shù)據(jù)準(zhǔn)備:開始收集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行清洗、數(shù)據(jù)集成等操作
模型建立:選擇和應(yīng)用各種數(shù)據(jù)挖掘模型,并進(jìn)行優(yōu)化,以便得到更好的分類結(jié)果。
模型評估:對模型進(jìn)行評價(jià),并檢查構(gòu)建模型的每個步驟,確認(rèn)模型是否實(shí)現(xiàn)了預(yù)定的商業(yè)目標(biāo)。
上線發(fā)布:模型的作用是從數(shù)據(jù)中找到金礦,也就是我們所說的“知識”;數(shù)據(jù)挖掘結(jié)果如果是日常運(yùn)營的一部分,那么后續(xù)的監(jiān)控和維護(hù)就會變得重要。
《利用Python進(jìn)行數(shù)據(jù)分析》(使用Python的人可以看看)
《Pentaho Kettle解決方案》(ETL工程師會用到)
《精益數(shù)據(jù)分析》(商業(yè)模式畫布,如何構(gòu)建數(shù)據(jù)指標(biāo)體系)
《Tableau數(shù)據(jù)可視化實(shí)戰(zhàn)》
《看穿一切數(shù)字的統(tǒng)計(jì)學(xué)》
《寫給所有人的極簡統(tǒng)計(jì)學(xué)》
繪圖工具:幕布類似與石墨文檔,在其基礎(chǔ)上增加了一鍵生成思維導(dǎo)圖
? ? ? ? ? ? ? ? ? ?xmind需要下載,功能上和process on類似,不過process on有在線版,不需要下載;
? ? ? ? ? ? ? ? ? ?有道云筆記,博客等都可以記錄筆記進(jìn)行分享
?
?
總結(jié)
- 上一篇: 数据分析全景图
- 下一篇: 数据清洗---占据了数据分析师80%的时