数据分析步骤
數(shù)據(jù)挖掘的過程可以分成以下 6 個步驟。
商業(yè)理解:數(shù)據(jù)挖掘不是我們的目的,我們的目的是更好地幫助業(yè)務決策;所以的從實際商業(yè)需求出發(fā),在這個基礎上,再對數(shù)據(jù)挖掘的目標進行定義。
數(shù)據(jù)理解:嘗試收集部分數(shù)據(jù),然后對數(shù)據(jù)進行探索,包括數(shù)據(jù)描述、數(shù)據(jù)質(zhì)量驗證等。這有助于你對收集的數(shù)據(jù)有個初步的認知。
數(shù)據(jù)準備:開始收集數(shù)據(jù),并對數(shù)據(jù)進行清洗、數(shù)據(jù)集成等操作
模型建立:選擇和應用各種數(shù)據(jù)挖掘模型,并進行優(yōu)化,以便得到更好的分類結(jié)果。
模型評估:對模型進行評價,并檢查構(gòu)建模型的每個步驟,確認模型是否實現(xiàn)了預定的商業(yè)目標。
上線發(fā)布:模型的作用是從數(shù)據(jù)中找到金礦,也就是我們所說的“知識”;數(shù)據(jù)挖掘結(jié)果如果是日常運營的一部分,那么后續(xù)的監(jiān)控和維護就會變得重要。
《利用Python進行數(shù)據(jù)分析》(使用Python的人可以看看)
《Pentaho Kettle解決方案》(ETL工程師會用到)
《精益數(shù)據(jù)分析》(商業(yè)模式畫布,如何構(gòu)建數(shù)據(jù)指標體系)
《Tableau數(shù)據(jù)可視化實戰(zhàn)》
《看穿一切數(shù)字的統(tǒng)計學》
《寫給所有人的極簡統(tǒng)計學》
繪圖工具:幕布類似與石墨文檔,在其基礎上增加了一鍵生成思維導圖
? ? ? ? ? ? ? ? ? ?xmind需要下載,功能上和process on類似,不過process on有在線版,不需要下載;
? ? ? ? ? ? ? ? ? ?有道云筆記,博客等都可以記錄筆記進行分享
?
?
總結(jié)
- 上一篇: 数据分析全景图
- 下一篇: 数据清洗---占据了数据分析师80%的时