数据分析——起源
數(shù)據(jù)分析生命周期:
從數(shù)據(jù)到?jīng)Q策的過程。
1.詢問:業(yè)務(wù)挑戰(zhàn)、目標(biāo)、問題
2.準(zhǔn)備:數(shù)據(jù)生成、收集、存儲(chǔ)、管理
3.處理:數(shù)據(jù)清洗、數(shù)據(jù)完整性
4.分析:數(shù)據(jù)探索、可視化和分析
5.分享:交流和解釋結(jié)果
6.行動(dòng):將見解付諸實(shí)踐以解決問題
EMC的數(shù)據(jù)分析生命周期:
EMC Corporation 的數(shù)據(jù)分析生命周期是循環(huán)的,分為六個(gè)步驟:
1.發(fā)現(xiàn)數(shù)據(jù)
2.預(yù)處理數(shù)據(jù)
3.模型規(guī)劃
4.建筑模型
5.交流結(jié)果
6.行動(dòng)
EMC Corporation 現(xiàn)在更名為 Dell EMC。這個(gè)模型由 David Dietrich 創(chuàng)建,反映了現(xiàn)實(shí)世界項(xiàng)目的周期性。這些階段不是靜態(tài)的里程碑;每一步都連接并通向下一步,并最終重復(fù)。關(guān)鍵問題可幫助分析師測(cè)試他們是否已取得足夠的成就以繼續(xù)前進(jìn),并確保團(tuán)隊(duì)在每個(gè)階段都花費(fèi)了足夠的時(shí)間,并且在數(shù)據(jù)準(zhǔn)備好之前不要開始建模。它與這個(gè)程序所基于的數(shù)據(jù)分析生命周期略有不同,但它有一些共同的核心思想:第一階段是對(duì)發(fā)現(xiàn)和提出問題感興趣;必須先準(zhǔn)備好數(shù)據(jù),然后才能對(duì)其進(jìn)行分析和使用;然后應(yīng)該分享調(diào)查結(jié)果并采取行動(dòng)。
SAS的迭代生命周期:
迭代生命周期由一家名為SAS的公司創(chuàng)建,該公司是領(lǐng)先的數(shù)據(jù)分析解決方案提供商。它可用于產(chǎn)生可重復(fù)、可靠和可預(yù)測(cè)的結(jié)果:
1.詢問
2.準(zhǔn)備
3.探索
4.建模
5.行動(dòng)
6.事實(shí)
7.評(píng)估
SAS 模型通過將其可視化為無窮大符號(hào)來強(qiáng)調(diào)其模型的周期性。它們的生命周期有七個(gè)步驟,我們?cè)谄渌P椭锌吹搅似渲械脑S多步驟,例如 Ask、Prepare、Model 和 Act。但是這個(gè)生命周期也有點(diǎn)不同;它包括行動(dòng)階段之后的一個(gè)步驟,旨在幫助分析師評(píng)估他們的解決方案并可能再次返回詢問階段。?
基于項(xiàng)目的數(shù)據(jù)分析生命周期:
1.識(shí)別問題
2.設(shè)計(jì)數(shù)據(jù)需求
3.預(yù)處理數(shù)據(jù)
4.執(zhí)行數(shù)據(jù)分析
5.可視化數(shù)據(jù)
此數(shù)據(jù)分析項(xiàng)目生命周期由 Vignesh Prajapati 開發(fā)。它不包括第六階段,或者我們所說的行動(dòng)階段。但是,它仍然涵蓋了許多與我們已經(jīng)描述的生命周期相同的步驟。它從識(shí)別問題開始,在分析前準(zhǔn)備和處理數(shù)據(jù),并以數(shù)據(jù)可視化結(jié)束。
大數(shù)據(jù)分析生命周期:
作者 Thomas Erl、Wajid Khattak 和 Paul Buhler 在他們的書《大數(shù)據(jù)基礎(chǔ):概念、驅(qū)動(dòng)程序和技術(shù)》中提出了大數(shù)據(jù)分析生命周期。他們的生命周期建議將階段分為九個(gè)步驟:
1.商業(yè)案例評(píng)估
2.數(shù)據(jù)識(shí)別
3.數(shù)據(jù)采集和過濾
4.數(shù)據(jù)提取
5.數(shù)據(jù)驗(yàn)證和清理
6.數(shù)據(jù)聚合和表示
7.數(shù)據(jù)分析
8.數(shù)據(jù)可視化
9.分析結(jié)果的利用
這個(gè)生命周期似乎比以前的生命周期模型多三四個(gè)步驟。但實(shí)際上,他們只是將我們所說的準(zhǔn)備和處理分解為更小的步驟。它強(qiáng)調(diào)在分析階段之前收集、準(zhǔn)備和清理數(shù)據(jù)所需的各個(gè)任務(wù)。
總結(jié)
- 上一篇: 在ppt中加入python_python
- 下一篇: 如何把mkv转成mp4,请看详细步骤