CPDA数据分析师:一个完整的数据分析流程
大數(shù)據(jù)在國內(nèi)已經(jīng)火熱了一段時間,無論是政府還是企業(yè)都已開始重視大數(shù)據(jù),紛紛設(shè)立大數(shù)劇部門,數(shù)據(jù)之于企業(yè)的重要性不言而喻。因此優(yōu)秀的企業(yè)為了分析收集來的海量數(shù)據(jù),會毫不猶豫地雇傭?qū)I(yè)級的數(shù)據(jù)分析師來幫助公司進(jìn)行決策,創(chuàng)造價值。
據(jù)某招聘網(wǎng)站調(diào)查,一名有經(jīng)驗的數(shù)據(jù)分析師的年薪不低于20萬。而數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家等則收入更高。作為數(shù)據(jù)分析師,無論最初的職業(yè)定位方向是技術(shù)還是業(yè)務(wù),最終發(fā)到一定階段后都會承擔(dān)數(shù)據(jù)管理的角色。因此,一個具有較高層次的數(shù)據(jù)分析師需要具備完整的知識結(jié)構(gòu)。大數(shù)據(jù)時代,數(shù)據(jù)分析對于企業(yè)決策和發(fā)展起到越來越重要的作用。
1.數(shù)據(jù)采集
了解數(shù)據(jù)采集的意義在于真正了解數(shù)據(jù)的原始面貌,包括數(shù)據(jù)產(chǎn)生的時間、條件、格式、內(nèi)容、長度、限制條件等。這會幫助數(shù)據(jù)分析師更有針對性的控制數(shù)據(jù)生產(chǎn)和采集過程,避免由于違反數(shù)據(jù)采集規(guī)則導(dǎo)致的數(shù)據(jù)問題;同時,對數(shù)據(jù)采集邏輯的認(rèn)識增加了數(shù)據(jù)分析師對數(shù)據(jù)的理解程度,尤其是數(shù)據(jù)中的異常變化。
在數(shù)據(jù)采集階段,數(shù)據(jù)分析師需要更多的了解數(shù)據(jù)生產(chǎn)和采集過程中的異常情況,如此才能更好的追本溯源。另外,這也能很大程度上避免“垃圾數(shù)據(jù)進(jìn)導(dǎo)致垃圾數(shù)據(jù)出”的問題。
2.數(shù)據(jù)的加工整理
在明確數(shù)據(jù)分析目標(biāo)基礎(chǔ)上收集到的數(shù)據(jù),往往還需要進(jìn)行必要的加工整理后才能真正用于分析建模。數(shù)據(jù)的加工整理通常包括數(shù)據(jù)缺失值處理、數(shù)據(jù)的分組、基本描述統(tǒng)計量的計算、基本統(tǒng)計圖形的繪制、數(shù)據(jù)取值的轉(zhuǎn)換、數(shù)據(jù)的正態(tài)化處理等,它能夠幫助人們掌握數(shù)據(jù)的分布特征,是進(jìn)一步深入分析和建模的基礎(chǔ)。
3.數(shù)據(jù)分析
數(shù)據(jù)分析相對于數(shù)據(jù)挖掘更多的是偏向業(yè)務(wù)應(yīng)用和解讀,當(dāng)數(shù)據(jù)挖掘算法得出結(jié)論后,如何解釋算法在結(jié)果、可信度、顯著程度等方面對于業(yè)務(wù)的實際意義,如何將挖掘結(jié)果反饋到業(yè)務(wù)操作過程中便于業(yè)務(wù)理解和實施是關(guān)鍵。
4.數(shù)據(jù)展現(xiàn)
數(shù)據(jù)展現(xiàn)即數(shù)據(jù)可視化的部分,數(shù)據(jù)分析師如何把數(shù)據(jù)觀點展示給業(yè)務(wù)的過程。數(shù)據(jù)展現(xiàn)除遵循各公司統(tǒng)一規(guī)范原則外,具體形式還要根據(jù)實際需求和場景而定。基本素質(zhì)要求如下:
工具:PPT、Excel、Word甚至郵件都是不錯的展現(xiàn)工具,任意一個工具用好都很強大。
形式:圖文并茂的基本原則更易于理解,生動、有趣、互動、講故事都是加分項。
原則:領(lǐng)導(dǎo)層喜歡讀圖、看趨勢、要結(jié)論,執(zhí)行層歡看數(shù)、讀文字、看過程。
場景:大型會議PPT最合適,匯報說明Word最實用,數(shù)據(jù)較多時Excel更方便。
最重要一點,數(shù)據(jù)展現(xiàn)永遠(yuǎn)輔助于數(shù)據(jù)內(nèi)容,有價值的數(shù)據(jù)報告才是關(guān)鍵。
5.數(shù)據(jù)應(yīng)用
數(shù)據(jù)應(yīng)用是數(shù)據(jù)具有落地價值的直接體現(xiàn),這個過程需要數(shù)據(jù)分析師具備數(shù)據(jù)溝通能力、業(yè)務(wù)推動能力和項目工作能力。
數(shù)據(jù)溝通能力。深入淺出的數(shù)據(jù)報告、言簡意賅的數(shù)據(jù)結(jié)論更利于業(yè)務(wù)理解和接受,打比方、舉例子都是非常實用的技巧。
業(yè)務(wù)推動能力。在業(yè)務(wù)理解數(shù)據(jù)的基礎(chǔ)上,推動業(yè)務(wù)落地實現(xiàn)數(shù)據(jù)建議。從業(yè)務(wù)最重要、最緊急、最能產(chǎn)生效果的環(huán)節(jié)開始是個好方法,同時要考慮到業(yè)務(wù)落地的客觀環(huán)境,即好的數(shù)據(jù)結(jié)論需要具備客觀落地條件。
項目工作能力。數(shù)據(jù)項目工作是循序漸進(jìn)的過程,無論是一個數(shù)據(jù)分析項目還是數(shù)據(jù)產(chǎn)品項目,都需要數(shù)據(jù)分析師具備計劃、領(lǐng)導(dǎo)、組織、控制的項目工作能力。
數(shù)據(jù)分析師技能要求
1、數(shù)理統(tǒng)計基礎(chǔ)
作為一名數(shù)據(jù)分析師,一定要掌握一些基礎(chǔ)的、成熟的數(shù)學(xué)模型算法。例如:回歸分析、因子分析、聚類分析、決策樹、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)等。同時建議多看一些博文,看別人對于這個方法的理解,怎么在實際業(yè)務(wù)中應(yīng)用,以及如何優(yōu)化等等。在算法上可以不做到用軟件編寫算法,但是一定要知道原理,知道怎么應(yīng)用,怎么調(diào)整參數(shù),參數(shù)的含義等等。
2、工具
對于一個初級的數(shù)據(jù)分析師要掌握的基礎(chǔ)工具,Excel,SPSS,數(shù)據(jù)庫(如mysql等),隨著大數(shù)據(jù)的來臨,傳統(tǒng)的一些軟件已經(jīng)不足以支撐數(shù)據(jù)分析、數(shù)據(jù)挖掘了,隨著工作年限的增長,工作內(nèi)容的加深,R和Python一定要會一個,目前流行的很多機器學(xué)習(xí)算法要這些軟件才能實現(xiàn)。現(xiàn)在機器學(xué)習(xí)很火,建議多研究一下這方面的內(nèi)容,不論是對于自身的提升還是對職業(yè)發(fā)展都是非常有利的。
3、對行業(yè)的了解程度
對特定行業(yè)的了解可以幫助數(shù)據(jù)分析師盡快進(jìn)入狀態(tài),加速決策的過程。如果缺少這一前提,你的數(shù)據(jù)分析師可能不得不花時間來先對整體行業(yè)有一個大概地認(rèn)知,學(xué)習(xí)相關(guān)知識,然后才能投入其中。
4、溝通能力
現(xiàn)代社會,工作通常要通過分工合作來完成。溝通成為其中必不可少的一環(huán)。所以你想要雇傭的數(shù)據(jù)分析師在這方面有所建樹的話,可以極大地提升工作效率。另外,擁有良好溝通能力的專家懂得合理地呈現(xiàn)數(shù)據(jù)可視化成果并且講好數(shù)據(jù)故事。
要成為高級數(shù)據(jù)分析師的話,一方面是要強化對業(yè)務(wù)的理解,最好是做到通過數(shù)據(jù)分析幫助公司決策方向,或者說促進(jìn)企業(yè)快速增長。另一方面,要加強機器學(xué)習(xí)/數(shù)據(jù)挖掘的專業(yè)知識學(xué)習(xí),將機器學(xué)習(xí)成為數(shù)據(jù)分析的手段。最后,要強調(diào)的是,數(shù)據(jù)分析師是一個實踐的職位,要在實際項目中不斷的訓(xùn)練。
摘自:http://www.shcpda.com/xingyezixun/873.html
總結(jié)
以上是生活随笔為你收集整理的CPDA数据分析师:一个完整的数据分析流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大江大河,随笔观后感
- 下一篇: 工作4年工资8K,还有什么理由不努力?