如何迅速成长成为一名数据分析师(都是干货)?
分享一下鵝廠數(shù)據(jù)分析師的 wisehuang 的干貨經(jīng)驗(yàn)。
數(shù)據(jù)分析的下限,取決于邏輯歸納。與其說提高分析質(zhì)量,不如說提升邏輯歸納能力。
邏輯歸納,需要擁有良好的邏輯思維,并結(jié)合領(lǐng)域知識(shí)形成該領(lǐng)域的分析方法。而領(lǐng)域方法,進(jìn)一步歸納則能夠成為通用了方法論。
關(guān)于數(shù)據(jù)分析,本文將從邏輯思維和分析方法2個(gè)角度進(jìn)行解讀,其中分析方法會(huì)介紹數(shù)據(jù)分析前的準(zhǔn)備以及數(shù)據(jù)如何為我們創(chuàng)造長(zhǎng)期價(jià)值。
一、數(shù)據(jù)分析應(yīng)有的邏輯思維
邏輯思維,是在認(rèn)識(shí)事物的過程中借助概念、判斷、推理等思維形式反映客觀現(xiàn)實(shí)的理性認(rèn)識(shí)過程。借助邏輯思維,能夠確立執(zhí)行方向,減少方向的偏移度以及分析的誤差。
原始的數(shù)據(jù)并沒有太多的價(jià)值,它是已經(jīng)發(fā)生的事實(shí)或者結(jié)果。從中發(fā)掘價(jià)值則是數(shù)據(jù)分析的目的。
在數(shù)據(jù)分析中,其過程是與邏輯歸納相近的,過程如下:提出問題?分析問題?提出假設(shè)?驗(yàn)證假設(shè)?輸出結(jié)論
只有具備了良好邏輯思維,才能更好的幫助我們數(shù)據(jù)分析。
認(rèn)識(shí)邏輯,先從邏輯論證的三要素開始,如下圖所示:
在訓(xùn)練自己邏輯思維時(shí),首先要保證信息的完整性,其次才是討論準(zhǔn)確性。如果陳述和提問不夠清晰,后續(xù)論證是沒有意義的。
初步了解了邏輯,接下來將與各位分享4種思維方式以及其運(yùn)用方法,分別是目標(biāo)、結(jié)構(gòu)化、推理、逆向思維。
01 目標(biāo)思維
目標(biāo)思維,作用是明確目標(biāo)的定義及完整性,校準(zhǔn)執(zhí)行的方向。
從邏輯論證的要素來看,目標(biāo)只是一個(gè)論點(diǎn),而判斷論點(diǎn)是否有效、正確,則需要細(xì)究其論據(jù)和論證方式。
將目標(biāo)映射至三要素并進(jìn)行結(jié)構(gòu)化拆解,會(huì)變成我們熟悉的需求4要素,再次延伸又會(huì)變成5W2H法。
熟練運(yùn)用目標(biāo)思維,不僅能幫助我們分析問題,還能運(yùn)用于生活的許多方面。
在陳述問題時(shí)所使用的KWIC方法,其實(shí)也是邏輯要素的延伸:1)K(KEY):核心觀點(diǎn)2)W(Widen):擴(kuò)展核心觀點(diǎn)包含的內(nèi)容3)I(Illustrate):舉例說明佐證觀點(diǎn)4)C(Conclude):總結(jié)
信息越全面,溝通的成本越低,后續(xù)的論證質(zhì)量才能更高。
?
02 結(jié)構(gòu)化思維
目標(biāo)思維強(qiáng)調(diào)的是方向,結(jié)構(gòu)化思維強(qiáng)調(diào)的是拆解和延伸。
在上一節(jié)中目標(biāo)的拆解和延伸使用的就是結(jié)構(gòu)化的思維,它能夠幫助我們將無序、散亂的信息進(jìn)行聚焦、歸納、分類。
2-1、問題樹
問題樹,是大家較為熟悉的方法,也是我們常使用的“腦圖”。它是一種以樹狀圖形來分析存在的問題及其相互關(guān)系的方法,也是邏輯樹的一種類型。
在邏輯樹中,每一層都是下一層的總結(jié)概括,同樹干內(nèi)的延伸范圍相同,不同樹干的延伸范圍相互獨(dú)立。
在使用問題樹時(shí)將一個(gè)已知問題當(dāng)成樹干,然后根據(jù)相關(guān)問題增加樹干或樹枝,它能夠幫助我們更全面的找到相關(guān)項(xiàng)。
設(shè)置第一條樹干時(shí)有兩種方式,自上而下以及自下而上。
自上而下其實(shí)是以終為始,通過最終的目標(biāo)進(jìn)行拆解;自下而上則常見于頭腦風(fēng)暴,當(dāng)缺少拆解思路時(shí),我們可以將信息完全羅列,并對(duì)其進(jìn)行歸類逐層向上聚合。
在拆解時(shí),我們應(yīng)注意樹干間的平衡,假設(shè)某個(gè)樹干上的樹枝過多或過長(zhǎng),其上層的拆解維度可能是不正確的。
2-2、公式法及過程法
公式法,是問題樹的一種延伸。
公式在橫向表示時(shí),我們也稱為金字塔原理。
在邏輯樹的使用場(chǎng)景下,公式法不太關(guān)注細(xì)分場(chǎng)景以及整體漏斗。在進(jìn)行細(xì)化分析時(shí)結(jié)合場(chǎng)景、操作流程,對(duì)公式進(jìn)行進(jìn)一步的細(xì)化。
在結(jié)合過程法時(shí),須注意的點(diǎn)是完全窮舉。
舉個(gè)例子:在活動(dòng)中分析成交時(shí),會(huì)使用訪問人數(shù)、點(diǎn)擊購買按鈕人數(shù)、成交人數(shù)去分析漏斗。但漏斗數(shù)據(jù)往往是不完整的,這會(huì)影響推斷的準(zhǔn)確性。
結(jié)合場(chǎng)景、操作流程并輸出公式進(jìn)行數(shù)據(jù)分析,會(huì)比漏斗更為直觀。
?
以下載app后用戶的注冊(cè)流程為例,通過上圖,可以拆解出以下公式:
a、app注冊(cè)人數(shù)=手機(jī)號(hào)注冊(cè)人數(shù)+微信注冊(cè)人數(shù)
b、微信注冊(cè)人數(shù)=進(jìn)入注冊(cè)頁面人數(shù)+瀏覽其他頁面引流進(jìn)入人數(shù)-進(jìn)入注冊(cè)頁面人數(shù)*跳失率-登錄人數(shù)-點(diǎn)擊手機(jī)號(hào)登錄注冊(cè)人數(shù)
c、手機(jī)號(hào)注冊(cè)人數(shù)=進(jìn)入注冊(cè)頁面人數(shù)+瀏覽其他頁面引流進(jìn)入人數(shù)-進(jìn)入注冊(cè)頁面人數(shù)*跳失率-登錄人數(shù)-點(diǎn)擊微信登錄注冊(cè)人數(shù)-進(jìn)入手機(jī)號(hào)登錄頁面人數(shù)*跳失率-輸入手機(jī)號(hào)未獲取驗(yàn)證碼人數(shù)-獲取驗(yàn)證碼未輸入人數(shù)-輸入驗(yàn)證碼未登錄人數(shù)
公式羅列清楚后,代入數(shù)據(jù)就能夠了解是哪個(gè)數(shù)據(jù)和我們的預(yù)期不同,然后再根據(jù)數(shù)據(jù)優(yōu)化我們的交互。
2-3、二分法及矩陣法
這兩種結(jié)構(gòu)化方式,其實(shí)不太適合用于數(shù)據(jù)分析,但能夠幫助我們梳理思路便于全局思考。
二分法不適用于數(shù)據(jù)分析的原因是,世界不是非黑即白的,它很難將某個(gè)數(shù)據(jù)指標(biāo)的值枚舉完畢。
而矩陣法所呈現(xiàn)的是結(jié)果數(shù)據(jù),難以細(xì)化。
以時(shí)間管理中的四象限法為例:
四個(gè)象限能夠很好的用于任務(wù)分類,關(guān)于“重要”和“緊急”的程度,我們也可以使用坐標(biāo)軸的值進(jìn)行標(biāo)記,但如果要細(xì)究哪個(gè)元素影響了”重要“和”緊急“的值,矩陣法就難以承載了。
03 推理思維
確認(rèn)論點(diǎn),結(jié)構(gòu)化論據(jù),下一步是論證。在論證中運(yùn)用推理思維能夠幫助我們迅速找到問題的異同點(diǎn),從而發(fā)現(xiàn)它們的規(guī)律。
推理主要使用的方法是歸納、演繹、類比法,而在推理過程中還貫穿著對(duì)因果的辯證。
3-1、歸納法
歸納法,指從特殊(部分樣本)到一般(全量樣本)的過程,通俗的說是從個(gè)別的經(jīng)驗(yàn)歸納出普遍規(guī)律的方法。它更偏感性思維,其推理方式不夠嚴(yán)謹(jǐn),常用于開拓思路。
在產(chǎn)品工作中我們會(huì)遇見許多使用歸納法的情景,如:“很多用戶都需要這個(gè)功能,所以我們應(yīng)該盡快實(shí)現(xiàn)。”
通過歸納法拆解后如下圖所示:
這實(shí)質(zhì)上是以偏概全的方法,一旦有一個(gè)用戶不滿足這個(gè)前提,這個(gè)結(jié)論就無法成立。
這里并不是說如果有用戶不需要這個(gè)功能需求就不承接了,而是要增加更多的衡量維度,如樣本數(shù)量、樣本占比、投入產(chǎn)出比等。?
在輸出結(jié)論之前需要判斷樣本是否足夠有代表性,判斷是必然事件還是隨機(jī)事件。
這也是為什么數(shù)據(jù)分析需要長(zhǎng)時(shí)間的收集樣本并觀察數(shù)據(jù),樣本量太小會(huì)使其代表性不足,觀察周期太短會(huì)被數(shù)據(jù)的波動(dòng)所迷惑,很容易讓我們做出錯(cuò)誤的判斷。
3-2、演繹法
演繹法則與歸納法相反,是從既有經(jīng)證實(shí)的普遍性結(jié)論,推導(dǎo)出個(gè)別性結(jié)論的一種方法,常見的表現(xiàn)形式是邏輯三段論。
邏輯三段論的格式為:大前提、小前提、結(jié)論。
假設(shè)大前提為真,小前提為真,那結(jié)論一定為真。演繹法追求的是前后一致,不自相矛盾,但大部分人都倒在了第一步,即大前提本身是不成立的。
不成立的原因是,大前提并非經(jīng)證實(shí)的普遍性結(jié)論,而是通過歸納法輸出的結(jié)論。要避開歸納法的陷阱,我們則需要對(duì)其因果進(jìn)行辯證。
3-3、因果關(guān)系分析法
因果辯證,同時(shí)適用于演繹和歸納法,它們都是由因及果的過程。
近期互聯(lián)網(wǎng)保險(xiǎn)的營(yíng)銷活動(dòng)由于監(jiān)管原因,無法使用現(xiàn)金及優(yōu)惠券獎(jiǎng)品促進(jìn)成交,一定程度上減少了活動(dòng)的數(shù)量。
我們?cè)囍鸾獬隹赡艿囊蚬P(guān)系:
拆解完畢后先不進(jìn)行辯證,而是先對(duì)因果關(guān)系進(jìn)行枚舉:
枚舉完畢后,辯證時(shí)提問3個(gè)問題:1)原因是否真實(shí)?2)結(jié)果是否真實(shí)3)這個(gè)原因一定會(huì)引起這個(gè)結(jié)果嗎?是否有其他的原因?
在上述的案例中假設(shè)原因和結(jié)果都為真,套入第3點(diǎn)做出以下提問:1)使用現(xiàn)金及優(yōu)惠券獎(jiǎng)品,一定會(huì)使成交效果更好嗎,是否有其他的方式?2)不使用這2種獎(jiǎng)品,活動(dòng)一定不能做嗎,是否有其他的獎(jiǎng)品?3)活動(dòng)沒法做,一定不能促進(jìn)成交嗎,是否有其他的方式?
看到這里,我們會(huì)發(fā)現(xiàn)這些原因只是結(jié)果的必要不充分條件。
在推理中,論證完畢也不應(yīng)蓋棺定論。
我們應(yīng)先對(duì)結(jié)論提出假設(shè),并設(shè)計(jì)實(shí)驗(yàn)或采取其他的手段驗(yàn)證假設(shè),最終驗(yàn)證后的結(jié)果才是真正的結(jié)論。
04 逆向思維法”反過來想,總是反過來想。“— — 查理·芒格
逆向思維,同時(shí)具有聚焦和發(fā)散兩種作用。
聚焦,是以終為始,問題樹中的“自上而下”拆解是其表現(xiàn)形式之一。
發(fā)散,是因?yàn)閺恼蛩伎甲優(yōu)槟嫦蛩伎?#xff0c;思考習(xí)慣的改變能夠開拓我們的思路,并幫助我們補(bǔ)全邏輯。
在數(shù)據(jù)分析中,我們能夠怎么使用逆向思維呢?
個(gè)人總結(jié)的逆向方法如下:1)主賓反轉(zhuǎn)正向:用戶購買商品數(shù)量提升了,為什么?逆向:商品被用戶購買的數(shù)量提升了,為什么?
從用戶出發(fā)并沒有錯(cuò)誤,從商品出發(fā)能幫助我們補(bǔ)全分析的維度。
2)謂語反轉(zhuǎn)
正向:活躍度降低了,分析用戶進(jìn)入活動(dòng)入口逆向:活躍度降低了,分析用戶的跳出原因
同樣是活躍度降低,”進(jìn)入“這個(gè)詞會(huì)從入口出發(fā),分析其流量情況。從”跳出“出發(fā),則會(huì)從交互、設(shè)計(jì)層面出發(fā)分析。
3)次序反轉(zhuǎn)
正向:引導(dǎo)用戶成交,捐款后獲得獎(jiǎng)品
逆向:給予用戶獎(jiǎng)品后,引導(dǎo)用戶成交
這里的逆向主要是為了開拓思路,并不是說要直接給予用戶獎(jiǎng)品。在開拓思路后進(jìn)一步延伸,方案可以調(diào)整為,給予用戶部分獎(jiǎng)品,成交后再給予另一部分。
小結(jié)
校正方向,使用目標(biāo)思維;分解問題和提出假設(shè),使用結(jié)構(gòu)化思維;邏輯推理用于論證,而逆向思維則用于補(bǔ)全我們的邏輯。
良好的邏輯思維,結(jié)合領(lǐng)域知識(shí)能夠幫助我們快速形成不同領(lǐng)域的方法,并解決問題。
二、數(shù)據(jù)分析的方法
01 數(shù)據(jù)分析前的準(zhǔn)備
數(shù)據(jù)分析前的準(zhǔn)備過程,在我看來比實(shí)際的分析更為重要。
假設(shè)目標(biāo)是錯(cuò)的,我們就不應(yīng)該執(zhí)行。而目標(biāo)不同,分析類型和分析內(nèi)容也不同,同時(shí)執(zhí)行多個(gè)方向,很容易使自己陷入混亂。
1-1、分清楚目標(biāo)和指標(biāo)
數(shù)據(jù)分析,能幫助我們了解業(yè)務(wù)運(yùn)行狀況,并從中發(fā)現(xiàn)問題、優(yōu)化問題。其次,還能夠幫助洞察下一個(gè)增長(zhǎng)點(diǎn)。
但數(shù)據(jù)分析的意義,往往在數(shù)據(jù)產(chǎn)生之前。我們應(yīng)圍繞產(chǎn)品目標(biāo),進(jìn)行產(chǎn)品設(shè)計(jì)以及運(yùn)營(yíng)策劃。如果最開始的目標(biāo)及指標(biāo)設(shè)置錯(cuò)誤,后續(xù)的工作將難以為繼。
目標(biāo)是結(jié)果,而指標(biāo)是對(duì)結(jié)果分拆的具體要求,是對(duì)目標(biāo)的衡量。
假設(shè)我們的目標(biāo)是提升年度成交金額,那衡量這個(gè)目標(biāo)的方法是什么呢?
根據(jù)衡量的方法我們才能定向的設(shè)置調(diào)整產(chǎn)品設(shè)計(jì)及運(yùn)營(yíng)策略。如果缺少可衡量目標(biāo)的單位和方法,目標(biāo)會(huì)難以達(dá)成。
而圍繞目標(biāo)設(shè)置數(shù)據(jù)的采集方案,可以大大節(jié)省數(shù)據(jù)過濾和清洗的時(shí)間。
甚至于在明確指標(biāo)后再最開始就設(shè)置好分析模型,通過監(jiān)測(cè)模型中的數(shù)據(jù)情況更及時(shí)的發(fā)現(xiàn)問題,做出更高質(zhì)、高效的決策。
1-2、辨別指標(biāo)的目的
辨別了目標(biāo)和指標(biāo),下一步則是運(yùn)用結(jié)構(gòu)化思維進(jìn)行拆解、延伸。
在拆解之前,需要對(duì)自己提問:拆解出的指標(biāo)目的是什么?根據(jù)目的我們才能有傾向性的分析。
根據(jù)指標(biāo)目的,可以分為結(jié)果指標(biāo)、過程指標(biāo)以及觀察指標(biāo)。
結(jié)果指標(biāo)用于衡量目標(biāo),過程指標(biāo)用于體現(xiàn)如何完成。觀察指標(biāo)則指的受影響指標(biāo),其是否會(huì)受到自變量(結(jié)果指標(biāo))的影響,導(dǎo)致上升或下降。
在上圖中,基于成交訂單數(shù),設(shè)置過程指標(biāo)為訂單平均金額及商品分布能幫助我們了解完成的方式。
而觀察指標(biāo)的設(shè)置,是為了跳出框架思考。
上圖的用戶付費(fèi)率,可以監(jiān)測(cè)成交訂單數(shù)上升,是否帶動(dòng)用戶付費(fèi)率的上升,從而判斷是局部還是整體上升;而成交深度及ARPU/LTV則可以幫助我們考察下一個(gè)增長(zhǎng)點(diǎn)是什么。
在設(shè)置結(jié)果指標(biāo)時(shí),除了核心指標(biāo),還應(yīng)輔以制衡性指標(biāo),它的目的是希望核心指標(biāo)完成的更為健康。
核心指標(biāo)和制衡性指標(biāo)所延展的過程、觀察指標(biāo)是不同的。
1-3、確認(rèn)分析類型完成了目標(biāo)和指標(biāo)的設(shè)置,接下來是對(duì)每個(gè)指標(biāo)進(jìn)行細(xì)化分析,分析類型包含:描述性分析、預(yù)測(cè)性分析和規(guī)范性分析。類型不同,作用也不同。
1)描述性分析表現(xiàn)形式:數(shù)據(jù)報(bào)表
數(shù)據(jù)報(bào)表能夠幫助我們描述事件發(fā)展的情況,但很難解釋某種結(jié)果發(fā)生的原因和未來可能的趨勢(shì)。
它更偏向結(jié)果性的描述,此前的結(jié)果對(duì)此后是不具備太多參考意義的。
2)預(yù)測(cè)性分析表現(xiàn)形式:用戶相似度及物品相似度計(jì)算、用戶購買飽和度、用戶成交影響因子
預(yù)測(cè)性分析可以理解為對(duì)結(jié)果和變量的關(guān)系進(jìn)行預(yù)測(cè)的過程,包含相似度、相關(guān)性分析、回歸分析等。
相似度多用于推薦算法,通過計(jì)算用戶的相似度和商品相似度從而推薦給用戶。而相關(guān)分析用于預(yù)測(cè)變量的關(guān)聯(lián)性,如用戶的成交會(huì)受什么因素影響。
3)實(shí)證性分析及規(guī)范性分析
表現(xiàn)形式:A/B實(shí)驗(yàn)
實(shí)證性分析,指是什么,偏向于客觀;規(guī)范性分析指應(yīng)當(dāng)做什么,偏向于主觀。
在實(shí)際使用過程,上述的4種分析類型常常會(huì)被混合使用,混合使用時(shí)應(yīng)明確不同類型我們應(yīng)采取的分析維度。
數(shù)據(jù)分析是有順承關(guān)系的,先采集事實(shí),再根據(jù)事實(shí)或者預(yù)測(cè),提出我們的假設(shè)。逐步灰度地驗(yàn)證假設(shè),最終才輸出我們的結(jié)論。
不能將主觀猜測(cè)強(qiáng)加于事實(shí)之上,已經(jīng)發(fā)生的結(jié)果并不一定是未來的結(jié)果
02 數(shù)據(jù)分析如何帶來長(zhǎng)期價(jià)值
學(xué)習(xí)了方法,做好了準(zhǔn)備,終于進(jìn)入了分析的環(huán)節(jié)。
筆者此前面向的數(shù)據(jù)分析,常常是“一錘子買賣”,花了很大的力氣采集數(shù)據(jù)卻沒有了下文。
為了使有用功更多,下文將從用戶和收益2個(gè)維度分享數(shù)據(jù)如何為我們沉淀長(zhǎng)期價(jià)值。
2-1、了解我們的用戶
這一步是為了讓我們知道完成指標(biāo)的用戶是誰,常常以產(chǎn)品的會(huì)員體系作為切入點(diǎn)。會(huì)員體系越清晰,分析效果越好。
本節(jié)將以電商產(chǎn)品為例,和各位分享如何基于用戶的延伸分析。
1)基礎(chǔ)信息
基礎(chǔ)信息,指用戶本身的屬性。
身份特征,可以從自然屬性、社會(huì)屬性向下細(xì)分,包含用戶的性別、年齡、職業(yè)、教育等。
渠道屬性,指用戶的注冊(cè)時(shí)間、注冊(cè)平臺(tái)、注冊(cè)來源等。
2)決策類型
決策類型,主要分為決策周期、品類偏好、促銷偏好、對(duì)象偏好,這是用戶分析中常常被忽略的一方面。
決策周期中的首次訪問,指的首次觸及該商品的時(shí)間。結(jié)合次數(shù)、時(shí)長(zhǎng)以及成交時(shí)間,從而了解用戶的決策周期。
品類偏好,結(jié)合品牌和歷史成交單數(shù),能夠幫助我們獲悉品牌、價(jià)格綜合對(duì)用戶的影響。
而成交品類、商品、單數(shù)則是幫助我們理解其品類購買深度及路徑,用于進(jìn)行關(guān)聯(lián)推薦和評(píng)判用戶的價(jià)值。
促銷偏好,結(jié)合品類和折扣金額了解用戶的敏感度,能更好的提高其轉(zhuǎn)化率。對(duì)象偏好,同樣是了解購買深度及路徑,不過維度不同。
在用戶層面的分析,此前接觸的一些朋友都非常熱衷于使用RFM模型,在使用過程中也應(yīng)“因地制宜”。
3)購買路徑
品類深度、對(duì)象深度是影響決策類型的因子,當(dāng)它們?cè)谫徺I路徑時(shí)則聚焦于次序。
根據(jù)次序,制定運(yùn)營(yíng)的發(fā)力點(diǎn),再遵循用戶的購買路徑制定轉(zhuǎn)化路徑。
在用戶分布相對(duì)穩(wěn)定的前提下,應(yīng)順從用戶的購買規(guī)律而非傾力于另一條主線。
一專多強(qiáng)的前提是專,只有聚焦優(yōu)勢(shì)品類或主題建立了優(yōu)勢(shì),才能為其他的方向供應(yīng)炮彈。
4)增長(zhǎng)觀察
前面解決的問題是:他是誰,買什么以及怎么買。最后一點(diǎn),則是增長(zhǎng)觀察。
購買路徑聚焦于次序,增長(zhǎng)觀察聚焦于深度。購買的次序是運(yùn)營(yíng)的主線,購買的深度用于精細(xì)化運(yùn)營(yíng)。
了解用戶在品類和對(duì)象的購買深度,再輔以ARPU與LTV的比對(duì),從用戶的剩余潛力尋找平臺(tái)增長(zhǎng)點(diǎn)的方式。
2-2、建立你的用戶模型
了解用戶的下一步,是建立用戶模型。
在一次交流會(huì)上,前輩阿翹對(duì)我提問:“你所負(fù)責(zé)的產(chǎn)品,用戶畫像是怎么樣的?”
當(dāng)時(shí)我把平臺(tái)用戶的地域、年齡、性別等分布介紹了一番。緊接著他提問:“根據(jù)這樣的畫像你能夠做什么呢?”
再后來,我才學(xué)會(huì)了把數(shù)據(jù)聚合成特征,把特征集合成模型。
基于對(duì)用戶的認(rèn)識(shí)建立模型,以上一小節(jié)的決策模型為例。
將決策類型、品類偏好、對(duì)象偏好、促銷偏好4個(gè)因子的關(guān)聯(lián),并輔以用戶的基礎(chǔ)信息進(jìn)行組合。
如:“精打細(xì)算、專注大牌、疼愛孩子的母親”。
這樣一來冰冷的數(shù)據(jù)也被賦予了情感化的表達(dá),無論是產(chǎn)品設(shè)計(jì)、交互設(shè)計(jì)、產(chǎn)品運(yùn)營(yíng)都會(huì)變得容易的多。
建立起用戶模型,才能夠更好地進(jìn)行情感化設(shè)計(jì)、精細(xì)化運(yùn)營(yíng)。
2-3、分析與收益相關(guān)的行為
收益,常用成交或ROI進(jìn)行衡量。那我們?cè)趺磁袛嗯c收益相關(guān)的行為呢?有關(guān)程度又有多高?
判斷相關(guān)性及其程度時(shí),使用的方法是:相關(guān)性分析。
相關(guān)性分析主要用于:a、判斷兩個(gè)或多個(gè)變量之間的統(tǒng)計(jì)學(xué)關(guān)聯(lián);b、如果存在關(guān)聯(lián),進(jìn)一步分析關(guān)聯(lián)強(qiáng)度和方向。
根據(jù)數(shù)據(jù)的類型不同,所采取分析方法不同。
關(guān)于收益及影響收益的行為,二者都屬于無序分類變量,此類數(shù)據(jù)的分析方法是卡方校驗(yàn)。
卡方檢驗(yàn),用于統(tǒng)計(jì)樣本的實(shí)際觀測(cè)值與理論推斷值之間的偏離程度,如果卡方值越大,實(shí)際觀測(cè)值與理論推斷值偏差程度越大。
反之,二者偏差越小;若兩個(gè)值完全相等時(shí),卡方值就為0,表明理論值完全符合。
在實(shí)際分析時(shí),會(huì)先進(jìn)行假設(shè),并通過計(jì)算判定其假設(shè)成立的概率從而反推其不成立的概率。
以判定關(guān)注與成交行為是否有關(guān)為例,介紹卡方校驗(yàn)。
1)提出假設(shè)假設(shè):關(guān)注與成交無關(guān)
2)計(jì)算實(shí)際觀測(cè)數(shù)據(jù)及理論推測(cè)數(shù)據(jù)將關(guān)注及成交的相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),可得出下表:
根據(jù)表格,可計(jì)算出綜合的成交率等于58.3%。
假設(shè)關(guān)注與成交行為無關(guān),成交率應(yīng)不隨關(guān)注行為變化而變化,或數(shù)據(jù)抖動(dòng)較小。
將觀測(cè)的成交率代入原表,并得出理論推斷值。
完成了這一步,就可以進(jìn)行卡方檢驗(yàn)的計(jì)算了。
3)卡方校驗(yàn)計(jì)算
繼續(xù)代入公式
當(dāng)我們計(jì)算出卡方值時(shí),可以初步判定由于卡方值較大,實(shí)際觀測(cè)值與理論推斷值差異較為明顯,原假設(shè)關(guān)注與成交無關(guān)成立的可能性是比較小的。
4)計(jì)算自由度及P值而到了判定可能性具體的程度,則是根據(jù)P值(用于判斷判定假設(shè)檢驗(yàn)結(jié)果)進(jìn)行校驗(yàn),P值越小,原假設(shè)關(guān)注與成交無關(guān)的概率也越小。
由于其自由度等于1,結(jié)合卡方值再查詢卡方分布表可得P<0.01,所以原假設(shè)成立的可能也越小,即關(guān)注與成交有關(guān)的概率非常大。
在實(shí)際使用時(shí),同樣的也須兼顧樣本和觀測(cè)時(shí)間周期,樣本包含準(zhǔn)確性和數(shù)量,觀測(cè)時(shí)間周期則用于分辨其抖動(dòng)性。這2者較為基礎(chǔ)也就不過多描述了。
相關(guān)性分析,用于代表相關(guān)程度,只能說明有關(guān)但并不能說明因果性。
對(duì)變量之間的依賴關(guān)系進(jìn)行定量關(guān)系及因果關(guān)系的研究,我們還會(huì)使用回歸分析進(jìn)行計(jì)算。但由于計(jì)算方式并非本文的重心,在此也不過多的贅述了。
本小節(jié),也有較多的概念并未在本文提及,此部分將附在文末。
?
小結(jié)
個(gè)人認(rèn)為數(shù)學(xué)方法是非常重要的領(lǐng)域知識(shí),很多時(shí)候不是不會(huì)數(shù)據(jù)分析,而是不知道使用什么方法分析。因?yàn)椴辉娺^,所以也未曾往陌生的方向思考。
遇到這樣的問題時(shí),先運(yùn)用逆向思維確認(rèn)分析目標(biāo),其次再進(jìn)行結(jié)構(gòu)化的拆解,再逐層學(xué)習(xí)分析時(shí)應(yīng)該使用的方法。
若時(shí)間寬裕,還是建議閱讀統(tǒng)計(jì)學(xué)相關(guān)的書籍。耐下性子閱讀,工具書的收益會(huì)比大部分同領(lǐng)域的文章都大。
總結(jié)
以上是生活随笔為你收集整理的如何迅速成长成为一名数据分析师(都是干货)?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从无到有算法养成篇-线性表历练
- 下一篇: tableau必知必会之轻松搞定 关系网