数据产品-数据分析方法论和分析方法介绍
作為數據產品,前期的數據分析工作是必不可少的,只有經歷過足夠多的數據分析小活,對業務的認知和對底層數據的熟悉度才能夠足夠深入,足夠支撐我們將底層的需求提升成為數據產品層面上的需求。而數據分析的方法層出不窮,但很多都是基于前人最基礎的數據方法論所衍生出來的,因此對原始常見的數據方法論的了解和認知程度很大層度影響了后面的工作。本篇文章將介紹常見的數據分析方法,并會在自己工作過程中,結合實際的事件進行不斷的豐富。
數據分析流程: 明確分析的目的并提出問題>>數據采集>>數據處理>>數據探索>>分析數據>>得到可視化結果
營銷方面的理論模型有: 4P、用戶使用行為、STP理論、SWOT等。
管理方面的理論模型有: PEST、5W2H、時間管理、生命周期、邏輯樹、金字塔、SMART原則等
基本分析方法: 對比分析,分組分析,交叉分析,結構分析,漏斗分析,多維分解,因素分析,矩陣分析等
高級分析方法: 相關分析,回歸分析,聚類分析,判斷分析,成分分析,因子分析,時間序列等
新進發展起來的分析方法: 同期群分析,用戶分層和用戶分群,A/B測試,RFM模型,用戶路徑分析等
常用分析維度指標: 流量、用戶、訂單、內容、活動
一、營銷方面的理論模型
1、4P理論
說明: 從產品(Product)、價格(Price)、渠道(Place)和促銷(Promote)這四個方面分析市場。適用于公司整體經營狀況的分析,通過將四者的結合、協調發展,從而提高企業的市場份額,達到最終獲利的目的
產品:指公司提供什么產品或服務?那個產品銷量最好?是否與用戶需求一致?購買產品的都是些什么用戶?
價格:公司收入如何?用戶能接受的價格時什么樣?用戶的支付方式?
渠道:公司的渠道方式有哪些?各種渠道的轉化率、地區覆蓋率等?渠道政策的吸引力?
促銷:投入多少促銷資源?效果如何?
2、用戶使用行為理論
說明: 認知—熟悉—試用—使用—忠誠。用戶行為指用戶為獲取、使用產品或服務才去的各種行動,首先要認知熟悉,然后試用,再決定是否繼續消費使用,最后成為產品或服務的忠實用戶
用戶行為分析對應的五大場景分別是:拉新,轉化,促活,留存,變現
用戶行為分析是最為常見的分析工作,特別是以軟件為核心的業務的公司,常會分析軟件的用戶信息、點擊信息、異常信息等
3、SWOT理論
說明: S:strengths(優勢),weaknesses(劣勢),Opportunities(機會),Trreats(威脅) SWOT分析又稱態勢分析法,基于內外部競爭環境和競爭條件下的態勢分析,就是將與研究對象密切相關的各種主要內部優勢、劣勢和外部的機會和威脅等,通過調查列舉出來,并依照矩陣形式排列,然后用系統分析的思想,把各種因素相互匹配起來加以分析,從中得出一系列相應的結論,而結論通常帶有一定的決策性
4、STP理論
說明:市場細分(Segmentation)、選擇適當的市場目標(Targeting)和市場定位(Positioning),是戰略營銷的核心內容。STP理論是指企業在一定的市場細分的基礎上,確定自己的目標市場,最后把產品或服務定位在目標市場中的確定位置上。
二、管理方面的理論模型
1、PEST理論
說明: 從政治(Politics)、經濟(Economy)、社會(Society)、技術(Technology)這4個方面分析內外環境。該方法適用于行業分析、企業戰略管理、產品分析等。常見于行業報告中的分析方法
政治環境:政治體制、經濟體制、財政政策、稅收政策、產業政策、投資政策等
社會環境:人口規模、性別比例、年齡結構、生活力式、購買習慣、城市特點等
技術環境:折舊和報廢速度、技術更新速度、技術傳播速度、技術商品化速度等
經濟環境:GDP及增長率、進出口總額及增長率、利率、匯率、通貨膨脹率、消費價格指數、居民可支配收入、失業率、勞動生產率等
2、5W2H理論
說明: 從Why、When、Where、What、Who、How、How much 這7個常見的維度分析問題
-------最常見的例子:需要組織一個拉新活動來增長網站新用戶注冊量,使用5W2H方法來思考--------
What:要舉辦一個什么樣的拉新活動?活動的助力或阻力是什么?具體工作有哪些?
Why:為什么要舉辦這個活動?為什么要采取線上/線下的活動形式?
Who:活動面向的用戶是哪些人?參加活動的工作人員有哪些?誰負責哪部分工作?
When:活動策劃什么時候完成?什么時候開始宣傳?活動舉辦的時間?
Where:活動在哪舉辦?是線上(宣傳渠道有哪些?活動渠道是?)還是線下(具體地點是?在哪做活動宣傳?)活動
How:活動舉辦的形式是?通過什么方式來吸引用戶?怎么做宣傳?
How much:我們期待達成的目標注冊量是多少?活動需要的選產成本是什么?
------當做分析的時候,也可以用5W2H來思考工作的進行--------
我做這個的分析報告目的是什么?為什么要做(why)?
要做成什么樣的形式,會用到什么樣的數據,用到什么樣的方法(what)?
做這個分析的時候可能會涉及到哪些業務線的人,需要誰的幫助(who)?
什么時候開始做,截止期限是什么(when)?
要達到怎樣的分析高度—可以是技術層面,也可以是職位層面(where)?
采取什么樣的分析分析,怎么樣分析才能符合業務背景(How)?
在整個分析過程中要付出多少努力?(How much)?
3、邏輯樹理論
說明: 又稱問題樹、演繹樹或分解樹等。它將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展。適用于業務問題專題分析
邏輯樹分析法三原則:
a、要素化:把相同問題總結歸納成要素
b、框架化:將各個要素組成框架,遵守不重不漏原則
c、關聯化:框架內的各要素保持必要的相互關系,簡單而不孤立
---------麥肯錫邏輯樹一共分為7個步驟---------
第一步確認你要解決什么問題
第二步是分解問題,運用樹枝的邏輯層層展開
第三步是剔除次要問題
第四步是制定詳細的工作計劃,并將計劃分為可執行的帶日期的步驟
第五步是進行關鍵分析,對于關鍵驅動點再通過頭腦風暴,進行分析找到解決方案
第六步綜合分析結果,建立論證
第七步陳述工作過程,進行交流
4、SMART原則
說明:SMART原則(Specific具體、Measurable可度量、Attainable可實現、Relevant現實性、Time-based時限性)
是一種目標管理方法,按照這個原則制定出的目標才能保證可實施、可跟進、可考核,也更容易實現。
三、基本分析方法
1、交叉分析法
說明: 用于分析兩個變量之間的相互關系的一種基本數據分析法。把統計分析數據制作成二維交叉表格,將具有一定聯系的變量分別設置為行變量和列變量,兩個變量在表格中的交叉結點即為變量值,通過表格體現變量之間的關系,稱為交叉分析法
2、矩陣關聯分析法
說明: 矩陣分析法是指根據事物的兩個重要屬性作為分析的依據,進行分類關聯分析,找出解決問題的一種分析方法,也稱為象限圖分析法。以屬性A為橫軸,屬性B為縱軸,在兩個軸上分別按照某標準進行劃分,構成四個象限,將待分析的主體項目對應投射進四象限中,可直觀表現出兩屬性的關聯性。
3、漏斗分析方法
說明: 轉化漏斗分析是業務分析的基本模型,最常見的是把最終的轉化設置為某種目的的實現,最典型的就是完成交易。 漏斗幫助我們解決兩方面的問題:
①在一個過程中是否發生泄漏,如果有泄漏,我們能在漏斗中看到,并且能夠通過進一步的分析堵住這個泄漏點。
②在一個過程中是否出現了其他不應該出現的過程,造成轉化主進程收到損害。
---------比如一個電商的活動頁,它的漏斗模型應該是這樣的--------
四、高級分析方法
1、聚類分析
說明: 聚類分析常用于數據挖掘當中,也常用于數據標簽指標聚合之中,樣本個體或指標變量按其具有的特性進行分類,尋找合理的度量事物相似性的統計量。
性質分類:
a、Q型聚類分析:對樣本進行分類處理,又稱樣本聚類分祈 使用距離系數作為統計量衡量相似度,如歐式距離、極端距離、絕對距離等
b、R型聚類分析:對指標進行分類處理,又稱指標聚類分析 使用相似系數作為統計量衡量相似度,相關系數、列聯系數等 方法分類:
a、系統聚類法:適用于小樣本的樣本聚類或指標聚類,一般用系統聚類法來聚類指標,又稱分層聚類
b、逐步聚類法:適用于大樣本的樣本聚類
c、其他聚類法:兩步聚類、K均值聚類等
2、時間序列分析
說明: 動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用于解決實際問題 時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動
五、新進發展起來的分析方法
1、RFM模型
從最近一次消費(Recency)
客戶最近一次消費距離現在的時間,消費頻率(Frequency)
客戶在固定時間內的購買次數(一般是1年),消費金額(Monetary)
客戶在一段時間(通常是1年)內的消費金額這3個方面來衡量客戶價值和客戶創利能力
--------根據三維圖表,以RFM為XYZ軸,1代表高,0代表低,進行用戶分層--------------
六、常用分析維度指標
1、流量
訪問:PV、UV、IP(最常見);跳出率、平均訪問時長、平均訪問頁數等;使用設備、操作系統、瀏覽器、地域分布等訪問行為
注冊:注冊人數、注冊走勢、累計注冊人數、達成率等
渠道&推廣:來源渠道分布、總消費、展示量、點擊率、點擊率、平均點擊價格、轉化率、轉化成本、ROI等
2、用戶
活躍/登錄:活躍/登錄:DAU、WAU、MAU、活躍率、登錄人數等
留存:次日留存率、周留存率、月留存率等,還有按渠道去分析留存率
流失:流失率,流失人數、每日平均流失人數
付費:付費人數、付費轉化率、單筆訂單平均金額等 其他:每日評論人數、收藏人數、分享人數
頭像:一方面分析用戶屬性:關注年齡、性別、學歷、職業、地域、婚否、收入、興趣等;另一方面分析用戶行為:登錄次數、活躍率、累計消費金額、最近一次購買、購買次數、復購率等
3、訂單
付費人數、新增付費人數;總金額、每日訂單數、平均每日成交額、客單價;付費金額、付費毛利、付費利潤、復購率、ARPU、付費各個路徑轉化等
4、內容
PV、UV;UGC、PGC、文章數、關注數、閱讀數、互動數(評論、點贊等)、傳播數(轉發、分享等)
5、活動
活動頁PV、UV、新增人數、參與人數、登錄人數、轉化人數、轉化成交金額、ARPU、優惠券發放/使用人數、營銷成本、營銷轉化率、ROI、分享人數、分享次數等,數據要根據活動類型而定。
總結
以上是生活随笔為你收集整理的数据产品-数据分析方法论和分析方法介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++ 流操作符重载函数
- 下一篇: Luogu P3521 [POI2011