校验用户画像的准确性
用戶畫像是數據運營的基礎,也是做深度挖掘的一個不可或缺的模塊。只有先打好畫像基礎,確保畫像質量,后續的深挖行為才有突破的可能。
一. 用戶畫像開發中
? ??1.1 Recall、Pecision、K-S、F1曲線、Roc曲線、Confusion Matrix、AUC
? ? 1.2??交叉驗證
二. 用戶畫像上線后
三. 用戶畫像更新
? ? 3.1 用戶回訪
? ? 3.2 機制檢測
在用戶研究的課題中,用戶畫像是幾乎每個公司都會去做的,淺層的包括統計類的:上月購買量,上周活躍天數等;深層的包括洞察類的:潛在需求偏好,生命周期階段等;前者的校驗簡單,后者的校驗需要通過一些特別的方式。本文就洞察類畫像校驗做一系列的梳理。
省略掉預處理設計的過程,畫像校驗的步驟主要集中在畫像開發,畫像上線,畫像更新中,并且三個階段中,每個階段的校驗方式不盡不同
一. 用戶畫像開發中
當我們所開發的用戶畫像是類似于用戶的下單需求、用戶的購車意愿、用戶是否有注冊意愿這一類存在歷史的正負樣本的有監督的問題,我們可以利用歷史確定的數據來校驗我們的畫像準確性。比如,銀行在設計用戶征信的畫像前,會有一批外部購買的壞樣本和好樣本,其實畫像問題就轉化為分類問題去解決評估了。
1.1 Recall、Pecision、K-S、F1曲線、Roc曲線、Confusion Matrix、AUC
針對這類問題,已經有較為成熟的理論基礎,直接利用測試樣本判斷的準確程度判斷畫像是否準確
這張圖是一張非常常見也是有效的來總結Recall、Pecision、Lift曲線、Roc曲線、Confusion Matrix的圖。
FPR = FP/(FP + TN)
Recall=TPR=TP/(TP+FN)
Precision=TP/(TP+FP)
F1曲線:2*Precision*Recall/(Precision+Recall)
Roc曲線:TPR vs FPR,也就是Precision vs Recall
Auc:area under the roc curve ,也就是roc曲線下面的面積,積分或者投點法均可求解。
1.2??交叉驗證
并不是所有畫像都是有監督訓練的畫像,舉個例子,用戶的性別畫像,是一個無監督的刻畫,當你無法通過app端資料填寫直接獲取到的時候,你只能夠通過其他數據特征的對用戶進行分群。
首先,我們在總的數據集中篩選出所有關鍵影響特征,每次將篩選出的特征分為兩塊,測試特征訓練特征,利用訓練特征建立模型,再利用測試特征去判斷模型是否合理(比如女鞋用戶群的女鞋購買次數小于男性用戶群,則次模型異常,刪除),最后集成所有合理模型。
這樣的邏輯中,我們將所有異常不合理的模型全部剔除,訓練過程中就校驗了用戶畫像的準確性。
二. 用戶畫像上線后
ABTest
不得不說,abtest是用戶畫像校驗最為直觀有效的校驗方式。
用戶分流模塊:
一句話解釋,就是A1=A2保證分配隨機,A3好于A1+A2的效果檢驗畫像是否準確?多準確?
三. 用戶畫像更新
3.1 用戶回訪
在畫像刻畫完成后,必然會存在畫像優化迭代的過程,客服回訪是非常常見且有效的方式。
比如,我們定義了一波潛在流失用戶10萬人,隨機抽取1000人,進行回訪,根據回訪結果做文本挖掘,提取關鍵詞,看消極詞用戶的占比;
(來源網絡)
3.2 機制檢測
再比如,我們定義了一波忠誠用戶10萬人,隨機抽取100人,后臺隨機獲取用戶安裝app的列表,看用戶同類app的下載量數目的分布;
橫軸為用戶手機中同類競品安裝量的個數,縱軸為對應的隨機抽樣的100人中的個數。
- 人群1分布為忠誠用戶畫像最準確的,同類app下載量集中在1附近,定義的用戶極為準確
- 人群2分布雜亂
- 人群3分布在下降量異常高的數值附近,定義人群不準確
用戶畫像是數據運營的基礎,也是做深度挖掘的一個不可或缺的模塊。只有先打好畫像基礎,確保畫像質量,后續的深挖行為才有突破的可能。
總結
以上是生活随笔為你收集整理的校验用户画像的准确性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 移动端设备标识码:DeviceID、IM
- 下一篇: Anaconda 安装 Tensorfl