當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

校验用户画像的准确性

發布時間：2024/2/28 编程问答 53 豆豆

生活随笔收集整理的這篇文章主要介紹了校验用户画像的准确性小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

用戶畫像是數據運營的基礎，也是做深度挖掘的一個不可或缺的模塊。只有先打好畫像基礎，確保畫像質量，后續的深挖行為才有突破的可能。

一. 用戶畫像開發中
? ??1.1 Recall、Pecision、K-S、F1曲線、Roc曲線、Confusion Matrix、AUC
? ? 1.2??交叉驗證
二. 用戶畫像上線后
三. 用戶畫像更新
? ? 3.1 用戶回訪
? ? 3.2 機制檢測

在用戶研究的課題中，用戶畫像是幾乎每個公司都會去做的，淺層的包括統計類的：上月購買量，上周活躍天數等；深層的包括洞察類的：潛在需求偏好，生命周期階段等；前者的校驗簡單，后者的校驗需要通過一些特別的方式。本文就洞察類畫像校驗做一系列的梳理。

省略掉預處理設計的過程，畫像校驗的步驟主要集中在畫像開發，畫像上線，畫像更新中，并且三個階段中，每個階段的校驗方式不盡不同

一. 用戶畫像開發中

當我們所開發的用戶畫像是類似于用戶的下單需求、用戶的購車意愿、用戶是否有注冊意愿這一類存在歷史的正負樣本的有監督的問題，我們可以利用歷史確定的數據來校驗我們的畫像準確性。比如，銀行在設計用戶征信的畫像前，會有一批外部購買的壞樣本和好樣本，其實畫像問題就轉化為分類問題去解決評估了。

1.1 Recall、Pecision、K-S、F1曲線、Roc曲線、Confusion Matrix、AUC

針對這類問題，已經有較為成熟的理論基礎，直接利用測試樣本判斷的準確程度判斷畫像是否準確

這張圖是一張非常常見也是有效的來總結Recall、Pecision、Lift曲線、Roc曲線、Confusion Matrix的圖。

FPR = FP/(FP + TN)

Recall=TPR=TP/(TP+FN)

Precision=TP/(TP+FP)

F1曲線:2*Precision*Recall/(Precision+Recall)

Roc曲線：TPR vs FPR，也就是Precision vs Recall

Auc：area under the roc curve ，也就是roc曲線下面的面積，積分或者投點法均可求解。

1.2??交叉驗證

并不是所有畫像都是有監督訓練的畫像，舉個例子，用戶的性別畫像，是一個無監督的刻畫，當你無法通過app端資料填寫直接獲取到的時候，你只能夠通過其他數據特征的對用戶進行分群。

首先，我們在總的數據集中篩選出所有關鍵影響特征，每次將篩選出的特征分為兩塊，測試特征訓練特征，利用訓練特征建立模型，再利用測試特征去判斷模型是否合理（比如女鞋用戶群的女鞋購買次數小于男性用戶群，則次模型異常，刪除），最后集成所有合理模型。

這樣的邏輯中，我們將所有異常不合理的模型全部剔除，訓練過程中就校驗了用戶畫像的準確性。

二. 用戶畫像上線后

ABTest

不得不說，abtest是用戶畫像校驗最為直觀有效的校驗方式。

用戶分流模塊：

一句話解釋，就是A1=A2保證分配隨機，A3好于A1+A2的效果檢驗畫像是否準確？多準確？

三. 用戶畫像更新

3.1 用戶回訪

在畫像刻畫完成后，必然會存在畫像優化迭代的過程，客服回訪是非常常見且有效的方式。

比如，我們定義了一波潛在流失用戶10萬人，隨機抽取1000人，進行回訪，根據回訪結果做文本挖掘，提取關鍵詞，看消極詞用戶的占比；

（來源網絡）

3.2 機制檢測

再比如，我們定義了一波忠誠用戶10萬人，隨機抽取100人，后臺隨機獲取用戶安裝app的列表，看用戶同類app的下載量數目的分布；

橫軸為用戶手機中同類競品安裝量的個數，縱軸為對應的隨機抽樣的100人中的個數。

人群1分布為忠誠用戶畫像最準確的，同類app下載量集中在1附近，定義的用戶極為準確
人群2分布雜亂
人群3分布在下降量異常高的數值附近，定義人群不準確

用戶畫像是數據運營的基礎，也是做深度挖掘的一個不可或缺的模塊。只有先打好畫像基礎，確保畫像質量，后續的深挖行為才有突破的可能。

總結

以上是生活随笔為你收集整理的校验用户画像的准确性的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：移动端设备标识码：DeviceID、IM
下一篇： Anaconda 安装 Tensorfl