日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据产品-规则型和挖掘型标签构建案例

發(fā)布時間:2025/3/17 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据产品-规则型和挖掘型标签构建案例 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據產品經理在構建數據標簽的過程中,最為常見的是構建統(tǒng)計性的標簽,其很大原因是統(tǒng)計型標簽的可解釋型比較強,開發(fā)周期很短,容易根據業(yè)務需要進行調整。而對于規(guī)則型和挖掘型標簽,其構建周期較長,而且可解釋性較差,很難真正定義一個挖掘型標簽是絕對的可應用型。但作為數據產品經理,需要知曉這兩種類型標簽的構建過程,也需要了解一些統(tǒng)計學理論和算法理論,才能夠在需要之時構建對應的標簽

一、規(guī)則型-用戶生命周期分組

1、背景說明

通過生命周期的判定,對不同階段用戶采取不同運營手段,結合后續(xù)用戶中心的流失預警建立,減少用戶流失,及時挽回沉默、流失用戶,并根據數據分析結果形成通用規(guī)則型標簽

2、用戶分組劃分核心

五個分組:新手期賬號、新增賬號流失、活躍賬號、沉默賬號、活躍賬號流失
①活躍用戶:連續(xù)多久未上線可以判定流失?
②新用戶:注冊后多久未上線可以判定當日流失?

3、流失劃分核心點

①“新用戶流失界線”:新用戶注冊后連續(xù)m天未上線——找到m值
②“活躍用戶流失界線”:活躍用戶連續(xù)n天未上線-----找到n值
注:當新用戶在注冊后m天內有過上線,即切換活躍用戶流失界線的口徑來計算流失

4、根據二八原則尋找分界點

①新用戶流失界限分界點
A、注冊當天為第0天
B、樣本選取T日的新注冊賬號;T范圍限定在7.1-10.30期間,樣本量為7017235
C、連續(xù)Y天未上線新用戶的回流率=注冊后連續(xù)Y天未上線的用戶在T+Y+1日及之后(截止至11.27)有過回流的人數/連續(xù)Y天未上線的新用戶總數

結論:根據二八原則,找到回流率20%的分界點對應的天數值作為新用戶流失界限的分界點為6天,即新用戶注冊后,第1-6天均未上線視為當日流失用戶

②活躍用戶流失界限分界點
A、樣本選取距離11.27日,182天(即5.28)之前的活躍用戶;樣本量為5180595
B、最后一次活躍間隔天數=活躍用戶的最后一次活躍時間-上一次活躍時間

結論:根據二八原則,找到80%人數占比的分界點為活躍流失用戶的分界點為27天,再找有百分之50%會再次活躍的人群定義為活躍用戶,找到分界點為3天。即連續(xù)3天至27天未上線的用戶,視為沉默用戶;連續(xù)27天以上未上線的活躍用戶,有80%的可能性不會再上線,視為流失用戶

5、用戶生命周期分層


說明:以此分層信息,可以構建用戶生命周期標簽,基于不同的數值區(qū)間劃分對應的分組信息

二、挖掘型-賬號流失概率

1、賬號流失概率

基于用戶生命周期分組進行預測
說明:
A、新增賬號流失&活躍賬號流失:流失概率100%
B、新手期賬號屬于新賬號
C、活躍賬號、沉默賬號屬于老賬號
計算規(guī)則:計算每一個賬號截至計算時的流失概率

2、判斷過程

使用不同的模型和特征對新賬號和老賬號進行流失概率判定
A、特征選取:主要是用戶的登錄上線情況特征,基于算法訓練提取主要影響特征因素

B、驗收方法:使用測試集,比較其【流失概率】和【實際是否流失】的AUC (Area Under Curve) 值
C、驗收標準:AUC值的分布(具有通用的行業(yè)取值分層值,至少需要大于0.5)
AUC值解釋(百度百科)
AUC = 1,是完美分類器
AUC = [0.85, 0.95], 效果很好
AUC = [0.7, 0.85], 效果一般
AUC = [0.5, 0.7],效果較低,但用于預測股票已經很不錯了
AUC = 0.5,跟隨機猜測一樣(例:丟銅板),模型沒有預測價值
AUC < 0.5,比隨機猜測還差;但只要總是反預測而行,就優(yōu)于隨機猜測

3、模型部署

算法訓練過程的細節(jié)不太理解,感興趣的可以自己多去了解。將模型訓練完成后進行部署定期計算并進行增量數據存儲,記錄每天對應用戶數值情況,形成挖掘型標簽

三、挖掘型-用戶內容偏好

用戶偏好內容(TF-IDF):構建用戶的內容分類的偏好情況標簽

1、結果1:無場景權重

A、對內容單元互動行為內容分類TF-IDF算法求出每個用戶身上內容分類標簽的無場景權重
B、內容分類標簽的綜合權重基于以下數據,求出每個用戶身上的內容分類標簽的綜合權重:- 內容分類標簽的無場景權重
a) 行為次數 (根據行為數據統(tǒng)計得出)
b) 行為類型權重 (自定義)
c) 時間衰減函數 (暫用牛頓冷卻定律)
基于相關系數矩陣的內容分類標簽相關性舉個例子:用戶1身上打上了5個A標簽、2個B標簽、1個C標簽;用戶2身上打上了4個A標簽,3個B標簽;用戶3身上打上了4個C標簽、1個D標簽。用個圖象表示一下:那么同時打上A、B標簽的用戶有兩個人,這就說明AB之間可能存在某種相關性
d) 用戶:以賬號 (User ID)為統(tǒng)計口徑
e) 標簽:內容單元的分類標簽
我們用- w(P, T) 表示一個標簽T被用于標記用戶P的次數
a) TF(P, T) 表示這個標記次數在用戶P所有標簽中所占的比重
b) IDF(P, T) 表示標簽T在全部標簽中的稀缺程度,即這個標簽的出現幾率
用戶P對于標簽T的無場景權重 = TF(P, T) * IDF(P, T)

2、結果2:綜合權重

a) “TF-IDF計算得到每個用戶身上的標簽權重”即上一步的無場景權重
b) “行為次數”由行為數據統(tǒng)計得出(行為權重更多的是基于業(yè)務判斷,對動作的大小進行權重分數賦予,不用業(yè)務場景給予權重不同,根據實際業(yè)務情況確定)

牛頓冷卻定律的數學模型
F(t) = 初始溫度 × exp( -冷卻系數 × 間隔的時間 )
補充(基于實際的業(yè)務去定義冷卻系數的計算):指定14天后降為初始值的0.5,即 __ 0.5=1×exp(-__α×14)

3、應用說明:

通過TF-IDF算法,結合時間衰減因素后,得出該用戶最喜歡的 TopN 風格分類。
舉例:
選擇“Top 3 包含 古風、校園、戀愛”表示“古風 或 校園 或 戀愛 中任意一個屬于該用戶最喜歡的前3個風格”
選擇“Top 1 包含 古風、校園、戀愛”表示“古風 或 校園 或 戀愛 中任意一個屬于該用戶最喜歡的第1個風格”

四、規(guī)則型-影響力標簽

(絕對排名、百分比排位,定位出個人的影響力)

1、絕對排名

將用戶按單篇發(fā)布頻率從大到小排列,排名a表示該用戶的單篇發(fā)布頻率排在第a位。允許并列,并列的下一名需跳過并列人數。如3人并列第1,則無第2、3名,下一位是第4名

2、百分比排位

表示該用戶的單篇發(fā)布頻率高于b%的樣本,類似四分位數,可參考 Excel “PERCENTRANK”函數

總結

以上是生活随笔為你收集整理的数据产品-规则型和挖掘型标签构建案例的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 嫩草影院懂你的 | 男女免费视频网站 | 色婷婷影院 | 欧洲丰满少妇做爰 | 国产精品一区二区三区四区在线观看 | 无码人妻久久一区二区三区 | 法国空姐在线观看完整版 | 久久九九久精品国产免费直播 | 美女黄视频在线观看 | 加勒比一区二区 | 思思久久99| 播金莲一级淫片aaaaaaa | 丁香色欲久久久久久综合网 | 精品三级| 韩日a级片| 国产精品久久免费视频 | 国内精品卡一卡二卡三 | 男女午夜视频在线观看 | 国产激情在线 | 精品国产AV色欲天媒传媒 | 青青草综合 | 91tv在线| 久久亚洲欧美 | 成人免费视频免费观看 | 神马伦理视频 | 性xxxx视频| 久久成人福利视频 | 日本在线一本 | 在线免费观看黄网 | 无码乱人伦一区二区亚洲 | 亚洲看| 日韩经典av| 精品国产无码一区二区 | 美女扒开尿口给男人捅 | 黄色av电影网址 | 得得的爱在线视频 | 丰满岳妇伦在线播放 | www一区二区| 欧美日本三级 | 一女双乳被两男吸视频 | 豆花在线观看 | 91麻豆精品在线 | 日韩av中文字幕在线免费观看 | 免费一级特黄3大片视频 | 亚洲高清视频一区二区 | 一级全黄裸体免费观看视频 | 欧美精品xx | 国产夜夜嗨 | 国产日批视频在线观看 | 91性视频 | 隣の若妻さん波多野结衣 | 偷偷色噜狠狠狠狠的777米奇 | 国产毛片欧美毛片久久久 | 午夜激情网址 | 亚洲一区在线免费 | 波多野结衣啪啪 | 免费av在线网址 | 日日弄天天弄美女bbbb | 中文字幕精品无 | 日本香蕉视频 | 国产有码在线观看 | 老熟妇仑乱一区二区视频 | 国产精品伊人久久 | 6080av| r级无码视频在线观看 | 久久久一级片 | 免费成人在线观看 | 精品亚洲aⅴ无码一区二区三区 | 国产精品久久久精品三级 | 国产又黄又湿 | 亚洲欧美日本在线观看 | 香蕉视频毛片 | 九七影院在线观看免费观看电视 | 一道本一区 | 国产精品偷伦视频免费观看了 | 成人做爰69片免费看 | 成人导航网站 | 538精品一线| av永久免费网站 | 99热这里只有精品2 91免费版黄 | 欧美精品毛片 | 91美女片黄在线观看游戏 | 国产成人精品亚洲精品色欲 | 北条麻妃久久 | 人妻精品无码一区二区 | 欧美黄色一区二区 | 黄色肉肉视频 | 蜜桃久久久 | 亚洲视频久久 | 国产亚洲精品久久久久久 | 91九色在线 | 中国美女一级黄色片 | 小小姑娘电影大全免费播放 | 久久久999 | 中文字幕在线观看网站 | 肉嫁高柳家在线看 | 日韩精品成人在线观看 | 精品人妻无码在线 | 国产精品久久久久久久久久东京 |