聚类分析在用户行为中的实例_用户关注行为数据分析过程详解-描述统计+聚类...
以下是基于一小段用戶關注產品的行為數據分析過程詳細描述,各位老師如有不同意見或優化建議,還請不吝賜教。
一、數據大致是這樣的(已經脫敏處理)
二、數據預處理
從年款提取出年限,從價格標識出價格區間,隨便寫一下SQL如下:
Select 城市,品牌,2016-substr(年款,1,4) as 年限
,case when
報價<=5 then ‘0~5’
when 報價>5 and 報價<10
then ‘5~10’
when 報價>10 and 報價<15
then ‘10~15’
when 報價>15 and 報價<20
then ‘15~20’
when 報價>20 and 報價<50
then ‘20~50’
Else ‘50以上’end as
報價區間
From 分析表
三、基礎描述統計
基礎分析一般對數據進行簡單的整合操作,描述通過數據能夠直觀看到的結論,比如:
各地區的用戶量占比—反映不同地區的需求量級
各地區的關注品牌top
10%—反映不同地區的品牌需求差異
不同品牌的價格區間—反映用戶對于價格的關注情況
年限與價格的變化趨勢—新人會覺得這個可以用一下相關分析之類的,其實沒有太大必要。
因為,既定報價是受相對嚴格的市場規則調控的,而本次分析的目的是針對用戶對于既定已在線產品的關注度,因此,價格并不是本次分析的主體。
這也響應上一篇文章,并不是越專業的分析越實用。
四、用戶聚類
這個分兩步,第一步是對數據進行再處理;第二步是分析(SPSS K-means聚類)。
處理結果是將用戶日志數據,轉變為對每個用戶的行為統計數據,基本包括每個用戶的關注次數、關注不同品牌數,同一品牌反復關注次數,關注不同價格區間的次數等,大致如下:
第二步是利用SPSS進行聚類分析,并將分析結果翻譯為可讀性較強的報告,用的是最基本的K-means聚類,以下是部分聚類結果:
結果解讀起來并不費勁兒,大致用戶劃分為3類,每一類的描述數據如表最終聚類中心所示,每一類的用戶數量即案例數如表案例數所示。
舉例如第一類,可以解釋為關注低價品牌的用戶數量相對較少,對于品牌的選擇也較少(從現實的市場角度講,應是這部分價格區間的品牌類型本身就少的原因),但反復查看次數多,一定程度上不太利于成交。
以上。
總結
以上是生活随笔為你收集整理的聚类分析在用户行为中的实例_用户关注行为数据分析过程详解-描述统计+聚类...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 苹果屏幕一半失灵一半好的_佛说:一半一半
- 下一篇: 交际过程的两个基本环节_跨文化交际学概论