聚类分析在用户行为中的实例_用户关注行为数据分析过程详解-描述统计+聚类...
以下是基于一小段用戶關(guān)注產(chǎn)品的行為數(shù)據(jù)分析過(guò)程詳細(xì)描述,各位老師如有不同意見(jiàn)或優(yōu)化建議,還請(qǐng)不吝賜教。
一、數(shù)據(jù)大致是這樣的(已經(jīng)脫敏處理)
二、數(shù)據(jù)預(yù)處理
從年款提取出年限,從價(jià)格標(biāo)識(shí)出價(jià)格區(qū)間,隨便寫(xiě)一下SQL如下:
Select 城市,品牌,2016-substr(年款,1,4) as 年限
,case when
報(bào)價(jià)<=5 then ‘0~5’
when 報(bào)價(jià)>5 and 報(bào)價(jià)<10
then ‘5~10’
when 報(bào)價(jià)>10 and 報(bào)價(jià)<15
then ‘10~15’
when 報(bào)價(jià)>15 and 報(bào)價(jià)<20
then ‘15~20’
when 報(bào)價(jià)>20 and 報(bào)價(jià)<50
then ‘20~50’
Else ‘50以上’end as
報(bào)價(jià)區(qū)間
From 分析表
三、基礎(chǔ)描述統(tǒng)計(jì)
基礎(chǔ)分析一般對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的整合操作,描述通過(guò)數(shù)據(jù)能夠直觀看到的結(jié)論,比如:
各地區(qū)的用戶量占比—反映不同地區(qū)的需求量級(jí)
各地區(qū)的關(guān)注品牌top
10%—反映不同地區(qū)的品牌需求差異
不同品牌的價(jià)格區(qū)間—反映用戶對(duì)于價(jià)格的關(guān)注情況
年限與價(jià)格的變化趨勢(shì)—新人會(huì)覺(jué)得這個(gè)可以用一下相關(guān)分析之類(lèi)的,其實(shí)沒(méi)有太大必要。
因?yàn)?#xff0c;既定報(bào)價(jià)是受相對(duì)嚴(yán)格的市場(chǎng)規(guī)則調(diào)控的,而本次分析的目的是針對(duì)用戶對(duì)于既定已在線產(chǎn)品的關(guān)注度,因此,價(jià)格并不是本次分析的主體。
這也響應(yīng)上一篇文章,并不是越專(zhuān)業(yè)的分析越實(shí)用。
四、用戶聚類(lèi)
這個(gè)分兩步,第一步是對(duì)數(shù)據(jù)進(jìn)行再處理;第二步是分析(SPSS K-means聚類(lèi))。
處理結(jié)果是將用戶日志數(shù)據(jù),轉(zhuǎn)變?yōu)閷?duì)每個(gè)用戶的行為統(tǒng)計(jì)數(shù)據(jù),基本包括每個(gè)用戶的關(guān)注次數(shù)、關(guān)注不同品牌數(shù),同一品牌反復(fù)關(guān)注次數(shù),關(guān)注不同價(jià)格區(qū)間的次數(shù)等,大致如下:
第二步是利用SPSS進(jìn)行聚類(lèi)分析,并將分析結(jié)果翻譯為可讀性較強(qiáng)的報(bào)告,用的是最基本的K-means聚類(lèi),以下是部分聚類(lèi)結(jié)果:
結(jié)果解讀起來(lái)并不費(fèi)勁兒,大致用戶劃分為3類(lèi),每一類(lèi)的描述數(shù)據(jù)如表最終聚類(lèi)中心所示,每一類(lèi)的用戶數(shù)量即案例數(shù)如表案例數(shù)所示。
舉例如第一類(lèi),可以解釋為關(guān)注低價(jià)品牌的用戶數(shù)量相對(duì)較少,對(duì)于品牌的選擇也較少(從現(xiàn)實(shí)的市場(chǎng)角度講,應(yīng)是這部分價(jià)格區(qū)間的品牌類(lèi)型本身就少的原因),但反復(fù)查看次數(shù)多,一定程度上不太利于成交。
以上。
總結(jié)
以上是生活随笔為你收集整理的聚类分析在用户行为中的实例_用户关注行为数据分析过程详解-描述统计+聚类...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 苹果屏幕一半失灵一半好的_佛说:一半一半
- 下一篇: 交际过程的两个基本环节_跨文化交际学概论