用户行为分析案例——天池数据集User Behavior Data from Taobao
用戶行為分析過程
- 說明
- 一、數據集與分析目的
- 1、數據集
- 2、分析目的
- 二、數據處理
- 1、數據預覽
- 2、數據處理
- 三、數據提取與分析
- 1、網站流量分析
- 2、用戶分析
- 3、商品銷售分析
- 四、總結
- 1、關于平臺流量與轉化率:
- 2、關于網站用戶粘性以及用戶消費習慣
- 3、關于商品銷售情況
說明
本次數據分析基于阿里云天池數據集(用戶行為數據集),使用轉化漏斗,AARRR模型,對常見電商分析指標,包括轉化率,PV,UV,留存率,復購率等進行分析,分析過程中使用MySQL以及Navicat進行數據預覽與清洗處理,使用Excel進行數據可視化。
一、數據集與分析目的
1、數據集
| user_id | 整數類型,序列化后的用戶ID |
| item_id | 整數類型,序列化后的商品ID |
| category_id | 整數類型,序列化后的商品所屬類目ID |
| behaviortype | 字符串,枚舉類型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’) |
| timestamps | 行為發生的時間戳 |
該數據集記錄用戶在淘寶網站瀏覽商品產生的行為信息。由于數據集過大 ,選取其中10200位用戶,共105萬條數據。
2、分析目的
1)了解網站流量情況;
2)了解該階段網站用戶粘性以及用戶行為習慣;
3)了解網站商品銷售情況;
分析邏輯如下:
二、數據處理
1、數據預覽
MySQL建表,使用Navicat導入數據
use userbehavior; create table user( user_id int not null, item_id int not null, category_id int not null, behavetype varchar(10) not null, times int not null, constraint user_behave PRIMARY KEY (user_id,item_id,times))2、數據處理
(1)日期處理
將行為發生時間轉為datetime類型,獲取其發生日期及時間
(2)數據清洗
DELETE FROM user WHERE datentime < '2017-11-25 00:00:00' OR datentime > '2017-12-04 00:00:00';三、數據提取與分析
1、網站流量分析
- 創建用戶行為視圖
(1)用戶參與度(pv)分析
分析:11月25日至12月1日使用用戶數變化幅度小,范圍在7000到8000之間,從12月2日有較大幅度增加,對比11月25,26(周末)有較大的提升,可能是周末的雙12預熱營銷活動效果。
(2)網站購買轉化率(uv)(支付轉化率=支付訪客數/總訪客數)
select activeuser.dates,activeuser.ac,alluser.au,concat(round(activeuser.ac/alluser.au*100,2),'%') conversion from (SELECT dates,count(distinct user_id) ac FROM taobaouser.userbehave where buy<>0 group by dates) as activeuser join (SELECT dates,count(distinct user_id) au FROM taobaouser.userbehave group by dates) as alluser on activeuser.dates=alluser.dates
支付轉化率在11月30日取得最高值,之后呈大幅下降趨勢。
(3)轉化漏斗
獨立訪客轉化率能達到69.9%,但是從訪客行為來看,瀏覽到購買轉化率只有2.3%,若要了解具體環節的轉化率,需要對整個流程接觸到的版面進行細化的數據分析。
2、用戶分析
(數據有限,用戶新增及激活不做分析)
(1)留存
計算新增留存率與活躍留存率,視該時間段內首次登陸為新增用戶,購買為活躍用戶
新增活躍率:
將25日登陸用戶作為新增用戶來看,次日,3日留存率能達到60%以上,7日留存率達到了90%以上,用戶粘性很好,高新增留存率可能與處于雙十一促銷時段有關,說明產品新手引導性很好。
活躍留存率:
活躍留存率在20%上下浮動,同時在12月3日有稍大幅度的上升,由于用戶新增時期未知,活躍留存率維持在20%是不錯的現象。
(2)變現——復購分析
SELECT user_id,count(*) FROM taobaouser.user where behavetype='buy' group by user_id
復購次數集中在1-5次,呈長尾分布,該階段用戶消費欲望不大。
(3)用戶消費習慣分析
一天中各時段用戶行為分析:
使用切片器分別觀察每天用戶行為:
用戶瀏覽量峰值在晚上20-23點;加購率往往在早間6-7點,晚間22-23點達到峰值;收藏率往往在早間5-7點,下午16-18點達到峰值;夜間3-4點(消費欲望),上午10-11點,下午14-15點,晚上20點22點為購買轉化率峰值,其中10-11點轉化率最高。
網站可以利用這些時間點進行營銷活動安排。
另外總體來看購買轉化率更貼近于收藏率,可以適當利用來進行銷售量預測。
(4)用戶價值分析
借鑒RFM 模型,暫時不考慮M維度,對R(最近一次購買時間)F(購買頻率)進行打分,完成用戶分層
3、商品銷售分析
(1)商品銷售分布
大部分銷售來源于銷售次數為1的16190個商品,說明該時段銷售主要源于長尾部分,而非銷售數量較高的暢銷品。
(2)暢銷品及其品類分析
SELECT category_id,item_id,cartbox,dense_rank() over (order by buy desc) r FROM taobaouser.onitem where buy<>0 limit 20查看銷量top20的商品及品類分布:銷量為前3的商品為3122135,2964774,3237415,分屬1516409,1265358,3231625類
查看瀏覽top20的商品及品類分布:瀏覽量為前3的商品為812879,138964,3845702,分屬4756105,3607361類
查看收藏top20的商品及品類分布:收藏量為前3的商品為2818406,2308741,3330337,分屬982926,4827153,4756105類
查看加購商品top20及品類:加購量為前3的商品為1535294,2331370,3031354,分屬3848953,3607361,2735466類
通過分析銷量高的品類的商品銷量都不低,建議通過調研等方式推出細分市場的商品類型,并跟進后續數據。
(3)商品購買轉化率
SELECT item_id,category_id,pv,buy,concat(round(buy/pv*100,2),'%') conversion FROM taobaouser.onitem order by conversion desc limit 200
對于商品瀏覽量高,而轉化率非常低的,建議商家對商品購買流程使用轉化漏斗進行分析并進行改善。
四、總結
1、關于平臺流量與轉化率:
- 整體來看從瀏覽到有購買意愿有6.5%的轉化率,從有購買意愿到有購買行為有28%的轉化率,說明大多數用戶以瀏覽頁面為主而購買轉化較少,低購買意愿轉化率可能與剛完成的雙11大促有關。從9天的趨勢來看,前7天轉化率處于穩步上升階段,說明雙11之后的消費情況在回升,進入12月之后,瀏覽量有稍大幅度的提升,加購轉化率有小幅提升,購買轉化率大幅下降。是否需要提高轉化率,可以對比去年同時段轉化率情況,使用使用營收目標判斷轉化率是否達到目標。
提高加購轉化率的建議:
——優化搜索引擎,利用用戶畫像優化商品匹配;
——優化商品界面加購與收藏按鍵布局,以便用戶觸達。
2、關于網站用戶粘性以及用戶消費習慣
- 網站留存較為穩定,把9天中第一次登錄視為用戶新增的話,留存率在60%左右,活躍留存率也能達到20%,并且營銷活動帶來的用戶喚醒效果也很明顯。
提高用戶留存建議:
——分析流失用戶特征,進行用戶流失預測,結合用戶畫像,通過各種活動進行用戶喚醒。 - 對于用戶復購情況,9天內網站有復購現象的用戶數接近60%,但是總體上約30%的用戶產生了80%的消費次數,復購次數多的用戶偏少,可能與雙11剛結束,雙12未開始的特殊時段有關,建議拉長分析區間分析復購情況。
-——提高復購率的建議:開展營銷活動,比如淘寶的達成金主的條件限制,鼓勵用戶復購。 - 對于用戶消費習慣的分析,通過了解用戶消費的集中時段集中實施各種營銷活動,提高投入產出比。
3、關于商品銷售情況
- 分析發現商品售賣主要依靠長尾商品的累積效應,而非爆款商品的帶動,這也是雙11之后用戶的補充采買的特征,同時發現此時用戶購買的品類以及商品的瀏覽量很低,用戶的個人喜好特征表現明顯,同時瀏覽量高的商品購買轉化率低。
-——針對瀏覽量高而購買轉化率低的商品,建議商家改善商品頁面,詳情頁以及評論區管理。
一起學習,共同進步,歡迎大家評論!
總結
以上是生活随笔為你收集整理的用户行为分析案例——天池数据集User Behavior Data from Taobao的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SkinFiner(人像磨皮软件)官方中
- 下一篇: 人教版初中信息技术电子课本_电子课本|2