淘宝母婴用品数据分析
一.分析背景及目的
本文是一次探索性分析,通過對所有常規(guī)指標(biāo)進(jìn)行分析,來尋找業(yè)務(wù)上優(yōu)化點
二、理解數(shù)據(jù)
1.數(shù)據(jù)來源:
數(shù)據(jù)集-阿里云天池?tianchi.aliyun.com
其中包含2個csv數(shù)據(jù),表1購買商品和表2嬰兒信息
2.列名含義:
?
三.數(shù)據(jù)清洗
?
1.選擇子集
auction_id(購買行為編號) 和 property(商品屬性)在后續(xù)分析中不會使用,故將這兩列隱藏。(好習(xí)慣是永遠(yuǎn)不刪除數(shù)據(jù),不需要的數(shù)據(jù)隱藏起來)
2.列名重命名
將列名翻譯為中文
3.刪除重復(fù)值
未發(fā)現(xiàn)重復(fù)值
4.缺失值處理
經(jīng)過篩選未發(fā)現(xiàn)缺失值,操作參考Excel數(shù)據(jù)處理(缺失值/重復(fù)值/異常值/拆分) - 知乎 (zhihu.com)
5.一致化處理
將日期修改成yyyy/m/d的格式,參考數(shù)據(jù)分析學(xué)習(xí)第(3)篇“如何使用Excel分析嬰兒用品銷量情況?” - 知乎 (zhihu.com)
?
將性別列中值為0、1、2的分別修改為女、男、不詳,參考數(shù)據(jù)分析學(xué)習(xí)第(3)篇“如何使用Excel分析嬰兒用品銷量情況?” - 知乎 (zhihu.com)
?
6.數(shù)據(jù)排序
對購買數(shù)量降序排序,發(fā)現(xiàn)購買數(shù)量最大值為10000
對購買日期排序,發(fā)現(xiàn)交易記錄的時間范圍是2012年7月2日-2015年2月5日
7.異常值處理
刪除出生日期為1984年的那一列
四、分析思路
1.從行為、商品、用戶三個角度展開描述分析
?
2.對描述分析的結(jié)果從以下角度提出假設(shè)
?
3.驗證假設(shè)得出結(jié)論
五、分析過程
商品
1.不同種類商品銷量對比(分析方法:帕累托模型)
?
因為資源總是有限的,不同的渠道和用戶會產(chǎn)生不同的效益,所以我們不能將所有的資源投入到全部渠道里。帕累托分析依據(jù)的原理是20/80定律,80%的效益常常來自于20%的投入,而其他80%的投入?yún)s只產(chǎn)生了20%的效益,這說明,同樣的投入在不同的地方會產(chǎn)生不同的效益。28、50014815、50008168三類商品貢獻(xiàn)了總銷量的88%。所以建議把主要的投入放在上述三類商品上。
2.爆款商品
top13的商品銷量都達(dá)到1000件以上
?
50018831商品為爆款,其銷量占據(jù)top13的34%,為12657件
其他商品銷量比較接近,在1000到3700件之間浮動
銷量主要集中在14年的雙11,而平時銷量不高,說明是節(jié)假日爆款商品。需要對14年雙11進(jìn)行復(fù)盤,總結(jié)運營經(jīng)驗,復(fù)制爆款商品
行為
1.銷量隨時間變化情況(分析方法:折線圖)
?
2012年、2015年銷量只是其他年份的零頭
假設(shè):數(shù)據(jù)不完整(數(shù)據(jù)來源)
交易記錄的時間范圍是2012年7月2日-2015年2月5日
假設(shè)成立
2014年銷量約為2013年的2倍
假設(shè):網(wǎng)購人數(shù)增加(行業(yè)規(guī)律),產(chǎn)品好評率提高(產(chǎn)品問題)
?
兩年的銷量趨勢走向基本相同,且在大多數(shù)月份2014年的銷量為2013年的2倍
假設(shè)成立
由圖,2014年11月份銷量為13年度514%,這是2014年銷量約為2013年的2倍的主要原因
假設(shè):是雙11導(dǎo)致14年11月銷量猛增(行業(yè)規(guī)律)
?
因為有些店家會把雙11活動延長幾天,所以在13號出現(xiàn)峰值屬于正?,F(xiàn)象
假設(shè)成立
1、2月份出現(xiàn)銷量低谷
假設(shè):春節(jié)快遞停運(行業(yè)規(guī)律)
?
)
2013年2月10日過春節(jié),2014年1月30日過春節(jié),2015年2月19日過春節(jié),正好與銷量最低時間相吻合。全國大多數(shù)地區(qū)在節(jié)前1周快遞停運
假設(shè)成立
2.復(fù)購情況
定義:統(tǒng)計周期為2012年7月2日-2015年2月5日,復(fù)購率=客戶重復(fù)購買行為次數(shù)/客戶樣本數(shù)量
?
由此可見絕大多數(shù)用戶沒有復(fù)購行為
假設(shè):數(shù)據(jù)集中絕大多數(shù)嬰兒用品長時間內(nèi)只適用于購買一次(產(chǎn)品問題)
需要調(diào)取產(chǎn)品信息進(jìn)一步確認(rèn)
有復(fù)購行為用戶中,大多數(shù)只復(fù)購1次,僅有1人復(fù)購3次
這說明用戶的忠誠度很低,很有可能需要用爆款來驅(qū)動用戶購買
用戶
性別
1.不同性別的銷量對比
?
女嬰銷量約占六成,男嬰占四成
?
男、女用戶人數(shù)約為1:1
2.不同性別的購買偏好
?
?
5008168、28類商品在男、女嬰兒中銷量都比較高
50014815類在女嬰中銷量最高,在男嬰中銷量一般
38、50022520類銷量一般,38類女嬰銷量高些
12265008類在男女嬰兒中銷量都比較低,建議根據(jù)實際情況,適當(dāng)淘汰該類別下的末端商品
50014815類在女嬰中銷量最高,在男嬰中銷量一般
假設(shè):50014815類商品具有性別差異(產(chǎn)品問題)
?
?
在女嬰中銷量高的主要原因是50018831、50012564這兩款商品,它們在男嬰中也是銷量最高的
假設(shè)不成立
假設(shè):是女嬰的購買力比男嬰強(qiáng)導(dǎo)致的(用戶問題)
查詢商品50018831的數(shù)據(jù)時發(fā)現(xiàn),有位用戶單次購買160件,并不是女嬰的購買力更強(qiáng)
假設(shè)不成立
(因為這組數(shù)據(jù)單次購買量太大,會影響對趨勢的判斷,暫時刪除)
38類女嬰銷量較高
查詢38類商品數(shù)據(jù)時發(fā)現(xiàn),有位用戶單次購買40件
?
年齡
1.不同年齡段商品的銷量對比
?
0歲、1歲和出生前購買占據(jù)購買量的70%
2歲、3歲占據(jù)20%
其他年齡段占據(jù)10%
下面重點考慮0歲、1歲和出生前購買用戶的購買需求
2.不同年齡段購買偏好
?
?
?
50022520類在未出生baby中銷量高,在0歲、1歲嬰兒中銷量低
38類在1歲中銷量高,在未出生baby、0歲嬰兒中銷量低
50022520類在未出生baby中銷量高
假設(shè):存在單次購買量較大的數(shù)據(jù)(異常數(shù)據(jù))
?
并沒有用戶單次購買量較大的情況
假設(shè)不成立
50022520類對用戶年齡敏感,給未出生baby備貨的用戶喜歡購買
38類在1歲中銷量高
假設(shè):存在單次購買量較大的數(shù)據(jù)(異常數(shù)據(jù))
?
一名用戶單次購買了40件
假設(shè)成立
六、總結(jié)建議
1.商品
88%銷量集中在28、50014815、50008168這三類商品上,這三類商品對嬰兒的性別、年齡不敏感
9%的銷量集中在38、50022520兩類商品上,在用戶給未出生baby準(zhǔn)備時非常喜歡購買50022520類的商品
3%是122650008類,建議對該類別下的商品進(jìn)行末位淘汰
?
2.用戶行為規(guī)律
絕大多數(shù)用戶對大型活動敏感,因為雙11的緣故,14年11月份銷量約為其它月份的6倍
14年雙11活動非常成功,同比13年銷量增長514%,應(yīng)該進(jìn)行復(fù)盤,總結(jié)運營經(jīng)驗
?
11月13日,母嬰用品的銷量達(dá)到峰值,是商家把雙11活動集中在這天的緣故
雙11的銷量占全月的77%
?
3.用戶
主流用戶年齡是0歲、1歲和為未出生的baby準(zhǔn)備,除去未出生的baby偏好50022520類的商品外,這3個年齡的
用戶對商品的偏好基本相同,都集中在28、50014815、50008168這三類商品上
男、女嬰兒用戶人數(shù)基本持平,女嬰的購買能力比男嬰略高,男、女嬰兒對商品的偏好基本相同,同樣集中在
28、50014815、50008168這三類商品上
復(fù)購率僅為0.17%,這說明用戶的忠誠度很低,很有可能絕大多數(shù)是貪圖便宜被吸引進(jìn)來,這樣的用戶質(zhì)量并不
高,需要進(jìn)一步調(diào)取數(shù)據(jù)摸清用戶的購買需求,可以從下圖入手
?
下面這批用戶單次購買量超過20
?
前2位用戶的購買時間沒有促銷活動,后3位用戶雖然趕上了5月份的活動,但活動力度不如雙11大,這些人中沒有
1個人在優(yōu)惠力度最大的雙11期間下單,這就說明ta們的購買需求是急切的
還有一個共同點是,這些人購買的都是女嬰用品
由此做出假設(shè),這些人是否因工作需要所以要批量購買,例如兒童福利院等機(jī)構(gòu)
建議調(diào)取以上用戶在淘寶平臺的其他信息,進(jìn)一步探索ta們的購買需求
總結(jié)
以上是生活随笔為你收集整理的淘宝母婴用品数据分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: dataframe之按时间筛选数据
- 下一篇: Matlab读取excel并使用拉依达准