电子商务网站商品推荐案例分析
生活随笔
收集整理的這篇文章主要介紹了
电子商务网站商品推荐案例分析
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
本案例的主要目的是通過分析用戶和網(wǎng)站數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù),分析老客戶忠誠度下降的原因。
建立客戶忠誠度模型,提高其忠誠度。
一、分析方法和過程
數(shù)據(jù)來源:客戶信息、交易信息分別存放在網(wǎng)站數(shù)據(jù)庫的客戶表、訂單表、訂單明細(xì)中。
數(shù)據(jù)抽取:去除不需要的電話、身份證等不重要信息,抽取重要信息,如反應(yīng)客戶個人身份背景、學(xué)歷等反應(yīng)其交易心理的相關(guān)信息。
數(shù)據(jù)轉(zhuǎn)換:將抽取的信息轉(zhuǎn)換成能被數(shù)據(jù)挖掘算法使用的格式,放入數(shù)據(jù)倉庫中。
忠誠度計算方法:
1、忠誠:
2、忠誠變不忠誠:
3、不忠誠變忠誠:
4、不忠誠:
本月消費比前半年月平均消費降低50%,則忠誠度降一級;
本月消費比前半年月平均消費提升20%,則忠誠度升一級。
抽取之后的客戶信息表如下圖:
用戶數(shù)據(jù)不全面的處理:用戶數(shù)據(jù)填寫的不全面,重要信息可能缺失。
處理方式:根據(jù)專家系統(tǒng)填入缺省值、平均值、
數(shù)據(jù)轉(zhuǎn)換:如果使用ID3/C45,需要將源數(shù)據(jù)進(jìn)行離散化處理。根據(jù)統(tǒng)計經(jīng)驗,上圖的離散化結(jié)果如下圖:
本案例基于ID3進(jìn)行忠誠度分類:(屬性值是點值,可以用KNN分類;屬性值是范圍值,用ID3/C45分類)。
根據(jù)ID3算法:輸入為上述已分好類的樣本數(shù)據(jù)集,輸出是代表分類規(guī)則的二叉樹或者多叉樹。
客戶群細(xì)分:
1、客戶群細(xì)分,是根據(jù)客戶行為特征或者公共屬性將客戶劃分成同類群種的過程。目的是為營銷人員實現(xiàn)更加精準(zhǔn)的營銷策略、為企業(yè)提供更好的營銷戰(zhàn)略做支撐。
2、在客戶細(xì)分的基礎(chǔ)上,再簡歷客戶行為模型,建立其更加細(xì)化的、具有相同消費行為的微小群體,就能實現(xiàn)更加精準(zhǔn)的營銷策略、廣告投放策略、商品推薦策略。雖然離一對一的營銷還有具體,但對企業(yè)制定營銷戰(zhàn)略已經(jīng)具有非常強(qiáng)的指導(dǎo)意義。
3、客戶群細(xì)分可以采用人口統(tǒng)計學(xué)變量:年齡、性別、收入、職業(yè)、教育背景,這個可以作為初始條件。也可以采用購買行為特征變量:購買量、購買類型、購買頻次。
兩者的區(qū)別是:沒有購買行為或者購買行為數(shù)據(jù)很難獲取的情況下,比如低頻次需求(裝修),采用更加穩(wěn)定的人口統(tǒng)計學(xué)變量。如果購買行為數(shù)據(jù)容易獲取,則建議采用購買行為作為特征變量。另外,如果是非常重要的客戶群劃分,比如投資風(fēng)險偏好,則最好讓用戶自己輸入,更加能反應(yīng)用戶真實需求,避免機(jī)器分類與人主觀愿望上的差別,也能避免法律上的糾紛。
4、客戶群細(xì)分,可以采用分類或者聚類實現(xiàn)。分類實現(xiàn)時,則需要營銷人員提供已經(jīng)分好類的樣本;聚體實現(xiàn)時,則自動對客戶群進(jìn)行分類。
5、決策樹等分類算法易于理解,但受限樣本劃分準(zhǔn)確度的影響,即樣本劃分準(zhǔn)確度會對分類解決產(chǎn)生重大影響。聚類算法沒有先驗知識,依靠算法人員的經(jīng)驗和反復(fù)迭代得出結(jié)果,有時能得出營銷人員沒有發(fā)現(xiàn)的事實。
6、處理過程類似客戶忠誠度分類:從數(shù)據(jù)庫表單中提取數(shù)據(jù);采用、去噪、清理;填入缺省值或者舍去;離散化變換;處理后的數(shù)據(jù)形如下表:
7、基于此表進(jìn)行Kmeans聚類。聚類是為了推薦商品做準(zhǔn)備的。聚類結(jié)果寫入user cluster表、cluster info,分別記錄客戶的分類(字段為客戶編號、類編號)、客戶類別所有客戶的商品購買信息(字段為類編號、商品編號、購買量)。
8、以上是根據(jù)用戶相似度,推薦相似用戶喜歡或者購買的商品。如果依據(jù)客戶本身的歷史行為做推薦,則可以挖掘大部分用戶的頻繁項集,然后根據(jù)當(dāng)前用戶最近的購買行為,計算商品之間的相似度或者關(guān)聯(lián)性最強(qiáng)的商品,推薦給用戶。
9、推薦系統(tǒng)的的首要目的:結(jié)果的正確性,這就牽涉到推薦正確率要盡量高。比如80%的正確率,也就意味著20%的錯誤率,即有20%的人群會被推薦他們根本不喜歡或者不感興趣的商品,這種推薦效果產(chǎn)生的負(fù)面影響和損失是不好評估的。因此,我們開發(fā)的推薦系統(tǒng),正確率要盡量高,盡量保持在95%以上。在這之上,提高推薦結(jié)果被用戶喜歡的程度是提高點擊轉(zhuǎn)化率、購買轉(zhuǎn)化率的關(guān)鍵因素。再進(jìn)一步,如能跟用戶實時交互,則能更加快速深入理解用戶的需求,使推薦效果更好。
10、推薦系統(tǒng)不一定更需要這么復(fù)雜的計算過程。人工編輯的推薦商品目錄也是一種,熱門榜單也是推薦系統(tǒng)的一種。但是,如果想取得良好的個性化推薦效果,還是需要借助上述的自動化推薦系統(tǒng),而非人工式推薦系統(tǒng)(專家推薦系統(tǒng)),這樣能產(chǎn)生滿足用戶個性化(用戶所屬族群)要求的推薦結(jié)果。進(jìn)一步,如果能實時計算用戶的瀏覽、點擊、收藏、購買行為,并求出用戶特征,就能實現(xiàn)實時推薦效果,這種方式能有效提高網(wǎng)站的用戶體驗,提高購買轉(zhuǎn)化率,甚至省略用戶的搜索查找商品的過程。
11、實際使用過程中,這些推薦算法并不是相互矛盾排斥的,經(jīng)常會綜合實用,取長補(bǔ)短,適應(yīng)不同場景下的推薦要求。
結(jié)合多種推薦方案的推薦系統(tǒng)實例:針對商務(wù)網(wǎng)站,設(shè)計一套推薦系統(tǒng)。
1、在網(wǎng)站首頁,根據(jù)統(tǒng)計方法,列出前10名的熱銷商品。給新用戶和訪問者(沒有歷史數(shù)據(jù),同時又適應(yīng)所有用戶)最普世的推薦方案。
2、對已注冊、有瀏覽數(shù)據(jù)的用戶,提供更個性化的推薦結(jié)果。
3、基于用戶分類,將同類用戶中,其他用戶購買的總商品數(shù)的前N推薦給當(dāng)前用戶。或者是這些商品的新品。
4、基于商品分類,找出當(dāng)前用戶購買歷史商品中,最相似的商品推薦給用戶,或者通過關(guān)聯(lián)技術(shù),找出關(guān)聯(lián)商品推薦給用戶,
5、關(guān)聯(lián)規(guī)則需要的客戶交易數(shù)據(jù)存放在網(wǎng)站數(shù)據(jù)庫的訂單表和訂單明細(xì)表中,通過訂單表編號到訂單明細(xì)表中查找關(guān)聯(lián)的商品,并挖掘出關(guān)聯(lián)規(guī)則。
注意事項:
1、這里的客戶忠誠度等級,可以替換為不同等級的購物欲望、電子設(shè)備發(fā)燒友、電話費消費額、手機(jī)流量等級、信用卡不同等級、股票/理財投資風(fēng)險愛好不同等級、外賣送餐單價不同等級,等等形如不同等級的客戶劃分,商品劃分的分類情況。
2、對客戶忠誠度的劃分,等價于對不同客戶群的細(xì)分。劃分出的客戶群,必定對應(yīng)不同的客戶特征屬性,根據(jù)這些特征屬性,就可以采用不同營銷策略,提高銷售轉(zhuǎn)化率;還可以采取不同的推薦商品,提高購買率;采取不同的廣告展示策略、提高點擊率。
3、數(shù)據(jù)特征向量過多,可以采用主成分分析、SVD奇異值分解方法降維;如果ID3過擬合,如何解決?
4、底層數(shù)據(jù)如何架構(gòu)?應(yīng)用層數(shù)據(jù)如何分析?數(shù)據(jù)倉庫如何架構(gòu)?
5、數(shù)據(jù)如何清洗?如何去噪?不完全數(shù)據(jù)如何填入缺省值,如何舍去?
6、如何計算商品、客戶的相似度?
7、如何求最優(yōu)化問題?針對什么情況?
8、Kmeans聚類計算量大,特別是用戶和特征向量都很多的時候,聚類的速度會非常慢。而且計算最佳K值時,必須不斷嘗試,才能得到K值與所有樣本點的誤差和曲線,得到最佳K值,這個計算量也是非常巨大的。建議只在一段時間內(nèi)運算一次,比如一個月,得出用戶的分類情況后,就可通過ID3、KNN對待分類樣本進(jìn)行分類,降低運算量提高計算速度。
建立客戶忠誠度模型,提高其忠誠度。
一、分析方法和過程
數(shù)據(jù)來源:客戶信息、交易信息分別存放在網(wǎng)站數(shù)據(jù)庫的客戶表、訂單表、訂單明細(xì)中。
數(shù)據(jù)抽取:去除不需要的電話、身份證等不重要信息,抽取重要信息,如反應(yīng)客戶個人身份背景、學(xué)歷等反應(yīng)其交易心理的相關(guān)信息。
數(shù)據(jù)轉(zhuǎn)換:將抽取的信息轉(zhuǎn)換成能被數(shù)據(jù)挖掘算法使用的格式,放入數(shù)據(jù)倉庫中。
忠誠度計算方法:
1、忠誠:
2、忠誠變不忠誠:
3、不忠誠變忠誠:
4、不忠誠:
本月消費比前半年月平均消費降低50%,則忠誠度降一級;
本月消費比前半年月平均消費提升20%,則忠誠度升一級。
抽取之后的客戶信息表如下圖:
用戶數(shù)據(jù)不全面的處理:用戶數(shù)據(jù)填寫的不全面,重要信息可能缺失。
處理方式:根據(jù)專家系統(tǒng)填入缺省值、平均值、
數(shù)據(jù)轉(zhuǎn)換:如果使用ID3/C45,需要將源數(shù)據(jù)進(jìn)行離散化處理。根據(jù)統(tǒng)計經(jīng)驗,上圖的離散化結(jié)果如下圖:
本案例基于ID3進(jìn)行忠誠度分類:(屬性值是點值,可以用KNN分類;屬性值是范圍值,用ID3/C45分類)。
根據(jù)ID3算法:輸入為上述已分好類的樣本數(shù)據(jù)集,輸出是代表分類規(guī)則的二叉樹或者多叉樹。
客戶群細(xì)分:
1、客戶群細(xì)分,是根據(jù)客戶行為特征或者公共屬性將客戶劃分成同類群種的過程。目的是為營銷人員實現(xiàn)更加精準(zhǔn)的營銷策略、為企業(yè)提供更好的營銷戰(zhàn)略做支撐。
2、在客戶細(xì)分的基礎(chǔ)上,再簡歷客戶行為模型,建立其更加細(xì)化的、具有相同消費行為的微小群體,就能實現(xiàn)更加精準(zhǔn)的營銷策略、廣告投放策略、商品推薦策略。雖然離一對一的營銷還有具體,但對企業(yè)制定營銷戰(zhàn)略已經(jīng)具有非常強(qiáng)的指導(dǎo)意義。
3、客戶群細(xì)分可以采用人口統(tǒng)計學(xué)變量:年齡、性別、收入、職業(yè)、教育背景,這個可以作為初始條件。也可以采用購買行為特征變量:購買量、購買類型、購買頻次。
兩者的區(qū)別是:沒有購買行為或者購買行為數(shù)據(jù)很難獲取的情況下,比如低頻次需求(裝修),采用更加穩(wěn)定的人口統(tǒng)計學(xué)變量。如果購買行為數(shù)據(jù)容易獲取,則建議采用購買行為作為特征變量。另外,如果是非常重要的客戶群劃分,比如投資風(fēng)險偏好,則最好讓用戶自己輸入,更加能反應(yīng)用戶真實需求,避免機(jī)器分類與人主觀愿望上的差別,也能避免法律上的糾紛。
4、客戶群細(xì)分,可以采用分類或者聚類實現(xiàn)。分類實現(xiàn)時,則需要營銷人員提供已經(jīng)分好類的樣本;聚體實現(xiàn)時,則自動對客戶群進(jìn)行分類。
5、決策樹等分類算法易于理解,但受限樣本劃分準(zhǔn)確度的影響,即樣本劃分準(zhǔn)確度會對分類解決產(chǎn)生重大影響。聚類算法沒有先驗知識,依靠算法人員的經(jīng)驗和反復(fù)迭代得出結(jié)果,有時能得出營銷人員沒有發(fā)現(xiàn)的事實。
6、處理過程類似客戶忠誠度分類:從數(shù)據(jù)庫表單中提取數(shù)據(jù);采用、去噪、清理;填入缺省值或者舍去;離散化變換;處理后的數(shù)據(jù)形如下表:
7、基于此表進(jìn)行Kmeans聚類。聚類是為了推薦商品做準(zhǔn)備的。聚類結(jié)果寫入user cluster表、cluster info,分別記錄客戶的分類(字段為客戶編號、類編號)、客戶類別所有客戶的商品購買信息(字段為類編號、商品編號、購買量)。
8、以上是根據(jù)用戶相似度,推薦相似用戶喜歡或者購買的商品。如果依據(jù)客戶本身的歷史行為做推薦,則可以挖掘大部分用戶的頻繁項集,然后根據(jù)當(dāng)前用戶最近的購買行為,計算商品之間的相似度或者關(guān)聯(lián)性最強(qiáng)的商品,推薦給用戶。
9、推薦系統(tǒng)的的首要目的:結(jié)果的正確性,這就牽涉到推薦正確率要盡量高。比如80%的正確率,也就意味著20%的錯誤率,即有20%的人群會被推薦他們根本不喜歡或者不感興趣的商品,這種推薦效果產(chǎn)生的負(fù)面影響和損失是不好評估的。因此,我們開發(fā)的推薦系統(tǒng),正確率要盡量高,盡量保持在95%以上。在這之上,提高推薦結(jié)果被用戶喜歡的程度是提高點擊轉(zhuǎn)化率、購買轉(zhuǎn)化率的關(guān)鍵因素。再進(jìn)一步,如能跟用戶實時交互,則能更加快速深入理解用戶的需求,使推薦效果更好。
10、推薦系統(tǒng)不一定更需要這么復(fù)雜的計算過程。人工編輯的推薦商品目錄也是一種,熱門榜單也是推薦系統(tǒng)的一種。但是,如果想取得良好的個性化推薦效果,還是需要借助上述的自動化推薦系統(tǒng),而非人工式推薦系統(tǒng)(專家推薦系統(tǒng)),這樣能產(chǎn)生滿足用戶個性化(用戶所屬族群)要求的推薦結(jié)果。進(jìn)一步,如果能實時計算用戶的瀏覽、點擊、收藏、購買行為,并求出用戶特征,就能實現(xiàn)實時推薦效果,這種方式能有效提高網(wǎng)站的用戶體驗,提高購買轉(zhuǎn)化率,甚至省略用戶的搜索查找商品的過程。
11、實際使用過程中,這些推薦算法并不是相互矛盾排斥的,經(jīng)常會綜合實用,取長補(bǔ)短,適應(yīng)不同場景下的推薦要求。
結(jié)合多種推薦方案的推薦系統(tǒng)實例:針對商務(wù)網(wǎng)站,設(shè)計一套推薦系統(tǒng)。
1、在網(wǎng)站首頁,根據(jù)統(tǒng)計方法,列出前10名的熱銷商品。給新用戶和訪問者(沒有歷史數(shù)據(jù),同時又適應(yīng)所有用戶)最普世的推薦方案。
2、對已注冊、有瀏覽數(shù)據(jù)的用戶,提供更個性化的推薦結(jié)果。
3、基于用戶分類,將同類用戶中,其他用戶購買的總商品數(shù)的前N推薦給當(dāng)前用戶。或者是這些商品的新品。
4、基于商品分類,找出當(dāng)前用戶購買歷史商品中,最相似的商品推薦給用戶,或者通過關(guān)聯(lián)技術(shù),找出關(guān)聯(lián)商品推薦給用戶,
5、關(guān)聯(lián)規(guī)則需要的客戶交易數(shù)據(jù)存放在網(wǎng)站數(shù)據(jù)庫的訂單表和訂單明細(xì)表中,通過訂單表編號到訂單明細(xì)表中查找關(guān)聯(lián)的商品,并挖掘出關(guān)聯(lián)規(guī)則。
注意事項:
1、這里的客戶忠誠度等級,可以替換為不同等級的購物欲望、電子設(shè)備發(fā)燒友、電話費消費額、手機(jī)流量等級、信用卡不同等級、股票/理財投資風(fēng)險愛好不同等級、外賣送餐單價不同等級,等等形如不同等級的客戶劃分,商品劃分的分類情況。
2、對客戶忠誠度的劃分,等價于對不同客戶群的細(xì)分。劃分出的客戶群,必定對應(yīng)不同的客戶特征屬性,根據(jù)這些特征屬性,就可以采用不同營銷策略,提高銷售轉(zhuǎn)化率;還可以采取不同的推薦商品,提高購買率;采取不同的廣告展示策略、提高點擊率。
3、數(shù)據(jù)特征向量過多,可以采用主成分分析、SVD奇異值分解方法降維;如果ID3過擬合,如何解決?
4、底層數(shù)據(jù)如何架構(gòu)?應(yīng)用層數(shù)據(jù)如何分析?數(shù)據(jù)倉庫如何架構(gòu)?
5、數(shù)據(jù)如何清洗?如何去噪?不完全數(shù)據(jù)如何填入缺省值,如何舍去?
6、如何計算商品、客戶的相似度?
7、如何求最優(yōu)化問題?針對什么情況?
8、Kmeans聚類計算量大,特別是用戶和特征向量都很多的時候,聚類的速度會非常慢。而且計算最佳K值時,必須不斷嘗試,才能得到K值與所有樣本點的誤差和曲線,得到最佳K值,這個計算量也是非常巨大的。建議只在一段時間內(nèi)運算一次,比如一個月,得出用戶的分類情況后,就可通過ID3、KNN對待分類樣本進(jìn)行分類,降低運算量提高計算速度。
總結(jié)
以上是生活随笔為你收集整理的电子商务网站商品推荐案例分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pushmail 今天你push了吗?
- 下一篇: 网文阅读付费模式为何重走回头路?