當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

因果推断实战：淘宝3D化价值分析小结

發布時間：2023/12/14 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了因果推断实战：淘宝3D化价值分析小结小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

觀察性因果推斷方法有很多，文章主要介紹了PSM、貝葉斯概率圖、DID這幾種方法，可將文章分享的實踐方法作為因果推斷分析中的一種參考。?

背景介紹

???為什么需要因果推斷

統計學有一些有趣的‘研究’：太陽黑子與男性自殺率間存在關系；而一個國家的人均巧克力消費量越高，出現諾貝爾獎獲得者的比例越大；甚至還有這樣的報導：

這些現象揭示了傳統統計學的局限性：由于我們不可能對人群是否吃巧克力，屬于哪個星座做隨機化實驗，因此我們得到的數據都是觀察性數據，它只能告訴我們數據的相關性，而非因果性。我們觀察到了巧克力消費和諾獎數量，星座和違章人數的線性關系，但它沒有告訴我們的是，巧克力消費和諾獎數量背后的共同原因可能是經濟發達程度；而違章率高的星座在當地人口占比最高。

從對社會和業務更有意義的角度來說，我們想知道的是 ‘怎么做才能提升諾獎的數量’ 或者‘用戶點擊某功能能否帶來加購/留存的提升’，而這樣的問題就需要我們探究現象背后的原因，以及量化原因對于結果造成的影響，因果推斷應運而生?；诜词聦嵉乃枷牒蛿M合隨機實驗的一系列方法，我們能夠控制混雜變量，從觀察性的數據中得出因果性結論，從而論證業務價值，給出落地建議。

???什么是因果推斷

因果推斷是一門探究事物之間因果關系的學科，學術界有兩個主要框架：因果圖模型和潛在結果（Potential Outcome, PO）模型。因果圖模型是由Judea Pearl提出，著眼于因果關系的識別；而潛在結果模型是由統計學家 Donald Rubin 在上世紀七十年代所開創的因果推斷框架，很多社會科學家常用的工具，比如傾向性得分匹配(Propensity Score Matching)模型和工具變量模型，都可以歸類到潛在結果模型。

站在數據分析的角度，潛在結果模型更加通俗易懂。我們使用潛在結果模型來給出因果推斷的嚴謹定義。

基本概念和符號

首先，定義一些基本概念：

干預(treatment) :用來表示用戶是否接受了某種干預(being treated)，例如是否命中了某個策略，點擊了優惠券。

潛在結果(potential outcome) 和：每個用戶i對于是否接受干預分別有兩個潛在結果和。假設我想要探究高考對于小明收入的影響，那么真實的結果就是小明的高考分數和他的收入。而假設平行世界里有和小明一模一樣的小明2號，但他高考少了20分，那小明的收入和小明2號的收入都被稱為潛在結果/反事實結果。只有真實發生的潛在結果是實際存在的。

觀察結果(observed outcome) :觀察到的、真實發生的潛在結果

混淆變量(confounders):直觀來說(雖然不太嚴謹)，混淆變量是一系列用戶特征，越全越好。嚴格來說，混雜變量需要足夠全使得對于一群混雜變量相同的用戶來說，他們的潛在結果和是相互獨立的。這個嚴格的定義其實是因果效應的可識別性的必要條件之一。

其次，通過因果推斷可以得到什么：

我們從因果推斷推出來的，是因果效應。因為數據的缺失，個體的因果效應（Treatment Effect, TE)是不可被識別的，也就是說，個體的因果效應不能用已觀測到的數據來表示。但我們可以描述人群的平均因果效應，即個體因果效應的均值（Average treatment effect, ATE)。

根據不同的業務場景，我們可能也想知道受到干預的人群的平均因果效應（Average treatment effect on the Treated, ATT)，或者人群某個subgroup（受到干預）的平均因果效應(Conditional Average Treatment Effect, CATE)，(Conditional Average Treatment effect on the Treated, CATT)

舉個例子

以Push投放對內容閱讀篇數的影響為例。我們對于ID = 1，2，3的用戶投放Push（T=Y)，ID為4，5，6的用戶則不進行干預。

以ID =1的用戶為例：假如投放Push后，她的閱讀篇數是9（Y1），而假如不投放，她的篇數是7（Y0)；這兩者都是潛在結果，只有站在上帝視角才能同時看到兩個結果

因為我們真的對她投放了push，因此觀察到的真實結果就是閱讀篇數為9。（‘不投放時篇數為7’這個事實就永遠不得而知了）

接下來我們站在“上帝視角”解釋一下ATE和ATT的計算。在上帝視角下，我們可以同時觀測到每個用戶的兩個潛在結果，算出兩種因果效應分別為ATE=1.2>0 和 ATT=1.7>0。因此，push確實是可以提升用戶的閱讀篇數的，這個結論就符合常理了。ATE和ATT的具體計算過程如下：

假如我們失去了“上帝視角”，ATE和ATT就沒法用上面的公式來計算了，因為對于每一個用戶的兩個潛在結果，總是有一個是觀察不到的。這時候離線因果推斷就派上用場啦!

???什么時候用，怎么用？

條件允許的情況下，ab test是最佳的因果推斷方法之一。但ab test也有自己的局限性：

ab test不可進行：比如我們不能強迫一組用戶‘吸煙’，另一組用戶‘不吸煙’去觀察吸煙對健康的危害；

ab test成本太高：當線上實驗的選擇太多，而產品的流量/時間成本是有限時，逐一對每一個實驗都進行測試顯然不現實，此時通過離線數據進行因果推斷可以幫助我們科學地預判不同實驗策略的‘前途’，讓我們可以優先嘗試前途更加光明的實驗；

因果推斷是通過特定的方法對觀察性數據控制混雜變量以擬合隨機試驗。所有的方法的核心思想，都離不開控制混雜（control confounding variables)。在上文小明高考的例子里，我提到過要尋找‘一模一樣的小明2號’，而‘一模一樣’的目的就是為了控制混雜變量。只有在控制了兩者混雜變量一致，僅有高考分數不同的情況下，我們才能計算高考分數對工資收入的影響。

混雜變量是指對于‘因’和‘果’都有影響的因素，忽視它們會對結果帶來致命的偏倚；對小明和小明2號來說，需要控制的混雜變量有：上過的學校，遇見過的老師，自己的學習、睡眠時長，等等等等，因為這些都會影響高考的分數（因），也會影響未來的收入（果）。但是例如小明的頭發顏色、身高這種特征并不會對于因果變量有什么影響，無需控制。所以在實踐中很關鍵的一點，就是判斷到底需要控制哪些混雜，才能讓你認為小明和小明2號是‘同質’的。判斷混雜因子并沒有一個標準方法，而是需要結合對業務的深度理解。不同的數據類型、場景會有不同的適用方法，下面是一些常見的判斷標準和對應方法：

混雜（W）的典型結構：同時作用于X和Y。

常見方法一覽

離線因果推斷在淘寶3D化價值分析上的實戰

這部分主要介紹大淘寶技術-家裝家居數據科學團隊在淘寶3D化項目中對項目的價值分析上的實戰，通過這一實例幫助大家對因果推斷如何運用有更直接的認識。

???業務背景和現狀

淘寶3D化為消費者提供多元化的場景導購內容，包括 2D 場景圖文，3D 樣板間，DIY 樣板間等3D沉浸式體驗。通過應用3D技術實現沉浸式商品導購體驗，影響用戶購買決策提升確定性，從而提升整體家裝類目的導購轉化率以及用戶留存。

在淘寶搜索頁實現場景化

在3D樣板間實現客制化

自項目啟動以來，業務一直受困于一個問題：3D模型的IPV覆蓋率未達預期，增速不佳。3D模型是所有3D化產品的基石，沒有模型意味著無法3D化。深入分析原因后發現，商家無法通過‘上模型’獲得差異化權益、以及看不到產品的長期效果，共同導致了他們的配合意愿低。因此，驗證3D化價值成為了當務之急。通過對價值指標體系，受益方進行拆分，結合業務理解確立了如下的分析框架，并選擇了用因果推斷來驗證不同3D化產品的價值，因為它可以真正回答‘XX產品導致了加購率/成交率提升Y%’這類問題：

???3D樣板間價值分析

用戶可以從商詳頁，首猜，主搜云卡片等渠道進入樣板間，并在樣板間內實現多點漫游，換風格，搭配家具，放我家等功能，給用戶更場景化，私人化的體驗。選取進入3D樣板間的用戶，利用傾向性得分匹配法（PSM）獲取對照組的同質用戶，分析用戶在各個價值指標的差異。

基于傾向性得分匹配法 - 量化價值：

傾向性得分匹配法：一句話概括，就是匹配分數相同的‘同質’用戶。由于在觀察研究中，混雜變量較多，無法一一匹配，因此將多個混淆變量用一個綜合分數作為表征。通過分數對用戶進行匹配，最終得到兩組‘同質’人群。

使用20余種用戶基本特征，行為特征和家居偏好特征作為混雜因素，應用于匹配模型；

匹配后數據表明，實驗組用戶的加購率+24.85%，手淘停留時長+27.68%，客單價+29.53%，帶貨帶寬+5.98%，用戶決策周期-5.75%

通過PSM的分析結論，我們定量的驗證了3D樣板間對手淘各項指標的正向價值，進一步的，我們想要挖掘背后是什么因素使得3D樣板間產生了這些價值：

基于貝葉斯因果圖 - 挖掘產生價值行為：

貝葉斯因果圖：計算變量之間的熵增，結合問題結構推理成對變量之間的因果關系；若兩個節點間以一個單箭頭連接在一起，表示其中一個節點是因，另一個是果。以下圖為例，smoking表示吸煙，其概率用P(S)表示；lung Cancer表示肺癌，一個人在吸煙的情況下得肺癌的概率用P(C|S)表示，X-ray表示需要照醫學上的X光，肺癌可能會導致需要照X光，吸煙也有可能會導致需要照X光（所以smoking也是X-ray的一個因），所以，因吸煙且得肺癌而需要照X光的概率用P(X|C,S)表示。

用戶在3D樣板間里會產生大量復雜行為，包括點擊商品錨點、切換場景、切換風格等等，而只有‘點擊了商品并完成加購/購買’是完成樣板間的價值實現。因此我們通過計算用戶行為事件間的貝葉斯概率矩陣，推導出貝葉斯因果圖，找到用戶關鍵事件節點的根因行為。

考慮到特征覆蓋度和用戶使用頻次，最終選取了10+樣板間內行為特征和20+用戶特征&偏好，并據此畫出了因果圖。大部分的因果鏈都是符合邏輯的，例如年齡指向結婚，結婚指向生育，收入指向有無房產等。它也揭示了一些有意義的箭頭，我們據此給出了一定的建議，比如：

‘有房’標簽非常重要，是很多樣板間內行為特征的‘因’。建議圍繞‘有房’特征做好人群圈選，精準投放；

用戶對于新手引導的完成度高：新手引導的每一環都被保留在因果圖上。但是當前的行為鏈路止步于‘切換房間’，沒有引導用戶至點擊商品這一重度行為，建議完善；

在新手引導鏈路改造完成后，在引導完成率不降低的情況下，用戶的加購率提升了28.93%。

離線因果推斷驗證了3D樣板間的價值。在分析了對照組人群的運營可落地性后，我們轉向了實時線上因果策略輸出，從類目，商家，用戶多個維度提供運營策略。

PSM輸出的對照組人群，由于和實驗組‘同質’，也可以被認為是樣板間的潛力人群。我們對這一波潛客進行了隨機分組，在淘寶搜索頁上進行在線實驗：

頁面中部為主搜云卡片

基于雙重差分法 - 計算業務增量價值：

雙重差分法：在滿足基線期平行趨勢假設的基礎上，估計策略影響的平均處理效應。以下圖為例，兩家開在不同地區的店鋪A/B，假設店鋪A，B 滿足平行趨勢假設，且A家參與了大促（打廣告），B家沒有?？紤]到時間變量對于兩個店鋪帶來的共同影響，需要求兩次差值才能正確估計廣告對A帶來的效益提升，即所謂雙重差分。DID = (A2-A1)-(B2-B1)，也可以用模型來擬合DID。

在3D樣板間的case中，因為潛客是用PSM挖掘后再隨機分組的，所以認為滿足平行趨勢假設，DID可行；

PSM+DID也是常見的搭配，一起使用可以避開各自的局限性，起到1+1>2的效果；在后續的文章會展開。

通過DID計算線上3周的實驗數據表明，加購率提升了6.73%，加購件數提升了1.26件，淘寶時長增長了17.26分鐘。

總結

觀察性因果推斷方法有很多，文章主要介紹了PSM、貝葉斯概率圖、DID這幾種方法，可將文章分享的實踐方法作為因果推斷分析中的一種參考。觀察性因果推斷仍有許多局限之處，數據驅動產品任重道遠。不迷信任何一種算法，多種分析方法論的結合+實際經驗方為上策。希望這篇文章可以起到拋磚引玉的作用，引起大家對因果推斷的興趣，引發更多討論，一起學習、共同成長。也希望可以認識一些正在做因果推斷的小伙伴。

參考資料

Judea P, & Dana M.. The Book of Why.

Hernán, M. A., & Robins, J. M. ?Causal Inference: What If.

王樂. 概率圖模型之貝葉斯網絡. https://zhuanlan.zhihu.com/p/30139208

有哪些相關性不等于因果性的例子？. (n.d.). https://www.zhihu.com/question/66895407

Caliendo, M., & Kopeinig, S. (2008). Some Practical Guidance for the Implementation of PSM. Journal of Economic Surveys, 31–72(22(1)).

imai, K., Keele, L., Tingley, D., & Yamamoto, T. (2011). Unpacking the Black Box of Causality: Learning about Causal Mechanisms from Experimental and Observational Studies. American Political Science Review, 105(4).

團隊介紹

大淘寶技術-家裝家居數據科學團隊基于淘系全域數據，利用多維分析、歸因分析、運籌優化、博弈論、因果推斷等分析和挖掘方法，設計合適的分析和算法解決方案，對淘寶，天貓家裝家居垂直行業的權益效率提升、用戶留存等問題建模分析，實驗用戶規模及用戶粘性的增長。

???拓展閱讀

作者|亦歌、行週

編輯|橙子君

總結

以上是生活随笔為你收集整理的因果推断实战：淘宝3D化价值分析小结的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： App产品原型背后要交代的细节和要理解的
下一篇：苹果mac笔记本部分按键失灵怎么办，5连

编程问答

因果推断实战：淘宝3D化价值分析小结

???為什么需要因果推斷

???什么是因果推斷

基本概念和符號

舉個例子

???什么時候用，怎么用？

???業務背景和現狀

???3D樣板間價值分析

基于傾向性得分匹配法 - 量化價值：

基于貝葉斯因果圖 - 挖掘產生價值行為：

基于雙重差分法 - 計算業務增量價值：

總結