因果推断 - 基础知识
生活随笔
收集整理的這篇文章主要介紹了
因果推断 - 基础知识
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 因果關系之梯
- 因果圖的路徑結構
- 阻斷
- d-分離
- 混雜
- 結構因果模型(SCM)
版權:轉載前請聯系作者獲得授權。
聲明:部分內容出自因果關系之梯,已獲得原作者授權。
參考書籍:《The Book of Why》——Judea Pearl
因果關系之梯
因果關系之梯可以分為三個層次(由低到高):
因果圖的路徑結構
因果圖的路徑結構可以分為三種:
在兩種情況下,節點之間具有相關性(不相互獨立):
阻斷
定義:在一條路徑中,在不以任何節點為條件的前提下,當且僅當兩條箭頭在某個變量處對撞時,稱該路徑被阻斷,該變量稱為對撞子。
- 在鏈式路徑和叉式路徑中,X和Y是相關的,但是如果以Z為條件(也稱為“控制Z”),考慮(X | Z)和(Y | Z),它們是不相關的。這是由于X和Y之間的路徑被阻斷了。
- 在對撞路徑中,X和Y是不相關的,但是如果以Z為條件,考慮(X | Z)和(Y | Z),它們是相關的。這是由于原本阻斷的路徑被打開了。
d-分離
定義:假設N為節點集,如果一條路徑滿足下面三種情況的至少一種,則稱該路徑被N(節點集)d-分離。
更一般地,如果節點N阻斷了X -> Y之間的每條路徑,則稱X和Y被N(節點)d-分離。
d-分離法則:
混雜
定義:任何使P(Y∣do(X))P(Y|do(X))P(Y∣do(X))不同于P(Y∣X)P(Y|X)P(Y∣X)的因素。
例子:下圖中,Z就是X和Y之間的混雜因子。
結構因果模型(SCM)
SCM用于對因果推斷過程建模。在SCM中,包含外生變量集合U、內生變量集合V和函數集合F。
- 外生變量:表示模型沒有考慮到的一些因素,如:噪聲、不確定性等。圖中的U1和U2都是外生變量。
- 內生變量:主要要研究的變量,圖中的X和Y都是內生變量。
- 函數:外生變量與內生變量之間的計算關系,圖中右側的兩個式子即為函數。
- 單向箭頭:表示兩個變量之間存在直接的因果關系。
- 雙向箭頭:表示兩個變量之間存在未知的混雜因素。
總結
以上是生活随笔為你收集整理的因果推断 - 基础知识的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python输出到文件
- 下一篇: 因果推断 - 干预