博客專欄

EEPW首頁 > 博客 > 因果推斷入門:為什么需要因果推斷?(2)

因果推斷入門:為什么需要因果推斷?(2)

發(fā)布人:數據派THU 時間:2022-09-18 來源:工程師 發(fā)布文章
2.3.2 Ignorability & Exchangeability


這時候,我們就可以問出本章中最重要的問題“什么樣的假設可以使 ATE=associational di?erence”?等同于“什么假設讓我們能夠通過取  列的平均值(忽略問號)減去從  列的平均值(忽略問好)來計算 ATE?”
這個問題的答案就是假設 ,即 potential outcome  和 treatment 獨立。這個假設使我們能夠將 ATE 簡化為 associational di?erence,即有了下面這個推導:


圖片


第一個=成立由  得到,第二個=成立因為在  條件下,potentionl outcome  和 observe outcome 是相等的,可以跳到公式 2.13 得到解釋。
圖片
可以從兩個方面來理解假設 2.1 中的獨立性:Ignorability 和 Exchangeability。
Ignorability:
這種對缺失數據的忽略被稱為可忽略性 Ignorability。換句話說,Ignorability 就像忽略人們最終是如何選擇他們所選擇的 treatment,而只是假設他們是被隨機分配 treatment 的,即也就是去掉了 confounder 的影響,即 ;展現在因果圖中就是刪掉  的邊。
圖片

▲ Fig 2.1


圖片▲ Fig 2.2
Exchangeability:
關于這個假設的另一個角度是可交換性 Exchangeability??山粨Q性是指實驗組(treatment group)里的個體是可交換的,即如果它們被調換,新的實驗組將觀察到與舊的實驗組相同的結果,而新的控制組將觀察到與舊的控制組相同的結果。形式化的,可交換性意味著:
圖片
繼而可以推出:
圖片
這和  也是等價的。關于可交換性的一個重要直覺是,它保證了實驗組的 comparable。換句話說,實驗組在 treatment 以外的所有方面都是相同的。這種直覺是 "控制 "或 "調整 "變量的概念的基礎,我們很快會在討論條件交換性時討論這個問題。
用可視化的例子來理解 Exchangeability:
圖片
T=1 的所有個體稱為 Group A,T=0 的所有個體稱為 Group B,把 GroupA 和 GroupB 中的個體全部交換后,Observe outcome  保持不變。
圖片
那么交換前后的  也保持不變,然后就可以推出獨立性。
圖片
再來介紹一個概念:identifiability
圖片
如果可以把一個因果效應的表達式減少到一個純粹的統(tǒng)計表達式,只使用統(tǒng)計符號,如 T、X、Y,期望,和條件來表示,則意味著因果量  是可識別的。
我們已經看到,假設 2.1 具有非常好的性質。但是,一般來說,它是完全不現實的,因為在我們觀察到的大多數數據中都可能存在混雜因素(圖2.1)。然而,我們可以通過進行隨機實驗 RCT 實現這一假設,隨機實驗迫使 treatment 不是由任何其他因素引起的,而是由拋硬幣決定的,所以我們就有了圖 2.2 所示的因果結構。我們在第五章中更深入地討論隨機實驗。
圖片
本小節(jié)從兩個角度介紹了假設 2.1:可忽略性和可交換性。從數學上講,這兩個假設的意思是一樣的,但它們的名字對應于對同一假設的不同思考方式??山粨Q性和可忽略性只是這個假設的兩個名稱。之后,我們將介紹這個假設的更實際的、有條件的版本。

2.3.3 Conditional Exchangeability & Unconfoundedness


圖片
用上面的例子解釋假設 2.2 就是:“在所有喝醉酒的人里,其穿不穿鞋睡覺不是由其主觀意識決定的,而與意識無關,是由一個隱藏的上帝之手決定的”。同樣的對于 2.2,也有兩種不同的解釋。
Conditional exchangeability:
在觀察性數據中,假設實驗組是可以 exchangeability 是不現實的。換句話說,沒有理由期望各組在 treatment 之外的所有相關變量上都是一樣的。然而,如果我們通過條件化來控制相關變量,那么實驗組或許是可交換的。這種情況下,盡管 treatment 和 potential outcome 可能是 unconditionally associated(由于 confounder 存在,紅色虛線),但在 X 固定住的條件下,它們是沒有關聯的(想象下紅線被截斷)。
圖片
如 Fig 2.3 所示,X 是 T 和 Y 的 confunder,因此,T 和 Y 之間有一條沿著  的 non-causal association(紅色虛線所示)。但是,當我們 contioning on X,即固定住 X 的值,T 和 Y 之間的 non-causal association 就會被 block 掉,變成:


圖片
我們可以推出在 X 固定的條件下的 causal effect,即 conditional average treatment effect:
圖片
第一行是期望公式,第二行是由假設 2.2 得到的,第三行是由觀察的數據得到的。
這時候再對 X 求期望,就可以得到完整的 average treatment effect,這個又叫做 Adjustment Formula(調整公式):
圖片
Conditional exchangeability(假設 2.2)是因果推理的核心假設,它有很多名稱。例如,unconfoundedness 無混雜性、conditional ignorability 條件可忽略性、no unobserved confounding 無未觀察到的混雜、selection on observables 對可觀察的選擇、no omitted variable bias 無遺漏變量偏差等。我們將在本系列教程中大量使用 “unconfoundedness 無混雜性”這個名稱。
但是,實際情況是 我們通常無法確定有條件的可交換性是否成立??赡苡幸恍┪从^察到的混雜因子不是 X 的一部分,這意味著違反了條件可交換性,如下圖所示,由于存在另外一個混雜因子 W,獨立性并不存在。
圖片
幸運的是,隨機試驗可以解決這個問題(第 5 章)。不幸的是,在觀測數據中,這種情況很有可能存在。我們能做的最好的事情就是觀察并擬合盡可能多的協(xié)變量(X 和 W)——盡可能確保 unconfoundedness。

2.3.4 Positivity/Overlap and Extrapolation


雖然想象中對許多協(xié)變量進行 condition 可以實現 unconfoundedness,但它實際上可能是有副作用的。這與另一個我們尚未討論的假設有關:Positivity 積極性。Positivity 是指具有不同協(xié)變量值 X=x 的任何 group 都有一定的概率接受任何 value 的 treatment。即。為了好理解把原文也貼出來,建議大家停下來仔細回味一下 Positivity 的意思。


Positivity is the condition that all subgroups of the data with di?erent covariates have some probability of receiving any value of treatment. Formally, we de?ne positivity for binary treatment as follows

圖片
下面解釋 positivity 為啥重要,首先回顧下調整公式:
圖片
如果違反了 positivity,那么就有  或者 ,由聯合概率公式得到  或 ,這正對應著調整公式中的兩個事件。
把 Eq.(1) 中的期望改成求和,Eq(1) 就可以寫成:
圖片
應用 Bayes rule, 可以得到:
圖片
在 Eq.(2) 中,如果分母中的 ,那么算不出 causal effect 了。
直觀的解釋是如果 ,那么意味著 X=x 這一組 group 里面,每個人都接受了 treatment(每個喝醉酒的人都穿鞋睡覺),這樣就沒法計算 causal effect。
The Positivity-Unconfoundedness Tradeo?:
盡管 condition on 更多的協(xié)變量可能會有更高的機率滿足 unconfoundedness,但同樣會有更大的機率違反 Positivity。隨著我們增加協(xié)變量的數量,每個 subgroup 越來越小,整個 subgroup 得到同樣 treatment 的可能性越來越高。例如,一旦任 subgroup 的大小減少到 1,肯定不會滿足 Positivity。 

2.3.5 No interference, Consistency, and SUTVA


這一小節(jié)再介紹幾個其他的概念:
No interference:
圖片
No interference 指的是每個個體的 potential outcome 只和當前這個個體所接受的 treatment 有關,和其他個體的 treatment 無關。
Consistency:
圖片
Consistency 一致性指的是,如果觀察到的 treatment T=t,觀察的結果Y 實際上是 T=t 的 potential outcome--Y(t)。這樣就能解釋為什么 ,這可能解決了前面部分一些讀者留下的疑問,即為什么
圖片

2.3.6 Tying It All Together


搞明白上述假設后,我們再來回顧下調整公式,這一次在每個等式后把需要的假設列了出來:
圖片
這就是怎么把所有這些假設結合在一起,來保證平均因果效應 ATE 的可識別性。通過上面的公式,很容易就可以算 ATE 的實際估值。



*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。

比較器相關文章:比較器工作原理




關鍵詞: AI

相關推薦

技術專區(qū)

關閉