




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
因果推斷學習筆記?因果推斷區(qū)別于傳統(tǒng)的相關性研究很重要的?點是潛在結(jié)果框架,也就是我們今天的topic所要涵蓋的內(nèi)容。今天的session我們將會cover以下?個話題:1.什么是潛在結(jié)果2.因果推斷的核?問題3.對于核?問題的討論和答案4.完整的實例?、潛在結(jié)果研究treatment對于結(jié)果的影響,我們想要同時知道同等條件下,不同treatment下的結(jié)果,從?能夠得出結(jié)論,treatment的改變是否會導致結(jié)果的不同例如a)吃藥不吃藥對于頭痛個體(吃藥前頭痛)的影響1.不吃藥頭痛,吃藥之后不頭痛:有因果效應2.不吃藥不頭痛,吃藥后不頭痛:沒有因果效應1.1符號說明我們先約定?下此次課程中所提到的符號,借助這些符號,把上?的因果效應的討論抽象成數(shù)學公式。隨機變量X表?d維的協(xié)變量(covariate)T表??預(treatment)Y表?觀測到的結(jié)果(observedoutcome),我們今天討論的是?元treatment,也就是T=0或者T=1i表?第i個樣本(sample/unit/individual)Y(T)表?對于樣本i來說接受treatmentT之后的潛在結(jié)果(potentialoutcome),?如Yi(1),Y(0)iiY(1)?Y(0)表?因果效應ii1.2因果推斷的核?問題對于潛在結(jié)果,{Y(1),Y(0)}中只會有?個被觀測到,因果效應groundtruth缺失。實際觀測到的結(jié)果,只可能是潛在結(jié)果中唯?的?ii個,被稱為factualoutcome,另?個觀測不到的被稱為counterfactual。例如前?的例?中提到的對于?個頭痛個體,treatment只能?選?,?不能同時給予兩個treatment,i.吃藥,factual是吃藥的結(jié)果ii.不吃藥,factual是不吃藥帶來的結(jié)果滴滴向?戶隨機發(fā)送推薦短信(?預),?戶要么收到短信,要么收不到,這時候?戶的反應,只能是其中?種情形下的結(jié)果,?不可能是兩個結(jié)果。對于此短信的反應的實際結(jié)果只能依賴于?選?的?預,?不能看到?預和不?預下的?戶分別的反應?;跐撛诮Y(jié)果模型,我們感興趣的是平均因果效應(Averagetreatmenteffect,簡記為ATE)ATE:E[Y(1)?Y(0)]=E[Y(1)]–E[Y(0)]在?數(shù)據(jù)時代和統(tǒng)計學中經(jīng)典的?數(shù)定律,使我們能夠利??樣本平均來估計平均因果效應。但與此同時,如下圖表格中所?,對于每個樣本來說,Y(1)和Y(0)是潛在結(jié)果,Y(1)?Y(0)沒有真實的值,分布未可知,?法?統(tǒng)計學?法去估計。?對于E[Y(1)]和E[Y(0)],Y(1)是潛在結(jié)果,它們之間并不是獨?同分布的,沒有任何假設,利??樣本直接求平均來估計E[Y(1)]是i不對的(?數(shù)定律要求數(shù)據(jù)是獨?同分布的)。因此為了估計左邊的ATE,需要把它轉(zhuǎn)換成右邊隨機變量Y關于T的分布,給定T,也就是右邊的Y和T之間的相關性模型,從?在隨機變量(X,T,Y)上我們能夠定義分布的,可以??數(shù)定律或者統(tǒng)計模型求解。因此核?在于通過設置合理的假設,在E[Y(1)]?E[Y(0)]=E[Y∣T=1]–E[Y∣T=0]左右兩邊建?等號,也就是接下來我們課程的重點討論對象。通過上?的討論,我們了解到,潛在結(jié)果決定了相關性關系(右邊)并不等價于因果關系(左邊)真正的原因?如,前?天晚上喝酒,這種情況下喝酒就是混淆變量(confounding),也就是既會影響treatment,?會影響結(jié)果;再?如,穿鞋?和不穿鞋?的?群不?樣,有顯著的差別,這兩組接受穿鞋?treatment的?群是不可?的(non-overlapping),?如穿鞋?睡覺的絕?多數(shù)可能都是喝醉的?,?不穿鞋?睡覺中絕?多數(shù)都是清醒的?,從?兩個?群是不?致的???的?群應該是:穿鞋?和不穿鞋?的?群??的喝酒的?以及清醒的?分布是?致的來。天?變熱導致冰激凌漲價(影響treatment),同時也會導致雪?融化(影響結(jié)果),它就是?個混淆變量。1.3兩個假設1.3.1Ignorability假設為了從因果性模型轉(zhuǎn)換到相關性模型,從confounding出發(fā),我們考慮如下三個等價的假設1.Ignorability2.exchangability3.unconfoundednessIgnorability名字的由來是加了這個假設之后,潛在結(jié)果中的questionMarks可以直接忽略,或者說counterfactualoutcome可以忽略,從?能夠取實際的觀測結(jié)果來估計。嚴格來說,Ignorability指潛在結(jié)果與實際的treatment的分配?關,如果有confounding的話,即既會影響treatment,?會影響結(jié)果,就?如在如下的因果圖中所?,潛在結(jié)果會和treatment之間有額外的confounding的通道,從?潛在結(jié)果和treatment不能保持獨?。因此ignorability保證了unconfoundedness。,即沒有混淆變量的影響Exchangeability:接受treatment和不接受treatment的組別之間是可以交換的E[Y(1)]?E[Y(0)]=P(T=1)E[Y(1)∣T=1]+P(T=0)E[Y(1)∣T=0]?(P(T=0)E[Y(0)∣T=0]+P(T=1)E[Y(0)∣T=1])=(P(T=1)+P(T=0))×E[Y(1)∣T=1]–(P(T=1)+P(T=0))×E[Y(0)∣T=0]=E[Y(1)∣T=1]?E[Y(0)∣T=0]上述的推導證明了Ignorability和exchangability這兩種說法是等價的,都能夠通過去除confounding來去除掉treatment對于潛在的結(jié)果的影響。1.3.2consistency假設除了ignorability,我們還需要假設:consistency1.接受的treatment唯?確定結(jié)果2.T=t代表觀測到的Y就是基于t的潛在結(jié)果Alongwithconsistency,我們還需要額外的假設1.沒有?擾(Nointerference)2.對于第i個樣本來說,ta??的treatment唯?的確定了結(jié)果,別的樣本的treatment對于其最終的結(jié)果沒有影響,?如在如下狗狗的例?中,我是否快樂其實只與我??的treatment(??有狗狗)有關,?與別的treatment(朋友有沒有狗狗)?關,樣本i不受其他的treatment的?擾。綜合以上ignorability,consistency,nointerference假設,我們可以得到ATE的調(diào)整公式:E[Y(1)]?E[Y(0)](nointerference)=E[Y(1)∣T=1]?E[Y(0)∣T=0](Ignorability)=E[Y∣T=1]?E[Y∣T=0](consistenty)??個很?然的問題是,是不是這兩個假設總能成??答案是itdepends。?先我們先討論ignorability。對于RandomizedControlTrial(RCT),?如通過拋硬幣來決定隨機給予treatment(穿鞋?睡覺,不穿鞋?睡覺),這個假設就是成?的,沒有混淆變量喝酒,喝酒和清醒的?在treatment間沒有差異,潛在結(jié)果和treatment獨?。那么什么時候這個假設不成?呢?ignorability。??接下來我們討論consistency的假設,它也不總是成?。T=1代表有狗狗,那么只要有狗狗,最終個體的結(jié)果Y就是基于有狗狗的結(jié)果——快樂,?與狗狗的品類?關。如下圖所?,就是?個不滿?consistency的例?,最終的結(jié)果不只取決于實際接受的treatment,還可能收到別的?擾。圍的司機所受到的補貼的影響,這個時候consistency就不能得到滿?。ignorability和consistency,nointerference使我們能夠在ATE的左右兩端建?等號,也就能夠通過統(tǒng)計學的?法去估計因果效應,這個過程被稱作identifiation。如果?個因果?標,可以通過統(tǒng)計分布估計得到,這個因果quantity就是可識別的(identifiable),?如ate,以及接下來我們更感興趣的cate。添加假設建?等式的過程就是identification。identification:從因果量到統(tǒng)計量,把個體效應的因果模型轉(zhuǎn)換到可估計的相關性模型?、CATE通常情況下,考慮異質(zhì)性的因果效應可以給我們更多的信息,能夠從協(xié)變量(individual)層?更加細致的區(qū)分因果效應,heterogeneoustreatmenteffect(hte),conditionalaveragetreatmenteffect(cate)或者等價的individualtreatmenteffect(ite)定義E[Y(1)-Y(0)|X]identificationE[Y(1)?Y(0)∣X](nointerference)=E[Y(1)∣T=1,X]–E[Y(0)∣T=0,X](?假設)=E[Y∣T=1,X]?E[Y∣T=0,X](consistency)2.1兩個假設2.1.1conditionalignorability核?假設:等價的假設conditionalignorabilityconditionalexchangeabilityunfoundedness這?的conditionalignorability指的是給定協(xié)變量covariate,潛在結(jié)果與treatment?關,也就是基于covariate的條件獨?,反映在因果圖上就是切斷給定協(xié)變量,outcome和treatment之間由于潛在的confounding?可能存在的的聯(lián)系。引?conditionalignorability或者conditionalexchangability的原因在于,unconfoundedness是沒有辦法實際中驗證的,因為我們不知道是否有未觀測到的confounding,?這些很可能會在treatment和outcome之間建?別的通道。2.1.2Positivity不同于ATE,CATE的估計還需要額外的假設:正定性(Positivity)正定性(Positivity)定義:離散treatment:概率P(T∣X)>0,給定協(xié)變量之后任意treatment的概率都嚴格?于0,也就是通常所說的傾向性評分(propensityscore)嚴格?于0連續(xù)treatment:更嚴格的要求generalizedpropensityscore概率密度p(T∣X)>01.Mathematicalformulation(數(shù)學公式)從CATE的計算公式出發(fā),可以得到propensityscore是作為分母中的?項,若為0,則該計算表達式?定義,從??法計算得到cate或者ate2.直觀解釋:OverlapPositivity保證了T=1T=0和的?群是完全重合的。如果有positivityviolation(違反)的話,?如說關于第?維協(xié)變量?群有50%的重合,這樣?隨著協(xié)變量維數(shù)d的增加,重合的部分會逐漸的減?,衰減直??群?乎?重合(0.5)d~0,也就是通常所說的維數(shù)災難(curseofdimensionality)3.外推能?:Positivityviolation會帶來模型外推能?的變差如下圖所?,在identification之后得到的統(tǒng)計估計中,T=1建模得到的模型不能遷移到另?個T=0,因為數(shù)據(jù)之間的gap,因此計算得到cate可能是有偏差的still,有沒有不滿?positivity的情形呢?在滴滴,定價策略基礎調(diào)節(jié),基于城市粒度調(diào)節(jié),對于城市的所有?,treatment都是調(diào)價,沒有不調(diào)價的,那么P(T=1|X)=1,P(T=0|X)=0,positivy就不滿?2.2causalquantity和statisticalquantity之間的等式有了這兩個假設,就能夠如下圖所?,建?causalquantity和statisticalquantity之間的等式cateidentificationby-product:得到基于個體?平的因果效應CATE之后,依據(jù)雙期望定理(條件期望的期望是?條件期望),我們依舊可以得到ATE,也就是總體?平的因果效應2.3總結(jié)2.3.1假設因為潛在結(jié)果,因果模型推斷估計CATE/ATE所需要的假設ConditionalIgnorability/IgnorabilityPositivity/NAConsistency/ConsistencyNointerference/Nointerference2.3.2依賴的數(shù)學定理Linearityofexpectation(期望的線形性質(zhì))Theoverallexpectationcanbecomputedbytakingexpectationonconditionalexpectation(重期望定理)更加general的統(tǒng)計學名詞clarificationEstimand是任何想要去估計的量Estimate是基于數(shù)據(jù)的統(tǒng)計量,可作為estimand的估計Estimation指的是從得到數(shù)據(jù),得到統(tǒng)計量去估計estimand的過程Potentialoutcomeframework決定了causalestimand是不能直接估計的。本次session討論的以上假設都是在把?個causalestimand轉(zhuǎn)化成?個統(tǒng)計學的estimand,從?可以利?統(tǒng)計學的estimation獲取得到相應的estimate,也就是如下所?的identification-estimationflowchart。如何去做有效的estimation,?如減??差和減?bias,提?模型準確度,是因果推斷中的另?重點和算法聚焦。三、實例基于potentialoutcomeframework,我們以下?的?個因果推斷的實例,展??個從identification到?estimation來估計ATE的鏈路。3.1背景46%的美國?有??壓,??壓和死亡率的增加相關,因此想要研究鈉的攝?對于??壓的影響(effect)。數(shù)據(jù)主要的notation為:Y:?壓;T:鈉的攝?;X:年齡和流失的蛋?質(zhì)。3.2估計CausalEstimand:ATE=E[Y(1)-Y(0)]Identifiacation:該實例是仿真數(shù)據(jù)集,滿?conditionalignorability,positivity;consistency,同時真實的ATE已知,我們可以從中檢驗模型的準確度Estimation
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 滑雪場地建設與維護合同書
- 深圳市冷凍水產(chǎn)品購銷合同
- 重大突破:中國與尼日爾簽訂基礎設施建設項目合同
- 正式婚后財產(chǎn)歸屬合同樣本
- 設備采購與租賃合同樣本
- 社區(qū)衛(wèi)生服務中心藥師聘用合同范本
- 建筑工程總承包合同中新防水工程條款
- 緊急設備配送及維護合同
- 樓盤分銷代理合同范本
- 衛(wèi)浴產(chǎn)品標準制定與質(zhì)量認證考核試卷
- 上海話培訓課件
- 注塑車間績效考核方案
- 初中英語閱讀理解專項練習26篇(含答案)
- 誦讀經(jīng)典傳承文明課件
- 高中數(shù)學選擇性必修3 教材習題答案
- 智能語音技術與應用-基于Python實現(xiàn)(高職)全套教學課件
- 北師大版二年級下冊數(shù)學第一單元 除法教案
- 2024年兒童托管行業(yè)分析報告及未來發(fā)展趨勢
- 野生動植物保護
- 2024年安徽省合肥熱電集團招聘筆試參考題庫含答案解析
- 核心素養(yǎng)導向的作業(yè)設計
評論
0/150
提交評論