版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
流行病學資料的多因素回歸(huíguī)分析鄭衛(wèi)軍流行病學(liúxínɡbìnɡxué)與衛(wèi)生統計學教研室第一頁,共七十八頁。整理課件diseasesourcegeneenvironmenthealthhabitSESgenderage???Exampleofcomplexityofmedicalstudy第二頁,共七十八頁。整理課件Exampleofcomplexityinmedicalstudyphysicalactivityeatingdrinkingsmokingsocialeconomicstatusenduredglucosebloodpressureweightcholesteroldiabetescoronaryheartdiseaseenvironmentlifestyleendogeneousfactorsdiseases第三頁,共七十八頁。整理課件流行病學多變量分析(fēnxī)工具回歸多因素、多元線性回歸多因素、多元logistic回歸COX比例(bǐlì)風險模型主成分分析因子分析聚類判別分析路徑分析結構方程模型第四頁,共七十八頁。整理課件本章(běnzhānɡ)我們來交流點什么?多因素(yīnsù)線性回歸多因素logistic回歸多因素COX回歸第五頁,共七十八頁。整理課件本講學習(xuéxí)目標掌握(zhǎngwò)多因素回歸的技巧及注意點第六頁,共七十八頁。整理課件一、多因一果的回歸(huíguī)分析方法比較研究實驗因素(yīnsù)與療效實驗組VS對照組:t檢驗、卡方、秩和、方差分析相關性研究相關分析回歸分析第七頁,共七十八頁。整理課件多因素問題常見(chánɡjiàn)情況常見于觀察性研究探討多個因素作用模式(móshì)分析由于分組不均衡造成存在著混雜因素實驗性研究也可以遇到。基本的處理方法:多因素回歸第八頁,共七十八頁。舉例(jǔlì)
關于胰臟癌病人生存時間的研究。該研究的終點為死亡,包括很多可能影響生存的因素第九頁,共七十八頁。本例目標分析影響生存的多個因素,因素間地位(dìwèi)平等第十頁,共七十八頁。舉例關于(guānyú)胰臟癌病人生存時間的研究。該研究的終點為死亡,探討術中放療對生存的影響第十一頁,共七十八頁。本例目標探討術中放療(fànɡliáo)較未放療(fànɡliáo)是否影響生存,其它為混雜因素,需要排除混雜干擾第十二頁,共七十八頁。COX回歸分析(fēnxī)結果第十三頁,共七十八頁。多因素(yīnsù)回歸多因素線性回歸:因變量定量資料多因素logistic回歸:因變量是分類資料(常見二分類)多因素Poisson回歸:因變量是泊松分布資料多因素COX比例風險模型:因變量是時間生存(shēngcún)資料多因素回歸的自變量:可以是定量,也可以是分類資料第十四頁,共七十八頁。不同方法的應用(yìngyòng)場合病例對照研究(yánjiū)?隊列研究?實驗性研究?第十五頁,共七十八頁。整理課件不同方法的應用(yìngyòng)場合線性回歸隊列/實驗性研究(yánjiū)Logistic回歸病例對照/隊列/實驗性研究Poisson回歸
隊列COX模型隊列/實驗性研究第十六頁,共七十八頁。整理課件思考(sīkǎo):什么樣的設計?采用什么樣的方法?例1某研究者跟蹤隨訪已發(fā)病冠心病病人,研究病人的年齡age、性別sex(0為女性、1為男性)、心電圖檢驗(jiǎnyàn)是否異常ecg(ST段壓低、0為正常、1為輕度異常、2為重度異常)與冠心病ca復發(fā)是否有關。例1某研究者希望研究病人的年齡age、性別sex(0為女性、1為男性)、心電圖檢驗是否(shìfǒu)異常ecg(ST段壓低、0為正常、1為輕度異常、2為重度異常)與冠心病ca發(fā)病是否有關。第十七頁,共七十八頁。整理課件橫截面研究可以(kěyǐ)做多因素回歸嗎?橫截面調查的數據疾?。盒难懿?、高血壓相關因素:性別、年齡、紅肉日均攝入量、吸煙、飲酒(yǐnjiǔ)、高血糖、血管彈性指數第十八頁,共七十八頁。整理課件橫截面研究可以(kěyǐ)做多因素回歸嗎?橫截面調查的數據疾?。盒难懿?、高血壓相關因素:性別(xìngbié)、年齡、紅肉日均攝入量、吸煙、飲酒、高血糖、血管彈性指數哪些因素可以做呢?第十九頁,共七十八頁。整理課件橫截面研究可以做多因素(yīnsù)回歸嗎?橫截面調查的數據疾?。盒难懿 ⒏哐獕合嚓P因素(yīnsù):性別、年齡、紅肉日均攝入量、吸煙、飲酒、高血糖、血管彈性指數固有的因素,理論上和結局時間邏輯明確的因素可以開展多因素回歸分析第二十頁,共七十八頁。整理課件多因素回歸(huíguī)的注意點樣本量回歸方程中,因素的篩選(shāixuǎn)多重共線性問題第二十一頁,共七十八頁。整理課件樣本量線性回歸:納入回歸模型(móxíng)變量數的5-10倍Logistic回歸:陽性數納入模型變量數的5-10倍,總樣本量至少乘以2樣本量過少,則導致抽樣誤差增加,回歸模型擬合效果變差第二十二頁,共七十八頁。整理課件因素(yīnsù)篩選1.常見方法單因素加多因素方法
即單因素回歸P值<0.05,<0.1,<0.2的納入(nàrù)模型分析。
此舉是為了減少變量個數,提高擬合效果最優(yōu)子集方程法(逐步回歸法)向前法向后法逐步法單因素加多因素逐步回歸法第二十三頁,共七十八頁。整理課件24(1)前進(qiánjìn)法
(2)后退法
(3)逐步法自變量從無到有、從少到多
先將全部自變量放入方程(fāngchéng),然后逐步剔除
雙向篩選:引入有意義的變量(biànliàng)(前進法),剔除無意義變量(biànliàng)(后退法)最優(yōu)方程篩選第二十四頁,共七十八頁。整理課件25逐步回歸分析的基本思想-擬合(nǐhé)效果線性回歸保證(bǎozhèng)納入因素后,模型的R2值最大Logistic等回歸方法AIC值、SC值或-2loglikelihood值越小好第二十五頁,共七十八頁。整理課件26因素(yīnsù)篩選注意事項如果(rúguǒ)有變量的引入導致具有關鍵作用的因子其統計學意義發(fā)生改變(從無到有,或從有到無),必須發(fā)現原因!是否由于樣本量過少,變量過多導致是否存在多重共線性是否屬于混雜因素是否屬于中間變量:回歸模型不能同時納入影響因素及其中間變量第二十六頁,共七十八頁。整理課件27多重共線性是指在進行多因素回歸分析時,自變量間存在較強的線性相關關系。共線關系的存在,可使得估計系數方差加大,系數估計不穩(wěn),結果分析困難。因此在回歸分析時,特別是當回歸結果難以用專業(yè)知識解釋時,要進行共線性診斷,找出存在共線性且不重要的那些自變量,剔出方程,另行回歸分析。對于存在共線性的資料,可以利用共線性診斷有選擇的保留自變量以消除共線性;或者采用嶺回歸、主成分(chéngfèn)回歸等回歸分析方法以避免共線性指標對結果的影響。多重共線性問題(wèntí)第二十七頁,共七十八頁。整理課件28多重共線性的表現(biǎoxiàn)在實際應用中主要表現為:(1)模型擬合效果很好,但偏回歸系數幾乎都無統計學意義;(2)偏回歸系數估計值的方差(fānɡchà)很大;(3)偏回歸系數估計值不穩(wěn)定,隨著樣本含量的增減各偏回歸系數發(fā)生較大變化或當一個自變量被引入或剔除時其余變量偏回歸系數有很大變化;(4)偏回歸系數估計值的大小與符號可能與事先期望的不一致或與經驗相悖,結果難以解釋
出現以上情況,提示存在多重共線性問題,應進行多重共線性診斷。第二十八頁,共七十八頁。整理課件回歸(huíguī)案例分析(logistic)某婦幼保健院采用病例對照研究探索乳腺增生的影響因素。隨機抽取某年在本院就診(jiùzhěn)的200名乳腺增生患者及200名非乳腺增生患者,采用問卷調查法對各種可能的影響因素進行調查,以探索乳腺增生的危險因素。第二十九頁,共七十八頁。整理課件回歸(huíguī)案例分析第三十頁,共七十八頁。整理課件1:單因素(yīnsù)分析回歸(huíguī)案例分析第三十一頁,共七十八頁。整理課件單因素分析初步結論:由于年齡的影響在單因素分析中無統計學意義,且OR值也較為(jiàowéi)接近1,在多因素分析中不再考慮年齡因素,僅對其它4個因素進行分析。回歸案例(ànlì)分析第三十二頁,共七十八頁。整理課件多因素(yīnsù)分析結果:回歸案例(ànlì)分析第三十三頁,共七十八頁。整理課件多因素分析小結:為什么rs變得無統計學意義了?相關分析結果顯示,妊娠(rènshēn)次數與流產次數具有較強的相關性(r=0.55,P<0.001)?;貧w案例(ànlì)分析第三十四頁,共七十八頁。整理課件多因素分析小結:可以設想,妊娠次數對乳腺增生可能并無影響(yǐngxiǎng)或影響(yǐngxiǎng)很小,單因素中的影響(yǐngxiǎng)可能主要是通過流產次數這一因素起作用的,當多因素分析中校正了流產次數的影響(yǐngxiǎng)后,妊娠次數的影響(yǐngxiǎng)變得無統計學意義。將妊娠次數這一變量去掉,重新擬合方程?;貧w(huíguī)案例分析第三十五頁,共七十八頁。整理課件模型中所有變量均有統計學意義(yìyì)。與含rs變量的模型相比,AIC和SC均降低,似然比差別很小。說明去掉rs后模型更優(yōu)含rs模型不含rs模型回歸案例(ànlì)分析第三十六頁,共七十八頁。整理課件初產年齡與母乳喂養(yǎng)可能存在一定的交互效應為什么mr和chage變得無統計學意義?(注意:即使有統計學意義,也無法反應真實的情況)一旦模型中加入交互項,變量便不再(bùzài)反映主效應,而是單獨效應。此時mr反映的是chage=0時的效應,同樣,chage反映的是mr=0時的效應?;貧w案例(ànlì)分析第三十七頁,共七十八頁。整理課件交互項的進一步解釋:對于母乳喂養(yǎng)的人(mr=0),初產年齡(niánlíng)>=25與初產年齡<25歲的人相比,其效應(參數估計值)為0.2717。對于非母乳喂養(yǎng)的人(mr=1),初產年齡>=25與初產年齡<25歲的人相比,其效應(參數估計值)為0.2717+1.4587=1.7304?;貧w案例(ànlì)分析第三十八頁,共七十八頁。整理課件本例結論:流產次數多是乳腺增生的危險因素,初產年齡和是否(shìfǒu)母乳喂養(yǎng)的交互作用對乳腺增生的影響也有統計學意義。初產年齡≥25且非母乳喂養(yǎng)的人,其乳腺增生的危險明顯增高。而單純初產年齡<25的人,或單純非母乳喂養(yǎng)的人,發(fā)生乳腺增生的危險并不高。這提示可針對不同人群開展不同的干預措施?;貧w案例(ànlì)分析第三十九頁,共七十八頁。整理課件當混雜混入(hùnrù)流行病學匹配(pǐpèi)分層多因素回歸多因素回歸+匹配多因素回歸+傾向得分多因素回歸+傾向得分第四十頁,共七十八頁。整理課件回歸中的混雜(hùnzá)因素混雜因素的識別:(1)該因素對結局有影響,可利用單因素回歸或χ2檢驗來驗證。(2)該因素在分析因素中的分布不均衡,可用χ2檢驗驗證一下。(3)從專業(yè)角度來判斷,即該因素不能是分析因素與結局關系的一個中間環(huán)節(jié)。也就是說,不能是分析因素引起該因素,通過該因素再引起結局。這一點主要根據(gēnjù)專業(yè)知識來確定。如果同時滿足這三個條件,基本可以斷定是混雜因素。如果有一條不滿足,該因素就不是混雜因素。第四十一頁,共七十八頁。整理課件回歸中的混雜(hùnzá)因素例2:分析性別、吸煙對幽門螺桿菌(HP)的影響,判斷(pànduàn)吸煙是否是混雜因素性別吸煙狀況HP陰性HP陽性男不吸煙146343吸煙64178女不吸煙211吸煙110530第四十二頁,共七十八頁。整理課件回歸(huíguī)中的混雜因素(1)判斷吸煙是否對Hp有影響:單因素logistic回歸提示:吸煙對Hp的發(fā)生(fāshēng)有一定影響,吸煙發(fā)生(fāshēng)的危險更高一些第四十三頁,共七十八頁。整理課件回歸中的混雜(hùnzá)因素(2)判斷吸煙在不同性別(xìngbié)中分布是否不同:卡方檢驗提示:吸煙在性別中分布不同,男性中比例更高第四十四頁,共七十八頁。整理課件回歸(huíguī)中的混雜因素未校正吸煙因素(yīnsù),性別分析結果校正吸煙(xīyān)因素后,性別分析結果第四十五頁,共七十八頁。整理課件回歸中的混雜(hùnzá)因素不吸煙的人之中,性別的分析(fēnxī)結果吸煙的人之中,性別的分析(fēnxī)結果第四十六頁,共七十八頁。整理課件胰島素治療的2型糖尿病患者(huànzhě)中胰島素和胰島素類似物的劑量與癌癥之間的關系
混雜因素分析(fēnxī)案例第四十七頁,共七十八頁。整理課件研究(yánjiū)方法及設計本研究(yánjiū)克服了以往相關研究(yánjiū)的不足1-4
-巢式病例對照研究
-多因素logistic回歸分析
-納入每種胰島素平均日用劑量作為變量入選標準
-2型糖尿病;入選前5年未用過胰島素;無惡性腫瘤史患者平均隨訪75.9月,在此期間患者暴露于甘精胰島素、地特胰島素、賴脯胰島素、門冬胰島素、人胰島素(基礎、餐時)第四十八頁,共七十八頁。整理課件第四十九頁,共七十八頁。整理課件預先計劃的比較(bǐjiào)在腫瘤組和對照組之間比較(bǐjiào)使用各種胰島素的人數所占比例使用各種胰島素的平均日劑量(
Meandailydose,MDD)使用各種胰島素的平均日劑量MDD≥0.3IU/kg的人數所占比例Mannuccietal.DiabetesCare.2010Jun14.[Epubaheadofprint]第五十頁,共七十八頁。整理課件腫瘤風險(fēngxiǎn)與胰島素日用劑量的關聯性病例組甘精胰島素平均日用(rìyòng)劑量較對照組高(0.24vs0.16IU/kg/day,p=0.036)人胰島素與其他胰島素類似物腫瘤發(fā)生與平均日用劑量無關
Mannuccietal.DiabetesCare.2010Jun14.[Epubaheadofprint]第五十一頁,共七十八頁。整理課件腫瘤風險與胰島素日用劑量(jìliàng)的關聯性每種胰島素“平均日劑量≥0.3IU/day*kg”:“大劑量”經Chalrson同病指數(zhǐshù)、二甲雙胍暴露、總胰島素平均日劑量校正后納入所有新發(fā)腫瘤病例及對照除外隨訪中首12月內新發(fā)腫瘤病例及其對照
Mannuccietal.DiabetesCare.2010Jun14.[Epubaheadofprint]第五十二頁,共七十八頁。整理課件結論(jiélùn)使用每種胰島素的人數比例,腫瘤組和對照組之間差異無統計學意義。校正混雜因素之后,高平均日劑量(≥0.3IU/kg)的甘精胰島素與腫瘤風險有聯系,其它(qítā)胰島素無此現象。當評價胰島素及其類似物與腫瘤風險的可能聯系時,必須考慮劑量。第五十三頁,共七十八頁。整理課件多因素(yīnsù)回歸+匹配常見logistic回歸(huíguī)非條件logistic:非匹配條件logistic回歸:匹配第五十四頁,共七十八頁。整理課件條件(tiáojiàn)logistic回歸:1:1匹配,可以通過SPSS軟件COX回歸模塊實施1:n匹配,則無法采用SPSS軟件,而要SAS或者(huòzhě)其它軟件實施第五十五頁,共七十八頁。整理課件傾向的分法是Rosenbaum和Rubin(1984)年首次提出的,其主要目的是均衡各對比組間各個特征變量的可比性。傾向得分:是指在一定協變量條件下,一個觀察對象可能接受某種處理(或暴露)因素的可能性。傾向的分值相同的兩個個體,其協變量的分布也趨于一致,即具有(jùyǒu)相同的接受處理/對照的概率。傾向的分主要用來降低選擇偏倚。多因素+傾向(qīngxiàng)得分第五十六頁,共七十八頁。整理課件傾向(qīngxiàng)得分應用方法傾向得分是協變量的一個綜合指標,可以校正已測量的混雜因素(yīnsù)。可以作為協變量進行多調整可以作為匹配的因素開展或不開展多因素調整也可以用于分層。第五十七頁,共七十八頁。整理課件
不同胰島素促泌劑與二甲雙胍在有或無心肌梗
塞史二型糖尿病患者中死亡率和心血管風險
的比較:丹麥(dānmài)研究多因素+傾向(qīngxiàng)得分第五十八頁,共七十八頁。整理課件數據來源:丹麥國家注冊(zhùcè)登記研究所有丹麥居民各有一個唯一、永久的注冊號,與國內各種注冊相連接.“丹麥國家處方注冊”,記錄了1995年來所有的處方.“全國患者注冊”,1978年以來,所有的住院患者出院時記錄了主要診斷(以及必要時,次要(cìyào)診斷).“全國死因注冊”,記錄死因信息。第五十九頁,共七十八頁。整理課件研究(yánjiū)人群丹麥居民年齡大于20歲,在1997年至2006年之間應用胰島素促泌劑或者二甲雙胍單藥治療者總人數為107,806;隨訪時間:中位數3.3年(最長9年)剔除(tīchú)了接受胰島素單一治療的8183例和多個藥物聯合治療的3434例。入組人群分為有或無心肌梗死病史研究期間允許更改治療藥物77%的患者在研究期間僅使用了一種藥物治療MI,myocardialinfarction第六十頁,共七十八頁。整理課件研究(yánjiū)設計研究目的:評估與二甲雙胍相比,常用的胰島素促泌劑(包括瑞格列奈)的死亡率和心血管風險(fēngxiǎn)。大型、回顧性、非隨機分組的觀察性研究。對居住在丹麥、接受單一口服降糖藥治療的T2DM患者的臨床注冊資料進行統計分析。SlideNo61Date第六十一頁,共七十八頁。整理課件無心梗史患者的各組基線(jīxiàn)數據二甲雙胍格列美脲格列齊特格列本脲格列吡嗪甲苯磺丁脲瑞格列奈N(%)43,340(54.3)36,313(37.0)5,926(6.0)12,495(12.7)6,965(6.1)5,335(5.4)2,513(2.6)年齡(年)52.5
±14.060.9±13.360.0±13.263.2±13.763.0
±13.564.4
±13.557.9
±12.6男性(%)50.955.356.554.454.153.856.0治療時間(年)1.76±1.582.11±1.752.10±1.752.35±2.082.35±2.082.36±2.131.97±1.76各組基線(jīxiàn)水平不均衡,不具可比性.第六十二頁,共七十八頁。整理課件既往心梗史患者的各組基線(jīxiàn)數據二甲雙胍格列美脲格列齊特格列本脲格列吡嗪甲苯磺丁脲瑞格列奈N(%)2,906(30.2)3,894(43.3)517
(6.9)1168(12.2)660
(7.3)501
(5.6)186
(2.1)年齡(年)65.8±10.770.9±11.070.5±10.970.9±11.070.5±10.471.2±11.468.2±10.3男性(%)73.170.369.370.069.764.970.4治療時間(年)1.67±1.481.98±1.601.96±1.782.28±1.962.19±1.902.12±1.982.04±1.76各組基線水平不均衡(jūnhéng),不具可比性.第六十三頁,共七十八頁。整理課件
統計學方法:傾向(qīngxiàng)匹配第六十四頁,共七十八頁。整理課件傾向得分(défēn)計算第六十五頁,共七十八頁。整理課件傾向性匹配(pǐpèi)
(propensity-matching)3.每一個個體都有一個"傾向性得分",與該個體出現在兩組之中的概率P和1-P有關。4.根據促泌劑組中某患者"傾向性得分",到服用二甲雙胍的人群中找一個“對象”,兩者“傾向性得分“最接近,若最接近的候選者很多,可隨機抽取(chōuqǔ)一位。5.事先規(guī)定得分相差多少算"接近";若二甲雙胍的人群中沒有得分“接近”的對象,促泌劑組中的該成員就找不到"對象"。第六十六頁,共七十八頁。整理課件第六十七頁,共七十八頁。整理課件基線(jīxiàn)水平的均衡性有所改善。傾向性匹配(pǐpèi)后,各組人數第六十八頁,共七十八頁。整理課件第六十九頁,共七十八頁。整理課
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保公益捐贈攻略-成功的環(huán)保捐贈計劃
- 河南師范大學《比較政治學》2023-2024學年第一學期期末試卷
- 河南科技大學《土壤肥料學A》2021-2022學年第一學期期末試卷
- 重陽節(jié)環(huán)保宣傳-傳承重陽習俗環(huán)保
- 河南科技大學《護士人文修養(yǎng)》2021-2022學年第一學期期末試卷
- 河南科技大學《工程力學B》2023-2024學年第一學期期末試卷
- 河南科技大學《材料測試與技術》2021-2022學年第一學期期末試卷
- 河北地質大學《基礎工程》2021-2022學年第一學期期末試卷
- 2021年6月大學英語四級詞匯講解及考點歸納
- 非貴金屬盤細分市場深度研究報告
- 蛋白的分離純化
- 16開(19x26)獎狀打印模版
- 大班健康《預防手足口病》課件
- 淺談三新背景下課堂教學方式的變革 論文
- 咽喉癌病歷書寫
- 數據中心運維管理方案
- 2023年佛山市圖書館招考工作人員筆試參考題庫(共500題)答案詳解版
- “跨媒介敘事”理論研究
- 大型活動安保服務投標方案
- 非傳統安全研究與中國
- 河南省南陽市宛城區(qū)2023-2024學年八年級上學期期中地理試題
評論
0/150
提交評論