Poisson回歸模型及其應(yīng)用_第1頁
Poisson回歸模型及其應(yīng)用_第2頁
Poisson回歸模型及其應(yīng)用_第3頁
Poisson回歸模型及其應(yīng)用_第4頁
Poisson回歸模型及其應(yīng)用_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Poisson回歸模型及其應(yīng)用回歸模型及其應(yīng)用寧波大學(xué)醫(yī)學(xué)院寧波大學(xué)醫(yī)學(xué)院 沈其君沈其君問題提出問題提出 隊列研究隊列研究 開放隊列開放隊列 固定(封閉)隊列固定(封閉)隊列 特點:隨防時間長特點:隨防時間長 隨訪中有進(jìn)有出(失隨訪中有進(jìn)有出(失訪)訪) 影響因素多影響因素多 低發(fā)病率低發(fā)病率 M-HM-H法和標(biāo)準(zhǔn)化法法和標(biāo)準(zhǔn)化法 LogisticLogistic回歸模型回歸模型 CoxCox回歸模型回歸模型 PoissonPoisson回歸模型回歸模型Poisson回歸模型的引入回歸模型的引入 回歸分析回歸分析 研究因變量與自變量間關(guān)系 分析目的分析目的 預(yù)測與控制、因素分析與篩選、危險度估

2、計(RR和PAR) LogisticLogistic回歸模型回歸模型 因變量為二項分布 PoissonPoisson回歸模型回歸模型 因變量為Poisson分布,低發(fā)生率的(分組)計數(shù)(離散)資料(如低發(fā)病率或死亡率),自變量 可以連續(xù)型或離散型率(發(fā)生數(shù))與因素間關(guān)系率(發(fā)生數(shù))與因素間關(guān)系 一個實例一個實例 例例 ScottoScotto等人對美國北方城市等人對美國北方城市MM城和南城和南方方D D城城1515歲以上婦女患非黑色素皮癌狀況歲以上婦女患非黑色素皮癌狀況進(jìn)行調(diào)查,結(jié)果見表進(jìn)行調(diào)查,結(jié)果見表13-313-3,年齡每,年齡每1010歲歲一層。試用一層。試用PoissonPoisso

3、n回歸模型分析年齡效回歸模型分析年齡效應(yīng)和南北城市的差別。應(yīng)和南北城市的差別。 表表 13-3 M 城城與與 D 城城婦婦女女的的非非黑黑色色素素皮皮癌癌的的資資料料 M 城城(參參考考組組) D 城城 年年齡齡(歲歲) 發(fā)發(fā)癌癌例例數(shù)數(shù) 觀觀察察人人數(shù)數(shù) 發(fā)發(fā)癌癌例例數(shù)數(shù) 觀觀察察人人數(shù)數(shù) (j) ( dj1) ( nj1) ( dj2) ( nj2) 15 1 172675 4 181343 25 16 123065 38 146207 35 30 96216 119 121374 45 71 92051 221 111353 55 102 72159 259 83004 65 130 5

4、4722 310 55932 75 133 32185 226 29007 85 及及以以上上 40 8328 65 7538 合合計計 523 651401 1242 735758 率(發(fā)生數(shù))與因素間關(guān)系率(發(fā)生數(shù))與因素間關(guān)系 資料結(jié)構(gòu)資料結(jié)構(gòu) 對于隊列研究資料,設(shè)一個變量為混雜因素對于隊列研究資料,設(shè)一個變量為混雜因素(如年齡)分為(如年齡)分為J J層(可以是多個因素交叉形層(可以是多個因素交叉形成的層),另一個變量為暴露因素,分為成的層),另一個變量為暴露因素,分為K K個個水平(可以是多個因素形成的水平)。假如在水平(可以是多個因素形成的水平)。假如在第第j j層 、 第層 、

5、第k k個 暴 露 水 平 (個 暴 露 水 平 (j j= 1 , 2 , ,= 1 , 2 , ,J J; ; k k=1,2,=1,2,K K)觀察了)觀察了n njk jk例(人年),其中有例(人年),其中有d djk jk例發(fā)?。ɑ蛩劳觯?。形成如表例發(fā)?。ɑ蛩劳觯?。形成如表13-113-1的形式。并的形式。并可計算觀察發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度。可計算觀察發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度。表表 13-1 開開放放隊隊列列資資料料分分層層列列聯(lián)聯(lián)表表形形式式 暴暴露露水水平平(K) 1 k K 合合計計 nj1 dj1 hj1 njk djk hjk njK djK hjK nj. dj. hj

6、. 1 n11 d11 h11 n1k d1k h1k n1K d1K h1K n1. d1. h1. j nj1 dj1 hj1 njk djk hjk njK djK hjK nj dj hj J nJ1 dJ1 hJ1 nJk dJk hJk nJK dJK hJK nJ dJ hJ 表 13-1 中的h 層層別別(j) 率(發(fā)生數(shù))與因素間關(guān)系率(發(fā)生數(shù))與因素間關(guān)系 資料結(jié)構(gòu)資料結(jié)構(gòu) 表中最后一列是第表中最后一列是第j j層的發(fā)病率或發(fā)病密層的發(fā)病率或發(fā)病密度(對暴露因素求合計)。度(對暴露因素求合計)。 表中的表中的 jk jk為第為第j j層第層第k k個暴露水平下的發(fā)病個暴露水

7、平下的發(fā)病(死亡)率或發(fā)病密度的估計值,其真(死亡)率或發(fā)病密度的估計值,其真正的發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度為正的發(fā)?。ㄋ劳觯┞驶虬l(fā)病密度為h hjkjk,是層別因素和暴露因素的作用結(jié)果。是層別因素和暴露因素的作用結(jié)果。 h層別、因素組成設(shè)計陣層別、因素組成設(shè)計陣 對于隊列研究資料,將層別和因素交叉對于隊列研究資料,將層別和因素交叉分組形成列聯(lián)表資料,這里的層別和因分組形成列聯(lián)表資料,這里的層別和因素實際上為有序分類變量資料(等級資素實際上為有序分類變量資料(等級資料),分析中可以將層別、因素用多個料),分析中可以將層別、因素用多個0101變量表示形成設(shè)計陣(變量表示形成設(shè)計陣(design d

8、esign matrixmatrix)。為敘述方便,假定)。為敘述方便,假定J J=8=8,K K=2=2,記記i i為為8 82 2列聯(lián)表格子的順序編號,則設(shè)列聯(lián)表格子的順序編號,則設(shè)計陣為表計陣為表13-213-2的形式的形式 表表 13-2 層別、因素組成設(shè)計陣層別、因素組成設(shè)計陣 格子編號格子編號(i) j k Xi1 Xi2 Xi3 Xi4 Xi5 Xi6 Xi7 Xi8 Xi9 hi 1 1 1 1 0 0 0 0 0 0 0 0 h1 2 1 2 1 0 0 0 0 0 0 0 1 h2 3 2 1 0 1 0 0 0 0 0 0 0 h3 4 2 2 0 1 0 0 0 0 0

9、 0 1 h4 5 3 1 0 0 1 0 0 0 0 0 0 h5 6 3 2 0 0 1 0 0 0 0 0 1 h6 7 4 1 0 0 0 1 0 0 0 0 0 h7 8 4 2 0 0 0 1 0 0 0 0 1 h8 9 5 1 0 0 0 0 1 0 0 0 0 h9 10 5 2 0 0 0 0 1 0 0 0 1 h10 11 6 1 0 0 0 0 0 1 0 0 0 h11 12 6 2 0 0 0 0 0 1 0 0 1 h12 13 7 1 0 0 0 0 0 0 1 0 0 h13 14 7 2 0 0 0 0 0 0 1 0 1 h14 15 8 1 0 0 0

10、 0 0 0 0 1 0 h15 16 8 2 0 0 0 0 0 0 0 1 1 h16 表表 13-2 層別、因素組成設(shè)計陣層別、因素組成設(shè)計陣(有有截截距距項項) 格子編號格子編號(i) j k Xi1 Xi2 Xi3 Xi4 Xi5 Xi6 Xi7 Xi8 hi 1 1 1 0 0 0 0 0 0 0 0 h1 2 1 2 0 0 0 0 0 0 0 1 h2 3 2 1 1 0 0 0 0 0 0 0 h3 4 2 2 1 0 0 0 0 0 0 1 h4 5 3 1 0 1 0 0 0 0 0 0 h5 6 3 2 0 1 0 0 0 0 0 1 h6 7 4 1 0 0 1 0

11、0 0 0 0 h7 8 4 2 0 0 1 0 0 0 0 1 h8 9 5 1 0 0 0 1 0 0 0 0 h9 10 5 2 0 0 0 1 0 0 0 1 h10 11 6 1 0 0 0 0 1 0 0 0 h11 12 6 2 0 0 0 0 1 0 0 1 h12 13 7 1 0 0 0 0 0 1 0 0 h13 14 7 2 0 0 0 0 0 1 0 1 h14 15 8 1 0 0 0 0 0 0 1 0 h15 16 8 2 0 0 0 0 0 0 1 1 h16 率與協(xié)變量間的回歸模型結(jié)構(gòu)率與協(xié)變量間的回歸模型結(jié)構(gòu) 在在h hjkjk與層別因素、暴露因素間可通過

12、幾與層別因素、暴露因素間可通過幾種不同模型結(jié)構(gòu)反映其間的關(guān)系,并通種不同模型結(jié)構(gòu)反映其間的關(guān)系,并通過模型中參數(shù)來反映層別因素、暴露因過模型中參數(shù)來反映層別因素、暴露因素的效應(yīng)大小。若用素的效應(yīng)大小。若用 j j表示層別因素第表示層別因素第j j層的效應(yīng),層的效應(yīng), k k表示暴露因素第表示暴露因素第k k個水平的個水平的效應(yīng),則常用的表示效應(yīng),則常用的表示h hjkjk與層別、暴露因與層別、暴露因素間關(guān)系的模型常見的有兩種。素間關(guān)系的模型常見的有兩種。加法模型加法模型(additive model) h hjk jk與層別與層別 j j、暴露因素、暴露因素 k k間加法模型表示間加法模型表示

13、形式為形式為:hjk=jk 當(dāng)設(shè)計陣表示資料結(jié)構(gòu)時,率的加法模當(dāng)設(shè)計陣表示資料結(jié)構(gòu)時,率的加法模型為型為: hi= , p=J+K-1 參數(shù)參數(shù) j j和和 k k可以用觀察數(shù)據(jù)進(jìn)行估計。對可以用觀察數(shù)據(jù)進(jìn)行估計。對于第一暴露水平的基準(zhǔn)組,由于于第一暴露水平的基準(zhǔn)組,由于 1 1=0, =0, 則則有有h hj j1 1= j j, , 或或h hi i= j j。KKJJXXXX2211乘法模型乘法模型(multiplicative model) 當(dāng)加法模型不成立時,常將率作對數(shù)變換,其形式為: lnhjk=jk 或表示為: hjk=exp(jk)=exp(j)exp(k) 當(dāng)資料結(jié)構(gòu)以設(shè)計

14、陣形式表示時,率的乘法模型形式為: )exp(2211KKJJiXXXXh乘法模型乘法模型(multiplicative model) 上述上述h hjkjk、h hi i與與 j j、 k k間的模型形式稱為乘間的模型形式稱為乘法模型。當(dāng)層別與因素間無交互作用時,法模型。當(dāng)層別與因素間無交互作用時,以以k k=1=1為基準(zhǔn)組(為基準(zhǔn)組(exp(exp( 1 1)=1)=1),而),而exp(exp( k k) )就是第就是第k k個暴露水平相對于基準(zhǔn)組個暴露水平相對于基準(zhǔn)組的疾病相對危險度。當(dāng)層別與因素間存的疾病相對危險度。當(dāng)層別與因素間存在交互作用時,只能分層計算第在交互作用時,只能分層計

15、算第k k個水平個水平相對于相對于k k=1=1水平的相對危險度。水平的相對危險度。冪轉(zhuǎn)換模型(冪轉(zhuǎn)換模型(power model) 冪模型的形式為 當(dāng)=1時為加法模型,由于 在=0時為log(h), 即乘法模型,當(dāng)在01時為一簇模型??筛鶕?jù)實際數(shù)據(jù)擬擬合模型的形式。但解釋上不如加 法和乘法模型簡單。kjjkh/ ) 1(h非線性模型(非線性模型(nonlinear model) 對于流行病學(xué)資料,在研究因素與疾病對于流行病學(xué)資料,在研究因素與疾病發(fā)生間的關(guān)系時需要鑒別其間的關(guān)系是發(fā)生間的關(guān)系時需要鑒別其間的關(guān)系是加法模型還是乘法模型。然而,從經(jīng)驗加法模型還是乘法模型。然而,從經(jīng)驗和實踐的角度

16、,腫瘤等慢性病流行病學(xué)和實踐的角度,腫瘤等慢性病流行病學(xué)的暴露效應(yīng)很多情況都符合乘法模型。的暴露效應(yīng)很多情況都符合乘法模型。 除加法模型和乘法模型外,率與協(xié)變量除加法模型和乘法模型外,率與協(xié)變量間可以有非線性形式,需對研究問題深間可以有非線性形式,需對研究問題深入了解的基礎(chǔ)上來構(gòu)建非線性模型入了解的基礎(chǔ)上來構(gòu)建非線性模型。Poisson回歸模型及其參數(shù)估計回歸模型及其參數(shù)估計 PoissonPoisson分布條件下回歸模型的似然函數(shù)分布條件下回歸模型的似然函數(shù) 參數(shù)估計參數(shù)估計 模型擬合度與參數(shù)檢驗?zāi)P蛿M合度與參數(shù)檢驗 PoissonPoisson分布下模型的似然函數(shù)分布下模型的似然函數(shù) 對于

17、低發(fā)生(?。┞实拈_放性隊列研究資料,由于di服從Poisson分布,其概率函數(shù)為: 其中di是隨機(jī)變量,可取值為di=1,2, 其期望發(fā)生數(shù)i=nihi( )。回歸模型的似然函數(shù)為Poisson分布條件下各個格子概率函數(shù)的總概率(積)。 L()=!idiidepii!)()(11ihndiiniinidehnpiii,iX參數(shù)估計參數(shù)估計 兩側(cè)取對數(shù),回歸模型的對數(shù)似然函數(shù)兩側(cè)取對數(shù),回歸模型的對數(shù)似然函數(shù)為為: : lnL()= 對數(shù)似然函數(shù)中的未知參數(shù)可以用迭代對數(shù)似然函數(shù)中的未知參數(shù)可以用迭代重復(fù)加權(quán)最小二乘法(簡稱重復(fù)加權(quán)最小二乘法(簡稱IRLSIRLS法)估法)估計,它與通常的極大似

18、然估計結(jié)果一致。計,它與通常的極大似然估計結(jié)果一致。 也可用極大似然估計法也可用極大似然估計法 ),(_),(ln(iiiiiiXhnXhnd模型擬合度與參數(shù)檢驗?zāi)P蛿M合度與參數(shù)檢驗 偏差統(tǒng)計偏差統(tǒng)計量量 PoissonPoisson回歸模型擬合好壞用偏差統(tǒng)計量回歸模型擬合好壞用偏差統(tǒng)計量(deviance)(deviance)表示,偏差統(tǒng)計量實際上是對表示,偏差統(tǒng)計量實際上是對數(shù) 似 然 比 統(tǒng) 計 量 , 它 是 飽 和 模 型數(shù) 似 然 比 統(tǒng) 計 量 , 它 是 飽 和 模 型(saturated model)(saturated model)和擬合模型對數(shù)似然值和擬合模型對數(shù)似然值差

19、的兩倍,其在差的兩倍,其在PoissonPoisson分布條件下的計分布條件下的計算公式為:算公式為:)()ln(22iiiiidddG模型擬合度與參數(shù)檢驗?zāi)P蛿M合度與參數(shù)檢驗 2 2統(tǒng)計量統(tǒng)計量 G2服從于自由度為服從于自由度為n n-p-p的的 2 2分布(分布(n n為格為格子數(shù),子數(shù),p p為模型中參數(shù)個數(shù))。為模型中參數(shù)個數(shù))。 模型的擬合度也可用每個格子的實際發(fā)模型的擬合度也可用每個格子的實際發(fā)生數(shù)與期望數(shù)的生數(shù)與期望數(shù)的 2 2統(tǒng)計量來表示。統(tǒng)計量來表示。 iiiid)(22參數(shù)(因素)檢驗參數(shù)(因素)檢驗參數(shù)檢驗可通過兩個包含不同參數(shù)個數(shù)模參數(shù)檢驗可通過兩個包含不同參數(shù)個數(shù)模型

20、的偏差統(tǒng)計量型的偏差統(tǒng)計量G2 2的差(的差( G2 2)和自由度)和自由度的差(的差( dfdf)來實現(xiàn),當(dāng))來實現(xiàn),當(dāng) G2 2時,時,P P0.05, ChiSq Intercept 0 0.0000 0.0000 0.0000 0.0000 . . AGE 1 1 -11.6579 0.4487 -12.5373 -10.7784 675.01 .0001 AGE 2 1 -9.0277 0.1413 -9.3046 -8.7508 4083.79 .0001 AGE 3 1 -7.8105 0.0905 -7.9880 -7.6331 7442.69 .0001 AGE 4 1 -7

21、.0627 0.0698 -7.1996 -6.9258 10227.8 .0001 AGE 5 1 -6.5706 0.0647 -6.6974 -6.4438 10321.5 .0001 AGE 6 1 -6.0125 0.0599 -6.1299 -5.8950 10066.2 .0001 AGE 7 1 -5.5993 0.0633 -5.7233 -5.4753 7833.04 .0001 AGE 8 1 -5.4797 0.1037 -5.6828 -5.2765 2794.67 .0001 CITY 1 1 0.8043 0.0522 0.7020 0.9066 237.34 C

22、hiSq Intercept 1 -5.4797 0.1037 -5.6828 -5.2765 2794.67 .0001 AGE1 1 -6.1782 0.4577 -7.0753 -5.2810 182.17 .0001 AGE2 1 -3.5480 0.1675 -3.8763 -3.2197 448.76 .0001 AGE3 1 -2.3308 0.1275 -2.5807 -2.0810 334.36 .0001 AGE4 1 -1.5830 0.1138 -1.8061 -1.3599 193.38 .0001 AGE5 1 -1.0909 0.1109 -1.3083 -0.8

23、735 96.75 .0001 AGE6 1 -0.5328 0.1086 -0.7457 -0.3199 24.06 .0001 AGE7 1 -0.1196 0.1109 -0.3371 0.0978 1.16 0.2809 AGE8 0 0.0000 0.0000 0.0000 0.0000 . . CITY1 1 0.8043 0.0522 0.7020 0.9066 237.34 ChiSq AGE 266.9143 CITY 8.1950 1 258.72 ChiSq AGE 7 2561.57 .0001 CITY 1 258.72 ChiSq Intercept 1 -7.0760 0.0476 -7.1694 -6.9826 22070.7 .0001 AGE1 1 2.2883 0.0627 2.1654 2.4112 1331.64 .0001 CITY1 1 0.8031 0.0522 0.7008 0.9054 236.92 ChiSq Intercept 2790.3403 AGE1 272.6493 1 2517.69 .0001 CITY 14.3722 1 258.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論