![第3章-廣義線性模型_第1頁(yè)](http://file4.renrendoc.com/view/16e66aa1e6bd7fb7398a3c321e2c8f06/16e66aa1e6bd7fb7398a3c321e2c8f061.gif)
![第3章-廣義線性模型_第2頁(yè)](http://file4.renrendoc.com/view/16e66aa1e6bd7fb7398a3c321e2c8f06/16e66aa1e6bd7fb7398a3c321e2c8f062.gif)
![第3章-廣義線性模型_第3頁(yè)](http://file4.renrendoc.com/view/16e66aa1e6bd7fb7398a3c321e2c8f06/16e66aa1e6bd7fb7398a3c321e2c8f063.gif)
![第3章-廣義線性模型_第4頁(yè)](http://file4.renrendoc.com/view/16e66aa1e6bd7fb7398a3c321e2c8f06/16e66aa1e6bd7fb7398a3c321e2c8f064.gif)
![第3章-廣義線性模型_第5頁(yè)](http://file4.renrendoc.com/view/16e66aa1e6bd7fb7398a3c321e2c8f06/16e66aa1e6bd7fb7398a3c321e2c8f065.gif)
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主編:費(fèi)宇中國(guó)人民大學(xué)出版社2023/9/51.第3章廣義線性模型3.1廣義線性模型概述3.2Logistic模型3.3對(duì)數(shù)線性模型2023/9/52.3.1
廣義線性模型概述第2章我們研究了多元線性模型,該模型的一個(gè)重要假定是因變量是連續(xù)型的變量(通常假定服從正態(tài)分布),但在許多情況下,這種假定并不合理,例如下面這兩種情況.(1)結(jié)果變量可能是類(lèi)型變量.二值分類(lèi)變量和多分類(lèi)變量.(比如:是/否,差/一般/良好/優(yōu)秀等)顯然都不是連續(xù)型變量.2023/9/53.3.1廣義線性模型概述(2)結(jié)果變量可能是計(jì)數(shù)型變量(比如:一周交通事故的數(shù)目)這類(lèi)變量都是非負(fù)的有限值,而且它們的均值和方差通常是相關(guān)的(一般線性模型假定因變量是正態(tài)變量,而且相互獨(dú)立).普通線性回歸模型(2.3)假定因變量y服從正態(tài)分布,其均值滿(mǎn)足關(guān)系式:μ=Xβ,這表明因變量的條件均值是自變量的線性組合.本章介紹兩種常見(jiàn)的廣義線性模型:Logistic模型與對(duì)數(shù)線性模型.2023/9/54.3.1廣義線性模型概述1.廣義線性模型的定義:(1)隨機(jī)成分:設(shè)y1,y2,…,yn是來(lái)自于指數(shù)分布族的隨機(jī)樣本,即yi的密度函數(shù)為其中ai(.),b(.),ci(.)是已知函數(shù),參數(shù)αi是典則參數(shù),?是散度參數(shù).2023/9/55.1.廣義線性模型的定義:(2)聯(lián)結(jié)函數(shù):設(shè)yi的均值為μi而函數(shù)m(.)是單調(diào)可微的聯(lián)接函數(shù),使得其中是協(xié)變量,是未知參數(shù)向量.2023/9/56.指數(shù)分布族正態(tài)分布二項(xiàng)分布泊松分布2023/9/57.2.正態(tài)線性回歸模型正態(tài)分布屬于指數(shù)分布族,其密度函數(shù)為與(3.1)對(duì)照可知2023/9/58.2.正態(tài)線性回歸模型只要取聯(lián)結(jié)函數(shù)為,則正態(tài)線性回歸模型滿(mǎn)足廣義線性模型的定義.類(lèi)似的,容易驗(yàn)證,二項(xiàng)分布和泊松分布都屬于指數(shù)分布族.下面介紹實(shí)際中應(yīng)用廣泛的兩種廣義線性模型:Logistic模型和對(duì)數(shù)線性模型.2023/9/59.3.2Logistic模型1.模型定義 設(shè)yi服從參數(shù)為pi的二項(xiàng)分布,則μi=E(yi)=pi采用邏輯聯(lián)結(jié)函數(shù),即這個(gè)廣義線性模型稱(chēng)為L(zhǎng)ogistic模型.2023/9/510.例3.1(數(shù)據(jù)文件為eg3.1)表3.1某地區(qū)45個(gè)家庭的調(diào)查數(shù)據(jù)2023/9/511.2.模型的參數(shù)估計(jì)和檢驗(yàn)采用R軟件中的廣義線性模型過(guò)程glm()可以完成回歸系數(shù)的估計(jì),以及模型回歸系數(shù)的顯著性檢驗(yàn).程序如下:#eg3.1廣義線性模型:Logistic模型#打開(kāi)數(shù)據(jù)文件eg3.1.xls,選取A1:B46區(qū)域,然后復(fù)制data3.1<-read.table("clipboard",header=T)#將eg3.1.xls數(shù)據(jù)讀入到data3.1中g(shù)lm.logit<-glm(y~x,family=binomial,data=data3.1)#建立y關(guān)于x的logistic回歸#模型,數(shù)據(jù)為data3.1summary(glm.logit)#模型匯總,給出模型回歸系數(shù)的估計(jì)和顯著性檢驗(yàn)等yp<-predict(glm.logit,data.frame(x=15))p.fit<-exp(yp)/(1+exp(yp));p.fit#估計(jì)x=15時(shí)y=1的概率2023/9/512.運(yùn)行以上程序可得如下結(jié)果:Call:glm(formula=y~x,family=binomial,data=data3.1)DevianceResiduals:Min1QMedian3QMax-1.21054-0.054980.000000.004331.87356Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)-21.280210.5203-2.0230.0431*x1.64290.83311.9720.0486*Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1(Dispersionparameterforbinomialfamilytakentobe1)Nulldeviance:62.3610on44degreesoffreedomResidualdeviance:6.1486on43degreesoffreedomAIC:10.149NumberofFisherScoringiterations:92023/9/513.2.模型的參數(shù)估計(jì)和檢驗(yàn)>yp<-predict(glm.logit,data.frame(x=15))>p.fit<-exp(yp)/(1+exp(yp));p.fit#估計(jì)x=15時(shí)y=1的概率10.9665418容易看出:回歸模型的回歸系數(shù)在5%水平上顯著,于是得回歸模型為當(dāng)x=15時(shí),估計(jì)y=1的概率約為0.97,即年收入為15萬(wàn)元的家庭有私家車(chē)的可能性約為97%.2023/9/514.3.3對(duì)數(shù)線性模型1.模型的定義設(shè)y服從參數(shù)λ為的泊松分布,則μ=E(y)=λ,采用對(duì)數(shù)聯(lián)結(jié)函數(shù),即這個(gè)廣義線性模型稱(chēng)為泊松對(duì)數(shù)線性模型.2023/9/515.例3.2(數(shù)據(jù)文件為eg3.2)表3.4
Breslow癲癇數(shù)據(jù)2023/9/516.例3.2(數(shù)據(jù)文件為eg3.2)這個(gè)數(shù)據(jù)是robust包中的Breslow癲癇數(shù)據(jù)(Breslow,1993).我們討論在治療初期的八周內(nèi),癲癇藥物對(duì)癲癇發(fā)病數(shù)的影響,響應(yīng)變量為八周內(nèi)癲癇發(fā)病數(shù)(y),預(yù)測(cè)變量為前八周內(nèi)的基礎(chǔ)發(fā)病次數(shù)(x1),年齡(x2)和治療條件(x3),其中治療條件是二值變量,x3=0表示服用安慰劑,x3=1表示服用藥物.根據(jù)這個(gè)數(shù)據(jù)建立泊松對(duì)數(shù)線性模型并對(duì)模型的系數(shù)進(jìn)行顯著性檢驗(yàn).2023/9/517.表3.2Breslow癲癇數(shù)據(jù)Nox1x2x3yNox1x2x3y1113101431192017211300143210301133625011331918119483601334242411156622055353130174…………………………284722053581336102976181425912371103038321282023/9/518.2.模型的參數(shù)估計(jì)和檢驗(yàn)采用R軟件中的廣義線性模型過(guò)程glm()來(lái)建立泊松對(duì)數(shù)線性模型并對(duì)模型的系數(shù)進(jìn)行顯著性檢驗(yàn).程序如下:#eg3.2廣義線性模型:泊松對(duì)數(shù)線性模型#打開(kāi)數(shù)據(jù)文件eg3.2.xls,選取A1:E60區(qū)域,然后復(fù)制data3.2<-read.table(“clipboard”,header=T)#將eg3.2.xls數(shù)據(jù)讀入到data3.2中g(shù)lm.ln<-glm(y~x1+x2+x3,family=poisson(link=log),data=data3.2)#建立y關(guān)于#x1,x2,x3的泊松對(duì)數(shù)線性模型summary(glm.ln)#模型匯總,給出模型回歸系數(shù)的估計(jì)和顯著性檢驗(yàn)等2023/9/519.運(yùn)行以上程序可得如下結(jié)果:Call:glm(formula=y~x1+x2+x3,family=poisson(link=log),data=data3.2)DevianceResiduals:Min1QMedian3QMax-6.0569-2.0433-0.93970.792911.0061Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)1.94882590.135619114.370<2e-16***x10.02265170.000509344.476<2e-16***x20.02274010.00402405.6511.59e-08***x3-0.15270090.0478051-3.1940.0014**Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1(Dispersionparameterforpoissonfamilytakentobe1)Nulldeviance:2122.73on58degreesoffreedomResidualdeviance:559.44on55degreesoffreedomAIC:850.71NumberofFisherScoringiterations:52023/9/520.2.模型的參數(shù)估計(jì)和檢驗(yàn)于是得回歸模型:從檢驗(yàn)結(jié)果可以看出:x1和x2的系數(shù)都顯著,說(shuō)明基礎(chǔ)發(fā)病次數(shù)(x1),年齡(x2)和治療條件(x3)對(duì)八周內(nèi)癲癇發(fā)病數(shù)(y)重要影響.年齡(x2)的回歸系數(shù)為0.0227,表明保持其他預(yù)測(cè)變量不變,年齡增加1歲,癲癇發(fā)病數(shù)的對(duì)數(shù)均值將相應(yīng)的增加0.0227.2023/9/521.2.模型的參數(shù)估計(jì)和檢驗(yàn)在因變量的初始尺度(癲癇發(fā)病數(shù),而不是癲癇發(fā)病數(shù)的對(duì)數(shù))上解釋回歸系數(shù)比較容易,因此,指數(shù)化系數(shù):可以看出:保持其他預(yù)測(cè)變量不變,年
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆高考英語(yǔ)讀后續(xù)寫(xiě)說(shuō)課稿 追車(chē)人
- 2025SRV汽化煙道熱噴涂合金防護(hù)層施工合同
- 2025民間融資合同范本
- 14《母雞》(說(shuō)課稿)-2023-2024學(xué)年語(yǔ)文四年級(jí)下冊(cè)統(tǒng)編版
- 2025年駕校培訓(xùn)合同范本
- 2025商品購(gòu)銷(xiāo)合同(超市類(lèi))
- 2024年五年級(jí)數(shù)學(xué)下冊(cè) 一 圖形的運(yùn)動(dòng)(二)1.2畫(huà)對(duì)稱(chēng)圖形說(shuō)課稿 冀教版
- 2024-2025學(xué)年高中歷史 第一單元 第一次世界大戰(zhàn) 第2課 慘烈的四年戰(zhàn)事教學(xué)說(shuō)課稿 岳麓版選修3
- 陶土板幕墻施工方案
- 游樂(lè)場(chǎng)植物墻施工方案
- 法醫(yī)病理學(xué)課件
- 職代會(huì)提案征集表
- 介紹uppc技術(shù)特點(diǎn)
- 物業(yè)工程工作分配及人員調(diào)配方案
- 《諫逐客書(shū)》理解性默寫(xiě)(帶答案)最詳細(xì)
- 《黑駿馬》讀書(shū)筆記思維導(dǎo)圖
- 2023年物理會(huì)考真題貴州省普通高中學(xué)業(yè)水平考試試卷
- 盤(pán)扣式懸挑腳手架專(zhuān)項(xiàng)施工方案
- 勞動(dòng)防護(hù)用品知識(shí)考試試題(含答案)
- 高中教師業(yè)務(wù)知識(shí)考試 數(shù)學(xué)試題及答案
- GB/T 9290-2008表面活性劑工業(yè)乙氧基化脂肪胺分析方法
評(píng)論
0/150
提交評(píng)論