



下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
半?yún)?shù)回歸模型的廣義交互改進(jìn)
在醫(yī)學(xué)科學(xué)研究數(shù)據(jù)的統(tǒng)計(jì)分析過(guò)程中,參數(shù)回歸模型的一些假設(shè)是不完全滿足的。例如,反應(yīng)變量與解釋變量之間的具體依存關(guān)系不明確,反應(yīng)變量的分布難以確定。此時(shí),參數(shù)回歸模型難以進(jìn)行擬合處理,而非參數(shù)回歸模型則能進(jìn)行有效的分析。簡(jiǎn)單的非參數(shù)回歸模型研究的是反應(yīng)變量Y與單一解釋變量t的依存關(guān)系,它能夠解決醫(yī)學(xué)與衛(wèi)生研究工作中的許多重要問(wèn)題,但是,在實(shí)際工作中,有許多事物或現(xiàn)象受多個(gè)變量的影響,因此,需要研究多個(gè)變量間的相互關(guān)系。經(jīng)典統(tǒng)計(jì)模型在研究受多個(gè)解釋變量影響的依存關(guān)系時(shí)常常采用多重回歸,而多重回歸的更一般模型即為線性模型:yi=x′iβ+εi,為了放寬該線性模型中的某一個(gè)解釋變量的線性假定,使模型在假定方面具有較強(qiáng)的適應(yīng)性,本文對(duì)半?yún)?shù)回歸模型進(jìn)行了研究?;貧w系數(shù)向量的估計(jì)假定對(duì)每一個(gè)觀察值yi,有p+1個(gè)解釋變量,其中p維向量xi和數(shù)量變量t,如果反應(yīng)變量y線性相關(guān)于解釋變量x,則有以下模型yi=x′iβ+g(ti)+εi(1)yi=x′iβ+g(ti)+εi(1)其中β為未知的p維回歸系數(shù)向量,g(t)為未知的光滑函數(shù)(如光滑樣條),x為線性變量,t為樣條變量,ε與(x,t)相互獨(dú)立,且E(ε)=0,V(ε)=σ2(未知),顯然,xi不含常數(shù)1,常數(shù)項(xiàng)可以包含在g(t)中,則以上模型被稱為半?yún)?shù)回歸模型(semiparametricregressionmodel)。半?yún)?shù)回歸模型可通過(guò)懲罰最小二乘方法進(jìn)行求解,β和g(t)的估計(jì)使得以下加權(quán)懲罰平方和最小Sw(β,g)=n∑i=1wi{yi-x′iβ-g(ti)}2+α∫g″(t)2dt(2)Sw(β,g)=∑i=1nwi{yi?x′iβ?g(ti)}2+α∫g′′(t)2dt(2)其中光滑參數(shù)α>0,wi>0,不加權(quán)時(shí),可令wi=1。令Y=(y1,…,yn)′,W=diag(w1,…,wn),X為n×p階矩陣,其第i行為x′i,為了考慮相持情況,假定t1,t2,…,tn可由s1,s2,…,sq來(lái)表示,表示它們之間關(guān)系的矩陣叫關(guān)聯(lián)矩陣(incidencematrix),用N來(lái)表示,N為n×q階矩陣,其元素為Nij,當(dāng)ti=sj時(shí),Nij=1,否則,Nij=0。假定點(diǎn)ti不全相同,則q≥2。令αj=g(sj),j=1,2,…,q。則待估計(jì)向量g為(α1,α2,…,αq)′。同理,假定s1<s2<…<sq,而且αj=g(sj),則可以定義兩個(gè)矩陣Q和R,只不過(guò)要用s1,s2,…,sq來(lái)代替t1,t2,…,tn。令K=QR-1Qt,則∫g″(s)2ds=g′Kg。若用矩陣符號(hào)來(lái)表示Sw(β,g),則Sw(β,g)=(Y-Xβ-Ng)′W(Y-Xβ-Ng)+αg′Kg(3)當(dāng)β和g為以下分塊矩陣方程的解時(shí),上式取最小值。[X′WXX′WΝΝ′WXΝ′WΝ+αΚ](βg)=[X′Ν′]WY(4)方程(4)是一個(gè)(p+q)元方程組,直接解方程組不方便,也很不實(shí)際,實(shí)際工作中,一般將方程(4)化為以下形式X′WXβ=X′W(Y-Ng)(5)(N′WN+αK)g=N′W(Y-Xβ)(6)求解時(shí)可采用不需迭代的直接法(directmethod)進(jìn)行求解。由(6)可得:Ng=S(Y-Xβ)(7)其中S=N(N′WN+αK)-1N′W,(Ng)i=g(ti)。將(7)代入(5),化簡(jiǎn)得X′W(I-S)Xβ=X′W(I-S)Y(8)這是廣義最小二乘正規(guī)方程組,用來(lái)估計(jì)β,加權(quán)矩陣為非對(duì)角陣W(I-S),解得β后,就可通過(guò)(7)求得g和Ng,因此,可得到光滑曲線g(t)。對(duì)于回歸系數(shù)向量β的估計(jì)值,可進(jìn)行假設(shè)檢驗(yàn),β=(β1,β2,…,βp)′。檢驗(yàn)假設(shè)為H0:βi=0,i=1,2,…,p備擇假設(shè)為H1:βi≠0,α=0.05檢驗(yàn)統(tǒng)計(jì)量為t=?βi√Cii?σ2(9)其中Cii表示(X′W(I-S)X)-1的對(duì)角線上第i個(gè)元素,?σ2=n∑i=1(yi-?yi)2tr{Ι-A}?A為帽子陣。A=S+(I-S)X{X′W(I-S)X}-1X′W(I-S)(10)當(dāng)H0成立時(shí),t~tυ,υ=tr{I-A}。在半?yún)?shù)回歸模型中,對(duì)于光滑參數(shù)的自動(dòng)選擇需要計(jì)算廣義交互有效GCV(generalizedcross-validation)得分函數(shù)。GCV得分函數(shù)為GCV(α)=n∑i=1wi(yi-?yi)2(1-n-1trA)2(11)其中trA=trS+tr[{X′W(I-S)X}-1X′W(I-S)2X]。另外,半?yún)?shù)模型的誤差自由度EDF=tr{I-A}=n-trA,均方差MSE=n∑i=1(yi-?yi)2tr{Ι-A},殘差平方和SSE=n∑i=1(yi-?yi)2,令ˉy=1nn∑i=1yi,則擬合優(yōu)度R2=1-SSEn∑i=1(yi-ˉy)2。本文利用6.11版SAS軟件的IML模塊進(jìn)行編程來(lái)實(shí)現(xiàn)以上分析過(guò)程?;貧w模型的建立為說(shuō)明半?yún)?shù)模型的擬合效果,本文用SAS程序進(jìn)行模擬抽樣實(shí)驗(yàn),取p=2,n=60,t由1變化到60,x1~N(12.66,2.572),x2~N(6.7,1.872),誤差項(xiàng)ε相互獨(dú)立且服從分布N(0.52),y=3.4x1-5.2x2+0.1(t-30)2+30.2+ε,則用SAS模擬抽樣程序可得到一個(gè)樣本模擬數(shù)據(jù)(表1)。如果假定y與x1,x2存在線性依存關(guān)系,對(duì)該數(shù)據(jù)人為地進(jìn)行參數(shù)線性模型擬合,則可以得到回歸方程:?y=49.0545+0.1282t+4.4925x1-6.0078x2,雖然該回歸方程有意義(P≈0.0005),但擬合效果差,SSE=45494.6052,R2=0.2692,誤差均方為812.4037,從下面的圖1可知,殘差與t之間存在二次曲線趨勢(shì),即殘差中仍然蘊(yùn)含有用的回歸信息。如果采用半?yún)?shù)回歸模型進(jìn)行擬合,則計(jì)算得到的α值為148.75,x1和x2的回歸系數(shù)分別為3.7976和-5.2356,標(biāo)準(zhǔn)誤分別為0.2385和0.2958,檢驗(yàn)結(jié)果均有顯著意義(P<0.01),SSE=980.6252,MSE=19.2357,R2=0.9842,模型擬合的殘差情況見(jiàn)圖2,由上述計(jì)算結(jié)果和圖2可以看出,半?yún)?shù)模型的擬合效果得到大大提高,并且正確地反映了y與t的關(guān)系?;緮?shù)學(xué)模型的基本思想半?yún)?shù)回歸模型可看作是參數(shù)線性模型和非參數(shù)回歸模型的混合模型,半?yún)?shù)回歸模型較參數(shù)線性模型有較強(qiáng)的適應(yīng)性。由于實(shí)際工作中經(jīng)常會(huì)遇到某個(gè)變量有影響,但表現(xiàn)為未知函數(shù)的情況,因此,半?yún)?shù)回歸模型是線性模型的一個(gè)擴(kuò)展,它放寬了線性模型中的某一個(gè)解釋變量的線性假定,使模型適應(yīng)數(shù)據(jù)變化的能力更強(qiáng)。實(shí)際應(yīng)用半?yún)?shù)回歸模型時(shí),反應(yīng)變量線性相關(guān)于線性變量應(yīng)以專業(yè)理論知識(shí)或以往經(jīng)驗(yàn)為依據(jù),樣條變量t的處理不同于其他線性變量,它是采用非參數(shù)的形式進(jìn)行處理。方程(4)是一個(gè)(p+q)元方程組,多元方程組的解法很多,但直接解方程組不方便,也很不實(shí)際,實(shí)際工作中,也可采用backfitting方法求解方程組,backfitting是一個(gè)迭代求解的方法,它在上述二個(gè)方程(5)和(6)之間交替迭代求解,直至收斂為止。該方法的收斂速度取決于α的大小以及有關(guān)矩陣的特征值的大小,雖然該矩陣特征值的絕對(duì)值都小于1,最終也會(huì)收斂,但實(shí)際應(yīng)用中,經(jīng)常發(fā)生最大特征值很接近于1,從
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 法律實(shí)務(wù)合同審查技能知識(shí)要點(diǎn)梳理
- 《小學(xué)體育田徑運(yùn)動(dòng)基本技能訓(xùn)練教案》
- 安全管理文檔之班組長(zhǎng)安全培訓(xùn)實(shí)施方案
- 2025年國(guó)網(wǎng)山東省電力公司招聘高校畢業(yè)生1300人(第一批)筆試參考題庫(kù)附帶答案詳解
- 2025年國(guó)家電網(wǎng)有限公司客戶服務(wù)中心招聘15人(第一批)筆試參考題庫(kù)附帶答案詳解
- 2025年上半年宜春市公安局交通警察支隊(duì)招考臨聘人員易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年宜昌市興山縣事業(yè)單位招考考試(66人)易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年定西市通渭縣事業(yè)單位及招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2024福建泉州晉江市市政工程建設(shè)有限公司權(quán)屬公司招聘4人筆試參考題庫(kù)附帶答案詳解
- 2025年上半年安陽(yáng)市湯陰縣事業(yè)單位招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 《珍愛(ài)生命拒絕毒品》主題班會(huì)課件
- GB/T 32399-2024信息技術(shù)云計(jì)算參考架構(gòu)
- 蘇教版二年級(jí)數(shù)學(xué)下冊(cè)單元測(cè)試題及答案全套1
- 河北張家口中國(guó)化工集團(tuán)盛華化工公司“11.28”重大爆燃事故調(diào)查報(bào)告
- 《知識(shí)產(chǎn)權(quán)法教程(第八版) 》 課件 王遷 第1-9章 總論、著作權(quán)法律制度概述-專利法律制度概述
- 07SG111-1 建筑結(jié)構(gòu)加固施工圖設(shè)計(jì)表示方法
- 屋頂分布式光伏發(fā)電EPC項(xiàng)目 投標(biāo)方案(技術(shù)方案)
- 網(wǎng)約車(chē)停運(yùn)損失費(fèi)起訴狀模板
- 中國(guó)急性缺血性卒中診治指南(2023)解讀
- A型肉毒素治療知情同意書(shū) 注射知情同意書(shū)
- 血液透析導(dǎo)管溶栓及護(hù)理
評(píng)論
0/150
提交評(píng)論