版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)Tel:E-Mail:醫(yī)學(xué)統(tǒng)計(jì)學(xué) 馬斌榮主編 人民衛(wèi)生出版社 2006年第四版中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)1在上一節(jié)中我們通過(guò)直線相關(guān)分析知道了待產(chǎn)婦尿中雌三醇含量和新生兒體重之間成正相關(guān)關(guān)系。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出這個(gè)新生兒的體重嗎?或者這個(gè)新生兒的體重可能在什么范圍內(nèi)呢?對(duì)此相關(guān)分析不能給我們答案,這些問(wèn)題需要使用直線回歸的方法來(lái)解決。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)2第二節(jié) 線性回歸當(dāng)我們知道了兩個(gè)變量之間有直線相關(guān)關(guān)系,并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化,這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,那么它們的變化可用函數(shù)方程來(lái)表示。在實(shí)際生活當(dāng)中,由于其它因
2、素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程來(lái)反映。但是,我們需要利用數(shù)學(xué)函數(shù)的理論去研究?jī)勺兞恐g的數(shù)量依存關(guān)系,為了區(qū)別于數(shù)學(xué)上確定的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)3直線回歸的統(tǒng)計(jì)模型1.yi是xi的線性函數(shù)部分加上誤差項(xiàng)i;2.:截距(intercept),是x0時(shí)y的本底水平;3.回歸部分x :y的變化中隨x變化而變化的部分;稱為回歸系數(shù)(regression coefficient):自變量x每改變一個(gè)度量單位,應(yīng)變量y改變量的平均估計(jì)值;4.隨機(jī)誤差i :又稱殘差(residual);是不能由變量x所解釋的變異
3、部分;反映了除變量x之外的隨機(jī)因素對(duì)y的影響。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)4建立直線回歸方程利用樣本數(shù)據(jù)計(jì)算參數(shù)和的估計(jì)值a和b,建立模型的估計(jì)方程,即尋找一條與所有散點(diǎn)都最為接近(實(shí)測(cè)點(diǎn)到直線的縱向距離)的直線,使得總的預(yù)測(cè)誤差最小。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)5尋找總的預(yù)測(cè)誤差最小的直線X觀測(cè)值預(yù)測(cè)值預(yù)測(cè)誤差(殘差)Y中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)6最小二乘法(least square method)怎樣的 最好的代表了所有的y,需要有個(gè)標(biāo)準(zhǔn)。經(jīng)典的標(biāo)準(zhǔn)是最小二乘(least squares)原則:每個(gè)觀察點(diǎn)距離回歸線的縱向距離的平方和最小,即殘差平方和最?。阂?yàn)橹本€一定經(jīng)過(guò)“樣本均數(shù)”點(diǎn)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)7計(jì)算例1資料
4、的估計(jì)值a和b中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)8將估計(jì)值a和b代入方程回歸參數(shù)a、b的解釋1.斜率(b):當(dāng)x每增加1個(gè)單位時(shí),y平均改變b個(gè)單位;本例b0.0608,表明待產(chǎn)婦尿中雌三醇含量每增加1mg/24h,新生兒體重平均增加0.0608kg。2.截距(a):當(dāng)x0時(shí)y本底水平的平均估計(jì)值;本例a2.1523,表示待產(chǎn)婦尿中雌三醇含量為0時(shí),新生兒體重的本底值為2.1523kg(注意這種解釋有時(shí)候并無(wú)實(shí)際意義,如x是否可取0)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)9問(wèn)題:直線回歸方程的建立是否一定能說(shuō)明雌三醇含量與新生兒體重之間存在回歸關(guān)系?與直線相關(guān)一樣,直線回歸方程也是從樣本資料計(jì)算而得的,同樣也存在著抽樣誤差問(wèn)題
5、。所以,需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得(即檢驗(yàn)總體回歸系數(shù)是否為0)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)10(一)回歸系數(shù)的假設(shè)檢驗(yàn)(t檢驗(yàn)):1.建立檢驗(yàn)假設(shè):H0:0H1:00.052.計(jì)算統(tǒng)計(jì)量t:回歸方程的假設(shè)檢驗(yàn)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)11Sb :回歸系數(shù)的標(biāo)準(zhǔn)誤;Sy.x :殘差標(biāo)準(zhǔn)差(又稱剩余標(biāo)準(zhǔn)差),即去除x對(duì)y的影響后y的變異。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)12例1資料回歸系數(shù)的t檢驗(yàn)查t界值表t0.05(29)2.045t,在0.05水準(zhǔn)拒絕H0,認(rèn)為總體回歸系數(shù)不為零,雌三醇含量與新生兒出生體重之間存在線性回歸關(guān)系。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)13(二)回歸模型的假設(shè)檢驗(yàn)
6、(方差分析,ANOVA):1.建立檢驗(yàn)假設(shè):H0:回歸模型不成立H1:回歸模型成立0.052.計(jì)算統(tǒng)計(jì)量F:方差分析的基本思想:將應(yīng)變量y的總變異分解成兩個(gè)部分,一個(gè)是處理因素(自變量x)帶來(lái)的回歸變異,另一個(gè)是隨機(jī)誤差帶來(lái)的殘差變異。回歸變異:又稱回歸均方(方差),即y的變異中因?yàn)閤對(duì)y的線性回歸關(guān)系而帶來(lái)的變異;殘差變異:又稱殘差均方(方差),是除了自變量x之外的其他隨機(jī)因素對(duì)y帶來(lái)的變異;中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)14F檢驗(yàn)就是將兩部分的變異進(jìn)行比較:如果F值接近1,說(shuō)明回歸變異和殘差變異沒(méi)有多大差別,兩者都是隨機(jī)誤差,處理因素(自變量x)對(duì)應(yīng)變量y沒(méi)有線性回歸關(guān)系,回歸模型不成立;如果F值遠(yuǎn)大
7、于1,說(shuō)明回歸變異遠(yuǎn)大于殘差變異,處理因素(自變量x)帶來(lái)的變異不能簡(jiǎn)單的解釋為隨機(jī)誤差,即處理因素(自變量x)對(duì)應(yīng)變量y存在回歸關(guān)系,回歸模型成立。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)15中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)16從上圖可以看出:上式兩端平方,數(shù)學(xué)上可以證明:y的總離均差平方和等于回歸離均差平方和加上殘差離均差平方和,y的自由度等于回歸自由度加上殘差自由度。即:SS總SS回SS殘,v總v回v殘中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)17例1資料的方差分析表變異 來(lái)源 離均差平方和(SS)自由度(v)均方 (MS) F值回歸2.5057412.5057417.16殘差4.23426290.14601總變異6.7400030查F界值表F0
8、.05(1,29)4.18F,在0.05水準(zhǔn)拒絕H0,認(rèn)為處理因素(自變量x)對(duì)應(yīng)變量y存在回歸關(guān)系,回歸模型成立。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)18相關(guān)系數(shù)與回歸系數(shù)假設(shè)檢驗(yàn)的關(guān)系從上述計(jì)算結(jié)果可以看到:相關(guān)系數(shù)和回歸系數(shù)的t檢驗(yàn)結(jié)果完全等價(jià),并且與各自的方差分析結(jié)果完全等價(jià)(分子的自由度為1,即兩變量分析)中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)19直線回歸分析的應(yīng)用 1.建立統(tǒng)計(jì)模型解釋?xiě)?yīng)變量對(duì)自變量的數(shù)量依存關(guān)系2.自變量預(yù)測(cè)應(yīng)變量:利用已知、容易測(cè)量或可以測(cè)量的變量去預(yù)測(cè)未知、不易測(cè)量或不可測(cè)量的變量由父親的身高預(yù)測(cè)兒子成人后的身高;3.應(yīng)變量控制自變量:利用應(yīng)變量反向控制自變量已知鉛作業(yè)的時(shí)間(x)與血鉛濃度(y)
9、的回歸關(guān)系,當(dāng)制定人體血鉛正常值上限標(biāo)準(zhǔn)后,控制工人鉛作業(yè)的時(shí)間;已知汽車流量(x)與空氣氮氧化物污染濃度(y)的回歸關(guān)系,當(dāng)制定空氣氮氧化物的限制標(biāo)準(zhǔn)后,控制汽車流量。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)201.的置信區(qū)間: 意義:估計(jì)總體回歸系數(shù)取值范圍的大小例1資料:回歸系數(shù)為0.0608,計(jì)算置信區(qū)間是(0.0308, 0.0908)區(qū)間范圍不包括0,即總體回歸系數(shù)不為0,說(shuō)明尿雌三醇含量對(duì)新生兒的體重存在回歸關(guān)系。利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè) 中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)212.總體 的置信區(qū)間:意義:當(dāng)自變量x取值為某一定值xi時(shí),回歸方程對(duì)應(yīng)的估計(jì)值yi的總體條件均數(shù)的取值范圍。例1資料:如果某位待產(chǎn)婦尿中雌
10、三醇含量為16mg/24h,估計(jì)其新生兒體重的均數(shù)是3.1251kg,總體均數(shù)的95置信區(qū)間是2.983.27kg。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)22總體 的95%置信區(qū)間中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)233.個(gè)體y值的預(yù)測(cè)區(qū)間:意義:當(dāng)自變量x取值為某一定值xi時(shí),預(yù)測(cè)應(yīng)變量估計(jì)值yi取值的參考值范圍。例1資料:如果某位待產(chǎn)婦尿中雌三醇含量為16mg/24h,估計(jì)其新生兒體重的均數(shù)是3.1251kg,95%參考值范圍是2.333.92kg。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)24個(gè)體y值的95%預(yù)測(cè)區(qū)間中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)2595置信區(qū)間和參考值范圍中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)26線性回歸的類型與條件 (一)線性回歸的類型:型回歸:y是來(lái)自正態(tài)
11、分布總體的隨機(jī)變量,x是精確測(cè)量或可控制的變量。(溶液濃度與光密度)型回歸:y是來(lái)自正態(tài)分布總體的隨機(jī)變量,x也是來(lái)自正態(tài)分布總體的隨機(jī)變量。(父高與子高)(二)線性回歸的條件:1.線性(linearity):y與x之間存在直線關(guān)系;2.獨(dú)立性(independence):各觀察值間彼此獨(dú)立;3.正態(tài)性(normality):對(duì)于任何給定的自變量x,應(yīng)變量y都有一個(gè)服從正態(tài)分布的取值范圍對(duì)應(yīng);4.等方差(equal variance):對(duì)于任何給定的自變量x,應(yīng)變量y每一個(gè)取值范圍的方差相等。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)27給定x,y是正態(tài)分布、方差相等示意圖中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)28給定x,y是正態(tài)分布、
12、方差不等示意圖中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)29相關(guān)與回歸的區(qū)別(一)資料要求不同:1.相關(guān)分析:對(duì)稱地對(duì)待兩個(gè)變量,對(duì)自變量和應(yīng)變量不加以區(qū)別。要求:x與y均為隨機(jī)變量(有概率分布),且x和y都來(lái)自正態(tài)分布總體(雙變量正態(tài)分布)。2.回歸分析:應(yīng)變量和自變量的處理不對(duì)稱。自變量x:被看做是(在重復(fù)抽樣中)可精確測(cè)量或嚴(yán)格控制的變量。應(yīng)變量y:是隨機(jī)變量,并且對(duì)于任何一個(gè)選定的x,應(yīng)變量y都有一個(gè)正態(tài)分布的總體與之對(duì)應(yīng),且這些總體的方差都相等。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)30(二)應(yīng)用方向不同:1.相關(guān)分析:研究?jī)蓚€(gè)變量之間的相互關(guān)系,即在兩個(gè)變量中,任何一個(gè)的變化都會(huì)引起另一個(gè)的變化,是一種雙向變化的關(guān)系。通過(guò)相
13、關(guān)分析可以知道兩個(gè)變量是否有關(guān)系,關(guān)系是否密切,性質(zhì)是屬于正相關(guān)還是負(fù)相關(guān)。2.回歸分析:研究?jī)蓚€(gè)變量在數(shù)量比例上的依存關(guān)系,一個(gè)變量的改變會(huì)引起另一個(gè)變量的變化,是一種單向的關(guān)系。回歸是對(duì)兩個(gè)變量做定量描述,研究變量間的數(shù)量依存關(guān)系,已知一個(gè)變量值可以預(yù)測(cè)或控制另一個(gè)變量值,并且得到定量的結(jié)果。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)31(三)參數(shù)性質(zhì)不同:1.相關(guān)系數(shù)r:說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)方向和密切程度的統(tǒng)計(jì)指標(biāo)。沒(méi)有單位,取值范圍【-1,1】;絕對(duì)值意義:絕對(duì)值越大,散點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。2.回歸系數(shù)b:表示x每增大(或減?。┮粋€(gè)單位,y平均增大(或減?。゜
14、個(gè)單位。有單位(y的單位/x的單位),取值范圍無(wú)限;絕對(duì)值意義:絕對(duì)值越大,回歸直線越陡,說(shuō)明當(dāng)x變化一個(gè)單位時(shí),y的平均變化就越大。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)32相關(guān)與回歸的聯(lián)系(一)相關(guān)系數(shù)和回歸系數(shù)的聯(lián)系:對(duì)于同一組樣本資料,如果知道變量x和y的標(biāo)準(zhǔn)差sx、sy,相關(guān)系數(shù)和回歸系數(shù)可以互相推算。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)33(二)方向一致且假設(shè)檢驗(yàn)等價(jià)1.對(duì)于同一組樣本資料,r與b符號(hào)一致。r為正時(shí),b也為正,表示兩變量是正相關(guān),是同向變化(x變大y也變大)。r為負(fù)時(shí),b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化(x變大y會(huì)變?。?.對(duì)于同一組樣本資料,r與b的假設(shè)檢驗(yàn)結(jié)果等價(jià),可用r的顯著檢驗(yàn)代替b的顯
15、著性檢驗(yàn)。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)34(三)相關(guān)回歸可以互相解釋確定系數(shù)(coefficient of determination):相關(guān)系數(shù)的平方,反映x對(duì)y的回歸貢獻(xiàn)的程度大小。計(jì)算公式:在應(yīng)變量y的總離均差平方和中自變量x的回歸離均差平方和所占的比例,即自變量x的回歸貢獻(xiàn)對(duì)應(yīng)變量y的總變異能解釋的百分比。取值范圍:【0,1】,越接近1,說(shuō)明實(shí)際觀測(cè)點(diǎn)離回歸直線越近,回歸模型的擬合度越高。 例1:r=0.6097,R2=0.3717,即待產(chǎn)婦尿中雌三醇含量大約可解釋新生兒體重變異性的37.17%。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)35相關(guān)回歸分析的注意事項(xiàng)1.實(shí)際意義:進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無(wú)關(guān)
16、系的兩個(gè)事物或現(xiàn)象用來(lái)作相關(guān)回歸分析。例如:有人說(shuō),孩子長(zhǎng),公園里的小樹(shù)也在長(zhǎng)。但是求孩子身高和小樹(shù)高度之間的相關(guān)關(guān)系就毫無(wú)意義,用孩子的身高推測(cè)小樹(shù)的高度則更加荒謬。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)362.繪制散點(diǎn)圖:對(duì)于性質(zhì)不明確的兩組變量數(shù)據(jù),首先應(yīng)繪制散點(diǎn)圖,在圖上看它們是否呈現(xiàn)出直線趨勢(shì),然后再進(jìn)行相關(guān)分析判斷變量有無(wú)關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān)。對(duì)于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。中醫(yī)科研設(shè)計(jì)與統(tǒng)計(jì)373.正確判斷關(guān)系的性質(zhì):兩變量間的直線關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系。例如:有人發(fā)現(xiàn),對(duì)于在校兒童,鞋的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會(huì)新詞并不能使腳變大,原因涉及到第三個(gè)因素-年齡。當(dāng)兒童年齡長(zhǎng)大腳也在長(zhǎng)大,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 41869.3-2024光學(xué)和光子學(xué)微透鏡陣列第3部分:光學(xué)特性測(cè)試方法
- 供熱供氣工程履約擔(dān)保格式
- 2025版?zhèn)湄浶袠I(yè)質(zhì)量認(rèn)證合同范本3篇
- 展覽館弱電系統(tǒng)改造合同模板
- 醫(yī)療服務(wù)票據(jù)管理策略與流程
- 2025年度綠色辦公用品采購(gòu)及回收利用合同3篇
- 紡織服裝電力供應(yīng)協(xié)議準(zhǔn)則
- 城市濱水區(qū)改造房屋拆除工程協(xié)議
- 2025版電梯設(shè)備安裝與維護(hù)合同范本3篇
- 船只租賃合同:水上建筑維修
- 金色年終匯報(bào)PPT模板
- 《鼻負(fù)壓置換術(shù)在兒童呼吸道感染中的應(yīng)用及護(hù)理對(duì)策研究【論文】3600字》
- 沭陽(yáng)縣國(guó)土空間總體規(guī)劃(2021-2035)草案公示1
- C++初學(xué)者入門全篇
- 發(fā)動(dòng)機(jī)機(jī)械系統(tǒng)2.0升ltg-9.66維修指南車下
- 哈爾濱市商品房買賣合同書(shū)(最終定稿)
- 警犬行為理論考試題庫(kù)(含答案)
- 財(cái)政與金融基礎(chǔ)知識(shí)全套教學(xué)課件(中職)
- oppo其它-lpdt工作手冊(cè)
- 中醫(yī)診所規(guī)章制度(完整版)
- 職工董事選舉辦法
評(píng)論
0/150
提交評(píng)論