醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第11章 線性相關(guān)與回歸(1) 學(xué)習(xí)課件_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第11章 線性相關(guān)與回歸(1) 學(xué)習(xí)課件_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第11章 線性相關(guān)與回歸(1) 學(xué)習(xí)課件_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第11章 線性相關(guān)與回歸(1) 學(xué)習(xí)課件_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué) 第11章 線性相關(guān)與回歸(1) 學(xué)習(xí)課件_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十一章

線性相關(guān)與回歸兩個(gè)變量(現(xiàn)象)之間的關(guān)系大量的醫(yī)學(xué)科研與實(shí)踐中,經(jīng)常會遇到對兩個(gè)變量之間相互關(guān)聯(lián)關(guān)系的研究。屬雙變量分析范疇(bivariateanalysis)。例如:糖尿病病人的血糖與胰島素水平的關(guān)系;某人群年齡與血壓的關(guān)系;兒童身高與體重的關(guān)系;動物實(shí)驗(yàn)中動物進(jìn)食量與增加體重的關(guān)系等。通常采用相關(guān)、回歸分析第一節(jié)線性相關(guān)

LinearCorrelation一、線性相關(guān)的基本概念相關(guān)關(guān)系:兩個(gè)變量之間,當(dāng)一個(gè)變量增大,另一個(gè)也隨之增大(或減少),我們稱這種現(xiàn)象為共變,也就是兩個(gè)變量之間有相關(guān)關(guān)系。直線相關(guān)關(guān)系:即兩個(gè)變量之間呈直線變化趨勢散點(diǎn)圖能夠直觀地表達(dá)兩個(gè)變量之間關(guān)系有助于識別兩個(gè)變量是否存在直線相關(guān)關(guān)系能粗略判斷直線相關(guān)關(guān)系的性質(zhì)及密切程度實(shí)例11.1

在某地一項(xiàng)膳食調(diào)查中,隨機(jī)抽取14名40-60歲的健康婦女,測得每人的基礎(chǔ)代謝與體重?cái)?shù)據(jù),見下表,據(jù)此數(shù)據(jù)如何判斷這兩項(xiàng)指標(biāo)之間有無關(guān)聯(lián)?繪制散點(diǎn)圖圖14名中年健康婦女的基礎(chǔ)代謝與體重的散點(diǎn)圖線性相關(guān)(linearcorrelation)又稱簡單相關(guān)(simplecorrelation)是指兩個(gè)隨機(jī)變量X、Y之間呈直線型變化趨勢的關(guān)系用于X、Y都是正態(tài)分布的資料相關(guān)的性質(zhì)可以通過散點(diǎn)圖直觀說明正相關(guān)(positivecorrelation)散點(diǎn)呈直線變化趨勢Y隨X的增加而有增加的趨勢當(dāng)散點(diǎn)全部在一條直線上時(shí),為完全正相關(guān)負(fù)相關(guān)(negativecorrelation)散點(diǎn)呈直線變化趨勢Y隨X的增加而有減小的趨勢當(dāng)散點(diǎn)全部在一條直線上時(shí),為完全負(fù)相關(guān)零相關(guān)(zerocorrelation)X與Y之間沒有線性變化趨勢X、Y的取值不受對方的影響如何定量描述兩個(gè)變量的線性相關(guān)關(guān)系的大小及方向呢?二、相關(guān)系數(shù)的意義與計(jì)算意義線性相關(guān)系數(shù)簡稱相關(guān)系數(shù)(coefficientofcorrelation)又稱積差相關(guān)系數(shù)(coefficientofproduct-momentcorrelation))或Pearson相關(guān)系數(shù)(軟件中常用此名稱)

用來說明兩個(gè)變量線性相關(guān)的密切程度和方向的指標(biāo)總體相關(guān)系數(shù):記為

樣本相關(guān)系數(shù):記為

r2、計(jì)算公式r無度量單位

-1≤r≤1

r值為正:正相關(guān)為負(fù):負(fù)相關(guān)

|r|=1:完全相關(guān)r的正負(fù)號表示線性相關(guān)的方向

r絕對值的大小表示線性相關(guān)的密切程度,越接近±1,其線性密切程度越高;越接近0,線性密切程度越低相關(guān)系數(shù)特點(diǎn)例11.2計(jì)算例11.1中基礎(chǔ)代謝Y與體重X之間樣本相關(guān)系數(shù)。

由例11-1得即基礎(chǔ)代謝與體重之間的相關(guān)系數(shù)為0.964,呈正相關(guān),說明基礎(chǔ)代謝隨體重的增加而升高三、相關(guān)系數(shù)的統(tǒng)計(jì)推斷(一)假設(shè)檢驗(yàn)方法:查表法

按自由度υ=n-2查r界值表,如果樣本相關(guān)系數(shù)r大于界值,則具有統(tǒng)計(jì)學(xué)意義,線性相關(guān)關(guān)系存在t檢驗(yàn)法υ=n-2例11-3繼例11-2中算得r=0.964后,試檢驗(yàn)相關(guān)是否具有統(tǒng)計(jì)學(xué)意義

本例

n=14,r=0.964,按υ=14-2=12,查r界值表,得r0.05,12=0.532

因此P<0.05,即相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為基礎(chǔ)代謝與體重之間存在線性相關(guān),且相關(guān)系數(shù)為0.964查表法本例υ=12,查t界值表,得t0.05/2,12=2.179,因此P<0.05,故拒絕H0,接受H1,認(rèn)為基礎(chǔ)代謝與體重之間存在線性正相關(guān)。此結(jié)果與查表的結(jié)果是一致的。本例n=14,r=0.964,代入公式t檢驗(yàn)法(二)總體相關(guān)系數(shù)

的區(qū)間估計(jì)(了解)例11.3(續(xù))估計(jì)總體相關(guān)系數(shù)95%可信區(qū)間1、將r=0.964進(jìn)行雙曲正切變換,2、求Z的95%可信區(qū)間3、對Z進(jìn)行反雙曲正切變換因此,總體相關(guān)系數(shù)的95%CI為:(0.8872,0.9888)四、線性相關(guān)分析中應(yīng)注意的問題一般先繪制散點(diǎn)圖,再進(jìn)行相關(guān)分析相關(guān)分析要求X、Y都為正態(tài)分布樣本的相關(guān)系數(shù)接近零并不意味著兩變量間一定無相關(guān)性;相關(guān)未必真有內(nèi)在聯(lián)系.一個(gè)變量的數(shù)值人為選定時(shí)莫作相關(guān).出現(xiàn)異常值時(shí)慎用相關(guān).分層資料盲目合并易出假象.(二)適用條件:①不服從雙變量正態(tài)分布的資料;②總體分布型未知,或有不確定數(shù)值的資料;③原始數(shù)據(jù)用等級表示的等級資料。(一)概念也稱等級相關(guān)同樣用來描述兩個(gè)變量之間關(guān)聯(lián)的程度和方向由于對變量分布不作要求,屬于非參數(shù)統(tǒng)計(jì)方法最常用的秩(等級)相關(guān)系數(shù):

Spearman相關(guān)系數(shù),符號:rs五、秩相關(guān)(RankCorrelation)(三)Spearman秩相關(guān)計(jì)算(了解)1.意義:等級相關(guān)系數(shù)rs用來說明兩個(gè)變量間直線相關(guān)關(guān)系的密切程度與相關(guān)方向。計(jì)算

(1)兩個(gè)變量X、Y分別從小到大編秩

(2)利用秩次來計(jì)算等級相關(guān)系數(shù)方法:將秩次數(shù)據(jù)根據(jù)Pearson相關(guān)系數(shù)公式來計(jì)算(常用)例11-4某地研究2~7歲急性白血病患兒的血小板數(shù)與出血癥狀程度之間的相關(guān)性,結(jié)果見表11-2,試用秩相關(guān)進(jìn)行分析表11-2急性白血病患兒的血小板(109/L)和出血癥狀病人編號血小板數(shù)秩次p2出血癥狀秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)12111+++11.5132.2511.513824++9.0811816539+7.04921310416-3.512.2514426525++9.08145540636++9.08154740749-3.52.2524.51060864-3.512.25281260981-3.512.2531.5129010100-3.512.2535143811121+++11.5132.25126.25200412144-3.512.2542合計(jì)—78650-78630451

秩相關(guān)系數(shù)為負(fù),說明兩變量間有負(fù)相關(guān)關(guān)系,同樣由樣本算得的秩相關(guān)系數(shù)是否有統(tǒng)計(jì)學(xué)意義,也應(yīng)做假設(shè)檢驗(yàn)利用表11-2中的數(shù)據(jù)容易算得(四)秩相關(guān)系數(shù)的假設(shè)檢驗(yàn)(了解)假設(shè)檢驗(yàn)

H0:

s=0;H1:s≠0統(tǒng)計(jì)推斷當(dāng)n≤50時(shí),可查rs臨界值表,若秩相關(guān)系數(shù)超過臨界值,則拒絕H0;當(dāng)n>50時(shí),也可采用前面Pearson相關(guān)系數(shù)的檢驗(yàn)公式--t檢驗(yàn)法例11-4中算得查臨界值表,,按的水準(zhǔn),不能拒絕,可以認(rèn)為急性白血病患兒的出血癥狀與血小板數(shù)之間無相關(guān)關(guān)系例11-5對例1-4的秩相關(guān)系數(shù)作假設(shè)檢驗(yàn)第二節(jié)線性回歸

LinearRegression

兩變量間的數(shù)量關(guān)系確定性關(guān)系是指兩變量間的關(guān)系是函數(shù)關(guān)系。已知一個(gè)變量的值,另一個(gè)變量的值可以通過這種函數(shù)關(guān)系精確計(jì)算出來。例如圓周長與半徑:c=2πr

非確定性關(guān)系是指兩變量在宏觀上存在關(guān)系,但并未精確到可以用函數(shù)關(guān)系來表達(dá)例如身高與體重的關(guān)系一、線性回歸的基本概念實(shí)例

在某地一項(xiàng)膳食調(diào)查中,隨機(jī)抽取14名40-60歲的健康婦女,測得每人的基礎(chǔ)代謝與體重?cái)?shù)據(jù),見下表,據(jù)此數(shù)據(jù)如何判斷這兩項(xiàng)指標(biāo)之間有無關(guān)聯(lián)?線性回歸直線繪制散點(diǎn)圖圖14名中年健康婦女的基礎(chǔ)代謝與體重的散點(diǎn)圖線性回歸方程的一般表達(dá)式:a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)b:斜率(slope),回歸系數(shù)(regressioncoefficient)

b

的統(tǒng)計(jì)學(xué)意義是:

X

每增加(減)一個(gè)單位,Y

平均改變b個(gè)單位線性回歸分析:用一條直線(即直線方程)來描述兩個(gè)變量間依存變化的數(shù)量關(guān)系,得出的直線方程稱為線性回歸方程。二、線性回歸分析適用條件X與Y之間呈線性關(guān)系(Linear)個(gè)體觀察值之間獨(dú)立(Independent)給定X時(shí),對應(yīng)的Y服從正態(tài)分布(NormalDistribution)不同的X所對應(yīng)Y的方差相等(EqualVariance)三、回歸方程參數(shù)(a、b)的計(jì)算

原理:最小二乘法原則:使各散點(diǎn)到直線的縱向距離的平方和最小。即使最小。根據(jù)前面的計(jì)算有得到的回歸方程為:四、線性回歸方程的假設(shè)檢驗(yàn)需要檢驗(yàn)總體回歸方程是否成立!b≠0原因:①由于抽樣誤差引起,總體回歸系數(shù)β=0②存在回歸關(guān)系,總體回歸系數(shù)β≠0假設(shè)檢驗(yàn)方法:方差分析(F檢驗(yàn))、t檢驗(yàn)X1、方差分析Y的離均差平方和的分解兩邊平方后求和幾個(gè)平方和的含義其自由度分別為

如果兩變量間總體回歸關(guān)系確實(shí)存在,回歸的貢獻(xiàn)就要大于隨機(jī)誤差,大到何種程度時(shí)可以認(rèn)為具有統(tǒng)計(jì)意義,可計(jì)算統(tǒng)計(jì)量F:公式

,υ=n-2Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤

SY.X為Y的剩余標(biāo)準(zhǔn)差,即扣除X的影響后Y的變異大小。

2、t檢驗(yàn)

H0:β=0H1:β≠0α=0.05t檢驗(yàn)查t界值表,t0.001(12)=4.318,所以p<0.001,拒絕H0,可以認(rèn)為體重與基礎(chǔ)代謝之間存在線性回歸關(guān)系

3、總體回歸系數(shù)的可信區(qū)間利用上述對回歸系數(shù)的t檢驗(yàn),可以得到β的1-α雙側(cè)可信區(qū)間為4、決定系數(shù)回歸平方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論