醫(yī)學(xué)統(tǒng)計(jì)學(xué)直線回歸_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)直線回歸_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)直線回歸_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)直線回歸_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)直線回歸_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

英國(guó)人類學(xué)家F.Galton首次在《自然遺傳》一書中,提出并闡明了“相關(guān)”和“相關(guān)系數(shù)”兩個(gè)概念,為相關(guān)論奠定了基礎(chǔ)。其后,他和英國(guó)統(tǒng)計(jì)學(xué)家KarlPearson對(duì)上千個(gè)家庭的身高、臂長(zhǎng)、(伸開大拇指與中指兩端的最大長(zhǎng)度)做了測(cè)量,發(fā)現(xiàn):歷史背景:第1頁(yè)/共36頁(yè)第一頁(yè),共37頁(yè)。兒子身高(Y,英寸)與父親身高(X)存在線性關(guān)系:

第2頁(yè)/共36頁(yè)第二頁(yè),共37頁(yè)?;貧w與相關(guān)

regressionandcorrelation

變量間關(guān)系問題:年齡~身高、肺活量~體重、藥物劑量與動(dòng)物死亡率等。

第一節(jié)

直線回歸第二節(jié)直線相關(guān)第三節(jié)Spearman等級(jí)相關(guān)

兩個(gè)關(guān)系:依存關(guān)系:應(yīng)變量(dependentvariable)Y隨自變量(independentvariable)X變化而變化。——回歸分析

互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系——

相關(guān)分析第3頁(yè)/共36頁(yè)第三頁(yè),共37頁(yè)。實(shí)例第4頁(yè)/共36頁(yè)第四頁(yè),共37頁(yè)。散點(diǎn)圖第5頁(yè)/共36頁(yè)第五頁(yè),共37頁(yè)。第一節(jié)

直線回歸回歸關(guān)系:例如血壓和年齡的關(guān)系,稱為直線回歸(linearregression)。

目的:建立直線回歸方程(linearregressionequation)第6頁(yè)/共36頁(yè)第六頁(yè),共37頁(yè)。一、

直線回歸方程

一般表達(dá)式:a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。意義:X每改變一個(gè)單位,Y平均改變b個(gè)單位。

b>0,Y隨X的增大而增大(減少而減少)——

斜上;

b<0,Y隨X的增大而減小(減少而增加)——

斜下;

b=0,Y與X無直線關(guān)系——

水平。

|b|越大,表示Y隨X變化越快,直線越陡峭。第7頁(yè)/共36頁(yè)第七頁(yè),共37頁(yè)。二、回歸方程參數(shù)的計(jì)算

最小二乘法原則(leastsquaremethod):使各散點(diǎn)到直線的縱向距離的平方和最小。即使最小。第8頁(yè)/共36頁(yè)第八頁(yè),共37頁(yè)。散點(diǎn)圖第9頁(yè)/共36頁(yè)第九頁(yè),共37頁(yè)。編號(hào)母X臍YX2Y2XY11.213.901.464115.21004.719021.304.501.690020.25005.850031.394.201.932117.64005.838041.424.832.016423.32896.858651.474.162.160917.30566.115261.564.932.433624.30497.690871.684.322.822418.66247.257681.724.992.958424.90018.582891.984.703.920422.09009.3060102.105.204.410027.040010.9200合計(jì)15.8345.7325.8083210.731973.1380SXSYSX2SY2SXY

回歸參數(shù)計(jì)算的實(shí)例

第10頁(yè)/共36頁(yè)第十頁(yè),共37頁(yè)。三、回歸系數(shù)的假設(shè)檢驗(yàn)b≠0原因:①由于抽樣誤差引起,總體回歸系數(shù)β=0②存在回歸關(guān)系,總體回歸系數(shù)β≠0公式

,υ=n-2Sb為回歸系數(shù)的標(biāo)準(zhǔn)誤

SY.X為Y的剩余標(biāo)準(zhǔn)差——扣除X的影響后Y的變異程度。

(一)t檢驗(yàn);第11頁(yè)/共36頁(yè)第十一頁(yè),共37頁(yè)。編號(hào)母X臍YX2Y2XY11.213.901.464115.21004.719021.304.501.690020.25005.850031.394.201.932117.64005.838041.424.832.016423.32896.858651.474.162.160917.30566.115261.564.932.433624.30497.690871.684.322.822418.66247.257681.724.992.958424.90018.582891.984.703.920422.09009.3060102.105.204.410027.040010.9200合計(jì)15.8345.7325.8083210.731973.1380SXSYSX2SY2SXY第12頁(yè)/共36頁(yè)第十二頁(yè),共37頁(yè)。任一點(diǎn)P(X,Y)的縱坐標(biāo)被回歸直線與均數(shù)截成3段:圖應(yīng)變量Y的平方和劃分示意圖YP(X,Y)第13頁(yè)/共36頁(yè)第十三頁(yè),共37頁(yè)。SS總=SS回歸+SS殘差(二)方差分析SS殘差越小,SS回歸越大表明回歸模型的預(yù)測(cè)效果越好。第14頁(yè)/共36頁(yè)第十四頁(yè),共37頁(yè)。四、直線回歸方程的區(qū)間估計(jì)第15頁(yè)/共36頁(yè)第十五頁(yè),共37頁(yè)。五、回歸方程的應(yīng)用

1.預(yù)測(cè)(forecast)(給定X值,估計(jì)Y)2.控制(給定Y值范圍,求X值范圍)第16頁(yè)/共36頁(yè)第十六頁(yè),共37頁(yè)。第二節(jié)

直線相關(guān)回歸----變量間的依存關(guān)系

相關(guān)----變量間的互依關(guān)系

直線相關(guān)(linearcorrelation):簡(jiǎn)單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布資料。第17頁(yè)/共36頁(yè)第十七頁(yè),共37頁(yè)。圖7-4

相關(guān)系數(shù)示意圖

散點(diǎn)呈橢圓形分布,X、Y同時(shí)增減---正相關(guān)(positivecorrelation);

X、Y此增彼減---負(fù)相關(guān)(negativecorrelation)。

散點(diǎn)在一條直線上,

X、Y變化趨勢(shì)相同----完全正相關(guān);反向變化----完全負(fù)相關(guān)。第18頁(yè)/共36頁(yè)第十八頁(yè),共37頁(yè)。圖7-5

相關(guān)系數(shù)示意圖

X、Y變化互不影響----零相關(guān)(zerocorrelation)第19頁(yè)/共36頁(yè)第十九頁(yè),共37頁(yè)。一、

相關(guān)系數(shù)概念

相關(guān)系數(shù)(correlationcoefficient),又稱積差相關(guān)系數(shù)(coefficientofproduct–momentcorrelation),或Pearson相關(guān)系數(shù)(軟件中常用此名稱)

說明相關(guān)的密切程度和方向的指標(biāo)。

r——樣本相關(guān)系數(shù)第20頁(yè)/共36頁(yè)第二十頁(yè),共37頁(yè)。r無單位,-1≤

r

1。r值為正——正相關(guān),為負(fù)——負(fù)相關(guān);(與回歸系數(shù)b的符號(hào)相同)|r|=1---完全相關(guān),|r|=0---零相關(guān)。二、相關(guān)系數(shù)的意義第21頁(yè)/共36頁(yè)第二十一頁(yè),共37頁(yè)。三、

相關(guān)系數(shù)的計(jì)算

第22頁(yè)/共36頁(yè)第二十二頁(yè),共37頁(yè)。四、相關(guān)系數(shù)的假設(shè)檢驗(yàn)

r≠0原因:①由于抽樣誤差引起 ②存在相關(guān)關(guān)系公式

,υ=n-2Sr----相關(guān)系數(shù)的標(biāo)準(zhǔn)誤

第23頁(yè)/共36頁(yè)第二十三頁(yè),共37頁(yè)。注意:對(duì)于同一資料,tb=tr,檢驗(yàn)完全等價(jià)第24頁(yè)/共36頁(yè)第二十四頁(yè),共37頁(yè)。

習(xí)慣上,相關(guān)系數(shù)的絕對(duì)值|r|在:

0.3以下,稱為微弱線性相關(guān);

0.3-0.5,稱為低度線性相關(guān);

0.5-0.8,稱為顯著線性相關(guān);

0.8以上,稱為高度線性相關(guān)。第25頁(yè)/共36頁(yè)第二十五頁(yè),共37頁(yè)。區(qū)別:

六、直線回歸與相關(guān)的區(qū)別與聯(lián)系1.資料:②

X、Y服從雙變量正態(tài)分布

①Y正態(tài)隨機(jī)變量,X為選定變量

回歸2.應(yīng)用:回歸——由一個(gè)變量值推算另一個(gè)變量值

相關(guān)——只反映兩變量間互依關(guān)系

相關(guān)3.回歸系數(shù)有單位,相關(guān)系數(shù)無單位第26頁(yè)/共36頁(yè)第二十六頁(yè),共37頁(yè)。聯(lián)系:

第27頁(yè)/共36頁(yè)第二十七頁(yè),共37頁(yè)。七、直線回歸與相關(guān)的應(yīng)用注意事項(xiàng)

⑴要有實(shí)際意義

⑵不能任意“外延”⑶繪制散點(diǎn)圖

第28頁(yè)/共36頁(yè)第二十八頁(yè),共37頁(yè)。第三節(jié)

等級(jí)相關(guān)

rankcorrelation

適用資料:⑴不服從雙變量正態(tài)分布⑵總體分布類型未知⑶原始數(shù)據(jù)用等級(jí)表示

等級(jí)相關(guān)系數(shù)rs(即SpearmanCorrelationCoefficient)——反映兩變量間相關(guān)的密切程度與方向。第29頁(yè)/共36頁(yè)第二十九頁(yè),共37頁(yè)。表7-3等級(jí)相關(guān)系數(shù)計(jì)算表綜合評(píng)分存活天數(shù)

編號(hào)(1)X(2)秩次U(3)Y(4)秩次V(5)d(6)=(3)-(5)d2(7)=(6)21234567798091907087922365147>453016242825147623541-5-342-40625916416036合計(jì)

106

注意:相同秩次較多時(shí)應(yīng)校正rs。第30頁(yè)/共36頁(yè)第三十頁(yè),共37頁(yè)。1、兩變量X,Y間存在直線回歸關(guān)系,即基本上可以確定兩者有因果關(guān)系。()2、回歸系數(shù)越小,兩變量相關(guān)關(guān)系也越不密切。()3、n=10,r=0.90,可認(rèn)為兩變量呈中高度相關(guān)。()4、直線回歸中,b的假設(shè)檢驗(yàn)結(jié)果P<0.05,說明該回歸方程有應(yīng)用價(jià)值。()第31頁(yè)/共36頁(yè)第三十一頁(yè),共37頁(yè)。1、相關(guān)系數(shù)r的意義是()A.X與Y的從屬關(guān)系B.兩總體之間的直線相關(guān)關(guān)系C.表示兩變量的相關(guān)方向和關(guān)系的密切程度D.表示X與Y之間的直線相關(guān)關(guān)系的密切程度和方向E.以上都不是第32頁(yè)/共36頁(yè)第三十二頁(yè),共37頁(yè)。2、在相關(guān)分析中,相關(guān)系數(shù)假設(shè)檢驗(yàn)時(shí),P值越小,則:A.兩變量相關(guān)性越好B.結(jié)論可信度越大C.認(rèn)為總體具有線性相關(guān)的理由越充分D.抽樣誤差越小E.Y隨X變化的變化率越大3.對(duì)兩個(gè)變量進(jìn)行直線相關(guān)分析,r=0.39,P>0.05,則說明兩個(gè)變量之間()A.有伴隨關(guān)系B.有數(shù)量關(guān)系C. 有因果關(guān)系D.有直線相關(guān)關(guān)系E.無直線相關(guān)關(guān)系4.分析肺活量和身高之間的數(shù)量關(guān)系,擬用身高值預(yù)測(cè)肺活量值,則應(yīng)采用()A.秩相關(guān)分析B.相關(guān)分析C.直線回歸分析D.t檢驗(yàn)E.以上都不是第33頁(yè)/共36頁(yè)第三十三頁(yè),共37頁(yè)。5、關(guān)于相關(guān)與回歸的聯(lián)系,下列說法中不正確的是()A.對(duì)同一組數(shù)據(jù)若同時(shí)計(jì)算b和r,它們的正負(fù)號(hào)是一致的B.對(duì)同一組數(shù)據(jù),b和r的假設(shè)檢驗(yàn)是等價(jià)的C.用回歸可以解釋相關(guān)D.決定系數(shù)r2越接近1,說明引入回歸的效果越好E.對(duì)同一組數(shù)據(jù),b與r是相等的6、用最小二乘法確定的直線回歸方程,可保證各觀察點(diǎn)()A.距直線的縱向距離相等B.距直線的縱向距離的平方和最小C.與直線的垂直距離相等D.與直線的垂直距離的平方和最小E.與橫軸的縱向距離的平方和最小第34頁(yè)/共36頁(yè)第三十四頁(yè),共37頁(yè)。7、在雙變量(X,Y)的相關(guān)與回歸分析中有()A.r值增加,b值增加

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論