醫(yī)學醫(yī)學統(tǒng)計學直線回歸_第1頁
醫(yī)學醫(yī)學統(tǒng)計學直線回歸_第2頁
醫(yī)學醫(yī)學統(tǒng)計學直線回歸_第3頁
醫(yī)學醫(yī)學統(tǒng)計學直線回歸_第4頁
醫(yī)學醫(yī)學統(tǒng)計學直線回歸_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

內(nèi)容概述直線回歸方程的建立回歸系數(shù)和回歸方程的意義及性質(zhì)回歸系數(shù)的假設檢驗應變量總變異的分解回歸問題的方差分析直線回歸的區(qū)間估計第1頁/共53頁第一頁,共54頁。兩個斜率的比較兩條回歸直線的合并過定點的直線回歸直線回歸與直線相關的區(qū)別及聯(lián)系回歸分析的正確應用第2頁/共53頁第二頁,共54頁。11.1概述Y因變量,響應變量

(dependentvariable,responsevariable)X自變量,解釋變量

(independentvariable,explanatoryvariable)

直線回歸的形式:第3頁/共53頁第三頁,共54頁。Regression

釋義n=1078單位:英寸x=68y=69x1=72y1=71x2=64y2=67第4頁/共53頁第四頁,共54頁。11.1直線回歸方程的建立最小二乘法(leastsquareestimation)第5頁/共53頁第五頁,共54頁。例:某醫(yī)院欲研究兒童的體重與體表面積的關系,測量了10名3歲男童體重與體表面積,數(shù)據(jù)見下表編號X(X,kg)Y(Y,103cm2)111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合計133.457.266第6頁/共53頁第六頁,共54頁。1112131415165.05.56.06.510名3歲男童體重與體表面積的直線回歸第7頁/共53頁第七頁,共54頁。體重與體表面積的回歸第8頁/共53頁第八頁,共54頁?;貧w直線的繪制計算不太接近的兩點的Y值:X=12kg時

Y=2.5212+0.2385×12=5.3832(103cm2)X=15kg時

Y=2.5212+0.2385×15=6.0987(103cm2)第9頁/共53頁第九頁,共54頁。10名3歲男童體重與體表面積回歸圖1112131415165.05.56.06.5體重(kg),X體表面積Y(103cm2)第10頁/共53頁第十頁,共54頁。11.3回歸系數(shù)和回歸方程的意義及性質(zhì)b的意義a的意義的意義的意義的意義第11頁/共53頁第十一頁,共54頁。b

的意義斜率(slope)

=2.5212+0.2385X

體重每增加1kg,

則體表面積平均增加0.2385(103cm2)b

的單位為(Y的單位/X的單位)第12頁/共53頁第十二頁,共54頁。a的意義a截距(intercept,constant)X=0時,Y的估計值a的單位與Y值相同當X可能取0時,a才有實際意義。第13頁/共53頁第十三頁,共54頁。估計值的意義X=11時,=5.145,

即體重為11kg的三歲女童,其平均體表面積之估計為5.145(103cm2);X=15時,

=6.099,

即體重為15kg的三歲女童,其平均體表面積之估計為6.099(103cm2).給定X時,Y的估計值。當時,第14頁/共53頁第十四頁,共54頁。由體重(kg)估計體表面積(103cm2)

XYY的估計值

(體重,kg)(體表面積) 11.0 5.283 5.145 11.8 5.299 5.336 12.0 5.358 5.383 12.3 5.292 5.455 13.1 5.602 5.646 13.7 6.014 5.789 14.4 5.830 5.956 14.9 6.102 6.075 15.2 6.075 6.146 16.0 6.411 6.337第15頁/共53頁第十五頁,共54頁。

的意義

為殘差:點到直線的縱向距離。1112131415165.05.56.06.5第16頁/共53頁第十六頁,共54頁。殘差平方和(residualsumofsquares).綜合表示點距直線的距離。在所有的直線中,回歸直線的殘差平方和是最小的。(最小二乘)

的意義第17頁/共53頁第十七頁,共54頁?;貧w直線的有關性質(zhì)(1)直線通過均點(2)直線上方各點到直線的縱向距離之和

=直線下方各點到直線的縱向距離之和即:(3)各點到該回歸線縱向距離平方和較到其它任何直線者為小。

第18頁/共53頁第十八頁,共54頁。11.4回歸系數(shù)的假設檢驗回歸系數(shù)為0,則回歸關系不存在。

H0:總體回歸系數(shù)為0,=0;

H1:總體回歸系數(shù)不為0,0;=0.05。第19頁/共53頁第十九頁,共54頁?;貧w系數(shù)的t檢驗第20頁/共53頁第二十頁,共54頁。體重與體表面積回歸系數(shù)的假設檢驗H0:總體回歸系數(shù)=0,即體重與體表面積無回歸關系;H1:總體回歸系數(shù)≠0,即體重與體表面積有回歸關系。

=0.05。體重與體表面積間存在回歸關系。第21頁/共53頁第二十一頁,共54頁?;貧w系數(shù)與相關系數(shù)的假設檢驗結果等價。第22頁/共53頁第二十二頁,共54頁。11.5因變量總變異的分解XP

(X,Y)Y第23頁/共53頁第二十三頁,共54頁。Y的總變異分解未引進回歸時的總變異:

(sumofsquaresaboutthemeanofY)引進回歸以后的變異(剩余):(sumofsquaresaboutregression)回歸的貢獻,回歸平方和:

(sumofsquaresduetoregression)第24頁/共53頁第二十四頁,共54頁。Y的總變異分解

第25頁/共53頁第二十五頁,共54頁。第26頁/共53頁第二十六頁,共54頁。剩余標準差(1)扣除了X的影響后Y方面的變異;(2)引進回歸方程后,Y方面的變異。第27頁/共53頁第二十七頁,共54頁。11.6回歸問題的方差分析

前面應變量總變異的分解與方差分析中方差的分解原理相同,因而,X對Y的影響是否有統(tǒng)計學意義,或X與Y的回歸關系是否成立,可以進行方差分析第28頁/共53頁第二十八頁,共54頁。例11.2對例11.1所建方程進行方差分析。H0:體重與體表面積間無直線回歸關系;

H1:體重與體表面積間有直線回歸關系。=0.05。lXX=24.9040,lYY=1.5439,lXY=5.9396,SS總=lYY=1.5439,根據(jù)式(11.6)SS剩

=1.5439-5.93962/24.9040=0.1273根據(jù)(11.12):

SS回

=SS總-SS剩=1.5439-0.1273=1.4166第29頁/共53頁第二十九頁,共54頁。變異來源SSMSF回歸1.416611.416689.01剩余0.127380.0159總變異1.543990.1715表11.2方差分析表得F=89.01,今1=1,2=8,查附表4F界值表,得P<0.01,按

=0.05水準拒絕H0,接受H1,故可認為3歲男童的體重與體表面積之間有線性回歸關系第30頁/共53頁第三十頁,共54頁。11.7回歸問題的區(qū)間估計回歸系數(shù)的可信區(qū)間估計估計值的可信區(qū)間估計個體Y值的容許區(qū)間估計第31頁/共53頁第三十一頁,共54頁。復習均數(shù)的可信區(qū)間:均數(shù)界值×標準誤(4.3,4.4)個體的容許區(qū)間(參考值范圍):

均數(shù)界值×標準差(2.37)第32頁/共53頁第三十二頁,共54頁。11.7.1總體回歸系數(shù)的可信區(qū)間估計根據(jù)

t分布原理估計:0.2385+/-2.306×0.02528

=0.1802~0.2968(103cm2/kg)第33頁/共53頁第三十三頁,共54頁。11.7.2的可信區(qū)間估計

樣本總體Y的總平均給定X時Y的平均

(Y的條件均數(shù))根據(jù)

t分布原理根據(jù):第34頁/共53頁第三十四頁,共54頁。X=12時,求的95%可信區(qū)間

=13.44,lXX=24.9040,=0.1262。當X=12時,=5.3832,第35頁/共53頁第三十五頁,共54頁。11.7.3的容許區(qū)間估計給定X時Y的估計值是Y的均數(shù)的一個估計。給定X時Y值的容許區(qū)間是Y

值的可能范圍。的100(1-)%容許限:第36頁/共53頁第三十六頁,共54頁。

的可信區(qū)間與Y的容許區(qū)間可信區(qū)間是針對條件均數(shù)的,而容許區(qū)間是針對Y的取值范圍的。X=12時,的可信區(qū)間為:5.2578~5.5077(103cm2),

表示:體重為12kg的3歲男童,估計其平均體表面積為5.3832,95%可信區(qū)間為(5.2587,5.5077)(103cm2)。

X=12時,Y的容許區(qū)間為:5.0666~5.6998(103cm2),

表示:體重為12kg的3歲男童,估計有95%的人其體表面積在5.0666~5.6998(103cm2)之間。第37頁/共53頁第三十七頁,共54頁。結論:體重為12kg的3歲男童,估計有95%的人其體表面積在5.0666~5.6998(103cm2)之間,平均體表面積為5.3832(103cm2),95%可信區(qū)間為(5.2587,5.5077)(103cm2)。第38頁/共53頁第三十八頁,共54頁??尚艆^(qū)間與容許區(qū)間示意

(confidenceband&toleranceband)1112131415164.55.05.56.06.57.0第39頁/共53頁第三十九頁,共54頁。11.8兩條回歸直線的比較有時需要對兩條回歸方程進行比較,以推斷相應的兩總體回歸直線是否平行,是否重疊。決定直線回歸方程的參數(shù)是回歸系數(shù)b和截距a兩回歸直線平行,等價于1=2;兩回歸直線重疊,等價于1=2且1=2。第40頁/共53頁第四十頁,共54頁。11.8.1兩回歸系數(shù)的比較檢驗假設為:

H0:1=2;

H1:1≠2。

=0.05。

t=第41頁/共53頁第四十一頁,共54頁。11.9過定點的直線回歸例11.4在用熒光光度法測定全血硒的研究中,分別取不同硒含量的標準液,消化后測定其熒光強度,試作標準直線。含硒量(g)X 熒光強度Y

0.000 0.00 0.025 4.36 0.050 9.31 0.100 17.13 0.150 25.03 0.200 33.22第42頁/共53頁第四十二頁,共54頁。過定點(X0,Y0)的直線回歸方程一般的直線回歸方程(過X的均數(shù)和Y的均數(shù)):第43頁/共53頁第四十三頁,共54頁。過定點(X0,Y0)的直線方程估計第44頁/共53頁第四十四頁,共54頁。不同硒含量所得熒光強度的過定點的回歸

熒光強度Y0

0.025

0.05

0.075

0.1

0.125

0.15

0.175

0.2

0

5

10

15

20

25

30

35

硒含量X(g)第45頁/共53頁第四十五頁,共54頁。11.10直線回歸與直線相關的區(qū)別與聯(lián)系區(qū)別r沒有單位,b有單位;所以,相關系數(shù)與單位無關,回歸系數(shù)與單位有關;相關表示相互關系,沒有依存關系;而回歸有依存關系;對資料的要求不同:當X和Y都是隨機的,可以進行相關和回歸分析;當Y是隨機的(X是控制的),理論上只能作回歸而不能作相關分析;

I型回歸:X是精確控制的;II型回歸:X是隨機的。由X推算Y:由Y推算X:第46頁/共53頁第四十六頁,共54頁。11.10直線回歸與直線相關的區(qū)別與聯(lián)系聯(lián)系均表示線性關系;符號相同:共變方向一致;假設檢驗結果相同:是否存在共變關系;第47頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論