版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
MedicalStatistics
醫(yī)學統(tǒng)計學
回歸分析RegressionAnalysis主要內容直線回歸的定義(掌握)直線回歸方程的估計(掌握)回歸方程的解釋(掌握)回歸系數的t檢驗(掌握)回歸方程中變異的分解(掌握)回歸方程的方差分析(掌握)與回歸有關的區(qū)間估計(熟悉)兩直線回歸方程的比較(了解)過定點的直線回歸(了解)相關與回歸的區(qū)別和聯系(掌握)回歸分析的正確應用(掌握)其他類型的回歸(了解)周長C這兩個關系有什么不同?體重X體表面積Y1112131415165.05.56.06.5半徑r12342π4π6π8π直線回歸的定義宏觀上來講,體重和體表面積呈直線關系,但并不能用來描述。所以我們用“hat”表示估計值,給定x時y的條件均數
Y因變量,響應變量
(dependentvariable,responsevariable)X自變量,解釋變量
(independentvariable,explanatoryvariable)b回歸系數,斜率
(regressioncoefficient,slope)a截距
(intercept)不同斜率時回歸直線的表現XYRegression
釋義小插曲:為什么叫”回歸“?
F.GaltonK.Pearson小插曲:為什么叫”回歸“?分析實例:3歲男童體重與體表面積編號體重X體表面積Y111.05.283211.85.299312.05.358412.35.292513.15.602613.76.014714.45.830814.96.102915.26.0751016.06.411合計133.457.266繪制散點圖體重X體表面積Y1112131415165.05.56.06.5X(1)Y(2)11.05.28311.85.29912.05.35812.35.29213.15.60213.76.01414.45.83014.96.10215.26.07516.06.411直線回歸方程的求解:最小二乘原理1112131415165.05.56.06.5目標:使點到回歸直線的綜合距離為最小!直線回歸方程的求解最小二乘法
(LeastSquareMethod)回歸方程的估計對于本例,經計算得回歸方程3歲男童體重和體表面積間的直線回歸方程回歸直線體重X體表面積Y1112131415165.05.56.06.5(12,5.3832)(15,6.0987)(13.44,5.7266)回歸直線的有關性質直線通過均點直線上方各點到直線的縱向距離之和
=直線下方各點到直線的縱向距離之和即:各點到該回歸線縱向距離平方和較到其它任何直線者為小。
回歸系數和回歸方程的意義及性質b
的意義a
的意義和的意義的意義回歸系數的解釋b的涵義:體重增加1(kg),則體表面積平均遞增0.2385(103cm2)。體重為X+1(kg)的3歲男童,其平均體表面積比體重為X(kg)的3歲男童之平均體表面積多0.2385(103cm2)。a的意義a截距(intercept,constant)X=0時,Y的估計值a的單位與Y值相同當X可能取0時,a才有實際意義。估計值的意義X=12kg,=5.3832(103cm2)
即體重為12kg的3歲男童其體表面積之均數的估計值為5.3832(103cm2)給定X時,Y的均數的估計值。當時,這里的均數是給定X的條件下,由回歸方程估計得到的,故又稱條件均數(conditionalmean)。編號(1)體重(kg),X(2)體表面積(103cm2),Y(3)(4)(5)111.05.2835.1450.138211.85.2995.336-0.037312.05.3585.383-0.025412.35.2925.455-0.163513.15.6025.646-0.044613.76.0145.7890.225714.45.8305.956-0.126814.96.1026.0750.027915.26.0756.146-0.0711016.06.4116.3370.074合計133.457.26657.2660.000殘差體重X體表面積Y1112131415165.05.56.06.5殘差平方和(residualsumofsquares).綜合表示點距直線的距離。在所有的直線中,回歸直線的殘差平方和是最小的。(最小二乘)
的意義直線回歸系數的t檢驗回歸系數也有抽樣誤差!檢驗方法針對回歸系數b的檢驗:t檢驗針對整個回歸方程的檢驗:方差分析直線回歸系數的t檢驗總體回歸系數
=0,則回歸關系不存在。H0:總體回歸系數為0,
=0;H1:總體回歸系數不為0,
0;
=0.05。直線回歸系數的t檢驗Y的剩余標準差——扣除X的影響(即回歸所能解釋的部分)后Y本身的變異程度什么叫做本身的變異?甲在學習某學科之前,只知曉該學科10%的知識點,如果當時去考試,不一定恰好考10分,但是大約會在10分附近波動;如果他考了12分。甲在學習某學科1周,知曉該學科40%的知識點,如果當時去考試,不一定恰好考40分,但是大約會在40分附近波動;如果他考了36分。甲在學習某學科5周,知曉該學科80%的知識點,如果當時去考試,不一定恰好考80分,但是大約會在80分附近波動;如果他考了85分。甲在學習某學科10周,知曉該學科95%的知識點,如果當時去考試,不一定恰好考95分,但是大約會在95分附近波動;如果他考了92分。在本例中,從成績來看,四次成績波動很大,但請注意,這四次這么大的波動,并非主要是由于考生考運等原因造成的,而是由于不同的學習時間導致對知識掌握程度不同。只有將學習時間這個影響因素去除,2(12-10)、-4(36-40)、5(85-80)、-3(92-95),這些分數的差別才是一種變異,即考生各次考試間的變異。H0:總體回歸系數
=0,即體重與體表面積無回歸關系;H1:總體回歸系數
≠0,即體重與體表面積有回歸關系。
=0.05。
=10-2=8按
=8查t界值表,得P<0.001。按
=0.05水準拒絕H0,接受H1??梢哉J為體重與體表面積之間有回歸關系?;貧w系數與相關系數的假設檢驗結果等價。因變量總變異的分解X
P
(X,Y)Y實際上是原始觀察值Y的離均差平方和,又稱為總離均差平方和,或總變異,記為SS總?;貧w直線與Y的均數之距離平方和,稱為回歸平方和反映在總平方和中可以用X解釋的部分,記為SS回。為原始觀察值離回歸直線的縱向距離平方和,又稱剩余平方和,記為SS剩。在總變異中,扣除由X解釋的部分后剩余的部分,或不能由X解釋的部分。Y的總變異分解
回歸方程的方差分析H0:體重與體表面積間無直線回歸關系;H1:體重與體表面積間有直線回歸關系。α=0.05。列方差分析表變異來源SS
MSF回歸1.416611.416689.01剩余0.127380.0159總變異1.543990.1715F=89.01,今
1=1,
2=8,查F界值表,得P<0.01,按
=0.05水準拒絕H0,接受H1,故可認為3歲男童的體重與體表面積之間有線性回歸關系。直線回歸中三種假設檢驗間的關系在直線回歸中,相關系數的假設檢驗,回歸系數的假設檢驗,以及回歸方程的方差分析結果等價。與直線回歸有關的區(qū)間估計回歸系數的可信區(qū)間估計(掌握)估計值的可信區(qū)間估計(了解)個體Y值的容許區(qū)間估計(了解)總體回歸系數
的可信區(qū)間估計根據
t分布原理估計:總體回歸系數
的可信區(qū)間估計根據
t分布原理估計:本例中已計算得sb=0.02528復習可信區(qū)間容許區(qū)間均數的可信區(qū)間:均數
界值×標準誤個體的容許區(qū)間(參考值范圍):
均數
界值×標準差的可信區(qū)間估計
樣本總體Y的總平均給定X時Y的平均
(Y的條件均數)根據
t分布原理:X=12時,求的95%可信區(qū)間
=13.44,lXX=24.9040,=0.1262。當X=12時,=5.38325.3832
2.306
0.0540=5.2587~5.5077即體重為12kg的3歲男童,估計其平均體表面積為5.3832(103cm2),95%可信區(qū)間為(5.2587,5.5077)(103cm2)。Y的容許區(qū)間估計給定X時Y的估計值是Y的均數的一個估計。給定X時Y值的容許區(qū)間是Y值的可能范圍。
Y的100(1-
)%容許限:5.3832
2.306
0.1372=5.0666~5.6998即體重為12kg的3歲男童,估計有95%的人體表面積在5.0666到5.6998(103cm2/kg)之間。剩余標準差、條件標準誤、條件標準差抽樣誤差抽樣誤差+個體變異估計值、95%可信區(qū)間和95%容許區(qū)間1112131415164.55.05.56.06.57.0體表面積Y(103cm2)體重X(Kg)兩直線回歸方程的比較在實際工作中,有時需要對兩條回歸方程進行比較,以推斷相應的兩總體回歸直線是否平行,是否重疊。決定直線回歸方程的參數是回歸系數b和截距a,兩回歸直線平行,等價于
1=
2
;兩回歸直線重疊,等價于
1=
2且
1=
2。在第十章例10.3中已對成年男子和女子的心率與心臟左室電機械收縮時間的線性相關進行了比較。這里,對該資料進行回歸分析,并對兩個回歸方程進行比較。1、散點圖50607080901003003504004502、分別建立回歸方程,并進行假設檢驗男子:
t=5.941,
=10, P<0.001女子:
t=7.317,
=10, P<0.0013、進行兩回歸系數的比較兩條回歸線斜率的比較。建立假設:H0:即兩總體回歸系數相等;H1:即兩總體回歸系數不等。
=0.10。ν=12+12-4=20查附表2t界值表,得t0.10,20=1.725,P>0.10,按
=0.10水準,不拒絕H0,可認為兩總體回歸系數相等,即兩條直線平行。斜率相等,說明兩條回歸線平行,但還不能說明兩條回歸線重合。若需進一步了解這兩條回歸線是否重合,還須檢驗兩條回歸線的截距是否相等。如果斜率不等,則沒有必要對截距進行檢驗。(P130)過定點的直線回歸醫(yī)學研究中應用直線回歸,經常會遇到一種特殊情況,即所求回歸直線除了要根據若干對觀察值進行最佳擬合外,還要求所擬合的直線必須經過某一定點(X0,Y0)。這在應用光電比色分析、熒光分析、火焰光度測定以及同位素測定等實驗方法來繪制標準直線時常會遇到。設有n對觀察值及定點(X0,Y0),求經過此定點并擬合此n對(X,Y)值的直線回歸方程為:
=n-1 在用熒光光度法測定全血硒的研究中,分別取不同硒含量的標準液,消化后測定其熒光強度,試作標準直線。含硒量(
g)X熒光強度Y(X-X0)2=X2(Y-Y0)2=Y2(X-X0)(Y-Y0)=XY0.0254.360.00062519.0096000.1090000.0509.310.00250086.6761000.4655000.10017.130.010000293.4369001.7130000.15025.030.022500626.5009003.7545000.20033.220.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東食品藥品職業(yè)學院《商務英語函電與合同》2023-2024學年第一學期期末試卷
- 廣東省外語藝術職業(yè)學院《通風空調A》2023-2024學年第一學期期末試卷
- 廣東女子職業(yè)技術學院《現代設計技術》2023-2024學年第一學期期末試卷
- 七年級上冊《1.2.4絕對值》課件與作業(yè)
- 廣東茂名幼兒師范??茖W?!稖y量學基礎》2023-2024學年第一學期期末試卷
- 廣東茂名健康職業(yè)學院《習思想》2023-2024學年第一學期期末試卷
- 五年級數學(小數乘法)計算題專項練習及答案匯編
- 大學生心理健康教育(蘭州大學)學習通測試及答案
- 土木實習總結15篇
- 云南玉溪市2021高考英語優(yōu)生自選練習(8)及答案
- 獸醫(yī)學英語詞匯【參考】
- 行政個人年終述職報告
- 第12課《詞四首》課件+2023-2024學年統(tǒng)編版語文九年級下冊
- 《發(fā)電廠電氣部分》考試題庫
- 建筑施工安全生產包保責任實施方案
- 2024年R1快開門式壓力容器操作證考試題庫及答案
- 《數學物理方法》期末測試卷及答案
- 鐵路工務勞動安全
- 直播電商年終總結
- 滬科版九年級物理下冊教案全冊
- PAS 2050:2011-商品和服務在生命周期內的溫室氣體排放評價規(guī)范(英文)
評論
0/150
提交評論