版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件第九章雙變量回歸與相關(guān)(第九章) 講課內(nèi)容: 第一節(jié) 直線回歸(重點(diǎn)) 第二節(jié) 直線相關(guān)(重點(diǎn)) 第三節(jié) 秩相關(guān) 第六節(jié) 兩條回歸直線的比較 第七節(jié) 曲線擬合7/25/20222 第2、第3、第4章介紹了計(jì)量資料單變量的統(tǒng) 計(jì)描述與統(tǒng)計(jì)推斷:P.13 例2-1:計(jì)算101名成年女子血清總膽固 醇的平均指標(biāo)與變異指標(biāo)。P.51 例3-7:比較阿卡波糖膠囊(試驗(yàn)組)與拜 糖蘋膠囊(對(duì)照組)降低糖尿病人的空腹血糖值 有無(wú)差別。P.73 例4-2:比較安慰劑組、降血脂新藥2.4g 組、降血脂新藥4.8g組、降血脂新藥7.2g組降 低患者的低密度脂蛋白含量有無(wú)差別。7/25/20223在醫(yī)
2、學(xué)研究中常要分析兩變量間或多變 量間的關(guān)系: 年齡與血壓 藥物劑量與動(dòng)物死亡率 肺活量與身高、體重、胸圍和肩寬等 7/25/20224事物間的相關(guān)關(guān)系確定性關(guān)系 兩變量間的函數(shù)表達(dá)式 圓的周長(zhǎng)與半徑的關(guān)系: C2R 路程與速度、時(shí)間的關(guān)系:LST 數(shù)學(xué)中X與Y的直線函數(shù)關(guān)系:Ya+bX 非確定性關(guān)系 兩變量間存在關(guān)系,但未精 確到可以用函數(shù)表達(dá)式來(lái)描述。 年齡與血脂的關(guān)系; 身高與體重的關(guān)系; 體重與體表面積的關(guān)系。7/25/20225第一節(jié) 直線回歸Linear Regression7/25/20226一、直線回歸的概念“回歸”是一個(gè)借用已久因而相沿成習(xí) 的統(tǒng)計(jì)學(xué)術(shù)語(yǔ)。直線回歸是分析成對(duì)觀測(cè)
3、數(shù)據(jù)中兩變量 間線性依存關(guān)系的方法。7/25/20227生物遺傳學(xué)上的“回歸” Pearson K(英,18571936)1903年搜集了1078個(gè)家庭人員的身高、前臂長(zhǎng)等指標(biāo)的記錄,發(fā)現(xiàn)兒子身高(Y,英寸)與父親身高間(X,英寸)存在線性依存關(guān)系: =33.73+0.516 X 但不少身材高的父親的兒子成年后身高比其父親矮,不少身材矮的父親的兒子成年后身高比其父親高。Galton F (英,18221911 ) 將這種現(xiàn)象稱之為子一代身高向人群平均身高的“回歸”。7/25/20228Regression 釋義210=10247/25/20229Francis GaltonFrancis Ga
4、lton 爵士 (英,18221911) 是達(dá)爾文(Charles Darwin) 的表弟。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計(jì)方法對(duì)進(jìn)化論中的變異進(jìn)行研究,開(kāi)創(chuàng)了生物統(tǒng)計(jì)學(xué)。7/25/202210Karl PearsonKarl Pearson (英,18571936)是Francis Galton 的得意門生,他開(kāi)創(chuàng)了統(tǒng)計(jì)方法學(xué)。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗(yàn)的提出、回歸與相關(guān)的發(fā)展。7/25/202211天文學(xué)上的“回歸”地球繞太陽(yáng)公轉(zhuǎn),在公轉(zhuǎn)的同時(shí)本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時(shí)地球的假設(shè)軸心還來(lái)回?cái)[動(dòng)。由于地球軸心的來(lái)回?cái)[動(dòng),太陽(yáng)光垂
5、直照射到地球上就有南、北兩個(gè)極限位置(南、北緯23027),分別稱南、北回歸線,太陽(yáng)光對(duì)赤道“回歸”垂直照射到南、北回歸線的時(shí)間分別為我國(guó)農(nóng)歷的冬至與夏至。 7/25/202212日常生活中的“回歸”現(xiàn)象 1歲姜二狗,7歲姜二狗同學(xué),20歲小姜同志,30歲姜科長(zhǎng),40歲姜處長(zhǎng),50歲姜局長(zhǎng),60歲姜老,70歲老姜,80歲姜二狗。 目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計(jì)術(shù)語(yǔ),并且衍生出“回歸方程”、 “回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。7/25/202213例 某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的回歸方程。7/25/202214
6、年齡(歲)X尿肌酐含量Y(mmol/24h)hat7/25/202215各散點(diǎn)呈直線趨勢(shì)但并非均在一條直線上根據(jù)原始數(shù)據(jù)擬合的直線方程與數(shù)理 上二元一次函數(shù)方程在內(nèi)涵上有區(qū)別, 稱為直線回歸方程。7/25/202216二、直線回歸方程的求法最小二乘法在所有直線中最小7/25/2022177/25/202218CASIO fx-3600PV計(jì)算器計(jì)算a、b與r步驟 鍵 盤 說(shuō) 明 1 MODE 2 進(jìn)入線性回歸模式 LR 2 SHIFT KAC 清除以前儲(chǔ)存數(shù)據(jù) 3 13 XDYD 3.54 DATA 數(shù)據(jù)輸入 11 XDYD 3.01 DATA 9 XDYD 3.09 DATA 4 SHIFT
7、 r 顯示相關(guān)系數(shù) 0.8818 5 SHIFT a 顯示截距 1.6617 6 SHIFT b 顯示回歸系數(shù) 0.1392 SHIFT DEL 刪除輸錯(cuò)的一對(duì)數(shù)據(jù)7/25/202219年齡(歲)X尿肌酐含量Y(mmol/24h)(8,2.8)(12,3.3)7/25/202220 b 的意義斜率(slope) 年齡每增加1歲, 尿肌酐含量平均增加0.1392(mmol/24h)b的單位為 (Y的單位/X的單位)7/25/202221a 截距(intercept, constant)X=0 時(shí),Y的估計(jì)值a的單位與Y值相同當(dāng)X可能取0時(shí),a才有實(shí)際意義。 a 的意義7/25/202222回歸直
8、線的有關(guān)性質(zhì)直線通過(guò)均點(diǎn) 各點(diǎn)到該回歸線縱向距離平方和較到其它任何直線者為小。 為來(lái)自的一個(gè)樣本對(duì)于X各個(gè)取值,相應(yīng)Y的總體均數(shù)7/25/202223XY7/25/202224三、直線回歸方程中的統(tǒng)計(jì)推斷(一)回歸方程的假設(shè)檢驗(yàn)1.方差分析(1)建立檢驗(yàn)假設(shè)并確定檢驗(yàn)水準(zhǔn) H0:=0 H1: 0 =0.05的分解重點(diǎn)7/25/202225因變量Y總變異 的分解X Y Y7/25/202226SS總=SS回+SS殘7/25/202227未引進(jìn)回歸時(shí)的總變異: (sum of squares of deviation from mean)引進(jìn)回歸以后的剩余變異: (sum of squares o
9、f residuals)回歸的貢獻(xiàn),回歸平方和: (sum of squares due to regression)Y的總變異分解7/25/202228 (3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值SS總=lYY =1.0462 SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS殘= SS總SS回=1.04620.8134=0.2328v總=v回+v剩v總=n1,v回=1, v殘=n27/25/202229F0.01(1,6)=13.747/25/2022302. t 檢驗(yàn)回歸的剩余標(biāo)準(zhǔn)差扣除了X的影響后Y方面的變異;引進(jìn)回歸方程后, Y方面的變異。7/25/202231(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)
10、量 t 值(1)建立檢驗(yàn)假設(shè)并確定檢驗(yàn)水準(zhǔn)(3)確定P值下結(jié)論 7/25/202232 (二)總體回歸系數(shù)的可信區(qū)間此區(qū)間不包括=0,結(jié)論為b有統(tǒng)計(jì)學(xué)意義。7/25/202233 SPSS結(jié)果7/25/202234 (三)利用回歸方程進(jìn)行估計(jì)與預(yù)測(cè)1.總體均數(shù) 的可信區(qū)間: 給定X后對(duì)應(yīng)Y的總體均數(shù)給定X后對(duì)應(yīng)Y的樣本均數(shù)7/25/2022352.個(gè)體Y值的容許區(qū)間 給定X后對(duì)應(yīng)個(gè)體Y值波動(dòng)范圍7/25/202236 X Y (體重,kg) (體表面積,103cm2 )11.0 5.28311.8 5.29912.0 5.35812.3 5.29213.15.60213.7 6.01414.4
11、 5.83014.9 6.10215.2 6.07516.0 6.411例 某地10名三歲兒童體重與體表面積7/25/2022371112131415164.55.05.56.06.57.0可信區(qū)間與容許區(qū)間示意(confidence band & tolerance band)X 體重Y 體表面積7/25/202238第二節(jié) 直線相關(guān)Linear Correlation7/25/202239生物遺傳學(xué)上的“相關(guān)” 在回歸分析中,有理由認(rèn)為父親身高決定兒子身高,故把父親身高作為自變量X,兒子身高作為應(yīng)變量Y。Pearson K(英,18571936)在對(duì)同一家庭中兄弟與姐妹身高間關(guān)系進(jìn)行分析時(shí)
12、,發(fā)現(xiàn)兩者難以象父親與兒子身高間關(guān)系那樣區(qū)別自變量X與應(yīng)變量Y,也不必計(jì)算回歸方程。Galton F(英,18221911)將這種現(xiàn)象稱之為 “相關(guān)”。7/25/202240 當(dāng)一個(gè)變量增大,另一個(gè)也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)。兩個(gè)變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。 相關(guān)關(guān)系不一定是因果關(guān)系。一、直線相關(guān)的概念7/25/202241r = 0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)相互關(guān)系示意圖7/25/202242相關(guān)系數(shù)的性質(zhì)兩變量間的線性關(guān)系密切程度與相關(guān)方 向用
13、直線相關(guān)系數(shù)r表示。1 r 1r0為正相關(guān)r0為負(fù)相關(guān)r0為零相關(guān)或無(wú)相關(guān)7/25/202243二、相關(guān)系數(shù)的意義與計(jì)算 Pearson 相關(guān)系數(shù) 標(biāo)準(zhǔn)化后的協(xié)方差7/25/2022447/25/202245SPSS結(jié)果7/25/202246三、相關(guān)系數(shù)的統(tǒng)計(jì)推斷(一)相關(guān)系數(shù)的假設(shè)檢驗(yàn)?zāi)蚣◆颗c年齡之間無(wú)直線相關(guān)關(guān)系7/25/202247附表2附表137/25/202248(二)總體相關(guān)系數(shù)的可信區(qū)間相關(guān)系數(shù)的抽樣分布在0時(shí)呈偏態(tài)分布Z的1-可信區(qū)間:變換后r的1-可信區(qū)間:Z變換后服從正態(tài)分布7/25/202249相關(guān)系數(shù)的抽樣分布(| | = 0.8,n=100,1000次抽樣) -0
14、.8-0.6-0.4-0.20.00100200300-1.0 00.20.40.60.81.00100200300 = - 0.8 = 0.87/25/202250R.A. Fisher(1921) 的 z 變換 z 近似服從均數(shù)為 , 標(biāo)準(zhǔn)差為 的正態(tài)分布。 7/25/202251相關(guān)系數(shù)的z變換值的抽樣分布( = - 0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.20.00100200300-1.0變換前變換后7/25/202252 01234050100150200 00.20.40.60.81.00100200300相關(guān)系數(shù)的z變換值的抽樣分
15、布( =0.8)變換前變換后7/25/202253相關(guān)系數(shù)的可信區(qū)間估計(jì)1. 將 r 變換為 z 。2. 根據(jù) z 服從正態(tài)分布,估計(jì) z 的可信區(qū)間。3. 再將 z 變換回 r。7/25/202254求得8名健康成人血清總膽固醇與低密度脂蛋白膽固醇含量間的 r=0.974,試求總體相關(guān)系數(shù) 的95%可信區(qū)間。z的95%可信區(qū)間: 總體相關(guān)系數(shù)的95%可信區(qū)間 : (0.8587 0.9954)7/25/202255四、決定系數(shù) 0R21 Y的總變異中回歸關(guān)系所能解釋的百分比 年齡可解釋尿肌酐含量變異性的77.75%7/25/202256五、直線回歸與直線相關(guān)的區(qū)別與聯(lián)系 區(qū)別 r沒(méi)有單位,b
16、有單位;相關(guān)表示相互關(guān)系,沒(méi)有依存關(guān)系; 回歸有依存關(guān)系;對(duì)資料的要求不同: 當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行相關(guān)和回 歸分析; 當(dāng)Y是隨機(jī)變量,X是控制變量時(shí),理論 上只能作回歸而不能作相關(guān)分析;7/25/202257 區(qū)別 I型回歸: Y是隨機(jī)變量,X是控制變量; II型回歸: Y與X均是隨機(jī)變量。同一資料中由X推算Y與由Y推算X的回歸方程不同:7/25/202258 聯(lián)系均表示線性關(guān)系符號(hào)相同:共變方向一致假設(shè)檢驗(yàn)結(jié)果相同:tr=tb 可以互相換算: 7/25/202259六、直線回歸與相關(guān)應(yīng)用的注意事項(xiàng)相關(guān):X與Y沒(méi)有主次,為雙向?;貧w:Y依X變化而變化,為單向。自變量的選擇: 原因、容易
17、測(cè)量、變異小要有實(shí)際意義。1.根據(jù)分析目的選擇變量及統(tǒng)計(jì)方法7/25/202260孩子的身高與小樹(shù)的高度間顯示出顯著的相關(guān)性7/25/202261有無(wú)異常點(diǎn),謹(jǐn)慎剔除。2.進(jìn)行相關(guān)、回歸分析前要繪制散點(diǎn)圖, 進(jìn)行判斷7/25/202262離群值對(duì)相關(guān)的影響7/25/202263樣本的間雜性對(duì)相關(guān)性的誤導(dǎo)7/25/2022643.用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件 Y與X為線形關(guān)系誤差服從均數(shù)為0的正態(tài)分布方差相等各觀察單位獨(dú)立回歸模型應(yīng)用前提條件:7/25/202265e07/25/2022660000eeee7/25/202267P值越小越有理由認(rèn)為變量間直線關(guān)系 存在,不能說(shuō)關(guān)系越密切。
18、直線回歸關(guān)系可以內(nèi)插,不宜外延。當(dāng)樣本含量較大時(shí),統(tǒng)計(jì)學(xué)檢驗(yàn)的作用 減弱。r0.05/2,100=0.1954.結(jié)果的解釋及正確應(yīng)用7/25/202268第三節(jié) 秩相關(guān)Rank Correlation 一、Spearman 秩相關(guān)7/25/202269應(yīng)用條件:1.不服從雙變量正態(tài)分布而不宜作積差 相關(guān)分析;2.總體分布類型未知;3.原始數(shù)據(jù)用等級(jí)表示。7/25/202270work years of potential life lost7/25/2022717/25/202272或用秩Pi、Qi直接計(jì)算積差相關(guān)系數(shù)r附表14(n50)7/25/202273SPSS結(jié)果7/25/202274第六節(jié) 兩條回歸直線的比較 一、兩個(gè)回歸系數(shù)的比較二、兩個(gè)截距的比較7/25/2022757/25/202276YXbcb2b1bc07/25/202277第七節(jié) 曲線擬合 7/25/202278一、曲線擬合的一般步驟 1.依據(jù)分析目的確定X與Y,根據(jù)兩變量 散點(diǎn)圖、結(jié)合專業(yè)知識(shí)選擇曲線類型。 2.求回歸方程:曲線直線化。 3.擬合優(yōu)度:R2。7/25/202279CRF:促腎上腺皮質(zhì)激素釋放因子 ACTH:腎上腺皮質(zhì)激素例9-137/25
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專業(yè)前臺(tái)接待服務(wù)供應(yīng)協(xié)議
- 2025年度離婚協(xié)議書(shū)范本:共同債務(wù)的承擔(dān)與償還4篇
- 2025年度新能源汽車充電設(shè)施購(gòu)銷合同4篇
- 2025年度茶葉電商平臺(tái)入駐合作協(xié)議書(shū)4篇
- 2025年度柴油儲(chǔ)備與應(yīng)急供應(yīng)合同范本4篇
- 2024年05月內(nèi)蒙古2024屆中國(guó)民生銀行呼和浩特分行畢業(yè)生“未來(lái)銀行家”暑期管培生校園招考筆試歷年參考題庫(kù)附帶答案詳解
- 2025年度汽車內(nèi)飾部件委托加工合同書(shū)4篇
- 個(gè)性化2024版?zhèn)€人勞動(dòng)協(xié)議匯編版A版
- 2024金融借款協(xié)議樣本版
- 2025年度農(nóng)產(chǎn)品出口FAS貿(mào)易合同范本3篇
- 第二章 運(yùn)營(yíng)管理戰(zhàn)略
- 《三本白皮書(shū)》全文內(nèi)容及應(yīng)知應(yīng)會(huì)知識(shí)點(diǎn)
- 專題14 思想方法專題:線段與角計(jì)算中的思想方法壓軸題四種模型全攻略(解析版)
- 醫(yī)院外來(lái)器械及植入物管理制度(4篇)
- 圖像識(shí)別領(lǐng)域自適應(yīng)技術(shù)-洞察分析
- 港口與港口工程概論
- 《念珠菌感染的治療》課件
- 新概念英語(yǔ)第二冊(cè)考評(píng)試卷含答案(第49-56課)
- 商業(yè)倫理與企業(yè)社會(huì)責(zé)任(山東財(cái)經(jīng)大學(xué))智慧樹(shù)知到期末考試答案章節(jié)答案2024年山東財(cái)經(jīng)大學(xué)
- 【奧運(yùn)會(huì)獎(jiǎng)牌榜預(yù)測(cè)建模實(shí)證探析12000字(論文)】
- (完整版)譯林版英語(yǔ)詞匯表(四年級(jí)下)
評(píng)論
0/150
提交評(píng)論