




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1雙變量回歸與相關(guān)BivariateRegression&Correlation第9章2講課內(nèi)容:
第一節(jié)直線回歸(重點(diǎn))
第二節(jié)直線相關(guān)(重點(diǎn))
第三節(jié)秩相關(guān)第六節(jié)兩條回歸直線的比較第七節(jié)曲線擬合3第2、第3、第4章介紹了單變量計(jì)量資料的統(tǒng)計(jì)描述與統(tǒng)計(jì)推斷:P.13
例2-1:計(jì)算101名成年女子血清總膽固醇的平均指標(biāo)與變異指標(biāo)。P.51
例3-7:比較阿卡波糖膠囊(試驗(yàn)組)與拜糖蘋(píng)膠囊(對(duì)照組)降低糖尿病人的空腹血糖值
有無(wú)差別。P.73例4-2:比較安慰劑組、降血脂新藥2.4g
組、降血脂新藥4.8g組、降血脂新藥7.2g組降低患者的低密度脂蛋白含量有無(wú)差別。4在醫(yī)學(xué)研究中常要分析兩變量間或多變量間的關(guān)系:年齡與血壓藥物劑量與動(dòng)物死亡率肺活量與身高、體重、胸圍和肩寬等...5事物間的相關(guān)關(guān)系確定性關(guān)系兩變量間的函數(shù)表達(dá)式
圓的周長(zhǎng)與半徑的關(guān)系:C=2R
路程與速度、時(shí)間的關(guān)系:L=ST
數(shù)學(xué)中X與Y的直線函數(shù)關(guān)系:Y=a+bX
非確定性關(guān)系
兩變量間存在關(guān)系,但未精確到可以用函數(shù)表達(dá)式來(lái)描述。
年齡與血脂的關(guān)系;身高與體重的關(guān)系;體重與體表面積的關(guān)系。6第一節(jié)直線回歸LinearRegression7一、直線回歸的概念“回歸”是一個(gè)借用已久因而相沿成習(xí)的統(tǒng)計(jì)學(xué)術(shù)語(yǔ)。直線回歸是分析成對(duì)觀測(cè)數(shù)據(jù)中兩變量間線性依存關(guān)系的方法。8生物遺傳學(xué)上的“回歸”
PearsonK(英,1857~1936)1903年搜集了1078個(gè)家庭人員的身高、前臂長(zhǎng)等指標(biāo)的記錄,發(fā)現(xiàn)兒子身高(Y,英寸)與父親身高間(X,英寸)存在線性依存關(guān)系:
=33.73+0.516X
但不少身材高的父親的兒子成年后身高比其父親矮,不少身材矮的父親的兒子成年后身高比其父親高。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為子一代身高向人群平均身高的“回歸”。9Regression釋義10FrancisGaltonFrancisGalton爵士(英,1822~1911)是達(dá)爾文(CharlesDarwin)的表弟。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計(jì)方法對(duì)進(jìn)化論中的變異進(jìn)行研究,開(kāi)創(chuàng)了生物統(tǒng)計(jì)學(xué)。11KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門(mén)生,他開(kāi)創(chuàng)了統(tǒng)計(jì)方法學(xué)。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗(yàn)的提出、回歸與相關(guān)的發(fā)展。12天文學(xué)上的“回歸”地球繞太陽(yáng)公轉(zhuǎn),在公轉(zhuǎn)的同時(shí)本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時(shí)地球的假設(shè)軸心還來(lái)回?cái)[動(dòng)。由于地球軸心的來(lái)回?cái)[動(dòng),太陽(yáng)光垂直照射到地球上就有南、北兩個(gè)極限位置(南、北緯23027’),分別稱南、北回歸線,太陽(yáng)光對(duì)赤道“回歸”垂直照射到南、北回歸線的時(shí)間分別為我國(guó)農(nóng)歷的冬至與夏至。
13日常生活中的“回歸”現(xiàn)象
1歲姜二狗,7歲姜二狗同學(xué),20歲小姜同志,30歲姜科長(zhǎng),40歲姜處長(zhǎng),50歲姜局長(zhǎng),60歲姜老,70歲老姜,80歲姜二狗。
目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計(jì)術(shù)語(yǔ),并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。14例某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h),試估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的回歸方程。15年齡(歲)X尿肌酐含量Y(mmol/24h)hat16各散點(diǎn)呈直線趨勢(shì)但并非均在一條直線上根據(jù)原始數(shù)據(jù)擬合的直線方程與數(shù)理上二元一次函數(shù)方程在內(nèi)涵上有區(qū)別,稱為直線回歸方程。17二、直線回歸方程的求法最小二乘法在所有直線中最小18年齡(歲)X尿肌酐含量Y(mmol/24h)(8,2.8)(12,3.3)19b的意義斜率(slope)
年齡每增加1歲,尿肌酐含量平均增加0.1392(mmol/24h)b的單位為(Y的單位/X的單位)20a截距(intercept,constant)X=0時(shí),Y的估計(jì)值a的單位與Y值相同當(dāng)X可能取0時(shí),a才有實(shí)際意義。a的意義21回歸直線的有關(guān)性質(zhì)直線通過(guò)均點(diǎn)各點(diǎn)到該回歸線縱向距離平方和較到其它任何直線者為小。
為來(lái)自的一個(gè)樣本對(duì)于X各個(gè)取值,相應(yīng)Y的總體均數(shù)22XY23三、直線回歸方程中的統(tǒng)計(jì)推斷(一)回歸方程的假設(shè)檢驗(yàn)1.方差分析(1)建立檢驗(yàn)假設(shè)并確定檢驗(yàn)水準(zhǔn)
H0:β=0H1:β≠0α=0.05的分解重點(diǎn)24因變量Y總變異的分解X
Y
Y25SS總=SS回+SS殘26未引進(jìn)回歸時(shí)的總變異:
(sumofsquaresofdeviationfrommean)引進(jìn)回歸以后的剩余變異:
(sumofsquaresofresiduals)回歸的貢獻(xiàn),回歸平方和:
(sumofsquaresduetoregression)Y的總變異分解27
(3)計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值SS總=lYY=1.0462
SS回=blXY=l2XY/lXX=5.8452/42=0.8134SS殘=SS總-SS回=1.0462-0.8134=0.2328v總=v回+v剩v總=n-1,v回=1,v殘=n-228F0.01(1,6)=13.74292.t檢驗(yàn)回歸的剩余標(biāo)準(zhǔn)差扣除了X的影響后Y方面的變異;引進(jìn)回歸方程后,Y方面的變異。30(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量t值(1)建立檢驗(yàn)假設(shè)并確定檢驗(yàn)水準(zhǔn)(3)確定P值下結(jié)論
31
(二)總體回歸系數(shù)
的可信區(qū)間此區(qū)間不包括β=0,結(jié)論為b有統(tǒng)計(jì)學(xué)意義。32
(三)利用回歸方程進(jìn)行估計(jì)與預(yù)測(cè)1.總體均數(shù)的可信區(qū)間:給定X后對(duì)應(yīng)Y的總體均數(shù)給定X后對(duì)應(yīng)Y的樣本均數(shù)332.個(gè)體Y值的容許區(qū)間
給定X后對(duì)應(yīng)個(gè)體Y值波動(dòng)范圍34
XY(體重,kg)(體表面積,103cm2) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.1 5.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411例某地10名三歲兒童體重與體表面積351112131415164.55.05.56.06.57.0可信區(qū)間與容許區(qū)間示意
(confidenceband&toleranceband)X體重Y體表面積36第二節(jié)直線相關(guān)LinearCorrelation37生物遺傳學(xué)上的“相關(guān)”在回歸分析中,有理由認(rèn)為父親身高決定兒子身高,故把父親身高作為自變量X,兒子身高作為應(yīng)變量Y。PearsonK(英,1857~1936)在對(duì)同一家庭中兄弟與姐妹身高間關(guān)系進(jìn)行分析時(shí),發(fā)現(xiàn)兩者難以象父親與兒子身高間關(guān)系那樣區(qū)別自變量X與應(yīng)變量Y,也不必計(jì)算回歸方程。GaltonF(英,1822~1911)將這種現(xiàn)象稱之為“相關(guān)”。38
當(dāng)一個(gè)變量增大,另一個(gè)也隨之增大(或減少),我們稱這種現(xiàn)象為共變,或相關(guān)。兩個(gè)變量有共變現(xiàn)象,稱為有相關(guān)關(guān)系。相關(guān)關(guān)系不一定是因果關(guān)系。一、直線相關(guān)的概念39相互關(guān)系示意圖r=0(h)r=0(f)r=-1(d)r=1(b)0<r<1(a)-1<r<0(c)r
0(e)r
0(g)零相關(guān)正相關(guān)負(fù)相關(guān)完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)零相關(guān)40相關(guān)系數(shù)的性質(zhì)兩變量間的線性關(guān)系密切程度與相關(guān)方向用直線相關(guān)系數(shù)r表示。-1≤r≤1r>0為正相關(guān)r<0為負(fù)相關(guān)r=0為零相關(guān)或無(wú)相關(guān)41二、相關(guān)系數(shù)的意義與計(jì)算
Pearson相關(guān)系數(shù)標(biāo)準(zhǔn)化后的協(xié)方差4243三、相關(guān)系數(shù)的統(tǒng)計(jì)推斷(一)相關(guān)系數(shù)的假設(shè)檢驗(yàn)?zāi)蚣◆颗c年齡之間無(wú)直線相關(guān)關(guān)系44附表2附表1345(二)總體相關(guān)系數(shù)的可信區(qū)間相關(guān)系數(shù)的抽樣分布在≠0時(shí)呈偏態(tài)分布Z的1-α可信區(qū)間:變換后r的1-α可信區(qū)間:Z變換后服從正態(tài)分布46相關(guān)系數(shù)的抽樣分布
(||=0.8,n=100,1000次抽樣)-0.8-0.6-0.4-0.20.00100200300-1.0
00.20.40.60.81.00100200300
=-0.8
=0.847R.A.Fisher(1921)的z變換
z近似服從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。
48相關(guān)系數(shù)的z變換值的抽樣分布(=-0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.20.00100200300-1.0變換前變換后49相關(guān)系數(shù)的z變換值的抽樣分布(=0.8)
01234050100150200
00.20.40.60.81.00100200300變換前變換后50相關(guān)系數(shù)的可信區(qū)間估計(jì)1.將r變換為z。2.根據(jù)z服從正態(tài)分布,估計(jì)z的可信區(qū)間。3.再將z變換回r。51求得8名健康成人血清總膽固醇與低密度脂蛋白膽固醇含量間的r=0.974,試求總體相關(guān)系數(shù)ρ的95%可信區(qū)間??傮w相關(guān)系數(shù)ρ的95%可信區(qū)間:(0.85870.9954)z的95%可信區(qū)間:
52四、決定系數(shù)0﹤R2﹤1
Y的總變異中回歸關(guān)系所能解釋的百分比年齡可解釋尿肌酐含量變異性的77.75%53五、直線回歸與直線相關(guān)的區(qū)別與聯(lián)系
區(qū)別
r沒(méi)有單位,b有單位;相關(guān)表示相互關(guān)系,沒(méi)有依存關(guān)系;回歸有依存關(guān)系;對(duì)資料的要求不同:
當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析;
當(dāng)Y是隨機(jī)變量,X是控制變量時(shí),理論上只能作回歸而不能作相關(guān)分析;54
區(qū)別
I型回歸:Y是隨機(jī)變量,X是控制變量;
II型回歸:Y與X均是隨機(jī)變量。同一資料中由X推算Y與由Y推算X的回歸方程不同:55
聯(lián)系均表示線性關(guān)系符號(hào)相同:共變方向一致假設(shè)檢驗(yàn)結(jié)果相同:tr=tb
可以互相換算:
56六、直線回歸與相關(guān)應(yīng)用的注意事項(xiàng)相關(guān):X與Y沒(méi)有主次,為雙向?;貧w:Y依X變化而變化,為單向。自變量的選擇:原因、容易測(cè)量、變異小要有實(shí)際意義。1.根據(jù)分析目的選擇變量及統(tǒng)計(jì)方法57孩子的身高與小樹(shù)的高度間顯示出顯著的相關(guān)性58有無(wú)異常點(diǎn),謹(jǐn)慎剔除。2.進(jìn)行相關(guān)、回歸分析前要繪制散點(diǎn)圖,進(jìn)行判斷59離群值對(duì)相關(guān)的影響60樣本的間雜性對(duì)相關(guān)性的誤導(dǎo)613.用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件Y與X為線形關(guān)系誤差服從均數(shù)為0的正態(tài)分布方差相等各觀察單位獨(dú)立回歸模型應(yīng)用前提條件:62e0630000eeee離群值缺乏二次項(xiàng)方差不齊不獨(dú)立64P值越小越有理由認(rèn)為變量間直線關(guān)系存在,不能說(shuō)關(guān)系越密切。直線回歸關(guān)系可以內(nèi)插,不宜外延。當(dāng)樣本含量較大時(shí),統(tǒng)計(jì)學(xué)檢驗(yàn)的作用減弱。r0.05/2,100=0.1954.結(jié)果的解釋及正確應(yīng)用65第三節(jié)秩相關(guān)RankCorrelation一、Spearman秩相關(guān)66應(yīng)用條件:1.不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析;2.總體分布類型未知;3.原始數(shù)據(jù)用等級(jí)表示。67死因類別死因構(gòu)成(%)WYPLL構(gòu)成(%)(1)X(2)Y(4)10.030.0520.140.3430.200.9340.430.6950.440.3860.450.7970.471.1980.654.7490.952.31100.965.95112.441.11122.693.53133.073.48147.785.65159.8233.951618.9317.161722.598.421827.969.33合計(jì)——WYPLL:workyearsofpotentiallifelost表9-3某省1995年到1999年居民死因構(gòu)成與WYPLL構(gòu)成68死因類別死因構(gòu)成(%)W
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【高一】【志存高遠(yuǎn)踏新程 腳踏實(shí)地創(chuàng)未來(lái)】開(kāi)學(xué)第一課 -文字稿
- 分?jǐn)?shù)的初步認(rèn)識(shí)復(fù)習(xí)(教案)2024-2025學(xué)年數(shù)學(xué)三年級(jí)上冊(cè) 蘇教版
- 六年級(jí)下冊(cè)數(shù)學(xué)教案-總復(fù)習(xí)18 數(shù)形結(jié)合思想 青島版
- 三年級(jí)下冊(cè)數(shù)學(xué)教案-第七單元小數(shù)的初步認(rèn)識(shí) 青島版
- 第23課《孟子三章:得道多助失道寡助》教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版語(yǔ)文八年級(jí)上冊(cè)
- 2025年學(xué)習(xí)雷鋒精神六十二周年主題活動(dòng)方案 匯編3份
- Unit 4 Position Lesson 1 The Magic Show(教學(xué)設(shè)計(jì))-2024-2025學(xué)年北師大版(三起)英語(yǔ)五年級(jí)上冊(cè)
- 2025年河北省石家莊市單招職業(yè)傾向性測(cè)試題庫(kù)參考答案
- 2025年黑龍江冰雪體育職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)1套
- 2025年杭州職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案
- 2025年車位買(mǎi)賣(mài)合同模板電子版
- AI創(chuàng)作指令合集系列之-教案寫(xiě)作指令
- 關(guān)于投資協(xié)議書(shū)范本5篇
- 《反電信網(wǎng)絡(luò)詐騙法》知識(shí)考試題庫(kù)150題(含答案)
- 2025年上海市各區(qū)初三一模語(yǔ)文試卷(打包16套無(wú)答案)
- 2024 原發(fā)性肝癌診療指南 更新要點(diǎn)課件
- 《圓柱與圓錐-圓柱的表面積》(說(shuō)課稿)-2023-2024學(xué)年六年級(jí)下冊(cè)數(shù)學(xué)人教版
- 【8語(yǔ)期末】蕪湖市2024-2025學(xué)年八年級(jí)上學(xué)期期末考試語(yǔ)文試題
- 常用臨床檢驗(yàn)結(jié)果解讀
- 2025年浙江省金華義烏市人社局招聘雇員歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 老年癡呆患者護(hù)理課件
評(píng)論
0/150
提交評(píng)論