版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
線性相關(guān)與回歸LinearCorrelation&RegressionFrancisGaltonFrancisGalton爵士(英,1822~1911)對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn)是提出“相關(guān)”與“回歸”的概念,用統(tǒng)計(jì)方法對(duì)進(jìn)化論中的變異進(jìn)行研究,開創(chuàng)了生物統(tǒng)計(jì)學(xué)。方法的提出KarlPearsonKarlPearson(英,1857~1936)是FrancisGalton的得意門生,他開創(chuàng)了統(tǒng)計(jì)方法學(xué)。他對(duì)統(tǒng)計(jì)學(xué)的主要貢獻(xiàn):變異數(shù)據(jù)的處理、分布曲線的選配、卡方檢驗(yàn)的提出、回歸與相關(guān)的發(fā)展。方法的提出直線相關(guān)
(
linearcorrelation)
體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖1.直線相關(guān)的概念
11名男青年身高與前臂長(zhǎng)度散點(diǎn)圖2.對(duì)資料的要求
3.相關(guān)系數(shù)
(correlationcoefficient,r)
表示方法:
-1r
1*意義:描述兩個(gè)變量直線相關(guān)的方向與與密切程度的指標(biāo)。x、y都是正態(tài)分布資料的隨機(jī)變量正相關(guān)負(fù)相關(guān)0<r<1-1<r<0相關(guān)系數(shù)示意:r=1r=-1完全正相關(guān)完全負(fù)相關(guān)相關(guān)系數(shù)計(jì)算方法:__(x-x)(y-y)l
xyr=————————————=——————___________________________(x-x)2(y-y)2
l
xx·l
yy__(x)(y)l
xy=(x-x)(y-y)=xy-—————n__(x)2lxx=(x-x)2=x2-————n_(y)2lyy=(y-y)2=y2-————n____________________________(x-x)2(y-y)2
l
xx·l
yy
計(jì)算:__(x-x)(y-y)l
xyr=————————————=——————__(x)(y)l
xy=(x-x)(y-y)=xy-—————n__=8.975(x)2lxx=(x-x)2=x2-————n_=98.5
(y)2lyy=(y-y)2=y2-————n_=1.69525r=8.975√98.51.69525=0.6945
編號(hào)身高(cm)前臂長(zhǎng)(cm)XYX2Y2(X)(Y)1170477990289002209217342726629929176431604470402560019364155416355240251681517347813129929220961885094003534425007178478366316842209818346841833489211691804988203240024011016543709527225184911166443174285612116合計(jì)1891500861853260812281011名男青年身高與前臂長(zhǎng)度4.相關(guān)系數(shù)的假設(shè)檢驗(yàn)公式:查表法
檢驗(yàn)假設(shè):H0:=0,H1:0,=0.05r-0rt=———=——————,Sr
1-r2———n-2________=n-2t=0.6945(1-0.69452)/(10-2)√=2.730=n–2=10–2=8P<0.05結(jié)論:可認(rèn)為該地女中學(xué)生的體重與肺活量有正相關(guān)關(guān)系
線性回歸LinearRegressionRegression釋義天文學(xué)上的“回歸”地球繞太陽(yáng)公轉(zhuǎn),在公轉(zhuǎn)的同時(shí)本身還自轉(zhuǎn),在本身自轉(zhuǎn)的同時(shí)地球的假設(shè)軸心還來回?cái)[動(dòng)。由于地球軸心的來回?cái)[動(dòng),太陽(yáng)光垂直照射到地球上就有南、北兩個(gè)極限位置(南、北緯23027’),分別稱南、北回歸線。統(tǒng)計(jì)術(shù)語(yǔ)目前“回歸”已成為表示變量之間數(shù)量依存關(guān)系的統(tǒng)計(jì)術(shù)語(yǔ),并且衍生出“回歸方程”、“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。
1.直線回歸的概念
體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖a為回歸直線在y軸上的截距0yxa>0a=0a<0a0yxb>0b=0b<0b=0
b為回歸系數(shù)
__(x-x)(y-y)xy-(x)(y)/nb=————————=—————————_(x-x)2x2-(x)2/n
__a=y-bx4.直線回歸方程的計(jì)算方法y=a+bx
^
__(x-x)(y-y)xy-(x)(y)/nb=————————=——————————_(x-x)2x2-(x)2/nb=946.55-40523.15/10165014052/10=0.0911
__a=y-bx=23.15/10-0.0911405/10=-1.3746
女中學(xué)生肺活量對(duì)體重的直線回歸方程是:y=-1.3746+0.0911x
^=y(tǒng)/n-bx/n|b-0|bt=————=——,=n-2SbSbSyxSb=———————____________(x-x)2_Sb為樣本回歸系數(shù)標(biāo)準(zhǔn)誤Syx為剩余標(biāo)準(zhǔn)差5.回歸系數(shù)的假設(shè)檢驗(yàn)同一組資料作直線相關(guān)與回歸時(shí)tb與tr等值假設(shè):H0:=0,H1:0,=0.05;
(y-y)2Syx=—————n-2?(y-?)2=lyy-bl
xy
=1.69525-0.09118.975=0.87760.877610-2=0.3312=0.331298.5==0.0334Sb
=Syx(x–x)2
|b-0|bt=————=——SbSb=0.09110.0334=2.728=n–2=8P<0.05結(jié)論:總體回歸系數(shù)不等于零,即回歸方程y=-1.3746+0.0911x成立
^體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖與回歸直線y=-1.3746+0.0911x
^x2=44?2=2.64x1=37?1=2.00
6.直線回歸方程的圖示p1p2p1p2
SPSS結(jié)果34描述兩變量的依存數(shù)量關(guān)系利用回歸方程進(jìn)行預(yù)測(cè):由易測(cè)的變量值估算難算的變量值(由x估計(jì)y)利用回歸方程進(jìn)行控制:即利用回歸方程進(jìn)行逆估計(jì)(由y估計(jì)x)7.直線回歸方程的應(yīng)用
區(qū)別:
1)意義 直線回歸反映兩變量的依存關(guān)系; 直線相關(guān)反映兩變量的相互關(guān)系。直線回歸與直線相關(guān)的聯(lián)系與區(qū)別
區(qū)別:
2)對(duì)資料的要求直線回歸:自變量是正態(tài)總體的隨機(jī)變量或指定變量,y一定是正態(tài)總體的隨機(jī)變量;直線相關(guān):兩變量均為正態(tài)總體的隨機(jī)變量。1)同一組資料的r
與b的正負(fù)符號(hào)是一致的;2)同一組資料的r
和b的假設(shè)檢驗(yàn)結(jié)果是一致的,即tr=tb。
聯(lián)系:3)相關(guān)回歸可以互相解釋R的平方稱為確定系數(shù)
(coefficientofdetermination)應(yīng)用確定系數(shù),也可以從回歸的角度對(duì)相關(guān)程度做進(jìn)一步的了解。聯(lián)系:1.進(jìn)行相關(guān)與回歸時(shí)先繪制散點(diǎn)圖,還要觀察有無異常點(diǎn)。2.回歸與相關(guān)的應(yīng)用僅限于原實(shí)測(cè)數(shù)據(jù)的范圍內(nèi)使用。應(yīng)用注意事項(xiàng)孩子的身高與小樹的高度間顯示出顯著的相關(guān)性錯(cuò)誤應(yīng)用舉例小樹高度與孩子身高的關(guān)系研究第二節(jié)
Spearman秩相關(guān)
(等級(jí)相關(guān))
求兩變量的相關(guān)系數(shù),當(dāng)X、Y并不服從二元正態(tài)分布,對(duì)數(shù)據(jù)做秩變換后再計(jì)算直線相關(guān)系數(shù),用rs記之。
適用條件例題:某醫(yī)生做一種研究,欲了解人群中氟骨癥患病率(%)與飲用水中氟含量(mg/l)之間的關(guān)系。隨機(jī)觀察8個(gè)地區(qū)氟骨癥患病率與飲用水中氟含量,數(shù)據(jù)如表兩欄。試計(jì)算等級(jí)相關(guān)系數(shù)rs。
調(diào)查了某地區(qū)10個(gè)鄉(xiāng)的釘螺密度與血吸蟲感染率(%)數(shù)據(jù)如表。試分析該地區(qū)螺密度與感染率之間有無相關(guān)關(guān)系?例題
代入公式:若資料中相同觀察值的例數(shù)較多時(shí),計(jì)算的結(jié)果偏差較大,此時(shí)可由公式
計(jì)算校正的rs值rs′。
Thankyou!擴(kuò)展:多元線性回歸
常數(shù)項(xiàng),表示當(dāng)所有自變量為0時(shí)應(yīng)變量Y的總體平均值的估計(jì)值
表示其它自變量固定不變的情況下,每改變一個(gè)測(cè)量單位時(shí)所引起的應(yīng)變量Y的平均改變量
bj為偏回歸系數(shù)(partialregressioncoefficient)
例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球液體金合歡烯橡膠行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球變頻用移相變壓器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球國(guó)防輕型戰(zhàn)術(shù)車輛行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球高性能碳纖維材料行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 科技驅(qū)動(dòng)下的跨領(lǐng)域職業(yè)發(fā)展實(shí)踐
- 科技改變生活智能陽(yáng)臺(tái)綠化的應(yīng)用
- 小學(xué)生自我學(xué)習(xí)能力培養(yǎng)的教學(xué)策略研究
- 2025版學(xué)校教師聘用合同范本:教師跨區(qū)域交流合作協(xié)議3篇
- 超市管理手冊(cè)全面采購(gòu)策略
- 2025年度個(gè)人委托代繳社保及醫(yī)療合同范本4篇
- 電纜擠塑操作手冊(cè)
- 浙江寧波鄞州區(qū)市級(jí)名校2025屆中考生物全真模擬試卷含解析
- 2024-2025學(xué)年廣東省深圳市南山區(qū)監(jiān)測(cè)數(shù)學(xué)三年級(jí)第一學(xué)期期末學(xué)業(yè)水平測(cè)試試題含解析
- IATF16949基礎(chǔ)知識(shí)培訓(xùn)教材
- 【MOOC】大學(xué)生創(chuàng)新創(chuàng)業(yè)知能訓(xùn)練與指導(dǎo)-西北農(nóng)林科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 勞務(wù)派遣公司員工考核方案
- 基礎(chǔ)生態(tài)學(xué)-7種內(nèi)種間關(guān)系
- 2024年光伏農(nóng)田出租合同范本
- 《阻燃材料與技術(shù)》課件 第3講 阻燃基本理論
- 2024-2030年中國(guó)黃鱔市市場(chǎng)供需現(xiàn)狀與營(yíng)銷渠道分析報(bào)告
- 新人教版九年級(jí)化學(xué)第三單元復(fù)習(xí)課件
評(píng)論
0/150
提交評(píng)論