版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、相關(guān)與回歸第九講基本內(nèi)容 醫(yī)學(xué)上,許多現(xiàn)象之間都有相互聯(lián)系,例如:身高與體重、父親身高與兒子身高、體溫與脈搏、產(chǎn)前檢查與嬰兒體重、乙肝病毒與乙肝等。 在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。變量之間的關(guān)系:乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關(guān)系;有的現(xiàn)象之間因果不清,只是伴隨關(guān)系,例如丈夫的身高和妻子的身高之間,就不能說(shuō)有因果關(guān)系。 相關(guān)與回歸就是用于研究和解釋兩個(gè)變量之間相互關(guān)系的。 主要內(nèi)容第一節(jié) 直線(xiàn)相關(guān)第二節(jié) 直線(xiàn)回歸第三節(jié) 注意事項(xiàng)第一節(jié) 直線(xiàn)相關(guān)一、相關(guān)的類(lèi)型二、相關(guān)系數(shù) 相關(guān)系數(shù)的計(jì)算公式 相關(guān)系數(shù)的假設(shè)檢驗(yàn)三、直線(xiàn)相關(guān)的意義為研究父親
2、與成年兒子身高之間的關(guān)系,皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高1078個(gè)點(diǎn)形成圖形是一個(gè)散點(diǎn)圖。散點(diǎn)圖 為了確定相關(guān)變量之間的關(guān)系,收集一些數(shù)據(jù),這些數(shù)據(jù)是成對(duì)的;然后在直角坐標(biāo)系上描述這些點(diǎn),這一組點(diǎn)集稱(chēng)為散點(diǎn)圖。相關(guān)的類(lèi)型正相關(guān) 負(fù)相關(guān) 完全正相關(guān) 完全負(fù)相關(guān) 稱(chēng)零相關(guān) 相關(guān)系數(shù) 樣本的相關(guān)系數(shù)用r表示r的值在-1和1之間; r的絕對(duì)值越接近1,兩變量的關(guān)聯(lián)程度越強(qiáng),r的絕對(duì)值越接近0,兩變量的關(guān)聯(lián)程度越弱;正相關(guān)時(shí),r值在0和1之間,這時(shí)一個(gè)變量增加,另一個(gè)變量也增加;負(fù)相關(guān)時(shí),r值在-1和0之間,此時(shí)一個(gè)變量增加,
3、另一個(gè)變量將減少。相關(guān)系數(shù)的計(jì)算公式一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān);于是設(shè)想,通過(guò)測(cè)量待產(chǎn)婦尿中雌三醇含量,可以預(yù)測(cè)產(chǎn)兒體重,以便對(duì)低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時(shí)的尿,測(cè)量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。問(wèn)尿中雌三醇含量與產(chǎn)兒體重之間相關(guān)系數(shù)是多少?是正相關(guān)還是負(fù)相關(guān)?分析問(wèn)題:總體-樣本、 目的、變量、關(guān)系 編號(hào)(1)尿雌三醇mg/24h(2產(chǎn)兒體重kg(3)編號(hào)(1)尿雌三醇mg/24h(2)產(chǎn)兒體重kg(3)172.517173.2292.518253.2392.519273.44122.720153.45142.721153.46162.7
4、22153.57162.423163.58143.024193.49163.025183.510163.126173.611173.027183.712193.128203.813213.029224.014242.830253.915153.231244.316163.2 待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系 14X=534Y=99.2 X2=9876 Y2=324.8XY=1750N=31計(jì)算結(jié)果r的值說(shuō)明了兩個(gè)變量X與Y之間關(guān)聯(lián)的密切程度(絕對(duì)值大?。┡c關(guān)聯(lián)的性質(zhì)(正負(fù)號(hào))。問(wèn)題:我們能否得出結(jié)論:待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間成正相關(guān),相關(guān)系數(shù)是0.61。為什么?從計(jì)算結(jié)果可以知道,3
5、1例待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間程正相關(guān),相關(guān)系數(shù)r0.61。相關(guān)系數(shù)的假設(shè)檢驗(yàn) 上例中的相關(guān)系數(shù)r等于0.61,說(shuō)明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。因?yàn)?,總體相關(guān)系數(shù)()為零時(shí),由于抽樣誤差,從總體抽出的31例,其r可能不等于零。這就要對(duì)r進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。 相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用t檢驗(yàn),選用統(tǒng)計(jì)量t的計(jì)算公式如下:=n-2 1. H0 : =0 H1 : 0 2. =0.05 3. t=n-2=31-2=29 t=4.144.確定
6、P值:查t值表, t 0.05(29) =2.045 t=4.142.045,由t所推斷的P值小于0.055.結(jié)論: 按=0.05水準(zhǔn)拒絕?,接受?,認(rèn)為臨產(chǎn)婦24小時(shí)內(nèi)尿中雌三醇濃度與產(chǎn)兒體重之間有正相關(guān)關(guān)系。 直線(xiàn)相關(guān)的意義在確實(shí)存在相關(guān)關(guān)系的前提下(?),如果r的絕對(duì)值越大,說(shuō)明兩個(gè)變量之間的關(guān)聯(lián)程度越強(qiáng),那么,已知一個(gè)變量對(duì)預(yù)測(cè)另一個(gè)變量越有幫助;如果r絕對(duì)值越小,則說(shuō)明兩個(gè)變量之間的關(guān)系越弱,一個(gè)變量的信息對(duì)猜測(cè)另一個(gè)變量的值無(wú)多大幫助。一般說(shuō)來(lái),當(dāng)樣本量較大,并對(duì)r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí),r的絕對(duì)值大于0.7,則表示兩個(gè)變量高度相關(guān);r的絕對(duì)值大于0.4,小于等于0.7時(shí),則
7、表示兩個(gè)變量之間中度相關(guān);r的絕對(duì)值大于0.2,小于等于0.4時(shí),則兩個(gè)變量低度相關(guān)。 雌三醇含量與產(chǎn)兒體重有相關(guān)關(guān)系:如果知道了一位待產(chǎn)婦的尿雌三醇含量能推斷出產(chǎn)兒的體重嗎?能預(yù)測(cè)產(chǎn)兒的體重可能在什么范圍內(nèi)?這要用直線(xiàn)回歸的方法來(lái)解決。 第二節(jié) 直線(xiàn)回歸一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗(yàn)四、直線(xiàn)回歸的應(yīng)用一個(gè)人的快樂(lè),不是因?yàn)樗麚碛械亩?,而是因?yàn)樗?jì)較的少休息一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗(yàn)四、直線(xiàn)回歸的應(yīng)用第二節(jié) 直線(xiàn)回歸知道了兩個(gè)變量之間有直線(xiàn)相關(guān)關(guān)系,并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化,這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,它們的變化可用函數(shù)方程來(lái)表示
8、,叫它們是函數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。實(shí)際上,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱(chēng)這種關(guān)系式為直線(xiàn)回歸方程,這種關(guān)系為直線(xiàn)回歸。直線(xiàn)回歸就是用來(lái)描述一個(gè)變量如何依賴(lài)于另一個(gè)變量其任務(wù)就是要找出一個(gè)變量隨另一個(gè)變量變化的直線(xiàn)方程,我們把這個(gè)直線(xiàn)方程叫做直線(xiàn)回歸方程。 回歸方程 abX=+ 式中的 是由自變量X推算應(yīng)變量Y的估計(jì)值,a是回歸直線(xiàn)在Y 軸上的截距,即X=0時(shí)的Y值;b為樣本的回歸系數(shù),即回歸直線(xiàn)的斜率,表示當(dāng)X變動(dòng)一個(gè)單位時(shí),Y平均變動(dòng)b個(gè)單位。如果a、b已知,代入上式,就可求得直線(xiàn)回歸方程。
9、 y回歸系數(shù)根據(jù)上例的數(shù)據(jù),求待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間的回歸方程。從相關(guān)系數(shù)的計(jì)算中,已經(jīng)求得: 這就是我們求得的二者關(guān)系的回歸方程 回歸直線(xiàn)的描繪 根據(jù)求得的回歸方程,可以在自變量X的實(shí)測(cè)范圍內(nèi)任取兩個(gè)值,代入方程中,求得相應(yīng)的兩個(gè)Y值,以這兩對(duì)數(shù)據(jù)找出對(duì)應(yīng)的兩個(gè)坐標(biāo)點(diǎn),將兩點(diǎn)連接為一條直線(xiàn),就是該方程的回歸直線(xiàn)。回歸直線(xiàn)一定經(jīng)過(guò)(0,a ),( )。這兩點(diǎn)可以用來(lái)核對(duì)圖線(xiàn)繪制是否正確。 =2.15+0.061X 是否一定能說(shuō)明雌三醇與產(chǎn)兒體重之間存在回歸關(guān)系? 與直線(xiàn)相關(guān)一樣,直線(xiàn)回歸方程也是從樣本資料計(jì)算而得的,同樣也存在著抽樣誤差問(wèn)題。所以,需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn)
10、,以判斷b是否從回歸系數(shù)為零的總體中抽得。為了判斷抽樣誤差的影響,需對(duì)回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)??傮w的回歸系數(shù)一般用表示。 采用t檢驗(yàn)方法其中Sy.x為各觀察值Y到回歸直線(xiàn)的距離的標(biāo)準(zhǔn)差,表示去除X影響后Y的變異程度, 回歸系數(shù)的假設(shè)檢驗(yàn)H0:=0 H1:0=0.05計(jì)算統(tǒng)計(jì)量: t=4.14; =31-2=29,t 0.05(29)=2.045計(jì)算概率值P: P0.05做出推論:按=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1認(rèn)為待產(chǎn)婦24小時(shí)尿中雌三醇含量與產(chǎn)兒體重之間存在直線(xiàn)回歸關(guān)系。,直線(xiàn)回歸的應(yīng)用 描述兩變量之間的依存關(guān)系:通過(guò)回歸系數(shù)的假設(shè)檢驗(yàn),若認(rèn)為兩變量之間存在直線(xiàn)回歸關(guān)系,則可用直線(xiàn)回歸
11、來(lái)描述。利用回歸方程進(jìn)行預(yù)測(cè) :把自變量代入回歸方程,對(duì)應(yīng)變量進(jìn)行估計(jì),可求出應(yīng)變量的波動(dòng)范圍。例如,已知某待產(chǎn)婦的尿雌三醇濃度,代入回歸方程,再用區(qū)間估計(jì)的方法,即可知道生產(chǎn)時(shí),產(chǎn)兒的體重的范圍。 利用回歸方程進(jìn)行統(tǒng)計(jì)控制 :空氣質(zhì)量與汽車(chē)數(shù)量 第三節(jié) 應(yīng)用時(shí)注意事項(xiàng)一、注意事項(xiàng) 二、相關(guān)與回歸的區(qū)別三、相關(guān)與回歸的聯(lián)系應(yīng)用直線(xiàn)相關(guān)與回歸的注意事項(xiàng) 1.實(shí)際意義 進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無(wú)關(guān)系的兩個(gè)事物或現(xiàn)象用來(lái)作相關(guān)回歸分析。例如,有人說(shuō),孩子長(zhǎng),公園里的小樹(shù)也在長(zhǎng)。求孩子和小樹(shù)之間的相關(guān)關(guān)系就毫無(wú)意義,用孩子的身高推測(cè)小樹(shù)的高度則更加慌謬。 2.相關(guān)關(guān)系 相關(guān)關(guān)系不一定是因
12、果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對(duì)于在校兒童,鞋的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會(huì)新詞并不能使腳變大,而是涉及到第三個(gè)因素 年齡。當(dāng)兒童長(zhǎng)大一些,他們的閱讀能力會(huì)提高而且由于長(zhǎng)大也穿不下原來(lái)的鞋。 3.利用散點(diǎn)圖對(duì)于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖上看它們有無(wú)關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān),然后再進(jìn)行相關(guān)回歸分析。4.變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個(gè)范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來(lái)的回歸關(guān)系。相關(guān)與回歸的區(qū)別 1.意義 :相關(guān)反映兩變量的相互關(guān)系,即在兩個(gè)變量中,任何一個(gè)的變化都會(huì)引起另
13、一個(gè)的變化,是一種雙向變化的關(guān)系?;貧w是反映兩個(gè)變量的依存關(guān)系,一個(gè)變量的改變會(huì)引起另一個(gè)變量的變化,是一種單向的關(guān)系。2.應(yīng)用:研究?jī)蓚€(gè)變量的相互關(guān)系用相關(guān)分析。研究?jī)蓚€(gè)變量的依存關(guān)系用回歸分析。3.研究性質(zhì):相關(guān)是對(duì)兩個(gè)變量之間的關(guān)系進(jìn)行描述,看兩個(gè)變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負(fù)相關(guān)?;貧w是對(duì)兩個(gè)變量做定量描述,研究?jī)蓚€(gè)變量的數(shù)量關(guān)系,已知一個(gè)變量值可以預(yù)測(cè)出另一個(gè)變量值,可以得到定量結(jié)果。 4.相關(guān)系數(shù)r與回歸系數(shù)b :r與b的絕對(duì)值反映的意義不同。r的絕對(duì)值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線(xiàn),表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對(duì)值越大,回歸直線(xiàn)越陡,說(shuō)明當(dāng)X變化一個(gè)單位時(shí),Y的平均變化就越大。反之也是一樣。 相關(guān)與回歸的聯(lián)系1.關(guān)系 能進(jìn)行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對(duì)于兩組新數(shù)據(jù)可先做散點(diǎn)圖,求出它們的相關(guān)系數(shù),對(duì)于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。 2. r與b 符號(hào)一致:r為正時(shí),b也為正,表示兩變量是正相關(guān),是同向變化。r為負(fù)時(shí),b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化。 r與b的假設(shè)檢驗(yàn)結(jié)果一致:可用r的顯著檢驗(yàn)代替b的顯著性檢驗(yàn)。 小結(jié)第一節(jié) 直線(xiàn)相
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車(chē)輛抵押合同借款范本年
- 商品采購(gòu)合同范本年
- 合同協(xié)議補(bǔ)充模板
- 鋼鐵項(xiàng)目擔(dān)保合同
- 攝影師勞動(dòng)合同范本
- 商品混凝土合同書(shū)范本
- 草坪種植合同協(xié)議書(shū)模板范本
- 租賃合同申請(qǐng)書(shū)年
- 空置房屋轉(zhuǎn)讓合同模板
- 部編版道德與法治九年級(jí)上冊(cè)《我們的夢(mèng)想》聽(tīng)課評(píng)課記錄1
- DL-T+5196-2016火力發(fā)電廠(chǎng)石灰石-石膏濕法煙氣脫硫系統(tǒng)設(shè)計(jì)規(guī)程
- 2024-2030年中國(guó)產(chǎn)教融合行業(yè)市場(chǎng)運(yùn)營(yíng)態(tài)勢(shì)及發(fā)展前景研判報(bào)告
- 2024年微生物檢測(cè)試劑行業(yè)商業(yè)計(jì)劃書(shū)
- 高中英語(yǔ)選擇性必修一單詞表
- 物業(yè)公司介紹
- (正式版)SHT 3551-2024 石油化工儀表工程施工及驗(yàn)收規(guī)范
- JTGT H21-2011 公路橋梁技術(shù)狀況評(píng)定標(biāo)準(zhǔn)
- 【永輝超市公司員工招聘問(wèn)題及優(yōu)化(12000字論文)】
- 中國(guó)直銷(xiāo)發(fā)展四個(gè)階段解析
- 2024屆浙江省寧波市鎮(zhèn)海區(qū)鎮(zhèn)海中學(xué)高一物理第一學(xué)期期末質(zhì)量檢測(cè)試題含解析
- 部編版語(yǔ)文四年級(jí)下冊(cè) 教材解讀
評(píng)論
0/150
提交評(píng)論