




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
直線相關(guān)與回歸分析第一頁,共四十頁,編輯于2023年,星期日
分析兩個變量間的關(guān)系常用回歸及相關(guān)分析的統(tǒng)計方法。如兩個變量間的關(guān)系是線性的,可用直線相關(guān)與回歸分析;如兩個變量間的關(guān)系是非線性的需用非線性(曲線)回歸?;貧w分析適用于分析變量間的因果關(guān)系;用一個自變量的值來估計另一個應(yīng)變量的值。相關(guān)分析用于分析兩變量間相互聯(lián)系的密切程度及相關(guān)方向。
第一節(jié)概述
第二頁,共四十頁,編輯于2023年,星期日第二節(jié)相關(guān)系數(shù)
相關(guān)分析的目的在于通過相關(guān)系數(shù)r來描述和度量兩變量線性聯(lián)系的程度和方向。
r>0正相關(guān)圖例1r<0負(fù)相關(guān)圖例2r=0零相關(guān)圖例3
零相關(guān)即兩變量間無關(guān)。樣本相關(guān)系數(shù)不等于零,并不表示總體相關(guān)系數(shù)不等于零,還要作顯著性檢驗(yàn)。next第三頁,共四十頁,編輯于2023年,星期日r=0.7495回第四頁,共四十頁,編輯于2023年,星期日r=-0.83597回第五頁,共四十頁,編輯于2023年,星期日第六頁,共四十頁,編輯于2023年,星期日
相關(guān)系數(shù)的計算:
X和Y的離均差積和X的離均差平方和第七頁,共四十頁,編輯于2023年,星期日
相關(guān)系數(shù)的顯著性檢驗(yàn)
樣本相關(guān)系數(shù)的標(biāo)準(zhǔn)誤查t界值表,得P值第八頁,共四十頁,編輯于2023年,星期日
例6.1極譜法和碘量法測定水中溶解氧的含量,兩法的測得值是否有相關(guān)性?
兩法的測得值有相關(guān)(P<0.01)第九頁,共四十頁,編輯于2023年,星期日
第三節(jié)直線回歸方程目的:找出描述x與y依存關(guān)系的直線方程。Y為應(yīng)變量(dependentvariable)X為自變量(independentvariable)A為截距(intercept)b為回歸系數(shù)(regressioncoefficient)回歸系數(shù)b表示x每改變一個單位,y平均改變b個單位。第十頁,共四十頁,編輯于2023年,星期日Y=10x+5
=4.22+0.20x體重心臟橫徑第十一頁,共四十頁,編輯于2023年,星期日
設(shè)有n對x,y的觀察值,先在直角坐標(biāo)系中作散點(diǎn)圖,如果散點(diǎn)的分布呈直線趨勢,則可設(shè)法求出直線方程。通常用最小二乘法,依據(jù):各點(diǎn)與該直線的縱向距離的平方和為最小先由(6.3)式求得b,再由(6.4)式求得a,就得出直線回歸程。
第十二頁,共四十頁,編輯于2023年,星期日xy最小第十三頁,共四十頁,編輯于2023年,星期日回歸系數(shù)的顯著性檢驗(yàn)從樣本資料中算得的回歸系數(shù)b,也有抽樣誤差,因此需作顯著性檢驗(yàn),檢驗(yàn)其是否是回歸系數(shù)為零的總體中抽得的。
H0:β=0H1:β≠0。當(dāng)拒絕H0時,可認(rèn)為x與y間的直線回歸方程有統(tǒng)計學(xué)意義。顯著性檢驗(yàn)可有兩種方法:t檢驗(yàn)法和方差分析法。第十四頁,共四十頁,編輯于2023年,星期日
t檢驗(yàn)法:樣本回歸系數(shù)的標(biāo)準(zhǔn)誤剩余標(biāo)準(zhǔn)差估計誤差平方和第十五頁,共四十頁,編輯于2023年,星期日方差分析法:Y的總變異X和Y的線性關(guān)系引起的變異誤差引起的變異回歸平方和誤差平方和第十六頁,共四十頁,編輯于2023年,星期日總的自由度:n-1(總例數(shù)減1)回歸自由度:1(自變量個數(shù))誤差自由度:n-2(總的自由度減去回歸自由度)df1=1,df2=n-2查方差分析用的F界值表,得P值第十七頁,共四十頁,編輯于2023年,星期日例6.2
研究正常男性年齡與運(yùn)動后最大心率的關(guān)系,求直線回歸方程。第十八頁,共四十頁,編輯于2023年,星期日直線回歸相關(guān)分析的注意事項(xiàng):
1.相關(guān)分析只是以相關(guān)系數(shù)來描述兩個變量間線性相關(guān)的程度和方向,并不闡明事物間存在聯(lián)系的本質(zhì),也不是兩事物間存在聯(lián)系的證據(jù)。要闡明兩事物間的本質(zhì)聯(lián)系,必須憑專業(yè)知識從理論上加以論證。因此,把兩個毫無關(guān)系的事物放在一起作相關(guān)分析是毫無意義的。同樣,作回歸分析也要有實(shí)際意義。
第十九頁,共四十頁,編輯于2023年,星期日第二十頁,共四十頁,編輯于2023年,星期日直線回歸相關(guān)分析的注意事項(xiàng):在進(jìn)行直線回歸前應(yīng)繪制散點(diǎn)圖,有直線趨勢時,才適宜作直線回歸分析。散點(diǎn)圖還能提示資料有無異常點(diǎn)。3.直線回歸方程的適用范圍一般以自變量的取值范圍為限。第二十一頁,共四十頁,編輯于2023年,星期日直線回歸相關(guān)分析的注意事項(xiàng):
4.對同一組資料作回歸和相關(guān)分析,其相關(guān)系數(shù)和回歸系數(shù)的顯著性檢驗(yàn)結(jié)果完全相同。由于相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)果可直接查表,比較方便;而回歸系數(shù)的顯著性檢驗(yàn)計算復(fù)雜,故在實(shí)際應(yīng)用中常用相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)果代替回歸系數(shù)的顯著性檢驗(yàn)。第二十二頁,共四十頁,編輯于2023年,星期日直線回歸相關(guān)分析的注意事項(xiàng):5.在資料要求上:相關(guān)分析要求兩個變量服從雙變量正態(tài)分布?;貧w分析要求因變量服從正態(tài)分布,自變量可以是精確測量和嚴(yán)格控制的變量。如兩個變量服從雙變量正態(tài)分布,則可以作兩個回歸方程,用X推算Y,或用Y推算X。
第二十三頁,共四十頁,編輯于2023年,星期日第五節(jié)過定點(diǎn)的直線回歸醫(yī)學(xué)研究中在擬合直線時,除了要求與觀察點(diǎn)盡量接近外,還常常要求必須經(jīng)過某定點(diǎn)(m,n)。例如在光電比色、熒光分析、火焰光度測定以及同位素測定等實(shí)驗(yàn)方法繪制標(biāo)準(zhǔn)直線時就常有這樣的要求。此定點(diǎn)也可以是(m,0),(0,n)或(0,0)等,尤以(0,0)為最常見。計算公式和實(shí)例見第116頁。第二十四頁,共四十頁,編輯于2023年,星期日第六節(jié)直線相關(guān)與回歸的SAS程序
SAS的CORR過程可用于求變量之間的線性相關(guān)系數(shù)及偏相關(guān)系數(shù)。;
SAS的REG過程可用于各種線性回歸分析,包括多元回歸(見第七章),逐步回歸和最優(yōu)子集回歸(見第八章)等。第二十五頁,共四十頁,編輯于2023年,星期日第七章多元回歸及相關(guān)第一節(jié)多元線性回歸的基本概念
事物間的相互聯(lián)系往往是多方面的,在很多情況下對應(yīng)變量y發(fā)生影響的自變量往往不止一個。多元線性回歸的目的就是用一個多元線性回歸方程表示多個自變量和1個應(yīng)變量間的關(guān)系。:截距:標(biāo)準(zhǔn)偏回歸系數(shù)標(biāo)準(zhǔn)偏回歸系數(shù)表示其他自變量固定的情況下,xi改變一個單位,y平均改變bi個單位。第二十六頁,共四十頁,編輯于2023年,星期日多元線性回歸的應(yīng)用條件:1.獨(dú)立性:各觀察對象間相互獨(dú)立。2.線性:自變量與應(yīng)變量間的關(guān)系為線性。正態(tài)性:自變量取不同值時,應(yīng)變量的分布為正態(tài)。方差齊性:自變量取不同值時,應(yīng)變量的總體方差相等。當(dāng)不符合條件時,可對自變量進(jìn)行變換。如:第二十七頁,共四十頁,編輯于2023年,星期日第二節(jié)多元回歸的計算
1.計算截距和各偏回歸系數(shù)。2.多元回歸方程的顯著性檢驗(yàn):(1)整個方程的顯著性檢驗(yàn):用方差分析。(2)對各偏回歸系數(shù)的顯著性檢驗(yàn):F檢驗(yàn):去掉xj后回歸平方和的減少是否顯著。t檢驗(yàn):回歸系數(shù)除以它的標(biāo)準(zhǔn)誤。第二十八頁,共四十頁,編輯于2023年,星期日第三節(jié)標(biāo)準(zhǔn)偏回歸系數(shù)
要比較各個自變量對于應(yīng)變量的作用大小,不能用偏回歸系數(shù),因?yàn)楦髌貧w系數(shù)的單位不同。必須把偏回歸系數(shù)標(biāo)準(zhǔn)化,化成沒有單位的標(biāo)準(zhǔn)偏回歸系數(shù),公式為:消除不同單位的影響后,標(biāo)準(zhǔn)偏回歸系數(shù)的絕對值越大,該自變量對于應(yīng)變量的作用越大,但該差別是否有統(tǒng)計意義,也必須經(jīng)過檢驗(yàn)。第二十九頁,共四十頁,編輯于2023年,星期日第四節(jié)偏相關(guān)系數(shù)
相關(guān)系數(shù)r應(yīng)稱為簡單相關(guān)系數(shù),因?yàn)樗豢紤]了x1和
x2之間的相互影響,而未注意到其他變量對x1和x2可能有的影響。事實(shí)上,客觀事物間的關(guān)系是錯綜復(fù)雜的,變量之間的相互影響也往往是多種多樣的。例如,當(dāng)存在x1,x2,x3三個變量時,如果我們不考慮x3
,而只對x1,x2計算其相關(guān)系數(shù)r,則這r的大小往往不反映客觀真實(shí)情況;如r很大,可能意味著x1,x2之間的關(guān)系很密切,但也可能實(shí)際上x1,x2之間并無什么關(guān)系,而x3卻對x1,x2能同時發(fā)揮很大的影響,我們所看到的較大r值不過是x3對x1的作用和x3對x2的作用的客觀表現(xiàn)而已。反之,x1,x2之間算得的一個小r值,也不一定就意味著x1,x2之間的關(guān)系確實(shí)薄弱,也有可能x1,x2之間雖有關(guān)聯(lián),但此關(guān)聯(lián)性卻被x3對它們的作用所抵消,以致被掩蓋了。第三十頁,共四十頁,編輯于2023年,星期日因此在較單純的情況下,如果x1,x2與周圍其他變量沒什么關(guān)系的話,則用簡單相關(guān)系數(shù)來表示x1,x2之間的相關(guān)性是可行的;如果存在著對x1,x2關(guān)系密切的其他變量,則r就不能確切地表示x1,x2之間的真實(shí)關(guān)系,這就需要用到偏相關(guān)系數(shù)。所謂偏相關(guān)系數(shù)指的是當(dāng)把x1,x2以外的其他變量對它們的影響都扣除掉(或平衡掉)以后,x1,x2之間的相關(guān)系數(shù)。表示把x3的作用扣除掉以后x1
和x2的偏相關(guān)系數(shù)表示把x3和x4的作用扣除掉以后x1
和x2的偏相關(guān)系數(shù)偏相關(guān)系數(shù)可從簡單相關(guān)系數(shù)計算得到,也要作顯著性檢驗(yàn)。第三十一頁,共四十頁,編輯于2023年,星期日第五節(jié)多元相關(guān)系數(shù)及決定系數(shù)在多元回歸中可算得一個多元相關(guān)系數(shù),用R表示,它是y與之間的簡單相關(guān)系數(shù),也可理解為y與自變量組合之間的相關(guān)系數(shù)。
R2稱為多元回歸方程的決定系數(shù),即y的變異中可由方程中的自變量組合所決定的部分。
R2值介于0~1之間,R2越接近1,說明回歸方程的效果越好。R2越接近0,說明回歸方程的效果越差,即y的變異中只有很少一部分能由方程中的自變量組合所決定,即使該方程有顯著意義,也不能認(rèn)為該方程的效果可以令人滿意,啟示我們還應(yīng)進(jìn)一步尋找其他對y可能有顯著作用的變量或變量組合。R2也可用于檢驗(yàn)多元回歸方程的顯著性。第三十二頁,共四十頁,編輯于2023年,星期日第六節(jié)多元回歸在醫(yī)學(xué)中的應(yīng)用
1.一。根據(jù)較易測得的自變量推算不易測得的應(yīng)變量如:用身高,體重推算體表面積。二。確定各自變量xi取不同值時,y的正常值范圍如:建立一個由身高,體重推算心象面積的多元回歸方程,利用此方程就可分別求出身高,體重取不同值的組合時,心象面積的正常值范圍。三。預(yù)測預(yù)報如:建立心肌梗塞預(yù)報方程或腦卒中預(yù)報方程。四。回顧推斷如:推斷死亡時間。
第三十三頁,共四十頁,編輯于2023年,星期日第七節(jié)多元回歸及相關(guān)的SAS程序
求偏相關(guān)系數(shù)用CORR過程。求多元回歸及相關(guān)用REG過程。第三十四頁,共四十頁,編輯于2023年,星期日第八章逐步回歸及最優(yōu)子集回歸第一節(jié)逐步回歸分析一.逐步回歸分析的基本概念逐步回歸分析的目的是建立“最優(yōu)”回歸方程。
“最優(yōu)”回歸方程是指包含所有對y有顯著作用的自變量,而不包含對y作用不顯著的自變量的方程。第三十五頁,共四十頁,編輯于2023年,星期日二.逐步回歸分析的計算方法在供選的自變量Xi中,按其對y的作用大小,由大到小地把自變量逐個引入方程,每引入一個自變量就對它作顯著性檢驗(yàn),顯著時才引入,而當(dāng)新的自變量進(jìn)入方程后,對方程中原有的自變量也要作檢驗(yàn),并把作用最小且退化為不顯著的自變量逐個剔出方程。因此,逐步回歸的每一步(引入一個變量或剔除一個變量都稱為一步)前后都要作顯著性檢驗(yàn),以保證每次引入新變量前方程中只包含作用顯著的自變量。這樣一步步進(jìn)行下去,直至方程中所含自變量都顯著而又沒有新的作用顯著的自變量可引入方程為止。第三十六頁,共四十頁,編輯于2023年,星期日逐步回歸分析方法示意:yx1、x2、x3、……
xmxjXj是否顯著結(jié)束引入方程方程內(nèi)自變量中選擇對y作用最小的xi剔除方程外:作用最大的自變量:第三十七頁,共四十頁,編輯于2023年,星期日第三節(jié)最優(yōu)子集回歸回歸方程優(yōu)劣的評價:(P為選入方程的自變量數(shù))1.剩余標(biāo)準(zhǔn)差最?。?.變異系數(shù)最?。?.復(fù)相關(guān)系數(shù)最大:4.校
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社工與黨支部合作協(xié)議
- 借用押金合同范本
- 加工砂石合同范本
- 知識版權(quán)問題如何在市場中正確解決糾紛
- 磁頭生產(chǎn)流程中的品質(zhì)監(jiān)控與優(yōu)化
- 前期物業(yè)委托服務(wù)合同范本
- 醫(yī)院護(hù)士聘用合同范本
- 口罩出口合同范例
- 農(nóng)莊基地出租合同范本
- 電費(fèi)電價知識培訓(xùn)課件
- 課件-DeepSeek從入門到精通
- 心電監(jiān)護(hù)儀的操作及注意事項(xiàng) 課件
- GB/T 718-2024鑄造用生鐵
- 細(xì)胞生物學(xué)(全套1047張課件)
- 大班數(shù)學(xué)活動有趣的鐘表
- 剪映入門教程PPT
- 外研版一起五年級英語下冊全冊教案教學(xué)設(shè)計版
- 回字格+米字格練字模版(A4最大利用率)
- 幼小銜接--相鄰數(shù)PPT課件
- 橡膠履帶力學(xué)分析及優(yōu)化設(shè)計
- CFM56-7發(fā)動機(jī)滑油系統(tǒng)及其常見故障分析(共41頁)
評論
0/150
提交評論