




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第三節(jié)直線相關(guān)第二節(jié)直線回歸第一節(jié)回歸和相關(guān)的概念第七章直線回歸與相關(guān)一、變量的關(guān)系二、相關(guān)變量三、回歸分析和相關(guān)分析第一節(jié)回歸和相關(guān)的概念函數(shù)關(guān)系一、變量的關(guān)系xy是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,當(dāng)變量x取某個數(shù)值時,
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),則x稱為自變量,y稱為因變量各觀測點落在一條線上相關(guān)關(guān)系xy變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個變量的取值不能由另一個變量唯一確定當(dāng)變量x取某個值時,變量y的取值可能有幾個各觀測點分布在直線周圍黃牛的體長與體重的關(guān)系⑴、相關(guān)關(guān)系的類型相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)⑵、相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)7一個變量的變化受另一個或多個變量的影響仔豬的生長速度受遺傳特性、營養(yǎng)水平、飼養(yǎng)管理條件等因素的影響;子代的身高受親本身高的影響相關(guān)變量存在相關(guān)關(guān)系的變量稱為相關(guān)變量。相關(guān)變量間的關(guān)系分為兩類因果關(guān)系平行關(guān)系二、相關(guān)變量相關(guān)變量存在相關(guān)關(guān)系的變量稱為相關(guān)變量。相關(guān)變量間的關(guān)系分為兩類因果關(guān)系平行關(guān)系二、相關(guān)變量兩個變量之間互為因果或共同受到另外因素的影響人的身高和體重之間的關(guān)系;兄弟姐妹身高之間的關(guān)系一元回歸分析研究“一因一果”,即一個自變量與一個因變量的回歸分析多元回歸分析研究“多因一果”,即多個自變量與一個因變量的回歸分析回歸分析研究變量之間的因果關(guān)系以計算回歸方程為基礎(chǔ)的分析方法x為自變量(表示原因的變量)y為因變量或依變量(表示結(jié)果的變量)三、回歸分析和相關(guān)分析回歸分析的任務(wù)揭示因果關(guān)系的變量間的聯(lián)系形式建立它們之間的回歸方程利用所建立的回歸方程,由自變量(原因)來預(yù)測因變量(結(jié)果)簡單相關(guān)分析對兩個變量間的直線關(guān)系進(jìn)行相關(guān)分析偏相關(guān)分析研究其余變量保持不變的情況下兩個變量間的線性相關(guān)相關(guān)分析以計算相關(guān)系數(shù)為基礎(chǔ)的統(tǒng)計分析方法研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系x和y都受誤差的影響,無自變量和因變量的區(qū)別變量間的關(guān)系及分析方法隨機關(guān)系(無關(guān))三、預(yù)測及應(yīng)用二、回歸方程的顯著性檢驗一、直線回歸方程的建立第二節(jié)直線回歸一、直線回歸方程的建立對于兩個相關(guān)變量,一個變量用x表示,另一個變量用y表示,如果通過試驗或調(diào)查獲得兩個變量的n對觀測值:
(x1,y1),(x2,y2),……,(xn,yn)如何知道x和y間的變化趨勢?
㈠、散點圖直觀地、定性地表示了兩個變量之間的關(guān)系通過散點圖可初步判斷兩個變量是否相關(guān);若相關(guān),是直線型還是曲線型相關(guān)兩個變量間直線關(guān)系的性質(zhì)(是正相關(guān)還是負(fù)相關(guān))和相關(guān)程度(是密切還是不密切)
㈡、直線回歸的數(shù)學(xué)模型變量y與x內(nèi)在聯(lián)系,可用一條線性方程表示:y=+x因變量y的實際觀測值總是帶有隨機誤差因變量y的實際觀測值yi記為yi
=+xi+i
(i=1,2,…,n)回歸模型:描述因變量y如何依賴于自變量x和誤差項的方程模型參數(shù)相互獨立,服從N(0,2)誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。對于一個給定的x值,y的期望值為:E(y)=+x誤差項ε是一個服從正態(tài)分布的隨機變量,且相互獨立。即ε~N(0,σ2)基本假定回歸方程:描述y的期望值如何依賴于x的方程簡單線性回歸方程的形式如下E(y)=+x方程的圖示是一條直線,因此也稱為直線回歸方程是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值
㈢、回歸方程1、估計(經(jīng)驗)的回歸方程總體回歸參數(shù)和是未知的,必需利用樣本數(shù)據(jù)去估計用樣本統(tǒng)計量a和b代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程簡單線性回歸中估計的回歸方程為a叫做樣本回歸截距,是回歸直線與y軸交點的縱坐標(biāo),當(dāng)x=0時,y=ab叫做樣本回歸系數(shù),表示x改變一個單位,y平均改變的數(shù)量;b的符號反映了x影響y的性質(zhì),b的絕對值大小反映了x影響y的程度y叫做回歸估計值,是當(dāng)x取某一個值時,y值平均數(shù)+x的估計值2、參數(shù)和
的估計用最小二乘法擬合的直線與實際數(shù)據(jù)的誤差比其他任何直線都小通過計算因變量的觀察值與估計值之間的離差平方和達(dá)到最小,來求得a和b的方法。即最小二乘法(圖示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)^ei=yi-yi}據(jù)微積分的極值原理,Q(a,b)對a,b的一階偏導(dǎo)數(shù)等于0,即計算公式【例】在四川白鵝的生產(chǎn)性能研究中,得到如下一組關(guān)于雛鵝重(g)與70日齡重(g)的數(shù)據(jù),試建立70日齡重(y)與雛鵝重(x)的直線回歸方程。已知:x2=118112,x=1182
y=32650,xy=32526101、作散點圖以雛鵝重(x)為橫坐標(biāo),70日齡重(y)為縱坐標(biāo)作散點圖2、計算回歸截距a,回歸系數(shù)b,建立直線回歸方程x2=118112,x=1182
y=32650,xy=3252610y=582.1816+21.7122x二、回歸方程的顯著性檢驗若x和y變量間并不存在直線關(guān)系,但由n對觀測值(xi,yi)也可以根據(jù)上面介紹的方法求得一個回歸方程
y=a+bx顯然,這樣的回歸方程所反應(yīng)的兩個變量間的直線關(guān)系是不真實的如何判斷直線回歸方程所反應(yīng)的兩個變量間的直線關(guān)系的真實性?
1、離差平方和的分解因變量y
變異來源于兩個方面:由自變量x的取值不同造成的隨機誤差等其他因素造成的對一個具體的觀測值來說,變異大小可以通過該實際觀測值與其均值之差y-y
來表示三個平方和的關(guān)系兩邊平方后求和dfy
=n-1,dfR=1自變量個數(shù),dfr=n–2SSy=SSR+SSr
dfy=dfR+dfr總平方和SSy{回歸平方和SSR{殘差平方和SSr{總平方和:SSy=(yi
-y)2反映y的總變異程度,即因變量的n
個觀察值與其均值的總離差回歸平方和:SSR=(yi
-y)2反映自變量x
的變化對因變量y
取值變化的影響,也稱為可解釋的平方和殘差平方和:SSr=(yi
-y)2反映的是除x
以外的其他因素對y
取值的影響,也稱為不可解釋的平方和或剩余平方和三個平方和的意義2、線性關(guān)系的檢驗——F檢驗檢驗自變量和因變量之間的線性關(guān)系是否顯著將回歸均方(SSR/dfR)同殘差(SSr/dfr)加以比較,用F檢驗來分析差別是否顯著顯著兩個變量之間存在線性關(guān)系不顯著兩個變量之間不存在線性關(guān)系檢驗的步驟提出假設(shè)H0:線性關(guān)系不顯著計算檢驗統(tǒng)計量F確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F
作出決策FF,拒絕H0F<F,接受H0【續(xù)前例】四川白鵝70日齡重與雛鵝重回歸關(guān)系方差分析表6-1四川白鵝70日齡重與雛鵝重回歸關(guān)系方差分析
F=213.81>F0.01(1,10)=10.04,P<0.01,表明四川白鵝70日齡重與雛鵝重間存在極顯著的直線關(guān)系。檢驗x與y之間是否具有線性關(guān)系理論基礎(chǔ)是回歸系數(shù)b的抽樣分布在一元線性回歸中,等價于回歸方程的顯著性檢驗3、回歸系數(shù)的顯著性檢驗——t檢驗樣本統(tǒng)計量b的分布b是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布b的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:E(b)=標(biāo)準(zhǔn)差:由于未知,需用其估計量Sy來代替得到的估計的標(biāo)準(zhǔn)差估計標(biāo)準(zhǔn)誤差Sy實際觀察值與回歸估計值離差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況從另一個角度說明了回歸直線的擬合程度計算公式b的抽樣分布樣本統(tǒng)計量b的分布和計算E(b)=檢驗的步驟提出假設(shè)H0:
=0(沒有線性關(guān)系)H1:
0(有線性關(guān)系)計算檢驗的統(tǒng)計量確定顯著性水平,并進(jìn)行決策t>t,拒絕H0t<t,接受H0【續(xù)前例】對四川白鵝70日齡重與雛鵝重回歸系數(shù)進(jìn)行顯著性檢驗提出假設(shè)H0:=0四川白鵝70日齡重與雛鵝重之間無線性關(guān)系H1:
0四川白鵝70日齡重與雛鵝重之間有線性關(guān)系計算檢驗的統(tǒng)計量t=b/Sb=21.7122/1.4849=14.62df=n-2=12-2=10,t0.05(10)=2.228,t0.01(10)=3.169
t=14.62>t0.01(10),P<0.01,表明回歸系數(shù)b=21.7122是極顯著的,即四川白鵝70日齡重與雛鵝重間存在極顯著的直線關(guān)系。利用直線回歸方程進(jìn)行預(yù)測或控制,一般只適用于原來研究的范圍,不能隨意把范圍擴大。在研究范圍內(nèi)兩變量是直線關(guān)系,并不能保證在這研究范圍之外仍然是直線關(guān)系若需要擴大預(yù)測和控制范圍,則要有充分的理論依據(jù)或進(jìn)一步的實驗依據(jù)利用直線回歸方程進(jìn)行預(yù)測或控制,一般只能內(nèi)推,不要輕易外延三、預(yù)測及應(yīng)用五、應(yīng)用直線回歸與相關(guān)的注意事項四、相關(guān)系數(shù)與回歸系數(shù)的關(guān)系三、相關(guān)系數(shù)的顯著性檢驗二、相關(guān)系數(shù)的計算一、決定系數(shù)和相關(guān)系數(shù)第三節(jié)直線相關(guān)相關(guān)分析的基本任務(wù):根據(jù)x、y的觀測值,計算其相關(guān)程度和并進(jìn)行顯著性檢驗一、決定系數(shù)和相關(guān)系數(shù)
直線回歸效果的好壞取決于回歸平方和(y-y)2占總平方和(y-y)2的比例大小。比例越大,直線回歸效果越好,反之則差1、決定系數(shù)比值叫做x對y的決定系數(shù),記為r2,即:決定系數(shù)的大小表示了回歸方程估測可靠程度的高低,或者說反映了回歸直線的擬合度高低取值范圍在[0,1]之間r2
1,說明回歸方程擬合的越好r20,說明回歸方程擬合的越差2、相關(guān)系數(shù)(coefficientofcorrelation)兩個變量之間線性相關(guān)程度稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r計算:相關(guān)系數(shù)取值及其意義r
的取值范圍是[-1,1]|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)
r=0,不存在線性相關(guān)關(guān)系相關(guān)-1r<0,為負(fù)相關(guān)0<r1,為正相關(guān)|r|1表示關(guān)系越密切|r|0表示關(guān)系越不密切相關(guān)系數(shù)取值及其意義(圖示)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加【例】計算10只綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)。解:x2=51904,x=720y2=46818,y=680xy=49123二、相關(guān)系數(shù)的計算三、相關(guān)系數(shù)的顯著性檢驗檢驗兩個變量之間是否存在線性相關(guān)關(guān)系等價于對回歸系數(shù)b的檢驗采用t檢驗或F檢驗均可檢驗步驟提出假設(shè)H0:H1:0計算檢驗的統(tǒng)計量確定顯著性水平,并作出決策若t>t,拒絕H0
若t<t,接受H0t檢驗的公式
Sr相關(guān)系數(shù)標(biāo)準(zhǔn)誤【續(xù)前例】對10只綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)進(jìn)行顯著性檢驗提出假設(shè)H0:H1:0計算檢驗的統(tǒng)計量df=n-2=10-2=8,t0.05(8)=2.306,t0.01(8)=3.355t=4.5160>t0.01(8)=3.355,拒絕H0,綿羊的胸圍(cm)和體重(kg)的相關(guān)系數(shù)極顯著四、相關(guān)系數(shù)與回歸系數(shù)的關(guān)系r2=(r)2y=a+bx,相關(guān)系數(shù)b研究對象都是呈直線關(guān)系的相關(guān)變量直線回歸分析將二個相關(guān)變量區(qū)分為自變量和因變量,側(cè)重于尋求它們之間的聯(lián)系形式——直線回歸方程相關(guān)分析不區(qū)分自變量和因變量,側(cè)重于揭示變量之間的聯(lián)系程度和性質(zhì)——計算出相關(guān)系數(shù)實際進(jìn)行直線回歸分析時,可用相關(guān)系數(shù)顯著性檢驗代替直線回歸關(guān)系顯著性檢驗兩種分析都是針對y與x是否存在直線關(guān)系二者的檢驗是等價的相關(guān)系數(shù)顯著,回歸系數(shù)亦顯著相關(guān)系數(shù)不顯著,回歸系數(shù)也必然不顯著直線回歸分析和相關(guān)分析是處理變量間關(guān)系的數(shù)學(xué)方法將這些方法應(yīng)用于生物科學(xué)研究時要考慮到生物本身的客觀實際情況變量間是否本身存在相關(guān)關(guān)系其余變量盡量保持一致觀測值要盡可能的多外推要謹(jǐn)慎正確理解回歸或相關(guān)顯著與否的含義顯著的回歸方程并不一定具有實踐上意義五、應(yīng)用直線回歸與相關(guān)的注意事項同一變量往往受到許多其它變量的影響研究兩個變量間關(guān)系時,要求其余變量應(yīng)盡量保持在同一水平研究人的身高和胸圍之間的關(guān)系體重固定,身高,胸圍體重變化,結(jié)果就會變化變量間是否本身存在相關(guān)關(guān)系其余變量盡量保持一致觀測值要盡可能的多外推要謹(jǐn)慎正確理解回歸或相關(guān)顯著與否的含義顯著的回歸方程并不一定具有實踐上意義五、應(yīng)用直線回歸與相關(guān)的注意事項兩個變量成對觀測值應(yīng)盡可能多一些可提高分析的精確性,一般至少有5對以上的觀測值變量x的取值范圍要盡可能大一些容易發(fā)現(xiàn)兩個變量間的變化關(guān)系變量間是否本身存在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZSA 231-2024 氧化鎵單晶片X 射線雙晶搖擺曲線半高寬測試方法
- T-ZMDS 10022-2024 光學(xué)脊柱測量及姿態(tài)評估設(shè)備
- 二零二五年度名義購房代持合同中的房產(chǎn)繼承與轉(zhuǎn)讓安排
- 2025年度高品質(zhì)車位租賃與社區(qū)設(shè)施管理合同
- 二零二五年度安全生產(chǎn)評價資質(zhì)借用服務(wù)合同
- 2025年度高速公路監(jiān)控系統(tǒng)維保服務(wù)協(xié)議雙聯(lián)
- 二零二五年度解除勞動合同通知書及員工離職后商業(yè)保險權(quán)益處理及終止協(xié)議
- 2025年度電力系統(tǒng)設(shè)備租賃合同模板
- 2025年美業(yè)美容儀器銷售代表入職合同
- 二零二五年度淘寶平臺商家入駐信息保密協(xié)議
- 公園棧道棧橋施工方案
- 不規(guī)則抗體篩查與鑒定
- 中國銀行海爾多聯(lián)機方案書
- 涂布機初級操作技術(shù)與維修培訓(xùn)課件
- GB/T 8417-2003燈光信號顏色
- GB/T 7984-2001輸送帶具有橡膠或塑料覆蓋層的普通用途織物芯輸送帶
- GB/T 7631.10-2013潤滑劑、工業(yè)用油和有關(guān)產(chǎn)品(L類)的分類第10部分:T組(渦輪機)
- GB/T 7324-2010通用鋰基潤滑脂
- GB/T 28114-2011鎂質(zhì)強化瓷器
- GB/T 15566.1-2020公共信息導(dǎo)向系統(tǒng)設(shè)置原則與要求第1部分:總則
- 三菱電梯LEHY-II、LEGY緊急救援的盤車裝置切換說明
評論
0/150
提交評論