版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章簡(jiǎn)單相關(guān)與回歸
直線回歸
直線相關(guān)
基本概念
注意事項(xiàng)變量間的關(guān)系一般可以分為兩類:第一節(jié)基本概念
變量間存在完全確定性的關(guān)系可以用精確的數(shù)學(xué)表達(dá)式(即函數(shù))來(lái)表示這種變量之間的關(guān)系是確定性的,只要知道了其中1個(gè)或2個(gè)變量的值就可以精確地計(jì)算出另一個(gè)變量的值,這類變量間的關(guān)系稱為函數(shù)關(guān)系
變量間存在非確定性的關(guān)系不能用精確的數(shù)學(xué)表達(dá)式來(lái)表示人的身高與體重的關(guān)系
仔豬初生重與斷奶重的關(guān)系
豬瘦肉率與背膘厚、眼肌面積、胴體長(zhǎng)等的關(guān)系
這些變量間都存在著十分密切的關(guān)系,但不能由一個(gè)或幾個(gè)變量的值精確地求出另一個(gè)變量的值變量間的這種不確定的關(guān)系稱為相關(guān)關(guān)系
存在相關(guān)關(guān)系的變量稱為相關(guān)變量
相關(guān)關(guān)系一般又可以分為兩種:平行關(guān)系
兩個(gè)或兩個(gè)以上變量之間共同受到另外因素的影響因果關(guān)系
一個(gè)變量的變化受另一個(gè)或幾個(gè)變量的影響人的身高和體重之間的關(guān)系兄弟身高之間的關(guān)系營(yíng)養(yǎng)因素遺傳因素
仔豬的生長(zhǎng)速度遺傳、營(yíng)養(yǎng)、飼養(yǎng)管理等因素子女的身高父親身高、母親身高等因素采用相關(guān)分析(correlationanalysis)研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為簡(jiǎn)單相關(guān)分析(直線相關(guān)分析)
研究一個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析、多元相關(guān)分析
研究在其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)分析
相關(guān)分析只能研究?jī)蓚€(gè)變量之間相關(guān)的程度和性質(zhì)或一個(gè)變量與多個(gè)變量之間相關(guān)的程度和性質(zhì)
采用回歸分析(regressionanalysis)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系研究“一因一果”,即一個(gè)自變量與一個(gè)依變量的回歸分析稱為一元回歸分析
研究“多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析
回歸分析的任務(wù)是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程利用所建立的回歸方程,由自變量(原因)來(lái)預(yù)測(cè)、控制依變量(結(jié)果)第二節(jié)直線相關(guān)1.相關(guān)系數(shù)的確定對(duì)于某一個(gè)體來(lái)說(shuō),如果我們同時(shí)觀測(cè)兩個(gè)性狀,那么就可以得到兩個(gè)變量,其中一個(gè)變量記作x,另一個(gè)變量記作y觀測(cè)n個(gè)個(gè)體,就得到n對(duì)(x,y)在一個(gè)平面直角坐標(biāo)系中,將每對(duì)(x,y)描點(diǎn),作出散點(diǎn)圖,觀察這些點(diǎn)的位置、排列和趨向如果這些點(diǎn)排列越有規(guī)律
則說(shuō)明這兩個(gè)變量的關(guān)系越緊密,即兩個(gè)性狀的關(guān)系越密切
這種關(guān)系的密切程度和性質(zhì)可以用一個(gè)數(shù)值來(lái)表示,這個(gè)數(shù)值就是統(tǒng)計(jì)學(xué)上的“相關(guān)系數(shù)”如果這些點(diǎn)排列越散亂
則說(shuō)明這兩個(gè)變量的關(guān)系越不緊密,即兩個(gè)性狀的關(guān)系越不密切
在平面直角坐標(biāo)系中,描上n個(gè)(x,y)點(diǎn),并找出這些點(diǎn)的中心位置(,),將坐標(biāo)系平移到以(,)為新原點(diǎn)的位置上
分布在1、3象限內(nèi)的點(diǎn)的坐標(biāo)乘積分布在2、4象限內(nèi)的點(diǎn)的坐標(biāo)乘積有3種情況:表示1、3象限內(nèi)的點(diǎn)多,2、4象限內(nèi)的點(diǎn)少
表示2、4象限內(nèi)的點(diǎn)多,1、3象限內(nèi)的點(diǎn)少
表示這些點(diǎn)均勻地分布在四個(gè)象限內(nèi)
稱為離均差乘積和,簡(jiǎn)稱乘積和,用SPxy表示乘積和的絕對(duì)值越大,說(shuō)明兩個(gè)變量間的關(guān)系越密切,因此我們可以用乘積和的大小來(lái)表示兩變量關(guān)系的密切程度
可以用乘積和的正負(fù)來(lái)表示兩變量關(guān)系的性質(zhì):乘積和為正說(shuō)明兩變量呈正相關(guān),乘積和為負(fù)說(shuō)明兩變量間呈負(fù)相關(guān)
用乘積和來(lái)衡量?jī)蓚€(gè)變量之間的關(guān)系不是很理想對(duì)于總體來(lái)說(shuō):對(duì)于個(gè)體來(lái)說(shuō):如果我們先將每個(gè)變量進(jìn)行標(biāo)準(zhǔn)化,轉(zhuǎn)化成沒(méi)有單位的相對(duì)數(shù),同時(shí)進(jìn)行相乘求和再平均就比較合理了2.相關(guān)系數(shù)的性質(zhì)(1)當(dāng)r>0時(shí)表示兩個(gè)變量呈正相關(guān),r=1時(shí)表示兩個(gè)變量呈完全正相關(guān)
當(dāng)r<0時(shí)表示兩個(gè)變量呈負(fù)相關(guān),r=-1時(shí)表示兩個(gè)變量呈完全負(fù)相關(guān)當(dāng)r=0或趨近于0時(shí),表示兩變量不相關(guān),又稱為零相關(guān)
(2)r的取值范圍在[-1,1]r的絕對(duì)值越大,表示x、y兩變量的相關(guān)性越強(qiáng)r的絕對(duì)值越小,表示x、y兩變量的相關(guān)性越弱
3.相關(guān)系數(shù)的計(jì)算相關(guān)系數(shù)的公式:但在具體計(jì)算時(shí),一般將其轉(zhuǎn)化為:例1:試計(jì)算豬宰活重與屠宰率的相關(guān)系數(shù)宰前活重x(kg)808582909510087屠宰率y(%)697068727378704.相關(guān)系數(shù)的顯著性檢驗(yàn)(1)提出假設(shè)(2)計(jì)算t值H0:ρ=0(兩變量不相關(guān))HA:ρ≠0(兩變量相關(guān))相關(guān)系數(shù)標(biāo)準(zhǔn)誤(3)查表,推斷r2為決定系數(shù)例2:對(duì)例1中的相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)(1)提出假設(shè)(2)計(jì)算t值(3)查表,推斷根據(jù)df=n-2=5,查表:
豬宰前活重與屠宰率存在極顯著的正相關(guān)關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn)還有一種更簡(jiǎn)單的方法,即查表法
例1中,我們根據(jù)df=n-2=5查r的臨界值表:
r0.05=0.754,r0.01=0.874r=0.9502>r0.01
r達(dá)極顯著水平
與t-檢驗(yàn)法結(jié)果相同
一般可將r值分為以下幾個(gè)等級(jí)
完全負(fù)相關(guān)負(fù)強(qiáng)相關(guān)負(fù)中等相關(guān)負(fù)弱相關(guān)零相關(guān)完全正相關(guān)正強(qiáng)相關(guān)正中等相關(guān)正弱相關(guān)5.相關(guān)系數(shù)的置信區(qū)間求總體相關(guān)系數(shù)ρ的置信區(qū)間,必須了解r的分布
當(dāng)ρ=0時(shí),r近似地服從正態(tài)分布在ρ≠0的總體中,r的抽樣分布并不一定服從t分布或正態(tài)分布因此在估計(jì)ρ的置信區(qū)間時(shí),應(yīng)對(duì)r進(jìn)行z轉(zhuǎn)換,則z服從正態(tài)分布
根據(jù)計(jì)算μZ的置信區(qū)間:[LZ1,LZ2]然后將這一置信區(qū)間反轉(zhuǎn)換成ρ的置信區(qū)間[L1,L2]具體步驟如下:(1)將r轉(zhuǎn)換成z(2)計(jì)算z的標(biāo)準(zhǔn)誤(3)計(jì)算z的置信區(qū)間
(4)將z的置信區(qū)間轉(zhuǎn)換成ρ的置信區(qū)間
例3:求例1中相關(guān)系數(shù)的置信區(qū)間(1)將r轉(zhuǎn)換成z(2)計(jì)算z的標(biāo)準(zhǔn)誤(3)計(jì)算z的置信區(qū)間
95%:[0.854,2.814]0.9599%:[0.544,3.214]0.99(4)將z的置信區(qū)間轉(zhuǎn)換成ρ的置信區(qū)間
95%:99%:相關(guān)系數(shù)的置信區(qū)間是偏態(tài)的6.等級(jí)相關(guān)在實(shí)踐中,有時(shí)我們會(huì)遇到等級(jí)或名次的資料,這類資料就只能用等級(jí)相關(guān)法來(lái)求相關(guān)系數(shù)(1)將x和y排成相應(yīng)的名次或等級(jí),當(dāng)兩個(gè)x或兩個(gè)y的名次相同時(shí),求平均名次或平均等級(jí)(2)求x與y差(d)(3)求x與y的等級(jí)相關(guān)系數(shù),查r臨界值表檢驗(yàn)其是否顯著等級(jí)相關(guān)系數(shù)計(jì)算步驟:例3:經(jīng)調(diào)查,獲得一個(gè)村的養(yǎng)殖戶所生產(chǎn)的雞蛋量與所獲純利的名次資料如下,試計(jì)算相關(guān)系數(shù)。戶號(hào)123456789101112蛋產(chǎn)量12.52.54567.57.5910.510.512純利1.51.5435.575.5108.512118.5差-0.51-1.51-0.5-12-2.50.5-1.5-0.53.5解:(1)計(jì)算相關(guān)系數(shù):(2)相關(guān)系數(shù)的顯著性檢驗(yàn):根據(jù)df
=n-2=10查得:
雞蛋產(chǎn)量與利潤(rùn)之間存在極顯著的相關(guān)關(guān)系第三節(jié)直線回歸一個(gè)變量(或性狀)是因,用x表示,另一變量是果,用y表示,可以采用回歸分析來(lái)研究2個(gè)變量間的關(guān)系兩變量間雖然沒(méi)有因果關(guān)系,但一個(gè)性狀容易測(cè)定,用x表示,另一性狀難以測(cè)定或測(cè)定具有破壞性,用y表示,且兩變量有較好的相關(guān)性
我們希望通過(guò)易測(cè)性狀(x)來(lái)間接測(cè)定難測(cè)性狀(y),此時(shí)也可以采用回歸分析來(lái)進(jìn)行研究研究x、y變量間因果依存關(guān)系的統(tǒng)計(jì)分析方法就稱為回歸分析
回歸分析表現(xiàn)的是兩變量間比較嚴(yán)格的從屬關(guān)系,是把非確定性的關(guān)系用嚴(yán)格的函數(shù)關(guān)系來(lái)進(jìn)行研究1.直線回歸方程的配合x與y的直線回歸方程一般表示為:y的估計(jì)值
直線在y軸上的截距
回歸系數(shù)把(x,y)在平面直角坐標(biāo)系內(nèi)作散點(diǎn)圖,如果這些散點(diǎn)越趨向一條直線,就說(shuō)明直線回歸方程越理想選取什么樣的a和b才能最好地反映x和y之間的關(guān)系呢?根據(jù)最小二乘法,選取的a、b值應(yīng)使觀測(cè)值y與回歸估計(jì)值的偏差平方和最小,即:最小根據(jù)微積分學(xué)中的極值原理,令Q對(duì)a、b的一階偏導(dǎo)數(shù)等于0,即:整理可得關(guān)于a、b的正規(guī)方程組:解方程,得:將所求得的a,b直接代入,就可得到回歸方程將a式代入,得:說(shuō)明回歸直線必經(jīng)過(guò)其中心點(diǎn)2.直線回歸方程的計(jì)算和作圖2.1回歸方程的計(jì)算例1現(xiàn)有7頭長(zhǎng)白豬宰前活重與屠宰率的數(shù)據(jù),試建立屠宰率對(duì)宰前活重的回歸方程宰前體重x(kg)808582909510087屠宰率y(%)69706872737870計(jì)算一級(jí)數(shù)據(jù)將一級(jí)數(shù)據(jù)代入計(jì)算公式,得:屠宰率對(duì)宰前活重的回歸方程為:回歸直線必定經(jīng)過(guò)中心點(diǎn),即(88.4,71.4)回歸方程表示每增加1㎏宰前活重,屠宰率平均可增加0.4472%2.2直線的作圖兩點(diǎn)決定一條直線,因此我們只要知道回歸方程的任意2個(gè)點(diǎn)值,就可以在平面直角坐標(biāo)系中畫出相應(yīng)的回歸直線將最小的x=80和最大的x=100代入回歸方程,得到兩個(gè)點(diǎn):(80,67.66),(100,76.60)回歸直線僅僅是有兩個(gè)端點(diǎn)的實(shí)線段,而不是可以無(wú)限延長(zhǎng)的直線
對(duì)直線適度作一些外延是可以的,但不能外延得太長(zhǎng)3.直線回歸方程的估計(jì)標(biāo)準(zhǔn)誤3.1總平方和的剖分變量y的變異程度的大小可用y的離均差平方和來(lái)表示:又稱為總平方和,即:總平方和剖分為2個(gè)部分:其中:離回歸平方和用Q表示,是建立直線回歸方程的依據(jù)反映了總變異中由x與y線性關(guān)系以外的一切因素所引起的y的變異部分
回歸平方和用U表示,是由x所引起的y的變化反映了總變異中由x與y線性關(guān)系(直線相關(guān))所引起y的變異部分可以根據(jù)回歸平方和U與離回歸平方和Q兩者的大小來(lái)檢驗(yàn)回歸方程配合效果的好壞
回歸平方和U在總平方和SSy中的比例(稱為決定系數(shù))越大,說(shuō)明由自變量x
估計(jì)、預(yù)測(cè)依變量y的準(zhǔn)確性越高3.2估計(jì)標(biāo)準(zhǔn)誤離回歸平方和的大小反映了實(shí)際觀測(cè)值y與估計(jì)值之間的偏離程度
在直線回歸分析中離回歸平方和的自由度df
=n-2離回歸平方和除以離回歸自由度就可以得到離回歸均方,即:離回歸均方的平方根叫離回歸標(biāo)準(zhǔn)誤,即:在統(tǒng)計(jì)學(xué)中采用離回歸標(biāo)準(zhǔn)誤用來(lái)表示回歸方程的偏離程度,估計(jì)直線回歸的標(biāo)準(zhǔn)誤例2計(jì)算例1中的直線回歸的標(biāo)準(zhǔn)誤?;貧w直線的估計(jì)標(biāo)準(zhǔn)誤即離回歸標(biāo)準(zhǔn)誤為:4.回歸系數(shù)的顯著性檢驗(yàn)(1)提出假設(shè)(2)計(jì)算t值H0:β=0(總體回歸不存在)HA:ρ≠0(總體回歸存在)回歸系數(shù)標(biāo)準(zhǔn)誤(3)查表,推斷例3對(duì)例1中的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)。t0.05,5=2.571,t0.01,5=4.032b值極顯著說(shuō)明我們有99%的把握認(rèn)為總體回歸是存在的,表示宰前活重與屠宰率之間存在極顯著的直線關(guān)系5.回歸系數(shù)的置信區(qū)間回歸系數(shù)b的抽樣分布服從的t分布,因此在估計(jì)總體回歸系數(shù)β的置信區(qū)間時(shí)可直接用臨界t值進(jìn)行計(jì)算:95%置信區(qū)間為:99%置信區(qū)間為:例4計(jì)算例1中回歸系數(shù)的置信區(qū)間。95%置信區(qū)間為:99%置信區(qū)間為:6.回歸系數(shù)與相關(guān)系數(shù)的關(guān)系(1)回歸系數(shù)b和相關(guān)系數(shù)r的符號(hào)相一致當(dāng)b>0時(shí),y隨x增大而增大,表示x,y兩變量呈正相關(guān)(r>0)當(dāng)b<0時(shí),y隨x增大而減小,表示x,y兩變量呈負(fù)相關(guān)(r<0)(2)相關(guān)系數(shù)是標(biāo)準(zhǔn)化了的回歸系數(shù)(3)相關(guān)系數(shù)是兩個(gè)方向相反的回歸系數(shù)的幾何均數(shù)兩者相乘,可得:6.回歸關(guān)系的F檢驗(yàn)總平方和可剖分成2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023勞動(dòng)者就業(yè)協(xié)議書內(nèi)容七篇
- 2023雙方保密協(xié)議書七篇
- 協(xié)議書范本汽車
- 2023房子裝修雙方協(xié)議書七篇
- 新疆維吾爾自治區(qū)喀什地區(qū)疏勒縣實(shí)驗(yàn)學(xué)校教育集團(tuán)2023-2024學(xué)年七年級(jí)11月月考道德與法治試題(原卷版)-A4
- 2024秋新滬科版物理8年級(jí)上冊(cè)教學(xué)課件 第6章 熟悉而陌生的力 第3節(jié) 來(lái)自地球的力
- 2023年藥品包裝機(jī)械項(xiàng)目融資計(jì)劃書
- 2023年聚氨酯涂料項(xiàng)目融資計(jì)劃書
- 烹飪?cè)现R(shí)習(xí)題+參考答案
- 黑龍江省佳木斯市富錦市2024屆九年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 人教版(2024)七年級(jí)上冊(cè)數(shù)學(xué)第5章單元測(cè)試卷(含答案)
- 情商與智慧人生學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 巨量-營(yíng)銷科學(xué)(初級(jí))認(rèn)證培訓(xùn)考試題庫(kù)(含答案)
- 第4章-長(zhǎng)基線水聲定位系統(tǒng)(LBL)
- 先張法預(yù)應(yīng)力混凝土管樁基礎(chǔ)技術(shù)規(guī)程
- 加工合同模板
- 高爾夫文化與禮儀慕課測(cè)驗(yàn)作業(yè)答案
- 中藥治療高血壓的臨床論文(共3篇)
- (完整版)認(rèn)知功能成套測(cè)驗(yàn)操作手冊(cè)
- 最新快遞公司勞動(dòng)合同模板
- [高一政史地]關(guān)于紹興老地名的研究性學(xué)習(xí)結(jié)題報(bào)告
評(píng)論
0/150
提交評(píng)論