第六章 相關(guān)與回歸_第1頁(yè)
第六章 相關(guān)與回歸_第2頁(yè)
第六章 相關(guān)與回歸_第3頁(yè)
第六章 相關(guān)與回歸_第4頁(yè)
第六章 相關(guān)與回歸_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章第六章 簡(jiǎn)單相關(guān)與回歸簡(jiǎn)單相關(guān)與回歸 前面各章我們討論的問(wèn)題,都只涉及到一個(gè)變量,如體重 、日增重、產(chǎn)仔數(shù)、體溫、血糖濃度 、產(chǎn)奶量 、產(chǎn)毛量或孵化率 、發(fā)病率等。 但是,由于客觀事物在發(fā)展過(guò)程中相互聯(lián)系、相互影響,因而在畜牧、水產(chǎn)等試驗(yàn)研究中常常要研究?jī)蓚€(gè)或兩個(gè)以上變量間的關(guān)系。 變量間的關(guān)系有兩類: 一類是變量間存在著完全確定性的關(guān)系,可以用精確的數(shù)學(xué)表達(dá)式來(lái)表示。 如長(zhǎng)方形的面積 (S) 與 長(zhǎng)(a)和 寬(b)的關(guān)系可以表達(dá)為: S=ab。它們之間的關(guān)系是確定性的,只要知道了其中兩個(gè)變量的值就可以精確地計(jì)算出另一個(gè)變量的值,這類變量間的關(guān)系稱為函數(shù)關(guān)系。 另一類是 變 量 間不存

2、在完全的確定性關(guān)系,不能用精確的數(shù)學(xué)公式來(lái)表示。 如黃牛的體長(zhǎng)與體重的關(guān)系;仔豬初生重與斷奶重的關(guān)系;豬瘦肉率與背膘厚度、眼肌面積、胴體長(zhǎng)等的關(guān)系等等,這些變量間都存在著十分密切的關(guān)系,但不能由一個(gè)或幾個(gè)變量的值精確地求出另一個(gè)變量的值。像這樣一類關(guān)系在生物界中是大量存在的,統(tǒng)計(jì)學(xué)中把這些變量間的關(guān)系稱為相關(guān)關(guān)系,把存在相關(guān)關(guān)系的變量稱為相關(guān)變量。相關(guān)變量間的關(guān)系一般分為兩種: 一種是平行關(guān)系,是研究變量間關(guān)系的強(qiáng)弱程度,此時(shí)我們不關(guān)心在它們之間是誰(shuí)影響了誰(shuí),誰(shuí)是因,誰(shuí)是果,變量間的地位是平等的。如黃牛的體長(zhǎng)和胸圍之間的關(guān)系,豬的背膘厚度和眼肌面積之間的關(guān)系等都屬于平行關(guān)系。 另一種是因果關(guān)系

3、,即一個(gè)變量的變化受另一個(gè)或幾個(gè)變量的影響。如仔豬的生長(zhǎng)速度受遺傳特性、營(yíng)養(yǎng)水平、飼養(yǎng)管理?xiàng)l件等因素的影響,子代的體高受親本體高的影響。 統(tǒng)計(jì)學(xué)上采用相關(guān)分析研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。 對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為簡(jiǎn)單相關(guān)分析(也叫直線相關(guān)分析)。 對(duì)多個(gè)變量進(jìn)行相關(guān)分析時(shí),研究一個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析;研究其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)分析。 統(tǒng)計(jì)學(xué)上采用回歸分析 研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。表示原因的變量稱為自變量,表示結(jié)果的變量稱為依變量。 研究“一因一果”,即一個(gè)自變量與一個(gè)依變量的回歸分析稱為一元回歸分析; 研究“

4、多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。第一節(jié)第一節(jié) 簡(jiǎn)單相關(guān)簡(jiǎn)單相關(guān)一、一、 樣本相關(guān)系數(shù)的定義樣本相關(guān)系數(shù)的定義 假設(shè)兩個(gè)隨機(jī)變量(X,Y)有若干個(gè)體(n個(gè))在這兩個(gè)變量上的觀測(cè)值(xi,yi)那么在直角坐標(biāo)中則可作出n 對(duì)觀測(cè)值的散點(diǎn)圖(見圖6-1 (A)表示x與y 無(wú)相關(guān);(B)表示y 隨x 增加而增加;(C)表示y 隨x 增加而減少;(D)表示x與y呈曲線關(guān)系。 )。 如果把零點(diǎn)為原點(diǎn)的坐標(biāo)移到以( , )為原點(diǎn)的坐標(biāo)中,其各相關(guān)點(diǎn)的位置不變,而各對(duì)

5、x,y值化為 ,則在以平均數(shù) 為原點(diǎn)的坐標(biāo)中,x軸與y軸就將整個(gè)坐標(biāo)平面劃分為4個(gè)象限。 這時(shí)我們就可以用 描述各散點(diǎn)在象限中的變異情況。:+ +;:- +;:- -;:+ -。xy ,xxyy, x y ,xxyy圖圖6-1 各類相關(guān)散點(diǎn)示意圖各類相關(guān)散點(diǎn)示意圖 那么,x與y的關(guān)系如何描述,辦法是用+,-,中的一個(gè)作變異的合并。若用“+,-”合并,則 無(wú)意義。若用“”法合并,誰(shuí)為分子,誰(shuí)為分母無(wú)依據(jù),且隨意決定,會(huì)出現(xiàn)計(jì)算結(jié)果各不相同,而惟有用“”合并,能克服以上弊端。 相乘時(shí):、為正,反映正相關(guān);、為負(fù),反映負(fù)相關(guān)。 將散點(diǎn)變異相加,即得: ,此即離均差乘積和,間稱乘積和。以 SPxy表示

6、,以此可作為兩變量間相關(guān)性質(zhì)(方向)和相關(guān)程度的度量。為了消除兩變量各自變異度及單位不同的影響,須將 各以其標(biāo)準(zhǔn)差除之,另外為了消除自由度不等的影響,便于比較,再除以自由度,于是得到相關(guān)系數(shù)r(表示簡(jiǎn)單相關(guān)程度和性質(zhì)的統(tǒng)計(jì)量稱作相關(guān)系數(shù)).0,0 xxyyxxyy ,xxyy樣本樣本相關(guān)系數(shù)用相關(guān)系數(shù)用r r 表示,總表示,總體體相關(guān)系數(shù)用相關(guān)系數(shù)用表示。表示。 2222111xxyynxxyyrxxnyynxxyy221)()()()(1YXYXNYYXXYXYXYXN其中:其中:SPSPxyxy 變量變量x x和變量和變量y y的的離均差離均差乘積和乘積和簡(jiǎn)稱簡(jiǎn)稱乘積和乘積和SSSSx x

7、 變量變量x x 的的離均差平方和離均差平方和 SSSSy y 變量變量y y 的的離均差平方和離均差平方和nyynxxnyxxySSSSSPryxxy2222)()()(相關(guān)系數(shù)相關(guān)系數(shù)r r 的特點(diǎn)的特點(diǎn): :(1)r 為無(wú)單位的相對(duì)數(shù)值,可直接用于不同資料間相關(guān)程度的比較。(2) r1,0|r|1。 |r|越接近于1,說(shuō)明兩變量的相關(guān)程度越強(qiáng); |r|越接近于0,兩變量的相關(guān)程度越差。(3)r=0表示x與y無(wú)相關(guān), r0表示負(fù)相關(guān), r0表示正相關(guān), |r|=1為完全相關(guān)。1二、二、樣本相關(guān)系數(shù)的計(jì)算樣本相關(guān)系數(shù)的計(jì)算【例6-1】表6-1為用氦氖激光照射母黃牛后血紅蛋白含量(y,g)和照

8、射天數(shù)(x,d)的資料,試求兩變量的相關(guān)系數(shù)。一級(jí)數(shù)據(jù)計(jì)算如下:一級(jí)數(shù)據(jù)計(jì)算如下: 45x8 .61y 286xy2852x58.4332y978. 098 .6158.43394528598 .6145286)()()(222222nyynxxnyxxyr三、相關(guān)系數(shù)的顯著性檢驗(yàn)三、相關(guān)系數(shù)的顯著性檢驗(yàn) 由樣本資料求出的相關(guān)系數(shù)r與其他統(tǒng)計(jì)量一樣,也存在著抽樣誤差,假若求得的r值不等于零,它是否是一個(gè)有意義的數(shù)值,還需要進(jìn)行顯著性檢驗(yàn)之后才能作出判斷。檢驗(yàn)的目的就是要判明r所在的總體是否確有線性關(guān)系。 檢驗(yàn)時(shí)首先提出假設(shè):H0:=0 ; HA:0;然后測(cè)定r與之間的差異是由于抽樣誤差引起的,

9、還是本質(zhì)的差異,根據(jù)構(gòu)造統(tǒng)計(jì)量的不同分為F檢驗(yàn)和t檢驗(yàn),下面以t檢驗(yàn)步驟為例說(shuō)明。 1 1、H H0 0:=0 =0 ; H HA A:002 2、t t 檢驗(yàn)公式為檢驗(yàn)公式為rSrt 2/12nrSr2edfn其中:其中: 相關(guān)系數(shù)的標(biāo)準(zhǔn)誤相關(guān)系數(shù)的標(biāo)準(zhǔn)誤 誤差自由度誤差自由度edfrS 對(duì)于例對(duì)于例6-16-1,由公式可得:,由公式可得: 故故p p0.010.01,否定,否定H H0 0:=0=0,接受,接受H HA A:00。說(shuō)明。說(shuō)明母黃牛血紅蛋白含量和照射天數(shù)間負(fù)相關(guān)關(guān)系極母黃牛血紅蛋白含量和照射天數(shù)間負(fù)相關(guān)關(guān)系極顯著,表示為顯著,表示為r r = = * * *。8078. 02

10、9/)978. 0(12rs0.01(7)0.978| |12.413.4990.0788tt978. 0 統(tǒng)計(jì)學(xué)家已根據(jù)相關(guān)系數(shù)r 的t 檢驗(yàn)法,計(jì)算出r的顯著臨界值并列出了表(見附表9)。 實(shí)際分析資料時(shí)可以直接查附表對(duì)r 進(jìn)行顯著性檢驗(yàn)。 本例由dfe= 9-2 = 7,M = 2(變量個(gè)數(shù)),查r 臨界值表得:r0.05(7)=0.666,r0.01(7)=0.798,而 r0.01(7)=0.798,p0,Y 隨X 的增大而增大(減少 而減少) 斜上; bF0.01(1,7)=12.25,pt0.01(7)=3.499, p0.71),以確?;貧w變異至少占y 總變異的一半以上。5 .

11、 02rr五、直線回歸的應(yīng)用五、直線回歸的應(yīng)用1. 1. 預(yù)測(cè)(預(yù)測(cè)(forecastforecast) (給定(給定X X 值,估計(jì)值,估計(jì)Y Y )2. 2. 控制(控制(controlcontrol) (給定(給定Y Y 值范圍,求值范圍,求X X 值范圍)值范圍)區(qū)別:區(qū)別: 六、直線回歸與相關(guān)的區(qū)別與聯(lián)系六、直線回歸與相關(guān)的區(qū)別與聯(lián)系 1. 1. 資料資料X X、Y Y 服從雙變量正態(tài)分布,即均為隨機(jī)變量服從雙變量正態(tài)分布,即均為隨機(jī)變量 Y Y為正態(tài)為正態(tài)隨機(jī)變量隨機(jī)變量,X X為為選定選定變量變量 2. 2. 應(yīng)用應(yīng)用 回歸回歸 由一個(gè)變量值推算另一個(gè)變量值由一個(gè)變量值推算另一個(gè)變量值 相關(guān)相關(guān) 只反映兩變量間互依關(guān)系只反映兩變量間互依關(guān)系 3. 3. 回歸系數(shù)與原度量單位有關(guān),而相關(guān)系數(shù)無(wú)關(guān)回歸系數(shù)與原度量單位有關(guān),而相關(guān)系數(shù)無(wú)關(guān)回歸:回歸:相關(guān):相關(guān):聯(lián)系:聯(lián)系: LINE LINE 假定假定xy標(biāo)準(zhǔn)差相等標(biāo)準(zhǔn)差相等 EQUAL STANDARD DEVIATIONEQUAL STANDARD DEVIATION 對(duì)于任何對(duì)于任何X X值,隨機(jī)變量值,隨機(jī)變量Y Y的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差 Y|XY|X相等相等獨(dú)立獨(dú)立 INDEPENDENCEINDEPENDENCE 每一觀察值之間彼此獨(dú)立每一觀察值之間彼此獨(dú)立 y|X = + x線性線性 L

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論