excel一元及多元線性回歸實(shí)例_第1頁
excel一元及多元線性回歸實(shí)例_第2頁
excel一元及多元線性回歸實(shí)例_第3頁
excel一元及多元線性回歸實(shí)例_第4頁
excel一元及多元線性回歸實(shí)例_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 實(shí)用標(biāo)準(zhǔn)文案野外實(shí)習(xí)資料的數(shù)理統(tǒng)計(jì)分析 一元線性回歸分析 ?一元回歸處理的是兩個(gè)變量之間的關(guān)系,即兩個(gè)變量X和Y之間如果存在一定的關(guān)系,則通過觀測所得數(shù)據(jù),找出兩者之間的關(guān)系式。如果兩個(gè)變量的關(guān)系大致是線性的,那就是一元線性回歸問題。 對(duì)兩個(gè)現(xiàn)象X和Y進(jìn)行觀察或?qū)嶒?yàn),得到兩組數(shù)值:X1,X2,,Xn和Y1,Y2,Yn,假如要找出一個(gè)函數(shù)Y=f(X),使它在X=X1,X2, ,Xn時(shí)的數(shù)值f(X1),f(X2), ,f(Xn)與觀察值Y1,Y2,Yn趨于接近。 在一個(gè)平面直角坐標(biāo)XOY中找出(X1,Y1),(X2,Y2),(Xn,Yn)各點(diǎn),將其各點(diǎn)分布狀況進(jìn)行察看,即可以清楚地看出其各點(diǎn)分布

2、狀況接近一條直線。對(duì)于這種線性關(guān)系,可以用數(shù)學(xué)公式表示: Y = a + bX 這條直線所表示的關(guān)系,叫做變量Y對(duì)X的回歸直線,也叫Y對(duì)X的回歸方程。其中a為常數(shù),b為Y對(duì)于X的回歸系數(shù)。 對(duì)于任何具有線性關(guān)系的兩組變量Y與X,只要求解出a與b的值,即可以寫出回歸方程。計(jì)算a與b值的公式為: 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 個(gè)為第iYi為第i個(gè)自變量的樣本值,X式中:為變量為因變量的均值,的均值,Xi n為樣本數(shù)。因變量Y的樣本值。只要將所獲得的數(shù)據(jù)錄入就可Microsoft Excel中都有現(xiàn)成的回歸程序,當(dāng)前一般計(jì)算機(jī)的 自動(dòng)得到回歸方程。通??梢愿鶕?jù)相關(guān)系數(shù)的大小來決定。得到的回歸方程是否有意義,

3、其相關(guān)的程度有多大,值的絕對(duì)值越的相關(guān)系數(shù)。Yr之間的直線相關(guān)程度,r為X和和用r來表示兩個(gè)變量XY為負(fù)值時(shí)叫做負(fù)相關(guān)。r叫做正相關(guān),當(dāng)r為正值時(shí),兩個(gè)變量之間的相關(guān)程度就越高。大, 的計(jì)算公式如下:r 式中各符號(hào)的意義同上。檢驗(yàn)法r檢驗(yàn)法、Ft檢驗(yàn)法或在求得了回歸方程與兩個(gè)變量之間的相關(guān)系數(shù)后,可以利用 來檢驗(yàn)兩個(gè)變量是否顯著相關(guān)。具體的檢驗(yàn)方法在后面介紹。 多元線性回歸分析2 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 一元回歸研究的是一個(gè)自變量和一個(gè)因變量的各種關(guān)系。但是客觀事物的變化往往受到多種因素的影響,即使其中有一個(gè)因素起著主導(dǎo)作用,但其它因素的作用也是不可忽視的。因此,我們還需要研究多種變量的關(guān)系,這

4、種多個(gè)變量之間的關(guān)系就叫做多元回歸問題。例如,水稻的產(chǎn)量不僅與生長期內(nèi)的雨量有關(guān),而且與溫度也有關(guān)系。所以尋求水稻的產(chǎn)量不僅與生長期內(nèi)的雨量之間的相互關(guān)系,就是多元回歸問題。 如果假設(shè)自變量為X1,X2,Xm,因變量為Y,而且因變量與自變量之間是線性的關(guān)系,則因變量Y與自變量為X1,X2,Xm的多元線性回歸方程為: Y = a+b1X1+b2X2+bmXm 式中:a,b1,b2,bm為常數(shù)。 因此,只要能夠求出a,b1,b2,bm這些常數(shù),就可以得到因變量Y與自變量為X1,X2,Xm之間的多元回歸方程。具體的算法比較簡單,但很煩瑣。這里不再敘述。求解多元回歸的計(jì)算機(jī)程序很多,只要將自變量的數(shù)據(jù)

5、以及與其相對(duì)應(yīng)的因變量的數(shù)據(jù)輸入計(jì)算機(jī)程序中,立刻就可以求出a,b1,b2,bm各常數(shù)的值,從而可以獲得因變量Y與自變量為X1,X2,Xm的多元線性回歸方程。 例如,設(shè)已知因變量Y的自變量X1,X2,X3,共得18組數(shù)據(jù),并已知Y對(duì)Xi存在著線性關(guān)系,求其回歸方程。 樣品 X1 X2 X3 Y 64 53 158 0.4 1 60 163 2 0.4 23 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 3 3.1 19 37 71 61 157 4 0.6 34 54 24 59 5 4.7 77 123 6 1.7 65 81 7 9.4 44 46 93 31 10.1 117 8 93 173 9 11.6 2

6、9 51 10 12.6 58 112 76 111 11 10.9 37 96 23.1 46 114 12 77 50 13 23.1 134 93 44 14 21.6 73 95 56 15 23.1 168 54 36 1.9 143 16 168 17 26.8 58 202 99 29.9 51 124 18 a=41.6516b1=1.7410b2=-0.0062b3=0.1553 通過求解,得到 所以,回歸方程為Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 通??刹捎脝蜗嚓P(guān)系數(shù)、偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來說明這三個(gè)自變量

7、與因變量之間是否有明顯的線性關(guān)系以及它們之間相關(guān)的程度如何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下,所求兩個(gè)變量之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2、Y和X1以及Y與X2之間的單相關(guān)系數(shù)。偏相關(guān)系數(shù)是指在這三個(gè)變量中,將其中一個(gè)變量保持常數(shù)時(shí),其他兩個(gè)變量之間的相關(guān)系數(shù)。用rYX1X2和rYX2X1分別表示X2為常數(shù)時(shí),Y與X1的偏相關(guān)系數(shù)和X1為常數(shù)時(shí),Y與X2的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相關(guān)系數(shù)求得。當(dāng)這三個(gè)變量中,同時(shí)考慮兩個(gè)變量對(duì)另一個(gè)變量相關(guān)系數(shù)時(shí),叫做復(fù)相關(guān)系數(shù)。用r(X1X2)Y表示X1和X2、兩個(gè)自變量對(duì)于Y的復(fù)相關(guān)系數(shù)。 3.方差分析 方

8、差分析法是分析多組平均數(shù)之間差異顯著性時(shí)常用的一種統(tǒng)計(jì)方法。方差(或均方)是一個(gè)表示變異程度的量,它是離均差的平方和與自由度之商。在一項(xiàng)實(shí)驗(yàn)或調(diào)查中往往存在著許多造成生物形狀變異的因素,這些因素有比較重要的,也有較次要的。分析時(shí)主要是把平方和與自由度按不同的變異起因分解為若干部分,從而構(gòu)成來自不同起因的方差。利用它來檢驗(yàn)各組平均數(shù)之間差異的顯著性。在正態(tài)總體及方差相同的基本假定下,我們將利用方差比給出F分布的檢驗(yàn)統(tǒng)計(jì)量。因此這種方法稱為方差分析法。 方差分析是分析和處理試驗(yàn)或觀測數(shù)據(jù)的主要方法之一。它首先被應(yīng)用于農(nóng)業(yè)試驗(yàn),目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門有著廣泛的應(yīng)用。方差分析的方法往往

9、與試驗(yàn)設(shè)計(jì)的方式緊密地聯(lián)系在一起。對(duì)于從不同試驗(yàn)設(shè)計(jì)中得出觀測資料,進(jìn)行方差分析時(shí)將有不同的計(jì)算方法,類型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個(gè)較簡單的例子介紹方差分析的數(shù)學(xué)模型和基本方法,以便于讀者對(duì)方差分析的方法有一個(gè)大致的了解。 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 在實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上,分組試驗(yàn),如分為a組,每組作b個(gè)水平的試驗(yàn),共得到ab個(gè)數(shù)據(jù)。然后,算出組平均值和總平均值,組內(nèi)和組間的離差平方和,組內(nèi)和組間方差,作F檢驗(yàn)。 F 組間方差/組內(nèi)方差 假設(shè) HO: 1 2 b ,表示各水平的均值相等。當(dāng) F F 時(shí),HO: 真;當(dāng) F F時(shí), HO:假。 試驗(yàn)中必不可少地會(huì)產(chǎn)生誤差。誤差有兩種:

10、條件誤差和試驗(yàn)誤差。前者是由試驗(yàn)條件不同而引起的系統(tǒng)性誤差,后者是在相同試驗(yàn)條件下引起的隨機(jī)誤差。 例如,把四種不同的飼料分別喂給4組小雞,每組5只,它們的增重情況如下: 組別 增重(Xij) 5549422152 1 61112308963 2 4297819592 3 16913716885153 4 試問四組小雞在平均增重量方面有沒有明顯的差別? 通過計(jì)算,得到組內(nèi)和組間方差分別為719.2和8706.3,因此, F=8706.3/719.2=12.1 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 對(duì)于給定的顯著性水平,將有臨界值F一,當(dāng)=0.01時(shí),F(xiàn)0.01(3,16)=5.3,其中3與16是自由度。 所以

11、F=12.15.3= F0.01(3,16) 故,否定各種飼料效果一致的假設(shè),可以認(rèn)為四種飼料的效果有極明顯的差別。 目前現(xiàn)成的計(jì)算機(jī)方差分析計(jì)算程序很多,如SPASS、SAS軟件等,將數(shù)據(jù)輸入后,都可以直接計(jì)算,并按要求輸出結(jié)果。 上述例子是單因素的方差分析,比較簡單。對(duì)于多因素的方差分析,由于比較復(fù)雜,這里就不再敘述了。 4. T檢驗(yàn) 生物學(xué)中所遇到的絕大多數(shù)問題,總體標(biāo)準(zhǔn)差都是未知的。在未知時(shí),平均數(shù)的顯著性檢驗(yàn)有兩種解決方法。其一是根據(jù)以往的經(jīng)驗(yàn)或從類似的工作中估計(jì)出一個(gè)值,用這個(gè)做檢驗(yàn)。使用估計(jì)的做檢驗(yàn)并不是很可靠的。因此在實(shí)際工作中,一般不用這種方法而廣泛使用t檢驗(yàn)。 對(duì)于一個(gè)正態(tài)

12、分布總體,若未知?jiǎng)t服從n-1自由度的t分布,因此,在未知時(shí)可以用 檢驗(yàn)做平均數(shù)的顯著性檢驗(yàn)。tt檢驗(yàn)的零假設(shè)H0為:=0 備擇假設(shè)有以下三種情況:(1)HA:0,若已知不可能小于0;(2)HA:0和t ;(2)t t/2,或表示為t t(雙側(cè)) 。 其中為給定的顯著性水平。 t檢驗(yàn)的統(tǒng)計(jì)量為: t = (-0)/(s/n1/2) 例如,已知玉米單交種群單105的平均穗重0=300克,噴藥后,隨機(jī)抽取9個(gè)果穗,其穗重為分別:308、305、311、298、315、300、321、294、320克。問噴藥后與噴藥前的果穗重差異是否顯著? 根據(jù)上面介紹的基本程序: 已知玉米穗重是服從正態(tài)分布的隨機(jī)變

13、量,未知。 ?(2)假設(shè):H0 :=0=300HA:0=300 由于問題要求檢驗(yàn)的是“果穗重差異是否顯著”,并沒有明確穗重一定增加或一定減少,所以備擇假設(shè)為HA:0 (3)顯著性水平:根據(jù)實(shí)驗(yàn)的要求(差異是否“顯著”)規(guī)定=0.05。 (4)統(tǒng)計(jì)量的值:由于未知需使用t檢驗(yàn)。 t = (-0)/(s/n1/2) 精彩文檔實(shí)用標(biāo)準(zhǔn)文案 t = (308-3000)/(9.62/91/2)=2.49 (5)建立的拒絕域H0:因HA:0,所以是雙側(cè)檢驗(yàn)。當(dāng) t t0.05(雙側(cè))時(shí)拒絕H0,=0.05時(shí),經(jīng)查表t8,0.05(雙側(cè))=2.306。 (6)結(jié)論:因t =2.49 t8,0.05(雙側(cè))

14、=2.306 ,所以結(jié)論是拒絕H0,接受HA。即噴藥前后果穗重的差異是顯著的。 5. F檢驗(yàn) t檢驗(yàn)屬于單個(gè)樣本的顯著性檢驗(yàn),即在樣本統(tǒng)計(jì)量與零假設(shè)所提出的總體參量之間做比較。這種檢驗(yàn)需要我們事先能夠提出合理的參量假設(shè)值和對(duì)參量有某種意義的備擇值。然而,在實(shí)際工作中,很難提出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實(shí)際工作中的應(yīng)用。 為了避免上述問題的出現(xiàn),在實(shí)際應(yīng)用時(shí),常常選擇兩個(gè)樣本,一個(gè)作為處理,一個(gè)作為對(duì)照。在這兩個(gè)樣本之間做比較。判斷它們之間是否存在足夠顯著的差異。當(dāng)它們之間的差異不能用偶然性解釋時(shí),則認(rèn)為它們之間存在足夠顯著的差異,這兩個(gè)樣本來自兩個(gè)不同的總體。而F檢驗(yàn)是關(guān)于兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論