直線回歸和相關(guān)完整版_第1頁
直線回歸和相關(guān)完整版_第2頁
直線回歸和相關(guān)完整版_第3頁
直線回歸和相關(guān)完整版_第4頁
直線回歸和相關(guān)完整版_第5頁
已閱讀5頁,還剩152頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

直線回歸和相關(guān)田間試驗設(shè)計與統(tǒng)計分析1回歸和相關(guān)的概念前面幾章討論的資料和統(tǒng)計方法只著重一個單獨變數(shù),例如產(chǎn)量等變數(shù)的分布及其特征在農(nóng)業(yè)試驗工作中,大部分問題是包括兩個或兩個以上變數(shù)在一起變異的問題例如降雨量、溫度和光照等氣候因子對番茄產(chǎn)量的影響等。2023/10/201回歸和相關(guān)的概念把許多種變數(shù)擺在一起的研究,目的在于發(fā)現(xiàn)它們之間存在的規(guī)律性,以預(yù)測或估計變數(shù)間的變異趨向,在統(tǒng)計上稱作回歸與相關(guān)研究研究兩個變數(shù)之間關(guān)系時,因變數(shù)不同而有兩種不同的研究方法。變數(shù)之間的關(guān)系函數(shù)關(guān)系統(tǒng)計關(guān)系1.變數(shù)之間的關(guān)系1回歸和相關(guān)的概念函數(shù)關(guān)系是一種一一對應(yīng)的確定關(guān)系不包含誤差的干擾

xy1回歸和相關(guān)的概念統(tǒng)計關(guān)系一種非確定的關(guān)系一個變數(shù)取值受到另一個變數(shù)的影響兩者之間既有關(guān)系,但又不是完全確定的函數(shù)關(guān)系變數(shù)之間的關(guān)系受到誤差的干擾

xy是指一個變數(shù)的取值受到另一個變數(shù)的影響,兩者有關(guān)系,但不存在完全確定的函數(shù)關(guān)系。相關(guān)關(guān)系因果關(guān)系:自變數(shù)(原因變數(shù))和依變數(shù)(結(jié)果變數(shù))。從統(tǒng)計學(xué)角度講,確定性關(guān)系與不確定性關(guān)系的區(qū)別僅在于前者不存在隨機(jī)誤差,而后者不可避免地具有試驗誤差。1回歸和相關(guān)的概念2.自變數(shù)和依變數(shù)變數(shù)之間的統(tǒng)計關(guān)系因果關(guān)系相關(guān)關(guān)系自變數(shù)(independentvariable)依變數(shù)(dependentvariable)呈現(xiàn)出一種共同變化的特點1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析回歸分析對具有因果關(guān)系的兩個變數(shù),可以推算出Y隨X改變的方程,此時的方程稱為Y依X的回歸方程(regressionequationofYonX)以計算回歸方程為基礎(chǔ)的分析方法稱為回歸分析原則上兩個變數(shù)中Y含有試驗誤差而X不含有試驗誤差時著重進(jìn)行回歸分析1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析回歸分析的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸回歸分析的特征:①有自變數(shù)和依變數(shù)之分;②具有預(yù)測的作用,即可以由X的數(shù)量變化來預(yù)測Y的數(shù)量變化;③自變數(shù)x無誤差或誤差很小,依變數(shù)y存在誤差?;貧w分析(regressionanalysis)

對回歸模型資料,通常在確定自變數(shù)和依變數(shù)的基礎(chǔ)上,建立由X來預(yù)測Y的回歸方程式,并推定當(dāng)自變數(shù)X取某一定值時依變數(shù)Y將會在什么范圍內(nèi)變化。1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)分析對具有相關(guān)關(guān)系的兩個變數(shù),可以計算出表示相關(guān)密切程度的統(tǒng)計數(shù),并檢驗其顯著性通常在Y和X均含有誤差時著重進(jìn)行相關(guān)分析1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)分析在直線相關(guān)時,這一統(tǒng)計數(shù)稱為相關(guān)系數(shù)(correlationcoefficient),記為r在多元相關(guān)時稱為復(fù)相關(guān)系數(shù)(multiplecorrelation)記為Ry.1.2…m曲線相關(guān)時稱為相關(guān)指數(shù)(correlationindex),記為R1回歸和相關(guān)的概念3.回歸分析和相關(guān)分析相關(guān)系數(shù)簡單相關(guān)系數(shù)r復(fù)相關(guān)系數(shù)Ry.1.2..m相關(guān)指數(shù)R直線相關(guān)多元相關(guān)曲線相關(guān)偏相關(guān)系數(shù)Ry.1…多元相關(guān)相關(guān)系數(shù)的種類①表示兩個變數(shù)的偕同變異;②沒有自變數(shù)與依變數(shù)之分;③不具有預(yù)測的作用;④存在隨機(jī)誤差。特征:

相關(guān)分析

(correlationanalysis):研究兩個變數(shù)之間有無關(guān)系,以及關(guān)系的密切程度和性質(zhì),而不需要由一變數(shù)去估測另一變數(shù)。相關(guān)系數(shù)復(fù)相關(guān)系數(shù)相關(guān)指數(shù)rRy.12…mR1回歸和相關(guān)的概念回歸分析和相關(guān)關(guān)系對具有因果關(guān)系的兩個變數(shù),統(tǒng)計分析的任務(wù)是由試驗數(shù)據(jù)推算一個方程為y依x的回歸方程對具有相關(guān)關(guān)系的兩個變數(shù),統(tǒng)計分析的目標(biāo)是計算表示y和x相關(guān)密切和程度的統(tǒng)計數(shù)并測其顯著性1回歸和相關(guān)的概念回歸分析和相關(guān)關(guān)系原則上y含有試驗誤差而x不含試驗誤差時著重進(jìn)行回歸分析;y和x均含有試驗誤差時則著重去進(jìn)行相關(guān)分析但沒有明顯的界限,而實際它們的分析包括著相互的信息1回歸和相關(guān)的概念兩個變數(shù)資料的散點圖

對具有統(tǒng)計關(guān)系的兩個變數(shù)資料,將其觀測值分別以坐標(biāo)點的形式標(biāo)記與同一直角坐標(biāo)平面上,獲得散點圖(scatterdiagram)通過散點圖可以初步判定變數(shù)之間的關(guān)系相關(guān)的性質(zhì)和密切程度變數(shù)的關(guān)系是直線型,還是非直線型是否有一些特殊的點表示著其他因素的干擾1回歸和相關(guān)的概念1234x,生物產(chǎn)量(g)0.00.51.01.52.0y,稻谷產(chǎn)量(g)水稻單株生物產(chǎn)量與稻谷產(chǎn)量的散點圖1回歸和相關(guān)的概念3.23.644.44.8x,每平方米穎花數(shù)(萬)05560657075y,結(jié)實率(%)水稻每平方米穎花數(shù)和結(jié)實率的散點圖1回歸和相關(guān)的概念34567890250300350400450x,最高葉面積指數(shù)y,產(chǎn)量(kg/畝)水稻最高葉面積指數(shù)和畝產(chǎn)量的散點圖第二節(jié)

直線回歸田間試驗設(shè)計與統(tǒng)計分析2.1直線回歸方程1.直線回歸方程式在散點圖上呈直線趨勢的兩個變數(shù),如果要概括其在數(shù)量上的互變規(guī)律,即從X的變化來預(yù)測或估計Y的變化,則要采用直線回歸方程來描述linearregressionequation

是和x對應(yīng)的依變數(shù)的點估計值

a是回歸截距(regressionintercept)b是回歸系數(shù)(regressioncoefficient)要使能夠最好地代表y和x在數(shù)量上的互變關(guān)系,必須使XY2.1直線回歸方程1.直線回歸方程式分別對a和b求偏導(dǎo)數(shù)并另其為0,即可獲得正規(guī)方程組(normalequations):2.1直線回歸方程1.直線回歸方程式正規(guī)方程組解之得:2.1直線回歸方程1.直線回歸方程式

是x的離均差和y的離均差的乘積和,簡稱為乘積和(sumofproducts),記作SP分母是x的離均差平方和,記作SSx2.1直線回歸方程1.直線回歸方程式a、b的取值及意義A、b皆可正可負(fù)若b=0或和0的差異不顯著,表明y的變異和x的取值大小無關(guān),直線回歸關(guān)系不能成立2.1直線回歸方程XY2.1直線回歸方程2.直線回歸的計算[例]一些夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)。江蘇武進(jìn)連續(xù)9年測定3月下旬至4月中旬旬平均溫度累積值(x,旬.度)和水稻一代三化螟盛發(fā)期(y,以5月10日為0)的關(guān)系,得結(jié)果于下表。試計算其直線回歸方程。Y12169273139-1X35.534.131.740.336.840.231.73244.22.1直線回歸方程因而有:從而得到回歸方程:2.1直線回歸方程對回歸方程的解析回歸系數(shù)的意義:當(dāng)3月下旬至4月中旬的積溫每提高1旬.度時,一代三化螟蟲的盛發(fā)期平均將提早1.1天截距的意義:若積溫為0,則一代三化螟蟲的盛發(fā)期將在6月27-28日由于x的實測區(qū)間為[31.7,44.2],根據(jù)回歸方程對Y的預(yù)測只能內(nèi)插而不能外延2.1直線回歸方程303438425/5-55/1005/1555/20105/2515(月/日)x,3月下旬至4月中旬平均溫度累積值y,一代三化螟盛發(fā)期2.1直線回歸方程例.在粉皮冬瓜雌花謝花后7-11天測量果實縱徑,獲得如下數(shù)據(jù),試作回歸分析謝花后天數(shù)x7891011果實縱徑y(tǒng)14.316.817.217.618.52.1直線回歸方程2.1直線回歸方程例.測得大紅番茄果實橫徑與果重的一組數(shù)據(jù)資料,試作橫徑與果重兩個變數(shù)間的回歸分析。果實橫徑x10628.98.587.87.77.47果重y14013213012111610810510695902.1直線回歸方程2.1直線回歸方程四、直線回歸的估計標(biāo)準(zhǔn)誤滿足為最小的直線回歸方程和實測的觀察點并不重合,表明該回歸方程仍然存在隨機(jī)誤差。Q就是誤差的一種度量,稱之為離回歸平方和(sumofsquarestodeviationfromregression)或剩余平方和2.1直線回歸方程四、直線回歸的估計標(biāo)準(zhǔn)誤由于在建立回歸方程時用了a和b兩個統(tǒng)計數(shù),故Q的自由度ν=n-2因而,可定義回歸方程的估計標(biāo)準(zhǔn)誤為:越小,各觀測值點越靠近回歸曲線,反之,越遠(yuǎn)2.1直線回歸方程四、直線回歸的估計標(biāo)準(zhǔn)誤Q值的計算:2.1直線回歸方程四、直線回歸的估計標(biāo)準(zhǔn)誤Q值的計算:2.1直線回歸方程Q值的計算:使用EXCEL中STEYX函數(shù)計算返回通過線性回歸法計算每個x的y預(yù)測值時所產(chǎn)生的標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤差用來度量根據(jù)單個x變量計算出的y預(yù)測值的誤差量。語法STEYX(known_y's,known_x's)Known_y's

為因變量數(shù)據(jù)點數(shù)組或區(qū)域。Known_x's

為自變量數(shù)據(jù)點數(shù)組或區(qū)域。2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定數(shù)學(xué)模型樣本的線性組成為:2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定基本假定:Y是隨機(jī)變數(shù),而X是沒有誤差的固定變數(shù),至少和Y比較起來X的誤差小到可以忽略在任一X上都存在一個Y的總體,是作正態(tài)分布的,其平均數(shù)是X的線形函數(shù)2.1直線回歸方程五、直線回歸的數(shù)學(xué)模型和基本假定基本假定:所有Y總體都具有共同的方差,這一方差不因X的不同而不同,直線回歸總體具有隨機(jī)誤差項相互獨立,并作正態(tài)分布,具有樣本b≠0總體β≠0?回歸系數(shù)也有抽樣誤差!總體β=0HAH02.2直線回歸的假設(shè)測驗和區(qū)間估計一、直線回歸的假設(shè)測驗1、回歸關(guān)系的假設(shè)測驗t測驗若總體不存在直線回歸關(guān)系,則總體回歸系數(shù)β=0若總體存在直線回歸關(guān)系,則總體回歸系數(shù)β≠0。2.2直線回歸的假設(shè)測驗和區(qū)間估計一、直線回歸的假設(shè)測驗-t測驗對直線回歸的假設(shè)測驗為:H0:β=0;對HA:β≠0回歸系數(shù)b的標(biāo)準(zhǔn)誤為:遵循ν=n-2的t分布2.2直線回歸的假設(shè)測驗和區(qū)間估計[例]水稻一代三化螟盛發(fā)期夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)Y12169273139-1X35.534.131.740.336.840.231.73244.2試測驗回歸關(guān)系的顯著性2.2直線回歸的假設(shè)測驗和區(qū)間估計ν=n-2=9-2=72.2直線回歸的假設(shè)測驗和區(qū)間估計接受HA:β≠0,即認(rèn)為積溫和一代三化螟盛發(fā)期是有真實的直線回歸關(guān)系。2.2直線回歸的假設(shè)測驗和區(qū)間估計一、直線回歸的假設(shè)測驗F測驗2.2直線回歸的假設(shè)測驗和區(qū)間估計總平方和ν=n-1離回歸平方和ν=n-2回歸平方和ν=(n-1)-(n-2)=12.2直線回歸的假設(shè)測驗和區(qū)間估計三個平方和的意義總平方和(SSy)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR或U)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和離回歸平方和(SSE或Q)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和2.1直線回歸方程XYF測驗SS總=SS回+SS離ν總=ν回+ν離ν總=n-1ν回=1ν離=n-22.2直線回歸的假設(shè)測驗和區(qū)間估計2.2直線回歸的假設(shè)測驗和區(qū)間估計[例]水稻一代三化螟盛發(fā)期夏季害蟲盛發(fā)期的早遲和春季溫度高低有關(guān)用F測驗檢測回歸關(guān)系的顯著性變異來源DFSSMSFF0.01回歸1174.8886174.888616.40**12.25離回歸774.667010.6667總變異8245556SUMMARYOUTPUT回歸統(tǒng)計MultipleR0.837138563RSquare0.700800973AdjustedRSquare0.658058255標(biāo)準(zhǔn)誤差3.265988788觀測值9方差分析

dfSSMSFSignificanceF回歸分析1174.8887762174.888776216.395798030.004875908殘差774.6667793410.66668276總計8245555556

Coefficients標(biāo)準(zhǔn)誤差tStatP-value下限95.0%上限95.0%Intercept48.5493193610.127786264.7936753520.00198070424.6009103672.49772836XVariable1-1.0996220390.271567101-4.0491725120.004875908-1.74177619-0.4574678872.2直線回歸的假設(shè)測驗和區(qū)間估計直線回歸分析中的t檢驗和F檢驗F(v1=1,v2=n-2)=t2(v=n-2)在直線回歸方程中,t檢驗和F檢驗的結(jié)果是一致的在多元非線性回歸方程中F檢驗是針對回歸方程總體回歸關(guān)系存在與否的檢驗而t檢驗是對各個回歸系數(shù)是否為零進(jìn)行檢驗因此,應(yīng)先進(jìn)行F檢驗,F值顯著的情況下再進(jìn)行t檢驗2.2直線回歸的假設(shè)測驗和區(qū)間估計兩個樣本回歸系數(shù)比較時的假設(shè)檢驗若有兩個直線回歸樣本,分別具有回歸系數(shù)b1、b2和總體回歸系數(shù)β1、β2,則在檢驗b1、b2的差異顯著性時,有:Ho:β1-β2=0HA:β1-β2≠0兩個樣本回歸數(shù)差數(shù)的標(biāo)準(zhǔn)誤為2.2直線回歸的假設(shè)測驗和區(qū)間估計兩個樣本回歸系數(shù)比較時的假設(shè)檢驗由于遵循v=(n1-2)+(n2-2)的t分布,故由可測定在β1-β2=0的總體中獲得現(xiàn)有

b1-b2≠0的概率2.2直線回歸的假設(shè)測驗和區(qū)間估計二.直線回歸的區(qū)間估計-直線回歸的抽樣誤差在直線回歸總體中抽取若干樣本時,由于的存在,各樣本的a、b值都有誤差由給出的點估計的精確性,決定于和a、b的誤差的大小因此對α、β以及μY/X作出區(qū)間估計是比較科學(xué)的2.2直線回歸的假設(shè)測驗和區(qū)間估計回歸截距的置信區(qū)間樣本回歸截距而和b的誤差a的標(biāo)準(zhǔn)誤為2.2直線回歸的假設(shè)測驗和區(qū)間估計回歸截距的置信區(qū)間而(a-α)/sa是遵循ν=n-2的t分布所以對總體回歸截距α有95%可靠度的置信區(qū)間為2.2直線回歸的假設(shè)測驗和區(qū)間估計回歸系數(shù)的置信區(qū)間服從自由度為n-2的t分布可以導(dǎo)出β的95%、99%置信區(qū)間為:2.2直線回歸的假設(shè)測驗和區(qū)間估計條件總體平均數(shù)

Y/X的置信區(qū)間根據(jù)回歸模型的定義,每一個X上都由一個Y變數(shù)的條件總體,該條件總體的平均數(shù)為

Y/X

,而樣本估計值為

由于,故的標(biāo)準(zhǔn)誤為:

2.2直線回歸的假設(shè)測驗和區(qū)間估計條件總體平均數(shù)

Y/X的置信區(qū)間可以導(dǎo)出

Y/X的95%、99%置信區(qū)間為:由于服從自由度為n-2的t分布

2.2直線回歸的假設(shè)測驗和區(qū)間估計例:試根據(jù)例1資料估計:當(dāng)3月下旬至4月中旬的積溫為40旬·度時,歷年的一代三化螟平均盛發(fā)期在何時(取95%可靠度)?將x=40代入方程得:2.2直線回歸的假設(shè)測驗和區(qū)間估計2.2直線回歸的假設(shè)測驗和區(qū)間估計條件總體預(yù)測值的置信區(qū)間這是以一定的保證概率估計任一X上Y單個預(yù)測值的存在范圍2.2直線回歸的假設(shè)測驗和區(qū)間估計條件總體預(yù)測值的置信區(qū)間故保證概率為0.95的Y(p)預(yù)測區(qū)間為:2.2直線回歸的假設(shè)測驗和區(qū)間估計條件總體預(yù)測值的置信區(qū)間[例]試根據(jù)例1資料估計:某年3月下旬至4月中旬的積溫為40旬·度,試估計該年的一代三化螟盛發(fā)期在何時(取95%可靠度)?2.2直線回歸的假設(shè)測驗和區(qū)間估計置信區(qū)間和預(yù)測區(qū)間圖示第三節(jié)

直線相關(guān)田間試驗設(shè)計與統(tǒng)計分析3直線相關(guān)有時我們無法或不需要由一個變數(shù)來估計另一個變數(shù)的值,我們感興趣的是這兩個變數(shù)之間有沒有什么關(guān)系如:番茄的產(chǎn)量和什么性狀有關(guān)呢?通過相關(guān)分析表明:產(chǎn)量和每花序上花的數(shù)目以及每果序上果實的數(shù)目有關(guān)如何提高產(chǎn)量呢??;?,保果3直線相關(guān)什么是相關(guān)分析呢?相關(guān)分析是一種用來表示兩個變量之間關(guān)系強(qiáng)度的數(shù)學(xué)方法。3直線相關(guān)什么情況下使用相關(guān)分析呢?變數(shù)(性狀)之間是平行的關(guān)系簡化數(shù)據(jù),如:產(chǎn)量、生育期等性狀的構(gòu)成要素很多,可從中找出影響大的要素一個性狀的數(shù)據(jù)比較難以獲得時,找出一個與之相關(guān)性大的數(shù)據(jù)容易獲得的性狀取代之3直線相關(guān)如何判斷直線相關(guān)關(guān)系的存在呢?先作scatterplot,散點圖是直觀地觀察連續(xù)變化變量間關(guān)系的重要工具用直線描述用曲線描述可能有周期變化無明顯關(guān)系相關(guān)性有多大?3直線相關(guān)相關(guān)系數(shù)設(shè)有一X、Y均為隨機(jī)變量的雙變數(shù)總體,具有N對(X,Y)。若在標(biāo)有這N個(X,Y)坐標(biāo)點的直角坐標(biāo)上移動坐標(biāo)軸,將X軸和Y軸分別平移到μX和μY上,則各點位置不變,而所取坐標(biāo)變?yōu)?X-μX,Y-μY)3直線相關(guān)IIIIVIII3直線相關(guān)IIIIVIII3直線相關(guān)IIIIVIII3直線相關(guān)

的值可用來度量兩個變數(shù)直線相關(guān)程度和性質(zhì)但是,X和Y的變異程度、所取單位及N的大小都會影響3直線相關(guān)為了具有可比性,需要將離均差轉(zhuǎn)化為標(biāo)準(zhǔn)化離均差,再以N除之,從而得到雙變數(shù)總體的相關(guān)系數(shù)為:3直線相關(guān)決定系數(shù)(determinationcoefficient)從這個等式可以看出:y與x直線回歸效果的好壞取決于回歸平方和

和離回歸平方和或者說回歸效果取決于回歸平方和在總平方和中所占的比例3直線相關(guān)決定系數(shù)(determinationcoefficient)即:這個比例越大,y與x的直線回歸效果就越好,反之則差。我們把上式的比值叫做x對y的決定系數(shù),記為r23直線相關(guān)決定系數(shù)(determinationcoefficient)決定系數(shù)的大小表示了回歸方程可靠程度的高低,或者說表示了回歸直線擬合度的高低。

0≤r2≤1

決定系數(shù)表示了兩個互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。3直線相關(guān)決定系數(shù)(determinationcoefficient)因為如果獲得了一個回歸方程:

y=a+bxbyx=b如果將x變?yōu)橐雷償?shù),方程可變?yōu)?/p>

x=-a/b+1/b*ybxy=1/b

那么r2=1forever!Why?根據(jù)函數(shù)關(guān)系獲得的3直線相關(guān)根據(jù)統(tǒng)計關(guān)系獲得的決定系數(shù)會是怎樣的?如例1

以積溫x為依變數(shù),盛發(fā)期y為自變數(shù),回歸方程為:

x=42.0-0.64y

以盛發(fā)期y為依變數(shù),積溫x為自變數(shù),回歸方程為:

y=48.5-1.1x

那么

r2=-0.64×(-1.1)=0.7因有誤差的存在使統(tǒng)計關(guān)系不同于函數(shù)關(guān)系3直線相關(guān)但決定系數(shù)介于0和1之間,不能反應(yīng)直線關(guān)系的性質(zhì)——是同向增減或是異向增減若求r2的平方根,且取平方根的符號與乘積和SPxy的符號一致,這樣求出的平方根既可表示y與x的直線相關(guān)的程度,也可表示直線相關(guān)的性質(zhì)。3直線相關(guān)把這樣計算所得的統(tǒng)計量稱為x與y的相關(guān)系數(shù)(coefficientofcorrelation),記為r,即3直線相關(guān)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加3直線相關(guān)相關(guān)關(guān)系都有哪些類型呢?相關(guān)關(guān)系非線性相關(guān)線性相關(guān)正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)完全相關(guān)不相關(guān)0<r<1-1<r<0r=0r=0零相關(guān)正相關(guān)負(fù)相關(guān)零相關(guān)r=0r=0r=-1r=1完全正相關(guān)完全負(fù)相關(guān)零相關(guān)零相關(guān)3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?決定系數(shù)是相關(guān)系數(shù)的平方值除|r|=1or0外,r2<|r|

因此,決定系數(shù)可以防止對相關(guān)系數(shù)所表示的相關(guān)程度作夸張的解釋r值可正可負(fù),而r2都取正值,因此,在相關(guān)分析中可以將兩者結(jié)合起來,即由r表示正或負(fù)的相關(guān)性質(zhì),由r2表示相關(guān)的程度在多元回歸分析中r2是表示一個回歸方程優(yōu)劣的重要參數(shù)3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?相關(guān)系數(shù)實際是兩個回歸系數(shù)的幾何平均值。這正反映了相關(guān)與回歸的不同:相關(guān)是雙向的關(guān)系,而回歸是單向的。3直線相關(guān)相關(guān)系數(shù)和決定系數(shù)有何區(qū)別?直線回歸分析側(cè)重于尋求它們之間的聯(lián)系形式

——直線回歸方程直線相關(guān)分析側(cè)重于揭示它們之間的聯(lián)系程度和性質(zhì)

——計算出相關(guān)系數(shù)。兩種分析所進(jìn)行的顯著性檢驗都是解決y與x間是否存在直線關(guān)系。因而二者的檢驗是等價的。

3直線相關(guān)所獲得的r值有統(tǒng)計學(xué)意義嗎?由于有抽樣誤差的,r是否能真正地表明相關(guān)關(guān)系的存在,還需進(jìn)一步進(jìn)行假設(shè)檢驗ρ=0的假設(shè)檢驗r本身不服從某個已知的理論分布,但當(dāng)n>5時ρ=0總體中的抽樣分布近似與正態(tài)分布,因此,可用t檢驗,統(tǒng)計量為:3直線相關(guān)根據(jù)例1的資料r=-0.8344,作假設(shè)檢驗提出假設(shè):H0:

;H1:

0確定顯著水平計算得t=-4.05|t|>t0.01否定原假設(shè),認(rèn)為線性關(guān)系是真實存在的3直線相關(guān)與本例中回歸系數(shù)的t檢驗相比較,我們會發(fā)現(xiàn),相關(guān)系數(shù)假設(shè)檢驗的t值和回歸系數(shù)的t值是相同的兩種分析所進(jìn)行的顯著性檢驗都是解決y與x間是否存在直線關(guān)系。因而二者的檢驗是等價的。在實際應(yīng)用中,對同一資料而言,兩種檢驗只選其一即可。3直線相關(guān)ρ=C的假設(shè)檢驗?zāi)康臅r為了檢驗實得的r與某一指定的或理論的相關(guān)系數(shù)C是否有顯著差異在ρ≠0時,r的抽樣分布有很大的偏態(tài),需對r進(jìn)行反雙曲正切變換3直線相關(guān)ρ=C的假設(shè)檢驗r>0r<0Z具有近似的正態(tài)分布,可用統(tǒng)計量u進(jìn)行檢驗3直線相關(guān)直線回歸和相關(guān)都有哪些內(nèi)在關(guān)系?直線回歸與相關(guān)的性質(zhì)或方向相同,顯著性檢驗等價。相關(guān)系數(shù)是標(biāo)準(zhǔn)化的回歸系數(shù)?;貧w系數(shù)是有單位的,但若對b作消去單位的標(biāo)準(zhǔn)化處理,即對b中x和y的離均差以各自的標(biāo)準(zhǔn)差sx

和sy為單位,則有:3直線相關(guān)3直線相關(guān)直線回歸和相關(guān)都有哪些內(nèi)在關(guān)系?相關(guān)系數(shù)r是y依x的回歸系數(shù)和x依y的回歸系數(shù)的幾何平均數(shù)3直線相關(guān)直線回歸何相關(guān)都有哪些內(nèi)在關(guān)系?線性回歸方程也可以用相關(guān)系數(shù)表示3直線相關(guān)直線回歸何相關(guān)都有哪些內(nèi)在關(guān)系?線性回歸和離回歸平方和也可用相關(guān)系數(shù)表示3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點直線回歸分析與相關(guān)分析在生物科學(xué)研究領(lǐng)域中已得到了廣泛的應(yīng)用,但在實際工作中卻很容易被誤用或作出錯誤的解釋。必須注意以下幾點:回歸和相關(guān)分析要有學(xué)科專業(yè)知識作指導(dǎo)要嚴(yán)格控制研究對象(X和Y)以外的有關(guān)因素。直線回歸和相關(guān)不顯著并不意味X和Y沒有關(guān)系3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點一個顯著的r或b并不代表X和Y的關(guān)系就一定是線性的。對難以發(fā)現(xiàn)X和Y的真實曲線關(guān)系,允許X和Y在一定的范圍之內(nèi)用線性關(guān)系進(jìn)行描述,但是使用范圍也必須嚴(yán)格限制在觀察值范圍之內(nèi)3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點一個顯著的相關(guān)或回歸并不一定具有實踐上的預(yù)測意義。例如,當(dāng)ν=50時,|r|=0.273即顯著,但r2=0.074,表明X和Y可用線性關(guān)系說明的部分僅占總變異的7.4%,未說明的部分占92.6%,顯然由X預(yù)測Y并不可靠因此,當(dāng)需要用X預(yù)測Y時要求|r|>0.7。3直線相關(guān)直線回歸和相關(guān)的應(yīng)用要點為了提高回歸和相關(guān)分析的準(zhǔn)確性,兩個變數(shù)的樣本容量n(觀察值對數(shù))要盡可能大,最小不能低于5第五節(jié)

協(xié)方差分析田間試驗設(shè)計與統(tǒng)計分析Analysisofcovariance5.1協(xié)方差分析的意義和功用

一、協(xié)方差分析的意義協(xié)方差(covariance)是兩個變數(shù)的互變異數(shù)總體協(xié)方差定義樣本協(xié)方差定義稱為均積(meanproducts)或協(xié)方,記作MP5.1協(xié)方差分析的意義和功用

5.1協(xié)方差分析的意義和功用

方差與協(xié)方差VariancexX變異Covariancex,yx,y協(xié)同變異5.1協(xié)方差分析的意義和功用

方差分析與協(xié)方差分析方差分析變異平方和自由度SStSSe協(xié)方差分析變異乘積和自由度SPtSPe回歸分析相關(guān)分析5.1協(xié)方差分析的意義和功用

二、協(xié)方差分析的功用統(tǒng)計控制估計協(xié)方差分量5.1協(xié)方差分析的意義和功用

統(tǒng)計控制試驗設(shè)計的基本原則隨機(jī)重復(fù)局部控制試驗控制5.1協(xié)方差分析的意義和功用

統(tǒng)計控制在有些情況下,試驗控制很難做到如:研究幾種生長素對減少番茄落花落果的效應(yīng)要求番茄的花序上的初始花數(shù)相同若初始花數(shù)與落花落果率存在線性回歸關(guān)系y=a+bx將落花落果率矯正到初始花數(shù)都相同時的落花落果率統(tǒng)計控制5.1協(xié)方差分析的意義和功用

估計協(xié)方差分量方差分析中根據(jù)均方MS與期望均方EMS間的關(guān)系可獲得不同變異來源的方差分量估計值協(xié)方差分析中也可以根據(jù)均積MP與期望均積EMP間的關(guān)可獲得不同變異來源的協(xié)方差分量估計值5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成設(shè)有k組回歸樣本,每組各有n對觀察值處理處理1…處理k觀測指標(biāo)xy…xy觀測值xij、yij(i=1,2,…kj=1,2,…n)x11x12…x1j…x1ny11y12…y1j…y1n…xk1xk2…xkj…xknyk1yk2…ykj…ykn5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成每個y觀察值不僅具有組效應(yīng)和隨機(jī)誤差,還受x變數(shù)的影響為第i個處理效應(yīng)為經(jīng)回歸矯正的處理平均數(shù)為Y依X的回歸系數(shù)5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成ay’ij如在觀察值中剔除處理效應(yīng),則協(xié)方差分析就是與x的線性回歸分析5.2單向分組資料的協(xié)方差分析

一、資料模式與線性組成對觀察值進(jìn)行回歸矯正,除去x不同的影響,則協(xié)方差分析就是的方差分析5.2單向分組資料的協(xié)方差分析

二、乘積和和自由度的分解根據(jù)方差分析中平方和分解的原理,協(xié)方差分析中總乘積和SPT也可分為組間SPt和組內(nèi)SPe兩部分5.2單向分組資料的協(xié)方差分析

例:為了研究A、B、C三種肥料對于蘋果的增產(chǎn)效果,選了24株同齡蘋果樹,第一年記下各樹的產(chǎn)量(x),第二年將每種肥料隨機(jī)施于8株蘋果樹上,再記下其產(chǎn)量(y),結(jié)果見下表肥料觀察值A(chǔ)x4758534649565444y5466635156666150BX5253645859616366Y5453676262636469CX4448465059575853y5258546170646966三、回歸關(guān)系的協(xié)方差分析5.2單向分組資料的協(xié)方差分析

三、回歸關(guān)系的協(xié)方差分析對x和y分別進(jìn)行方差分析,可得如下結(jié)果變異來源DFx變數(shù)y變數(shù)SSMSFSSMSF肥料間2356.08178.046.34**60.75030.375<1肥料內(nèi)21587528.083830.873565總變異23945.83891.62推斷可靠嗎?5.2單向分組資料的協(xié)方差分析

上述推斷是否可靠受以下條件限制:如x和y之間沒有回歸關(guān)系,那么上述推斷是正確的如果x和y之間有回歸關(guān)系,那么上述推斷就是不可靠的需要將x對y的影響消除后,才能檢驗處理間是否真正存在顯著差異利用專業(yè)知識進(jìn)行分析:x和y是同一株蘋果樹上相鄰兩年的產(chǎn)量,第一年是基礎(chǔ),第二年產(chǎn)量是在原基礎(chǔ)上的發(fā)展,兩者具有因果關(guān)系x,y之間是否存在直線回歸關(guān)系專業(yè)知識分析回歸的顯著性測驗NoANOVA(y)Yes測驗矯正平均數(shù)之間的差異顯著性No無差異Yes矯正平均數(shù)的多重比較協(xié)方差分析的基本步驟5.2單向分組資料的協(xié)方差分析

測驗x和y是否存在直線回歸關(guān)系對處理內(nèi)項(誤差)作回歸分析測驗H0:β=0對HA≠0離回歸平方和Qe和自由度ve=k(n-1)-1如接受H0:β=0則表明該資料只能用Y變數(shù)值作方差分析如否定H0:β=0則表明x和y有著顯著的直線回歸關(guān)系,因而需要進(jìn)行以下步驟5.2單向分組資料的協(xié)方差分析

測驗x和y是否存在直線回歸關(guān)系5.2單向分組資料的協(xié)方差分析

測驗x和y是否存在直線回歸關(guān)系**否定H0:β=05.2單向分組資料的協(xié)方差分析

測驗矯正平均數(shù)間的差異顯著性校正y的總平方和與自由度,即總離回歸平方和與自由度5.2單向分組資料的協(xié)方差分析

測驗矯正平均數(shù)間的差異顯著性矯正y的誤差項平方和與自由度,即誤差離回歸平方和與自由度5.2單向分組資料的協(xié)方差分析

測驗矯正平均數(shù)間的差異顯著性矯正y的處理間平方和與自由度及F檢驗**5.2單向分組資料的協(xié)方差分析

處理平均數(shù)的矯正和矯正平均數(shù)的多重比較已經(jīng)算得y依x的回歸系數(shù)b=1.1515說明無論哪個處理,若x增加一個單位,y則平均將增加b=1.1515個單位對y的矯正可用以下公式5.2單向分組資料的協(xié)方差分析

處理平均數(shù)的矯正和矯正平均數(shù)的多重比較對于是:肥料B=肥料C>肥料A對于是:肥料C>肥料A>肥料B5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較矯正數(shù)差數(shù)的標(biāo)準(zhǔn)誤假設(shè)5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較根據(jù)上式可對矯正平均數(shù)的差異顯著性做出測驗還可以使用LSD、LSR等方法進(jìn)行多重比較5.2單向分組資料的協(xié)方差分析

矯正平均數(shù)的多重比較測驗不同肥料效應(yīng)的矯正平均數(shù)的差異顯著性時,算得:肥料A和B:t=6.84**肥料A與C:t=-2.844*肥料B與C:t=-512**肥料矯正后的蘋果產(chǎn)量差異顯著性5%1%C64.29aAA62.06bAB55.51cB5.2單向分組資料的協(xié)方差分析

本例中,不考慮第一年產(chǎn)量對第二年產(chǎn)量的影響時,通過方差分析,不同肥料對蘋果產(chǎn)量的效應(yīng)是不顯著的如考慮了第一年產(chǎn)量對第二年產(chǎn)量的影響時,發(fā)現(xiàn)它們之間存在回歸關(guān)系,用協(xié)方差分析時發(fā)現(xiàn),不同肥料對蘋果產(chǎn)量的效應(yīng)差異是顯著的。因此,正確的試驗設(shè)計、嚴(yán)格的試驗控制和相應(yīng)的統(tǒng)計方法,對于獲得正確的試驗結(jié)論是十分重要的5.2單向分組資料的協(xié)方差分析

協(xié)方差分析步驟總結(jié):測驗x和y是否存在直線回歸關(guān)系如不存在直線回歸關(guān)系,直接作方差分析測驗矯正平均數(shù)間的差異顯著性如矯正平均數(shù)間差異顯著,則算出各個矯正平均數(shù)并進(jìn)行多重比較,作出相應(yīng)的統(tǒng)計推斷5.3兩向分組資料的協(xié)方差分析例:對6個菜豆品種(k=6)進(jìn)行維生素C含(y,mg/100g)比較試驗,4次重復(fù)(n=4),隨機(jī)區(qū)組設(shè)計根據(jù)前人的研究,菜豆維生素C含量不僅與品種有關(guān),而且與豆莢的成熟度有關(guān)。但在試驗中又無法使所有小區(qū)的豆莢都同時成熟,所以同時測定了100g所采豆莢干物重百分率x,作為豆莢成熟度指標(biāo)。測定結(jié)果列于表,試作協(xié)方差分析5.3兩向分組資料的協(xié)方差分析菜豆品種的維生素C含量與豆莢干物重百分率測定結(jié)果品種區(qū)組I

區(qū)組II區(qū)組III區(qū)組IV合計平均xi1yi1xi2yi2xi3yi3xi4yi4xi·yi·A134.093.033.494.834.791.738.980.8141.0360.335.2590.08A23647.33851.551.233.352.027.2182.615345.65383A331.781.430.110033.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論