版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第八章 直線回歸與相關(guān),變量間的關(guān)系有兩類 一類是函數(shù)關(guān)系,變量間存在著完全確定性的關(guān)系,可以用精確的數(shù)學(xué)表達(dá)式來(lái)表示,如長(zhǎng)方形的面積(S)與長(zhǎng)(a)和寬(b)的關(guān)系可以表達(dá)為:S=ab。它們之間的關(guān)系是確定性的,只要知道了其中一個(gè)變量的值就可以精確地計(jì)算出另一個(gè)變量的值,這類變量間的關(guān)系稱為函數(shù)關(guān)系。,另一類是相關(guān)關(guān)系,變量間關(guān)系不存在完全的確定性關(guān)系,不能用精確的數(shù)學(xué)公式來(lái)表示。 如人的身高與體重的關(guān)系;仔豬初生重與斷奶重的關(guān)系;豬瘦肉率與背膘厚度、眼肌面積、胴體長(zhǎng)等的關(guān)系等等,這些變量間都存在著十分密切的關(guān)系,但不能由一個(gè)或幾個(gè)變量的值精確地求出另一個(gè)變量的值。 像這樣一類關(guān)系在生物界中
2、是大量存在的,統(tǒng)計(jì)學(xué)中把這些變量間的關(guān)系稱為相關(guān)關(guān)系,把存在相關(guān)關(guān)系的變量稱為相關(guān)變量。,對(duì)于兩個(gè)相關(guān)變量(也稱協(xié)變量)關(guān)系一般分為兩種 一種是因果關(guān)系,即一個(gè)變量的變化受另一個(gè)或幾個(gè)變量的影響,如仔豬的生長(zhǎng)速度受遺傳、營(yíng)養(yǎng)、飼養(yǎng)管理等因素的影響,子女的身高受父母身高的影響; 另一種是平行關(guān)系,即兩個(gè)以上變量之間共同受到另外因素的影響,如人的身高和體重之間的關(guān)系,兄弟身高之間的關(guān)系等都屬于平行關(guān)系。變量間的關(guān)系及分析方法歸納如下:,對(duì)于兩個(gè)相關(guān)變量(也稱協(xié)變量),一個(gè)變量用符號(hào)x表示,另一個(gè)變量用y表示,如果通過(guò)試驗(yàn)或調(diào)查獲得兩個(gè)變量的成對(duì)觀測(cè)值,可表示為(x1,y1),(x2,y2),(xn
3、,yn)。為了直觀地看出x和y間的變化趨勢(shì),可將每一對(duì)觀測(cè)值在平面直角坐標(biāo)系描點(diǎn),作出散點(diǎn)圖(見圖9-1)。,圖9-1 (x,y)的散點(diǎn)圖,從散點(diǎn)圖(圖9-1)可以看出: 兩個(gè)變量間關(guān)系的性質(zhì)(是正相關(guān)還是負(fù)相關(guān))和程度(是相關(guān)密切還是不密切); 兩個(gè)變量間關(guān)系的類型,是直線型還是曲線型; 是否有異常觀測(cè)值的干擾。散點(diǎn)圖直觀地、定性地表示了兩個(gè)變量之間的關(guān)系。為了探討它們之間的規(guī)律性,還必須根據(jù)觀測(cè)值將其內(nèi)在關(guān)系定量地表達(dá)出來(lái),統(tǒng)計(jì)學(xué)上一般采用回歸分析(regression analysis)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。 表示原因的變量稱為自變量,表示結(jié)果的變量稱為依變量。 研究“一因一
4、果”,即一個(gè)自變量與一個(gè)依變量的回歸分析稱為一元回歸分析;研究“多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種,回歸分析的任務(wù)是揭示出呈因果關(guān)系的相關(guān)變量間的聯(lián)系形式,建立它們之間的回歸方程,利用所建立的回歸方程,由自變量(原因)來(lái)預(yù)測(cè)、控制依變量(結(jié)果)。,統(tǒng)計(jì)學(xué)上一般采用相關(guān)分析(correlation analysis)研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。 對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為簡(jiǎn)單相關(guān)分析(也叫直線相關(guān)分析);對(duì)多個(gè)變量進(jìn)行相關(guān)分析時(shí), 研究一
5、個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析;研究其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)分析。 在相關(guān)分析中,變量無(wú)自變量和依變量之分。相關(guān)分析只能研究?jī)蓚€(gè)變量之間相關(guān)的程度和性質(zhì)或一個(gè)變量與多個(gè)變量之間相關(guān)的程度,不能用一個(gè)或多個(gè)變量去預(yù)測(cè)、控制另一個(gè)變量的變化,這是回歸分析與相關(guān)分析區(qū)別的關(guān)鍵所在。 但是二者也不能截然分開,因?yàn)橛苫貧w分析可以獲得相關(guān)的一些重要信息,由相關(guān)分析也能獲得回歸的一些重要信息。,第一節(jié) 直線回歸,一、直線回歸方程的建立 直線回歸是回歸分析中最基本、最簡(jiǎn)單的一種,故又稱為簡(jiǎn)單回歸。 回歸關(guān)系是對(duì)每一個(gè)x的取值xi,都有y的一個(gè)分布與之對(duì)應(yīng),而不是一個(gè)確
6、定的yi與之相對(duì)應(yīng)。但是,當(dāng)xxi時(shí),yi的平均數(shù)y/xxi是與之相對(duì)應(yīng)的,y/xxi稱為y的條件平均數(shù)。在這種情況下,我們可以用直線回歸方程來(lái)描述x與y的關(guān)系,其一般形式為: (i=1,2, , n) (91) 其中,x是自變量,是與x值相對(duì)應(yīng)的倚變量y的條件平均值的點(diǎn)估計(jì)。,回歸直線在平面坐標(biāo)系中的位置取決于a、b的取值,為了使能最好地反應(yīng)y和x兩變量間的數(shù)量關(guān)系,根據(jù)最小二乘法,a、b應(yīng)使回歸估計(jì)值與觀測(cè)值的偏差平方和最小,即: 最小。,根據(jù)微積分學(xué)中的極值原理,令 Q對(duì)a、b的一階偏導(dǎo)數(shù)等于0,即: 整理得關(guān)于a、b的正規(guī)方程組:,a叫做樣本回歸截距,是回歸直線與y軸交點(diǎn)的縱坐標(biāo),當(dāng)x
7、=0時(shí),=a;b叫做樣本回歸系數(shù),表示x改變一個(gè)單位,y平均改變的數(shù)量;b的符號(hào)反映了 x影響y的性質(zhì),b的絕對(duì)值大小反映了x影響y的程度。,圖9-2 直線回歸方程的圖象,a和b均可取正值,也可取負(fù)值,因具體資料而異,由圖9-2可以看出,a0,表示回歸直線在第一象限與y軸相交;a0,表示y隨x的增加而增加;b0;表示y隨x的減少而減少;b=0或與0差異不顯著時(shí),表示y的變化與x的取值無(wú)關(guān),兩變量間不存在直線回歸關(guān)系。這只是對(duì)a和b的統(tǒng)計(jì)學(xué)解釋,對(duì)于具體資料,a和b往往還有專業(yè)上的實(shí)際意義。 叫做回歸估計(jì)值,是當(dāng)x在在其研究范圍內(nèi)取某一個(gè)值時(shí),y值平均數(shù)估計(jì)值。,可發(fā)現(xiàn)回歸方程的三個(gè)基本性質(zhì):,
8、F檢驗(yàn)的結(jié)果與t檢驗(yàn)的結(jié)果一致。事實(shí)上,統(tǒng)計(jì)學(xué)已證明,在直線回歸分析中,這二種檢驗(yàn)方法是等價(jià)的,可任選一種進(jìn)行檢驗(yàn)。 由于孵化歷期平均溫度(x)與歷期天數(shù)(y)之間存在顯著的直線關(guān)系。因此,可以通過(guò)黏蟲孵化歷期平均溫度(x)對(duì)孵化歷期天數(shù)(y)作出預(yù)測(cè)或控制。 特別要指出的是:利用直線回歸方程進(jìn)行預(yù)測(cè)或控制時(shí),一般只適用于原來(lái)研究的范圍,不能隨意把范圍擴(kuò)大,因?yàn)樵谘芯康姆秶鷥?nèi)兩變量是直線關(guān)系,這并不能保證在這研究范圍之外仍然是直線關(guān)系。,*四、直線回歸的區(qū)間估計(jì) 前面已求出了總體回歸截距a、回歸系數(shù)和x所對(duì)應(yīng)的y值總體平均數(shù)a+x的估計(jì)值a,b和 。這僅是一種點(diǎn)估計(jì)。下面在一定置信度下對(duì)、以及+x作出區(qū)間估計(jì)。,由圖9-5可以看出,單個(gè)y的置信帶要比 的置信帶寬,x偏離越遠(yuǎn),置信帶越寬,預(yù)測(cè)效果越差。 通過(guò)圖9-5中與單個(gè)y的95置信帶,就可由黏蟲孵化歷期平均溫度對(duì)孵化歷期天數(shù)直接作出預(yù)報(bào)。,第二節(jié) 直線相關(guān),如果兩個(gè)變量間呈線性關(guān)系,又不需要由x來(lái)估計(jì)y,只需要了解x和y的相關(guān)程度以及相關(guān)性質(zhì),就可以直線相關(guān)分析。 進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y的實(shí)際觀測(cè)值,計(jì)算表示兩個(gè)相關(guān)變量x、y間線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)量相關(guān)系數(shù)r并進(jìn)行顯著性檢驗(yàn)。,相關(guān)系數(shù)和決定系數(shù) 設(shè)有一雙變量總體資料,總體個(gè)數(shù)為N,這N對(duì)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025石方爆破專業(yè)施工合同
- 2025餐館合作經(jīng)營(yíng)合同
- 特殊人群的出行安全保障措施研究
- 網(wǎng)絡(luò)安全產(chǎn)品銷售中的技術(shù)合同法律解析
- 課題申報(bào)參考:康區(qū)佛苯藝術(shù)中的儒家人物形象演變與漢藏文化交融研究
- 環(huán)保理念下的小型機(jī)械設(shè)備創(chuàng)新設(shè)計(jì)實(shí)踐探討
- 2024年高等教育服務(wù)項(xiàng)目資金籌措計(jì)劃書
- 跨學(xué)科學(xué)習(xí)模式下的學(xué)生個(gè)性化發(fā)展
- 2025年人教版PEP七年級(jí)物理上冊(cè)階段測(cè)試試卷含答案
- 2025年蘇科新版必修1地理上冊(cè)階段測(cè)試試卷含答案
- 2025貴州貴陽(yáng)市屬事業(yè)單位招聘筆試和高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024年住院醫(yī)師規(guī)范化培訓(xùn)師資培訓(xùn)理論考試試題
- 期末綜合測(cè)試卷(試題)-2024-2025學(xué)年五年級(jí)上冊(cè)數(shù)學(xué)人教版
- 2024年廣東省公務(wù)員錄用考試《行測(cè)》試題及答案解析
- 結(jié)構(gòu)力學(xué)本構(gòu)模型:斷裂力學(xué)模型:斷裂力學(xué)實(shí)驗(yàn)技術(shù)教程
- 2024年貴州省中考理科綜合試卷(含答案)
- 無(wú)人機(jī)技術(shù)與遙感
- PDCA提高臥床患者踝泵運(yùn)動(dòng)的執(zhí)行率
- 新東方四級(jí)詞匯-正序版
- 借名購(gòu)車位協(xié)議書借名購(gòu)車位協(xié)議書模板(五篇)
- 同步輪尺寸參數(shù)表詳表參考范本
評(píng)論
0/150
提交評(píng)論