統(tǒng)計(jì)學(xué)基礎(chǔ)第八章課件_第1頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章課件_第2頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章課件_第3頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章課件_第4頁(yè)
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章課件_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章 相關(guān)與回歸第一節(jié) 相關(guān)關(guān)系的概念與種類(lèi)一、變量之間的關(guān)系1.函數(shù)關(guān)系(也稱(chēng)確定性關(guān)系) 即變量之間存在著確定的依存關(guān)系。其特點(diǎn)是對(duì)于一個(gè)或一組變量的每一確定的值,另一個(gè)變量都有惟一確定的值與之對(duì)應(yīng),這種關(guān)系能用函數(shù)來(lái)表達(dá)。例如對(duì)于商品的銷(xiāo)售額,當(dāng)價(jià)格P不變時(shí),銷(xiāo)售額Y由銷(xiāo)售量X惟一確定,X與Y具有一一對(duì)應(yīng)的確定性關(guān)系,可以用 這種函數(shù)來(lái)表達(dá),這種關(guān)系就是函數(shù)關(guān)系。2.相關(guān)關(guān)系(也稱(chēng)非確定性關(guān)系) 即變量之間顯然存在著密切的關(guān)系,但不是確定的依存關(guān)系。其特點(diǎn)是對(duì)于一個(gè)(或一組)變量的每一個(gè)確定的值,另一個(gè)變量有多個(gè)值與之對(duì)應(yīng),這種關(guān)系不能用普通函數(shù)來(lái)表達(dá)。例如單位面積上的糧食產(chǎn)量與施肥量

2、有關(guān),即在一定范圍內(nèi),隨著施肥量的增加,糧食產(chǎn)量也相應(yīng)有所提高。 二、相關(guān)關(guān)系的分類(lèi)1.單相關(guān)和復(fù)相關(guān) 從變量的多少來(lái)看,相關(guān)可以分為單相關(guān)和復(fù)相關(guān)。單相關(guān)也稱(chēng)一元相關(guān),是指兩個(gè)變量間的相關(guān)關(guān)系;復(fù)相關(guān)也稱(chēng)多元相關(guān),是指三個(gè)或三個(gè)以上變量間的相關(guān)關(guān)系。 (二)線性相關(guān)和非線性相關(guān) 從變量之間相互關(guān)系的表現(xiàn)形式來(lái)看,相關(guān)可以分為線性相關(guān)和非線性相關(guān)。線性相關(guān)也稱(chēng)直線相關(guān),是指當(dāng)一個(gè)變量每增(減)1個(gè)單位,另一相關(guān)變量按一個(gè)近似固定的增(減)量變化。從散點(diǎn)圖上看,其觀測(cè)點(diǎn)的分布近似地表現(xiàn)為一條直線形式,見(jiàn)圖8-1(a)與(b)所示;非線性相關(guān)也稱(chēng)曲線相關(guān),是指當(dāng)一個(gè)變量每增(減)1個(gè)單位,另一相關(guān)

3、變量按不固定的增(減)量變化。從散點(diǎn)的分布近似地表現(xiàn)為某種曲線形式。見(jiàn)圖8-2所示。XYXY(a) 正線性相關(guān) (b) 負(fù)線性相關(guān)圖8-1 線性相關(guān)關(guān)系XY圖8-2 非線性相關(guān) (三)正相關(guān)和負(fù)相關(guān) 從變量之間變化的方向來(lái)看,線性相關(guān)可以分為正相關(guān)和負(fù)相關(guān)。正相關(guān)是指相關(guān)變量按同一方向變化,即當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的值也相應(yīng)地增加,見(jiàn)圖8-1(a)所示;負(fù)相關(guān)是指相關(guān)變量按反方向變化,即當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的值卻相應(yīng)地減少,見(jiàn)圖8-1(b)所示。XYXY(a) 正線性相關(guān) (b) 負(fù)線性相關(guān)圖8-1 線性相關(guān)關(guān)系XY圖8-2 非線性相關(guān) (四)完全相關(guān)、不相關(guān)和不完全相關(guān)

4、 從變量之間關(guān)系的密切程度來(lái)看,相關(guān)可以分為完全相關(guān)、不相關(guān)和不完全相關(guān)。完全相關(guān)是指變量之間的關(guān)系是函數(shù)關(guān)系,見(jiàn)圖8-3所示。不相關(guān)是指變量之間不存在關(guān)系,相互獨(dú)立,見(jiàn)圖8-4所示。不完全相關(guān)是指變量之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,見(jiàn)圖8-1和圖8-2所示。相關(guān)分析和回歸分析研究的主要是不完全相關(guān)的問(wèn)題。XYXY 圖8-3 完全相關(guān) 圖8-4 不相關(guān)第二節(jié) 相關(guān)分析的內(nèi)容與方法一、相關(guān)分析的主要內(nèi)容 (1)研究現(xiàn)象之間有無(wú)依存關(guān)系存在,以及依存關(guān)系的表現(xiàn)形式。 這是相關(guān)分析的出發(fā)點(diǎn)。有相互依存關(guān)系才能用相關(guān)分析方法進(jìn)行分析研究,沒(méi)有關(guān)系而當(dāng)作有關(guān)系會(huì)導(dǎo)致錯(cuò)誤的結(jié)果。關(guān)系表現(xiàn)為什么樣的形式

5、,就需要使用什么樣的分析方法。把曲線相關(guān)當(dāng)作直線相關(guān)來(lái)進(jìn)行分析,也會(huì)使認(rèn)識(shí)發(fā)生偏差。 (2)研究相關(guān)關(guān)系的密切程度。相關(guān)關(guān)系是一種數(shù)量關(guān)系不嚴(yán)格的相互依存關(guān)系,相關(guān)分析的一個(gè)目的就是從這種不嚴(yán)格的關(guān)系中想辦法來(lái)判斷它們之間關(guān)系的密切程度。判斷相關(guān)關(guān)系密切程度的主要方法是計(jì)算相關(guān)系數(shù)和繪制相關(guān)圖。二、相關(guān)分析的主要方法(一)相關(guān)表與相關(guān)圖 1相關(guān)表 相關(guān)表是統(tǒng)計(jì)表的一種表現(xiàn)形式。根據(jù)資料是否分組,相關(guān)表可分為簡(jiǎn)單相關(guān)表和分組相關(guān)表。 (1)簡(jiǎn)單相關(guān)表是資料未經(jīng)分組的相關(guān)表。這是把影響因素(稱(chēng)自變量)的標(biāo)志值與被影響因素( 稱(chēng)因變量) 的標(biāo)志值按著從小到大一一對(duì)應(yīng)平行排列起來(lái)的統(tǒng)計(jì)表。例如,某廠的

6、機(jī)床使用年限與維修費(fèi)用資料如表 8-1所示。機(jī)床編號(hào)12345678910使用年限3344556677維修費(fèi)用(元)400540520620600740700760700820表 8-l機(jī)床使用年限與維修費(fèi)用相關(guān)表 (2)分組相關(guān)表。如果原始資料很多,繪制相關(guān)圖、編制簡(jiǎn)單相關(guān)表都不方便,可以編制分組相關(guān)表。 分組相關(guān)表是將原始資料進(jìn)行分組而編制的相關(guān)表。按分組的情況不同,分為單變量分組表與雙變量分組表兩種。 1)單變量分組表,是具有相關(guān)關(guān)系的兩個(gè)變量中,只根據(jù)一個(gè)變量進(jìn)行分組,計(jì)算出變量組和平均數(shù)的相關(guān)表。例如為研究某縣 40 塊耕地每畝施肥量與小麥畝產(chǎn)量的相依關(guān)系,編制單變量分組表見(jiàn)表 8-

7、2。按施肥量分組(kg/畝)畝 數(shù)/畝產(chǎn)量(kg)平均畝產(chǎn)量(kg/畝)75以下659098.375-10091125125.0100-12571140162.912531503175以上51055211.0表 8-2 40 塊耕地每畝施肥量與小麥畝產(chǎn)量分組相關(guān)表雙變量分組表,是對(duì)自變量和因變量都進(jìn)行分組編制的相關(guān)表。 雙變量分組表也叫棋盤(pán)式相關(guān)表。如果將上述40塊耕地每畝施肥量與小麥畝產(chǎn)量的資料編制成雙變量分組表如表 8-3 。按每畝施肥量分組/kg按畝產(chǎn)量分組/kg合計(jì)110以下110-145145-180180-215215-25017

8、5以上325150-l7577125-150246100-12561775-10081950-75426合 計(jì)410915240表 8-3 40塊耕地每畝施肥量與小麥畝產(chǎn)量相關(guān)表 2相關(guān)圖 相關(guān)圖是根據(jù)原始數(shù)據(jù)或分組表將對(duì)應(yīng)數(shù)值在坐標(biāo)圖上用點(diǎn)畫(huà)出來(lái),以表明相關(guān)點(diǎn)的分布狀況。一般地說(shuō),把自變量(x)置于橫軸上 ,因變量(y)置于縱軸上。通過(guò)相關(guān)圖,可以大致看出兩個(gè)現(xiàn)象之間有沒(méi)有關(guān)系,是什么樣的關(guān)系,密切程度如何。根據(jù)表 8-2 的資料,可繪制施肥量與小麥畝產(chǎn)量的相關(guān)圖,如圖 8-5 所示。圖 8-5 小麥畝產(chǎn)量與施肥量相關(guān)圖其中 y 表示小麥平均畝產(chǎn)量 ,x 表示每畝施肥量,單位為(公斤/ 畝)

9、。(二)相關(guān)系數(shù) 相關(guān)表和相關(guān)圖只能反映相關(guān)關(guān)系的方向和形態(tài),卻不能說(shuō)明相關(guān)關(guān)系的密切程度,為此,需要計(jì)算相關(guān)系數(shù)。相關(guān)系數(shù)是描述兩個(gè)現(xiàn)象之間線性相關(guān)關(guān)系密切程度的數(shù)字指標(biāo)。計(jì)算相關(guān)系數(shù)的方法很多,以英國(guó)統(tǒng)計(jì)學(xué)家皮爾生的積差法為基本方法,其公式為: (8.1)式中 r 稱(chēng)為相關(guān)系數(shù)。其中: ,稱(chēng)為 x 與 y 的協(xié)方差。,是x 的標(biāo)準(zhǔn)差。,是y 的標(biāo)準(zhǔn)差。所以相關(guān)系數(shù)可表示為 (8.1)【例8-1】以某廠機(jī)床使用年限與維修費(fèi)的資料為例說(shuō)明相關(guān)系數(shù)的計(jì)算。計(jì)算按下列步驟進(jìn)行: (1) 計(jì)算兩個(gè)數(shù)列的平均值。機(jī)床平均使用年限:(年)平均每臺(tái)機(jī)床維修費(fèi):(元)(2)計(jì)算表8-4上第 (3)到(7)各

10、欄數(shù)值 , 并得出合計(jì)數(shù)。 3. 計(jì)算自變量數(shù)列標(biāo)準(zhǔn)差 4. 計(jì)算因變量數(shù)列標(biāo)準(zhǔn)差 5. 計(jì)算相關(guān)系數(shù)用積差法計(jì)算相關(guān)系數(shù),需計(jì)算離差,計(jì)算過(guò)程較繁雜,實(shí)際工作中一般采用簡(jiǎn)算公式:(8. 3) 將表85的數(shù)據(jù)代入公式(8.23)可得=0.8602計(jì)算結(jié)果與按式(8.2)計(jì)算結(jié)果完全相同。表8-5 相關(guān)系數(shù)簡(jiǎn)算公式計(jì)算表公式(8.2)和(8.3)都是在相關(guān)表為簡(jiǎn)單表的情形下計(jì)算相關(guān)系數(shù)的公式。如果從單變量分組表計(jì)算相關(guān)系數(shù)則需要進(jìn)行加權(quán),若用積差法計(jì)算,其公式為:(8. 4)如果用簡(jiǎn)算公式計(jì)算則公式為:(8. 5) (三)相關(guān)密切程度的判斷 根據(jù)相關(guān)系數(shù) r 數(shù)值的大小判斷兩變量的密切程度如下:

11、 (1)當(dāng)|r|=1時(shí) ,x與y完全線性相關(guān),即x與y之間存在著確定的函數(shù)關(guān)系。 (2) 當(dāng)0|r|1 時(shí),表示x與y之間存在著一定的線性相關(guān)關(guān)系。|r|的數(shù)值愈大,愈接近于 1, 表示x與y的直線相關(guān)程度愈高;反之, |r|的數(shù)值愈小,愈接近于0, 表示x與y的直線相關(guān)程度愈低。通常,判斷電標(biāo)準(zhǔn)是:|r|0.3, 稱(chēng)為微弱相關(guān);0.3|r|0.5, 稱(chēng)為低度相關(guān);0.5|r|0.8, 稱(chēng)為顯著相關(guān)0.8|r|1, 稱(chēng)為高度相關(guān)。 (3) 當(dāng)r0 時(shí),表示x與y為正相關(guān);當(dāng) r0 時(shí),表示x與y為負(fù)相關(guān)。 (4)當(dāng)|r|=0時(shí),表示y的變化與x 無(wú)關(guān),即x與y完全沒(méi)有直線相關(guān)關(guān)系。第三節(jié) 回歸

12、分析一、回歸分析的主要內(nèi)容(1)確定相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式。(2)檢驗(yàn)所建立數(shù)學(xué)模型的可靠性。 二、回歸分析與相關(guān)分析的區(qū)別與聯(lián)系 回歸分析和相關(guān)分析是互相補(bǔ)充、密切聯(lián)系的。相關(guān)分析需要回歸分析來(lái)表明現(xiàn)象數(shù)量關(guān)系的具體形式,而回歸分析則應(yīng)該建立在相關(guān)分析的基礎(chǔ)上。依靠相關(guān)分析,表明現(xiàn)象的數(shù)量變化具有密切的相關(guān)關(guān)系后,進(jìn)行回歸分析才有意義。三、回歸分析的種類(lèi)(一)一元線性回歸 根據(jù)實(shí)測(cè)值繪制散點(diǎn)圖時(shí),如果圖中反映兩變量之間的關(guān)系呈直線趨勢(shì),則可以初步判定兩者之間存在線性關(guān)系,其關(guān)系式為:上式中 a 、b 的值確定后,直線也就確定了。在回歸分析中,a 、b的值確定后,則估計(jì)直線的方程可以寫(xiě)作: (8

13、.6)式中, 表示自變量;表示因變量的估計(jì)值。式(8.6)稱(chēng)為 對(duì) 的直線回歸方程或線性回歸模型,該直線稱(chēng)為回歸直線 ,b 稱(chēng)為回歸系數(shù)。 擬合回歸直線的主要問(wèn)題就在于估計(jì)待定參數(shù)a和b的值。常用的方法是最小二乘法,用這種方法求出的回歸直線是實(shí)測(cè)資料的“最佳”擬合直線。這和最小二乘法求直線趨勢(shì)方程一樣,只要將 (5.9) 式中時(shí)間變量的符號(hào) t 改為自變量x, 即可得如下方程組:解方程組得:(8.7)【例8-2】某產(chǎn)品的產(chǎn)量與單位成本的資料與有關(guān)計(jì)算結(jié)果見(jiàn)表 8-6。 從表中可大致地看出,單位成本 和產(chǎn)量 間具有線性負(fù)相關(guān)關(guān)系,即隨著產(chǎn)量的增加,單位成本不斷下降。設(shè)兩者的關(guān)系式為: 按公式(8

14、.7)計(jì)算a 、b的值為:= 所以回歸方程為:(8.8)此回歸方程表示產(chǎn)量每增加1000 件,單位成本平均下降1.82 元。我們知道當(dāng)回歸系數(shù) b 的符號(hào)為正時(shí),自變量和因變量按相同方向變動(dòng);當(dāng) b 的符號(hào)為負(fù)時(shí),自變量和因變量按相反方向變動(dòng)。這里 b=-1.82, 說(shuō)明產(chǎn)量與單位成本成反比例變化,即產(chǎn)量越大,成本越低。當(dāng)給定自變量一個(gè)值時(shí),我們可以根據(jù)回歸方程來(lái)估計(jì)或預(yù)測(cè)因變量的平均可能值。例如,若產(chǎn)量為 6000 件,代入回歸方程可算得平均單位成本為:( 元 )(二)回歸效果檢驗(yàn)(8.9)用8-2中的資料來(lái)說(shuō)明回歸標(biāo)準(zhǔn)差的計(jì)算方法。中間數(shù)據(jù)的計(jì)算見(jiàn)表 8-7表 87 估計(jì)標(biāo)準(zhǔn)誤差計(jì)算表 把

15、計(jì)算結(jié)果代人公式(8.9),即得:(元/件)當(dāng)實(shí)際觀察值甚多,且數(shù)值較大時(shí),根據(jù)上面公式計(jì)算估計(jì)標(biāo)準(zhǔn)誤差十分麻煩,此時(shí)可采用以下的簡(jiǎn)化公式計(jì)算:(8.10)(元)(三)回歸系數(shù)、回歸標(biāo)準(zhǔn)差與相關(guān)系數(shù)的關(guān)系 1.回歸系數(shù)與相關(guān)系數(shù)的關(guān)系由相關(guān)系數(shù)簡(jiǎn)算公式可推得 (8.11)又由回歸系數(shù)公式 (8.12) 將式(8.11)代入(8.12)并整理便得 (8.13) 式(8.13)反映了相關(guān)系數(shù) r 與回歸系數(shù) b 之間的數(shù)量關(guān)系。相關(guān)系數(shù)r值是有正、負(fù)之分的,它反映兩個(gè)變量相關(guān)的方向。由(8.13)我們看到r 的正、負(fù)號(hào)要由回歸系數(shù) b 的符號(hào)來(lái)確定 ,b 的正、負(fù)號(hào)與 r 的符號(hào)是一致的,因?yàn)樵诨?/p>

16、歸直線y=a+bx中,當(dāng)回歸系數(shù) b 為正值時(shí),y會(huì)隨著x的增大而增加,此時(shí) r 必然為正值,反之,當(dāng) b 為負(fù)值時(shí) , y將隨著x的增大而減少,所以 r 必然為負(fù)值。2. 相關(guān)系數(shù)和回歸標(biāo)準(zhǔn)差之間的關(guān)系因?yàn)?而所以即 除以n便得到此即上式兩邊同時(shí)除以 得或于是得到(8.14)(四)多元線性回歸多元線性回歸描述一個(gè)因變量與兩個(gè)或兩個(gè)以上自變量之間的數(shù)量關(guān)系。其回歸方程的一般表達(dá)式為: 多元線性回歸是一元線性回歸的推廣,在計(jì)算上較復(fù)雜,但其基本原理與一元線性回歸分析類(lèi)似,這里僅以二元線性回歸為例來(lái)加以說(shuō)明。其線性回歸方程為:上式中, a為常數(shù)項(xiàng), b1表示自變量x2一定時(shí),由于自變量x1變化一個(gè)單位而使y 平均改變的數(shù)值;b2表示自變量x1一定時(shí),由于自變量x2變化一個(gè)單位而使 y 平均改變

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論