統(tǒng)計學基礎第八章課件_第1頁
統(tǒng)計學基礎第八章課件_第2頁
統(tǒng)計學基礎第八章課件_第3頁
統(tǒng)計學基礎第八章課件_第4頁
統(tǒng)計學基礎第八章課件_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第八章 相關與回歸第一節(jié) 相關關系的概念與種類一、變量之間的關系1.函數(shù)關系(也稱確定性關系) 即變量之間存在著確定的依存關系。其特點是對于一個或一組變量的每一確定的值,另一個變量都有惟一確定的值與之對應,這種關系能用函數(shù)來表達。例如對于商品的銷售額,當價格P不變時,銷售額Y由銷售量X惟一確定,X與Y具有一一對應的確定性關系,可以用 這種函數(shù)來表達,這種關系就是函數(shù)關系。2.相關關系(也稱非確定性關系) 即變量之間顯然存在著密切的關系,但不是確定的依存關系。其特點是對于一個(或一組)變量的每一個確定的值,另一個變量有多個值與之對應,這種關系不能用普通函數(shù)來表達。例如單位面積上的糧食產(chǎn)量與施肥量

2、有關,即在一定范圍內(nèi),隨著施肥量的增加,糧食產(chǎn)量也相應有所提高。 二、相關關系的分類1.單相關和復相關 從變量的多少來看,相關可以分為單相關和復相關。單相關也稱一元相關,是指兩個變量間的相關關系;復相關也稱多元相關,是指三個或三個以上變量間的相關關系。 (二)線性相關和非線性相關 從變量之間相互關系的表現(xiàn)形式來看,相關可以分為線性相關和非線性相關。線性相關也稱直線相關,是指當一個變量每增(減)1個單位,另一相關變量按一個近似固定的增(減)量變化。從散點圖上看,其觀測點的分布近似地表現(xiàn)為一條直線形式,見圖8-1(a)與(b)所示;非線性相關也稱曲線相關,是指當一個變量每增(減)1個單位,另一相關

3、變量按不固定的增(減)量變化。從散點的分布近似地表現(xiàn)為某種曲線形式。見圖8-2所示。XYXY(a) 正線性相關 (b) 負線性相關圖8-1 線性相關關系XY圖8-2 非線性相關 (三)正相關和負相關 從變量之間變化的方向來看,線性相關可以分為正相關和負相關。正相關是指相關變量按同一方向變化,即當一個變量的值增加時,另一個變量的值也相應地增加,見圖8-1(a)所示;負相關是指相關變量按反方向變化,即當一個變量的值增加時,另一個變量的值卻相應地減少,見圖8-1(b)所示。XYXY(a) 正線性相關 (b) 負線性相關圖8-1 線性相關關系XY圖8-2 非線性相關 (四)完全相關、不相關和不完全相關

4、 從變量之間關系的密切程度來看,相關可以分為完全相關、不相關和不完全相關。完全相關是指變量之間的關系是函數(shù)關系,見圖8-3所示。不相關是指變量之間不存在關系,相互獨立,見圖8-4所示。不完全相關是指變量之間的關系介于完全相關和不相關之間,見圖8-1和圖8-2所示。相關分析和回歸分析研究的主要是不完全相關的問題。XYXY 圖8-3 完全相關 圖8-4 不相關第二節(jié) 相關分析的內(nèi)容與方法一、相關分析的主要內(nèi)容 (1)研究現(xiàn)象之間有無依存關系存在,以及依存關系的表現(xiàn)形式。 這是相關分析的出發(fā)點。有相互依存關系才能用相關分析方法進行分析研究,沒有關系而當作有關系會導致錯誤的結果。關系表現(xiàn)為什么樣的形式

5、,就需要使用什么樣的分析方法。把曲線相關當作直線相關來進行分析,也會使認識發(fā)生偏差。 (2)研究相關關系的密切程度。相關關系是一種數(shù)量關系不嚴格的相互依存關系,相關分析的一個目的就是從這種不嚴格的關系中想辦法來判斷它們之間關系的密切程度。判斷相關關系密切程度的主要方法是計算相關系數(shù)和繪制相關圖。二、相關分析的主要方法(一)相關表與相關圖 1相關表 相關表是統(tǒng)計表的一種表現(xiàn)形式。根據(jù)資料是否分組,相關表可分為簡單相關表和分組相關表。 (1)簡單相關表是資料未經(jīng)分組的相關表。這是把影響因素(稱自變量)的標志值與被影響因素( 稱因變量) 的標志值按著從小到大一一對應平行排列起來的統(tǒng)計表。例如,某廠的

6、機床使用年限與維修費用資料如表 8-1所示。機床編號12345678910使用年限3344556677維修費用(元)400540520620600740700760700820表 8-l機床使用年限與維修費用相關表 (2)分組相關表。如果原始資料很多,繪制相關圖、編制簡單相關表都不方便,可以編制分組相關表。 分組相關表是將原始資料進行分組而編制的相關表。按分組的情況不同,分為單變量分組表與雙變量分組表兩種。 1)單變量分組表,是具有相關關系的兩個變量中,只根據(jù)一個變量進行分組,計算出變量組和平均數(shù)的相關表。例如為研究某縣 40 塊耕地每畝施肥量與小麥畝產(chǎn)量的相依關系,編制單變量分組表見表 8-

7、2。按施肥量分組(kg/畝)畝 數(shù)/畝產(chǎn)量(kg)平均畝產(chǎn)量(kg/畝)75以下659098.375-10091125125.0100-12571140162.912531503175以上51055211.0表 8-2 40 塊耕地每畝施肥量與小麥畝產(chǎn)量分組相關表雙變量分組表,是對自變量和因變量都進行分組編制的相關表。 雙變量分組表也叫棋盤式相關表。如果將上述40塊耕地每畝施肥量與小麥畝產(chǎn)量的資料編制成雙變量分組表如表 8-3 。按每畝施肥量分組/kg按畝產(chǎn)量分組/kg合計110以下110-145145-180180-215215-25017

8、5以上325150-l7577125-150246100-12561775-10081950-75426合 計410915240表 8-3 40塊耕地每畝施肥量與小麥畝產(chǎn)量相關表 2相關圖 相關圖是根據(jù)原始數(shù)據(jù)或分組表將對應數(shù)值在坐標圖上用點畫出來,以表明相關點的分布狀況。一般地說,把自變量(x)置于橫軸上 ,因變量(y)置于縱軸上。通過相關圖,可以大致看出兩個現(xiàn)象之間有沒有關系,是什么樣的關系,密切程度如何。根據(jù)表 8-2 的資料,可繪制施肥量與小麥畝產(chǎn)量的相關圖,如圖 8-5 所示。圖 8-5 小麥畝產(chǎn)量與施肥量相關圖其中 y 表示小麥平均畝產(chǎn)量 ,x 表示每畝施肥量,單位為(公斤/ 畝)

9、。(二)相關系數(shù) 相關表和相關圖只能反映相關關系的方向和形態(tài),卻不能說明相關關系的密切程度,為此,需要計算相關系數(shù)。相關系數(shù)是描述兩個現(xiàn)象之間線性相關關系密切程度的數(shù)字指標。計算相關系數(shù)的方法很多,以英國統(tǒng)計學家皮爾生的積差法為基本方法,其公式為: (8.1)式中 r 稱為相關系數(shù)。其中: ,稱為 x 與 y 的協(xié)方差。,是x 的標準差。,是y 的標準差。所以相關系數(shù)可表示為 (8.1)【例8-1】以某廠機床使用年限與維修費的資料為例說明相關系數(shù)的計算。計算按下列步驟進行: (1) 計算兩個數(shù)列的平均值。機床平均使用年限:(年)平均每臺機床維修費:(元)(2)計算表8-4上第 (3)到(7)各

10、欄數(shù)值 , 并得出合計數(shù)。 3. 計算自變量數(shù)列標準差 4. 計算因變量數(shù)列標準差 5. 計算相關系數(shù)用積差法計算相關系數(shù),需計算離差,計算過程較繁雜,實際工作中一般采用簡算公式:(8. 3) 將表85的數(shù)據(jù)代入公式(8.23)可得=0.8602計算結果與按式(8.2)計算結果完全相同。表8-5 相關系數(shù)簡算公式計算表公式(8.2)和(8.3)都是在相關表為簡單表的情形下計算相關系數(shù)的公式。如果從單變量分組表計算相關系數(shù)則需要進行加權,若用積差法計算,其公式為:(8. 4)如果用簡算公式計算則公式為:(8. 5) (三)相關密切程度的判斷 根據(jù)相關系數(shù) r 數(shù)值的大小判斷兩變量的密切程度如下:

11、 (1)當|r|=1時 ,x與y完全線性相關,即x與y之間存在著確定的函數(shù)關系。 (2) 當0|r|1 時,表示x與y之間存在著一定的線性相關關系。|r|的數(shù)值愈大,愈接近于 1, 表示x與y的直線相關程度愈高;反之, |r|的數(shù)值愈小,愈接近于0, 表示x與y的直線相關程度愈低。通常,判斷電標準是:|r|0.3, 稱為微弱相關;0.3|r|0.5, 稱為低度相關;0.5|r|0.8, 稱為顯著相關0.8|r|1, 稱為高度相關。 (3) 當r0 時,表示x與y為正相關;當 r0 時,表示x與y為負相關。 (4)當|r|=0時,表示y的變化與x 無關,即x與y完全沒有直線相關關系。第三節(jié) 回歸

12、分析一、回歸分析的主要內(nèi)容(1)確定相關關系的數(shù)學表達式。(2)檢驗所建立數(shù)學模型的可靠性。 二、回歸分析與相關分析的區(qū)別與聯(lián)系 回歸分析和相關分析是互相補充、密切聯(lián)系的。相關分析需要回歸分析來表明現(xiàn)象數(shù)量關系的具體形式,而回歸分析則應該建立在相關分析的基礎上。依靠相關分析,表明現(xiàn)象的數(shù)量變化具有密切的相關關系后,進行回歸分析才有意義。三、回歸分析的種類(一)一元線性回歸 根據(jù)實測值繪制散點圖時,如果圖中反映兩變量之間的關系呈直線趨勢,則可以初步判定兩者之間存在線性關系,其關系式為:上式中 a 、b 的值確定后,直線也就確定了。在回歸分析中,a 、b的值確定后,則估計直線的方程可以寫作: (8

13、.6)式中, 表示自變量;表示因變量的估計值。式(8.6)稱為 對 的直線回歸方程或線性回歸模型,該直線稱為回歸直線 ,b 稱為回歸系數(shù)。 擬合回歸直線的主要問題就在于估計待定參數(shù)a和b的值。常用的方法是最小二乘法,用這種方法求出的回歸直線是實測資料的“最佳”擬合直線。這和最小二乘法求直線趨勢方程一樣,只要將 (5.9) 式中時間變量的符號 t 改為自變量x, 即可得如下方程組:解方程組得:(8.7)【例8-2】某產(chǎn)品的產(chǎn)量與單位成本的資料與有關計算結果見表 8-6。 從表中可大致地看出,單位成本 和產(chǎn)量 間具有線性負相關關系,即隨著產(chǎn)量的增加,單位成本不斷下降。設兩者的關系式為: 按公式(8

14、.7)計算a 、b的值為:= 所以回歸方程為:(8.8)此回歸方程表示產(chǎn)量每增加1000 件,單位成本平均下降1.82 元。我們知道當回歸系數(shù) b 的符號為正時,自變量和因變量按相同方向變動;當 b 的符號為負時,自變量和因變量按相反方向變動。這里 b=-1.82, 說明產(chǎn)量與單位成本成反比例變化,即產(chǎn)量越大,成本越低。當給定自變量一個值時,我們可以根據(jù)回歸方程來估計或預測因變量的平均可能值。例如,若產(chǎn)量為 6000 件,代入回歸方程可算得平均單位成本為:( 元 )(二)回歸效果檢驗(8.9)用8-2中的資料來說明回歸標準差的計算方法。中間數(shù)據(jù)的計算見表 8-7表 87 估計標準誤差計算表 把

15、計算結果代人公式(8.9),即得:(元/件)當實際觀察值甚多,且數(shù)值較大時,根據(jù)上面公式計算估計標準誤差十分麻煩,此時可采用以下的簡化公式計算:(8.10)(元)(三)回歸系數(shù)、回歸標準差與相關系數(shù)的關系 1.回歸系數(shù)與相關系數(shù)的關系由相關系數(shù)簡算公式可推得 (8.11)又由回歸系數(shù)公式 (8.12) 將式(8.11)代入(8.12)并整理便得 (8.13) 式(8.13)反映了相關系數(shù) r 與回歸系數(shù) b 之間的數(shù)量關系。相關系數(shù)r值是有正、負之分的,它反映兩個變量相關的方向。由(8.13)我們看到r 的正、負號要由回歸系數(shù) b 的符號來確定 ,b 的正、負號與 r 的符號是一致的,因為在回

16、歸直線y=a+bx中,當回歸系數(shù) b 為正值時,y會隨著x的增大而增加,此時 r 必然為正值,反之,當 b 為負值時 , y將隨著x的增大而減少,所以 r 必然為負值。2. 相關系數(shù)和回歸標準差之間的關系因為 而所以即 除以n便得到此即上式兩邊同時除以 得或于是得到(8.14)(四)多元線性回歸多元線性回歸描述一個因變量與兩個或兩個以上自變量之間的數(shù)量關系。其回歸方程的一般表達式為: 多元線性回歸是一元線性回歸的推廣,在計算上較復雜,但其基本原理與一元線性回歸分析類似,這里僅以二元線性回歸為例來加以說明。其線性回歸方程為:上式中, a為常數(shù)項, b1表示自變量x2一定時,由于自變量x1變化一個單位而使y 平均改變的數(shù)值;b2表示自變量x1一定時,由于自變量x2變化一個單位而使 y 平均改變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論