第六章相關與回歸()_第1頁
第六章相關與回歸()_第2頁
第六章相關與回歸()_第3頁
第六章相關與回歸()_第4頁
第六章相關與回歸()_第5頁
已閱讀5頁,還剩154頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 相互聯(lián)系與相互影響是普遍的現(xiàn)象受教育的水平工作后的收入預防疾病支出疾病的發(fā)病率 客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,當我們用變量來反映這些現(xiàn)象的特征時,便表現(xiàn)為變量之間的依存關系。 如商品價格的變化會刺激或抑制商品銷售量的變化;勞動力素質(zhì)的高低會影響企業(yè)的效益;原材料、直接人工的價格變化對產(chǎn)品銷售成本有直接的影響,糧食畝產(chǎn)量與施肥量、降雨量、溫度之間的關系等。 在經(jīng)濟管理和其他領域中,人們經(jīng)常需要研究兩個或多個變量(現(xiàn)象)之間的相互(因果)關系,并使用數(shù)學模型來加以描述和解釋。相關與回歸分析是定量分析現(xiàn)象之間相互依存關系的統(tǒng)計方法之一,是現(xiàn)代統(tǒng)計學中非常重要的內(nèi)容,它在自然科學、管理科學和社會

2、經(jīng)濟領域有著十分廣泛的應用。 第第6 6章章 相關與回歸分析相關與回歸分析學習目的和要求: 本章介紹相關分析與回歸分析的基本概念與分類,計算簡單相關系數(shù),對一元線性回歸模型進行參數(shù)估計、模型檢驗、估計與預測等內(nèi)容。返回6.1 6.1 相 關 關 系 概 述6.26.2線性相關關系測定6.36.3一元線性回歸分析 互有聯(lián)系的客觀現(xiàn)象(變量)間關系的緊密程度各不一樣。歸納起來,現(xiàn)象間的依存關系大致可以分成兩種類型:函數(shù)關系和相關關系。函數(shù)關系完全確定性的關系相關關系不完全確定的關系6.1 相關關系概述6.1.1 變量間的相互關系例:價格不變時商品銷售收入與銷售量的關系。Y = cX銷售收入銷售量Y

3、 與 X 間的確定性關系 (一)函數(shù)關系定義:現(xiàn)象之間存在著完全確定的依存關系,即當一個或一組變量每取一個值時,相應的另一個變量必然有一個確定值與之對應 。 函數(shù)關系可以用一個確定的公式,即函數(shù)式來表示。 ),(21nxxxfy 或:Y=F(X) 然而,現(xiàn)實世界中還有不少情況是現(xiàn)象之間有著密切的聯(lián)系,但密切的程度并沒有達到由一個(幾個)變量可以完全確定另一個變量的程度,它們之間是一種非確定性的關系。 變量之間的不確定的依存關系稱為相關關系(統(tǒng)計關系)。這種統(tǒng)計關系規(guī)律性的研究是相關分析和回歸分析研究的主要對象。家庭收入家庭消費支出(二)相關關系 定義:現(xiàn)象之間存在有依存關系,但這種關系是不完全

4、確定的隨機關系,即當一個或一組變量每取一個值時,相應的另一個變量可能有多個不同 值與之對應 。相關關系可用統(tǒng)計模型),(21nxxxfy或:Y=F(X)+式中, 為影響Y的除X外的其他隨機因素。 非確定性關系 (1)單一因果關系(如貨物運輸量與貨車保有輛數(shù)之間 ); (2)互為因果關系(如鐵路運輸業(yè)的發(fā)展水平與經(jīng)濟發(fā)展水平之間) ; (3)伴隨關系(共變關系,如工資與物價的變動) ?,F(xiàn)象間數(shù)量依存關系的形式: 變量間的依存關系在許多情況下表現(xiàn)為因果關系,其中一個或若干個起著影響作用的變量稱為自變量,通常用 X 表示,它是引起另一現(xiàn)象變化的原因,通常是可以控制、給定的值;而受自變量影響的變量稱為

5、因變量,通常用 Y 表示,它是自變量變化的結果,是不確定的值。(三) 相關關系與函數(shù)關系的聯(lián)系與區(qū)別 (2)函數(shù)關系可以用數(shù)學表達式精確表示出來,而相關關系只能通過研究變量間的統(tǒng)計規(guī)律才能得到。 (1)函數(shù)關系中的變量之間的關系是完全確定的,而相關關系中的變量之間的關系是不完全確定的。 由于有觀察或測量誤差等原因,函數(shù)關系在實際中往往通過相關關系表現(xiàn)出來。在研究相關關系時,又常常要使用函數(shù)關系的形式來表現(xiàn),以便找到相關關系的一般數(shù)量表現(xiàn)形式。 為此,在研究相關關系時,又常常使用函數(shù)關系作為工具,用一定的函數(shù)關系表現(xiàn)相關關系的數(shù)量聯(lián)系。(一)按相關的程度分6.1 相關關系概述6.1.2 相關關系

6、的種類 當一種現(xiàn)象的數(shù)量變化完全由其它現(xiàn)象的數(shù)量變化所確定時,此時現(xiàn)象的關系為完全相關。 如:在價格不變的條件下,某商品的銷售額與其銷售量總是成正比例關系; 在相關圖上表現(xiàn)為所有的觀察點都落在同一條線上,在這種場合,相關關系便成為函數(shù)關系函數(shù)關系是相關關系的一個特例。 當現(xiàn)象間彼此的數(shù)量變化互相獨立時,稱為不相關現(xiàn)象。 例如,通常認為股票價格的高低與氣溫的高低是不相關的; 如果現(xiàn)象之間的關系介于完全相關和不相關之間,稱為不完全相關。 如婦女的結婚年齡與受教育程度之間的關系。 不完全相關關系是現(xiàn)實當中相關關系的主要表現(xiàn)形式,也是相關分析的主要研究對象。 正相關:變量的變動方向一致(同增同減);

7、例如:工人的工資隨勞動生產(chǎn)率的提高而增加; 負相關:變量的變動方向相反(一增一減) ; 例如:商品流轉(zhuǎn)的規(guī)模愈大,流通費用水平愈低。(二)按相關的方向分(三)按相關的形式分 相關程度密切相關程度不密切 線性相關:當相關現(xiàn)象之間的關系大致呈現(xiàn)為線性關系,即當一個變量變動一個單位時,另一個變量也按一個大致固定的增(減)量變動,就稱為線性相關。 如:人均消費水平與人均收入水平通常成線性關系; 非線性相關:當相關現(xiàn)象之間不按固定比例變化時,近似于某種曲線方程的關系。 如:產(chǎn)品的平均成本與產(chǎn)品總產(chǎn)量之間的相關關系就是一種非線性相關。圖6.1 相關關系分類示意圖(四)按影響因素的多少分 1、 (簡)單相關

8、:兩個現(xiàn)象的相關,即一個變量對另一個變量的相關關系。 例學習成績與學習時間;血壓與年齡;畝產(chǎn)量與施肥量。 2、復(多元)相關:三個或三個以上現(xiàn)象的相關,即一個變量對兩個或兩個以上其它變量的相關關系。 例經(jīng)濟增長與人口增長、科技水平、自然資源、管理水平等之間的關系; 體重與身高、食欲、睡眠時間之間的關系。 3、偏相關:就多個變量測定其中兩個變量的相關程度而假定其他變量不變。 例在假定人們的收入水平不變時,某種商品的需求與其價格水平的關系。 就 y=ax1+bx2+ ,研究y與x1之間的關系,假定x2不變。 值得注意的是,并非所有的變量之間都存在相關關系,因此需要用相關分析方法來識別和判斷。 研究

9、和測度現(xiàn)象間相互依存關系的一種統(tǒng)計分析方法。相關分析,是以現(xiàn)象之間不完全的相關關系為研究對象,6.1 相關關系概述6.1.3 相關分析的主要內(nèi)容 1.確定現(xiàn)象間是否存在依存關系,其依存關系屬于何種類型主要是定性分析和判斷; 2.確定相關關系的密切程度定量分析相關圖、表、相關系數(shù); 3.確定相關關系的數(shù)學表達式回歸分析; 4.確定因變量估計值誤差的程度; 5.對回歸方程進行顯著性檢驗。相關分析的主要內(nèi)容:6.1 6.1 相 關 關 系 概 述6.2 6.2 線性相關關系測定6.3 6.3 一元線性回歸分析 定性分析是依據(jù)研究者的理論知識、專業(yè)知識和實踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關關系,以及有

10、何種相關關系做出判斷。6.2 線性相關關系的測定6.2.1 定性分析在定性分析的基礎上,通過編制相關表、繪制相關圖、計算相關系數(shù)與判定系數(shù)等方法,來判斷現(xiàn)象之間相關的方向、形式及密切程度。6.2 線性相關關系的測定6.2.2 定量分析相關表與相關圖 相關表和相關圖是研究相關關系的直觀工具。 在進行精確的定量分析之前,可以先利用它們對現(xiàn)象之間存在的相關關系的方向、形式、和密切程度作大致的判斷。 (一)相關表:相關表是一種統(tǒng)計表。由相關變量相對應的關系數(shù)值所編制成的反映現(xiàn)象之間的相關關系的數(shù)列表。 簡單相關表-根據(jù)總體單位的原始資料編制的相關表(適用 于所觀察的樣本單位數(shù)較少,不需要分組的情況)分

11、組相關表-將原始資料進行分組而編制的相關表(適用于所 觀察樣本單位數(shù)較多,標志變異又較復雜,需要分組的情況) 單變量分組表-按自變量分組 雙變量分組表-自變量和因變量均分組 (二)相關圖: 又稱散點圖,它是將兩個變量相對應的變量值用坐標點的形式,在直角坐標上描繪出來,以反映二者之間相關關系的圖形。 為研究商店人均月銷售額和利潤率的關系,調(diào)查10家商店取得10對數(shù)據(jù),說明簡單相關表和相關圖的編制方法。 從表可看出,隨著人均月銷售額的增加,利潤率有明顯的增長趨勢。所以,資料表明(如圖)有明顯的直線相關趨勢。例 1人均銷售額與和利潤率相關表編號人均月銷售額(千元)利潤率()1234567891013

12、345667783.06.26.68.110.412.612.316.316.818.5利潤率(%)人均銷售額(千元)120人均銷售額與利潤率相關圖510152384567 在某個地區(qū)抽取了9家生產(chǎn)同類產(chǎn)品的企業(yè),其月產(chǎn)量和單位產(chǎn)品成本的資料如表,現(xiàn)在來分析月產(chǎn)量和單位成本的關系。表6-2 9家企業(yè)的月產(chǎn)量和單位產(chǎn)品成本資料企業(yè)編號123456789月產(chǎn)量(千件)(x)4.16.35.47.63.28.59.76.82.1單位產(chǎn)本(元)(y)807271588650426391例 2序 號月產(chǎn)量(千件)(x)單位產(chǎn)本(元)(y)92.19153.28614.18035.47126.37286.

13、86347.65868.55079.742合計53.7613 9家企業(yè)的月產(chǎn)量和單位產(chǎn)品成本相關表 根據(jù)規(guī)模經(jīng)濟理論,可以判斷產(chǎn)品的產(chǎn)量和單位成本之間存在著相關關系,再繪制散點圖,我們可以比較直觀地看出這兩個變量間的關系。 9家企業(yè)的月產(chǎn)量和單位產(chǎn)品成本散點圖企業(yè)按銷售額分組(萬元)流通費用率(%)4以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.5866.577.588.599.51004812162024283236銷售額(萬元)流通費用率(%)例 3 單變量分組表可以使原始資料大大簡化,

14、在原始數(shù)據(jù)較多的情況下,使用單變量分組表能更清晰地反映現(xiàn)象間的相互依存關系,找出變量間數(shù)據(jù)變動的規(guī)律性。例 4 雙變量分組表又稱為棋盤式相關表。首先,分別確定自變量和因變量的分組數(shù);其次,按兩個變量的組數(shù)設計棋盤型表格;最后,計算各組次數(shù)置于相對應的方格中。適用于對大量復雜數(shù)據(jù)的處理和分析。 編制雙變量分組相關表,要把自變量置于橫行,其變量值從小到大自左至右排列;因變量置于縱欄,其變量值從大到小自上而下排列。這樣排列,可使相關表與相關圖取得一致形式,能直觀地看出變量之間相關的方向。 相關圖、表雖然有助于識別變量間的相關關系,但它無法對這種關系進行精確的計量(判定其相關關系的密切程度)。 在初步

15、判定變量間存在相關關系的基礎上,通常還要計算相應的分析指標相關系數(shù)。 相關系數(shù)是測定變量之間相關密切程度和相關方向的代表性指標。相關系數(shù)用符號“r”表示。 在各種相關中,單相關是基本的相關關系,它是復相關和偏相關的基礎。單相關有線性和非線性兩和表現(xiàn)形式。測定線性相關系數(shù)的方法是最基本的相關分析,是測定其他相關系數(shù)方法的基礎。我們著重研究線性的單相關系數(shù)線性的單相關系數(shù)。6.2 線性相關關系的測定6.2.3 定量分析相關系數(shù) 1、積差法計算公式:由英國統(tǒng)計學家皮爾遜(Pearson)設計的,故又稱為Pearson相關系數(shù)。則的一組樣本觀察值是設,),(),(YXyxii2222)()()()()

16、()(yyxxyyxxnyynxxnyyxxr的標準差的協(xié)方差的相關系數(shù)與為yxyxyxryxxyyxxy,)(yyxx2)(xx2)(yyyyxxxyLLLr 22)()()(yyxxyyxxr 由于COV(X,Y)的主導地位,又因為其形式是兩個差值的乘積之和,故把這個公式又稱為“積差公式”。 簡記為:Lxy簡記為:Lxx簡記為:Lyy 2 2、下面我們介紹直線相關系數(shù)的設計思路,從中我們會接觸到一些新的統(tǒng)計指標,同時也能充分享受到皮爾遜給我們展現(xiàn)的“對稱”美感。XYyy xx )(一)(二)(三)(四),(11yx),(nnyx00)()()()()(ryyxxyyxxxy正相關三一yxx

17、yrnyyxxxy)()(1yyxxnii顯示x與y之間的相關方向(1)即x和y基本上同時大或同時小,即兩個變量之間為正相關負相關XYyy xx )(一)(二)(三)(四),(11yx),(nnyx00)()()()()(ryyxxyyxxxy負相關四二nyyxxxy)(yxxyr 顯示x與y之間的相關程度)()()()()(yyxxAyyxx圖三一密集分布圖A散亂分布圖BXYPQ偏小偏大)()(qqppyyxx)(1yyxxnii(2)負相關)()()()()(yyxxAyyxx圖四二密集分布圖A散亂分布圖BXYPQ偏小偏大)()(qqppyyxx不相關00)(0:xyyyxxxxA圖 圖A

18、圖BXYXYxx yy 00)(0:xyyyxxyyB圖之間無直線相關與yx第一、顯示x與y之間的相關方向負相關正相關無直線相關00)(00)(00)()(ryyxxryyxxryyxxnyyxxryx之間的相關程度越低與越小之間的相關程度越高與越大yxyyxxyxyyxx)()(第二、顯示x與y之間的相關密切程度)(1yyxxnii的作用:歸 納 為大的正值時,表示強的正線性相關關系。 接近于零時,表示很小或沒有線性相關關系。 為大的負值時,表示強的負線性相關關系。nyyxxiixy)(nyyxxiixy)( cm kg mm kg大于基本結論:協(xié)方差與樣本的項數(shù)n、X與Y的計量單位有關 ,

19、從而不能真實反映相關的程度。)(1yyxxnii)(1yyxxnii)(1yyxxnii 似乎是 這樣(3)x、y的作用 消除變量協(xié)方差計量單位的影響直接對比:yxyxxynyyxxr)(yxnyyxx)( 相關程度的大小與計量單位無關。為了消除積差中兩個變量原有計量單位的影響,將各變量的離差除以該變量數(shù)列的標準差,使之成為相對積差,即 ,所以相關系數(shù)是無量綱的數(shù)量。yxyyxx和 使使111rrnyyxxryx22nyyxxryx2221yxyxyyxxyyxxn1112yxyyxxn22222)()(1yxyxnyynxxyyxxn1:1022rrr同理可證2122yxyyxxnr221)(ynyy3、積差法相關系數(shù)的簡捷計算公式2222)()()()()()(yyxxyyxxnyynxxnyyxxryxxynyxxy)()(yxyxyxxyyyxxyxyxxyxynyn

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論