第八章相關(guān)與回歸分析_第1頁
第八章相關(guān)與回歸分析_第2頁
第八章相關(guān)與回歸分析_第3頁
第八章相關(guān)與回歸分析_第4頁
第八章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章相關(guān)分析l 第一節(jié) 相關(guān)分析概述l 第二節(jié) 直線相關(guān)關(guān)系的測(cè)定 l 第三節(jié) 回歸分析第一節(jié)相關(guān)分析概述l 一、 相關(guān)關(guān)系的概念l 現(xiàn)象相互之間的數(shù)量關(guān)系可以從形式上分為兩種類型:一類是嚴(yán)格的確定性的函數(shù)關(guān)系,另一類是不嚴(yán)格的不確定性的相關(guān)關(guān)系。l 相關(guān)關(guān)系是現(xiàn)象之間確實(shí)存在有數(shù)量上的依存關(guān)系,但這種數(shù)量上的關(guān)系是不確定的。 函數(shù)關(guān)系的例子§ 某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y = px (p 為單價(jià))§ 圓的面積(S)與半徑之間的關(guān)系可表示為S=pR2 § 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價(jià)格(x

2、3)之間的關(guān)系可表示為y = x1 x2 x3函數(shù)關(guān)系1. 是一一對(duì)應(yīng)的確定關(guān)系2. 設(shè)有兩個(gè)變量x 和y ,變量y 隨變量x 一起變化,并完全依賴于x,當(dāng)變量x 取某個(gè)數(shù)值時(shí),y 依確定的關(guān)系取相應(yīng)的值,則稱y 是x 的函數(shù),記為y = f (x),其中x 稱為自變量,y 稱為因變量3. 各觀測(cè)點(diǎn)落在一條線上 相關(guān)關(guān)系(幾個(gè)例子)相關(guān)關(guān)系的例子§ 父親身高(y)與子女身高(x)之間的關(guān)系§ 收入水平(y)與受教育程度(x)之間的關(guān)系§ 糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系§ 商品的消費(fèi)量(y)與居民收入(x)之間

3、的關(guān)系§ 商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系相關(guān)關(guān)系1. 變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)2. 一個(gè)變量的取值不能由另一個(gè)變量唯一確定3. 當(dāng)變量x 取某個(gè)值時(shí),變量y 的取值可能有幾個(gè)4. 各觀測(cè)點(diǎn)分布在直線周圍 二、相關(guān)關(guān)系的種類(1)相關(guān)關(guān)系按涉及的變量的多少分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)。單相關(guān)就是兩個(gè)變量之間的相關(guān)關(guān)系。是研究一個(gè)因變量與一個(gè)自變量的依存關(guān)系。復(fù)相關(guān)就是多個(gè)變量之間的相關(guān)關(guān)系。是研究一個(gè)因變量與兩個(gè)或兩個(gè)以上自變量的依存關(guān)系。偏相關(guān)就是在復(fù)相關(guān)研究中,如果假定其它變量不變,僅研究某一個(gè)變量對(duì)另一個(gè)變量的依存關(guān)系。(2)相關(guān)關(guān)系按方向不同分為正相關(guān)和負(fù)相

4、關(guān)。 正相關(guān)是指變量之間存在著同向變動(dòng)的相關(guān)關(guān)系,即當(dāng)一個(gè)變量的數(shù)值有小變大,另一個(gè)變量的數(shù)值也相應(yīng)地由小變大 負(fù)相關(guān)是指變量之間存在著反向變動(dòng)的相關(guān)關(guān)系,即當(dāng)一個(gè)變量的數(shù)值有小變大,另一個(gè)變量的數(shù)值卻由大變小。(3)相關(guān)關(guān)系按表現(xiàn)的形式不同分為線性相關(guān)和非線性相關(guān)。 當(dāng)一個(gè)變量變動(dòng)時(shí),另一個(gè)變量也隨之發(fā)生大致均等的變動(dòng),從圖形上看,二者對(duì)應(yīng)點(diǎn)分布近似地在一條直線附近,這種相關(guān)關(guān)系就稱為線性相關(guān)關(guān)系。 當(dāng)一個(gè)變量變動(dòng)時(shí),另一個(gè)變量也隨之發(fā)生變動(dòng),但從圖形上看,二者對(duì)應(yīng)點(diǎn)分布近似地在一條曲線附近,這種相關(guān)關(guān)系就稱為非線性相關(guān)關(guān)系。(4)相關(guān)關(guān)系按相關(guān)程度不同分為完全相關(guān)、不完全相關(guān)和不相關(guān)。 完

5、全相關(guān)就是當(dāng)一個(gè)變量的變動(dòng)完全由另一個(gè)變量的變動(dòng)所決定。(函數(shù)關(guān)系) 當(dāng)兩個(gè)變量之間完全不存在任何依存關(guān)系,各自獨(dú)立變動(dòng),其相關(guān)程度為零,稱為不相關(guān)或零相關(guān)。 當(dāng)變量之間的關(guān)系介于完全相關(guān)與不相關(guān)之間,稱為不完全相關(guān)。三、相關(guān)分析的內(nèi)容l 1.確定現(xiàn)象之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系的表現(xiàn)形式l 2.測(cè)定相關(guān)關(guān)系的密切程度和方向l 3.確定現(xiàn)象之間相關(guān)關(guān)系的一般關(guān)系式l 4.測(cè)定變量估計(jì)值的可靠程度第二節(jié)直線相關(guān)關(guān)系的測(cè)定判斷現(xiàn)象之間有無相關(guān)關(guān)系,應(yīng)先進(jìn)行定性分析,即依據(jù)理論知識(shí)、實(shí)踐經(jīng)驗(yàn)對(duì)現(xiàn)象之間是否存在相關(guān)關(guān)系及相關(guān)關(guān)系的類型作出判斷。然后在此基礎(chǔ)上進(jìn)行定量分析,即運(yùn)用相關(guān)圖、相關(guān)表和相

6、關(guān)系數(shù)等方法對(duì)現(xiàn)象之間的相關(guān)關(guān)系進(jìn)行描述與測(cè)度。 相關(guān)表 相關(guān)關(guān)系的圖示 相關(guān)系數(shù)一、 相關(guān)表相關(guān)表是指按照相關(guān)現(xiàn)象的數(shù)量對(duì)應(yīng)關(guān)系以及一定的邏輯順序編制成的一種統(tǒng)計(jì)表。 通過相關(guān)表可以初步看出各變量之間的相關(guān)關(guān)系。 某企業(yè)2006年某種產(chǎn)品產(chǎn)量與總成本相關(guān)表月份 產(chǎn)量萬噸x 總成本萬元y1234562.43.14.35.24.46.1324351615378二、相關(guān)圖l 相關(guān)圖是指把相關(guān)表中原始的對(duì)應(yīng)數(shù)值在平面直角坐標(biāo)圖中用點(diǎn)描繪出來,用以反映其分布狀況的統(tǒng)計(jì)圖,也稱散點(diǎn)圖、散布圖。 l 從相關(guān)點(diǎn)的分布情況,就可以直觀地、近似地觀察出兩個(gè)變量之間有無相關(guān)關(guān)系、相關(guān)關(guān)系的形式

7、和相關(guān)關(guān)系的密切程度。 散點(diǎn)圖(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)三、相關(guān)系數(shù)1.相關(guān)系數(shù)的概念及其公式相關(guān)表與相關(guān)圖只能大致反映變量間的相關(guān)關(guān)系要準(zhǔn)確反映變量之間的相關(guān)程度,就需要計(jì)算相關(guān)系數(shù)。相關(guān)系數(shù)是測(cè)量變量之間的密切程度的指標(biāo)。測(cè)定兩個(gè)變量之間線性關(guān)系密切

8、程度的指標(biāo)稱為單線性相關(guān)系數(shù)或線性單相關(guān)系數(shù)。通常用字母 表示。 積差法公式: (簡單式)2.相關(guān)關(guān)系的密切程度的判斷標(biāo)準(zhǔn)l 相關(guān)系數(shù)的取值范圍一定是在1+1,或01這一閉區(qū)間。l 當(dāng) =1時(shí),表示與變量為完全相關(guān),即確定性的函數(shù)關(guān)系。l 當(dāng) =0時(shí),表明所有的相關(guān)點(diǎn)的分布都是雜亂無章的,說明變量與變量無關(guān) 。l 如果0 1,表示 xy 為正相關(guān);l 當(dāng)-1 0時(shí),表示 xy 為負(fù)相關(guān),。 3.直線相關(guān)分析的特點(diǎn)l 1)參與相關(guān)分析的兩個(gè)變量是對(duì)等關(guān)系,不分自變量和因變量,因此,相關(guān)系數(shù)只有一個(gè)。 l 2)相關(guān)系數(shù)有正負(fù)號(hào),它們反映相關(guān)關(guān)系的方向,正號(hào)反映正相關(guān),負(fù)號(hào)反映負(fù)相關(guān)。l 3)相關(guān)的

9、兩個(gè)變量必須是隨機(jī)的,這也是對(duì)等關(guān)系的反映。第三節(jié)回歸分析一、回歸分析的含義 什么是回歸回歸是由英國著名統(tǒng)計(jì)學(xué)家Francis Galton在19世紀(jì)末期研究孩子及其父母的身高時(shí)提出來的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。 Galton把這種孩子的身高向中間值靠近的趨勢(shì)稱之為一種回歸效應(yīng),而他發(fā)展的研究兩個(gè)數(shù)值變量之間數(shù)量關(guān)系的方法稱為回歸分析。什么是回歸分析?1. 從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式2. 對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),

10、并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著3. 利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度回歸分析與相關(guān)分析的關(guān)系聯(lián)系 :二者都是對(duì)客觀事物數(shù)量依存關(guān)系的分析。一方面,相關(guān)分析是回歸分析的基礎(chǔ)和前提。另一方面,回歸分析是相關(guān)分析的深入和繼續(xù)?;貧w分析與相關(guān)分析的區(qū)別1. 相關(guān)分析中,變量x變量y 處于平等的地位;回歸分析中,變量y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測(cè)因變量的變化2. 相關(guān)分析中所涉及的變量x 和y 都是隨機(jī)變量;回歸分析中,因變量y 是隨機(jī)變量,自變量x可以是隨機(jī)變量,也

11、可以是非隨機(jī)的確定變量3. 相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x 對(duì)變量y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制二、簡單直線回歸方程的配合方法回歸方程式,其一般形式為:應(yīng)用最小平方法原理有:三、估計(jì)標(biāo)準(zhǔn)誤差估計(jì)標(biāo)準(zhǔn)誤差是就是觀察值 對(duì)估計(jì)值 的平均離差,也叫回歸誤差,是衡量因變量的估計(jì)值與觀測(cè)值之間的平均誤差大小的指標(biāo)。簡捷公式 :四、估計(jì)標(biāo)準(zhǔn)誤差和相關(guān)系數(shù)的關(guān)系回歸模型的類型一元線性回歸1. 涉及一個(gè)自變量的回歸2. 因變量y與自變量x之間為線性關(guān)系 被預(yù)測(cè)或被解釋的變量稱為因變量(dependent variable),用y表示 用來預(yù)測(cè)或用來

12、解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independent variable),用x表示3. 因變量與自變量之間的關(guān)系用一條線性方程來表示回歸模型(regression model)1. 回答“變量之間是什么樣的關(guān)系?”2. 方程中運(yùn)用 1 個(gè)數(shù)字的因變量(響應(yīng)變量) 被預(yù)測(cè)的變量 1 個(gè)或多個(gè)數(shù)字的或分類的自變量 (解釋變量) 用于預(yù)測(cè)的變量l 3.主要用于預(yù)測(cè)和估計(jì)一元線性回歸模型1. 描述因變量 y 如何依賴于自變量x 和誤差項(xiàng)e 的方程稱為回歸模型2. 一元線性回歸模型可表示為Æ y = A + B x + e y 是x 的線性函數(shù)(部分)加上誤差項(xiàng) 線性部分反映了由于x

13、的變化而引起的y 的變化 誤差項(xiàng)e是隨機(jī)變量 反映了除x 和y 之間的線性關(guān)系之外的隨機(jī)因素對(duì)y 的影響 是不能由x 和y 之間的線性關(guān)系所解釋的變異性 A和 B稱為模型的參數(shù)一元線性回歸模型(基本假定) 1. 誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量,即E()=0。對(duì)于一個(gè)給定的x 值,y 的期望值為2. Y =A+ B x3. 對(duì)于所有的x 值,的方差2 都相同4. 誤差項(xiàng)是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即N( 0 ,2 ) 獨(dú)立性意味著對(duì)于一個(gè)特定的x 值,它所對(duì)應(yīng)的與其他x 值所對(duì)應(yīng)的不相關(guān) 對(duì)于一個(gè)特定的x 值,它所對(duì)應(yīng)的y 值與其他x 所對(duì)應(yīng)的y 值也不相關(guān)回歸方程 (regre

14、ssion equation)1. 描述y 的平均值或期望值如何依賴于x 的方程稱為回歸方程2. 一元線性回歸方程的形式如下3. Y = A+ Bx方程的圖示是一條直線,也稱為直線回歸方程A是回歸直線在y 軸上的截距,是當(dāng)x=0 時(shí)y 的期望值B是直線的斜率,稱為回歸系數(shù),表示當(dāng)x 每變動(dòng)一個(gè)單位時(shí),y 的平均變動(dòng)值估計(jì)的回歸方程(estimated regression equation)1. 總體回歸參數(shù) A和 B是未知的,必需利用樣本數(shù)據(jù)去估計(jì)2. 用樣本統(tǒng)計(jì)量a和b代替回歸方程中的未知參數(shù)A和B,就得到了估計(jì)的回歸方程3.一元線性回歸中估計(jì)的回歸方程為Yc=a+bx其中: a是估計(jì)的回

15、歸直線在 y 軸上的截距, b是直線的斜率,它表示對(duì)于一個(gè)給定的 x 的值, Yc是 y 的估計(jì)值,也表示 x 每變動(dòng)一個(gè)單位時(shí), y 的平均變動(dòng)值.參數(shù)的最小二乘估計(jì)1. 使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得a和b的方法。即2. 用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小根據(jù)最小二乘法的要求,可得求解a和b的公式如下已求得如下過程數(shù)據(jù):由最小二乘法標(biāo)準(zhǔn)方程得回歸系數(shù)的計(jì)算值為:得出Y對(duì)X的直線回歸方程為:方程的意義回歸直線的擬合優(yōu)度變差1. 因變量y 的取值是不同的,y 取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面 由于自變量x 的取值不同造成的 除x 以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響2. 對(duì)一個(gè)具體的觀測(cè)值來說,變差的大小可以通過該實(shí)際觀測(cè)值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論