版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十一章回歸分析§11.1回歸概念§11.2一元線性回歸方程§11.3可線性化的回歸方程概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第1頁(yè)!1.理解變量間的相關(guān)關(guān)系以及回歸分析的主要任務(wù)2.會(huì)用最小二乘法建立回歸直線方程一元線性回歸方程的建立回歸直線方程的有效性檢驗(yàn)教學(xué)要求重點(diǎn)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第2頁(yè)!
回歸分析的任務(wù)是:根據(jù)試驗(yàn)數(shù)據(jù)取估計(jì)回歸函數(shù),討論有關(guān)的點(diǎn)估計(jì)、區(qū)間估計(jì)、假設(shè)檢驗(yàn)等問(wèn)題。特別重要的是對(duì)隨機(jī)變量Y的觀察值做出點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第3頁(yè)!確定性關(guān)系是指變量之間的關(guān)系可以用函數(shù)關(guān)系來(lái)表達(dá)的;§11.1回歸概念自然界和生產(chǎn)實(shí)踐中的許多現(xiàn)象之間存在著相互依賴、相互制約的關(guān)系。一、現(xiàn)象二、關(guān)系非確定性關(guān)系即所謂相關(guān)關(guān)系?;貧w分析是研究相關(guān)關(guān)系的一種數(shù)學(xué)工具。它能幫助我們從一個(gè)變量取得的值去估計(jì)另一個(gè)變量所取得值。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第4頁(yè)!
例1居民按人口計(jì)算的平均收入與某種商品(如糖果)的消費(fèi)量之間,有著一定的聯(lián)系。一般說(shuō)來(lái)平均收入高的,消費(fèi)量大,但平均收入相同時(shí),這種商品的消費(fèi)量卻不一定是完全相同的。例2森林中的同一種樹木,其斷面直徑與高度之間是有聯(lián)系的。一般說(shuō)來(lái),較粗的樹較高,但直徑相同的樹,其高度也不完全是相同的。
概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第5頁(yè)!如果這個(gè)模型是線性的就稱為線性回歸分析。這種方法是處理變量間相關(guān)關(guān)系的有力工具,是數(shù)理統(tǒng)計(jì)中一種常用的方法。它不僅告訴人們?cè)鯓咏⒆兞块g的數(shù)學(xué)表達(dá)式,即經(jīng)驗(yàn)公式,而且還利用概率統(tǒng)計(jì)知識(shí)進(jìn)行分析討論,判斷出所建立的經(jīng)驗(yàn)公式的有效性,從而可以進(jìn)行預(yù)測(cè)或估計(jì)。這在實(shí)際中是很有用的。本章主要介紹如何建立經(jīng)驗(yàn)公式,以及建立的經(jīng)驗(yàn)公式其有效性的判斷。由一個(gè)或一組非隨機(jī)變量來(lái)估計(jì)或預(yù)測(cè)某一個(gè)隨機(jī)變量的觀察值時(shí),所建立的數(shù)學(xué)模型及所進(jìn)行的統(tǒng)計(jì)分析,稱為回歸分析。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第6頁(yè)!我們對(duì)普通變量x取定一組不完全相同的值:分別是在處對(duì)Y的獨(dú)立觀察結(jié)果稱是一個(gè)樣本,對(duì)應(yīng)的樣本值記為如何利用樣本來(lái)估計(jì)Y關(guān)于x的回歸函數(shù)首先需要推測(cè)f(x)的形式,可將每對(duì)觀察值在直角坐標(biāo)系中描繪出它的相應(yīng)的點(diǎn),這種圖稱為散點(diǎn)圖。通過(guò)散點(diǎn)圖可以粗略的看出f(x)的形式。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第7頁(yè)!(一)回歸直線方程例1以家庭為單位,某種商品年需求量與該商品價(jià)格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:統(tǒng)計(jì)結(jié)果表明,盡管價(jià)格不變,需求仍可能變化,價(jià)格改變需求也可能不變。但是,總的趨勢(shì)是家庭對(duì)該商品的年需求量隨著價(jià)格的上升而減少,它們之間存在著密切的聯(lián)系。我們要找出近似地描述它們關(guān)系的回歸函數(shù),也就是求出d對(duì)于p的回歸方程。價(jià)格Pi(xi)需求量di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.2概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第8頁(yè)!要求出回歸直線方程L,就是要找出a與b的估計(jì)量因而可以決定該種商品的需求量y對(duì)價(jià)格x的回歸函數(shù)為直線型。我們把y對(duì)x的回歸函數(shù)記為b稱為回歸系數(shù)y對(duì)x的回歸直線方程達(dá)到最小。使直線L總的看來(lái)與所有的散點(diǎn)最接近。通常是固定x使得散點(diǎn)的縱坐標(biāo)回歸直線上點(diǎn)的縱坐標(biāo)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第9頁(yè)!定量地描述了直線L與n個(gè)觀察點(diǎn)總的接近程度。Q的大小隨直線L的位置變化而變化。也就是說(shuō),Q的值隨著a和b的不同而變化。它是a和b的二元函數(shù)。稱它們?yōu)閍及b的最小二乘估計(jì)。要找一條總的看來(lái)最接近這n個(gè)點(diǎn)的直線,就要找出使得Q達(dá)到最小值的求法可以利用微積分中的極值求法:概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第10頁(yè)!由(1)得:代入(2)得(11.8)(11.9)于是所求的回歸直線方程為(11.10)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第11頁(yè)!所求回歸方程應(yīng)為繼續(xù)計(jì)算:解:設(shè)回歸直線方程為概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第12頁(yè)!(二)相關(guān)性檢驗(yàn)說(shuō)明x值的變化對(duì)y沒(méi)有影響,因而變量x不能控制變量y,用回歸直線方程(11.10)不能描述兩個(gè)變量y與x之間的關(guān)系。用最小二乘法求出的回歸直線并不需要事先假定y與x一定具有線性相關(guān)的關(guān)系。就方法——最小二乘法——本身而言,對(duì)任意一組數(shù)據(jù)都可以用(11.8)及(11.9)式給它們配一條直線,描述y與x間的關(guān)系。因此,需要判斷y對(duì)x的回歸函數(shù)的類型是否為線性的,也就是這兩個(gè)變量間是否真的存在著近似線性的關(guān)系。如果在中的b=0因此,在相關(guān)性檢驗(yàn)時(shí)首先提出待檢假設(shè):概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第13頁(yè)!對(duì)于任意n組數(shù)據(jù):總的離差平方和總和Syy余和Q回歸和U概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第14頁(yè)!=0∴概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第15頁(yè)!(3)證明:是回歸直線上的點(diǎn)說(shuō)明也是樣本值的均值點(diǎn)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第16頁(yè)!可更清楚地看出x對(duì)y的線性影響與U的關(guān)系。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第17頁(yè)!在平方和分解公式中如果U的值大,說(shuō)明U起主導(dǎo)作用,建立的回歸方程回歸效果顯著。如果Q的值大,說(shuō)明Q起主導(dǎo)作用,建立的回歸方程回歸效果不顯著。則建立的回歸方程無(wú)效可以證明:回歸直線方程若建立的回歸直線方程無(wú)效,則b=0概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第18頁(yè)!為了檢驗(yàn)相關(guān)性,有時(shí)選用樣本相關(guān)系數(shù)為統(tǒng)計(jì)量,并把R的臨界值列成相關(guān)系數(shù)表(附表七)。不過(guò)這兩種檢驗(yàn)方法是一致的。這是由于因此,F(xiàn)的值較大等價(jià)于|R|較大,可以用概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第19頁(yè)!可以用(11.9)與(11.8)式分別計(jì)算為了清楚起見(jiàn),可先列出回歸計(jì)算表如表11-3:例1以家庭為單位,某種商品年需求量與該商品價(jià)格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:Pi(xi)di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.25174646.215.2966.256.56.765.67.844.593.9610.894.212.25∑252554.9767.2874.68解:設(shè)回歸直線方程為2512.2597.295.766.2542.251.441.44相關(guān)性檢驗(yàn)的一般步驟概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第20頁(yè)!方差來(lái)源回歸和余和總和離差平方和U≈11.86Q≈0.32Syy=12.18自由度189F的值F≈296.5F的臨界值顯著性在顯著性一欄內(nèi)畫一個(gè)※在顯著性一欄內(nèi)再畫一個(gè)※4.結(jié)論:拒絕假設(shè)H0認(rèn)為b≠0變量x對(duì)y有極其顯著的線性影響。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第21頁(yè)!§11.3可線性化的回歸方程
如果由觀察數(shù)據(jù)畫出的散點(diǎn)圖或由經(jīng)驗(yàn)認(rèn)為兩個(gè)變量之間不能用線性關(guān)系近似描述,但是其中有些回歸方程仍可化為線性回歸方程,那么只要進(jìn)行變量替換,就能直接利用線性回歸方程的結(jié)果。在經(jīng)濟(jì)領(lǐng)域中常用的有下面幾種形式:(一)雙曲線型概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第22頁(yè)!(三)冪函數(shù)型(四)S曲線型概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第23頁(yè)!
試?yán)孟铝匈Y料(見(jiàn)表11-5),求出y對(duì)x的回歸曲線方程。例同一生產(chǎn)面積上某作物單位產(chǎn)品的成本與產(chǎn)量間近似滿足雙曲線型關(guān)系:5.6717.74.4518.53.8418.93.8418.83.7218.32.1819.1解:得回歸方程為列出回歸計(jì)算表概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第24頁(yè)!故該作物單位產(chǎn)品的成本與產(chǎn)量之間的回歸方程為概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第25頁(yè)!
另一類是統(tǒng)計(jì)關(guān)系或稱相關(guān)關(guān)系。即變量之間雖然存在著密切的關(guān)系,但從一個(gè)(或一組)變量的每一確定的值,不能求出另一變量的確定的值??墒窃诖罅吭囼?yàn)中,這種不確定的關(guān)系,具有統(tǒng)計(jì)規(guī)律性,這種聯(lián)系使稱為統(tǒng)計(jì)相關(guān)。二、關(guān)系一類是函數(shù)關(guān)系,即變量之間有著確定的關(guān)系。例如已知圓的半徑R,則圓面積可以用公式S=πR2
來(lái)計(jì)算。這里S與R之間有著確定的關(guān)系。這些關(guān)系表現(xiàn)在量上主要有兩種類型:概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第26頁(yè)!例3消費(fèi)者對(duì)某種商品(比如西紅柿)的月需求量與該種商品的價(jià)格有很密切的關(guān)系。一般說(shuō)來(lái),價(jià)格低時(shí)需求量大,價(jià)格高時(shí)需求量小,但同一種價(jià)格,月需求量也不完全相同。例4農(nóng)作物的產(chǎn)量與施肥量、氣候、農(nóng)藥也有這種不確定的關(guān)系。即便是具有確定關(guān)系的變量,由于試驗(yàn)誤差的影響,其表現(xiàn)形式也具有某種程度的不確定性。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第27頁(yè)!§11.2一元線性回歸方程
具有相關(guān)關(guān)系的變量間雖然不具有確定的函數(shù)關(guān)系,但是可以借助函數(shù)關(guān)系表達(dá)它們之間的統(tǒng)計(jì)規(guī)律性。用以近似地描述具有相關(guān)關(guān)系的變量間聯(lián)系的函數(shù)稱為回歸函數(shù)。
在實(shí)際中最簡(jiǎn)單的情況是由兩個(gè)變量組成的關(guān)系,比如:在經(jīng)濟(jì)關(guān)系中,對(duì)某種商品的需求量隨價(jià)格的升降而變化;居民消費(fèi)隨收入的增減而改變等等。首先考察兩量間的模型即概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第28頁(yè)!
由于兩個(gè)變量之間不存在完全確定的函數(shù)關(guān)系,因此必須把隨機(jī)波動(dòng)產(chǎn)生的影響引入方程:
其中,y是隨機(jī)變量,x是普通變量,ε是隨機(jī)項(xiàng)。隨機(jī)變量yi表示對(duì)應(yīng)于給定變量x的值xi的試驗(yàn)結(jié)果:
首先一個(gè)問(wèn)題是如何根據(jù)已經(jīng)試驗(yàn)的結(jié)果以及以往的經(jīng)驗(yàn)來(lái)確定回歸函數(shù)的類型以及求出函數(shù)中的未知參數(shù)的估計(jì),得到經(jīng)驗(yàn)公式。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第29頁(yè)!的類型,先把10對(duì)數(shù)據(jù)作為直角坐標(biāo)平面上點(diǎn)的坐標(biāo),并把這些點(diǎn)畫在直角坐標(biāo)平面上。這樣得到的圖稱為散點(diǎn)圖(如圖11-1)。為了確定回歸函數(shù)可以看出,所有的點(diǎn)大體上分布在一條直線的周圍。即需求量與價(jià)格大致成線性關(guān)系。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第30頁(yè)!
一般地,兩個(gè)變量的線性回歸模型為取一個(gè)容量為n的樣本并且假定:平面上任意一條直線L的方程記為用數(shù)值描述點(diǎn)與它沿平行縱軸方向到L的遠(yuǎn)近距離。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第31頁(yè)!整理后得:概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第32頁(yè)!可以用(11.9)與(11.8)式分別計(jì)算為了清楚起見(jiàn),可先列出回歸計(jì)算表如表11-2:可以證明,確實(shí)使平方和Q達(dá)到最小。例1以家庭為單位,某種商品年需求量與該商品價(jià)格之間的一組調(diào)查數(shù)據(jù)如表11-1所示:Pi(xi)di(yi)1523.5232.32.72.52.42.62.52.8231.53.31.23.51.2比如求例子1中的回歸方程5174646.215.2966.256.56.765.67.844.593.9610.894.212.25∑252554.9767.28概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第33頁(yè)!EX
P2231、2、3、4
概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第34頁(yè)!(二)相關(guān)性檢驗(yàn)因此,在相關(guān)性檢驗(yàn)時(shí)首先提出待檢假設(shè):若H0成立,則x與y之間無(wú)線性關(guān)系,由此建立的回歸直線方程就無(wú)效。若拒絕H0,則x與y之間存在線性關(guān)系,由此建立的回歸直線方程就有效。用方差分析的方法進(jìn)行檢驗(yàn)。為此先介紹平方和分解公式,將x對(duì)y的線性影響與隨機(jī)波動(dòng)引起的變差分開??偟碾x差平方和概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第35頁(yè)!在平方和分解公式中須證明成立帶入上式左端得=a=0(1)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第36頁(yè)!(2)證明:概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第37頁(yè)!在平方和分解公式中其中U是對(duì)于其平均值的離差平方和它反映了的分散程度。而這一分散性是由于在回歸直線上它們所對(duì)應(yīng)的橫坐標(biāo),的變化引起的,并且通過(guò)x對(duì)于y的線性影響表現(xiàn)出來(lái),稱它為回歸平方和。(11.1)概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第38頁(yè)!至于Q,它是對(duì)應(yīng)于變量x的每一個(gè)取值xi
,變量y的實(shí)際觀察值yi與回歸函數(shù)值的離差平方和,是由總誤差中分離出x對(duì)y的線性影響之外的其余因素而產(chǎn)生的誤差。在(11.2)式假定下,Q完全是隨機(jī)項(xiàng)ε引起的,稱為殘差平方和或剩余平方和。概率論與數(shù)理統(tǒng)計(jì)》共47頁(yè),您現(xiàn)在瀏覽的是第39頁(yè)!認(rèn)為x與y之間存在線性相關(guān)關(guān)系。1.首先提出待檢假設(shè)2.根據(jù)假設(shè)選取統(tǒng)計(jì)量在H。成立的條件下所選統(tǒng)計(jì)量3.對(duì)于給定的檢驗(yàn)水平α,構(gòu)造小概率事件(4)根據(jù)樣本觀察值計(jì)算統(tǒng)計(jì)量F的值并與臨界值Fα比較;
(5)下結(jié)論:如果F>Fα
,則否定假設(shè)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版本二手房買賣合同針對(duì)房產(chǎn)稅繳納的約定3篇
- 2025年個(gè)人水利工程建設(shè)與維護(hù)承包合同模板4篇
- 2025年度生態(tài)環(huán)保幕墻材料采購(gòu)與安裝勞務(wù)分包合同范例4篇
- 二零二五版汽車4S店促銷員銷售服務(wù)合同3篇
- 2025年度新材料研發(fā)與應(yīng)用推廣咨詢服務(wù)合同4篇
- 二手住宅買賣合同(海南版2024)
- 專利技術(shù)成果實(shí)施許可合同(2024版)版B版
- 2025年度智慧城市運(yùn)營(yíng)管理出資合同4篇
- 二零二五年度危險(xiǎn)品運(yùn)輸合同框架協(xié)議2篇
- 二零二五年度寵物活體活體領(lǐng)養(yǎng)援助合同4篇
- 節(jié)前停工停產(chǎn)與節(jié)后復(fù)工復(fù)產(chǎn)安全注意事項(xiàng)課件
- 設(shè)備管理績(jī)效考核細(xì)則
- 中國(guó)人民銀行清算總中心直屬企業(yè)2023年招聘筆試上岸歷年典型考題與考點(diǎn)剖析附帶答案詳解
- (正式版)SJT 11449-2024 集中空調(diào)電子計(jì)費(fèi)信息系統(tǒng)工程技術(shù)規(guī)范
- 廣州綠色金融發(fā)展現(xiàn)狀及對(duì)策的研究
- 人教版四年級(jí)上冊(cè)加減乘除四則混合運(yùn)算300題及答案
- 合成生物學(xué)技術(shù)在生物制藥中的應(yīng)用
- 消化系統(tǒng)疾病的負(fù)性情緒與心理護(hù)理
- 高考語(yǔ)文文學(xué)類閱讀分類訓(xùn)練:戲劇類(含答案)
- 協(xié)會(huì)監(jiān)事會(huì)工作報(bào)告大全(12篇)
- WS-T 813-2023 手術(shù)部位標(biāo)識(shí)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論