版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 第三章 回歸分析預(yù)測方法5 非線性回歸預(yù)測法1 引言2 一元線性回歸預(yù)測法3 多元線性回歸預(yù)測法4 虛擬變量 回歸預(yù)測要求掌握以下內(nèi)容:概念部分:1. 變量之間的關(guān)系可以分成哪兩類 2. 回歸分析與相關(guān)分析的區(qū)別和聯(lián)系3. 一元線性回歸(Linear regression)4. 最小二乘回歸法的基本思想5. 回歸方程的顯著性檢驗(yàn)6. 區(qū)間估計(jì)7. 虛擬變量計(jì)算部分:8. 一元線性回歸預(yù)測法 第一節(jié) 引言本章學(xué)習(xí)目的與要求: 通過本章的學(xué)習(xí),了解回歸分析預(yù)測法的概念,掌握回歸分析中各系數(shù)的計(jì)算方法及回歸預(yù)測方法,能夠運(yùn)用Excel工具來進(jìn)行預(yù)測。回本章目錄 案例: 有20戶家庭,冬天的取暖費(fèi)用
2、與3個(gè)因素有關(guān):日間戶外的平均溫度,閣樓絕緣層的厚度,以及爐子的使用年數(shù)。如果某一家庭的平均戶外溫度是F30度,閣樓絕緣層的厚度為5英寸,爐子已使用過10年,它的冬天取暖費(fèi)用為多少? 一、回歸與回歸分析預(yù)測方法 “回歸”一詞的涵義 “回歸”最初是遺傳學(xué)中的一個(gè)名詞,由英國生物學(xué)家兼統(tǒng)計(jì)學(xué)家高爾登首先提出。他在研究人類的身高時(shí),發(fā)現(xiàn)子女身高有回歸于人類的平均身高的趨勢。 回歸現(xiàn)代涵義研究自變量與因變量之間的關(guān)系形式的分析方法。目的:根據(jù)已知自變量來估計(jì)和預(yù)測因變量的值。例如:農(nóng)作物畝產(chǎn)量施肥量降雨量氣溫 在研究某一社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展變化規(guī)律時(shí),經(jīng)過分析可以找到影響這一現(xiàn)象變化的原因。在回歸分析中
3、,把某一現(xiàn)象稱為因變量,它是預(yù)測的對象,把引起這一現(xiàn)象變化的因素稱為自變量,它是引起這一現(xiàn)象變化的原因。而因變量則反映了自變量變化的結(jié)果。 回歸分析預(yù)測方法就是從各種經(jīng)濟(jì)現(xiàn)象之間的相互關(guān)系出發(fā),通過對與預(yù)測對象有聯(lián)系的現(xiàn)象變動(dòng)趨勢的分析,推算預(yù)測對象未來狀態(tài)數(shù)量表現(xiàn)的一種預(yù)測方法。二、回歸分析和相關(guān)分析1、變量之間的關(guān)系 現(xiàn)實(shí)世界中,每一事物都與它周圍的事物相互聯(lián)系、相互影響,反映客觀事物運(yùn)動(dòng)的各種變量之間也就存在著一定的關(guān)系。變量之間的關(guān)系可以分成兩類:函數(shù)關(guān)系和相關(guān)關(guān)系。 (1)函數(shù)關(guān)系。函數(shù)關(guān)系反映客觀事物之間存在著嚴(yán)格的依存關(guān)系,是一種確定性關(guān)系,亦即當(dāng)其它條件不變時(shí),對于某一自變量或
4、幾個(gè)自變量的每一數(shù)值,都有因變量的一個(gè)的確定值與之相對應(yīng),并且這種關(guān)系可以用一個(gè)確定的數(shù)學(xué)表達(dá)式反映出來。 設(shè)有兩個(gè)變量x和y,y與x一起變化并完全依賴于x,當(dāng)x取某個(gè)數(shù)值時(shí),y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記作y=f(x)。如,企業(yè)的原材料消耗金額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價(jià)格x3之間的關(guān)系可表示為y=x1x2x3。例:圓面積對于半徑的依存關(guān)系,正方形的面積對于邊長的依存關(guān)系等等。變量間的函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。(2)相關(guān)關(guān)系相關(guān)關(guān)系。反映事物之間的非嚴(yán)格、不確定的線性依存關(guān)系。有兩個(gè)顯著的特點(diǎn):事物之間在數(shù)量上確實(shí)存在一定的內(nèi)在聯(lián)系。表現(xiàn)在一個(gè)變量發(fā)生數(shù)量上的
5、變化,要影響另一個(gè)變量也相應(yīng)地發(fā)生數(shù)量上的變化。例:事物之間的數(shù)量依存關(guān)系不是確定的,具有一定的隨機(jī)性。表現(xiàn)在給定自變量一個(gè)數(shù)值,因變量會(huì)有若干個(gè)數(shù)值和它對應(yīng),并且因變量總是遵循一定規(guī)律圍繞這些數(shù)值平均數(shù)上下波動(dòng)。其原因是影響因變量發(fā)生變化的因素不止一個(gè)。例:影響工業(yè)總產(chǎn)值的因素除了職工數(shù)外,還有固定資產(chǎn)原值、流動(dòng)資金和能耗等因素。成本勞動(dòng)生產(chǎn)率相關(guān)關(guān)系的特點(diǎn) 1變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)。 2一個(gè)變量的取值不能由另一個(gè)變量唯一確定。 3對于線性相關(guān),各觀測點(diǎn)分布在直線周圍。 不相關(guān)正相關(guān)負(fù)相關(guān)相關(guān)但無線性關(guān)系2、回歸分析與相關(guān)分析研究和測度兩個(gè)或兩個(gè)以上變量之間關(guān)系的方法有回歸分析和相
6、關(guān)分析。相關(guān)分析。研究兩個(gè)或兩個(gè)以上隨機(jī)變量之間線性依存關(guān)系的緊密程度。通常用相關(guān)系數(shù)表示,多元相關(guān)時(shí)用復(fù)相關(guān)系數(shù)表示?;貧w分析。研究某一隨機(jī)變量(因變量)與其他一個(gè)或幾個(gè)普通變量(自變量)之間的數(shù)量變動(dòng)的關(guān)系。區(qū)別相關(guān)分析研究變量都是隨機(jī)變量,不分自變量與因變量回歸分析明確的自變量和因變量,自變量是確定的普通變量,因變量是隨機(jī)變量。聯(lián)系相關(guān)分析事物之間相互依存關(guān)系的兩個(gè)不可分割的方面。在實(shí)際工作中,一般先進(jìn)行相關(guān)分析,由相關(guān)系數(shù)的大小決定是否需要進(jìn)行回歸分析。在相關(guān)分析的基礎(chǔ)上建立回歸模型,以便進(jìn)行推算、預(yù)測?;貧w分析 相關(guān)分析相關(guān)關(guān)系線性相關(guān)非線性相關(guān)完全相關(guān)(R=1)(即線性相關(guān))不相關(guān)
7、(R=0)正相關(guān)負(fù)相關(guān)正相關(guān)負(fù)相關(guān)相關(guān)系數(shù)對變量之間關(guān)系密切程度的度量 的取值范圍是 -1,1:完全相關(guān) /完全正相關(guān) /完全負(fù)相關(guān) /不存在線性相關(guān)關(guān)系 /負(fù)相關(guān) /正相關(guān) 一般,r0.7為高度相關(guān);r0.3為低度相關(guān);0.3 r0.7 為中度相關(guān)。相關(guān)系數(shù)的缺點(diǎn):r接近于1的程度與n有關(guān)。當(dāng)n較小時(shí)r的波動(dòng)較大,當(dāng)n較大時(shí)r的絕對值容易偏小。例如,n=2時(shí),r的絕對值總為1(兩點(diǎn)連線總為一條直線)。例3-1 設(shè)有10個(gè)廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?(相關(guān)數(shù)據(jù))廠家12345678910投入20402030101020202030產(chǎn)出306040
8、60304040503070 回歸分析是研究某一隨機(jī)變量(因變量)與其他一個(gè)或幾個(gè)普通變量(自變量)之間的數(shù)量變動(dòng)的關(guān)系。其基本思路是:從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式,對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著。然后利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度。3、回歸分析的基本思路三、回歸模型的種類 (1)根據(jù)自變量的多少,回歸模型可以分為一元回歸模型和多元回歸模型。 (2)根據(jù)模型中自變量與因變量之間是否線性,可以分為線性回歸模型和非線性回歸模型。 (
9、3)根據(jù)回歸模型是否帶有虛擬變量,回歸模型可以分為普通回歸模型和帶虛擬變量的回歸模型。應(yīng)用回歸分析預(yù)測需滿足條件:1.數(shù)據(jù)量不能太少(以多于20個(gè)較好);2.預(yù)測對象與影響因素之間必須存在相關(guān)關(guān)系; 第二節(jié) 一元線性回歸預(yù)測法 一元線性回歸(Linear regression)是指成對的兩個(gè)變量數(shù)據(jù)分布大體上呈直線趨勢時(shí),運(yùn)用合適的參數(shù)估計(jì)方法,求出一元線性回歸模型,然后根據(jù)自變量與因變量之間的關(guān)系,預(yù)測因變量的趨勢。 現(xiàn)實(shí)中,很多社會(huì)經(jīng)濟(jì)現(xiàn)象之間都存在相關(guān)關(guān)系,因此,一元線性回歸預(yù)測有很廣泛的應(yīng)用。進(jìn)行一元線性回歸預(yù)測時(shí),必須選用合適的統(tǒng)計(jì)方法估計(jì)模型參數(shù),并對模型及其參數(shù)進(jìn)行統(tǒng)計(jì)檢驗(yàn)?;乇?/p>
10、章目錄一、一元線性回歸模型一元線性回歸(Linear regression),只研究一個(gè)自變量與一個(gè)因變量之間的統(tǒng)計(jì)關(guān)系。 對于只涉及一個(gè)自變量的簡單線性回歸模型可表示為:其中,b0和b1稱為模型的參數(shù);e是隨機(jī)誤差項(xiàng),又稱隨機(jī)干擾項(xiàng),有 在線性回歸模型中加入隨機(jī)誤差項(xiàng)是基于以下原因: 第一,模型不可能包含所有的解釋變量。 第二,模型的設(shè)定誤差。 第三,測量誤差的影響。 第四,其他隨機(jī)因素的影響。簡單線性回歸方程的形式為 也稱為直線回歸方程。其中, b0是回歸直線在y軸上的截距; b1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值。總體回歸參數(shù)b0和b1是未知的,必需利用
11、樣本數(shù)據(jù)去估計(jì)。用樣本統(tǒng)計(jì)量b0和b1代替回歸方程中的未知參數(shù)b0和b1 ,就得到了估計(jì)的回歸方程:其中, b0是估計(jì)的回歸直線在y軸上的截距,b1是直線的斜率。 二、參數(shù)b0和b1的最小二乘估計(jì)對例3-1中兩個(gè)變量的數(shù)據(jù)進(jìn)行線性回歸,就是要找到一條直線來適當(dāng)?shù)卮韴D中的那些點(diǎn)的趨勢。 用數(shù)據(jù)尋找一條直線的過程也叫做擬合一條直線。?首先需要確定選擇這條直線的標(biāo)準(zhǔn)。這里介紹最小二乘回歸法(least squares regression)。最小二乘回歸法的基本思想:通過數(shù)學(xué)模型,擬合一條較為理想的直線,這條直線必須滿足兩點(diǎn)要求(1)原數(shù)列的觀測值與模型估計(jì)值的離差平方和(即所有點(diǎn)到該直線的垂直距
12、離的平方和)為最小。(2)原數(shù)列的觀測值與模型估計(jì)值的離差總和為0。最小二乘法離差與離差平方ee最小擬合程度最好最小二乘原理簡單講,使歷史數(shù)據(jù)到擬合直線上的離差平方和最小,從而求得模型參數(shù)的方法。法國數(shù)學(xué)家勒讓德于1806年首次發(fā)表最小二乘理論。事實(shí)上,德國的高斯于1794年已經(jīng)應(yīng)用這一理論推算了谷神星的軌道,但遲至1809年才正式發(fā)表。最小二乘法也是數(shù)理統(tǒng)計(jì)中一種常用的方法,在工業(yè)技術(shù)和其他科學(xué)研究中有廣泛應(yīng)用。設(shè)簡單線性回歸模型 中, b0和b1是b0和b1的估計(jì)值。則y的估計(jì)值用 表示。我們要求出這樣的待估參數(shù)b0和b1,使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小,即使 極小。為此
13、,分別求Q對b0和b1的偏導(dǎo),就可以求出符合要求的待估參數(shù)b0和b1:例3-2:已知某種商品的銷售量同居民的可支配收入有關(guān),現(xiàn)有如下表的統(tǒng)計(jì)數(shù)據(jù),試建立回歸方程,并求出相應(yīng)參數(shù)的最小二乘估計(jì)值。年份實(shí)際可支配收入 x(單位:10元)商品的銷售量(單位:件)年份實(shí)際可支配收入x(單位:10元)商品的銷售量(單位:件)1983522670019917418158198453971361992769868319855777658199380193171986613778419948559675198764481081995842854219886707583199686085841989695800
14、2199789096121990713844219989209719第一步:繪制散點(diǎn)圖6000650070007500800085009000950010000500550600650700750800850900yi(件)xi(10元)950第二步:設(shè)一元線性回歸方程為年份實(shí)際可支配收入 x (10元)商品的銷售量(件)xiyixi219835226700349740027248419845397136384630429052119855777658441866633292919866137784477159237576919876448108522155241473619886707583
15、5080610448900198969580025561390483025199071384426019146508369199174181586045078549081199276986836677227591361199380193177462917641601199485596758272125731025199584285427192364708964199686085847382240739600199789096128554680792100199892097198941480846400SUM11651133703989447718726865所求的回歸方程為:600065007
16、0007500800085009000950010000500550600650700750800850900yi(件)xi(10元)950三、回歸方程的顯著性檢驗(yàn)我們把觀測值與其平均值的偏差平方和 稱為總離差平方和。記為SST(Total Deviation Sum of Squares)。SST來源于兩個(gè)方面:一是由于自變量x的取值不同造成的(回歸變差);二是除x以外的其他因素(如觀測和實(shí)踐中產(chǎn)生的誤差等)的影響造成的(剩余變差)??煞纸鉃閮刹糠郑浩渲?稱作回歸平方和(Regression Sum of Squares),記作SSR; 稱作殘差平方和(Residual Sum of Squ
17、ares),記作SSE。SST=SSR+SSE總離差平方和 反映因變量的每個(gè)觀察值與其均值的總離差;回歸平方和 ,反映自變量的變化對因變量 y 取值變化的影響;殘差平方和 反映除自變量以外的其他因素對取值的影響,也稱為不可解釋的平方和或剩余平方和。 r2 = 決定系數(shù) =r = 相關(guān)系數(shù) = 確定性系數(shù)SSRSST+-YX解釋的總的均值(Y)回歸線(Y)未解釋的總的、解釋的和未解釋的偏離之間的關(guān)系回歸方程的顯著性檢驗(yàn):回歸方程的顯著性檢驗(yàn),就是檢驗(yàn)自變量和因變量之間的線性關(guān)系是否顯著。有3種方法:1.F檢驗(yàn)法(總體顯著性檢驗(yàn))。2.t檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))。3.相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)
18、的顯著性檢驗(yàn))。 具體方法是將回歸離差平方和SSR同剩余離差平方和SSE加以比較,應(yīng)用檢驗(yàn)來分析二者之間的差別是否顯著。如果是顯著的,則兩個(gè)變量之間存在線性關(guān)系;如果不顯著,則兩個(gè)變量之間不存在線性關(guān)系。檢驗(yàn)步驟如下:1.F檢驗(yàn)法(總體顯著性檢驗(yàn))(1)提出假設(shè)H0:自變量與因變量的線性關(guān)系不顯著;H1:兩者線性關(guān)系顯著。(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量F:(3)確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值Fa;(4)作出決策:若 拒絕H0 ;若 接受H0 。 在回歸分析中通常計(jì)算F值來檢驗(yàn)?zāi)P涂傮w的顯著性,在我們后面將要學(xué)到的多元回歸中,F(xiàn)用來檢驗(yàn)是否至少有一個(gè)回歸系數(shù)(因?yàn)橛卸鄠€(gè)回歸
19、系數(shù))不為0。而在簡單回歸(一元回歸)中只有一個(gè)回歸系數(shù)需要檢驗(yàn),而回歸系數(shù)就是回歸直線的斜率,所以檢驗(yàn)總體顯著性的F檢驗(yàn)就等價(jià)于回歸系數(shù)的檢驗(yàn)。 對回歸系數(shù)的顯著性檢驗(yàn)就是檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對因變量y的影響是否顯著。2.t檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn))檢驗(yàn)步驟如下:(1)提出假設(shè) (沒有線性關(guān)系) (有線性關(guān)系) (2)計(jì)算檢驗(yàn)的t統(tǒng)計(jì)量 自由度為n-2;(3)確定顯著性水平,并進(jìn)行決策 若 拒絕H0 ;若 接受H0 。在“投入與產(chǎn)出”的例1中,相關(guān)系數(shù)r=0.759,顯著性水平0.05時(shí),計(jì)算檢驗(yàn)的統(tǒng)計(jì)量: 查表得 落入拒絕域中,即拒絕H0,接受H1。所以
20、自變量x與因變量y之間相關(guān)關(guān)系明顯,投入量對產(chǎn)出量的影響顯著。 3. 相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn)) (1)計(jì)算相關(guān)系數(shù)r。(2)根據(jù)回歸模型的自由度(n-2)和顯著性水平a的值,查表得出臨界值 (3)判別:如果 ,則表明兩變量之間線性相關(guān)關(guān)系顯著。反之,如果 ,則表明兩變量之間線性相關(guān)關(guān)系不顯著。六、回歸方程在估計(jì)和預(yù)測中的應(yīng)用 點(diǎn)估計(jì)利用估計(jì)的回歸方程,對于自變量x(如例1的第2個(gè)廠家)的一個(gè)給定值x0,求出因變量y的估計(jì)值預(yù)測區(qū)間估計(jì)利用估計(jì)的回歸方程,對于自變量 x 的一個(gè)給定值x0,求出因變量y的一個(gè)的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間。y0在1-置信水平下的預(yù)測區(qū)間為:預(yù)測區(qū)間
21、為:所以他的產(chǎn)出的95%的預(yù)測區(qū)間為24.478和72.627之間。回到前面的例子,投入為25時(shí),平均產(chǎn)出的95%的置信區(qū)間。 當(dāng)實(shí)際觀測值較多時(shí)(n30), 近似等于1, 近似于正態(tài)分布, 上式可簡化為例3-1 設(shè)有10個(gè)廠家的投入和產(chǎn)出如下,根據(jù)這些數(shù)據(jù),我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎?(相關(guān)數(shù)據(jù))廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)1:某省19781986年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計(jì)如下表:1、建立一元線性回歸模型。2、對回歸模型進(jìn)行顯著性檢驗(yàn)(=0.05)。3、若居民貨幣收入每年平均增長1
22、9%,預(yù)測1987年居民消費(fèi)品購買力。4、對1987年居民消費(fèi)品購買力作個(gè)別值區(qū)間預(yù)測。要求用Excel軟件計(jì)算,并給出計(jì)算結(jié)果及截圖。年份居民消費(fèi)品購買力x居民貨幣收入x年份居民消費(fèi)品購買力x居民貨幣收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.8198115.819.6198217.622.1198320.525.6(單位:億元)作業(yè)2:(例3-1 ) 設(shè)有10個(gè)廠家的投入和產(chǎn)出如下,試建立回歸方程,當(dāng)投入為25時(shí),求出平均產(chǎn)出95%的置信區(qū)間。要求用Excel軟件計(jì)算,并給出計(jì)算結(jié)果的主要
23、結(jié)果(截圖)。廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)1:某省19781986年居民消費(fèi)品購買力和居民貨幣收入統(tǒng)計(jì)如下表:1、建立一元線性回歸模型。2、對回歸模型進(jìn)行顯著性檢驗(yàn)(=0.05)。3、若居民貨幣收入每年平均增長19%,預(yù)測1987年居民消費(fèi)品購買力。4、對1987年居民消費(fèi)品購買力作區(qū)間預(yù)測。年份居民消費(fèi)品購買力x居民貨幣收入x年份居民消費(fèi)品購買力x居民貨幣收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.81
24、98115.819.6198217.622.1198320.525.6(單位:億元)設(shè)一元線性回歸模型為:計(jì)算回歸系數(shù)。年份居民消費(fèi)品購買力x居民貨幣收入yx yx2y219788.511.698.672.25134.56197911.114.1156.51123.21198.81198013.617.1232.56184.96292.41198115.819.6309.68249.64384.16198217.622.1388.96309.76488.41198320.525.6524.8420.25655.36198427.833.6934.08772.841128.96198533.54
25、0.51356.751122.251640.25198639.247.81873.761536.642284.84合計(jì)187.62325875.74791.87207.76(單位:億元)計(jì)算回歸系數(shù)。所求回歸模型為:相關(guān)系數(shù)檢驗(yàn)法線形關(guān)系顯著,檢驗(yàn)通過F 檢驗(yàn)。年份居民消費(fèi)品購買力x居民貨幣收入y預(yù)測值y(y-y均)2(y- y)219788.511.611.30 209.75 0.09 197911.114.114.39 129.70 0.08 198013.617.117.36 70.79 0.07 198115.819.619.98 33.59 0.15 198217.622.122.1
26、2 13.35 0.00 198320.525.625.58 0.04 0.00 198427.833.634.26 71.98 0.44 198533.540.541.05 233.09 0.30 198639.247.847.83 486.21 0.00 合計(jì)187.6232233.86 1248.51 1.13 F 檢驗(yàn)。n =9;= 0.05;查 F 值表得 :F(1,n-2)= F0.05 (1,7)=5.59樣本的統(tǒng)計(jì)量 F : F = 77738.11F F0.05(1,9),表明兩變量之間線性相關(guān)關(guān)系顯著,檢驗(yàn)通過。t 檢驗(yàn)。n =9;/2 = 0.025;查 t 值表得:t/
27、2 (n-2)= t0.025 (7)=2.365樣本的統(tǒng)計(jì)量 t : t = 218.95;| t | t0.025(7),拒絕假設(shè)H0:b=0,而接受H1,即認(rèn)為 b 顯著異于 0,因變量 y 對自變量 x 的一元線性回歸成立。預(yù)測n =9;/2 = 0.025;查 t 值表得:t/2 (n-2)= t0.025 (7)=2.365預(yù)測 當(dāng)居民貨幣收入每年平均增長19%,在顯著性水平=0.05時(shí),1987年居民消費(fèi)品購買力的預(yù)測區(qū)間為53.4659.92億元 第三節(jié) 多元線性回歸預(yù)測法 社會(huì)經(jīng)濟(jì)現(xiàn)象的變化往往受到多個(gè)因素的影響,因此,一般要進(jìn)行多元回歸分析,我們把包括兩個(gè)或兩個(gè)以上自變量的
28、回歸稱為多元回歸。 多元回歸與一元回歸類似,可以用最小二乘法估計(jì)模型參數(shù)。也需對模型及模型參數(shù)進(jìn)行統(tǒng)計(jì)檢驗(yàn)。 選擇合適的自變量是正確進(jìn)行多元回歸預(yù)測的前提之一,多元回歸模型自變量的選擇可以利用變量之間的相關(guān)矩陣來解決?;乇菊履夸?一、多元線性回歸模型 描述因變量 y 如何依賴于自變量 和誤差項(xiàng) 的方程稱為多元線性回歸模型。涉及多個(gè)自變量的多元線性回歸模型可表示為:總體回歸參數(shù) 是未知的,要利用樣本數(shù)據(jù)去估計(jì)。用樣本統(tǒng)計(jì)量 代替回歸方程中的未知參數(shù),即得到估計(jì)的回歸方程: 二元線性回歸方程為: 其中, 分別是 的偏回歸系數(shù)。 同理三元線性回歸方程為 :由樣本數(shù)據(jù)推算、估計(jì)回歸方程中各個(gè)回歸系數(shù),
29、是多元回歸分析中的一個(gè)重要方面,下面簡要介紹回歸系數(shù)的計(jì)算方法。二元線性回歸方程中回歸系數(shù) 可由以下方程組解出:用手解這些方程枯燥而費(fèi)時(shí),一般來說,自變量超過3個(gè)時(shí),要用矩陣運(yùn)算,可以借助計(jì)算機(jī)軟件解出參數(shù)。下面給出一個(gè)三元線性回歸模型的例子。 例3-4: 有20戶家庭,冬天的取暖費(fèi)用與3個(gè)因素有關(guān):日間戶外的平均溫度,閣樓絕緣層的厚度,以及爐子的使用年數(shù)。有關(guān)信息列出在右表中: 試作出三元回歸方程并討論:哪些自變量與因變量正相關(guān)?哪些是負(fù)相關(guān)?如果某一家庭的平均戶外溫度是30度,閣樓絕緣層的厚度為5英寸,爐子已使用過10年,它的冬天取暖費(fèi)用為多少?(相關(guān)數(shù)據(jù))解:設(shè)三元線性回歸方程為 由軟件
30、可得到這題的線性回歸方程為: 將x130, x25, x310代入方程,得由這個(gè)線性回歸方程可以算出每個(gè)家庭的預(yù)測取暖費(fèi)值。殘差( )及其平方也列在下表中:20戶家庭預(yù)測取暖費(fèi)值計(jì)算表 二、對多元回歸模型的評估如果檢驗(yàn)水平合適而且數(shù)據(jù)足夠多,用多元回歸模型幾乎可以處理所有數(shù)據(jù)組。模型一旦建立,一件很重要的事就是檢驗(yàn)?zāi)P团c數(shù)據(jù)是否很好擬合以及與回歸分析的假設(shè)前提是否相符。檢驗(yàn)回歸模型是否恰當(dāng)?shù)姆椒ㄓ泻芏?,如:檢驗(yàn)?zāi)P驼w的顯著性、檢驗(yàn)回歸系數(shù)的顯著性、計(jì)算殘差、檢驗(yàn)樣本決定系數(shù)等。 1. F檢驗(yàn)法(總體顯著性檢驗(yàn)) 對多元回歸方程的整體性檢驗(yàn),就是要看自變量 是否從整體上對隨機(jī)變量有明顯的影響。
31、為此,要用到F統(tǒng)計(jì)量。檢驗(yàn)方法是將回歸離差平方和(SSR )同殘差平方和( SSE )加以比較,應(yīng)用 F 檢驗(yàn)來分析二者之間的差別是否顯著。如果是顯著的,因變量與自變量之間存在線性關(guān)系;如果不顯著,則因變量與自變量之間不存在線性關(guān)系。 多元回歸模型的整體性檢驗(yàn)的步驟如下:(1)提出假設(shè) H0: H1: 至少有一個(gè)回歸系數(shù)不等于0 。(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量 F回歸平方和 ;殘差平方和(3)確定顯著性水平和分子自由度m、分母自由度n-m-1找出臨界值Fa ;(4)作出決策:若F Fa ,拒絕H0;若F Fa ,接受H0 。2. 復(fù)相關(guān)系數(shù)檢驗(yàn)法(回歸系數(shù)的顯著性檢驗(yàn)) 步驟:(1)計(jì)算復(fù)相關(guān)系數(shù)R。
32、(2)根據(jù)回歸模型的自由度(n-m)和顯著性水平a的值,查表得出臨界值(3)判別:如果 ,則表明兩變量之間線性相關(guān)關(guān)系顯著。反之,如果 ,則表明兩變量之間線性相關(guān)關(guān)系不顯著。 多重樣本決定系數(shù) 多重樣本決定系數(shù)R2定義為回歸平方和占總離差平方和的比例,反映回歸直線的擬合程度。公式為:R2的取值范圍在 0, 1 之間,R21,說明回歸方程擬合的越好; R2 0,說明回歸方程擬合的越差。 本題中,3. 多重預(yù)測標(biāo)準(zhǔn)差 預(yù)測標(biāo)準(zhǔn)差可以通過SSE除以模型誤差自由度再進(jìn)行開方來計(jì)算: 也可以直接計(jì)算: 本題中4. t 檢驗(yàn)(回歸系數(shù)的顯著性檢驗(yàn))在多元線性回歸中,對每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn),應(yīng)用t
33、檢驗(yàn)。步驟如下:(1)提出假設(shè) (自變量與 因變量沒有線性關(guān)系) (自變量與 因變量有線性關(guān)系) 如果不能拒絕零假設(shè),說明自變量不顯著;如果拒絕零假設(shè),說明自變量是顯著的。(2)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 t(3)確定顯著性水平,并進(jìn)行決策 拒絕H0 ; 不拒絕 本例中,對戶外溫度: 對絕緣層厚度: 對爐子已用時(shí)間: 設(shè)顯著性水平為0.05,需檢驗(yàn)的各個(gè)回歸系數(shù)的自由度為20-3-116,進(jìn)行雙尾檢驗(yàn)。查表得臨界值 本題回歸方程為:b1-3.07, 表示對自變量x1的偏回歸系數(shù)的抽樣分布的標(biāo)準(zhǔn)差,由軟件計(jì)算可知為0.7723。代入數(shù)據(jù)所以 ,拒絕H0,說明自變量x1與因變量y有線性關(guān)系,戶外溫度對取暖費(fèi)有影響。同理可對其他回歸系數(shù)分別做顯著性檢驗(yàn)。 第四節(jié) 虛擬變量回歸預(yù)測 在回歸模型分析中,經(jīng)常發(fā)生的情況是:因變量不僅受諸如產(chǎn)量、銷售量、收入、價(jià)格、身高和溫度等數(shù)量變量的影響,而且也受諸如性別、文化程度、宗教、戰(zhàn)爭、地震、季節(jié)、地勢以及政府經(jīng)濟(jì)政策變化等品質(zhì)變量的影響。在建立線性回歸模型時(shí)。要將品質(zhì)變量引入線性回歸模型中。一、虛擬變量 品質(zhì)變量只能以品質(zhì)、屬性、種類等具體形式表現(xiàn),必須將其數(shù)量化。這種以出現(xiàn)為1,未出現(xiàn)為0形式表現(xiàn)的品質(zhì)變量,就稱為虛擬變量?;乇菊履夸洺R姷膸摂M變量的回歸模型有三種形式(1)反映政府政策變化或某種因素發(fā)生重大變異的跳躍、間 斷式模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025死亡賠償協(xié)議書格式
- 黑素瘤病因介紹
- 協(xié)議書汽車轉(zhuǎn)讓模板
- 合同戰(zhàn)略合作協(xié)議
- 代理合作協(xié)議范本大全
- 公司保密協(xié)議案例
- 顱內(nèi)靜脈血栓形成病因介紹
- 2023夫妻結(jié)婚前協(xié)議書七篇
- 關(guān)于采購協(xié)議
- 中醫(yī)藥健康知識(shí)講座
- 2023年報(bào)告文學(xué)研究(自考)(重點(diǎn))題庫(帶答案)
- 國軍淞滬會(huì)戰(zhàn)
- 2023年湖南體育職業(yè)學(xué)院高職單招(語文)試題庫含答案解析
- GB/T 39314-2020鋁合金石膏型鑄造通用技術(shù)導(dǎo)則
- 裝飾裝修施工質(zhì)量檢查評分表
- 非開挖施工技術(shù)講稿課件
- 單絨毛膜雙羊膜囊雙胎2022優(yōu)秀課件
- 《思想道德與法治》 課件 第四章 明確價(jià)值要求 踐行價(jià)值準(zhǔn)則
- 北師大版八年級上數(shù)學(xué)競賽試卷
- 幼兒園講座:課程游戲化、生活化建設(shè)的背景與目的課件
- 地理信息系統(tǒng)(GIS)公開課(課堂)課件
評論
0/150
提交評論