第三章回歸分析預(yù)測方法-課件

上傳人：3*** IP屬地：貴州上傳時間：2022-07-19 格式：PPT 頁數(shù)：103 大?。?.45MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩98頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章回歸分析預(yù)測方法5 非線性回歸預(yù)測法1 引言2 一元線性回歸預(yù)測法3 多元線性回歸預(yù)測法4 虛擬變量回歸預(yù)測要求掌握以下內(nèi)容：概念部分：1. 變量之間的關(guān)系可以分成哪兩類 2. 回歸分析與相關(guān)分析的區(qū)別和聯(lián)系3. 一元線性回歸（Linear regression）4. 最小二乘回歸法的基本思想5. 回歸方程的顯著性檢驗6. 區(qū)間估計7. 虛擬變量計算部分：8. 一元線性回歸預(yù)測法第一節(jié) 引言本章學(xué)習(xí)目的與要求：通過本章的學(xué)習(xí)，了解回歸分析預(yù)測法的概念，掌握回歸分析中各系數(shù)的計算方法及回歸預(yù)測方法，能夠運用Excel工具來進(jìn)行預(yù)測?；乇菊履夸?案例：有20戶家庭，冬天的取暖費用

2、與3個因素有關(guān)：日間戶外的平均溫度，閣樓絕緣層的厚度，以及爐子的使用年數(shù)。如果某一家庭的平均戶外溫度是F30度，閣樓絕緣層的厚度為5英寸，爐子已使用過10年，它的冬天取暖費用為多少？一、回歸與回歸分析預(yù)測方法 “回歸”一詞的涵義 “回歸”最初是遺傳學(xué)中的一個名詞，由英國生物學(xué)家兼統(tǒng)計學(xué)家高爾登首先提出。他在研究人類的身高時，發(fā)現(xiàn)子女身高有回歸于人類的平均身高的趨勢。回歸現(xiàn)代涵義研究自變量與因變量之間的關(guān)系形式的分析方法。目的：根據(jù)已知自變量來估計和預(yù)測因變量的值。例如：農(nóng)作物畝產(chǎn)量施肥量降雨量氣溫在研究某一社會經(jīng)濟現(xiàn)象的發(fā)展變化規(guī)律時，經(jīng)過分析可以找到影響這一現(xiàn)象變化的原因。在回歸分析中

3、，把某一現(xiàn)象稱為因變量，它是預(yù)測的對象，把引起這一現(xiàn)象變化的因素稱為自變量，它是引起這一現(xiàn)象變化的原因。而因變量則反映了自變量變化的結(jié)果。回歸分析預(yù)測方法就是從各種經(jīng)濟現(xiàn)象之間的相互關(guān)系出發(fā)，通過對與預(yù)測對象有聯(lián)系的現(xiàn)象變動趨勢的分析，推算預(yù)測對象未來狀態(tài)數(shù)量表現(xiàn)的一種預(yù)測方法。二、回歸分析和相關(guān)分析1、變量之間的關(guān)系現(xiàn)實世界中，每一事物都與它周圍的事物相互聯(lián)系、相互影響，反映客觀事物運動的各種變量之間也就存在著一定的關(guān)系。變量之間的關(guān)系可以分成兩類：函數(shù)關(guān)系和相關(guān)關(guān)系。（1）函數(shù)關(guān)系。函數(shù)關(guān)系反映客觀事物之間存在著嚴(yán)格的依存關(guān)系，是一種確定性關(guān)系，亦即當(dāng)其它條件不變時，對于某一自變量或

4、幾個自變量的每一數(shù)值，都有因變量的一個的確定值與之相對應(yīng)，并且這種關(guān)系可以用一個確定的數(shù)學(xué)表達(dá)式反映出來。設(shè)有兩個變量x和y，y與x一起變化并完全依賴于x，當(dāng)x取某個數(shù)值時，y依確定的關(guān)系取相應(yīng)的值，則稱y是x的函數(shù)，記作y=f(x)。如，企業(yè)的原材料消耗金額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價格x3之間的關(guān)系可表示為y=x1x2x3。例：圓面積對于半徑的依存關(guān)系，正方形的面積對于邊長的依存關(guān)系等等。變量間的函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。（2）相關(guān)關(guān)系相關(guān)關(guān)系。反映事物之間的非嚴(yán)格、不確定的線性依存關(guān)系。有兩個顯著的特點：事物之間在數(shù)量上確實存在一定的內(nèi)在聯(lián)系。表現(xiàn)在一個變量發(fā)生數(shù)量上的

5、變化，要影響另一個變量也相應(yīng)地發(fā)生數(shù)量上的變化。例：事物之間的數(shù)量依存關(guān)系不是確定的，具有一定的隨機性。表現(xiàn)在給定自變量一個數(shù)值，因變量會有若干個數(shù)值和它對應(yīng)，并且因變量總是遵循一定規(guī)律圍繞這些數(shù)值平均數(shù)上下波動。其原因是影響因變量發(fā)生變化的因素不止一個。例：影響工業(yè)總產(chǎn)值的因素除了職工數(shù)外，還有固定資產(chǎn)原值、流動資金和能耗等因素。成本勞動生產(chǎn)率相關(guān)關(guān)系的特點 1變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)。 2一個變量的取值不能由另一個變量唯一確定。 3對于線性相關(guān)，各觀測點分布在直線周圍。不相關(guān)正相關(guān)負(fù)相關(guān)相關(guān)但無線性關(guān)系2、回歸分析與相關(guān)分析研究和測度兩個或兩個以上變量之間關(guān)系的方法有回歸分析和相

6、關(guān)分析。相關(guān)分析。研究兩個或兩個以上隨機變量之間線性依存關(guān)系的緊密程度。通常用相關(guān)系數(shù)表示，多元相關(guān)時用復(fù)相關(guān)系數(shù)表示。回歸分析。研究某一隨機變量（因變量）與其他一個或幾個普通變量（自變量）之間的數(shù)量變動的關(guān)系。區(qū)別相關(guān)分析研究變量都是隨機變量，不分自變量與因變量回歸分析明確的自變量和因變量，自變量是確定的普通變量，因變量是隨機變量。聯(lián)系相關(guān)分析事物之間相互依存關(guān)系的兩個不可分割的方面。在實際工作中，一般先進(jìn)行相關(guān)分析，由相關(guān)系數(shù)的大小決定是否需要進(jìn)行回歸分析。在相關(guān)分析的基礎(chǔ)上建立回歸模型，以便進(jìn)行推算、預(yù)測。回歸分析相關(guān)分析相關(guān)關(guān)系線性相關(guān)非線性相關(guān)完全相關(guān)(R=1)(即線性相關(guān))不相關(guān)

7、(R=0)正相關(guān)負(fù)相關(guān)正相關(guān)負(fù)相關(guān)相關(guān)系數(shù)對變量之間關(guān)系密切程度的度量的取值范圍是 -1,1:完全相關(guān) /完全正相關(guān) /完全負(fù)相關(guān) /不存在線性相關(guān)關(guān)系 /負(fù)相關(guān) /正相關(guān) 一般，r0.7為高度相關(guān)；r0.3為低度相關(guān)；0.3 r0.7 為中度相關(guān)。相關(guān)系數(shù)的缺點：r接近于1的程度與n有關(guān)。當(dāng)n較小時r的波動較大，當(dāng)n較大時r的絕對值容易偏小。例如，n=2時，r的絕對值總為1（兩點連線總為一條直線）。例3-1 設(shè)有10個廠家的投入和產(chǎn)出如下，根據(jù)這些數(shù)據(jù)，我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎？（相關(guān)數(shù)據(jù)）廠家12345678910投入20402030101020202030產(chǎn)出306040

8、60304040503070 回歸分析是研究某一隨機變量(因變量)與其他一個或幾個普通變量(自變量)之間的數(shù)量變動的關(guān)系。其基本思路是：從一組樣本數(shù)據(jù)出發(fā)，確定變量之間的數(shù)學(xué)關(guān)系式，對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗，并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著，哪些不顯著。然后利用所求的關(guān)系式，根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值，并給出這種預(yù)測或控制的精確程度。3、回歸分析的基本思路三、回歸模型的種類 (1)根據(jù)自變量的多少，回歸模型可以分為一元回歸模型和多元回歸模型。 (2)根據(jù)模型中自變量與因變量之間是否線性，可以分為線性回歸模型和非線性回歸模型。 (

9、3)根據(jù)回歸模型是否帶有虛擬變量，回歸模型可以分為普通回歸模型和帶虛擬變量的回歸模型。應(yīng)用回歸分析預(yù)測需滿足條件：1.數(shù)據(jù)量不能太少（以多于20個較好）；2.預(yù)測對象與影響因素之間必須存在相關(guān)關(guān)系；第二節(jié) 一元線性回歸預(yù)測法一元線性回歸（Linear regression）是指成對的兩個變量數(shù)據(jù)分布大體上呈直線趨勢時，運用合適的參數(shù)估計方法，求出一元線性回歸模型，然后根據(jù)自變量與因變量之間的關(guān)系，預(yù)測因變量的趨勢。現(xiàn)實中，很多社會經(jīng)濟現(xiàn)象之間都存在相關(guān)關(guān)系，因此，一元線性回歸預(yù)測有很廣泛的應(yīng)用。進(jìn)行一元線性回歸預(yù)測時，必須選用合適的統(tǒng)計方法估計模型參數(shù)，并對模型及其參數(shù)進(jìn)行統(tǒng)計檢驗?；乇?/p>

10、章目錄一、一元線性回歸模型一元線性回歸（Linear regression），只研究一個自變量與一個因變量之間的統(tǒng)計關(guān)系。對于只涉及一個自變量的簡單線性回歸模型可表示為：其中，b0和b1稱為模型的參數(shù)；e是隨機誤差項，又稱隨機干擾項，有在線性回歸模型中加入隨機誤差項是基于以下原因：第一，模型不可能包含所有的解釋變量。第二，模型的設(shè)定誤差。第三，測量誤差的影響。第四，其他隨機因素的影響。簡單線性回歸方程的形式為也稱為直線回歸方程。其中， b0是回歸直線在y軸上的截距； b1是直線的斜率，稱為回歸系數(shù)，表示當(dāng)x每變動一個單位時，y的平均變動值?？傮w回歸參數(shù)b0和b1是未知的，必需利用

11、樣本數(shù)據(jù)去估計。用樣本統(tǒng)計量b0和b1代替回歸方程中的未知參數(shù)b0和b1 ，就得到了估計的回歸方程：其中， b0是估計的回歸直線在y軸上的截距，b1是直線的斜率。二、參數(shù)b0和b1的最小二乘估計對例3-1中兩個變量的數(shù)據(jù)進(jìn)行線性回歸，就是要找到一條直線來適當(dāng)?shù)卮韴D中的那些點的趨勢。用數(shù)據(jù)尋找一條直線的過程也叫做擬合一條直線。?首先需要確定選擇這條直線的標(biāo)準(zhǔn)。這里介紹最小二乘回歸法（least squares regression）。最小二乘回歸法的基本思想：通過數(shù)學(xué)模型，擬合一條較為理想的直線，這條直線必須滿足兩點要求（1）原數(shù)列的觀測值與模型估計值的離差平方和（即所有點到該直線的垂直距

12、離的平方和）為最小。（2）原數(shù)列的觀測值與模型估計值的離差總和為0。最小二乘法離差與離差平方ee最小擬合程度最好最小二乘原理簡單講，使歷史數(shù)據(jù)到擬合直線上的離差平方和最小，從而求得模型參數(shù)的方法。法國數(shù)學(xué)家勒讓德于1806年首次發(fā)表最小二乘理論。事實上，德國的高斯于1794年已經(jīng)應(yīng)用這一理論推算了谷神星的軌道，但遲至1809年才正式發(fā)表。最小二乘法也是數(shù)理統(tǒng)計中一種常用的方法，在工業(yè)技術(shù)和其他科學(xué)研究中有廣泛應(yīng)用。設(shè)簡單線性回歸模型中， b0和b1是b0和b1的估計值。則y的估計值用表示。我們要求出這樣的待估參數(shù)b0和b1，使因變量的觀察值與估計值之間的離差平方和達(dá)到最小，即使極小。為此

13、，分別求Q對b0和b1的偏導(dǎo)，就可以求出符合要求的待估參數(shù)b0和b1：例3-2：已知某種商品的銷售量同居民的可支配收入有關(guān)，現(xiàn)有如下表的統(tǒng)計數(shù)據(jù)，試建立回歸方程，并求出相應(yīng)參數(shù)的最小二乘估計值。年份實際可支配收入 x（單位：10元）商品的銷售量（單位：件）年份實際可支配收入x（單位：10元）商品的銷售量（單位：件）1983522670019917418158198453971361992769868319855777658199380193171986613778419948559675198764481081995842854219886707583199686085841989695800

14、2199789096121990713844219989209719第一步：繪制散點圖6000650070007500800085009000950010000500550600650700750800850900yi(件)xi（10元）950第二步：設(shè)一元線性回歸方程為年份實際可支配收入 x (10元)商品的銷售量（件）xiyixi219835226700349740027248419845397136384630429052119855777658441866633292919866137784477159237576919876448108522155241473619886707583

15、5080610448900198969580025561390483025199071384426019146508369199174181586045078549081199276986836677227591361199380193177462917641601199485596758272125731025199584285427192364708964199686085847382240739600199789096128554680792100199892097198941480846400SUM11651133703989447718726865所求的回歸方程為：600065007

16、0007500800085009000950010000500550600650700750800850900yi(件)xi（10元）950三、回歸方程的顯著性檢驗我們把觀測值與其平均值的偏差平方和稱為總離差平方和。記為SST（Total Deviation Sum of Squares）。SST來源于兩個方面：一是由于自變量x的取值不同造成的（回歸變差）；二是除x以外的其他因素(如觀測和實踐中產(chǎn)生的誤差等)的影響造成的（剩余變差）?？煞纸鉃閮刹糠郑浩渲?稱作回歸平方和（Regression Sum of Squares）,記作SSR；稱作殘差平方和（Residual Sum of Squ

17、ares）,記作SSE。SST=SSR+SSE總離差平方和反映因變量的每個觀察值與其均值的總離差；回歸平方和，反映自變量的變化對因變量 y 取值變化的影響；殘差平方和反映除自變量以外的其他因素對取值的影響，也稱為不可解釋的平方和或剩余平方和。 r2 = 決定系數(shù) =r = 相關(guān)系數(shù) = 確定性系數(shù)SSRSST+-YX解釋的總的均值（Y）回歸線（Y）未解釋的總的、解釋的和未解釋的偏離之間的關(guān)系回歸方程的顯著性檢驗：回歸方程的顯著性檢驗，就是檢驗自變量和因變量之間的線性關(guān)系是否顯著。有3種方法：1.F檢驗法（總體顯著性檢驗）。2.t檢驗法（回歸系數(shù)的顯著性檢驗）。3.相關(guān)系數(shù)檢驗法（回歸系數(shù)

18、的顯著性檢驗）。具體方法是將回歸離差平方和SSR同剩余離差平方和SSE加以比較，應(yīng)用檢驗來分析二者之間的差別是否顯著。如果是顯著的，則兩個變量之間存在線性關(guān)系；如果不顯著，則兩個變量之間不存在線性關(guān)系。檢驗步驟如下：1.F檢驗法（總體顯著性檢驗）（1）提出假設(shè)H0：自變量與因變量的線性關(guān)系不顯著；H1：兩者線性關(guān)系顯著。（2）計算檢驗統(tǒng)計量F：（3）確定顯著性水平，并根據(jù)分子自由度1和分母自由度n-2找出臨界值Fa；（4）作出決策:若拒絕H0 ；若接受H0 。在回歸分析中通常計算F值來檢驗?zāi)Ｐ涂傮w的顯著性，在我們后面將要學(xué)到的多元回歸中，F(xiàn)用來檢驗是否至少有一個回歸系數(shù)（因為有多個回歸

19、系數(shù)）不為0。而在簡單回歸（一元回歸）中只有一個回歸系數(shù)需要檢驗，而回歸系數(shù)就是回歸直線的斜率，所以檢驗總體顯著性的F檢驗就等價于回歸系數(shù)的檢驗。對回歸系數(shù)的顯著性檢驗就是檢驗x與y之間是否具有線性關(guān)系，或者說，檢驗自變量x對因變量y的影響是否顯著。2.t檢驗法（回歸系數(shù)的顯著性檢驗）檢驗步驟如下：（1）提出假設(shè) (沒有線性關(guān)系) (有線性關(guān)系) （2）計算檢驗的t統(tǒng)計量自由度為n-2；（3）確定顯著性水平，并進(jìn)行決策若拒絕H0 ；若接受H0 。在“投入與產(chǎn)出”的例1中，相關(guān)系數(shù)r=0.759，顯著性水平0.05時，計算檢驗的統(tǒng)計量：查表得落入拒絕域中，即拒絕H0，接受H1。所以

20、自變量x與因變量y之間相關(guān)關(guān)系明顯，投入量對產(chǎn)出量的影響顯著。 3. 相關(guān)系數(shù)檢驗法（回歸系數(shù)的顯著性檢驗）（1）計算相關(guān)系數(shù)r。（2）根據(jù)回歸模型的自由度（n-2）和顯著性水平a的值，查表得出臨界值（3）判別：如果，則表明兩變量之間線性相關(guān)關(guān)系顯著。反之，如果，則表明兩變量之間線性相關(guān)關(guān)系不顯著。六、回歸方程在估計和預(yù)測中的應(yīng)用點估計利用估計的回歸方程，對于自變量x（如例1的第2個廠家）的一個給定值x0，求出因變量y的估計值預(yù)測區(qū)間估計利用估計的回歸方程，對于自變量 x 的一個給定值x0，求出因變量y的一個的估計區(qū)間，這一區(qū)間稱為預(yù)測區(qū)間。y0在1-置信水平下的預(yù)測區(qū)間為：預(yù)測區(qū)間

21、為：所以他的產(chǎn)出的95%的預(yù)測區(qū)間為24.478和72.627之間?；氐角懊娴睦?，投入為25時，平均產(chǎn)出的95%的置信區(qū)間。當(dāng)實際觀測值較多時（n30），近似等于1，近似于正態(tài)分布，上式可簡化為例3-1 設(shè)有10個廠家的投入和產(chǎn)出如下，根據(jù)這些數(shù)據(jù)，我們可以認(rèn)為投入和產(chǎn)出之間存在相關(guān)性嗎？（相關(guān)數(shù)據(jù)）廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)1：某省19781986年居民消費品購買力和居民貨幣收入統(tǒng)計如下表：1、建立一元線性回歸模型。2、對回歸模型進(jìn)行顯著性檢驗（=0.05）。3、若居民貨幣收入每年平均增長1

22、9%，預(yù)測1987年居民消費品購買力。4、對1987年居民消費品購買力作個別值區(qū)間預(yù)測。要求用Excel軟件計算，并給出計算結(jié)果及截圖。年份居民消費品購買力x居民貨幣收入x年份居民消費品購買力x居民貨幣收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.8198115.819.6198217.622.1198320.525.6（單位：億元）作業(yè)2：（例3-1 ）設(shè)有10個廠家的投入和產(chǎn)出如下，試建立回歸方程，當(dāng)投入為25時，求出平均產(chǎn)出95%的置信區(qū)間。要求用Excel軟件計算，并給出計算結(jié)果的主要

23、結(jié)果（截圖）。廠家12345678910投入20402030101020202030產(chǎn)出30604060304040503070作業(yè)1：某省19781986年居民消費品購買力和居民貨幣收入統(tǒng)計如下表：1、建立一元線性回歸模型。2、對回歸模型進(jìn)行顯著性檢驗（=0.05）。3、若居民貨幣收入每年平均增長19%，預(yù)測1987年居民消費品購買力。4、對1987年居民消費品購買力作區(qū)間預(yù)測。年份居民消費品購買力x居民貨幣收入x年份居民消費品購買力x居民貨幣收入x19788.511.6198427.833.6197911.114.1198533.540.5198013.617.1198639.247.81

24、98115.819.6198217.622.1198320.525.6（單位：億元）設(shè)一元線性回歸模型為：計算回歸系數(shù)。年份居民消費品購買力x居民貨幣收入yx yx2y219788.511.698.672.25134.56197911.114.1156.51123.21198.81198013.617.1232.56184.96292.41198115.819.6309.68249.64384.16198217.622.1388.96309.76488.41198320.525.6524.8420.25655.36198427.833.6934.08772.841128.96198533.54

25、0.51356.751122.251640.25198639.247.81873.761536.642284.84合計187.62325875.74791.87207.76（單位：億元）計算回歸系數(shù)。所求回歸模型為：相關(guān)系數(shù)檢驗法線形關(guān)系顯著，檢驗通過F 檢驗。年份居民消費品購買力x居民貨幣收入y預(yù)測值y(y-y均)2(y- y)219788.511.611.30 209.75 0.09 197911.114.114.39 129.70 0.08 198013.617.117.36 70.79 0.07 198115.819.619.98 33.59 0.15 198217.622.122.1

26、2 13.35 0.00 198320.525.625.58 0.04 0.00 198427.833.634.26 71.98 0.44 198533.540.541.05 233.09 0.30 198639.247.847.83 486.21 0.00 合計187.6232233.86 1248.51 1.13 F 檢驗。n =9；= 0.05；查 F 值表得：F（1，n-2）= F0.05 （1，7）=5.59樣本的統(tǒng)計量 F ： F = 77738.11F F0.05(1，9)，表明兩變量之間線性相關(guān)關(guān)系顯著，檢驗通過。t 檢驗。n =9；/2 = 0.025；查 t 值表得：t/

27、2 （n-2）= t0.025 （7）=2.365樣本的統(tǒng)計量 t ： t = 218.95；| t | t0.025(7)，拒絕假設(shè)H0：b=0，而接受H1，即認(rèn)為 b 顯著異于 0，因變量 y 對自變量 x 的一元線性回歸成立。預(yù)測n =9；/2 = 0.025；查 t 值表得：t/2 （n-2）= t0.025 （7）=2.365預(yù)測當(dāng)居民貨幣收入每年平均增長19%，在顯著性水平=0.05時，1987年居民消費品購買力的預(yù)測區(qū)間為53.4659.92億元第三節(jié) 多元線性回歸預(yù)測法社會經(jīng)濟現(xiàn)象的變化往往受到多個因素的影響，因此，一般要進(jìn)行多元回歸分析，我們把包括兩個或兩個以上自變量的

28、回歸稱為多元回歸。多元回歸與一元回歸類似，可以用最小二乘法估計模型參數(shù)。也需對模型及模型參數(shù)進(jìn)行統(tǒng)計檢驗。選擇合適的自變量是正確進(jìn)行多元回歸預(yù)測的前提之一，多元回歸模型自變量的選擇可以利用變量之間的相關(guān)矩陣來解決?；乇菊履夸?一、多元線性回歸模型描述因變量 y 如何依賴于自變量和誤差項的方程稱為多元線性回歸模型。涉及多個自變量的多元線性回歸模型可表示為：總體回歸參數(shù) 是未知的，要利用樣本數(shù)據(jù)去估計。用樣本統(tǒng)計量代替回歸方程中的未知參數(shù),即得到估計的回歸方程：二元線性回歸方程為：其中，分別是的偏回歸系數(shù)。同理三元線性回歸方程為：由樣本數(shù)據(jù)推算、估計回歸方程中各個回歸系數(shù)，

29、是多元回歸分析中的一個重要方面，下面簡要介紹回歸系數(shù)的計算方法。二元線性回歸方程中回歸系數(shù) 可由以下方程組解出：用手解這些方程枯燥而費時，一般來說，自變量超過3個時，要用矩陣運算，可以借助計算機軟件解出參數(shù)。下面給出一個三元線性回歸模型的例子。例3-4：有20戶家庭，冬天的取暖費用與3個因素有關(guān)：日間戶外的平均溫度，閣樓絕緣層的厚度，以及爐子的使用年數(shù)。有關(guān)信息列出在右表中：試作出三元回歸方程并討論：哪些自變量與因變量正相關(guān)？哪些是負(fù)相關(guān)？如果某一家庭的平均戶外溫度是30度，閣樓絕緣層的厚度為5英寸，爐子已使用過10年，它的冬天取暖費用為多少？（相關(guān)數(shù)據(jù)）解：設(shè)三元線性回歸方程為由軟件

30、可得到這題的線性回歸方程為：將x130， x25， x310代入方程，得由這個線性回歸方程可以算出每個家庭的預(yù)測取暖費值。殘差（）及其平方也列在下表中：20戶家庭預(yù)測取暖費值計算表二、對多元回歸模型的評估如果檢驗水平合適而且數(shù)據(jù)足夠多，用多元回歸模型幾乎可以處理所有數(shù)據(jù)組。模型一旦建立，一件很重要的事就是檢驗?zāi)Ｐ团c數(shù)據(jù)是否很好擬合以及與回歸分析的假設(shè)前提是否相符。檢驗回歸模型是否恰當(dāng)?shù)姆椒ㄓ泻芏?，如：檢驗?zāi)Ｐ驼w的顯著性、檢驗回歸系數(shù)的顯著性、計算殘差、檢驗樣本決定系數(shù)等。 1. F檢驗法（總體顯著性檢驗）對多元回歸方程的整體性檢驗，就是要看自變量是否從整體上對隨機變量有明顯的影響。

31、為此，要用到F統(tǒng)計量。檢驗方法是將回歸離差平方和(SSR )同殘差平方和( SSE )加以比較，應(yīng)用 F 檢驗來分析二者之間的差別是否顯著。如果是顯著的，因變量與自變量之間存在線性關(guān)系；如果不顯著，則因變量與自變量之間不存在線性關(guān)系。多元回歸模型的整體性檢驗的步驟如下：（1）提出假設(shè) H0: H1: 至少有一個回歸系數(shù)不等于0 。（2）計算檢驗統(tǒng)計量 F回歸平方和；殘差平方和（3）確定顯著性水平和分子自由度m、分母自由度n-m-1找出臨界值Fa ；（4）作出決策：若F Fa ，拒絕H0；若F Fa ，接受H0 。2. 復(fù)相關(guān)系數(shù)檢驗法（回歸系數(shù)的顯著性檢驗）步驟：（1）計算復(fù)相關(guān)系數(shù)R。

32、（2）根據(jù)回歸模型的自由度（n-m）和顯著性水平a的值，查表得出臨界值（3）判別：如果，則表明兩變量之間線性相關(guān)關(guān)系顯著。反之，如果，則表明兩變量之間線性相關(guān)關(guān)系不顯著。多重樣本決定系數(shù) 多重樣本決定系數(shù)R2定義為回歸平方和占總離差平方和的比例，反映回歸直線的擬合程度。公式為：R2的取值范圍在 0, 1 之間，R21,說明回歸方程擬合的越好； R2 0，說明回歸方程擬合的越差。本題中，3. 多重預(yù)測標(biāo)準(zhǔn)差預(yù)測標(biāo)準(zhǔn)差可以通過SSE除以模型誤差自由度再進(jìn)行開方來計算：也可以直接計算：本題中4. t 檢驗（回歸系數(shù)的顯著性檢驗）在多元線性回歸中，對每一個自變量都要單獨進(jìn)行檢驗，應(yīng)用t

33、檢驗。步驟如下：（1）提出假設(shè) (自變量與因變量沒有線性關(guān)系) (自變量與因變量有線性關(guān)系) 如果不能拒絕零假設(shè),說明自變量不顯著；如果拒絕零假設(shè)，說明自變量是顯著的。（2）計算檢驗的統(tǒng)計量 t（3）確定顯著性水平，并進(jìn)行決策拒絕H0 ；不拒絕本例中，對戶外溫度：對絕緣層厚度：對爐子已用時間：設(shè)顯著性水平為0.05，需檢驗的各個回歸系數(shù)的自由度為20-3-116，進(jìn)行雙尾檢驗。查表得臨界值本題回歸方程為：b1-3.07，表示對自變量x1的偏回歸系數(shù)的抽樣分布的標(biāo)準(zhǔn)差，由軟件計算可知為0.7723。代入數(shù)據(jù)所以，拒絕H0，說明自變量x1與因變量y有線性關(guān)系，戶外溫度對取暖費有影響。同理可對其他回歸系數(shù)分別做顯著性檢驗。第四節(jié) 虛擬變量回歸預(yù)測在回歸模型分析中，經(jīng)常發(fā)生的情況是：因變量不僅受諸如產(chǎn)量、銷售量、收入、價格、身高和溫度等數(shù)量變量的影響，而且也受諸如性別、文化程度、宗教、戰(zhàn)爭、地震、季節(jié)、地勢以及政府經(jīng)濟政策變化等品質(zhì)變量的影響。在建立線性回歸模型時。要將品質(zhì)變量引入線性回歸模型中。一、虛擬變量品質(zhì)變量只能以品質(zhì)、屬性、種類等具體形式表現(xiàn)，必須將其數(shù)量化。這種以出現(xiàn)為1，未出現(xiàn)為0形式表現(xiàn)的品質(zhì)變量，就稱為虛擬變量?；乇菊履夸洺Ｒ姷膸摂M變量的回歸模型有三種形式（1）反映政府政策變化或某種因素發(fā)生重大變異的跳躍、間斷式模

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第三章回歸分析預(yù)測方法-課件

文檔簡介

溫馨提示

最新文檔

評論

第三章回歸分析預(yù)測方法-課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔