第八章 相關(guān)和回歸分析程ppt_第1頁
第八章 相關(guān)和回歸分析程ppt_第2頁
第八章 相關(guān)和回歸分析程ppt_第3頁
第八章 相關(guān)和回歸分析程ppt_第4頁
第八章 相關(guān)和回歸分析程ppt_第5頁
已閱讀5頁,還剩141頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1.第八章 相關(guān)和回歸分析(p157)第一節(jié) 相關(guān)與回歸分析的基本概念第二節(jié) 簡單線性相關(guān)分析第三節(jié) 一元線性回歸分析第四節(jié) 多元線性相關(guān)與回歸分析第五節(jié) 非線性回歸分析第六節(jié) Excel在相關(guān)與回歸分析的應(yīng)用2本章學(xué)習(xí)要求1.理解相關(guān)的意義、主要形式、以及相關(guān)分析的基本內(nèi)容。2.掌握相關(guān)系數(shù)的設(shè)計(jì)原理,以及相關(guān)關(guān)系顯著性檢驗(yàn)。3.回歸和相關(guān)的區(qū)別和聯(lián)系4.普通最小二乘法的原理以及回歸參數(shù)的意義。5.估計(jì)標(biāo)準(zhǔn)誤差的分析等。3 第一節(jié)第一節(jié) 相關(guān)與回歸分析的基本概念相關(guān)與回歸分析的基本概念一、問題的提出一、問題的提出二、函數(shù)關(guān)系與相關(guān)關(guān)系二、函數(shù)關(guān)系與相關(guān)關(guān)系三、相關(guān)關(guān)系的種類三、相關(guān)關(guān)系的種類

2、四、相關(guān)分析的步驟四、相關(guān)分析的步驟4相關(guān)567 相關(guān)和回歸分析是研究事物的相互關(guān)系,相關(guān)和回歸分析是研究事物的相互關(guān)系,測定它們聯(lián)系的緊密程度,揭示其變化測定它們聯(lián)系的緊密程度,揭示其變化的具體形式和規(guī)律性的統(tǒng)計(jì)方法,是構(gòu)的具體形式和規(guī)律性的統(tǒng)計(jì)方法,是構(gòu)造各種經(jīng)濟(jì)模型、進(jìn)行結(jié)構(gòu)分析、政策造各種經(jīng)濟(jì)模型、進(jìn)行結(jié)構(gòu)分析、政策評價(jià)、預(yù)測和控制的重要工具。評價(jià)、預(yù)測和控制的重要工具。8二、函數(shù)關(guān)系與相關(guān)關(guān)系二、函數(shù)關(guān)系與相關(guān)關(guān)系 客觀現(xiàn)象之間的數(shù)量聯(lián)系存在著兩種不同的類型: 函數(shù)關(guān)系和相關(guān)關(guān)系n函數(shù)關(guān)系: 即當(dāng)一個(gè)(或一組)變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量有確定值與之對應(yīng) 。9(函數(shù)關(guān)系)(1)

3、是一一對應(yīng)的確定關(guān)系(2)設(shè)有兩個(gè)變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個(gè)數(shù)值時(shí), y 依確定的關(guān)系取相應(yīng)的值,則稱 y 是 x 的函數(shù),記為 y = f (x),其中 x 稱為自變量,y 稱為因變量(3)各觀測點(diǎn)落在一條線上 10(1 1) 某種商品的銷售額某種商品的銷售額( (y y) )與銷售量與銷售量( (x x) )之間的之間的關(guān)系可表示為關(guān)系可表示為 y y = = p x p x ( (p p 為單價(jià)為單價(jià)) )(2 2)圓的面積)圓的面積(S)(S)與半徑之間的關(guān)系可表示為與半徑之間的關(guān)系可表示為 S S = = R R2 2(

4、3 3)企業(yè)的原材料消耗額)企業(yè)的原材料消耗額( (y y) )與產(chǎn)量與產(chǎn)量( (x x1 1) ) 、單位、單位產(chǎn)量消耗產(chǎn)量消耗( (x x2 2) ) 、原材料價(jià)格、原材料價(jià)格( (x x3 3) )之間的關(guān)系可之間的關(guān)系可表示為表示為y y = = x x1 1 x x2 2 x x3 3 11相關(guān)關(guān)系(相關(guān)關(guān)系(correlation analysiscorrelation analysis):相關(guān)關(guān)系相關(guān)關(guān)系:當(dāng)一個(gè)(或一組)變量每取一個(gè)值時(shí),相應(yīng)的另一變量的值不確定, 但它仍按某種規(guī)律在一定的范圍內(nèi)變化。12相關(guān)關(guān)系(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個(gè)變量的取值不能由

5、另一個(gè)變量唯一確定;(3)當(dāng)變量 x 取某個(gè)值時(shí),變量 y 的取值可能有幾個(gè);(4)各觀測點(diǎn)分布在直線周圍。13商品的消費(fèi)量商品的消費(fèi)量(y)(y)與居民收入與居民收入(x)(x)之間的關(guān)系之間的關(guān)系商品銷售額商品銷售額(y)(y)與廣告費(fèi)支出與廣告費(fèi)支出(x)(x)之間的關(guān)系之間的關(guān)系糧食畝產(chǎn)量糧食畝產(chǎn)量(y)(y)與施肥量與施肥量(x(x1 1) ) 、降雨量、降雨量(x(x2 2) ) 、溫度、溫度(x(x3 3) )之間的關(guān)系之間的關(guān)系收入水平收入水平(y)(y)與受教育程度與受教育程度(x)(x)之間的關(guān)系之間的關(guān)系父母親身高父母親身高(y)(y)與子女身高與子女身高(x)(x)之間

6、的關(guān)系之間的關(guān)系身高與體重的關(guān)系身高與體重的關(guān)系14因果關(guān)系因果關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系互為因果關(guān)系互為因果關(guān)系共變關(guān)系共變關(guān)系隨機(jī)性依存關(guān)系隨機(jī)性依存關(guān)系確定性依存關(guān)系確定性依存關(guān)系函數(shù)關(guān)系變量之變量之間關(guān)系間關(guān)系15下列變量之間存在相關(guān)關(guān)系嗎? 1 抽煙與肺癌之間的關(guān)系 2 懷孕期婦女的飲酒量與嬰兒出生體重之間的關(guān)系 3 納稅者年齡和他們交納稅款的數(shù)量之間的關(guān)系 4 采光量與植物的生產(chǎn)量之間的關(guān)系 5 一個(gè)人的投票傾向性與其年齡之間的關(guān)系16相關(guān)關(guān)系與函數(shù)關(guān)系的關(guān)系相關(guān)關(guān)系與函數(shù)關(guān)系的關(guān)系: : 在一定的條件下互相轉(zhuǎn)化。在一定的條件下互相轉(zhuǎn)化。 具有函數(shù)關(guān)系的變量具有函數(shù)關(guān)系的變量, ,當(dāng)存在

7、觀測誤差和隨機(jī)因素當(dāng)存在觀測誤差和隨機(jī)因素影響時(shí)影響時(shí), ,其函數(shù)關(guān)系往往以相關(guān)的形式表現(xiàn)出來。其函數(shù)關(guān)系往往以相關(guān)的形式表現(xiàn)出來。 具有相關(guān)關(guān)系的變量之間的聯(lián)系具有相關(guān)關(guān)系的變量之間的聯(lián)系, ,如果我們對它們?nèi)绻覀儗λ鼈冇辛松羁痰囊?guī)律性認(rèn)識有了深刻的規(guī)律性認(rèn)識, ,并且能夠把影響因變量變動的并且能夠把影響因變量變動的因素全部納入方程因素全部納入方程, ,這時(shí)相關(guān)關(guān)系也可轉(zhuǎn)化為函數(shù)關(guān)系。這時(shí)相關(guān)關(guān)系也可轉(zhuǎn)化為函數(shù)關(guān)系。 另外另外, ,相關(guān)關(guān)系也具有某種變動規(guī)律相關(guān)關(guān)系也具有某種變動規(guī)律, ,所以所以, ,相關(guān)關(guān)相關(guān)關(guān)系也經(jīng)常可以用一定的函數(shù)形式去近似地描述。系也經(jīng)??梢杂靡欢ǖ暮瘮?shù)形式去近似

8、地描述。17三、 相關(guān)關(guān)系的種類1.按相關(guān)的程度分:完全相關(guān)完全相關(guān)不完全相關(guān)不完全相關(guān) 不相關(guān)不相關(guān)(或零相關(guān)或零相關(guān))例:完全相關(guān)完全相關(guān):在價(jià)格P不變的情況下,銷售收入Y與銷售量X 的關(guān)系; 不相關(guān)不相關(guān):股票價(jià)格的高低與氣溫的高低是不相關(guān)的;182.按相關(guān)的方向分:正相關(guān)正相關(guān)負(fù)相關(guān)負(fù)相關(guān)正相關(guān):兩個(gè)變量之間的變化方向一致,都是增長趨正相關(guān):兩個(gè)變量之間的變化方向一致,都是增長趨 勢或下降趨勢。勢或下降趨勢。 例例: 收入與消費(fèi)的關(guān)系收入與消費(fèi)的關(guān)系; 工人的工資隨勞動生產(chǎn)率的提高而提高。工人的工資隨勞動生產(chǎn)率的提高而提高。負(fù)相關(guān):兩個(gè)變量變化趨勢相反,一個(gè)下降而另一負(fù)相關(guān):兩個(gè)變量變

9、化趨勢相反,一個(gè)下降而另一 個(gè)上升,或一個(gè)上升而另一個(gè)下降。個(gè)上升,或一個(gè)上升而另一個(gè)下降。 例例: : 物價(jià)與消費(fèi)的關(guān)系物價(jià)與消費(fèi)的關(guān)系; ; 商品流轉(zhuǎn)的規(guī)模愈大商品流轉(zhuǎn)的規(guī)模愈大, ,流通費(fèi)用水平則越低。流通費(fèi)用水平則越低。193.按相關(guān)的形式分:線性相關(guān)線性相關(guān)非線性相關(guān)非線性相關(guān) 線性相關(guān)(直線相關(guān)):當(dāng)一個(gè)變量每變動一個(gè)單位時(shí),線性相關(guān)(直線相關(guān)):當(dāng)一個(gè)變量每變動一個(gè)單位時(shí), 另一個(gè)變量按一個(gè)大致固定的另一個(gè)變量按一個(gè)大致固定的 增增( (減減) )量變動。量變動。例例: :人均消費(fèi)水平與人均收入水平人均消費(fèi)水平與人均收入水平非線性相關(guān)(曲線相關(guān)):當(dāng)一個(gè)變量變動時(shí),非線性相關(guān)(曲

10、線相關(guān)):當(dāng)一個(gè)變量變動時(shí), 另一另一個(gè)變量也相應(yīng)發(fā)生變動,但這種變動是不均等的。個(gè)變量也相應(yīng)發(fā)生變動,但這種變動是不均等的。例例: 產(chǎn)品的平均成本與總產(chǎn)量產(chǎn)品的平均成本與總產(chǎn)量; 農(nóng)產(chǎn)量與施肥量。農(nóng)產(chǎn)量與施肥量。204 .按所研究的變量多少分:單相關(guān)單相關(guān)復(fù)相關(guān)復(fù)相關(guān)偏相關(guān)偏相關(guān)單相關(guān)單相關(guān)(一元相關(guān)一元相關(guān)):只有一個(gè)自變量。:只有一個(gè)自變量。復(fù)相關(guān)復(fù)相關(guān)(多元相關(guān)多元相關(guān)):有兩個(gè)及兩個(gè)以上的自變量。:有兩個(gè)及兩個(gè)以上的自變量。如如: 居民的收入與儲蓄額; 成本與產(chǎn)量如如: 某種商品的需求與其價(jià)格水平以及收入水平 之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。21 偏相關(guān)偏相關(guān): 在某一現(xiàn)象與多種現(xiàn)象相

11、關(guān)的場合,假定其他變量不變,專門考察其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。 如: 在假定人們的收入水平不變的條件下,某種商品的需求與其價(jià)格水平的關(guān)系就是一種偏相關(guān)。22 5.5.按相關(guān)的性質(zhì)分:真實(shí)相關(guān)真實(shí)相關(guān)虛假相關(guān)虛假相關(guān)真實(shí)相關(guān)是現(xiàn)象的內(nèi)在聯(lián)系所決定。虛假相關(guān):如某人曾觀察過某一國家歷年的國內(nèi)生產(chǎn)總值與精神病患者人數(shù)的關(guān)系,呈相當(dāng)高的正相關(guān)。23 1.冰淇淋的銷量與兒童出事故次數(shù)之間 2.街上警察數(shù)量與犯罪數(shù)量之間 3.歷史上,婦女裙子的長度與經(jīng)濟(jì)的好壞有關(guān)系: 裙子越短,經(jīng)濟(jì)越景氣。 4.鸛的數(shù)量與丹麥鄉(xiāng)間嬰兒出生率的關(guān)系24四、相關(guān)分析的步驟n確定現(xiàn)象之間是否存在相關(guān)關(guān)系,以及相關(guān)關(guān)系呈

12、現(xiàn)的形態(tài)。n確定相關(guān)關(guān)系的緊密程度。n確定相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式。n確定因變量估計(jì)值誤差程度。n預(yù)測或估計(jì)。25定性分析定性分析定量分析定量分析第二節(jié)第二節(jié) 簡單線性相關(guān)分析簡單線性相關(guān)分析相關(guān)關(guān)系的判斷:相關(guān)關(guān)系的判斷:26 廣義的相關(guān)分析包括相關(guān)關(guān)系的分析廣義的相關(guān)分析包括相關(guān)關(guān)系的分析(狹義的相關(guān)分析)和回歸分析。(狹義的相關(guān)分析)和回歸分析。27一、相關(guān)表和相關(guān)圖 相關(guān)表和相關(guān)圖是研究相關(guān)關(guān)系的直觀工具,在進(jìn)行詳細(xì)的定量分析之前, 可以先利用它們對現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式、和密切程度作大致的判斷。n簡單相關(guān)表:簡單相關(guān)表:將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值

13、一一對應(yīng)而平行排列的表。消費(fèi)支出消費(fèi)支出y15203040425360657870可支配收可支配收入入x18254560627588929899居民消費(fèi)和收入的相關(guān)表居民消費(fèi)和收入的相關(guān)表單位:百元單位:百元29 相關(guān)圖相關(guān)圖:又稱散點(diǎn)圖。將x置于橫軸上,y置于縱軸上,將(x,y)繪于坐標(biāo)圖上。用來反映兩變量之間相關(guān)關(guān)系的圖形。 例:30例例 : 國家教育部決定將各高校的后勤社會化。國家教育部決定將各高校的后勤社會化。某從事飲食業(yè)的企業(yè)家認(rèn)為這是一個(gè)很好某從事飲食業(yè)的企業(yè)家認(rèn)為這是一個(gè)很好的投資機(jī)會,他得到十組高校人數(shù)與周邊的投資機(jī)會,他得到十組高校人數(shù)與周邊飯店的季銷售額的數(shù)據(jù)資料,并想根據(jù)

14、高飯店的季銷售額的數(shù)據(jù)資料,并想根據(jù)高校的數(shù)據(jù)決策其投資規(guī)模。校的數(shù)據(jù)決策其投資規(guī)模。 05010015020025005101520253031 圖示32二、簡單相關(guān)系數(shù) 相關(guān)分析相關(guān)分析: 用一個(gè)指標(biāo)來表明現(xiàn)象間相用一個(gè)指標(biāo)來表明現(xiàn)象間相互依存關(guān)系的密切程度。互依存關(guān)系的密切程度。 相關(guān)系數(shù): 簡單相關(guān)系數(shù) 復(fù)相關(guān)系數(shù) 偏相關(guān)系數(shù) 曲線相關(guān)系數(shù)(相關(guān)指數(shù))33(一)簡單相關(guān)系數(shù)的概念(一)簡單相關(guān)系數(shù)的概念 度量兩個(gè)變量兩個(gè)變量之間線性線性相關(guān)密切程度密切程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo)。 n簡單相關(guān)系數(shù)又稱皮爾遜(1890年,英國)相關(guān)系數(shù),或積矩相關(guān)系數(shù)或動差相關(guān)系數(shù)。n若相關(guān)系數(shù)是根據(jù)總體全

15、部數(shù)據(jù)計(jì)算的,稱為總體 相關(guān)系數(shù),記為 。n若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為 r。樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的一致估計(jì)量。 )()(),(2yVarxVaryxCovYXXY34 條件:兩個(gè)變量聯(lián)合分布是二維正態(tài)分布。yyxxxyLLLyyxxyyxxr22)()()(yxnxyyyxxLynyyyLxnxxxLxyyyxx111222222式中:352222yynxxnyxxynr2222111 ynyxnxyxnxyr或:或:或:或: 2222xy x yrxxyy 36yx,(0,0)( ),(yyxx+,+-,+-,-+,-37協(xié)方差S2xy的意義:1.相關(guān)系數(shù)的正負(fù)取

16、決于協(xié)方差的正負(fù)。2.協(xié)方差可以表示變量x、y相關(guān)程度的大小。3.變量值的項(xiàng)數(shù)和計(jì)量單位對離差乘積之和 有影響??梢?,相關(guān)系數(shù)是對變量離差標(biāo)準(zhǔn)化以后的協(xié)方差。yyxxnSyySxxSnSyyxxSSnyyxxSSSryxyxyxyxxy238 1. r 的取值范圍是 -1,1 |r|=1,為完全相關(guān)r =1,為完全正相關(guān)r =-1,為完全負(fù)相關(guān) 2. r = 0,不存在線性線性相關(guān)關(guān)系 3. -1r0,為負(fù)相關(guān) 4. 0r1,為正相關(guān) 5. |r|越趨于1表示關(guān)系越密切;|r|越趨于0表示 關(guān)系越不密切相關(guān)系數(shù)取值及其意義相關(guān)系數(shù)取值及其意義39r的范圍在0.1-0.3是微弱相關(guān)r的范圍在0.

17、3-0.5是低度相關(guān);r的范圍在0.5-0.8是顯著相關(guān);r的范圍在0.8以上是高度相關(guān).40完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)正相關(guān)程度增加41消費(fèi)支出(百元)y人均可支配收入(百元)xy2x2xy151822532427020254006255003045900202513504060160036002400426217643844260453752809562539756088360077445280659242258464598078986084960476447099490098016930473662265075165636933429987. 074575226399135 .128

18、2777.160733231374575 .1282799.915617313222222 yynxxnyxxynr解:解:根據(jù)樣本相關(guān)系數(shù)的計(jì)算公式有 人均國民收入與人均消費(fèi)金額之間的相關(guān)系 數(shù)為 0.998743【例例2】在研究我國人均消費(fèi)水平的問題中,把全國人均消費(fèi)額記為y,把人均國民收入記為x。我們收集到19811993年的樣本數(shù)據(jù)(xi ,yi),i =1,2,,13,數(shù)據(jù)見表1,計(jì)算相關(guān)系數(shù)。 我國人均國民收入與人均消費(fèi)金額數(shù)據(jù)我國人均國民收入與人均消費(fèi)金額數(shù)據(jù) 單位單位:元元年份年份人均人均國民收入國民收入人均人均消費(fèi)金額消費(fèi)金額年份年份人均人均國民收入國民收入人均人均消費(fèi)金額消

19、費(fèi)金額1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148解:解:由表中數(shù)據(jù)得:y 473, x 662, y2 26507,x2 51656,xy 36933,n=109878. 0473265071066251656104736623693310222222 yynxxnyxxynr45(三)相關(guān)系數(shù)的顯著性

20、檢驗(yàn)(三)相關(guān)系數(shù)的顯著性檢驗(yàn)n1.檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系 總體相關(guān)系數(shù)是未知的,常用樣本相關(guān)系數(shù)來估計(jì),不同的樣本其相關(guān)系數(shù)不同,r對 代表程度與樣本容量有關(guān)。 計(jì)算出樣本相關(guān)系數(shù)r以后,還要對其進(jìn)行顯著性檢驗(yàn),以判定現(xiàn)象總體間線性相關(guān)是否顯著。 46n檢驗(yàn)分兩類: 一是對總體相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn); 二是總體相關(guān)系數(shù)是否等于某一個(gè)給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。 此處只介紹第一種檢驗(yàn)。47n在二元正態(tài)總體情況下,r的抽樣分布具有確定的函數(shù)形式,當(dāng)總體相關(guān)系數(shù) 時(shí),r呈t分布。n 2. 等價(jià)于對回歸系數(shù)b 的檢驗(yàn)n 3. 采用 t 檢驗(yàn)0)2(122ntrnrt48 檢驗(yàn)的步驟

21、 H0: , H1: 0)2(122ntrnrt0 假設(shè)根據(jù)6對樣本觀測數(shù)據(jù)計(jì)算出某公司的股票價(jià)格與氣溫的樣本相關(guān)系數(shù)r=0.50,試問是否可以根據(jù)5%的顯著水平認(rèn)為該公司的股票與氣溫之間存在一定程度的線性關(guān)系。 解:H0: ;H1: 01547.15 .01265 .02t 0.05,t(6-2)=2.776由于t=1.1547t(6-2)=2.776,接受原假設(shè), r不能通過顯著性檢驗(yàn)(主要是樣本量過少)。例:例:三.等級相關(guān)系數(shù)(順序相關(guān)系數(shù))(一)定義條件:兩個(gè)變量不滿足正態(tài)要求或變量不是 數(shù)量型變量 樣本容量為n的隨機(jī)變量X、Y的取值分1,2,n個(gè)等級,且樣本的n個(gè)單位分別不重復(fù)地屬

22、于X、Y的各個(gè)等級,沒有兩個(gè)單位取相同等級的情形。50n斯皮爾曼等級相關(guān)系數(shù):n注意:1.也適用數(shù)值型變量:理由:(1)其中一個(gè)變量只能用等級來反映;(2)把測量值劃分為等級更能事物的本質(zhì)。方法:5116122nndris1 , 1: sr(1)先按實(shí)際觀測值大小排序,并賦予每 個(gè)觀測值秩序;(2)其次,把觀測值的取值范圍劃分若干 等級區(qū)間。2、變量取值出現(xiàn)相同等級時(shí),須計(jì)算這幾 個(gè)觀測結(jié)果所在的簡單算術(shù)平均數(shù)作為 它們的等級。52(二)斯皮爾曼等級相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn)n即斯皮爾曼等級相關(guān)系數(shù)對X、Y的總體等級相關(guān)關(guān)系進(jìn)行檢驗(yàn)。 檢驗(yàn)的步驟 :H0: , H1: 0 2、檢驗(yàn): 在樣本量n較小(

23、 )時(shí), 成立前提下,檢驗(yàn)統(tǒng)計(jì)量 的 水平單側(cè)臨界值r。53)0, 0(0sss或或) 0, 0(ss或或30n0Hsrn它滿足下列條件的最小r值:54 rrPs5556 第三節(jié) 一元線性回歸分析一、 回歸分析概念二、 回歸分析的種類三、 一元線性回歸分析57回歸方程一詞是怎么來的回歸方程一詞是怎么來的58一、 回歸分析的概念 對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型(稱為回歸方程式),用來近似學(xué)模型(稱為回歸方程式),用來近似地表達(dá)變量間的平均變化關(guān)系的一種統(tǒng)地表達(dá)變量間的平均變化關(guān)系的一種統(tǒng)計(jì)分析

24、方法。計(jì)分析方法。59二、回歸分析的內(nèi)容n從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式。n對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著。n利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度。60三、回歸分析和相關(guān)分析的區(qū)別與聯(lián)系:三、回歸分析和相關(guān)分析的區(qū)別與聯(lián)系: 區(qū)別:n相關(guān)分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預(yù)測因變量的變化.(地位)n相關(guān)分析中所涉及的變量 x 和 y 都是隨機(jī)變量;回歸分析

25、中,因變量 y 是隨機(jī)變量,自變量 x則作為研究時(shí)給定的非隨機(jī)變量。(性質(zhì))n相關(guān)分析主要是描述兩個(gè)變量之間線性相關(guān)的方向與密切程度;回歸分析不僅可以揭示變量 x 對變量 y 的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制 。(目的與方法)61聯(lián)系:n它們不僅具有共同的研究對象,而且在具體應(yīng)用時(shí),常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。 簡單說: 1、相關(guān)分析是回歸分析的基礎(chǔ)和前提; 2、回歸分析是相關(guān)分析的深入和繼續(xù)。62四、回歸模型

26、的種類回歸模型回歸模型多元回歸多元回歸一元回歸一元回歸線性線性回歸回歸非線性非線性回歸回歸線性線性回歸回歸非線性非線性回歸回歸63五、標(biāo)準(zhǔn)的一元線性回歸模型一元線性回歸模型(簡單線性回歸模型)一元線性回歸模型(簡單線性回歸模型) 注意:在兩個(gè)變量之間,必須確定哪個(gè)是自變量,哪個(gè)是因變量, 否則,有兩個(gè)回歸方程。回歸方程的主要作用是用自變量來推算因變量。64(一)(一) 總體回歸函數(shù)總體回歸函數(shù)1、模型中,Y是X的線性函數(shù)(部分)加上 隨機(jī)誤差項(xiàng)(或隨機(jī)干擾項(xiàng))。2、線性部分反映了由于X的變化而引起的 Y的變化, 是Y的數(shù)學(xué)期望,即對應(yīng)于X某一取值時(shí)Y的平均值:)(21XXYE21)(tttXY

27、21653、隨機(jī)誤差項(xiàng) 是隨機(jī)變量隨機(jī)誤差項(xiàng)是Y與E(Y) 的離差:4、 和 稱回歸系數(shù))()(21YEYXY1266總體回歸線與隨機(jī)誤差項(xiàng) XYtY 。 。 。XYE21)(67 由于總體單位數(shù)一般很多甚至是無限的,其回歸系數(shù) 是未知的,因此必須利用樣本數(shù)據(jù)去估計(jì)。 樣本回歸線:由于 不完全相等,則得樣本回歸函數(shù):21, :斜率,它表示自變量每變動一個(gè)單位,因變量 的平均變動值。: 殘差,與總體誤差項(xiàng) 相互對應(yīng)。: 樣本的容量。 2(二)(二) 樣本回歸函數(shù)樣本回歸函數(shù)tYYt與ttXY21ttteXY21681、總體回歸線是未知的,只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,

28、便可以擬合一條樣本回歸線。2、總體回歸函數(shù)中的 和 是未知的參數(shù),表現(xiàn)為常數(shù)。而樣本回歸函數(shù)中的 是隨機(jī)變量,其具體數(shù)值隨所抽取的樣本觀測值不同而變動。21和1269 3、總體回歸函數(shù)中的 是與未知的總體回歸線之間的縱向距離,它是不可直接觀測的。而樣本回歸函數(shù)中的是與樣本回歸線之間的縱向距離,當(dāng)根據(jù)樣本觀測值擬合出樣本回歸線之后,可以計(jì)算出的具體數(shù)值。70 (三)誤差項(xiàng)的標(biāo)準(zhǔn)假定(三)誤差項(xiàng)的標(biāo)準(zhǔn)假定 - 高斯高斯(德國數(shù)學(xué)家德國數(shù)學(xué)家)假定假定1.誤差項(xiàng) 是一個(gè)期望值為0的隨機(jī)變量,即E( )=0。2.對于所有的 x 值, 的方差都相同2 。3.誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為零,即

29、4.自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無關(guān)。5.誤差項(xiàng) 服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即 N( 0 ,2 )獨(dú)立性意味著對應(yīng)于不同的 x 值的 值不相關(guān),因此,對應(yīng)于不同的 x 值 的Y值也不相關(guān)。0),(stCov71六、一元線性回歸模型的估計(jì)六、一元線性回歸模型的估計(jì)(一)回歸系數(shù)的點(diǎn)估計(jì)(一)回歸系數(shù)的點(diǎn)估計(jì) 回歸參數(shù)的普通最小二乘估計(jì)回歸參數(shù)的普通最小二乘估計(jì)(OLS) 基本原理: 1、 使因變量的觀察值 Y與估計(jì)值 之間的 離差平方和(殘差平方和)達(dá)到最小來求得 。即 Y22122tttttXYYYeQ72推導(dǎo)過程:0202212211XYXQXYQ為使Q 達(dá)到極小值,則須有

30、:整理得如下標(biāo)準(zhǔn)方程組:XYXXYXn2212173解上述方程組得:XYnXnYXXnYXXYn221222xxxyLLXXYYXXXnXYXnYX222211其中 可變形為:2解解:y 473, x 662, y2 26507,x2 51656,xy 36933,n=10所建立的回歸方程為:0.3640.72YX 回歸系數(shù) 的含義是:人均可支配收入每增加1元,人均消費(fèi)支出平均增加0.72元。2364.01066272.01047372.0662101516564736621013693311212222XYXnXYXnYX75020040060080010001200140005001000

31、150020002500人均消費(fèi)與人均國民收入的回歸人均消費(fèi)與人均國民收入的回歸n根據(jù)例1中的數(shù)據(jù),人均消費(fèi)金額對人均國民收入的回歸方程為:76相關(guān)系數(shù)與回歸系數(shù)的關(guān)系yxSSr2xxxyLLxxyyxxxnxyxnxy222211YYXXxyLLLyyxxyyxxr22)()()(77 例:根據(jù)某地區(qū)15戶居民家庭的家計(jì)調(diào)查資料,每戶是人均月食品支出為282元,標(biāo)準(zhǔn)差為50.49元;每戶的人均收入水平為1010.67元,標(biāo)準(zhǔn)差為263.78元;支出對收入的回歸系數(shù)為0.18。 要求:(1)計(jì)算人均月食品支出與人均月收入的相關(guān) 系數(shù),說明相關(guān)方向和程度; (2)擬合人均月食品支出對于人均月收入

32、的回歸 方程。解:94. 049.5078.2638 . 02yxSSrxyxy18. 008.10008.10067.101018. 02822178錯誤:03. 078.26349.508 . 02yxSSrxyxy18. 091.95908.91100.95928218. 067.10102179(二)總體方差的估計(jì) 的無偏估計(jì) 可由下式給出: 其中 2S222222nenYYStXYYYettt212280n上式推導(dǎo)過程如下 :n約束條件:tttttttttttttYXYYXYYeYeXYe212212120, 0tttXee81(三)最小二乘估計(jì)量的性質(zhì)(高斯-馬爾可夫定理) 222

33、122111,1XXXnVarEEt 2222)(2XXVart82n證明:以 為例: 為了便于討論,將 代入估計(jì)量 ,并作以下變形 為了推導(dǎo)上式,利用了以下恒等式:tttuXY21222222XXuXXXXYXXXXYYXXtttttttttttttttttYXXYYXXXXXXXXX20283令 222220tttttwuEwuwEE 222222222)()(XXwuEwuwEuwVarVartttttttt2XXXXwttt84(四)回歸系數(shù)的區(qū)間估計(jì)n為了進(jìn)行區(qū)間估計(jì),有必要了解兩個(gè)回歸系數(shù)的概率分布。因?yàn)閮蓚€(gè)回歸系數(shù)均為線性估計(jì)量,是因變量Y的線性組合。根據(jù)標(biāo)準(zhǔn)假定,可知Y是服從正

34、態(tài)分布的變量,所以兩個(gè)回歸系數(shù)也服從正態(tài)分布。即22221121,NN85n在總體方差已知的情況下,用正態(tài)分布的區(qū)間估計(jì)。在總體方差未知,用其無偏估計(jì)量S2去代替。用正態(tài)分布的區(qū)間估計(jì)。當(dāng)小樣本時(shí),回歸系數(shù)估計(jì)值的標(biāo)準(zhǔn)化變換值t服從自由度為n-k即(n-2)的 t分布。區(qū)間為: ( j=1,2) 其中: jStnj22/86例7-6:p168211XXXnSSt22XXSSt87七、一元線性回歸模型的檢驗(yàn)七、一元線性回歸模型的檢驗(yàn)(一)回歸模型檢驗(yàn)的種類(一)回歸模型檢驗(yàn)的種類 回歸模型的檢驗(yàn)包括理論意義檢驗(yàn)、一級檢驗(yàn)和二級檢驗(yàn)。理論意義理論意義:檢驗(yàn)主要涉及參數(shù)估計(jì)值的符 號和取值區(qū)間。 如

35、食品支出的恩格爾函數(shù)中,b的取值區(qū)間應(yīng)在0-1之間;88一級檢驗(yàn)一級檢驗(yàn)又稱統(tǒng)計(jì)學(xué)檢驗(yàn),它是利用統(tǒng)計(jì)學(xué)中的抽樣理論來檢驗(yàn)樣本回歸方程的可靠性,具體又可分為擬合程度評價(jià)和顯著性檢驗(yàn)。一級檢驗(yàn)對所有的現(xiàn)象進(jìn)行回歸分析時(shí)都必須通過的檢驗(yàn)。二級檢驗(yàn)二級檢驗(yàn)又稱經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn),它是對標(biāo)準(zhǔn)線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗(yàn),具體包括序列相關(guān)檢驗(yàn),異方差性檢驗(yàn)等。89(二)(二)擬合程度評價(jià) 擬合程度:樣本觀測值聚集在樣本回歸線周圍的緊密擬合程度:樣本觀測值聚集在樣本回歸線周圍的緊密 程度。程度。 1.判定系數(shù)判定系數(shù) 判斷回歸模型擬合程度優(yōu)劣最常用的方法是樣本判斷回歸模型擬合程度優(yōu)劣最常用的方法是

36、樣本決定系數(shù)(又稱判定系數(shù))。決定系數(shù)(又稱判定系數(shù))。 判定系數(shù)是建立在對總離差平方和進(jìn)行分解的基判定系數(shù)是建立在對總離差平方和進(jìn)行分解的基礎(chǔ)之上的。礎(chǔ)之上的。 90分析:n因變量 Y的取值是不同的,Y 取值的這種波動稱為變差。變差來源于兩個(gè)方面:由于自變量 x 的取值不同造成的除 x 以外的其他因素(如x對y的非線性影響、測量誤差、隨機(jī)因素等)的影響n對一個(gè)具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差 來表示.yy 離差平方和的分解: 回歸平方和SSR與剩余平方和SSE含義如下:nininiyyyyyy12121292yxy21yyyyyy),(iiyx93離差平方和的分解

37、(三個(gè)平方和的意義) A、總平方和、總平方和(SST) 反映因變量的 n 個(gè)觀察值與其均值的總離差B、回歸平方和、回歸平方和(SSR) 反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和C、殘差平方和、殘差平方和(SSE)反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩余平方和94樣本判定系數(shù)樣本判定系數(shù) (可決系數(shù) r2 )回歸平方和占總離差平方和的比例ninininiyyyyyyyySSTSSRr1212121221r2表示全部偏差中有百分之幾的偏差可由表示全部偏差中有百分之幾的

38、偏差可由x與與y的的回歸關(guān)系來解釋?;貧w關(guān)系來解釋。9596證明:2222222222221212212112122)()()()()()()()()(ryyxxyyxxyyxxxxyyxxyyxxyyxxyyyyrnininini297 2. 估計(jì)標(biāo)準(zhǔn)誤差估計(jì)標(biāo)準(zhǔn)誤差Se 實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根。 估計(jì)標(biāo)準(zhǔn)誤差反映了實(shí)際觀察值在回歸直線周圍的分散狀況,是用來說明回歸方程代表性大小的統(tǒng)計(jì)指標(biāo)。從另一個(gè)角度說明了回歸直線的擬合程度。98nyySniie12由一元回歸方程樣本資料計(jì)算由一元回歸方程樣本資料計(jì)算:由總體資料計(jì)算或由總體資料計(jì)算或在大樣本情況下在大樣本情況下估計(jì)標(biāo)準(zhǔn)誤

39、差的計(jì)算公式為:2212111212nyxyynyySniiiniiniiniie112knyySniiek表示自變量個(gè)數(shù)99)(4215. 62150644.53622) (十噸nyyeS例例1002156478515301. 022615905.22395039 eS簡化式:簡化式:4215.6101前例2中回歸方程估計(jì)標(biāo)準(zhǔn)誤差為:)(35. 92103693372. 0473)364. 0(265072121112百元nyxyySniiiniiniie1023.估計(jì)標(biāo)準(zhǔn)誤差與判定系數(shù)比較n作為回歸模型擬合優(yōu)度的判斷和評價(jià)指標(biāo),估計(jì)標(biāo)準(zhǔn)誤差顯然不如判定系數(shù),判定系數(shù)是無量綱的系數(shù),有確定的

40、取值范圍(0-1),便于對不同資料回歸模型擬合優(yōu)度 進(jìn)行比較。而估計(jì)標(biāo)準(zhǔn)誤差則是有計(jì)量單位的,又沒有確定的取值范圍,不便于對不同資料回歸模型擬合優(yōu)度進(jìn)行比較。103估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)的關(guān)系n根據(jù)方差分析有:222yyyyyy2222222221212221rLLrLLLxxLxxLyyyyyyyyyyyyxxyyyyyynnSrye2122104(三)顯著性檢驗(yàn) 1.對整個(gè)回歸方程的顯著性檢驗(yàn)-F檢驗(yàn) 對自變量和因變量之間線性關(guān)系整體上是否顯著進(jìn)行檢驗(yàn)。 檢驗(yàn)具體方法是將回歸平方和(SSR)同剩余平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著。1051. 提出假設(shè) H0:

41、 (線性關(guān)系不顯著)2,1 (21211212nFMSEMSRnyyyynSSESSRFnicnic確定顯著性水平,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F 作出決策:若FF ,拒絕H0;若Ft,拒絕,拒絕H0; t t=2.201,拒絕H0,表明人均收入與人均消費(fèi)之間有線性關(guān)系0758.65827.341603495.1452638. 02t例例: 對前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)對前例的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)( 0.05)112回歸系數(shù)的顯著性檢驗(yàn)(Excel輸出的結(jié)果)051872. 0867789. 1bbSbt418049. 88047.39aaSatniiyaxxxnSS12

42、2)()(1niiybxxSS12)(113八八.利用回歸方程進(jìn)行估計(jì)和預(yù)測利用回歸方程進(jìn)行估計(jì)和預(yù)測 即根據(jù)自變量 x 的取值估計(jì)或預(yù)測因變量 y的取值。 當(dāng)給出的x屬于樣本內(nèi)的數(shù)據(jù)時(shí),計(jì)算的 值稱為內(nèi)插檢驗(yàn)或事后預(yù)測; 當(dāng)給出的x在樣本之外時(shí),計(jì)算的 值稱為外推預(yù)測或事前預(yù)測。 y y 114發(fā)生預(yù)測誤差的原因 :(1)模型本身中的誤差因素所造成的誤差。(2)由于回歸系數(shù)的估計(jì)值同其真值不一 致所造成的誤差。(3)由于自變量x是給定的同其實(shí)際值的 偏差所造成的誤差。(4)由于未來時(shí)期總體回歸系數(shù)發(fā)生變化 所造成的誤差。115估計(jì)或預(yù)測的類型:點(diǎn)估計(jì)y 的平均值的點(diǎn)估計(jì)y 的個(gè)別值的點(diǎn)估計(jì)區(qū)

43、間估計(jì)y 的平均值的置信區(qū)間估計(jì)y 的個(gè)別值的預(yù)測區(qū)間估計(jì)116點(diǎn)估計(jì)點(diǎn)估計(jì): 在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同。計(jì)中則不同。 對于自變量對于自變量 x 的一個(gè)給定值的一個(gè)給定值x0 ,根據(jù)回歸方,根據(jù)回歸方程得到因變量程得到因變量 y 的一個(gè)估計(jì)值的一個(gè)估計(jì)值0 y117n y 的平均值的點(diǎn)估計(jì)的平均值的點(diǎn)估計(jì) 利用估計(jì)的回歸方程,對于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值的一個(gè)估計(jì)值E(y0) ,就是平均值的點(diǎn)估計(jì)。如:在前面的例子中,假如我們要估計(jì)人均國民

44、收入為2000元時(shí),所有年份人均消費(fèi)金額的的平均值,就是平均值的點(diǎn)估計(jì)。 根據(jù)估計(jì)的回歸方程得:)(98.1160200052638. 022286.540元y118n y 的個(gè)別值的點(diǎn)估計(jì)的個(gè)別值的點(diǎn)估計(jì) 即利用估計(jì)的回歸方程,對于自變量即利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定的一個(gè)給定值值 ,求出因變量,求出因變量y 一個(gè)個(gè)別值的估計(jì)值一個(gè)個(gè)別值的估計(jì)值 。0 y 如:如果我們只是想知道1990年年人均國民收入為1250.7元時(shí)的人均消費(fèi)金額是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得:)(57.7127 .125052638. 022286.540元y0 x119 點(diǎn)估計(jì)不能給

45、出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)。120 區(qū)間估計(jì)區(qū)間估計(jì): 即對于自變量 x 的一個(gè)給定值 x0,根據(jù)回歸方程得到因變量 y 的一個(gè)估計(jì)區(qū)間 區(qū)間估計(jì)有兩種類型:置信區(qū)間估計(jì)預(yù)測區(qū)間估計(jì)121n y 的平均值的置信區(qū)間估計(jì)的平均值的置信區(qū)間估計(jì) 即利用估計(jì)的回歸方程,對于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的平均值平均值E(y0)的估計(jì)區(qū)間 ,這一估計(jì)區(qū)間稱為置置信區(qū)間。信區(qū)間。 E(y0) 在1-置信水平下的置信區(qū)間為:niiyxxxxnSnty1220201)2(122 【例例】p43根據(jù)前例,求出人均國民收入為1250.7元時(shí),人均消費(fèi)金

46、額95%的置信區(qū)間 解:根據(jù)前面的計(jì)算結(jié)果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為827.341603473077.9867 .125013195.14201. 257.71220 y123n y 的個(gè)別值的預(yù)測區(qū)間估計(jì)的個(gè)別值的預(yù)測區(qū)間估計(jì) 即利用估計(jì)的回歸方程,對于自變量 x 的一個(gè)給定值 x0 ,求出因變量 y 的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間 。 y0在1-置信水平下的預(yù)測區(qū)間為:niiyxxxxnSnty12202011)2(124【例例】根據(jù)前例,求出1990年人均國民收入為1250.7元時(shí),人均消費(fèi)金額的95%的預(yù)測區(qū)間 解:根

47、據(jù)前面的計(jì)算結(jié)果有 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為0 y827.341603473077.9867 .1250131195.14201. 257.7122125影響區(qū)間寬度的因素n1.置信水平 (1 - )區(qū)間寬度隨置信水平的增大而增大n2.數(shù)據(jù)的離散程度 (s)區(qū)間寬度隨離散程度的增大而增大n3.樣本容量區(qū)間寬度隨樣本容量的增大而減小n4.用于預(yù)測的 xp與x的差異程度區(qū)間寬度隨 xp與x 的差異程度的增大而增大126置信區(qū)間、預(yù)測區(qū)間、回歸方程bxayc預(yù)測上限預(yù)測上限預(yù)測下限預(yù)測下限127第三節(jié) 多元線性相關(guān)與回歸分析一、多元線性回歸模型一

48、、多元線性回歸模型 一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量之間的回歸.描述因變量 y 如何依賴于自變量 x1 ,x2 , xp 和誤差項(xiàng) 的方程稱為多元線性回歸模型。 涉及 p 個(gè)自變量的多元線性回歸模型可表示為x 0 , 1 1, , p是參數(shù)是參數(shù) ipipiixxxy221100常數(shù)項(xiàng),常數(shù)項(xiàng),和和Y構(gòu)成的平面與構(gòu)成的平面與Y軸的截距軸的截距21,xx1偏回歸系數(shù),表示在其他偏回歸系數(shù),表示在其他 固定時(shí)固定時(shí) 每變化一個(gè)每變化一個(gè)單位引起的單位引起的Y的平均變動;的平均變動;1x128 偏回歸系數(shù),表示在其他偏回歸系數(shù),表示在其他 固定時(shí)固定時(shí) 每變化每變化 一個(gè)單一個(gè)單位引起的位引起的Y的

49、平均變動;的平均變動;n 是被稱為誤差項(xiàng)的隨機(jī)變量是被稱為誤差項(xiàng)的隨機(jī)變量n y 是是x1,,x2 , ,xp 的線性函數(shù)加上誤差的線性函數(shù)加上誤差項(xiàng)項(xiàng) n 說明了包含在說明了包含在y里面但不能被里面但不能被p個(gè)自變量的個(gè)自變量的線性關(guān)系所解釋的變異性線性關(guān)系所解釋的變異性22xx在多元回歸模型中,還要求各自變量之間不存在顯著在多元回歸模型中,還要求各自變量之間不存在顯著相關(guān),或高度相關(guān)也即不得存在多重共線性。相關(guān),或高度相關(guān)也即不得存在多重共線性。129多元線性回歸模型n 對于 n 組實(shí)際觀察數(shù)據(jù)(yi ; xi1,,xi2 , ,xip ),(i=1,2,n),多元線性回歸模型可表示為y1

50、 = 1 1 x11 x12 px1p 1 1y2= 1 1 x21 x22 px2p yn= 1 1 xn1 xn2 pxnp n130二、參數(shù)的最小二乘法最小niiniipeyyQ1212210) (),(根據(jù)最小二乘法的要求,可得求解根據(jù)最小二乘法的要求,可得求解各回歸參數(shù)各回歸參數(shù) 的標(biāo)準(zhǔn)方程如下的標(biāo)準(zhǔn)方程如下),2, 1(00000piQQiii使因變量的觀察值與估計(jì)值之間的離差平方和使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得達(dá)到最小來求得 。即。即p,210131三、回歸方程的顯著性檢驗(yàn)三、回歸方程的顯著性檢驗(yàn) (線性關(guān)系的檢驗(yàn)(線性關(guān)系的檢驗(yàn) )n檢驗(yàn)因變量與所有的自變量和之間的是否存在一個(gè)顯著的線性關(guān)系,也被稱為總體的顯著性檢驗(yàn)n檢驗(yàn)方法是將回歸離差平方和(SS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論