版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2 第八章第八章 相關(guān)與回歸分析相關(guān)與回歸分析 本章內(nèi)容:理解相關(guān)關(guān)系概念、分類(lèi),相關(guān)分析與回歸分析的區(qū)別聯(lián)系;掌握一元線性回歸分析,學(xué)掌握一元線性回歸分析,學(xué)會(huì)用最小二乘法估計(jì)回歸參數(shù),會(huì)用最小二乘法估計(jì)回歸參數(shù),學(xué)會(huì)計(jì)算估計(jì)標(biāo)準(zhǔn)誤差、可決系學(xué)會(huì)計(jì)算估計(jì)標(biāo)準(zhǔn)誤差、可決系數(shù);掌握單相關(guān)關(guān)系分析,學(xué)會(huì)數(shù);掌握單相關(guān)關(guān)系分析,學(xué)會(huì)相關(guān)系數(shù)的計(jì)算。相關(guān)系數(shù)的計(jì)算。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3 第八章第八章 相關(guān)與回歸分析相關(guān)與回歸分析 本章分三節(jié): 第一節(jié) 相關(guān)與回歸分析的基本概念 第二節(jié) 一
2、元線性回歸分析 第三節(jié) 相關(guān)分析 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4第一節(jié)第一節(jié) 相關(guān)與回歸分析的相關(guān)與回歸分析的基本概念基本概念 本節(jié)需要把握四個(gè)問(wèn)題: 一、函數(shù)關(guān)系與相關(guān)關(guān)系; 二、相關(guān)關(guān)系的種類(lèi); 三、相關(guān)分析與回歸分析; 四、相關(guān)表和相關(guān)圖。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院5一、函數(shù)關(guān)系與相關(guān)關(guān)系一、函數(shù)關(guān)系與相關(guān)關(guān)系 客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,客觀現(xiàn)象間的數(shù)量聯(lián)系存在兩種不同類(lèi)型:函數(shù)關(guān)系和相關(guān)關(guān)系。 把握三個(gè)問(wèn)題: 1、函數(shù)關(guān)系; 2、相關(guān)關(guān)系; 3、二者關(guān)系。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院6 1、函數(shù)關(guān)系函數(shù)關(guān)系是指變量之間存在著嚴(yán)格確定的依存關(guān)
3、系,在這種關(guān)系中,當(dāng)一個(gè)或幾個(gè)變量取一定量的值時(shí),另一變量有確定值與之相對(duì)應(yīng),并且這種關(guān)系可以用一個(gè)數(shù)學(xué)表達(dá)式反映出來(lái)。例如:某種產(chǎn)品的總成本S與該產(chǎn)品的產(chǎn)量Q以及該產(chǎn)品的單位成本P之間的關(guān)系可用S=PQ表達(dá),這就是一種函數(shù)關(guān)系。通常把作為影響因素的變量稱(chēng)為自變量,把發(fā)生相應(yīng)變化的變量稱(chēng)為因變量。在本例中,S是因變量,P與Q則是自變量。 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院7 2、相關(guān)關(guān)系 相關(guān)關(guān)系是指變量之間存在一定的相依關(guān)系,但又不是確定的和嚴(yán)格依存的。這類(lèi)關(guān)系中,當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的變量就會(huì)有若干個(gè)數(shù)值與之相對(duì)應(yīng),從而表現(xiàn)出一定的波動(dòng)性。例如商品流轉(zhuǎn)規(guī)
4、模與流通費(fèi)用的關(guān)系,家庭收入與消費(fèi)支出的關(guān)系,工業(yè)勞動(dòng)生產(chǎn)率與產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計(jì)中所研究的就是這種相關(guān)關(guān)系。 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院8 上述函數(shù)關(guān)系和相關(guān)關(guān)系之間并不存在嚴(yán)格的界限,一定條件下可以轉(zhuǎn)化。由于有測(cè)量誤差等原因,函數(shù)關(guān)系在實(shí)際中往往通過(guò)相關(guān)關(guān)系表現(xiàn)出來(lái);反之當(dāng)對(duì)現(xiàn)象之間的內(nèi)在聯(lián)系和規(guī)律性了解得更清楚深刻的時(shí)候,相關(guān)關(guān)系也可能轉(zhuǎn)化為函數(shù)關(guān)系。因此,相關(guān)關(guān)系通??梢杂靡欢ǖ暮瘮?shù)關(guān)系表達(dá)式去近似地描述。 3、二者關(guān)系2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院9二、相關(guān)關(guān)系的種類(lèi)把握以下問(wèn)題:1、按相關(guān)程度劃分;2、按相關(guān)方向劃分;3、按相關(guān)形式劃分;4
5、、按變量多少劃分;5、按相關(guān)性質(zhì)劃分。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院10 1、按相關(guān)程度劃分可分為完全相關(guān)、不完全相關(guān)和不相關(guān)(1)完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個(gè)現(xiàn)象的數(shù)量變化所確定時(shí),稱(chēng)這兩種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周長(zhǎng)L決定于它的半徑R,即L=2R。在這種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以說(shuō)函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院111、按相關(guān)程度劃分(2)不相關(guān):當(dāng)兩個(gè)現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱(chēng)這兩個(gè)現(xiàn)象之間的關(guān)系為不相關(guān)或零相關(guān)。例如:學(xué)生的學(xué)習(xí)成績(jī)與其身高一般認(rèn)為是不相關(guān)的。(3)不完全相關(guān):若兩個(gè)現(xiàn)象之
6、間的關(guān)系介于完全相關(guān)和不相關(guān)之間,就稱(chēng)為不完全相關(guān),一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),這是相關(guān)分析的研究對(duì)象。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院12可分為正相關(guān)和負(fù)相關(guān):(1)兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),這種相關(guān)稱(chēng)為正相關(guān)。例如家庭消費(fèi)支出隨著收入的增加而增加等。(2)當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢(shì)變化,稱(chēng)為負(fù)相關(guān)。例如勞動(dòng)生產(chǎn)率愈高,單位產(chǎn)品成本愈低。 2、按相關(guān)方向劃分2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院13 3、按相關(guān)形式劃分 可以分為線性相關(guān)和非線性相關(guān): (1)當(dāng)一
7、個(gè)變量發(fā)生變動(dòng),另一個(gè)變量隨之發(fā)生大致均等的變動(dòng)(增加或減少),從圖形上看,其觀測(cè)點(diǎn)的分布近似地表現(xiàn)為直線形式,就是線性相關(guān)。 (2)而當(dāng)一個(gè)變量發(fā)生變動(dòng),另一個(gè)變量也隨之發(fā)生變動(dòng)(增加或減少),但是這種變動(dòng)不是均等的,從圖形上看,其觀察點(diǎn)的分布表現(xiàn)為各種不同的曲線形式,這種相關(guān)關(guān)系稱(chēng)為非線性相關(guān)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院14 4、按變量多少劃分分為單相關(guān)、復(fù)相關(guān)和偏相關(guān):(1)單相關(guān)又稱(chēng)一元相關(guān),是指兩個(gè)變量之間的相關(guān)關(guān)系,即僅限于一個(gè)變量與另一個(gè)變量之間的依存關(guān)系。(2)復(fù)相關(guān)又稱(chēng)多元相關(guān),是指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。例如家庭的消費(fèi)支出與家庭收入水平及市場(chǎng)價(jià)格水平
8、之間的關(guān)系便是一種復(fù)相關(guān)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院154、按變量多少劃分(3)在某一變量與多個(gè)變量相關(guān)時(shí),當(dāng)假定其他變量不變,其中兩個(gè)變量的相關(guān)關(guān)系稱(chēng)為偏相關(guān)。例如在假定家庭收入水平不變的條件下,市場(chǎng)價(jià)格水平與家庭的消費(fèi)支出的關(guān)系就是一種偏相關(guān)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院165、按相關(guān)性質(zhì)劃分分為“真實(shí)相關(guān)”和“虛假相關(guān)”:(1)當(dāng)兩種現(xiàn)象間的相關(guān)確實(shí)具有內(nèi)在的聯(lián)系時(shí),稱(chēng)之為“真實(shí)相關(guān)”。例如消費(fèi)與收入的相關(guān)關(guān)系等。(2)當(dāng)兩種現(xiàn)象間的相關(guān)只是表面存在,實(shí)質(zhì)沒(méi)有內(nèi)在聯(lián)系時(shí),稱(chēng)之為“虛假相關(guān)”。判斷依據(jù)是實(shí)質(zhì)性科學(xué)提供的知識(shí)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院
9、17三、相關(guān)分析與回歸分析三、相關(guān)分析與回歸分析把握以下問(wèn)題:1、相關(guān)分析與回歸分析的概念;2、二者的聯(lián)系;3、二者的區(qū)別;4、應(yīng)用中注意局限性。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院18 1、相關(guān)分析與回歸分析的概念 二者是研究現(xiàn)象尖相關(guān)關(guān)系的基本方法。 (1)相關(guān)分析(狹義)指用一個(gè)指標(biāo)表明現(xiàn)象間相互依存關(guān)系的密切程度。 (2)回歸分析:根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型來(lái)近似表達(dá)變量間的平均變化關(guān)系。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院19 2、二者的聯(lián)系 二者有著密切的聯(lián)系,它們具有共同的研究對(duì)象,在具體運(yùn)用時(shí)需要互相補(bǔ)充。具體: (1)相關(guān)分析需要依靠回歸分析表明現(xiàn)
10、象數(shù)量相關(guān)的具體形式; (2)回歸分析需要依靠相關(guān)分析來(lái)表明現(xiàn)象數(shù)量變化的相關(guān)程度,只有變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。因此,在一些統(tǒng)計(jì)學(xué)的相關(guān)書(shū)籍中,回歸分析和相關(guān)分析也合并稱(chēng)為相關(guān)關(guān)系分析或廣義的相關(guān)分析。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院203、二者的區(qū)別在研究目的和具體的研究方法上是有明顯區(qū)別的,兩者的主要區(qū)別在于: (1)相關(guān)分析研究變量間相關(guān)方向、程度,不能指出變量間相互關(guān)系的具體形式,也無(wú)法從一個(gè)變量的變化推測(cè)另一個(gè)變量的變化情況;而回歸分析能確切地指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從已知量估計(jì)和預(yù)測(cè)未知量。 2022-6-
11、3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院21 3、二者的區(qū)別 (2)在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個(gè)為自變量,哪個(gè)為因變量,而且只能從自變量去推測(cè)因變量,而不能從因變量去推斷自變量。 (3)相關(guān)分析所涉及的變量一般都是隨機(jī)變量;而回歸分析中因變量是隨機(jī)的,自變量則作為研究時(shí)給定的非隨機(jī)變量。 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院22 4、應(yīng)用中注意局限性 相關(guān)和回歸分析是對(duì)現(xiàn)象間相關(guān)關(guān)系進(jìn)行分析的有效的科學(xué)方法,但是它們有一定的局限性。在確定應(yīng)用相關(guān)和回歸分析之前,必須進(jìn)行定性分析,運(yùn)用足夠的理論知識(shí)、專(zhuān)業(yè)知識(shí)和必要的經(jīng)驗(yàn)來(lái)判斷現(xiàn)象之間是否具有真正的相關(guān),是具有實(shí)質(zhì)
12、性的內(nèi)在聯(lián)系還是表面上的聯(lián)系,還是一種偶然的巧合。 因此在應(yīng)用相關(guān)和回歸分析對(duì)客面現(xiàn)象進(jìn)行研究時(shí),一定要注意把定性分析和定量分析結(jié)合起來(lái),在定性分析基礎(chǔ)上開(kāi)展相關(guān)和回歸的定量分析。 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院23四、相關(guān)表和相關(guān)圖相關(guān)分析中,通過(guò)繪制相關(guān)圖和相關(guān)表,可以對(duì)現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式和密切程度作直觀的、大致的判斷。把握以下問(wèn)題:1、相關(guān)表;2、相關(guān)圖。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院241、相關(guān)表 (1)相關(guān)表是一種反映變量見(jiàn)相關(guān)關(guān)系的統(tǒng)計(jì)表。 研究現(xiàn)象之間的依存關(guān)系,首先要通過(guò)實(shí)際調(diào)查取得一系列成對(duì)的數(shù)據(jù),作為相關(guān)分析的原始資料。將某一變量按其數(shù)值
13、的大小順序排列,然后再將與其相關(guān)的另一變量的對(duì)應(yīng)值平行排列,便可得到簡(jiǎn)單的相關(guān)表。 2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院25 1、相關(guān)表 (2)例如假設(shè)對(duì)10戶居民家庭的月可支配收入和消費(fèi)指出進(jìn)行調(diào)查,得到原始資料如表 表8-1 居民收入和消費(fèi)的原始資料 單位:百元 根據(jù)原始資料,將消費(fèi)支出從小到大排序,得到表居民家庭編號(hào) 1 2 3 4 5 6 7 8 9 10 消費(fèi)支出 20 15 40 30 42 60 65 70 53 78可支配收入 25 18 60 45 62 88 92 99 75 982022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院26 1、相關(guān)表 (2)表8-2 居民消費(fèi)和收入的
14、相關(guān)表 單位:百元 從表中看出,隨著可支配收入的提高,居民的消費(fèi)支出也有相應(yīng)提高的趨勢(shì),二者存在明顯的正相關(guān)關(guān)系。消費(fèi)支出 15 20 30 40 42 53 60 65 70 78可支配收入 18 25 45 60 62 75 88 92 99 982022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院272、相關(guān)圖相關(guān)圖又稱(chēng)散點(diǎn)圖或散布圖,是以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y,將兩變量相對(duì)應(yīng)的成對(duì)的數(shù)據(jù)用坐標(biāo)點(diǎn)的形式描繪出來(lái),用于反映兩變量之間相關(guān)關(guān)系的圖形。由表8-2的資料繪制的相關(guān)圖如圖8-1所示。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院28圖8-1圖8 -1 居 民消費(fèi)和收入的相關(guān)圖01
15、02030405060708090020406080100120可支配收入消費(fèi)支出z從圖看出,居民的消費(fèi)支出與可支配收入之間呈現(xiàn)正線性相關(guān)關(guān)系2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院29 第二節(jié) 一元線性回歸分析 把握以下問(wèn)題: 一、標(biāo)準(zhǔn)的一元線性回歸模型; 二、一元線性回歸模型的估計(jì); 三、一元線性回歸模型擬合程度評(píng)價(jià)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院30一、標(biāo)準(zhǔn)的一元線性回歸模型 把握以下問(wèn)題: 1、總體回歸函數(shù); 2、樣本回歸函數(shù); 3、樣本回歸函數(shù)與總體回歸函數(shù)的區(qū)別; 4、誤差項(xiàng)的標(biāo)準(zhǔn)假定。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院31 1、總體回歸函數(shù) (1)一元線性回歸模型
16、指只有一個(gè)因變量和一個(gè)自變量的線性回歸模型,又稱(chēng)簡(jiǎn)單線性回歸模型。 假定因變量Y主要受自變量X的影響,二者間存在近似的線性函數(shù)關(guān)系有 該式被稱(chēng)為總體回歸函數(shù),式中 是未知的參數(shù),又叫回歸系數(shù)。Yt和Xt分別是Y和X的第t次觀測(cè)值。 是隨機(jī)誤差項(xiàng),又叫隨機(jī)干擾項(xiàng),它是一個(gè)特殊的隨機(jī)變量,反映未列入方程式的其他各種因素對(duì)Y的影響。) 1 . 8(21tttXY21,t2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院32 1、總體回歸函數(shù) (2)舉例說(shuō)明:消費(fèi)函數(shù) 式中Yt表示消費(fèi)支出, Xt表示可支配收入。 為基礎(chǔ)消費(fèi)水平的支出,不受可支配收入的影響, 為邊際消費(fèi)傾向,表明可支配收入每增加一個(gè)單位,消費(fèi)支
17、出增加的數(shù)量。此處,可支配收入是決定消費(fèi)支出的主要因素,圖中可表示為一條直線,但現(xiàn)實(shí)中確定型的消費(fèi)函數(shù)很難成立,原因是除收入外還有各種因素影響消費(fèi)支出。ttXY21212022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院33 1、總體回歸函數(shù) (3)實(shí)際中,只能平均看來(lái)消費(fèi)支出與可支配收入的關(guān)系能用直線反映,用數(shù)學(xué)形式表示為: 上式表明:在X的值給定下, Y的期望值是嚴(yán)密的線性函數(shù),這條直線被稱(chēng)為回歸直線。 Y的實(shí)際值不一定在該直線上,只是散布在直線的周?chē)?。我們把?shí)際觀測(cè)點(diǎn)與總體回歸線垂直方向的間隔稱(chēng)為隨機(jī)誤差項(xiàng),即) 3 . 8()(21ttXYEttttttttXYEYYEY21)()4 . 8)(則
18、2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院342、樣本回歸函數(shù) (1)總體回歸函數(shù)事實(shí)是未知的,用樣本信息進(jìn)行估計(jì)。 根據(jù)樣本數(shù)據(jù)擬合的直線稱(chēng)為樣本回歸直線,如果是擬合的是曲線,則稱(chēng)為樣本回歸曲線。其函數(shù)形式與總體回歸線的形式相同,表示為: 式中 是樣本回歸線上與Xt相對(duì)應(yīng)的Y值,可視為E(Yt)的估計(jì); 是樣本回歸函數(shù)的截距系數(shù), 是樣本回歸函數(shù)的斜率系數(shù),它們是對(duì)總體回歸系數(shù) 的估計(jì)。121,tY2)5 .8(21ttXY2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院35 2、樣本回歸函數(shù)(2)實(shí)際觀測(cè)的Yt不完全等于 ,如果et表示二者之差( et = Yt - ),則有:上式稱(chēng)為樣本回歸函數(shù)。
19、式中et稱(chēng)為殘差,et與 相互對(duì)應(yīng);n為樣本的容量。tYtY)6 .8.(,2, 1,21nteXYtttt2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院36 3、樣本回歸函數(shù)與總體回歸函數(shù)的區(qū)別 (1)總體回歸函數(shù)未知,它只有一條。樣本回歸線是根據(jù)樣本數(shù)據(jù)擬合的,每抽取一組樣本,可以擬合一條樣本回歸線; (2)總體回歸函數(shù)中的 是未知的參數(shù),表現(xiàn)為常數(shù),樣本回歸函數(shù)中的 和 是隨機(jī)變量,其具體數(shù)值隨抽取的樣本觀測(cè)值不同而變動(dòng); (3)總體回歸函數(shù)中的 是Yt與未知的總體回歸線間的縱向距離,它不可直接觀測(cè),而樣本回歸函數(shù)中et是Yt與樣本回歸線間的縱向距離,可以計(jì)算et具體數(shù)值。21,12t2022
20、-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院37 4、誤差項(xiàng)的標(biāo)準(zhǔn)假定隨機(jī)誤差項(xiàng) 是無(wú)法直接觀測(cè)的。為了進(jìn)行回歸分析,對(duì)其概率分布提出假定:(1)誤差項(xiàng)的期望值為0,即(2)誤差項(xiàng)的方差為常數(shù),即(3)誤差項(xiàng)之間不存在序列相關(guān)關(guān)系,其協(xié)方差為0,即當(dāng)ts時(shí)有:(4)自變量是給定的變量,與隨機(jī)誤差項(xiàng)線性無(wú)關(guān)。t0)(tE22)()(ttEVar0)()(ststECov2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院38 4、誤差項(xiàng)的標(biāo)準(zhǔn)假定 (5)隨機(jī)誤差項(xiàng)服從正態(tài)分布。 以上假定是德國(guó)數(shù)學(xué)家高斯最早提出,又稱(chēng)高斯假定。 滿足以上標(biāo)準(zhǔn)假定的一元線性回歸模型,稱(chēng)為標(biāo)準(zhǔn)的一元線性回歸模型。2022-6-3河北工程大學(xué)
21、經(jīng)濟(jì)管理學(xué)院39二、一元線性回歸模型的估計(jì) 把握以下問(wèn)題: 1、回歸系數(shù)的估計(jì); 2、總體方差的估計(jì); 3、最小二乘估計(jì)量的性質(zhì)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院40 1、回歸系數(shù)的估計(jì) (1)根據(jù)樣本資料確定樣本回歸方程時(shí),一般希望Y的估計(jì)值盡可能接近其真實(shí)值,即et的總量越小越好,但有正負(fù),代數(shù)和為0( et =0),通常用 et2作為衡量總偏差的尺度。所謂最小二乘法根據(jù)這一思路,使殘差平方和最小來(lái)估計(jì)回歸系數(shù)。 (2)設(shè) 為使Q最小,對(duì) 求偏導(dǎo)數(shù),令其為0,得:22122)()(tttttXYYYeQ122022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院411、回歸系數(shù)的估計(jì)(2)整理后有
22、:稱(chēng)為標(biāo)準(zhǔn)方程組,n為樣本容量,解方程組得:00)(200)(2212211tttttttteXXYXQeXYQ即即22121ttttttXXYXXnY_2_2122222/)(11)(XYnXnYXnXYXnYXXXnYXYXntttttttttttttt2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院421、回歸系數(shù)的估計(jì) (3)可以證明: 證明: 設(shè) 得到:222_)(1)(tttXnXXX222222_22_22_22_)(1)()()(2)(2)(tttttttttXnXnXnXXnXXnXnXXXnXXXXXttttttxytttyytttxxYXnYXYYXXLYnYYYLXnXXXL1
23、)()(1)()(1)(_222_222_xxxyLL22022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院43例8-1 根據(jù)15個(gè)居民家庭的人均月食品支出與人均月收入水平的數(shù)據(jù),估計(jì)食品支出的恩格爾函數(shù)。 解:最簡(jiǎn)單的恩格爾函數(shù)假定在商品價(jià)格不變的條件下,實(shí)際的食品支出Y與實(shí)際的收入水平X間的關(guān)系可以用一元線性回歸模型反映。根據(jù)Y和X的數(shù)據(jù)計(jì)算有關(guān)統(tǒng)計(jì)量,列在表8-3中(表略),將有關(guān)合計(jì)數(shù)代入公式得:9878.91515161802.0154231802.0151616365415423151644632151222022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院44例8-1 解:該例中 得到 同樣 樣本回歸方
24、程為:ttXY1802.099.980.1880423151615144632140.38242315112311)(193.10436151615163654)(1222222ttttxyttyyttxxYXnYXLYnYLXnXL1802.093.1043680.18802xxxyLL9878.912022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院45例8-1 解:上式中:0.1802表示收入每增加1元,食品支出會(huì)增加0.1802元;9.9878表示即使在收入為0的情況下,食品支出也需要9.99元。根據(jù)該式計(jì)算的食品支出在總收入中平均所占比重為: 上式中 即所謂恩格爾系數(shù),本例中,恩格爾系數(shù)隨著Xt
25、的增加而遞減,與恩格爾定律一致。1802.0/99.9/tttXXYttXY /2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院46 2、總體方差的估計(jì) (1)在一元線性回歸模型中還包括另一個(gè)參數(shù),即總體隨機(jī)誤差項(xiàng)的方差( ),它可以反映模型誤差的大小,本身不能直接測(cè)得,用最小二乘殘差et代替隨機(jī)誤差項(xiàng) 來(lái)估計(jì) 。 的無(wú)偏估計(jì)S2由下式給出: S2= et2/n-2,式中分子是殘差平方和,分母是自由度,n是樣本觀測(cè)值的個(gè)數(shù),2是一元線性回歸方程中回歸系數(shù)的個(gè)數(shù)。模型中殘差滿足兩個(gè)約束條件: 因而失去兩個(gè)自由度,所以自由度為n-22)(tVart220,0ttteXe2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理
26、學(xué)院47 2、總體方差的估計(jì) (2) S2的正平方根又叫做回歸估計(jì)的標(biāo)準(zhǔn)誤差。S越小表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本回歸線的離差程度越小,即回歸線具有較強(qiáng)的代表性;反之,S越大表明實(shí)際觀測(cè)點(diǎn)與所擬合的樣本線的離差程度越大,即回歸線的代表性較差。 (3)一般計(jì)算S2時(shí),殘差平方和用下式計(jì)算:tttttYXYYe21222022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院48例8-2 根據(jù)例8-1中的有關(guān)數(shù)據(jù)計(jì)算食品支出恩格爾函數(shù)的總體方差S2和回歸估計(jì)標(biāo)準(zhǔn)誤差S。 解:已知 將有關(guān)數(shù)據(jù)代入公式得: 又得到: S2= 43.47/(15-2)=3.3438 有S =1.828644632,423,123112tt
27、ttYXYY27.43446321802. 04239878. 9123112te2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院49 3、最小二乘估計(jì)量的性質(zhì) (1) 用最小二乘法求得的 值是樣本觀測(cè)值的函數(shù),通常稱(chēng)之為最小二乘估計(jì)量,它們的形式不變,但因樣本不同而不同,是一種隨機(jī)變量??梢宰C明在標(biāo)準(zhǔn)假定滿足下,回歸系數(shù)的最小二乘估計(jì)量的期望值等于其真值,即 其方差為:1222)(E11)(E2_222_21)()()(1()(XXVarXXXnVartt2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院50 3、最小二乘估計(jì)量的性質(zhì)(2)最小二乘估計(jì)量是總體回歸系數(shù)的線性無(wú)偏估計(jì)量,還可以證明,其方差最小,
28、同時(shí)隨著樣本容量的增大,其方差不斷縮小,也就是說(shuō),回歸系數(shù)的最小二乘估計(jì)量是最優(yōu)線性無(wú)偏估計(jì)量和一致估計(jì)量。 這由數(shù)學(xué)家高斯和馬爾可夫提出并證明,被稱(chēng)為高斯-馬爾可夫定理,表明在標(biāo)準(zhǔn)假定下,最小二乘估計(jì)量是一種最佳的估計(jì)方式。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院51三、一元線性回歸模型擬合程度評(píng)價(jià) 把握以下問(wèn)題: 1、回歸模型檢驗(yàn)的種類(lèi); 2、擬合程度的概念; 3、總離差平方和的分解; 4、可決系數(shù)及其性質(zhì)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院52 1、回歸模型檢驗(yàn)的種類(lèi) 包括理論意義檢驗(yàn)、一級(jí)檢驗(yàn)和二級(jí)檢驗(yàn)。 (1)理論意義檢驗(yàn)涉及參數(shù)估計(jì)值符號(hào)和取值區(qū)間,檢驗(yàn)是否與實(shí)質(zhì)性科學(xué)的理論
29、及人們的實(shí)踐經(jīng)驗(yàn)相符。 (2)一級(jí)檢驗(yàn)又稱(chēng)統(tǒng)計(jì)學(xué)檢驗(yàn),利用統(tǒng)計(jì)學(xué)中的抽樣理論來(lái)檢驗(yàn)樣本回歸方程的可靠性,具體又分為擬合程度評(píng)價(jià)和顯著性檢驗(yàn)。 (3)二級(jí)檢驗(yàn)又稱(chēng)經(jīng)濟(jì)計(jì)量學(xué)檢驗(yàn),是對(duì)標(biāo)準(zhǔn)線性回歸模型的假定條件能否得到滿足進(jìn)行檢驗(yàn),包括序列相關(guān)檢驗(yàn)、異方差檢驗(yàn)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院53 2、擬合程度的概念 擬合程度是指樣本觀測(cè)值聚集在樣本回歸線周?chē)木o密程度。 判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量指標(biāo)是 可決系數(shù)(又稱(chēng)決定系數(shù))。該指標(biāo)建立在對(duì)總離差平方和分解的基礎(chǔ)上。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院543、總離差平方和的分解 (1)因變量的實(shí)際觀測(cè)值與其樣本平均數(shù)之間
30、的離差稱(chēng)作總離差,即: 可以分解為兩部分:一是因變量的理論回歸值與其樣本均值的離差 ,表示能用回歸直線解釋的部分,稱(chēng)為可解釋離差;二是實(shí)際觀測(cè)值與理論回歸值的離差 它是不能由回歸直線解釋的殘差et。對(duì)任一實(shí)際觀測(cè)值總有:_YYt_YYtttYYtttttteYYYYYYYY)()()()(_2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院55 3、總離差平方和的分解 (2)用圖表示: XY0_YYtttYY_YYt_YttXY21tY2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院563、總離差平方和的分解 (3)將總離差式子左右平方求和,得 證明: 從而有)(2)()()()()(_22_2_2_ttttt
31、tttttYYYYYYYYYYYYYY0)(2_tttYYYY0)()()()()()(22_2_22_2_221_2121_xxxxxyxyttttttttttttLLLLXXYYXXXXYYXXXYXXYYYY22_2_)()()(ttttYYYYYY2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院57 3、總離差平方和的分解 (4)由上得:SST=SSR+SSE 式中SST是總的離差平方和;SSR是回歸直線可以解釋的離差平方和,稱(chēng)為回歸平方和;SSE是回歸直線無(wú)法解釋的離差平方和,稱(chēng)為剩余殘差平方和,又稱(chēng)殘差平方和。 又有 則 估計(jì)標(biāo)準(zhǔn)誤差SSTYYLtyy2_)(SSEYYettt22)(xy
32、xxxxxytttLLLLXXXXYYSSR222_222_21212_)()()(xyyytLLeSSE222222nLLneSxyyyt2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院584、可決系數(shù)及其性質(zhì) (1)由 SST=SSR+SSE得 1= SSR/ SST+ SSE /SST,可見(jiàn)各樣本觀測(cè)點(diǎn)與樣本回歸線靠得越近, SSR在SST所占比例越大,將其定義為可決系數(shù),即 r2= SSR/ SST=1- SSE /SST= 它是對(duì)回歸模型擬合程度的綜合度量,可決系數(shù)越大,模型擬合越高。可決系數(shù)越小,則模型對(duì)樣本的擬合程度越差。yyxyLL22022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院594、可決
33、系數(shù)及其性質(zhì) (2)性質(zhì):A、具有非負(fù)性; B、取值范圍0 r2 1,當(dāng)所有觀測(cè)值在回歸線上時(shí), SSE=0, r2 =1,說(shuō)明總離差完全可以由樣本直線解釋?zhuān)?dāng)觀測(cè)值不全在樣本線上時(shí), SSE0, r21 ,當(dāng)回歸直線沒(méi)有解釋任何離差,總離差平方和等于殘差平方和,則r2=0; C、它是樣本觀測(cè)值的函數(shù),也是統(tǒng)計(jì)量。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院60例8-3 利用例8-2中計(jì)算的殘差平方和,計(jì)算例8-1擬合的樣本回歸系數(shù)的可決系數(shù)。 解:r2= SSR/ SST=1- SSE /SST=0.8863 還可以利用公式r2 = =0.18021880.80/382.40=0.8863 此外
34、例8-2中的估計(jì)標(biāo)準(zhǔn)誤差yyxyLL28288. 1134798.4321580.18801802. 040.3822222nLLneSxyyyt2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院61 第三節(jié) 相關(guān)分析 把握以下問(wèn)題: 一、相關(guān)系數(shù)概念; 二、相關(guān)系數(shù)與可決系數(shù); 三、例8-102022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院62一、相關(guān)系數(shù)概念 把握以下問(wèn)題: 1、相關(guān)系數(shù)的定義; 2、總體相關(guān)系數(shù)的定義式; 3、樣本相關(guān)系數(shù)的定義公式。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院631、相關(guān)系數(shù)的定義 單相關(guān)分析是對(duì)兩個(gè)變量間的相關(guān)程度進(jìn)行分析。單相關(guān)分析所用的指標(biāo)稱(chēng)為單相關(guān)系數(shù)簡(jiǎn)稱(chēng)相關(guān)系數(shù)。 通常用 表示總體的相關(guān)系數(shù),以r表示樣本的相關(guān)系數(shù)。2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院642、總體相關(guān)系數(shù)的定義式 式中,Cov(X,Y)是變量X和Y的協(xié)方差;Var(X)、Var(Y)分別為變量X和Y的方差。 總體相關(guān)系數(shù)是反映兩變量之間線性相關(guān)程度的一種特征值,表現(xiàn)為一個(gè)常數(shù)。)81. 8()()(),(YVarXVarYXCov2022-6-3河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院65 3、樣本相關(guān)系數(shù)的定義公式 (1) 樣本相關(guān)系數(shù)是根據(jù)樣本觀測(cè)值計(jì)算的,抽取的樣本不同,其具體數(shù)值有差異,它是總體相關(guān)系數(shù)的一致估計(jì)量。)82. 8 ()()()(2_2_yyxxxyttttLLLYYXX
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)租賃合同的風(fēng)險(xiǎn)評(píng)估
- 茶樓茶葉技術(shù)轉(zhuǎn)讓合同
- 個(gè)人協(xié)作合同范例
- 書(shū)寫(xiě)工具訂購(gòu)合同
- 殯葬服務(wù)專(zhuān)業(yè)團(tuán)隊(duì)
- 保送承諾保證書(shū)
- 服務(wù)外包合同的項(xiàng)目規(guī)劃
- 自動(dòng)化生產(chǎn)設(shè)備選購(gòu)
- 裝修材料選購(gòu)協(xié)議樣本
- 電子招標(biāo)文件的審批流程
- 信陽(yáng)市光山縣2023-2024學(xué)年七年級(jí)上學(xué)期期末數(shù)學(xué)測(cè)試卷(含答案)
- 《“健康中國(guó)2030”規(guī)劃綱要》全文健康中國(guó)2030規(guī)劃綱要全文
- 案場(chǎng)物業(yè)管理制度
- 軍隊(duì)文職-政治理論-政治-馬克思主義基本原理練習(xí)一
- 南京聯(lián)合體2022-2023學(xué)年九年級(jí)上學(xué)期期中考試化學(xué)試題(含答案)
- 電子商務(wù)網(wǎng)絡(luò)商務(wù)信息采集與處理考核試題及答案
- SA8000-2014社會(huì)責(zé)任績(jī)效委員會(huì)SPT組織架構(gòu)、職責(zé)和定期檢討及評(píng)審會(huì)議記錄
- 攪拌釜式反應(yīng)器攪拌釜式反應(yīng)器課件
- 北京信息科技大學(xué)高等數(shù)學(xué)期末考試試卷(含答案)
- 化工設(shè)計(jì)練習(xí)題
- 招生動(dòng)員課件
評(píng)論
0/150
提交評(píng)論