




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第八章相關(guān)分析與回歸分析學(xué)習(xí)目標(biāo)主要內(nèi)容本章小結(jié)學(xué)習(xí)目標(biāo)
理解相關(guān)分析與回歸分析的基本的含義,最小二乘法的基本的思想;理解回歸模型中參數(shù)的意義及樣本可決系數(shù)的的意義;掌握回歸模型中的參數(shù)估計、相關(guān)系數(shù)檢驗、擬合優(yōu)度檢驗、回歸系數(shù)顯著性檢驗、回歸方程顯著性檢驗的基本方法、回歸模型的估計與預(yù)測。主要內(nèi)容:第一節(jié)相關(guān)分析第二節(jié)一元線性回歸分析第三節(jié)多元線性回歸分析本章小結(jié)思考題參考書目第一節(jié)相關(guān)分析1.1變量之間的兩類關(guān)系:變量之間存在著非嚴(yán)格、不確定的依存關(guān)系。在這種關(guān)系中,當(dāng)一個或幾個相互聯(lián)系的變量取一定的數(shù)值時,可以有另一變量的若干數(shù)值與之對應(yīng)。相關(guān):函數(shù)關(guān)系也稱為確定性關(guān)系,是指變量之間存在的嚴(yán)格確定的依存關(guān)系。在這種關(guān)系中,當(dāng)一個或幾個相互聯(lián)系的變量取一定的數(shù)值時,必有另一個且只有一個變量有確定的值與之對應(yīng)。函數(shù):1)按相關(guān)的密切程度可分為:完全相關(guān)、不完全相關(guān)、不相關(guān);2)按表現(xiàn)形態(tài)可分為:線性相關(guān)、非線性相關(guān);3)按相關(guān)的方向可分為:正相關(guān)、負(fù)相關(guān);4)按研究變量的多少可分為:單相關(guān)、復(fù)相關(guān)、偏向關(guān)。1.2相關(guān)關(guān)系的種類:1.3相關(guān)分析與回歸分析:回歸分析是研究某一隨機變量關(guān)于另一個(或多個)非隨機變量之間數(shù)量關(guān)系變動趨勢的方法。其目的在于根據(jù)已知的非隨機變量來估算和預(yù)測隨機變量的總體均值?;貧w分析:相關(guān)分析主要研究兩個和兩個以上的隨機變量之間相互依存關(guān)系的方向和密切程度的方法。相關(guān)分析:相關(guān)分析與回歸分析的區(qū)別與聯(lián)系:他們在研究現(xiàn)象之間相互依存的關(guān)系時,是相互補充、相互滲透的,在實際應(yīng)用中,一般定性的相關(guān)分析;然后計算相關(guān)系數(shù),擬合適當(dāng)?shù)幕貧w方程,進行顯著性檢驗;最后用回歸方程進行推算和預(yù)測。聯(lián)系:1)相關(guān)分析研究的變量都是隨機變量,不需要區(qū)別因變量和自變量,并且側(cè)重于研究兩個變量間線性相關(guān)的密切程度;2)回歸分析中必須確定因變量與自變量,自變量是確定的一般變量,而因變量是隨機變量,不僅揭示自變量對因變量的影響,還可以利用回歸方程進行預(yù)測和控制。區(qū)別:1.4相關(guān)關(guān)系的測度(1/2):相關(guān)圖是研究相關(guān)關(guān)系的直觀工具,又稱為散點圖。他是將具有相關(guān)關(guān)系的兩個變量間相對應(yīng)的變量值,在直角坐標(biāo)系中用坐標(biāo)點的形式描繪出來,根據(jù)坐標(biāo)點的分布狀況來大致判別相關(guān)形式、相關(guān)方向和相關(guān)密切的程度。(例)相關(guān)圖:(a)正相關(guān)(b)負(fù)相關(guān)1.4相關(guān)關(guān)系的測度(2/2):相關(guān)系數(shù)是衡量變量之間線性相關(guān)密切程度及相關(guān)方向的統(tǒng)計分析指標(biāo)。相關(guān)系數(shù):樣本相關(guān)系數(shù):總體相關(guān)系數(shù):樣本相關(guān)系數(shù)分子分母的簡化計算形式:1);2)當(dāng)時,變量間不存在線性相關(guān)關(guān)系;3)當(dāng)時,變量間具有完全線性相關(guān)關(guān)系,當(dāng)時,稱完全正相關(guān),當(dāng)時,稱完全負(fù)相關(guān)。4)當(dāng)時,變量間存在負(fù)相關(guān)關(guān)系;當(dāng)時,變量之間存在正相關(guān)關(guān)系5)的取值越接近0,變量間線性相關(guān)關(guān)系越弱,越接近1,變量間線性相關(guān)關(guān)系越強。相關(guān)系數(shù)的性質(zhì):對的統(tǒng)計量檢驗法第一步:提出假設(shè);第二步:計算檢驗統(tǒng)計量第三步:根據(jù)給定的顯著性水平,進行決策。若,拒絕,表明變量間線性相關(guān)關(guān)系顯,不能拒絕,表明變量間的線性著;若相關(guān)關(guān)系不顯著;相關(guān)系數(shù)的檢驗:
例8-1根據(jù)1996-2012年國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額資料,見書本表8-1,計算國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間的相關(guān)系數(shù),并對相關(guān)系數(shù)進行顯著性檢驗。
解:1)計算相關(guān)系數(shù)
案例分析:2)對樣本相關(guān)系數(shù)進行t檢驗計算t統(tǒng)計量:
對給定顯著性水平,查表得,這里,故在0.05的顯著性水平下,檢驗通過,說明國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間的相關(guān)關(guān)系顯著。第二節(jié)一元線性回歸分析一元線性總體回歸模型:
與是參數(shù)和的最小二乘估計。實際觀測值與之間差值稱為殘差,即:
一元線性回歸方程:2.1一元線性回歸模型A回歸模型的基本形式假設(shè)1:隨機誤差項具有零均值,同方差性,即假設(shè)2:隨機誤差項之間不存在序列相關(guān)關(guān)系,即假設(shè)3:解釋變量是確定性變量,且與隨機誤差項之間線性無關(guān)。假設(shè)4:隨機誤差項服從零均值、同方差的正態(tài)分布,即:B一元線性回歸模型的基本假設(shè)最小二乘法:就是使殘差平方和達到最小時求得參數(shù)和的估計值與的方法。殘差平方和:Q對分別求一階偏導(dǎo),并令其為0,得方程組:2.2一元線性回歸模型的估計A參數(shù)和的最小二乘估計求解方程組得的最小二乘估計量例8-2根據(jù)表8-1中給出的我國國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額數(shù)據(jù),建立回歸方程。解:根據(jù)例8-1的計算結(jié)果可知,國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間具有顯著的線性相關(guān)關(guān)系,由此可建立簡單直線回歸方程:
將表8-1中的有關(guān)數(shù)據(jù)代入下式:
案例分析:可得:
所求回歸方程為:
表明固定資產(chǎn)投資額每增加1億元,國內(nèi)生產(chǎn)總值平均增加1.305億元最小二乘估計量與分別是其真值與的無偏估計,且都服從正態(tài)分布。
B最小二乘估計量的性質(zhì)回歸標(biāo)準(zhǔn)差:其簡捷公式:越小表明實際觀測點與所擬合的樣本回歸線的離差程度越小,回歸線能較好的代表總回歸模型。反之,越大表明實際觀測點與所擬合的樣本回歸線的離差程度越大,回歸線的代表性越差。C總體方差的估計
其中:
D回歸系數(shù)的區(qū)間估計從回歸系數(shù)的最小二乘估計量可以看出,對任意給出的n對數(shù)據(jù)(xi,yi),都可以求出,從而可以寫出回歸方程,但這樣給出的方程不一定有意義。在使用回歸方程之前,必須對其進行統(tǒng)計檢驗,以判斷估計的可靠程度。這包括擬合優(yōu)度檢驗、整個回歸方程的顯著性檢驗、回歸系數(shù)的顯著性檢驗等。2.3一元線性回歸模型的檢驗擬合優(yōu)度是指模型對樣本觀測值的擬合程度,即樣本回歸直線與觀測點之間的緊密程度。衡量擬合優(yōu)度的指標(biāo)通常用樣本可決系數(shù)(又稱作決定系數(shù))。
A/C擬合優(yōu)度檢驗概念:總偏差平方和:回歸平方和:殘差平方和:總偏差平方和分解式:
Y的觀測值圍繞其均值的總偏差平方和可以分解為兩部分,一部分來自于回歸線,另一部分來自隨機因素。因而,可以用回歸平方和占總偏差平方和的比例來判斷回歸線與樣本觀測值的擬合程度,記為。他用公式表示為:
的意義及應(yīng)用:的取值在0到1之間,其值越接近1,說明回歸方程的擬合程度越高;反之,其值越小,說明回歸方程的擬合效果差。B/C回歸方程的顯著性檢驗(F檢驗)
回歸方程的顯著性檢驗就是對模型中的被解釋變量與解釋變量之間的線性關(guān)系在總體上是否顯著成立作出判斷。一元線性回歸模型只有一個解釋變量,要判斷y的均值是否隨x呈線性變化,實際上就是要判斷β1是否為零,通常采用F檢驗。
1.提出假設(shè)原假設(shè);備擇假設(shè)2.構(gòu)造統(tǒng)計量
在原價設(shè)成立的條件下,上述統(tǒng)計量
3.給定顯著性水平,確定拒絕域:,在附表中可直接查找的值。檢驗步驟(F檢驗):4.作出判斷根據(jù)樣本計算出統(tǒng)計量F的數(shù)值,然后與的值進行比較:若,則拒絕原假設(shè),認(rèn)為回歸方程是顯著的,即x與y之間有顯著的線性關(guān)系;若,則接受原假設(shè),認(rèn)為回歸方程不顯著,即x與y之間沒有顯著的線性關(guān)系。C/C回歸系數(shù)的顯著性檢驗(t檢驗)
一元線性回歸模型中,回歸系數(shù)的顯著性檢驗解釋要檢驗解釋變量x對被解釋變量y的影響程度是否顯著,也就是檢驗β1是否顯著,通常使用t檢驗。
需要注意的是,在一元線性回歸中,因為t檢驗與F檢驗提出的假設(shè)是一致的,而且,兩個統(tǒng)計量之間具有F=t^2的關(guān)系,所以,t檢驗與F檢驗是等價的。
1.提出假設(shè)原假設(shè);備擇假設(shè)2.構(gòu)造統(tǒng)計量
在原價設(shè)成立時,統(tǒng)計量3.給定顯著性水平,確定拒絕域:,在附表中可直接查找的值。檢驗步驟(t檢驗):4.作出判斷根據(jù)樣本計算出統(tǒng)計量t的數(shù)值,然后與的值進行比較:若,則拒絕原假設(shè),認(rèn)為β1顯著不為0,即變量x與y之間一元線性關(guān)系顯著成立;若,則接受原假設(shè),認(rèn)為回歸方程不顯著。認(rèn)為β1顯著為0,變量x與y之間一元線性關(guān)系不成立。案例分析:P141,例題8-3例8-3對例8-2建立的國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額的回歸方程進行顯著性檢驗。解:1)先進行F檢驗,計算F統(tǒng)計量對于給定的顯著性水平,查表得,由于,拒絕原假設(shè),認(rèn)為回歸方程是顯著的。2)還可以進行t檢驗,計算t統(tǒng)計量當(dāng)時,查表得,由于,拒絕原假設(shè),說明顯著不為0,即國內(nèi)生產(chǎn)總值和固定資產(chǎn)投資額之間具有顯著的線性相關(guān)關(guān)系。2.4一元線性回歸模型的應(yīng)用——估計與預(yù)測
當(dāng)回歸方程經(jīng)過檢驗是顯著的以后,可以將其用作估計與預(yù)測。
估計就是指當(dāng)x=x0時,尋求y的均值E(y0)=β0+β1x0的點估計與區(qū)間估計,這里E(y0)是常量;
預(yù)測問題是指當(dāng)x=x0時,y0的觀測值在什么范圍內(nèi)。即對于給定的顯著性水平α,找一個區(qū)間(T1,T2),使得P(T1<y0<T2
)=1-α,稱區(qū)間(T1,T2)是y0的概率為1-α的預(yù)測區(qū)間。
點估計:區(qū)間估計:A/B)y的均值E(y0)的估計B/B)y0的預(yù)測區(qū)間第三節(jié)多元線性回歸分析
一元線性回歸模型反映的是一個因變量和一個自變量之間的線性關(guān)系。實際上,社會經(jīng)濟現(xiàn)象的變動是很復(fù)雜的,一個因變量的變動往往是由許多自變量的綜合影響造成的。在線性回歸模型中,若一個因變量對應(yīng)多個自變量,這種模型稱為多元線性回歸模型。
多元回歸模型是一元線性回歸模型的推廣,其參數(shù)估計原理與一元線性回歸模型相同,只是計算更加復(fù)雜。
A多元線性回歸模型的一般形式
分別是參數(shù)的最小二乘估計。實際觀測值與之間差值稱為殘差,即:
多元線性回歸方程:3.1多元線性回歸模型假設(shè)1:隨機誤差項具有零均值,同方差性,即假設(shè)2:隨機誤差項之間不存在序列相關(guān)關(guān)系,即假設(shè)3:解釋變量是確定性變量,相互之間互不相關(guān),且與隨機誤差項之間線性無關(guān),
假設(shè)4:隨機誤差項服從零均值、同方差的正態(tài)分布,即:B多元線性回歸模型的基本假設(shè)A回歸系數(shù)的最小二乘估計
殘差平方和公式為:Q分別對求一階偏導(dǎo),并令其為0,得方程組:3.2多元線性回歸模型的參數(shù)估計解矩陣方程得:以上(k+1)個方程組成的方程組稱為正規(guī)方程組,經(jīng)過整理得:用矩陣形式表示如下:這就是參數(shù)的最小二乘估計量。參數(shù)估計量的期望為因而,參數(shù)估計量是的無偏估計參數(shù)估計量的方差-協(xié)方差陣為B最小二乘估計量的性質(zhì)
C總體方差的估計
多元回歸分析中的可決系數(shù)用
表示。
多元回歸分析中用作為擬合優(yōu)度的評價不可靠,必須進行修正。在樣本容量一定的情況下,將殘差平方和與總偏差平方和分別除以各自的自由度,以消除變量個數(shù)對擬合優(yōu)度的影響。修正以后的決定系數(shù)用表示。計算公式為:3.3擬合優(yōu)度檢驗修正后的可絕系數(shù)與未經(jīng)修正的可絕系數(shù)之間有如下關(guān)系:一般來說,越接近1,表明擬合程度越高;
越接近0或者小于0,表明擬合程度越差。3.4顯著性檢驗當(dāng)多元線性回歸模型中的參數(shù)估計出來以后,還要對模型進行顯著性檢驗。一方面,要對模型總體上的線性關(guān)系是否顯著進行檢驗;另一方面,還要對每個解釋變量對被解釋變量的影響是否顯著進行檢驗。1.提出假設(shè)原假設(shè)備擇假設(shè)不全為02.構(gòu)造統(tǒng)計量在原假設(shè)成立的條件下,上述統(tǒng)計量A/B回歸方程的顯著性檢驗(F檢驗)3.列出回歸模型的方差分析表方差來源平方和自由度均方F檢驗值回歸SSRkSSR/k
殘差
SSEn-k-1SSE/(n-k-1)總和
SSTn-1
4.給定顯著性水平在附表中查找的值,并與方差分析表中統(tǒng)計量的數(shù)值進行比較:
若,拒絕原假設(shè),認(rèn)為總體回歸方程中各解釋變量與被解釋變量的線性關(guān)系是顯著的。若,拒絕原假設(shè),則認(rèn)為總回歸方程不顯著,所建立的回歸模型沒有意義。1.提出假設(shè)原假設(shè);備擇假設(shè)
2.構(gòu)造統(tǒng)計量
其中,為回歸標(biāo)準(zhǔn)差B/B系數(shù)的顯著性檢驗(t檢驗)3.給定顯著性水平,查出臨界值4.作出判斷當(dāng)時,拒絕原假設(shè),可以認(rèn)為在顯著性水平下,對的影響顯著。當(dāng)時,接受原假設(shè),認(rèn)為在顯著性水平下,對的影響不顯著。點估計:區(qū)間估計:區(qū)間估計:3.5多元線性回歸模型的應(yīng)用——估計與預(yù)測(一)偏相關(guān)系數(shù)
考慮在對其他變量的影響進行控制的情況下,來考察相關(guān)的多個變量中某兩個變量的相關(guān)程度,偏相關(guān)系數(shù)就是衡量這種相關(guān)程度的指標(biāo)。為簡明起見,先計算三個變量間的相關(guān)系數(shù)。三個變量擬合三個回歸方程:3.5偏相關(guān)系數(shù)與復(fù)相關(guān)系數(shù)當(dāng)?shù)闹狄欢〞r,與的偏相關(guān)系數(shù)為:當(dāng)?shù)闹狄欢〞r,與的偏相關(guān)系數(shù)為:當(dāng)?shù)闹狄欢〞r,與的偏相關(guān)系數(shù)為:偏相關(guān)系數(shù)的符號與相應(yīng)的偏回歸系數(shù)相同,其取值范圍在-1到1之間。在實際運用中,可以將以上偏相關(guān)系數(shù)的定義推廣到多個變量的場合。復(fù)相關(guān)系數(shù),是在多元線性回歸分析中衡量因變量與多個自變量之間相關(guān)程度的指標(biāo)。其計算公式如下:(二)復(fù)相關(guān)系數(shù)案例分析:P149,例題8-4本章介紹了研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法:一是相關(guān)分析,二是回歸分析。實際應(yīng)用中,一般先進行定性的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇財經(jīng)職業(yè)技術(shù)學(xué)院《打印創(chuàng)新設(shè)計》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津醫(yī)科大學(xué)臨床醫(yī)學(xué)院《電視節(jié)目播音主持實訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 邵陽職業(yè)技術(shù)學(xué)院《結(jié)構(gòu)設(shè)計軟件應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 長春職業(yè)技術(shù)學(xué)院《三維動畫MAYA》2023-2024學(xué)年第二學(xué)期期末試卷
- 內(nèi)江師范學(xué)院《SAS與統(tǒng)計分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年重慶市建筑安全員考試題庫附答案
- 長春師范大學(xué)《公共管理與公共政策實務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安航空學(xué)院《老年認(rèn)知癥的篩查與干預(yù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京科技職業(yè)學(xué)院《會展設(shè)計實務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 襄陽職業(yè)技術(shù)學(xué)院《現(xiàn)代環(huán)境分析技術(shù)與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 一通三防培訓(xùn)課件PPT課件(PPT 53頁)
- 江蘇省邳州市2021-2022學(xué)年人教版四年級上冊期末數(shù)學(xué)試卷(含答案)
- 大數(shù)據(jù)分析及應(yīng)用實踐全書課件匯總整本書電子教案(最新)
- 教練技術(shù)一階段講義(共59頁)
- 第3章-系統(tǒng)模型與模型化
- 精品課程建設(shè)驗收自評報告
- 福建省義務(wù)教育課程設(shè)置及比例(修訂)
- 未成年人需辦銀行卡證明(模板)
- 建設(shè)項目職業(yè)病防護設(shè)施設(shè)計專篇編制導(dǎo)則
- 員工考勤流程圖
- 出口加工區(qū)外匯管理培訓(xùn)(ppt49)
評論
0/150
提交評論