第九章相關(guān)與回歸_第1頁
第九章相關(guān)與回歸_第2頁
第九章相關(guān)與回歸_第3頁
第九章相關(guān)與回歸_第4頁
第九章相關(guān)與回歸_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

河南科技大學(xué)經(jīng)濟(jì)與管理學(xué)院第一節(jié)相關(guān)關(guān)系的概念和種類第二節(jié)相關(guān)關(guān)系的判斷第三節(jié)一元回歸分析第四節(jié)多元線性回歸分析第九章相關(guān)與回歸第一節(jié)相關(guān)關(guān)系的概念和種類一、函數(shù)關(guān)系與相關(guān)關(guān)系1.函數(shù)關(guān)系當(dāng)一個或幾個變量取一定的值時,另一個變量有確定值與之相對應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。(函數(shù)關(guān)系)(1)是一一對應(yīng)的確定關(guān)系(2)設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個數(shù)值時,

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量(3)各觀測點(diǎn)落在一條線上

xy變量間的關(guān)系

(函數(shù)關(guān)系)

函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為y=p

x(p為單價)圓的面積(S)與半徑之間的關(guān)系可表示為S=r2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)

、單位產(chǎn)量消耗(x2)

、原材料價格(x3)之間的關(guān)系可表示為y=x1x2x3

當(dāng)一個或幾個相互聯(lián)系的變量取一定數(shù)值時,與之相對應(yīng)的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。

概念:指現(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量上的相互依存關(guān)系。2.相關(guān)關(guān)系變量間的關(guān)系

(相關(guān)關(guān)系)(1)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá);(2)一個變量的取值不能由另一個變量唯一確定;(3)當(dāng)變量x取某個值時,變量y的取值可能有幾個;(4)各觀測點(diǎn)分布在直線周圍。

xy(相關(guān)關(guān)系)

相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品的消費(fèi)量(y)與物價(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系二、相關(guān)關(guān)系的種類1.按相關(guān)形式劃分可以分為線性相關(guān)和非線性相關(guān)。線性相關(guān):當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時,稱之為線性相關(guān)。

非線性相關(guān):如果兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。2.按相關(guān)程度劃分完全相關(guān):當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確定時,這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。即函數(shù)關(guān)系。

不完全相關(guān):兩個現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。

不相關(guān):當(dāng)兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時,稱為不相關(guān)。如:股票價格的高低與氣溫的高低是不相關(guān)的。(1)正相關(guān):兩個相關(guān)現(xiàn)象間,當(dāng)一個變量的數(shù)值增加(或減少)時,另一個變量的數(shù)值也隨之增加(或減少),即同方向變化。例如收入與消費(fèi)的關(guān)系。(2)負(fù)相關(guān):當(dāng)一個變量的數(shù)值增加(或減少)時,而另一個變量的數(shù)值相反地呈減少(或增加)趨勢變化,即反方向變化。例如物價與消費(fèi)的關(guān)系。3.按相關(guān)的方向劃分可分為正相關(guān)和負(fù)相關(guān)4.按相關(guān)關(guān)系涉及的變量多少劃分分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)。兩個變量之間的相關(guān),稱為單相關(guān)。當(dāng)所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復(fù)相關(guān)。例如,某種商品的需求與其價格水平以及收入水平之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場合,假定其他變量不變,專門考察其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價格水平的關(guān)系就是一種偏相關(guān)。三、相關(guān)分析的內(nèi)容

(一)確定現(xiàn)象之間有無關(guān)系(二)確定相關(guān)關(guān)系的表現(xiàn)形式(三)確定相關(guān)關(guān)系的密切程度和方向第二節(jié)相關(guān)關(guān)系的判斷定性分析是依據(jù)研究者的理論知識和實(shí)踐經(jīng)驗,對客觀現(xiàn)象之間是否存在相關(guān)關(guān)系,以及何種關(guān)系作出判斷。定量分析在定性分析的基礎(chǔ)上,通過編制相關(guān)表、繪制相關(guān)圖、計算相關(guān)系數(shù)等方法,來判斷現(xiàn)象之間相關(guān)的方向、形態(tài)及密切程度。一、相關(guān)關(guān)系的判斷

二、相關(guān)表:將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值一一對應(yīng)而平行排列的表。

例:為了研究分析某種勞務(wù)產(chǎn)品完成量與其單位產(chǎn)品成本之間的關(guān)系,調(diào)查30個同類服務(wù)公司得到的原始數(shù)據(jù)如表。 整理后有三、相關(guān)圖:又稱散點(diǎn)圖。將x置于橫軸上,y置于縱軸上,將(x,y)繪于坐標(biāo)圖上。用來反映兩變量之間相關(guān)關(guān)系的圖形。為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測量了1078對父子的身高。把1078對數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個點(diǎn)所形成的圖形是一個散點(diǎn)圖。它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個橢圓。

正相關(guān)

強(qiáng)正相關(guān)弱正相關(guān)負(fù)相關(guān)

強(qiáng)負(fù)相關(guān)弱負(fù)相關(guān)不相關(guān)四、相關(guān)系數(shù)(一)相關(guān)系數(shù)的定義

1.簡單相關(guān)系數(shù):在線性條件下說明兩個變量之間相關(guān)關(guān)系密切程度的統(tǒng)計分析指標(biāo),簡稱相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為

若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為

r樣本相關(guān)系數(shù)的定義公式計算相關(guān)系數(shù)的“積差法”相關(guān)系數(shù)的計算公式計算公式還可以有:相關(guān)系數(shù)的性質(zhì)1、兩變量是對等關(guān)系不分自變量和因變量2、取值范圍:

r<0負(fù)相關(guān)r=0不相關(guān)r>0正相關(guān)完全線性相關(guān)r=1完全正相關(guān)r=-1完全負(fù)相關(guān)相關(guān)方向和相關(guān)程度不相關(guān)低度相關(guān)顯著相關(guān)高度相關(guān)四個等級:注意事項r是對變量之間線性相關(guān)關(guān)系的度量。

r=0只是表明兩個變量之間不存在線性關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。相關(guān)關(guān)系的測度

(相關(guān)系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加例:下表是有關(guān)15個地區(qū)某種商品需求量和地區(qū)人口增加量的資料。第三節(jié)一元回歸分析一、相關(guān)分析與回歸分析(一)概念:1.相關(guān)分析是用來研究變量之間相關(guān)密切程度與相關(guān)方向的一種統(tǒng)計分析方法。2.回歸分析是指對具有相關(guān)關(guān)系的現(xiàn)象,根據(jù)其相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型(稱為回歸方程式),用來近似地表達(dá)變量間的平均變化關(guān)系的一種統(tǒng)計分析方法。(二)相關(guān)分析與回歸分析的區(qū)別

1.在相關(guān)分析中,不必確定自變量和因變量;而在回歸分析中,必須事先確定哪個為自變量,哪個為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。2.相關(guān)分析不能指出變量間相互關(guān)系的具體形式;而回歸分析能確切的指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從已知量估計和預(yù)測未知量。3.相關(guān)分析所涉及的變量一般都是隨機(jī)變量,而回歸分析中因變量是隨機(jī)的,自變量則作為研究時給定的非隨機(jī)變量。(三)相關(guān)分析與回歸分析的聯(lián)系

相關(guān)分析和回歸分析有著密切的聯(lián)系,它們不僅具有共同的研究對象,而且在具體應(yīng)用時,常常必須互相補(bǔ)充。相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在著高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義??偨Y(jié):1、相關(guān)分析是回歸分析的基礎(chǔ)和前提;2、回歸分析是相關(guān)分析的深入和繼續(xù)。

(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度二、回歸分析回歸模型回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個數(shù)字的因變量被預(yù)測的變量1個或多個數(shù)字的或分類的自變量(解釋變量)用于預(yù)測的變量3. 主要用于預(yù)測和估計回歸模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸二、一元線性回歸模型當(dāng)兩個變量互為因果關(guān)系時,可以配合兩條回歸直線方程,一條是。在兩個變量只有單一的因果關(guān)系時,只能建立一個回歸方程,一般為

(一)配合最佳的回歸直線的條件1、要有一定數(shù)量的自變量與因變量的對應(yīng)資料2、現(xiàn)象之間確實(shí)存在顯著性的相關(guān)關(guān)系;3、其相關(guān)關(guān)系是直線相關(guān)關(guān)系;4、應(yīng)根據(jù)最小平方法原理配合一元線性回歸模型(二)根據(jù)未分組資料配合回歸直線模型

a為當(dāng)x=0等于時,y的估計值;b為自變量每變動一個單位時,因變量的平均變動值,也叫回歸系數(shù)。(三)根據(jù)分組資料配合回歸直線模型根據(jù)分組資料配合回歸直線模型,其方法與未分組的基本相同,區(qū)別僅在于求解a和b時要注意加權(quán)。年份貨幣收入

x購買商品支出y20003630.01296108020013731.01369114720023832.01444121620034033.21600132820044234.817641461.620054436.51936160620064739.02209183320075041.625002080合計334278.11411811751.6=8×11751.6-334×278.18×14118-(334)2=0.8122=278.1/8-0.8122×334/8=0.8532=0.8532+0.8122x運(yùn)用模型預(yù)測=0.8532+0.8122x

假定2008年該地區(qū)居民貨幣收入為58億元,預(yù)測2008年該地區(qū)居民購買商品支出額。億元

(四)估計標(biāo)準(zhǔn)誤差估計標(biāo)準(zhǔn)誤差:用來說明回歸方程代表性大小的統(tǒng)計分析指標(biāo)若估計標(biāo)準(zhǔn)誤差小,表明回歸方程準(zhǔn)確性高,代表性大;反之,若估計標(biāo)準(zhǔn)誤差大,表明回歸方程準(zhǔn)確性低,代表性小計算方法:1)定義公式法(因變量實(shí)際值與理論值離差的平均數(shù))2)簡捷公式年份貨幣收入

x購買商品支出y20003630.01296900108020013731.01369961114720023832.014441024121620034033.216001102.24132820044234.817641211.041461.620054436.519361332.25160620064739.022091521183320075041.625001730.562080合計334278.1141189782.0911751.6=0.144相關(guān)系數(shù)和估計標(biāo)準(zhǔn)誤差的關(guān)系

估計標(biāo)準(zhǔn)誤差小,相關(guān)系數(shù)的絕對值就越大,表明現(xiàn)象之間相關(guān)關(guān)系越密切,如果估計標(biāo)準(zhǔn)誤差的值等于0,相關(guān)系數(shù)的絕對值等于1,表明完全相關(guān)。這兩個指標(biāo)在數(shù)量上有如下的關(guān)系:應(yīng)用直線相關(guān)與回歸的注意事項

1.實(shí)際意義

進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系的兩個事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有人說,孩子長,公園里的小樹也在長。求孩子和小樹之間的相關(guān)關(guān)系就毫無意義,用孩子的身高推測小樹的高度則更加慌謬。

2.相關(guān)關(guān)系

相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對于在校兒童,鞋的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會新詞并不能使腳變大,而是涉及到第三個因素??年齡。當(dāng)兒童長大一些,他們的閱讀能力會提高而且由于長大也穿不下原來的鞋。

3.利用散點(diǎn)圖對于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān),然后再進(jìn)行相關(guān)回歸分析。4.變量范圍相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來的回歸關(guān)系。第四節(jié)多元線性回歸分析一、非線性回歸模型當(dāng)自變量與因變量存在某種曲線相關(guān)關(guān)系時,可擬合曲線回歸模型。例如:雙曲線:a>0b>0a>0b<0xxyy指數(shù)曲線:y=aebxb>0

b<0xxyy冪函數(shù)曲線:y=axba>0b>0xyb<1b=1b>1曲線模型的判別方法:理論和經(jīng)驗判斷;觀察散點(diǎn)圖

曲線模型的確定方法:

通常用變量代換法將曲線轉(zhuǎn)換為直線。按線性模型求解參數(shù),而后再變換為曲線模型。例如:雙曲線模型指數(shù)曲線模型非線性回歸模型的估計

幾種線性變換方法實(shí)際應(yīng)用時要注意:

第一、比較復(fù)雜的非線性函數(shù),需綜合利用上述的幾種方法。第二、變換得到的方程式中的變量不允許包含未知的參數(shù)。第三、當(dāng)變換后的新模型中包含的誤差項能夠滿足標(biāo)準(zhǔn)假定時,新模型中回歸系數(shù)最小二乘估計量的理想性質(zhì)才能成立。

第四、嚴(yán)格地說,線性變換方法只是適用于變量為非線性的函數(shù)。第五、并不是所有的非線性函數(shù)都可以通過變換得到與原方程完全等價的線性方程。二、多元線性回歸

一個因變量與兩個及兩個以上自變量之間的回歸如二元線性回歸方程,稱為偏回歸系數(shù)表示假定其他變量不變,當(dāng)

每變動一個單位時,y的平均平均變動值求解參數(shù)時,一般采用最小平方法。銷售額、人口數(shù)和年人均收入數(shù)據(jù)地區(qū)編號銷售額(萬元)y人口數(shù)(萬人)x1年人均收入(元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例】一家百貨公司在10個地區(qū)設(shè)有經(jīng)銷分公司。公司認(rèn)為商品銷售額與該地區(qū)的人口數(shù)和年人均收入有關(guān),并希望建立它們之間的數(shù)量關(guān)系式,以預(yù)測銷售額。有關(guān)數(shù)據(jù)如下表。試確定銷售額對人口數(shù)和年人均收入的線性回歸方程銷售額與人口數(shù)和年人均收入的二元回歸方程為復(fù)相關(guān)系數(shù)(只取正值)1、定義復(fù)相關(guān)系數(shù)是反映一個變量Y與其它K個變量χ2、χ3……χK間線性相關(guān)程度的指標(biāo)。樣本復(fù)相關(guān)系數(shù)的定義式:

2、特點(diǎn)(1)復(fù)相關(guān)系數(shù)介于0和1之間,即0≤R≤1。(2)如果R=1表明Y與χ2、χ3……χK之間存在嚴(yán)密的線性關(guān)系;如果R=0時,表明Y與χ2χ3……χK之間不存在任何線性相關(guān)關(guān)系。(3)一般0<R<1,表明變量之間存在一定程度的線性相關(guān)關(guān)系。三、注意事項1.在定性分析基礎(chǔ)上進(jìn)行定量分析,是保證分析合理的必要條件。2.盡量使用大樣本。3.進(jìn)行回歸預(yù)測時盡量注意條件的變化。4.一般不要用回歸方程預(yù)測自變量5.回歸系數(shù)不直接反映相關(guān)變量的關(guān)系的密切程度?;貧w系數(shù)只是表示自變量和因變量之間的數(shù)量對應(yīng)關(guān)系。練習(xí)題單項選擇題1、進(jìn)行相關(guān)分析,要求相關(guān)的兩個變量()A都是隨機(jī)的B一個是隨機(jī)的,一個不是隨機(jī)的C都不是隨機(jī)的D隨機(jī)或不隨機(jī)都可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論