統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析_第1頁(yè)
統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析_第2頁(yè)
統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析_第3頁(yè)
統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析_第4頁(yè)
統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第七章相關(guān)回歸分析第1頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月①了解相關(guān)關(guān)系的概念及種類;②掌握相關(guān)分析的原理、幾種常用相關(guān)系數(shù)的測(cè)定方法及相關(guān)系數(shù)取值含義;③掌握回歸分析的原理、方法及應(yīng)用,重點(diǎn)掌握簡(jiǎn)單線性回歸方程的擬合及應(yīng)用,明確直線回歸方程中待定參數(shù)的含義。

具體要求第2頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月第一節(jié)相關(guān)分析的基本問(wèn)題

一、相關(guān)關(guān)系與函數(shù)關(guān)系

二、相關(guān)關(guān)系的種類

三、相關(guān)分析的主要內(nèi)容

第3頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

一、相關(guān)關(guān)系與函數(shù)關(guān)系

1.函數(shù)關(guān)系現(xiàn)象之間存在的確定性的數(shù)量依存關(guān)系

圓的面積S與半徑r之間的數(shù)量關(guān)系

GDP與總產(chǎn)出及中間投入之間的關(guān)系

例:S=R2GDP=總產(chǎn)出-中間投入第4頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月2.相關(guān)關(guān)系也稱統(tǒng)計(jì)相關(guān),是指現(xiàn)象之間存在的非確定性的數(shù)量依存關(guān)系

非一一對(duì)應(yīng)商品價(jià)格與商品需求量之間存在的變動(dòng)關(guān)系

例:施肥量與農(nóng)作物產(chǎn)量的關(guān)系

第5頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月1.是一一對(duì)應(yīng)的確定關(guān)系2.設(shè)有兩個(gè)變量x和y,變量

y完全依賴于x,當(dāng)變量x取某個(gè)數(shù)值時(shí),y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量3.各觀測(cè)點(diǎn)落在一條線上1.變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)2.一個(gè)變量的取值不能由另一個(gè)變量唯一確定,當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)3.各觀測(cè)點(diǎn)分布在直線周圍

xyxy第6頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月2.函數(shù)關(guān)系與相關(guān)關(guān)系的聯(lián)系與區(qū)別聯(lián)系區(qū)別函數(shù)關(guān)系有時(shí)也可能表現(xiàn)為相關(guān)關(guān)系相關(guān)關(guān)系通常要利用相應(yīng)的函數(shù)關(guān)系式來(lái)表現(xiàn)確定性依存關(guān)系與非確定依存關(guān)系函數(shù)關(guān)系往往因?yàn)橛杏^察或測(cè)量誤差以及各種隨機(jī)因素的干擾等原因,在實(shí)際中常常通過(guò)相關(guān)關(guān)系表現(xiàn)出來(lái);而在研究相關(guān)關(guān)系時(shí),其數(shù)量間的規(guī)律性了解得越深刻的時(shí)候,則相關(guān)關(guān)系越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來(lái)表現(xiàn)。第7頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月相關(guān)關(guān)系變量個(gè)數(shù)的多少相關(guān)的密切程度單相關(guān)多元相關(guān)相關(guān)的方向相關(guān)的形式線性相關(guān)非線性相關(guān)完全相關(guān)不完全相關(guān)不相關(guān)正相關(guān)負(fù)相關(guān)

二、相關(guān)關(guān)系的種類

第8頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月1.確定變量之間有無(wú)相關(guān)關(guān)系及其表現(xiàn)形式

三、相關(guān)分析的主要內(nèi)容

2.確定相關(guān)關(guān)系的密切程度3.檢驗(yàn)現(xiàn)象統(tǒng)計(jì)相關(guān)的顯著性4.廣義上講,相關(guān)分析還包括擬合回歸方程第9頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月第二節(jié)相關(guān)關(guān)系的測(cè)度

一、相關(guān)關(guān)系的一般測(cè)度二、相關(guān)系數(shù)的測(cè)定三、等級(jí)相關(guān)系數(shù)的測(cè)定第10頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月一、相關(guān)關(guān)系的一般判斷

1.定性分析——根據(jù)一定的經(jīng)濟(jì)理論和實(shí)踐經(jīng)驗(yàn)的總結(jié)

2.相關(guān)表和相關(guān)圖

防止虛假相關(guān)或偽相關(guān)!第11頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(1)簡(jiǎn)單相關(guān)表銷售額與流通費(fèi)用相關(guān)表

散點(diǎn)圖

第12頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(2)分組相關(guān)表適用場(chǎng)合:原始資料較多種類:?jiǎn)巫兞糠纸M表——只對(duì)自變量進(jìn)行分組,因變量不分組雙變量分組表——將自變量和因變量都進(jìn)行分組第13頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月某市家庭收入與消費(fèi)支出相關(guān)表

散點(diǎn)圖

單變量分組第14頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月家庭收入與消費(fèi)支出相關(guān)表

雙變量分組第15頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月二、相關(guān)系數(shù)的測(cè)定

相關(guān)系數(shù)是在直線相關(guān)條件下,表明兩個(gè)現(xiàn)象之間相關(guān)關(guān)系的方向和密切程度的綜合性指標(biāo)。一般用符號(hào)r表示。類型直線相關(guān)系數(shù)

等級(jí)相關(guān)系數(shù)

第16頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月1.直線相關(guān)系數(shù)的計(jì)算(1)積差法第17頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例銷售額流通費(fèi)用第18頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(2)簡(jiǎn)捷計(jì)算法當(dāng)平均數(shù)有很多小數(shù)位或除不盡時(shí),比較方便。第19頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月第20頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(3)分組資料的簡(jiǎn)捷計(jì)算法公式單變量分組雙變量分組第21頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(4)直線相關(guān)系數(shù)r的統(tǒng)計(jì)檢驗(yàn)

第22頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(5)直線相關(guān)系數(shù)r的取值含義

r界于-1與1之間

當(dāng)r<0,表示負(fù)相關(guān);r>0,表示正相關(guān)絕對(duì)值r越接近1,線性相關(guān)越密切絕對(duì)值r越接近0,相關(guān)程度越弱經(jīng)驗(yàn)判斷:相關(guān)系數(shù)在0.3以下為無(wú)相關(guān),0.3~0.5為低度相關(guān),0.5~0.8為中度相關(guān),0.8以上是高度相關(guān)。第23頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月三、等級(jí)相關(guān)系數(shù)的測(cè)定方法

1.等級(jí)相關(guān)的含義就是把有關(guān)聯(lián)的數(shù)量標(biāo)志或品質(zhì)標(biāo)志的具體表現(xiàn)按等級(jí)次序排列,形成X和Y這兩個(gè)序列,再測(cè)定這兩個(gè)序列之間的相關(guān)程度,得到的相關(guān)系數(shù)即為等級(jí)相關(guān)系數(shù)。常用的有斯皮爾曼相關(guān)系數(shù)、肯特爾相關(guān)系數(shù)等。定等級(jí)依此計(jì)算每對(duì)觀察值相應(yīng)的等級(jí)差D計(jì)算D2代入公式2.斯皮爾曼(Spearman)相關(guān)系數(shù)的計(jì)算步驟第24頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例:某公司6位員工的學(xué)歷及其年終能力考核結(jié)論如表7-6所示,求學(xué)歷與能力的相關(guān)系數(shù)。

第25頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月3.肯特爾相關(guān)系數(shù)n——樣本容量

,∑i——換位總次數(shù)

上圖的例子,有第26頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月相關(guān)分析只能說(shuō)明兩個(gè)變量之間的相互依存關(guān)系,并不一定代表因果關(guān)系。在計(jì)算相關(guān)系數(shù)之前,一般要先做定性分析,否則就有可能因?yàn)閿?shù)據(jù)的偶然巧合,得到較高的相關(guān)系數(shù),從而把虛假相關(guān)視為可信的相關(guān)。

說(shuō)明請(qǐng)您舉例!有人曾對(duì)教師薪金的提高和酒價(jià)的上漲作了相關(guān)分析,計(jì)算得到一個(gè)較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費(fèi)量增加,從而導(dǎo)致酒價(jià)上漲呢?第27頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月第三節(jié)回歸分析的基本問(wèn)題

一、回歸分析的概念

二、回歸分析的主要內(nèi)容三、回歸分析的特點(diǎn)四、回歸模型的種類

第28頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月一、回歸分析的概念

相關(guān)分析的不足:只能分析現(xiàn)象之間相關(guān)關(guān)系的方向和相關(guān)的密切程度,但不能判斷現(xiàn)象之間具體的數(shù)量變動(dòng)依存關(guān)系,也不能根據(jù)相關(guān)系數(shù)來(lái)估計(jì)或預(yù)測(cè)因變量y可能發(fā)生的數(shù)值。

回歸分析:就是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,確定因變量和自變量之間數(shù)量變動(dòng)關(guān)系的數(shù)學(xué)表達(dá)式,以便對(duì)因變量進(jìn)行估計(jì)或預(yù)測(cè)的統(tǒng)計(jì)分析方法。

第29頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月關(guān)系:相關(guān)分析的主要任務(wù)是研究變量間相關(guān)關(guān)系的表現(xiàn)形式和密切程度,而回歸分析是在相關(guān)分析的基礎(chǔ)上,進(jìn)一步研究現(xiàn)象之間的數(shù)量變化規(guī)律。

變量xi與隨機(jī)變量y的回歸模型一般表示為

“因變量”或“被解釋變量”(dependentvariable)“解釋變量”或“自變量”(independentvariables)隨機(jī)變量您知道“回歸”這個(gè)詞的本來(lái)含義嗎?第30頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月19世紀(jì)末,英國(guó)著名統(tǒng)計(jì)學(xué)家FrancisGalton研究孩子及他們父母的身高時(shí)發(fā)現(xiàn),身材高的父母,他們的孩子也高,但這些孩子平均起來(lái)并不像他們的父母那樣高;對(duì)于比較矮的父母,他們的孩子比較矮,但這些孩子的平均身高要比他們的父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢(shì)稱之為一種回歸效應(yīng)?;貧w這個(gè)術(shù)語(yǔ)便開始傳播開來(lái)?,F(xiàn)在的回歸分析已經(jīng)沒(méi)有原來(lái)的含義,但這種說(shuō)法一直沿襲下來(lái),重在表明這是研究數(shù)值變量之間關(guān)系的方法?!盎貧w”的本來(lái)含義第31頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月二、回歸分析的主要內(nèi)容

1.根據(jù)研究目的和現(xiàn)象之間的內(nèi)在聯(lián)系,確定自變量和因變量2.確定回歸分析模型的類型及數(shù)學(xué)表達(dá)式3.對(duì)回歸分析模型進(jìn)行評(píng)價(jià)與診斷4.根據(jù)給定的自變量數(shù)值確定因變量的數(shù)值第32頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月三、回歸分析的特點(diǎn)

1.回歸分析必須根據(jù)研究目的確定其中一個(gè)為因變量,其余為自變量而相關(guān)分析可以不用區(qū)分自變量和因變量2.相關(guān)分析中,兩個(gè)變量要求都是隨機(jī)的,而在回歸分析中,要求因變量是隨機(jī)的,而自變量的值則是給定的3.若變量之間互為因果,則可以求出兩個(gè)回歸方程,而兩個(gè)變量之間只能求出一個(gè)相關(guān)系數(shù)4.回歸方程有較強(qiáng)的應(yīng)用性第33頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月四、回歸模型的類型一個(gè)自變量?jī)蓚€(gè)及兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸第34頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月第四節(jié)回歸分析的模型

一、簡(jiǎn)單線性回歸模型二、多元線性回歸模型三、非線性回歸模型第35頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月一、簡(jiǎn)單線性回歸分析(一)簡(jiǎn)單線性回歸模型

理論模型估計(jì)模型回歸參數(shù)回歸參數(shù)的估計(jì)值

兩點(diǎn)說(shuō)明:1.a是直線的截距,b是直線的斜率

2.因變量y的估計(jì)值記為yc誤差項(xiàng)

第36頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(二)參數(shù)估計(jì)銷售額wwwwwwwwwwThequestionis:Whichstraightlinefitsbest?思路:離差的平方和最小最小二乘法第37頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月整理得:最后解得:設(shè)估計(jì)模型為第38頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月斜率b的含義為:自變量x每增加(或減少)一個(gè)單位,因變量y將平均增加(或減少)b個(gè)單位。

第39頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月例:某企業(yè)對(duì)車間9名學(xué)徒工進(jìn)行調(diào)查,得到學(xué)徒期限與每天產(chǎn)量情況如右表所示,要求建立以日產(chǎn)量為因變量的回歸方程。

所以回歸方程為yc=0.83+87.5x第40頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月斜率b的其他公式回歸系數(shù)b和相關(guān)系數(shù)r是有聯(lián)系的

第41頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(三)回歸估計(jì)標(biāo)準(zhǔn)誤在散點(diǎn)圖上可以擬合一條與各觀測(cè)點(diǎn)配合最佳的直線,但這些觀測(cè)點(diǎn)所代表的若干對(duì)觀測(cè)值,只是從總體中抽取的一個(gè)樣本。由觀測(cè)值求出的回歸直線稱為樣本回歸直線,它只是總體回歸直線的一個(gè)估計(jì)線,因此在做回歸分析時(shí)需要對(duì)擬合的回歸方程的代表性進(jìn)行衡量。估計(jì)誤差的大小能反映估計(jì)值的準(zhǔn)確性。但實(shí)際值y與估計(jì)值yc離差之和為0,因?yàn)檎x差與負(fù)離差抵消了。顯然離差的平方和可以衡量準(zhǔn)確性

第42頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月

n-2為自由度,這是因?yàn)榘醋钚《朔ㄇ蠼鈨蓚€(gè)參數(shù)a和b,受到兩個(gè)正規(guī)方程的約束,失去了兩個(gè)自由度。

離差平方和的平均數(shù)稱為剩余方差,即對(duì)剩余方差開方即得回歸估計(jì)標(biāo)準(zhǔn)誤,又稱估計(jì)標(biāo)準(zhǔn)誤差,即第43頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月1.變差的產(chǎn)生在直線回歸中,因變量y的大小取值是不同的,它圍繞平均值上下波動(dòng)。y取值的這種波動(dòng)稱為變差。變差來(lái)源于兩個(gè)方面:一是由于自變量x的取值不同造成的;二是除x以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響造成的。(四)回歸方程判定系數(shù)第44頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月兩邊平方得兩邊求和并化簡(jiǎn)得第45頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月2.變差的分解反映由于x與y之間的線性關(guān)系引起的y的取值變化,也稱可解釋的變差?;貧w變差(SSR)TSS=SSR+SSE總變差(TSS)剩余變差或殘差(SSE)第46頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月回歸變差占總變差的比例,稱為判定系數(shù)。*也稱可決系數(shù)或確定系數(shù)。是反映回歸直線的擬合優(yōu)度的統(tǒng)計(jì)指標(biāo)。R21,說(shuō)明回歸方程擬合得越好;R20,說(shuō)明回歸方程擬合越差。*R2的取值范圍在[0,1]之間,在一元線形模型中,判定系數(shù)就等于相關(guān)系數(shù)的平方,即R2=r23.判定系數(shù)第47頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月在大樣本條件下,

第48頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(五)回歸方程的統(tǒng)計(jì)檢驗(yàn)1、模型整體擬合效果的顯著性檢驗(yàn)

在給定顯著性水平之下,若:則拒絕原假設(shè),認(rèn)為回歸方程整體是顯著的。

第49頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月2、模型參數(shù)顯著性的檢驗(yàn)

模型參數(shù)顯著性檢驗(yàn)主要是判斷每一個(gè)自變量對(duì)于回歸模型是否必要的。

一元線性回歸模型截距和斜率的顯著性檢驗(yàn)方法第50頁(yè),課件共55頁(yè),創(chuàng)作于2023年2月(六)因變量的置信區(qū)間估計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論