![真實圖形課件_第1頁](http://file4.renrendoc.com/view/c9939c945ce7ec214de9d96e0f3984bf/c9939c945ce7ec214de9d96e0f3984bf1.gif)
![真實圖形課件_第2頁](http://file4.renrendoc.com/view/c9939c945ce7ec214de9d96e0f3984bf/c9939c945ce7ec214de9d96e0f3984bf2.gif)
![真實圖形課件_第3頁](http://file4.renrendoc.com/view/c9939c945ce7ec214de9d96e0f3984bf/c9939c945ce7ec214de9d96e0f3984bf3.gif)
![真實圖形課件_第4頁](http://file4.renrendoc.com/view/c9939c945ce7ec214de9d96e0f3984bf/c9939c945ce7ec214de9d96e0f3984bf4.gif)
![真實圖形課件_第5頁](http://file4.renrendoc.com/view/c9939c945ce7ec214de9d96e0f3984bf/c9939c945ce7ec214de9d96e0f3984bf5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)
7.1相關(guān)與回歸分析的基本概念7.2一元線性回歸分析7.3多元線性回歸分析7.4非線性回歸7.5相關(guān)分析云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院1學(xué)習(xí)重點1. 相關(guān)系數(shù)的分析方法2.一元線性回歸的基本原理和參數(shù)的最小二乘估計3.回歸直線的擬合優(yōu)度4.回歸方程的顯著性檢驗5.利用回歸方程進行估計和預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院學(xué)習(xí)重點1. 相關(guān)系數(shù)的分析方法云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院27.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個數(shù)值時,
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)3函數(shù)關(guān)系
(幾個例子)函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px(p為單價)圓的面積S與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價格x3之間的關(guān)系可表示為y=x1x2x3
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院函數(shù)關(guān)系
(幾個例子)函數(shù)關(guān)系的例子云南財經(jīng)大學(xué)統(tǒng)計信息4相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達2.一個變量的取值不能由另一個變量唯一確定3.當(dāng)變量
x取某個值時,變量y的取值可能有幾個4.各觀測點分布在直線周圍
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系5相關(guān)關(guān)系
(幾個例子)相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1、降雨量x2、溫度x3之間的關(guān)系商品的消費量y與居民收入x之間的關(guān)系商品銷售額y與廣告費支出x之間的關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系
(幾個例子)相關(guān)關(guān)系的例子云南財經(jīng)大學(xué)統(tǒng)計信息6相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:
完全相關(guān)、不完全相關(guān)和不相關(guān)按相關(guān)方向劃分:
正相關(guān)和負相關(guān)按相關(guān)形式劃分:
線性相關(guān)和非線性相關(guān)按變量多少劃分單相關(guān)、復(fù)相關(guān)和偏相關(guān)按相關(guān)性質(zhì)劃分真實相關(guān)和虛假相關(guān)
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院77.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元線性回歸模型7.2.2一元線性回歸模型的估計7.2.3一元線性回歸模型的檢驗7.2.4一元線性回歸模型的預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元8一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項
的方程稱為回歸模型一元線性回歸模型可表示為y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項
是隨機變量反映了除x和y之間的線性關(guān)系之外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院一元線性回歸模型描述因變量y如何依賴于自變量x和誤差9一元線性回歸模型
(基本假定)誤差項ε的期望值為0,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=0+
1x對于所有的x值,誤差項之間不存在序列相關(guān)關(guān)系,即
自變量是給定的變量,與隨機誤差項線性無關(guān)隨機誤差項服從正態(tài)分布,即
ε~N(0,σ2)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院一元線性回歸模型
(基本假定)誤差項ε的期望值為0,即E(10總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程稱為總體回歸函數(shù)總體回歸函數(shù)的數(shù)學(xué)形式如下E(y)=0+1x函數(shù)的圖示是一條直線,也稱為總體回歸直線0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程11樣本回歸函數(shù)(估計方程)
總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程3.一元線性回歸中估計的回歸方程為其中:是估計的回歸直線在y軸上的截距,是直線的斜率,它表示對于一個給定的x的值,是y的估計值,也表示x每變動一個單位時,y的平均變動值
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院樣本回歸函數(shù)(估計方程)
總體回歸參數(shù)和是未知的127.2.2一元線性回歸模型的估計使因變量的觀察值與估計值之間的離差平方和達到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.2一元線性回歸模型的估計使因變量的觀察值與估計值之間13最小二乘法
(
和的計算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院最小二乘法
(和的計算公式)根據(jù)最小二14估計方程的求法
(例題分析)【例7-1】估計食品支出的恩格爾函數(shù)回歸方程為:y=9.9872+0.1802
x回歸系數(shù)=0.1802表示,收入每增加1億元,食品支出平均增加0.1802億元
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院估計方程的求法
(例題分析)【例7-1】估計食品支出的恩格爾15估計標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實際觀察值與回歸估計值離差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況對誤差項的標(biāo)準(zhǔn)差的估計,是在排除了x對y的線性影響后,y隨機波動大小的一個估計量反映用估計的回歸方程預(yù)測y時預(yù)測誤差的大小
計算公式為注:例題的計算結(jié)果為1.8286云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院估計標(biāo)準(zhǔn)誤差
(standarderrorofesti167.2.3一元線性回歸模型的檢驗離差因變量
y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.3一元線性回歸模型的檢驗離差因變量y的取值是不同17離差的分解
(圖示)xyy{}}云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差的分解
(圖示)xyy{}}云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院18離差平方和的分解
(三個平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差平方和的分解
(三個平方和的關(guān)系)SST=SSR19離差平方和的分解
(三個平方和的意義)總平方和(SST)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差平方和的分解
(三個平方和的意義)總平方和(SST)云20可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合21可決系數(shù)r2
(例題分析)
【例7-2】計算估計食品支出的恩格爾函數(shù)回歸的可決系數(shù),并解釋其意義
可決系數(shù)的實際意義是:在食品支出取值的變差中,有88.63%可以由食品支出與家庭收入之間的線性關(guān)系來解釋,或者說,在食品支出取值的變動中,有88.63%是家庭收入所決定的??梢娛称分С雠c家庭收入之間有較強的線性關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院可決系數(shù)r2(例題分析)
【例7-2】計算估計食品支出的22
7.2.3一元線性回歸模型的檢驗檢驗x與y之間是否具有線性關(guān)系,或者說,檢驗自變量x對因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布在一元線性回歸中,等價于線性關(guān)系的顯著性檢驗云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.3一元線性回歸模型的檢驗檢驗x與y之間是否23回歸系數(shù)的檢驗
(樣本統(tǒng)計量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計量sy來代替得到的估計的標(biāo)準(zhǔn)差云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(樣本統(tǒng)計量的分布)是根據(jù)最小二24回歸系數(shù)的檢驗
(檢驗步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計算檢驗的統(tǒng)計量確定顯著性水平,并進行決策t>t,拒絕H0;t<t,不拒絕H0云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(檢驗步驟)提出假設(shè)確定顯著性水平,25回歸系數(shù)的檢驗
(例題分析)對例題的回歸系數(shù)進行顯著性檢驗(=0.05)提出假設(shè)H0:b1=0H1:b1
0計算檢驗的統(tǒng)計量
t=10.07>t=2.160,拒絕H0,表明食品支出與家庭收入之間有線性關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(例題分析)對例題的回歸系數(shù)進行顯著性檢26
7.2.4一元線性回歸模型的預(yù)測根據(jù)自變量x的取值估計或預(yù)測因變量y的取值估計或預(yù)測的類型點估計y的個別值的點估計(或預(yù)測)區(qū)間估計y的個別值的預(yù)測區(qū)間估計云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.4一元線性回歸模型的預(yù)測根據(jù)自變量x的取值估計27y的個別值的點預(yù)測利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的一個個別值的估計值,就是個別值的點估計例如,如果我們只是想知道家庭收入為200元的那些家庭的食品支出是多少,則屬于個別值的點估計。根據(jù)估計的回歸方程得云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院y的個別值的點預(yù)測利用估計的回歸方程,對于自變量x的28區(qū)間預(yù)測
點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)間估計對于自變量
x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計區(qū)間本課程討論的區(qū)間估計類型預(yù)測區(qū)間估計(predictionintervalestimate)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院區(qū)間預(yù)測點估計不能給出估計的精度,點估計值與實際值之間是有29預(yù)測區(qū)間估計利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的一個個別值的估計區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間(predictioninterval)
y0在1-置信水平下的預(yù)測區(qū)間為云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院預(yù)測區(qū)間估計利用估計的回歸方程,對于自變量x的一個給定值30影響區(qū)間寬度的因素置信水平(1-)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的xp與x的差異程度區(qū)間寬度隨xp與x的差異程度的增大而增大云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院影響區(qū)間寬度的因素置信水平(1-)云南財經(jīng)大學(xué)統(tǒng)計信31置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測下限置信下限云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測327.3多元線性回歸分析7.3.1多元線性回歸模型7.3.2多元線性回歸模型的估計7.3.3多元線性回歸模型的檢驗和預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3多元線性回歸分析7.3.1多元線性回歸模型云南337.3.1多元回歸模型
一個因變量與兩個及兩個以上自變量的回歸描述因變量y如何依賴于自變量x1,x2,…,xk
和誤差項
的方程,稱為多元回歸模型涉及p個自變量的多元回歸模型可表示為
b0
,b1,b2
,,bk是參數(shù)
是被稱為誤差項的隨機變量y是x1,,x2
,,xk
的線性函數(shù)加上誤差項
包含在y里面但不能被k個自變量的線性關(guān)系所解釋的變異性云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.1多元回歸模型
一個因變量與兩個及兩個以上自變量的34多元回歸模型
(基本假定)誤差項ε是一個期望值為0的隨機變量,即E()=0對于自變量x1,x2,…,xp的所有值,的方差2都相同誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,2),且相互獨立云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院多元回歸模型
(基本假定)誤差項ε是一個期望值為0的隨機變35多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計量估計回歸方程中的參數(shù)
時得到的方程由最小二乘法求得一般形式為是估計值是y的估計值云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計量367.3.2多元線性回歸模型的估計使因變量的觀察值與估計值之間的離差平方和達到最小來求得
。即求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.2多元線性回歸模型的估計使因變量的觀察值與估377.3.3多元線性回歸模型的檢驗和預(yù)測回歸方程的擬合優(yōu)度回歸平方和占總平方和的比例計算公式為3.因變量取值的變差中,能被估計的多元回歸方程所解釋的比例云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.3多元線性回歸模型的檢驗和預(yù)測回歸方程的擬合38修正多重可決系數(shù)
用樣本容量n和自變量的個數(shù)p去修正R2得到計算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院修正多重可決系數(shù)
用樣本容量n和自變量的個數(shù)p去修正R2得到39顯著性檢驗(回歸系數(shù)的檢驗)提出假設(shè)H0:bi=0(自變量xi
與
因變量y沒有線性關(guān)系)H1:bi
0(自變量xi
與
因變量y有線性關(guān)系)計算檢驗的統(tǒng)計量t確定顯著性水平,并進行決策t>t,拒絕H0;t<t,不拒絕H0云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院顯著性檢驗(回歸系數(shù)的檢驗)提出假設(shè)確定顯著性水平,40顯著性檢驗
(回歸方程的顯著性檢驗)提出假設(shè)H0:12p=0線性關(guān)系不顯著H1:1,2,p至少有一個不等于02.計算檢驗統(tǒng)計量F確定顯著性水平和分子自由度p、分母自由度n-p-1找出臨界值F
4.作出決策:若F>F
,拒絕H0云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院顯著性檢驗
(回歸方程的顯著性檢驗)提出假設(shè)2.計算417.4非線性回歸1. 因變量y與x之間不是線性關(guān)系2. 可通過變量代換轉(zhuǎn)換成線性關(guān)系用最小二乘法求出參數(shù)的估計值并非所有的非線性模型都可以化為線性模型云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.4非線性回歸1. 因變量y與x之間不是線性關(guān)系42雙曲線基本形式:線性化方法令:y'=1/y,x'=1/x,則有y'
=+x'云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院雙曲線基本形式:云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院43指數(shù)曲線基本形式:線性化方法兩端取對數(shù)得:lny
=ln+x令:y'=lny,則有y'
=ln+x云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院指數(shù)曲線基本形式:云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院44S型曲線基本形式:線性化方法令:y'=1/y,x'=e-x,則有y'
=+x云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院S型曲線基本形式:云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院457.5相關(guān)分析
相關(guān)系數(shù)(correlationcoefficient)
對變量之間關(guān)系密切程度的度量對兩個變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為r云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.5相關(guān)分析
相關(guān)系數(shù)(correlationcoef46相關(guān)系數(shù)
(計算公式)
樣本相關(guān)系數(shù)的計算公式或化簡為云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)系數(shù)
(計算公式)樣本相關(guān)系數(shù)的計算公式或化簡為云47相關(guān)系數(shù)
(取值及其意義)
r的取值范圍是[-1,1]
|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負正相關(guān)
r=0,不存在線性相關(guān)關(guān)系-1r<0,為負相關(guān)0<r1,為正相關(guān)
|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)系數(shù)
(取值及其意義)r的取值范圍是[-1,1]云48相關(guān)系數(shù)的顯著性檢驗
(r的抽樣分布)1. r的抽樣分布隨總體相關(guān)系數(shù)和樣本容量的大小而變化當(dāng)樣本數(shù)據(jù)來自正態(tài)總體時,隨著n的增大,r的抽樣分布趨于正態(tài)分布,尤其是在總體相關(guān)系數(shù)很小或接近0時,趨于正態(tài)分布的趨勢非常明顯。而當(dāng)遠離0時,除非n非常大,否則r的抽樣分布呈現(xiàn)一定的偏態(tài)。當(dāng)為較大的正值時,r呈現(xiàn)左偏分布;當(dāng)為較小的負值時,r呈現(xiàn)右偏分布。只有當(dāng)接近于0,而樣本容量n很大時,才能認為r是接近于正態(tài)分布的隨機變量云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)系數(shù)的顯著性檢驗
(r的抽樣分布)1. r的抽樣分49相關(guān)系數(shù)的顯著性檢驗
(檢驗的步驟)1. 檢驗兩個變量之間是否存在線性相關(guān)關(guān)系等價于對回歸系數(shù)b1的檢驗采用R.A.Fisher提出的t檢驗檢驗的步驟為提出假設(shè):H0:;H1:0計算檢驗的統(tǒng)計量:確定顯著性水平,并作出決策若t>t,拒絕H0若t<t,不能拒絕H0云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)系數(shù)的顯著性檢驗
(檢驗的步驟)1. 檢驗兩個變量之間是50EndofChapter7休息片刻!云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院EndofChapter7休息片刻!云南財經(jīng)大學(xué)統(tǒng)計信51第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)
7.1相關(guān)與回歸分析的基本概念7.2一元線性回歸分析7.3多元線性回歸分析7.4非線性回歸7.5相關(guān)分析云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院第8章相關(guān)和回歸分析學(xué)習(xí)目標(biāo)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院52學(xué)習(xí)重點1. 相關(guān)系數(shù)的分析方法2.一元線性回歸的基本原理和參數(shù)的最小二乘估計3.回歸直線的擬合優(yōu)度4.回歸方程的顯著性檢驗5.利用回歸方程進行估計和預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院學(xué)習(xí)重點1. 相關(guān)系數(shù)的分析方法云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院537.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系設(shè)有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x
,當(dāng)變量x取某個數(shù)值時,
y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.1相關(guān)與回歸分析的基本概念函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)54函數(shù)關(guān)系
(幾個例子)函數(shù)關(guān)系的例子某種商品的銷售額y與銷售量x之間的關(guān)系可表示為y=px(p為單價)圓的面積S與半徑之間的關(guān)系可表示為S=R2
企業(yè)的原材料消耗額y與產(chǎn)量x1、單位產(chǎn)量消耗x2、原材料價格x3之間的關(guān)系可表示為y=x1x2x3
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院函數(shù)關(guān)系
(幾個例子)函數(shù)關(guān)系的例子云南財經(jīng)大學(xué)統(tǒng)計信息55相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達2.一個變量的取值不能由另一個變量唯一確定3.當(dāng)變量
x取某個值時,變量y的取值可能有幾個4.各觀測點分布在直線周圍
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系
(correlation)變量間關(guān)系不能用函數(shù)關(guān)系56相關(guān)關(guān)系
(幾個例子)相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1、降雨量x2、溫度x3之間的關(guān)系商品的消費量y與居民收入x之間的關(guān)系商品銷售額y與廣告費支出x之間的關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系
(幾個例子)相關(guān)關(guān)系的例子云南財經(jīng)大學(xué)統(tǒng)計信息57相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:
完全相關(guān)、不完全相關(guān)和不相關(guān)按相關(guān)方向劃分:
正相關(guān)和負相關(guān)按相關(guān)形式劃分:
線性相關(guān)和非線性相關(guān)按變量多少劃分單相關(guān)、復(fù)相關(guān)和偏相關(guān)按相關(guān)性質(zhì)劃分真實相關(guān)和虛假相關(guān)
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院相關(guān)關(guān)系(類型)
按相關(guān)程度劃分:云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院587.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元線性回歸模型7.2.2一元線性回歸模型的估計7.2.3一元線性回歸模型的檢驗7.2.4一元線性回歸模型的預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2一元線性回歸7.2.1標(biāo)準(zhǔn)的一元59一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項
的方程稱為回歸模型一元線性回歸模型可表示為y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項線性部分反映了由于x的變化而引起的y的變化誤差項
是隨機變量反映了除x和y之間的線性關(guān)系之外的隨機因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性0和1稱為模型的參數(shù)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院一元線性回歸模型描述因變量y如何依賴于自變量x和誤差60一元線性回歸模型
(基本假定)誤差項ε的期望值為0,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=0+
1x對于所有的x值,誤差項之間不存在序列相關(guān)關(guān)系,即
自變量是給定的變量,與隨機誤差項線性無關(guān)隨機誤差項服從正態(tài)分布,即
ε~N(0,σ2)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院一元線性回歸模型
(基本假定)誤差項ε的期望值為0,即E(61總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程稱為總體回歸函數(shù)總體回歸函數(shù)的數(shù)學(xué)形式如下E(y)=0+1x函數(shù)的圖示是一條直線,也稱為總體回歸直線0是回歸直線在y軸上的截距,是當(dāng)x=0時y的期望值1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動一個單位時,y的平均變動值云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院總體回歸函數(shù)描述y的平均值或期望值如何依賴于x的方程62樣本回歸函數(shù)(估計方程)
總體回歸參數(shù)和
是未知的,必須利用樣本數(shù)據(jù)去估計用樣本統(tǒng)計量和代替回歸方程中的未知參數(shù)和,就得到了估計的回歸方程3.一元線性回歸中估計的回歸方程為其中:是估計的回歸直線在y軸上的截距,是直線的斜率,它表示對于一個給定的x的值,是y的估計值,也表示x每變動一個單位時,y的平均變動值
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院樣本回歸函數(shù)(估計方程)
總體回歸參數(shù)和是未知的637.2.2一元線性回歸模型的估計使因變量的觀察值與估計值之間的離差平方和達到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實際數(shù)據(jù)的誤差比其他任何直線都小云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.2一元線性回歸模型的估計使因變量的觀察值與估計值之間64最小二乘法
(
和的計算公式)
根據(jù)最小二乘法的要求,可得求解和的公式如下云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院最小二乘法
(和的計算公式)根據(jù)最小二65估計方程的求法
(例題分析)【例7-1】估計食品支出的恩格爾函數(shù)回歸方程為:y=9.9872+0.1802
x回歸系數(shù)=0.1802表示,收入每增加1億元,食品支出平均增加0.1802億元
云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院估計方程的求法
(例題分析)【例7-1】估計食品支出的恩格爾66估計標(biāo)準(zhǔn)誤差
(standarderrorofestimate)實際觀察值與回歸估計值離差平方和的均方根反映實際觀察值在回歸直線周圍的分散狀況對誤差項的標(biāo)準(zhǔn)差的估計,是在排除了x對y的線性影響后,y隨機波動大小的一個估計量反映用估計的回歸方程預(yù)測y時預(yù)測誤差的大小
計算公式為注:例題的計算結(jié)果為1.8286云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院估計標(biāo)準(zhǔn)誤差
(standarderrorofesti677.2.3一元線性回歸模型的檢驗離差因變量
y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.3一元線性回歸模型的檢驗離差因變量y的取值是不同68離差的分解
(圖示)xyy{}}云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差的分解
(圖示)xyy{}}云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院69離差平方和的分解
(三個平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差平方和的分解
(三個平方和的關(guān)系)SST=SSR70離差平方和的分解
(三個平方和的意義)總平方和(SST)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院離差平方和的分解
(三個平方和的意義)總平方和(SST)云71可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間
R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院可決系數(shù)r2回歸平方和占總離差平方和的比例反映回歸直線的擬合72可決系數(shù)r2
(例題分析)
【例7-2】計算估計食品支出的恩格爾函數(shù)回歸的可決系數(shù),并解釋其意義
可決系數(shù)的實際意義是:在食品支出取值的變差中,有88.63%可以由食品支出與家庭收入之間的線性關(guān)系來解釋,或者說,在食品支出取值的變動中,有88.63%是家庭收入所決定的??梢娛称分С雠c家庭收入之間有較強的線性關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院可決系數(shù)r2(例題分析)
【例7-2】計算估計食品支出的73
7.2.3一元線性回歸模型的檢驗檢驗x與y之間是否具有線性關(guān)系,或者說,檢驗自變量x對因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)
的抽樣分布在一元線性回歸中,等價于線性關(guān)系的顯著性檢驗云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.3一元線性回歸模型的檢驗檢驗x與y之間是否74回歸系數(shù)的檢驗
(樣本統(tǒng)計量的分布)
是根據(jù)最小二乘法求出的樣本統(tǒng)計量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于未知,需用其估計量sy來代替得到的估計的標(biāo)準(zhǔn)差云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(樣本統(tǒng)計量的分布)是根據(jù)最小二75回歸系數(shù)的檢驗
(檢驗步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1
0(有線性關(guān)系)計算檢驗的統(tǒng)計量確定顯著性水平,并進行決策t>t,拒絕H0;t<t,不拒絕H0云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(檢驗步驟)提出假設(shè)確定顯著性水平,76回歸系數(shù)的檢驗
(例題分析)對例題的回歸系數(shù)進行顯著性檢驗(=0.05)提出假設(shè)H0:b1=0H1:b1
0計算檢驗的統(tǒng)計量
t=10.07>t=2.160,拒絕H0,表明食品支出與家庭收入之間有線性關(guān)系云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院回歸系數(shù)的檢驗
(例題分析)對例題的回歸系數(shù)進行顯著性檢77
7.2.4一元線性回歸模型的預(yù)測根據(jù)自變量x的取值估計或預(yù)測因變量y的取值估計或預(yù)測的類型點估計y的個別值的點估計(或預(yù)測)區(qū)間估計y的個別值的預(yù)測區(qū)間估計云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.2.4一元線性回歸模型的預(yù)測根據(jù)自變量x的取值估計78y的個別值的點預(yù)測利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的一個個別值的估計值,就是個別值的點估計例如,如果我們只是想知道家庭收入為200元的那些家庭的食品支出是多少,則屬于個別值的點估計。根據(jù)估計的回歸方程得云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院y的個別值的點預(yù)測利用估計的回歸方程,對于自變量x的79區(qū)間預(yù)測
點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)間估計對于自變量
x的一個給定值x0,根據(jù)回歸方程得到因變量y的一個估計區(qū)間本課程討論的區(qū)間估計類型預(yù)測區(qū)間估計(predictionintervalestimate)云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院區(qū)間預(yù)測點估計不能給出估計的精度,點估計值與實際值之間是有80預(yù)測區(qū)間估計利用估計的回歸方程,對于自變量x的一個給定值x0
,求出因變量y的一個個別值的估計區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間(predictioninterval)
y0在1-置信水平下的預(yù)測區(qū)間為云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院預(yù)測區(qū)間估計利用估計的回歸方程,對于自變量x的一個給定值81影響區(qū)間寬度的因素置信水平(1-)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的xp與x的差異程度區(qū)間寬度隨xp與x的差異程度的增大而增大云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院影響區(qū)間寬度的因素置信水平(1-)云南財經(jīng)大學(xué)統(tǒng)計信82置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測下限置信下限云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院置信區(qū)間、預(yù)測區(qū)間、回歸方程xpyxx預(yù)測上限置信上限預(yù)測837.3多元線性回歸分析7.3.1多元線性回歸模型7.3.2多元線性回歸模型的估計7.3.3多元線性回歸模型的檢驗和預(yù)測云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3多元線性回歸分析7.3.1多元線性回歸模型云南847.3.1多元回歸模型
一個因變量與兩個及兩個以上自變量的回歸描述因變量y如何依賴于自變量x1,x2,…,xk
和誤差項
的方程,稱為多元回歸模型涉及p個自變量的多元回歸模型可表示為
b0
,b1,b2
,,bk是參數(shù)
是被稱為誤差項的隨機變量y是x1,,x2
,,xk
的線性函數(shù)加上誤差項
包含在y里面但不能被k個自變量的線性關(guān)系所解釋的變異性云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.1多元回歸模型
一個因變量與兩個及兩個以上自變量的85多元回歸模型
(基本假定)誤差項ε是一個期望值為0的隨機變量,即E()=0對于自變量x1,x2,…,xp的所有值,的方差2都相同誤差項ε是一個服從正態(tài)分布的隨機變量,即ε~N(0,2),且相互獨立云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院多元回歸模型
(基本假定)誤差項ε是一個期望值為0的隨機變86多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計量估計回歸方程中的參數(shù)
時得到的方程由最小二乘法求得一般形式為是估計值是y的估計值云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院多元樣本回歸函數(shù)(方程)
用樣本統(tǒng)計量877.3.2多元線性回歸模型的估計使因變量的觀察值與估計值之間的離差平方和達到最小來求得
。即求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.2多元線性回歸模型的估計使因變量的觀察值與估887.3.3多元線性回歸模型的檢驗和預(yù)測回歸方程的擬合優(yōu)度回歸平方和占總平方和的比例計算公式為3.因變量取值的變差中,能被估計的多元回歸方程所解釋的比例云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院7.3.3多元線性回歸模型的檢驗和預(yù)測回歸方程的擬合89修正多重可決系數(shù)
用樣本容量n和自變量的個數(shù)p去修正R2得到計算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2云南財經(jīng)大學(xué)統(tǒng)計信息學(xué)院修正多重可決系數(shù)
用樣本容量n和自變量的個數(shù)p去修正R2得到90顯著性檢驗(回歸系數(shù)的檢驗)提出假設(shè)H0:bi=0(自變量xi
與
因變量y沒有線性關(guān)系)H1:bi
0(自變量xi
與
因變量y有線性關(guān)系)計算檢驗的統(tǒng)計量t確定顯著性水平,并進行決策t>t,拒絕H0;t<t,不拒絕H0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024學(xué)年泰州市靖江八年級語文第一學(xué)期12月調(diào)研試卷附答案解析
- 2025年農(nóng)業(yè)物資供應(yīng)鏈優(yōu)化管理協(xié)議
- 2025年專業(yè)除鼠服務(wù)合同
- 2025年出租車經(jīng)營權(quán)承接策劃協(xié)議
- 2025年通信傳輸設(shè)備項目規(guī)劃申請報告模范
- 2025年給皂液機項目提案報告模范
- 2025年農(nóng)業(yè)資源共享與協(xié)同發(fā)展協(xié)議
- 2025年建筑工程中介服務(wù)合同模板
- 2025年農(nóng)產(chǎn)品銷售合作協(xié)議合同
- 2025年棉花加工成套設(shè)備項目立項申請報告模稿
- GB/T 9386-2008計算機軟件測試文檔編制規(guī)范
- 2023年青島遠洋船員職業(yè)學(xué)院高職單招(數(shù)學(xué))試題庫含答案解析
- 2023年衛(wèi)生院崗位大練兵大比武競賽活動實施方案
- 2023年浙江省初中學(xué)生化學(xué)競賽初賽試卷
- 遼海版小學(xué)五年級美術(shù)下冊全套課件
- 專題7閱讀理解之文化藝術(shù)類-備戰(zhàn)205高考英語6年真題分項版精解精析原卷
- 真空泵日常操作標(biāo)準(zhǔn)作業(yè)指導(dǎo)書
- 2022年廣東省10月自考藝術(shù)概論00504試題及答案
- 中國石油大學(xué)(華東)-朱超-答辯通用PPT模板
- 隧道二襯承包合同參考
- 空氣能熱泵系統(tǒng)
評論
0/150
提交評論