統(tǒng)計學課件 第九章 相關分析與回歸分析_第1頁
統(tǒng)計學課件 第九章 相關分析與回歸分析_第2頁
統(tǒng)計學課件 第九章 相關分析與回歸分析_第3頁
統(tǒng)計學課件 第九章 相關分析與回歸分析_第4頁
統(tǒng)計學課件 第九章 相關分析與回歸分析_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第九章相關分析與回歸分析PowerPoint統(tǒng)計學

第一節(jié)相關關系一、相關關系的概念相關關系又稱非一一對應的關系,是指現(xiàn)象之間確實存在的、在數(shù)量上不確定的相互依存關系。如學生的學習成績與學習時間之間的關系。函數(shù)關系又稱一一對應的關系,是指現(xiàn)象之間確實存在的、在數(shù)量上確定的相互依存關系。如圓的面積與半徑之間的關系。變量間的關系

(函數(shù)關系)是一一對應的確定關系設有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當變量x取某個數(shù)值時,

y依確定的關系取相應的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上

xy變量間的關系

(函數(shù)關系)函數(shù)關系的例子某種商品的銷售額(y)與銷售量(x)之間的關系可表示為

y=p

x(p為單價)圓的面積(S)與半徑之間的關系可表示為S=R2

企業(yè)的原材料消耗額(y)與產(chǎn)量(x1)

、單位產(chǎn)量消耗(x2)

、原材料價格(x3)之間的關系可表示為y=x1x2x3

變量間的關系

(相關關系)變量間關系不能用函數(shù)關系精確表達一個變量的取值不能由另一個變量唯一確定當變量

x取某個值時,變量y的取值可能有幾個各觀測點分布在直線周圍

xy變量間的關系

(相關關系)相關關系的例子商品的消費量(y)與居民收入(x)之間的關系商品銷售額(y)與廣告費支出(x)之間的關系糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關系收入水平(y)與受教育程度(x)之間的關系父親身高(y)與子女身高(x)之間的關系二、相關關系的分類

1、按相關變量的多少不同,分為單相關和復相關。

2、按相關的方向不同,分為正相關和負相關。

3、按相關的形式不同,分為線性相關和非線性相關(曲線相關。具體包括指數(shù)曲線相關、對數(shù)曲線相關、冪函數(shù)曲線相關、雙曲線相關、拋物線相關、修正指數(shù)曲線相關、邏輯曲線相關和戈伯茲曲線相關)。

4、按相關的程度不同,分為完全相關、完全不相關和不完全相關(進一步又可分為高度相關、顯著相關、低度相關和微弱相關)相關關系分類圖

相關關系線性相關曲線相關

正相關負相關

冪指對雙拋修戈邏完高顯低微不函數(shù)數(shù)曲物正伯輯全度著度弱相數(shù)曲曲線線指茲曲相相相相相關曲線線相相數(shù)曲線關關關關關線相相關關曲線相相關關線相關關相關關圖10-1三、相關分析的內(nèi)容(一)、判斷現(xiàn)象之間有無相關關系。(二)、分析現(xiàn)象之間相關關系的方向。(三)、分析現(xiàn)象之間相關關系的形式。(四)、分析現(xiàn)象之間相關關系的密切程度。四、相關分析的步驟

定性判斷

編制相關表

繪制相關圖

計算相關系數(shù)圖10-2(二)、相關表

1、相關表的含義相關表是指表明現(xiàn)象之間相關關系的表格。

2、相關表的種類(1)、簡單相關表(表10-1)。(2)、單變量分組相關表(表10-2)。(3)、雙變量分組相關表(表10-3)。

3、相關表的作用

——表明想象之間相關關系的方向。例10-1某單位十名員工的智商值與勞動生產(chǎn)率相關關系表

表10-1智商值x809798103110120121122126130勞動生產(chǎn)率f2、73、22、93、05、26、04、24、85、26、3例10-2

某紡織廠118名工人看管機器數(shù)與勞動生產(chǎn)率相關關系表

表10-2按看管機器數(shù)分組(臺)工人人數(shù)(人)勞動生產(chǎn)率(米/小時)5—710148—9141710—11212212—13302513—15333216—17323718—192142∑118—例10-3某公司200名職工的工齡和時工資等級相關關系表

表10-3按工齡分組(年)按時工資級別分組(元)合計1231—56—1011—1516—2021及以上2040241600102426000128202050605020∑1006040200(三)、相關關系的圖示不相關負線性相關正線性相關非線性相關完全負線性相關完全正線性相關(四)、相關系數(shù)

1、相關系數(shù)的概念相關系數(shù)是指在線性相關條件下,表明兩個變量線性相關方向和相關程度的統(tǒng)計分析指標。一般用符號r表示。

2、相關系數(shù)的計算公式從這一公式可以看出,相關系數(shù)由三部分組成

(1)、協(xié)方差標準差σx和σy的作用:1、x、y協(xié)方差是名數(shù),標準化后成為無名數(shù),可以作為不同現(xiàn)象相關程度的比較。2、x、y協(xié)方差的數(shù)值可以無限增多或減少,不便說明問題,將它標準化后,使相關系數(shù)絕對數(shù)不超過1,即

|r|≤1相關系數(shù)的計算公式3、相關系數(shù)的取值范圍

-1≤r≤+1r>0,正線性相關;r<0,負線性相關;r=0,不存在線性相關(但可能存在曲線相關)。

|r|越接近于0,X與Y的線性相關程度越低;|r|越接近于1,X與Y的線性相關程度越高(具體見表10-4)。4、相關系數(shù)的直觀意義D、r=0F、-1<r<0E、0<r<1C、r=0B、r=-1A、r=1圖a、b、c、d是四種極端情況。圖a、b即當x與y有精確的線性關系時,r=1或r=-1。

r=1表示x與y之間完全正相關,所有的對應點都在一條直線上。

r=-1表示x與y之間完全負相關,所有的對應點也都在一條直線上。這實際上就是一種線性函數(shù)關系,它并不是統(tǒng)計學中研究的主要內(nèi)容。圖c這種極端情況,說明所有的觀察值分布雜亂無章,變量x與y之間沒有相關關系,即r=0。在實際中,r=0的情況很少,往往我們拿來毫不相干的兩個變量序列計算相關系數(shù),其絕對值都會大于0。圖d這種情況,表明x與y有非線性關系。所以,這里相關系數(shù)r=0只能說明x與y之間無線性相關關系,并不能說明x與y無任何關系。統(tǒng)計學主要研究線性相關關系。圖e、f表示變量x與y之間有線性統(tǒng)計關系,0<|r|<1,統(tǒng)計學主要研究這種線性統(tǒng)計關系。相關關系的測度

(相關系數(shù)取值及其意義)

r

的取值范圍是[-1,1]|r|=1,為完全相關r=1,為完全正相關r=-1,為完全負正相關

r=0,不存在線性相關關系相關-1r<0,為負相關0<r1,為正相關|r|越趨于1表示關系越密切;|r|越趨于0表示關系越不密切5、相關系數(shù)與相關等級的對應關系表

表10-4相關系數(shù)相關等級|r|=10.8≤|r|<10.5≤|r|<0.80.3≤|r|<0.50<|r|<0.3r=0完全線性相關高度線性相關顯著線性相關低度線性相關微弱線性相關不存在線性相關例10-4表10-5職工編號智商值X勞動生產(chǎn)率(件/小時)Y11105.20.490.64-0.5621206.086.492.5614.8831306.3372.493.6136.6741265.7234.091.6919.8951224.8127.690.164.5261214.2106.090.04-2.0671033.059.291.9610.788982.9161.292.2519.059802.7942.492.8952.1910973.2187.691.4416.44∑110744.02278.117.24171.80例10-1某單位十名員工的智商值與勞動生產(chǎn)率相關關系表

表10-1職工編號智商值X勞動生產(chǎn)率(件/小時)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6第三節(jié)回歸分析一、回歸分析的概念回歸分析是指在相關分析的基礎上,將變量之間的相關關系用一定的數(shù)學關系式表達出來,并據(jù)此由自變量(因變量)的給定值去估計因變量(自變量)的值。二、回歸分析的實質(zhì)回歸分析的實質(zhì)是將變量之間不確定的數(shù)量關系轉(zhuǎn)化為確定的數(shù)量關系,即將變量之間的相關關系轉(zhuǎn)化為函數(shù)關系。三、回歸模型的種類按自變量的多少分為一元回歸模型多元回歸模型

按是否線性分為線性回歸模型非線性回歸模型按是否帶虛擬變量普通回歸模型帶虛擬變量回歸模型回歸模型的類型一個自變量兩個及兩個以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸四、回歸分析與相關分析的關系

(一)區(qū)別

1、相關分析時,變量之間是對等的關系;回歸分析時,變量之間是不對等的關系。

2、表明兩個變量之間相關關系的相關系數(shù)只有一個;表明兩個變量之間回歸關系的回歸模型有兩個。

3、相關分析時,兩個變量都是隨機性變量;回歸分析時,只有因變量是隨機性變量,而自變量則是確定性變量。(二)聯(lián)系

1、相關分析是回歸分析的基礎和前提。

2、回歸分析是相關分析的繼續(xù)和深入。五、回歸分析的步驟

定性判斷

擬合回歸模型

檢驗回歸模型

進行回歸估計圖10-4(一)、定性判斷

1、判斷有無必要進行回歸分析。若|r|≥0.5,則進行回歸分析;若|r|<0.5,則不必進行回歸分析。

2、確定誰是自變量,誰是因變量。(二)、擬合一元線性回歸模型1、回歸模型(1)、回答“變量之間是什么樣的關系?”(2)、方程中運用1個數(shù)字的因變量(響應變量)被預測的變量1個或多個數(shù)字的或分類的自變量(解釋變量)用于預測的變量(3)、 主要用于預測和估計2、回歸模型的一般形式3、解這個方程的a、b參數(shù)的方法與基本思路.(1)、方法:最小平方法(2)、思路:是對原數(shù)列(Y)配合一條趨勢線(?)實際數(shù)列是波動的,我們想在實際時間數(shù)列中間作一條非常平滑的趨勢線來描述它,然后利用它進行預測。

對所配合的趨勢線有兩點基本要求:

1、原數(shù)列與趨勢線的離差平方之和為最小值。

Σ(Y-?)2=最小值

2、原數(shù)列與趨勢線的離差總和為0。

Σ(Y-?)=0用這種方法既可配合直線,也可配合曲線.具體怎樣配應根據(jù)實際數(shù)列確定.一元線性模型法

(a和b的最小二乘估計)1、原數(shù)列為直線。即Y=a+bx+e2、配合直線方程。即?=a+bx3、根據(jù)對趨勢線的兩點要求,求出a、b兩個參數(shù),這條趨勢線就確定了。為了使Σ(Y-?)2=最小值則令Q=Σ(Y-?)2=Σ(Y-a-bx)2分別對a、b求偏導數(shù),并令其為0,則Σ(Y-?)2=最小值θQ/θa=Σ(Y-?)2=Σ(Y-a-bx)2=-2Σ(Y-a-bx)θQ/θb=Σ(Y-?)2=Σ(Y-a-bx)2=-2Σ(Y-a-bx)x例10-1某單位十名員工的智商值與勞動生產(chǎn)率相關關系表

表10-1職工編號智商值X勞動生產(chǎn)率(件/小時)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6例10-5擬合某單位10名員工智商值與時勞動生產(chǎn)率的一元線性回歸模型。4、關于b的兩點說明(1)、b稱為回歸系數(shù),表示自變量X每變動一個單位,因變量Y平均變動b個單位。如上例表示智力值每增加一個單位,時勞動生產(chǎn)率將增加0.0754件。(2)、回歸系數(shù)b與相關系數(shù)r的關系可表示為:(三)、檢驗回歸模型

1、估計標準誤差的概念估計標準誤差又稱估計標準誤,是指因變量的實際觀察值Y對其理論估計值的標準差。即因變量的實際觀察值Y與其理論估計值離差平方的算術(shù)平均數(shù)的平方根。一般用符號表示。

2、估計標準誤差的作用

——說明回歸模型代表性的大小。標準差以平均數(shù)為中心計算,說明平均數(shù)代表性的大小;估計標準誤差以回歸模型為中心計算,說明回歸模型代表性的大小。離差平方和的分解

(圖示)xyy{}}離差分解圖離差平方和的分解

(三個平方和的關系)1、從上圖看有(總變差平方和)=(回歸平方和)+

(殘差平方和)

Lyy

=Q2+Q1。離差平方和的分解

(三個平方和的意義)總平方和(Lyy)反映因變量的n個觀察值與其均值的總離差回歸平方和(Q2)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(Q1)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和可決系數(shù)

(判定系數(shù)r2

)回歸平方和占總離差平方和的比例取值范圍在[0,1]之間反映回歸直線的擬合程度

R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差判定系數(shù)等于相關系數(shù)的平方,即r2=(R)2職工編號智商值X勞動生產(chǎn)率(件/小時)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.227,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.44.34725.10125.85525.55365.25205.17663.81943.44242.08523.36700.72730.80780.19780.02140.20430.95370.67140.29420.37800.0279∑110744.0210.845042.6—4.2838表10-6

例10-6

計算某單位10名員工時勞動生產(chǎn)率的估計標準誤差。例10-1某單位十名員工的智商值與勞動生產(chǎn)率相關關系表

表10-1職工編號智商值X勞動生產(chǎn)率(件/小時)YXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.21210014400169001587614884146411060996046400940927,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.4∑110744.0124823210.845042.6例10-5擬合某單位10名員工智商值與時勞動生產(chǎn)率的一元線性回歸模型。

例10-6

計算某單位10名員工時勞動生產(chǎn)率的估計標準誤差。4、關于Sy的幾點說明:Sy是用來說明回歸方程代表性大小的分析指標,其計算原理與標準差基本相同,Sy說明理論值(回歸線)的代表性,若Sy小,表明回歸方程準確性高;反之,估計不夠正確,代表性小。第一、當Sy很大,大到等于標準差時,即Sy=бy時,說明第二、當Sy=0時,說明,各實際點都落在回歸直線上,表明r=±1,完全相關。第三、當≠

y時,

Sy的取值在0~~бy之間;

r的取值在(+1)~~(-1)之間。Sy與r有如下關系:(四)、回歸估計

1、由自變量X的值估計因變量Y的值。

2、由因變量Y的值估計自變量X的值。

例10-7

資料見表10-1。

要求:(1)估計智商值為125時的時勞動生產(chǎn)率;(2)估計時勞動生產(chǎn)率為5時的智商值。(1)X=125時,時勞動生產(chǎn)率的估計值:職工編號智商值x勞動生產(chǎn)率(件/小時)yXY123456789101101201301261221211039880975.26.06.35.74.84.23.02.92.73.227,0436.0039.6932.4923.0417.649.008.417.2910.24572.0720.0819.0718.2585.6508.2309.0284.2216.0310.44.34725.10125.85525.55365.25205.17663.81943.44242.08523.36700.72730.80780.19780.02140.20430.95370.67140.29420.37800.0279∑110744.0210.845042.6—4.2838表10-6{(2)Y=5時,智商值的估計值:六、應用相關分析和回歸分析應注意的問題(一)、在定性分析的基礎上進行定量分析。(二)、只有當|r|≥0.5時才能進行回歸分析。(三)、利用回歸模型進行回歸估計時,只能進行內(nèi)插估計,不能進行外推預測。(四)、一種回歸模型只能做一種估計。(五)、在進行多元回歸分析時,應注意避免出現(xiàn)多重共線性問題。(六)、應考慮社會經(jīng)濟現(xiàn)象的復雜性。(七)、注意具體問題具體分析。七、相關與回歸分析的步驟(一)、定性判定,畫散點圖(二)、列出計算表格(三)、計算相關系數(shù)r(四)、計算a、b參數(shù),擬合一元回歸方程(五)、計算估計標準誤差Sy,(六)、進行預測某市十家超市每人月平均銷售額和利潤率資料如下:要求:(1)畫出人均銷售額與利潤率的相關散點圖;(2)計算的人均銷售額與利潤率的線性相關系數(shù);(3)擬合人均銷售額與利潤率之間的一元線性回歸模型,并指出回歸系數(shù)的經(jīng)濟含義;(4)計算的人均銷售額估計標準誤差;(5)估計為人均銷售額1萬元時的存款額;(6)估計利潤率為15%時的銷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論