相關(guān)和回歸分析(3)課件_第1頁(yè)
相關(guān)和回歸分析(3)課件_第2頁(yè)
相關(guān)和回歸分析(3)課件_第3頁(yè)
相關(guān)和回歸分析(3)課件_第4頁(yè)
相關(guān)和回歸分析(3)課件_第5頁(yè)
已閱讀5頁(yè),還剩47頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于相關(guān)與回歸分析 (3)第一張,PPT共五十二頁(yè),創(chuàng)作于2022年6月1 相關(guān)的意義和種類一、相關(guān)關(guān)系的概念函數(shù)關(guān)系:函數(shù)關(guān)系是一種嚴(yán)格的依存關(guān)系,這種關(guān)系可以用y = f(x)的方程來(lái)表現(xiàn)。 (一對(duì)一的關(guān)系)第二張,PPT共五十二頁(yè),創(chuàng)作于2022年6月設(shè)有兩個(gè)變量x和y ,變量y 隨變量x 一起變化,并完全依賴于x ,當(dāng)變量x 取某個(gè)數(shù)值時(shí),y 依確定的關(guān)系取相應(yīng)的值,則稱y 是 x 的函數(shù),記為y = f (x),其中x 稱為自變量,y 稱為因變量是一一對(duì)應(yīng)的確定關(guān)系各觀測(cè)點(diǎn)落在一條線上 xy第三張,PPT共五十二頁(yè),創(chuàng)作于2022年6月 函數(shù)關(guān)系的例子某種商品的銷售額(y)與銷售量(

2、x)之間的關(guān)系可表示為 y = p x (p 為單價(jià))圓的面積(S)與半徑之間的關(guān)系可表示為S = R2 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價(jià)格(x3)之間的關(guān)系可表示為y = x1 x2 x3 第四張,PPT共五十二頁(yè),創(chuàng)作于2022年6月變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量 x 取某個(gè)值時(shí),變量 y 的取值可能有幾個(gè)xy相關(guān)關(guān)系:相關(guān)關(guān)系是一種不完全確定的隨機(jī)關(guān)系。(一對(duì)多的關(guān)系)第五張,PPT共五十二頁(yè),創(chuàng)作于2022年6月 相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出

3、(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系二、相關(guān)的種類第六張,PPT共五十二頁(yè),創(chuàng)作于2022年6月按相關(guān)程度劃分:1、完全相關(guān):指某變量的變化,另一變量有一確定的值對(duì)它對(duì)應(yīng)。(函數(shù));2、不完全相關(guān):指兩個(gè)變量之間有數(shù)量聯(lián)系,但是數(shù)量是不確定的關(guān)系。3、零相關(guān):指兩個(gè)現(xiàn)象在數(shù)量上完全獨(dú)立,在一定的形式下,互不影響,互不相干的關(guān)系。(“零相關(guān)”不能稱為“不相關(guān)”,因?yàn)槭挛锏穆?lián)系是絕對(duì)的,而孤立是相對(duì)的,只有在某種形式下它才能互不影響互不相干。)第七張,PPT共五

4、十二頁(yè),創(chuàng)作于2022年6月按相關(guān)的方向劃分:1、正相關(guān):指兩個(gè)變量按照相同的變量變化?;蛘哒f(shuō)某個(gè)現(xiàn)象的數(shù)量增加,另一個(gè)現(xiàn)象的數(shù)量增加的現(xiàn)象。2、負(fù)相關(guān):指兩個(gè)變量按照相反的方向變化,或者說(shuō)某個(gè)現(xiàn)象的數(shù)量增加,另一個(gè)現(xiàn)象的數(shù)量減少的現(xiàn)象。第八張,PPT共五十二頁(yè),創(chuàng)作于2022年6月按相關(guān)形式劃分: 1、線性相關(guān):指兩個(gè)變量之間呈線性關(guān)系的相關(guān)。 2、非線性相關(guān):指變量之間的關(guān)系為非線性的相關(guān)關(guān)系。第九張,PPT共五十二頁(yè),創(chuàng)作于2022年6月按變量多少劃分:1、單相關(guān):指兩個(gè)因素之間的相關(guān)關(guān)系。2、復(fù)(多元)相關(guān):反映一個(gè)變量與其他多個(gè)因素之間的相關(guān)關(guān)系。3、偏相關(guān):指在某一現(xiàn)象和多種現(xiàn)象相

5、關(guān)的場(chǎng)合,假定其他變量不變,其中的兩個(gè)變量間的相關(guān)關(guān)系。第十張,PPT共五十二頁(yè),創(chuàng)作于2022年6月按相關(guān)性質(zhì)劃分:1、真實(shí)相關(guān):現(xiàn)象之間確實(shí)具有內(nèi)在聯(lián)系的相關(guān)。2、虛假相關(guān):現(xiàn)象之間只是表面存在,實(shí)質(zhì)上并沒(méi)有內(nèi)在聯(lián)系的相關(guān)。(精神病患者GDP人口總量)第十一張,PPT共五十二頁(yè),創(chuàng)作于2022年6月1、按相關(guān)的程度劃分完全相關(guān)不完全相關(guān)無(wú)相關(guān)2、按相關(guān)的方向劃分正相關(guān)負(fù)相關(guān)3、按相關(guān)的形式劃分線性相關(guān)非線性相關(guān)4、按影響因素的多少劃分單相關(guān)復(fù)相關(guān)第十二張,PPT共五十二頁(yè),創(chuàng)作于2022年6月三、相關(guān)分析的內(nèi)容:1、確定現(xiàn)象之間有無(wú)關(guān)系,以及相關(guān)的形態(tài)。(相關(guān)圖、表)2、確定相關(guān)關(guān)系的密切

6、程度。(相關(guān)系數(shù))3、選擇合適的數(shù)學(xué)模型。(建立回歸方程)4、測(cè)定變量估計(jì)值的可靠程度。(估計(jì)標(biāo)準(zhǔn)誤差)第十三張,PPT共五十二頁(yè),創(chuàng)作于2022年6月2 簡(jiǎn)單線性相關(guān)分析一、相 關(guān) 表主要有定性判斷、相關(guān)表、相關(guān)圖、相關(guān)系數(shù)。 它是把取得的數(shù)據(jù)以表的形式顯示出來(lái),據(jù)此觀察變量的走勢(shì)是否有關(guān),從而判斷有無(wú)相關(guān)關(guān)系的方法。(一)簡(jiǎn)單相關(guān)表 其中一個(gè)變量的值按順序排列,將兩個(gè)變量的值一一對(duì)應(yīng)地填列在同一張表格上,即形成簡(jiǎn)單相關(guān)表。適用于項(xiàng)目較少的情況。第十四張,PPT共五十二頁(yè),創(chuàng)作于2022年6月表1 家庭人均月收入與家庭人均月支出簡(jiǎn)單相關(guān)表 家庭人均月收入(元) 家庭人均月支出(元)51548

7、0515490519500530500530506530510570520570540600560680590第十五張,PPT共五十二頁(yè),創(chuàng)作于2022年6月(二)分組相關(guān)表 1、單變量分組相關(guān)表 它是一個(gè)變量分組,另一個(gè)變量不分組的相關(guān)表。 第十六張,PPT共五十二頁(yè),創(chuàng)作于2022年6月表2 家庭人均月收入與家庭人均月支出單變量分組相關(guān)表 家庭人均月收入(元) 戶數(shù)家庭人均月支出(元) 515248551915005303 5053 570253060015606801590第十七張,PPT共五十二頁(yè),創(chuàng)作于2022年6月2、雙變量分組相關(guān)表它是兩個(gè)變量都分組的相關(guān)表。第十八張,PPT共五

8、十二頁(yè),創(chuàng)作于2022年6月表3 家庭人均月收入與家庭人均月支出雙變量分組相關(guān)表家庭人均月支出(元) 家庭人均月收入(元) 合計(jì) 510570 570630 630690 475500 22500525 415525550 11550575 11575600 11合計(jì)63110第十九張,PPT共五十二頁(yè),創(chuàng)作于2022年6月二、相關(guān)圖可通過(guò)Excel繪制相關(guān)圖(散點(diǎn)圖)。三、相關(guān)系數(shù) (簡(jiǎn)單相關(guān)系數(shù) )相關(guān)系數(shù)可以測(cè)定變量之間相關(guān)的密切程度。第二十張,PPT共五十二頁(yè),創(chuàng)作于2022年6月(一)原始公式及判斷標(biāo)準(zhǔn) 1、原始公式 它是著名英國(guó)統(tǒng)計(jì)學(xué)家卡爾.皮爾遜設(shè)計(jì)的。 以上公式中,除去 、 ,

9、剩下的叫做x與y的協(xié)方差,用COV或 表示。 第二十一張,PPT共五十二頁(yè),創(chuàng)作于2022年6月所以 ,協(xié)方差的作用:顯示 x 與 y 是正相關(guān),還是負(fù)相關(guān)。相關(guān)系數(shù)的正負(fù)完全取決于協(xié)方差的正負(fù)。顯示 x 與 y 相關(guān)程度的大小。 協(xié)方差的絕對(duì)值小,表示相關(guān)程度低;協(xié)方差的絕對(duì)值大,表示相關(guān)程度高。第二十二張,PPT共五十二頁(yè),創(chuàng)作于2022年6月 但x與y的協(xié)方差是名數(shù),不同現(xiàn)象的變異情況不同,相關(guān)程度不能直接以協(xié)方差大小加以比較。需要以x與y的標(biāo)準(zhǔn)差加以標(biāo)準(zhǔn)化,使協(xié)方差化為無(wú)名數(shù),使相關(guān)系數(shù)可以比較不同現(xiàn)象相關(guān)程度的高低。而且以x與y的標(biāo)準(zhǔn)差加以標(biāo)準(zhǔn)化以后,使相關(guān)系數(shù)的絕對(duì)值不超過(guò)1。標(biāo)準(zhǔn)

10、差的作用第二十三張,PPT共五十二頁(yè),創(chuàng)作于2022年6月2、判斷標(biāo)準(zhǔn)(2)相關(guān)系數(shù)的取值范圍在-1至1 之間。 其值大小反映兩變量之間相關(guān)的密切程度,(1)相關(guān)系數(shù)有正負(fù)號(hào),分別表示正相關(guān)和負(fù)相關(guān)。(3)表明兩變量完全直線相關(guān);表明兩變量不存在直線相關(guān);3、習(xí)題:試證明完全正直線相關(guān)時(shí),r等于1;完全負(fù)直線相關(guān)時(shí),r等于-1。 第二十四張,PPT共五十二頁(yè),創(chuàng)作于2022年6月-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無(wú)線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加第二十五張,PPT共五十二頁(yè),創(chuàng)作于2022年6月(二)常用計(jì)算公式 由1、2、第二十六張,PPT共五十二頁(yè),創(chuàng)作于2022

11、年6月相關(guān)系數(shù)計(jì)算分析例題 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4 5 6 7 8生產(chǎn)費(fèi)用 月產(chǎn)量序 號(hào)1.444.009.6114.4425.0017.2151.8464.00207.54384473966400121001322517424182252560010421474.4172.0248.0418.0575.0805.2972.01280.04544.6例:7-2-1第二十七張,PPT共五十二頁(yè),創(chuàng)作于2022年6月根據(jù)計(jì)算結(jié)果可知:則相關(guān)系數(shù)為:說(shuō)明產(chǎn)量和生產(chǎn)費(fèi)用之

12、間存在高度正相關(guān)。第二十八張,PPT共五十二頁(yè),創(chuàng)作于2022年6月1、兩個(gè)變量都是連續(xù)性的;2、必須是成對(duì)數(shù)據(jù),且每對(duì)數(shù)據(jù)相互獨(dú)立;3、兩個(gè)變量的總體都接近正態(tài)分布;4、兩個(gè)變量的關(guān)系是線性的;(三)直線積差相關(guān)系數(shù)的應(yīng)用條件5、排除共變因素的影響。 6、只能描述兩變量之間線性關(guān)系的密切程度和方向,不能闡明二者的本質(zhì)聯(lián)系。7、一般地說(shuō),n小于30時(shí)計(jì)算出的r缺乏有效意義。第二十九張,PPT共五十二頁(yè),創(chuàng)作于2022年6月3 回 歸 分 析一、回歸分析的概念 回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間的數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,確立一個(gè)相應(yīng)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量來(lái)推測(cè)另一個(gè)未知

13、量,為估算預(yù)測(cè)提供一個(gè)重要的方法。第三十張,PPT共五十二頁(yè),創(chuàng)作于2022年6月相關(guān)與回歸分析區(qū)別聯(lián)系:相關(guān)分析:用一個(gè)指標(biāo)來(lái)表明現(xiàn)象間依存關(guān)系的密切程度。 回歸分析:根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個(gè)合適的數(shù)學(xué)模型,來(lái)近似地表達(dá)變量間的平均變化關(guān)系。第三十一張,PPT共五十二頁(yè),創(chuàng)作于2022年6月區(qū)別: (1)相關(guān)分析不說(shuō)明誰(shuí)是自變量,誰(shuí)是因變量,而回歸分析必須首先要確定誰(shuí)是自變量,誰(shuí)是因變量,不能顛倒。(2)相關(guān)分析中的每一個(gè)變量都是隨機(jī)的;回歸分析中自變量是一般變量,因變量是隨機(jī)變量。 聯(lián)系: (1)相關(guān)分析要依靠回歸分析來(lái)表現(xiàn)現(xiàn)象數(shù)量相關(guān)的具體形式;(2)回歸分析必須依靠相關(guān)關(guān)系來(lái)表

14、明變量之間的密切程度。 因此,相關(guān)分析與回歸分析被合稱為廣義的相關(guān)分析。第三十二張,PPT共五十二頁(yè),創(chuàng)作于2022年6月二、回 歸 的 種 類按自變量的個(gè)數(shù)分一元回歸多元回歸按回歸線的形態(tài)分線性回歸非線性回歸第三十三張,PPT共五十二頁(yè),創(chuàng)作于2022年6月回歸模型的類型一個(gè)自變量?jī)蓚€(gè)及兩個(gè)以上自變量回歸模型多元回歸一元回歸線性回歸非線性回歸線性回歸非線性回歸第三十四張,PPT共五十二頁(yè),創(chuàng)作于2022年6月三、簡(jiǎn)單線性回歸方程的求解1、方程式為:(一)方程式第三十五張,PPT共五十二頁(yè),創(chuàng)作于2022年6月2、回歸系數(shù)b的經(jīng)濟(jì)涵義:當(dāng)自變量變動(dòng)一個(gè)單位時(shí),因變量的平均變動(dòng)值。b0,x與y為

15、正相關(guān)b0,x與y為負(fù)相關(guān) 3、條件:所分析的兩個(gè)變量之間必須存在相關(guān)關(guān)系,且相關(guān)程度在顯著相關(guān)以上。第三十六張,PPT共五十二頁(yè),創(chuàng)作于2022年6月1、用最小平方法配合回歸直線的基本思想是:在所有的相關(guān)點(diǎn)中,通過(guò)數(shù)學(xué)方法配合一條較為理想的直線,這條直線必須滿足兩點(diǎn): 、原數(shù)列與趨勢(shì)線的離差平方和為最小值。即、原數(shù)列與趨勢(shì)線的離差之和為零。即:(三)a、b的最小二乘估計(jì) 第三十七張,PPT共五十二頁(yè),創(chuàng)作于2022年6月通過(guò)求a、b的一階偏導(dǎo)可得到求解a、b的聯(lián)立方程:解聯(lián)立方程得到:2、具體求解 第三十八張,PPT共五十二頁(yè),創(chuàng)作于2022年6月簡(jiǎn)單直線回歸方程建立的步驟為: 確定自變量x

16、和因變量y; 計(jì)算x2、xy、x、y、x2、xy; 代入公式,先求b,再求a。第三十九張,PPT共五十二頁(yè),創(chuàng)作于2022年6月 4544.6 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0104214 3844 7396 6400 12100 13225 17424 18225 25600207.54 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 880 36.4 62 86 80 110 115 132 135 160 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 1 2 3 4

17、5 6 7 8生產(chǎn)費(fèi)用 月產(chǎn)量序 號(hào)例7-3-1:根據(jù)例7-2-1資料配合生產(chǎn)費(fèi)用依產(chǎn)量變化的回歸方程:第四十張,PPT共五十二頁(yè),創(chuàng)作于2022年6月則回歸方程為:回歸系數(shù)b的涵義:月產(chǎn)量每增加1000噸,生產(chǎn)費(fèi)用平均增加12.9萬(wàn)元。計(jì)算得到:第四十一張,PPT共五十二頁(yè),創(chuàng)作于2022年6月 670 82 90 100 114 140 144耐用消費(fèi)品銷售額(萬(wàn)元) 2820 340 380 450 470 560 620人均年收入(元)合計(jì)200020012002200320042005時(shí)間要求:分析兩變量相關(guān)密切程度,若為顯著相關(guān)以上,則對(duì)兩變量進(jìn)行回歸分析。例7-3-2某地區(qū)人均年

18、收入與耐用消費(fèi)品銷售額資料如下:第四十二張,PPT共五十二頁(yè),創(chuàng)作于2022年6月答案:相關(guān)系數(shù) r = 0.98 b = 0.24 a = -1.13 yc = -1.13+0.24x回歸系數(shù)b的涵義:人均年收入每增加一元,耐用消費(fèi)品銷售額平均增加0.24萬(wàn)元。第四十三張,PPT共五十二頁(yè),創(chuàng)作于2022年6月四 回歸系數(shù)與相關(guān)系數(shù)的關(guān)系因?yàn)椋核裕旱谒氖膹垼琍PT共五十二頁(yè),創(chuàng)作于2022年6月4 估計(jì)標(biāo)準(zhǔn)誤差一、估計(jì)標(biāo)準(zhǔn)誤差的涵義二、估計(jì)標(biāo)準(zhǔn)誤差的測(cè)定它是用來(lái)說(shuō)明回歸直線代表性大小的指標(biāo),用 表示第四十五張,PPT共五十二頁(yè),創(chuàng)作于2022年6月例7-4-1:用兩種方法計(jì)算例7-3-1

19、中的估計(jì)標(biāo)準(zhǔn)誤差解:法一,根據(jù)公式 有y628680110115132135160yc66.877.191.3100.3115.8130.0144.2154.523.04 79.21 127.69 94.09 0.64 4 84.64 30.25 則有 = 第四十六張,PPT共五十二頁(yè),創(chuàng)作于2022年6月法二,根據(jù)公式有第四十七張,PPT共五十二頁(yè),創(chuàng)作于2022年6月三、相關(guān)系數(shù)與估計(jì)標(biāo)準(zhǔn)誤差的關(guān)系1、相關(guān)系數(shù)與估計(jì)標(biāo)準(zhǔn)誤差呈反向關(guān)系2、當(dāng)變量之間為完全直線相關(guān)時(shí),估計(jì)標(biāo)準(zhǔn)誤差為03、當(dāng)變量之間不存在直線相關(guān)時(shí),估計(jì)標(biāo)準(zhǔn)誤差等于y的標(biāo)準(zhǔn)差,即回歸直線和y數(shù)列的平均線重合第四十八張,PPT共五十二頁(yè),創(chuàng)作于2022年6月第七章 相關(guān)與回歸一、判 斷 對(duì) 錯(cuò)1、施肥量與收獲率是正相關(guān)關(guān)系。( )2、利用一個(gè)回歸方程,兩個(gè)變量可以互相推算。 ( )3、若直線回歸方程為 yc= 170 2.5X, 則變量X與Y

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論