若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有課件_第1頁(yè)
若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有課件_第2頁(yè)
若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有課件_第3頁(yè)
若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有課件_第4頁(yè)
若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第一節(jié) 變量間的相關(guān)關(guān)系一)相關(guān)關(guān)系的概念二)相關(guān)關(guān)系的種類新課導(dǎo)入 :某車(chē)間工人的基本情況:在這里,在這個(gè)車(chē)間的所有9名工人(總體)中,我們一方面可以了解職工工資總額、生活支出總數(shù)、平均工時(shí)數(shù)等,現(xiàn)在我們要分析的是工資、一周工時(shí)及生活支出和食用支出比例等方面的關(guān)系,有沒(méi)有什么關(guān)聯(lián)。 序號(hào)工資 一周工時(shí) 生活支出 食用支出比例 年齡 123456789850840830820810800795790785 494847464544434241 600590590587585570562560590 20%22%22.5%23%23.5%24%26%26.5%27% 3029452622485

2、22324 現(xiàn)象間的依存關(guān)系大致可以分成兩種類型:函數(shù)關(guān)系指現(xiàn)象間所具有的嚴(yán)格的確定性的依存關(guān)系相關(guān)關(guān)系指客觀現(xiàn)象間確實(shí)存在,但數(shù)量上不是嚴(yán)格對(duì)應(yīng)的依存關(guān)系一)相關(guān)分析的概念相關(guān)分析的概念1)函數(shù)關(guān)系1. 定義當(dāng)一個(gè)或幾個(gè)變量取一定的值時(shí),另一個(gè)變量有確定值與之相對(duì)應(yīng),我們稱這種關(guān)系為確定性的函數(shù)關(guān)系。2.函數(shù)關(guān)系特點(diǎn)(1)是一一對(duì)應(yīng)的確定關(guān)系;(2)設(shè)有兩個(gè)變量 x 和 y ,變量 y 隨變量 x 一起變化,并完全依賴于 x ,當(dāng)變量 x 取某個(gè)數(shù)值時(shí), y 依確定的關(guān)系取相應(yīng)的值,則稱 y 是 x 的函數(shù),記為 y = f (x),其中 x 稱為自變量,y 稱為因變量xy 3.函數(shù)關(guān)系的例

3、子某種商品的銷售額(y)與銷售量(x)之間的關(guān)系可表示為 y = p x (p 為單價(jià))圓的面積與半徑之間的關(guān)系可表示為S = r2 企業(yè)的原材料消耗額(y)與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價(jià)格(x3)之間的關(guān)系可表示為y = x1 x2 x3 2)相關(guān)關(guān)系 相關(guān)關(guān)系的例子商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系收入水平(y)與受教育程度(x)之間的關(guān)系父親身高(y)與子女身高(x)之間的關(guān)系1. 定義: 當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)

4、的另一變量的值雖然不確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。變量間的這種關(guān)系稱為具有不確定性的相關(guān)關(guān)系?,F(xiàn)象之間客觀存在的不嚴(yán)格、不確定的數(shù)量依存關(guān)系。相關(guān)關(guān)系的概念相關(guān)關(guān)系的特點(diǎn):變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量 x 取某個(gè)值時(shí),變量 y 的取值可能有幾個(gè)各觀測(cè)點(diǎn)分布不同. xy 相關(guān)關(guān)系和函數(shù)關(guān)系的區(qū)別和聯(lián)系 1.區(qū)別: (1)相關(guān)關(guān)系與函數(shù)關(guān)系的根本區(qū)別在于相依變量間的關(guān)系值是否確定. (2)相關(guān)關(guān)系的研究中各變量的地位是對(duì)等,函數(shù)關(guān)系時(shí)自變量和因變量必須是明確. (3)相關(guān)關(guān)系所涉及的變量均為隨機(jī)變量,而函數(shù)關(guān)系的自變量和因變量都是確定性變

5、量 2.聯(lián)系: (1)由于存在觀察或測(cè)量誤差,函數(shù)關(guān)系所具有的確定性對(duì)應(yīng)關(guān)系在實(shí)際中往往通過(guò)相關(guān)關(guān)系表現(xiàn)出來(lái). (2)為了更好地研究相關(guān)變量間的內(nèi)在聯(lián)系和數(shù)量變動(dòng)比例關(guān)系,往往借助函數(shù)關(guān)系表達(dá)式對(duì)相關(guān)關(guān)系作近似描述. (3)有時(shí),函數(shù)關(guān)系也可看作是相關(guān)關(guān)系的特例.即完全相關(guān).二)相關(guān)關(guān)系的種類相關(guān)關(guān)系按相關(guān)程度分類按相關(guān)方向分類按相關(guān)形式分類按所研究變量多少分類(1)正相關(guān):兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),即同方向變化。 例如收入與消費(fèi)的關(guān)系。(2)負(fù)相關(guān):當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢(shì)變化

6、,即反方向變化。 例如物價(jià)與消費(fèi)的關(guān)系。1)按相關(guān)的方向可劃分為:正相關(guān),負(fù)相關(guān)(1)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時(shí),稱之為線性相關(guān)。(2)當(dāng)兩種相關(guān)現(xiàn)象之間的關(guān)系不表現(xiàn)為直線關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。2)按相關(guān)的形式可劃分為: 線性相關(guān),非線性相關(guān)(1)當(dāng)只研究?jī)蓚€(gè)變量時(shí),它們之間的相關(guān),稱為單相關(guān)。(2)當(dāng)所研究的是一個(gè)變量對(duì)兩個(gè)或兩個(gè)以上其他變量的相關(guān)關(guān)系時(shí),稱為復(fù)相關(guān)。例如,某種商品的需求與其價(jià)格水平以及收入水平之間的相關(guān)關(guān)系便是一種復(fù)相關(guān)。(3)在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場(chǎng)合,假定其他變量不變,只考察其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相

7、關(guān)。例如,在假定人們的收入水平不變的條件下,某種商品的需求與其價(jià)格水平的關(guān)系就是一種偏相關(guān)。3)按相關(guān)關(guān)系涉及的變量多少可劃分為: 單相關(guān),復(fù)相關(guān)和偏相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān) 第二節(jié) 簡(jiǎn)單線性相關(guān)分析一)相關(guān)表與相關(guān)圖二)相關(guān)系數(shù)一)相關(guān)表與相關(guān)圖1)相關(guān)表 一種統(tǒng)計(jì)表,它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值按從小到大的順序排列,并將另一變量的值與之對(duì)應(yīng)排列形成的統(tǒng)計(jì)表。 將自變量x的數(shù)值按照從小到大的順序,并配合因變量y的數(shù)值一一對(duì)應(yīng)而平行排列的表。簡(jiǎn)單相關(guān)表分組相關(guān)表單變量分組相關(guān)表雙變量分組相關(guān)表 某市1996年 2

8、003年的工資性現(xiàn)金支出與城鎮(zhèn)儲(chǔ)蓄存款余額的資料,說(shuō)明簡(jiǎn)單相關(guān)表和相關(guān)圖的編制方法。 從表可看出,隨著工資性現(xiàn)金支出的增加,城鎮(zhèn)儲(chǔ)蓄存款余額有明顯的增長(zhǎng)趨勢(shì)。所以,資料表明(如圖)有明顯的直線相關(guān)趨勢(shì)。序號(hào)年份工資性現(xiàn)金支出(萬(wàn)元)x城鎮(zhèn)儲(chǔ)蓄存款余額(萬(wàn)元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510 (1)簡(jiǎn)單相關(guān)表單變量分組相關(guān)表自變量分組并計(jì)算次數(shù),而對(duì)應(yīng)的因變量不分組,只計(jì)算其平均值。單變量分組相關(guān)表的特點(diǎn):使冗長(zhǎng)的資料簡(jiǎn)化,能夠更清

9、晰地反映出兩變量之間相關(guān)關(guān)系。雙變量分組相關(guān)表:自變量和因變量都進(jìn)行分組而制成的相關(guān)表,這種表形似棋盤(pán),故又稱棋盤(pán)式相關(guān)表。(2)分組相關(guān)表分組相關(guān)表就是將原始數(shù)據(jù)進(jìn)行分組而編制的相關(guān)表。根據(jù)分組的情況不同,分組表有兩種: 1、單變量分組表:只根據(jù)一個(gè)變量進(jìn)行分組,另一個(gè)變量不進(jìn)行分組,只是計(jì)算出次數(shù)和平均數(shù),這種表叫做單變量分組表。 按體重分組(千克)人數(shù)(人)每組平均身高(厘米)62.5以上217060-62.5316757.5-602516355-57.53816252.5-558716050-52.512915847.5-509115545-47.52415445以下1151合計(jì)400

10、-企業(yè)按銷售額分組(萬(wàn)元)流通費(fèi)用率(%)4以下9.654 87.688 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.58 例: 簡(jiǎn)單分組相關(guān)表雙變量分組表概念:是對(duì)自變量和因變量都進(jìn)行分組而編制的相關(guān)表。例如: 400個(gè)大學(xué)生身高和體重相關(guān)表按體重分組(千克)按身高分組(厘米)150以下150154154158158-16216216616617017及以上合計(jì)62.5以上226062.53357.5604678255557.5161483852.555282028254875052.5332442451212947.5

11、50330282010914547.5212102445以下1合計(jì)59749412568254002)相關(guān)圖1、相關(guān)圖:利用直角坐標(biāo)系第一象限,把自變量置于橫軸上,因變量置于縱軸上,而將兩變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來(lái),用以表明相關(guān)點(diǎn)分布狀況的圖形。2、相關(guān)圖被形象地稱為相關(guān)散點(diǎn)圖3、因素標(biāo)志分了組,結(jié)果標(biāo)志表現(xiàn)為組平均數(shù),所繪制的相關(guān)圖就是一條折線,這種折線又叫相關(guān)曲線。散點(diǎn)圖 二)相關(guān)系數(shù) 1.相關(guān)系數(shù)的概念: 是指在線性相關(guān)的條件下,用以反映兩變量間線性相關(guān)程度和相關(guān)方向的統(tǒng)計(jì)分析指標(biāo).用r表示 2)相關(guān)系數(shù)的計(jì)算 樣本相關(guān)系數(shù)的計(jì)算公式或化簡(jiǎn)為關(guān)于相關(guān)系數(shù)的幾點(diǎn)說(shuō)明(1) r

12、的取值范圍是 -1,1(2)|r|=1,為完全相關(guān)r =1,為完全正相關(guān)r =-1,為完全負(fù)正相關(guān)(3) r = 0,不存在線性相關(guān)關(guān)系(4)-1r0,為負(fù)相關(guān);0r1,為正相關(guān)(5)|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)程度評(píng)價(jià)標(biāo)準(zhǔn)0| r |0.3為微弱相關(guān)0.3| r |0.5為低度相關(guān)0.5| r |0.8為顯著相關(guān)0.8| r |1為高度相關(guān)相關(guān)系數(shù)的計(jì)算計(jì)算公式:序號(hào)產(chǎn)品產(chǎn)量(千噸)生產(chǎn)費(fèi)用(萬(wàn)元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014.441210041855.01152

13、5.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合計(jì)36.4880207.541042144544.6相關(guān)系數(shù)計(jì)算表根據(jù)上表計(jì)算: 例:下表是有關(guān)15個(gè)地區(qū)某種食物需求量和地區(qū)人口增加量的資料。 第三節(jié) 一元線性回歸分析一)回歸分析的概念二)回歸分析的方法三)估計(jì)標(biāo)準(zhǔn)差四)可化為線性回歸的非線性回歸五)相關(guān)分析與回歸分析的特點(diǎn)一)回歸分析的概念 “回歸”這個(gè)統(tǒng)計(jì)學(xué)術(shù)語(yǔ),最早采用者是英國(guó)遺傳學(xué)家高爾登,他把這種統(tǒng)計(jì)分析方法應(yīng)用于研究生物學(xué)的遺傳問(wèn)題,指出生物后代有回復(fù)或回歸到其上代原有特性的傾向

14、。高爾登的學(xué)生皮爾遜繼續(xù)研究,把回歸與數(shù)學(xué)方法聯(lián)系起來(lái),把代表現(xiàn)象之間一般數(shù)量關(guān)系的直線或曲線稱為回歸直線或回歸曲線。從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來(lái)預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度回歸方程一詞是怎么來(lái)的二)回歸分析的方法回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1 個(gè)數(shù)字的因變量(響應(yīng)變量)被預(yù)測(cè)的變量1 個(gè)或多個(gè)數(shù)字的或分類的自變量 (解釋變量)用于預(yù)測(cè)的變量3.主要用于預(yù)測(cè)和估計(jì)當(dāng)只涉及一個(gè)自變量時(shí)

15、稱為一元回歸,若因變量 y 與自變量 x 之間為線性關(guān)系時(shí)稱為一元線性回歸對(duì)于具有線性關(guān)系的兩個(gè)變量,可以用一條線性方程來(lái)表示它們之間的關(guān)系描述因變量 y 如何依賴于自變量 x 和誤差項(xiàng) 的方程稱為回歸模型 對(duì)于只涉及一個(gè)自變量的簡(jiǎn)單線性回歸模型可表示為 y = a + x + e模型中,y 是 x 的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于 x 的變化而引起的 y 的變化誤差項(xiàng) 是隨機(jī)變量反映了除 x 和 y 之間的線性關(guān)系之外的隨機(jī)因素對(duì) y 的影響是不能由 x 和 y 之間的線性關(guān)系所解釋的變異性和 稱為模型的參數(shù)一元線性回歸模型對(duì)于經(jīng)判斷具有線性關(guān)系的兩個(gè)變量y與x,構(gòu)造一元線性回

16、歸模型為:假定E()=0,有總體一元線性回歸方程:建立回歸直線模型最小平方法基本數(shù)學(xué)要求:整理得到由兩個(gè)關(guān)于a、b的二元一次方程組成的方程組:進(jìn)一步整理,有:例:根據(jù)表人均銷售額與利潤(rùn)率資料,求其一元線性回歸方程。 人均銷售額與利潤(rùn)率資料 解:首先,根據(jù)表中合計(jì)欄的資料求出標(biāo)準(zhǔn)方程組中所需數(shù)據(jù);其次,將求出的數(shù)據(jù)代入公式,求出a、b的值:再次,將a、b的值代入回歸方程得:最后,由回歸方程可得相應(yīng)的回歸估計(jì)值, 如表所示。直線回歸方程的計(jì)算序號(hào)產(chǎn)品產(chǎn)量(千噸)生產(chǎn)費(fèi)用(萬(wàn)元)11.2621.44384474.422.0864.00739617233.1809.61640024843.811014

17、.441210041855.011525.001322557566.113237.2117424805.277.213551.841822597288.016064.00256001280合計(jì)36.4880207.541042144544.6已知n=13,可求代入公式有:回歸方程為 y =54.22286 + 0.52638 x 結(jié)果表明人均國(guó)民收入每增加1元,人均消費(fèi)金額平均增加0.53元。三)估計(jì)標(biāo)準(zhǔn)誤差(1)根據(jù)因變量實(shí)際值和估計(jì)值的離差計(jì)算計(jì)算公式 計(jì)算公式又可寫(xiě)為: 估計(jì)標(biāo)準(zhǔn)誤 根據(jù)回歸方程得出因變量的估計(jì)值。這個(gè)數(shù)值和實(shí)際數(shù)值之間就可能會(huì)產(chǎn)生誤差額,這就是估計(jì)值對(duì)于實(shí)際值的誤差,在

18、統(tǒng)計(jì)學(xué)當(dāng)中,我們用標(biāo)準(zhǔn)差指標(biāo)來(lái)反映誤差值在這一章中,我們也用這樣的計(jì)算原理來(lái)計(jì)算:(2)根據(jù)a、b兩個(gè)參數(shù)值計(jì)算估計(jì)標(biāo)準(zhǔn)誤差 第一種計(jì)算方法含義很明顯,計(jì)算公式和過(guò)程都表明了估計(jì)標(biāo)準(zhǔn)誤差是用平均誤差來(lái)表現(xiàn)的。但是計(jì)算比較麻煩,需要計(jì)算出所有的估計(jì)值。如果已經(jīng)有了直線回歸方程的參數(shù)值,可用一個(gè)比較簡(jiǎn)單的計(jì)算公式,即:1999年伊春林區(qū)16個(gè)林業(yè)局木材剩余物和年木材采伐量資料第二步:模型估計(jì)已知n=16,可求代入公式有:回歸方程為 結(jié)果表明伊春林區(qū)年采伐量每增加1萬(wàn)立方米,將平均產(chǎn)生0.404萬(wàn)立方米的剩余物。第三步:預(yù)測(cè)假設(shè)烏伊嶺林業(yè)局2004年計(jì)劃采伐木材20萬(wàn)m3,求木材剩余物的點(diǎn)預(yù)測(cè)值。估計(jì)標(biāo)準(zhǔn)差四)可化為線性回歸的非線性回歸當(dāng)因變量和自變量間的關(guān)系是指數(shù)曲線型時(shí),通常采用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論