電子教案-統(tǒng)計(jì)學(xué)原理(第二版):7章_第1頁
電子教案-統(tǒng)計(jì)學(xué)原理(第二版):7章_第2頁
電子教案-統(tǒng)計(jì)學(xué)原理(第二版):7章_第3頁
電子教案-統(tǒng)計(jì)學(xué)原理(第二版):7章_第4頁
電子教案-統(tǒng)計(jì)學(xué)原理(第二版):7章_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE137第七章統(tǒng)計(jì)分析——相關(guān)和回歸一、教學(xué)目的1.掌握相關(guān)分析和回歸分析的方法和步驟。2.掌握相關(guān)系數(shù)和回歸參數(shù)的計(jì)算。3.理解相關(guān)關(guān)系的意義。二、教學(xué)重點(diǎn)相關(guān)分析和回歸分析的方法、步驟;相關(guān)系數(shù)和回歸參數(shù)的計(jì)算。三、教學(xué)難點(diǎn)標(biāo)準(zhǔn)誤差的估計(jì)四、教學(xué)時(shí)數(shù)建議6課時(shí),其中:課堂講授5學(xué)時(shí),習(xí)題課1學(xué)時(shí)。教學(xué)內(nèi)容參考第一節(jié)相關(guān)分析的意義和任務(wù)一、相關(guān)關(guān)系的概念客觀現(xiàn)象總是普遍聯(lián)系、相互依存、相互制約的,當(dāng)我們用變量來反映這些現(xiàn)象的特征時(shí),便表現(xiàn)為變量之間的依存關(guān)系。變量之間就其關(guān)系的變化來說可分為函數(shù)關(guān)系和相關(guān)關(guān)系。(一)函數(shù)關(guān)系函數(shù)關(guān)系是指變量之間存在著嚴(yán)格確定的依存關(guān)系,在這種關(guān)系中,當(dāng)一個(gè)或幾個(gè)變量取一定量的值時(shí),另一變量有確定值與之相對應(yīng),并且這種關(guān)系可以用一個(gè)數(shù)學(xué)表達(dá)式反映出來。例如:某種產(chǎn)品的總成本S與該產(chǎn)品的產(chǎn)量Q以及該產(chǎn)品的單位成本P之間的關(guān)系可用S=PQ表達(dá),這就是一種函數(shù)關(guān)系。通常把作為影響因素的變量稱為自變量,把發(fā)生相應(yīng)變化的變量稱為因變量。在本例中,S是因變量,P與Q則是自變量。(二)相關(guān)關(guān)系相關(guān)關(guān)系是指變量之間存在一定的相依關(guān)系,但又不是確定的和嚴(yán)格依存的。這類關(guān)系中,當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對應(yīng)的變量就會(huì)有若干個(gè)數(shù)值與之相對應(yīng),從而表現(xiàn)出一定的波動(dòng)性。例如商品流轉(zhuǎn)規(guī)模與流通費(fèi)用的關(guān)系,家庭收入與消費(fèi)支出的關(guān)系,工業(yè)勞動(dòng)生產(chǎn)率與產(chǎn)品成本的關(guān)系等都屬于相關(guān)關(guān)系。在統(tǒng)計(jì)中所研究的就是這種相關(guān)關(guān)系。相關(guān)關(guān)系的種類客觀現(xiàn)象間的相關(guān)關(guān)系相當(dāng)復(fù)雜,表現(xiàn)為各種形態(tài),可以按不同的標(biāo)準(zhǔn)加以劃分。(一)按相關(guān)關(guān)系的程度劃分,可分為完全相關(guān)、不完全相關(guān)和不相關(guān)當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一個(gè)現(xiàn)象的數(shù)量變化所確定時(shí),稱這兩種現(xiàn)象之間的關(guān)系為完全相關(guān),例如圓的周長決定于它的半徑R,即。在這種情況下,相關(guān)關(guān)系即為函數(shù)關(guān)系,也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一種特例。當(dāng)兩個(gè)現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱這兩個(gè)現(xiàn)象之間的關(guān)系為不相關(guān)或零相關(guān)。例如:學(xué)生的學(xué)習(xí)成績與其身高一般認(rèn)為是不相關(guān)的。若兩個(gè)現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,就稱為不完全相關(guān),一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),這是相關(guān)分析的研究對象。(二)按相關(guān)形式劃分,可以分為線性相關(guān)和非線性相關(guān)當(dāng)一個(gè)變量發(fā)生變動(dòng),另一個(gè)變量隨之發(fā)生大致均等的變動(dòng)(增加或減少),從圖形上看,其觀測點(diǎn)的分布近似地表現(xiàn)為直線形式,就是線性相關(guān)。而當(dāng)一個(gè)變量發(fā)生變動(dòng),另一個(gè)變量也隨之發(fā)生變動(dòng)(增加或減少),但是這種變動(dòng)不是均等的,從圖形上看,其觀察點(diǎn)的分布表現(xiàn)為各種不同的曲線形式,這種相關(guān)關(guān)系稱為非線性相關(guān)。(三)按相關(guān)的方向劃分,可分力正相關(guān)和負(fù)相關(guān)兩個(gè)相關(guān)現(xiàn)象間,當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),另一個(gè)變量的數(shù)值也隨之增加(或減少),這種相關(guān)稱為正相關(guān)。例如家庭消費(fèi)支出隨著收入的增加而增加等。當(dāng)一個(gè)變量的數(shù)值增加(或減少)時(shí),而另一個(gè)變量的數(shù)值相反地呈減少(或增加)趨勢變化,稱為負(fù)相關(guān)。例如勞動(dòng)生產(chǎn)率愈高,單位產(chǎn)品成本愈低。(四)按相關(guān)關(guān)系涉及的因素多少劃分,分為單相關(guān)、復(fù)相關(guān)和偏相關(guān)單相關(guān)又稱一元相關(guān),是指兩個(gè)變量之間的相關(guān)關(guān)系,即僅限于一個(gè)變量與另一個(gè)變量之間的依存關(guān)系。復(fù)相關(guān)又稱多元相關(guān),是指三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。例如家庭的消費(fèi)支出與家庭收入水平及市場價(jià)格水平之間的關(guān)系便是一種復(fù)相關(guān)。在某一變量與多個(gè)變量相關(guān)時(shí),當(dāng)假定其他變量不變,其中兩個(gè)變量的相關(guān)關(guān)系稱為偏相關(guān)。例如在假定家庭收入水平不變的條件下,市場價(jià)格水平與家庭的消費(fèi)支出的關(guān)系就是一種偏相關(guān)相關(guān)分析的意義和任務(wù)(略)第二節(jié)簡單線性相關(guān)分析一、相關(guān)表用表格反映現(xiàn)象之間的關(guān)系相關(guān)表是一種顯示變量之間相關(guān)關(guān)系的統(tǒng)計(jì)表。,首先要通過實(shí)際調(diào)查取得一系列成對的數(shù)據(jù),作為相關(guān)分析的原始資料。將某一變量按其數(shù)值的大小順序排列,然后再將與其相關(guān)的另一變量的對應(yīng)值平行排列,便可得到簡單的相關(guān)表。如下表。【例7-1】1990-2008年中國居民年平均消費(fèi)額和職工年平均工資之間的資料。全國居民年平均消費(fèi)(元)全國職工年平均工資(元)83321409322340111627111393337118334538235555002789621030026470315974793346834636329371386910870410612422441114040492516024546318364613821001710324932818329229以上列出的相關(guān)表格也可以被稱為簡單相關(guān)表,即是把某一變量值按照從小到大的順序并配合另一變量值未經(jīng)分組,一一對應(yīng)陳列出來的統(tǒng)計(jì)表。相關(guān)圖用散點(diǎn)圖反映現(xiàn)象之間的關(guān)系相關(guān)圖是用來反映兩個(gè)變量之間相關(guān)關(guān)系的圖,又稱散點(diǎn)圖。相關(guān)圖可將兩種有關(guān)的數(shù)據(jù)成對地以點(diǎn)的形式描在直角坐標(biāo)圖上,以觀察與分析兩種因素之間的關(guān)系。從相關(guān)圖中可看出,隨著職工的年平均工資的增加,居民年平均消費(fèi)有相應(yīng)提高的趨勢,兩變量間存在明顯的正相關(guān)關(guān)系。相關(guān)系數(shù)在線性條件下說明兩個(gè)變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo),簡稱相關(guān)系數(shù),通常用來表示總體的相關(guān)系數(shù),r來表示樣本的相關(guān)系數(shù)。ρ=COV(X,Y)表示兩變量協(xié)方差,VAR(X)表示X變量的方差,VAR(Y)表示Y變量的方差。由于我們難以獲得變量總體的方差,所以常用樣本的估計(jì)量代替之,得到r=為方便計(jì)算,經(jīng)過數(shù)學(xué)推導(dǎo)可以得到:r=對樣本相關(guān)系數(shù)r的解釋如下:(1)-1≤r≤1;(2)r的絕對值的大小反映了現(xiàn)象之間相關(guān)關(guān)系的緊密程度,r的絕對值越大,相關(guān)關(guān)系越緊密,反之則反是;(3)r數(shù)值的符號表明該相關(guān)關(guān)系的正負(fù)性。四、相關(guān)分析與回歸分析研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法,二者有著密切的聯(lián)系。在相關(guān)分析中,相關(guān)系數(shù)能確定兩個(gè)變量之間的相關(guān)方向和相關(guān)的密切程度;而回歸分析就是對具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間數(shù)量變化的一般關(guān)系進(jìn)行測定,選擇一個(gè)合適的數(shù)學(xué)模型,以便對因變量進(jìn)行估計(jì)或預(yù)測的一種統(tǒng)計(jì)方法。相關(guān)分析需要依靠回歸分析表明現(xiàn)象數(shù)量相關(guān)的具體形式;而回歸分析需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度,只有變量之間存在著高度相關(guān)時(shí),進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。但是,相關(guān)分析和回歸分析在研究目的和具體的研究方法上是有明顯區(qū)別的,兩者的主要區(qū)別在于:其一,在相關(guān)分析中,只是研究變量之間的相關(guān)方向和相關(guān)的密切程度,無須確定自變量和因變量;而在回歸分析中,必須事先確定哪個(gè)為自變量,哪個(gè)為因變量,而且只能從自變量去推測因變量,而不能從因變量去推斷自變量。其二,相關(guān)分析不能指出變量間相互關(guān)系的具體形式,也無法從一個(gè)變星的變化推測另一個(gè)變量的變化情況;而回歸分析能確切地指出變量之間相互關(guān)系的具體形式,它可根據(jù)回歸模型從己知量估計(jì)和預(yù)測未知量。其三,相關(guān)分析所涉及的變量一般都是隨機(jī)變量;而回歸分析中因變量是隨機(jī)的,自變量則作為研究時(shí)給定的非隨機(jī)變量。第三節(jié)回歸分析一、回歸分析的概念和種類回歸分析是指對具有高度相關(guān)關(guān)系的變量之間數(shù)量變化的一般關(guān)系進(jìn)行測定,確定一個(gè)合適的數(shù)學(xué)模型,用來近似地表示變量間的平均變化關(guān)系的一種統(tǒng)計(jì)方法。(一)按照回歸模型中變量個(gè)數(shù)分一元回歸:包含一個(gè)自變量的回歸模型多元回歸:包含多個(gè)自變量的回歸模型(二)按照回歸曲線的形態(tài)分線性回歸:變量之間的關(guān)系為直線型。非線性回歸:變量之間的關(guān)系為曲線型。線性回歸分析一元線性回歸分析的一般形式為:yy——因變量的估計(jì)值;x——自變量;a——回歸直線在y坐標(biāo)軸上的截距;b——回歸直線的斜率,也稱回歸系數(shù),自變量每增加一個(gè)單位,y增加b個(gè)單位,b可為正或負(fù),b數(shù)值的正負(fù)性表明y與x相關(guān)關(guān)系的正負(fù)性。一元線性回歸分析的關(guān)鍵在于系數(shù)a,b數(shù)值的確定,通常采用最小平方法擬合估計(jì),使得估計(jì)出的因變量的數(shù)值與實(shí)際數(shù)值的差的平方和,即殘差平方和最小。求得b=【例7-3】根據(jù)表7-1的資料,又已知2009年全國職工平均工資為32319元,利用最小平方法估計(jì)2009年全國居民年平均消費(fèi)額。解:令全國職工平均工資為自變量X,全國居民年平均消費(fèi)額為因變量Yyn=19,得b=19*1034694387-205358*68588a=814.7939156因此得到方程=814.7939156+0.25860651x帶入2009年的x=32319,估計(jì)2009年全國居民年平均消費(fèi)為9173元。三、非線性回歸分析(略)第四節(jié)估計(jì)標(biāo)準(zhǔn)誤差一、估計(jì)標(biāo)準(zhǔn)誤差的概念估計(jì)標(biāo)準(zhǔn)誤差(也稱估計(jì)標(biāo)準(zhǔn)差、回歸標(biāo)準(zhǔn)差),是因變量實(shí)際值(Y)與所配合直線模型上的理論值(Yc)之間的標(biāo)準(zhǔn)差。用以說明回歸方程推算結(jié)果的準(zhǔn)確程度的統(tǒng)計(jì)指標(biāo),說明平均線的代表性大小。簡單直線回歸估計(jì)標(biāo)準(zhǔn)誤差的測定(一)根據(jù)因變量實(shí)際值和估計(jì)值的離差計(jì)算——估計(jì)標(biāo)準(zhǔn)誤差,其下標(biāo)yx代表y依x的回歸方程y——實(shí)際值——估計(jì)值【例7-5】居民家庭月收入和消費(fèi)支出如下表編號月收入x(百元)消費(fèi)支出y(百元)xy1151222518014.74637.54222181532427016.66572.77463201840036017.94530.00304252062550021.14431.30955302890084024.343313.3715640361600144030.741327.6540762423844260444.81697.9350875535625397553.13430.0181988607744528061.45172.10751092658464598064.01090.9784合計(jì)465349297512142934963.6938根據(jù)表中數(shù)字計(jì)算可得:該指標(biāo)數(shù)值越大,說明估計(jì)值的代表性越小,也就是相關(guān)點(diǎn)的離散程度大。反之,該指標(biāo)數(shù)值越小,說明估計(jì)值的代表性越大,也就是相關(guān)點(diǎn)的離散程度小。(二)根據(jù)a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論