第7章 相關(guān)與回歸分析_第1頁(yè)
第7章 相關(guān)與回歸分析_第2頁(yè)
第7章 相關(guān)與回歸分析_第3頁(yè)
第7章 相關(guān)與回歸分析_第4頁(yè)
第7章 相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩110頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章相關(guān)與回歸分析弗朗西斯﹒高爾頓先生被譽(yù)為現(xiàn)代相關(guān)和回歸的創(chuàng)始人1875年,他利用豌豆試驗(yàn)來(lái)確定尺寸的遺傳規(guī)律。他挑選7組不同尺寸的豌豆,說(shuō)服他的朋友每一組種植10粒種子,最后把原始的豌豆種子與新長(zhǎng)的豌豆種子進(jìn)行尺寸比較當(dāng)結(jié)果被繪制出來(lái)之后,他發(fā)現(xiàn)并非每一個(gè)子代都與父代一樣,相同的是,尺寸小的豌豆會(huì)得到更大的子代,而尺寸大的豌豆卻得到較小的子代高爾頓將此方法用到人類身上,他將父母和孩子的身高轉(zhuǎn)換成z值,對(duì)比父母的身高與他們孩子的身高。他并發(fā)現(xiàn)孩子們的z值偏離均值的程度小于父母的偏離程度,即非常矮小的父母傾向于有偏高的孩子;而非常高大的父母則傾向于有偏矮的孩子。它把這叫做對(duì)均值的“回歸”,這一發(fā)現(xiàn)構(gòu)成了回歸分析的基礎(chǔ)。

客觀現(xiàn)象總是普遍聯(lián)系和相互依存的,這種相互依存關(guān)系可以通過(guò)一定的數(shù)量關(guān)系反映出來(lái)。相關(guān)與回歸分析是定量分析現(xiàn)象之間相互依存關(guān)系的統(tǒng)計(jì)方法之一——研究現(xiàn)象間的相互關(guān)系,測(cè)定它們聯(lián)系的緊密程度,揭示其變化的具體形式和規(guī)律性。第7章相關(guān)與回歸分析STAT

聯(lián)系與相互影響是普遍的現(xiàn)象受教育的水平工作后的收入預(yù)防疾病支出疾病的發(fā)病率

事物相互間關(guān)系的質(zhì)的解釋:自然的、社會(huì)的、經(jīng)濟(jì)的、心理的…

事物相互間關(guān)系的量的分析:兩變量或多變量間的數(shù)量關(guān)系。在可以解釋的質(zhì)的關(guān)系基礎(chǔ)上進(jìn)行相關(guān)分析和回歸分析第一節(jié)相關(guān)分析第二節(jié)一元線性回歸分析第7章相關(guān)與回歸分析第7章相關(guān)與回歸分析STAT本章重點(diǎn)1.相關(guān)關(guān)系與回歸方程概述;2.相關(guān)關(guān)系的測(cè)定;3.回歸方程的擬合;4.回歸方程的應(yīng)用。本章難點(diǎn)1.差法相關(guān)系數(shù)的計(jì)算;2.總離差平方和及其分解。第7章相關(guān)與回歸分析STAT

第一節(jié)相關(guān)分析出租汽車費(fèi)用與行駛里程:總費(fèi)用=行駛里程

每公里單價(jià)家庭收入與恩格爾系數(shù):家庭收入高,則恩格爾系數(shù)低。確定性關(guān)系函數(shù)關(guān)系非確定性關(guān)系相關(guān)關(guān)系一、變量間的相互關(guān)系

互有聯(lián)系的客觀現(xiàn)象及其變量間關(guān)系的緊密程度各不一樣。歸納起來(lái),客觀現(xiàn)象之間的數(shù)量聯(lián)系存在著兩種不同的類型:函數(shù)關(guān)系和相關(guān)關(guān)系。第7章相關(guān)與回歸分析STAT

函數(shù)關(guān)系——完全確定性的關(guān)系相關(guān)關(guān)系——不完全確定的關(guān)系(一)函數(shù)關(guān)系定義:變量之間存在著完全確定的依存關(guān)系,即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量必然有一個(gè)確定值與之對(duì)應(yīng)。(1)某一(組)變量與另一變量間存在著一一對(duì)應(yīng)的關(guān)系;

[例]計(jì)件工資(y)與產(chǎn)量(x)

y=f(x)=10x;

x0=1件,y0=10元;

x1=2件,y1=20元圓的面積,R=10,S=100Π(2)y被解釋變量(因變量);x解釋變量(自變量)。第7章相關(guān)與回歸分析STAT然而,現(xiàn)實(shí)世界中還有不少情況是現(xiàn)象之間有著密切的聯(lián)系,但密切的程度并沒(méi)有達(dá)到由一個(gè)(幾個(gè))變量可以完全確定另一個(gè)變量的程度,它們之間是一種非確定性的關(guān)系。變量之間的不確定的依存關(guān)系稱為相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系)。這種統(tǒng)計(jì)關(guān)系規(guī)律性的研究是數(shù)理統(tǒng)計(jì)學(xué)中研究的主要對(duì)象,已形成數(shù)理統(tǒng)計(jì)學(xué)中兩個(gè)重要的分支——相關(guān)分析(Correlationanalysis)和回歸分析(Regressionanalysis)。第7章相關(guān)與回歸分析STAT(二)相關(guān)關(guān)系1.定義:變量之間存在有依存關(guān)系,但這種關(guān)系是不完全確定的隨機(jī)關(guān)系,即當(dāng)一個(gè)或一組變量每取一個(gè)值時(shí),相應(yīng)的另一個(gè)變量可能有多個(gè)不同值與之對(duì)應(yīng)。(1)某一(組)變量與另一變量間有關(guān)系,但并非一一對(duì)應(yīng);

[例]身高y與體重x;A:x=60kg、y=1.70m;B:x=60kg、y=1.72m;C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。第7章相關(guān)與回歸分析STAT第7章相關(guān)與回歸分析STAT(2)表述:y=f(x)+

。

影響身高的因素:體重、遺傳、鍛煉、睡眠質(zhì)量……2.成因(1)某些影響因素尚未被認(rèn)識(shí);(2)雖已認(rèn)識(shí)但無(wú)法測(cè)量;(3)測(cè)量誤差。[例]某種水果P元/斤:購(gòu)買(mǎi)額y=Px購(gòu)買(mǎi)量

x=2斤

y=2P+第7章相關(guān)與回歸分析STAT(1)單一因果關(guān)系(如貨物運(yùn)輸量與貨車保有輛數(shù)之間;(2)互為因果關(guān)系(如鐵路運(yùn)輸業(yè)的發(fā)展水平與經(jīng)濟(jì)發(fā)展水平之間);(3)伴隨關(guān)系(如工資與物價(jià)的變動(dòng))

3.數(shù)量關(guān)系的形式第7章相關(guān)與回歸分析STAT(三)

相關(guān)關(guān)系與函數(shù)關(guān)系的聯(lián)系與區(qū)別區(qū)別:(2)函數(shù)關(guān)系可以用數(shù)學(xué)表達(dá)式精確表示出來(lái),而相關(guān)關(guān)系只能通過(guò)研究變量間的統(tǒng)計(jì)規(guī)律才能得到。(1)函數(shù)關(guān)系中的變量之間的關(guān)系是完全確定的,而相關(guān)關(guān)系中的變量之間的關(guān)系是不完全確定的。第7章相關(guān)與回歸分析STAT

由于存在著測(cè)量誤差等因素的影響,函數(shù)關(guān)系在實(shí)踐中往往通過(guò)相關(guān)關(guān)系表現(xiàn)出來(lái);在研究相關(guān)關(guān)系時(shí),常常通過(guò)確定性的函數(shù)關(guān)系部分來(lái)研究變量之間的依賴關(guān)系。聯(lián)系:三、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分第7章相關(guān)與回歸分析STAT完全相關(guān)不完全相關(guān)不相關(guān)(二)按相關(guān)的方向分正相關(guān)負(fù)相關(guān)第7章相關(guān)與回歸分析STAT

當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一種現(xiàn)象的數(shù)量變化所確定時(shí),稱這兩種現(xiàn)象的關(guān)系為完全相關(guān),在這種場(chǎng)合,相關(guān)關(guān)系便成為函數(shù)關(guān)系——函數(shù)關(guān)系是相關(guān)關(guān)系的一個(gè)特例。

第7章相關(guān)與回歸分析STAT

當(dāng)兩個(gè)現(xiàn)象彼此互不影響,其數(shù)量變化各自獨(dú)立時(shí),稱為不相關(guān)現(xiàn)象。

兩個(gè)現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān),一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān)。不相關(guān)第7章相關(guān)與回歸分析STAT

正相關(guān):變量的變動(dòng)方向一致(同增同減);負(fù)相關(guān):變量的變動(dòng)方向相反(一增一減);

線性正相關(guān)

線性負(fù)相關(guān)

非線性相關(guān)第7章相關(guān)與回歸分析STAT(三)按相關(guān)的形式分相關(guān)程度密切相關(guān)程度不密切線性相關(guān)非線性相關(guān)

線性相關(guān):兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系。

非線性相關(guān):兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程的關(guān)系。第7章相關(guān)與回歸分析STAT第7章相關(guān)與回歸分析STAT(四)按影響因素的多少分

1.單(簡(jiǎn)單)相關(guān):是指兩個(gè)變量的相關(guān),即一個(gè)變量對(duì)另一個(gè)變量的簡(jiǎn)單依存關(guān)系。

[例]學(xué)習(xí)成績(jī)與學(xué)習(xí)時(shí)間;血壓與年齡;畝產(chǎn)量與施肥量。

2.復(fù)(多元)相關(guān):一個(gè)變量對(duì)兩個(gè)或兩個(gè)以上其它變量的依存關(guān)系。

[例]經(jīng)濟(jì)增長(zhǎng)與人口增長(zhǎng)、科技水平、自然資源、管理水平等之間的關(guān)系;

體重與身高、食欲、睡眠時(shí)間之間的關(guān)系。

3.偏相關(guān):在多個(gè)變量之間相關(guān)的情況下,測(cè)定其中兩個(gè)變量之間的相關(guān)程度而假定其他變量不變。[例]在假定人們的收入水平不變時(shí),某種商品的需求與其價(jià)格水平的關(guān)系。

就y=ax1+bx2+,研究y與x1之間的關(guān)系,假定x2不變。四、相關(guān)分析的主要內(nèi)容

所謂相關(guān)分析,就是以現(xiàn)象之間不完全的相關(guān)關(guān)系為研究對(duì)象,借助于圖表和分析指標(biāo)(如相關(guān)系數(shù))研究和測(cè)度現(xiàn)象所表現(xiàn)的兩個(gè)或兩個(gè)以上變量關(guān)系的一種統(tǒng)計(jì)分析方法。第7章相關(guān)與回歸分析STAT

1.確定現(xiàn)象間是否存在依存關(guān)系,其依存關(guān)系屬于何種類型——主要是定性分析和判斷;2.確定相關(guān)關(guān)系的密切程度——定量分析——相關(guān)圖、表,相關(guān)系數(shù)。3.確定相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式——回歸分析;4.確定因變量估計(jì)值的準(zhǔn)確程度。5.對(duì)回歸方程進(jìn)行顯著性檢驗(yàn)。第7章相關(guān)與回歸分析STAT三、線性相關(guān)關(guān)系的測(cè)定

[目的]采用定性和定量相結(jié)合的方法,測(cè)定變量間的相關(guān)方向與密切程度。一般即先作定性分析,再作定量分析。我們下面主要進(jìn)行定量分析。

(一)相關(guān)圖/表

相關(guān)表和相關(guān)圖是研究相關(guān)關(guān)系的直觀工具,在進(jìn)行詳細(xì)的定量分析之前,可以先利用它們對(duì)現(xiàn)象之間存在的相關(guān)關(guān)系的方向、形式、和密切程度作大致的判斷。1.相關(guān)表:由兩個(gè)相關(guān)變量相對(duì)應(yīng)的關(guān)系數(shù)值所編制成的反映現(xiàn)象之間的相關(guān)關(guān)系的數(shù)列表。

簡(jiǎn)單相關(guān)表:將具有相關(guān)關(guān)系的變量各樣本值按從小到大的順序一一對(duì)應(yīng)的列在一個(gè)表格里,就構(gòu)成了一個(gè)簡(jiǎn)單相關(guān)表。主要適用于所觀察的樣本單位數(shù)較少、不需要分組的情況。

第7章相關(guān)與回歸分析STAT居民消費(fèi)和收入的相關(guān)表單位:百元(1)單變量分組相關(guān)表:自變量分組且計(jì)算次數(shù),因變量只計(jì)算頻數(shù)和平均數(shù)。第7章相關(guān)與回歸分析STAT分組相關(guān)表:第7章相關(guān)與回歸分析STAT(2)雙變量分組相關(guān)表:又稱棋盤(pán)式相關(guān)表,對(duì)自變量與因變量均進(jìn)行分組。注:自變量X軸;因變量Y軸。

2.相關(guān)圖:又稱散點(diǎn)圖,它是將兩個(gè)變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)的形式,在直角坐標(biāo)上描繪出來(lái),以反映二者之間相關(guān)關(guān)系的圖形。

設(shè)一個(gè)變量為X,另一變量為Y,則散點(diǎn)圖上所描繪的就是下列數(shù)據(jù)數(shù)值:(X1,Y1)、(X2,Y2)、(X3,Y3)、…(Xn,Yn)。

[不足]難以精確反映相關(guān)的密切程度。第7章相關(guān)與回歸分析STAT相關(guān)圖第7章相關(guān)與回歸分析STAT

例一個(gè)10戶居民的可支配收入(百元)與消費(fèi)支出(百元)的統(tǒng)計(jì)資料按升序排列入下表(相關(guān)表):

消費(fèi)支出15203040425360657078可支配收入182545606275889299

98樣本(線性)相關(guān)系數(shù):消費(fèi)與可支配收入的相關(guān)圖XY為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個(gè)點(diǎn)所形成的圖形是一個(gè)散點(diǎn)圖。它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個(gè)橢圓。散點(diǎn)圖(例題分析)

【例1】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來(lái),該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的增長(zhǎng),這給銀行業(yè)務(wù)的發(fā)展帶來(lái)較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2015年的有關(guān)業(yè)務(wù)數(shù)據(jù)。STAT散點(diǎn)圖(例題分析)

散點(diǎn)圖(例題分析)

近年來(lái)教育部決定將各高校的后勤社會(huì)化。某從事飲食業(yè)的企業(yè)家認(rèn)為這是一個(gè)很好的投資機(jī)會(huì),他得到10組高校人數(shù)與周邊飯店季度銷售額的數(shù)據(jù)資料,并想根據(jù)高校的數(shù)據(jù)決策其投資規(guī)模。例2:

第7章相關(guān)與回歸分析STAT相關(guān)表用馬克威系統(tǒng)做出散點(diǎn)圖如下:例3:102030405060703035404550556065707580能源消耗量(十萬(wàn)噸)

能源消耗與工業(yè)總產(chǎn)值的相關(guān)圖工業(yè)總產(chǎn)值(億元)第7章相關(guān)與回歸分析STAT利用散點(diǎn)圖判斷

(scatterdiagram)

不相關(guān)

負(fù)線性相關(guān)

正線性相關(guān)

非線性相關(guān)

完全負(fù)線性相關(guān)完全正線性相關(guān)

第7章相關(guān)與回歸分析STAT(二)(線性)相關(guān)系數(shù)

相關(guān)圖表可反映兩個(gè)變量之間的相互關(guān)系及其相關(guān)方向,但無(wú)法確切地表明兩個(gè)變量之間相關(guān)的程度。統(tǒng)計(jì)學(xué)家卡爾·皮爾遜設(shè)計(jì)了統(tǒng)計(jì)指標(biāo)–––相關(guān)系數(shù)。簡(jiǎn)單相關(guān)系數(shù):在線性條件下說(shuō)明兩個(gè)變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo),簡(jiǎn)稱相關(guān)系數(shù)。根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為;根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r。將反映兩變量間曲線相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為非線性相關(guān)系數(shù)、非線性判定系數(shù);將反映多元線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為復(fù)相關(guān)系數(shù)、復(fù)判定系數(shù)等。第7章相關(guān)與回歸分析STAT(二)(線性)相關(guān)系數(shù)1.積差法計(jì)算公式第7章相關(guān)與回歸分析STAT(二)(線性)相關(guān)系數(shù)1.積差法計(jì)算公式第7章相關(guān)與回歸分析STAT(二)(線性)相關(guān)系數(shù)假設(shè):第7章相關(guān)與回歸分析STAT(二)(線性)相關(guān)系數(shù)則可得:Ⅰ為正Ⅱ?yàn)樨?fù)Ⅲ為正Ⅳ為負(fù)協(xié)方差為大的正值時(shí),表示強(qiáng)的正線性相關(guān)關(guān)系。第7章相關(guān)與回歸分析STAT[歸納]s2xy的作用第一、顯示x與y之間的相關(guān)方向第二、顯示x與y之間的相關(guān)密切程度第7章相關(guān)與回歸分析STAT[r的簡(jiǎn)捷計(jì)算式]-1.0+1.00-0.5+0.5無(wú)線性相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加完全負(fù)相關(guān)完全正相關(guān)2.線性相關(guān)的判斷準(zhǔn)則相關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1。第7章相關(guān)與回歸分析STAT通常的判斷準(zhǔn)則使用相關(guān)系數(shù)時(shí)應(yīng)注意的問(wèn)題:相關(guān)關(guān)系不等于因果關(guān)系;相關(guān)系數(shù)只度量變量間的線性關(guān)系,因此,弱相關(guān)不一定表明變量間沒(méi)有關(guān)系;極端值可能影響相關(guān)系數(shù)。注意相關(guān)關(guān)系成立的數(shù)據(jù)范圍警惕虛假相關(guān)第7章相關(guān)與回歸分析STAT[例]為了解餐飲業(yè)消費(fèi)數(shù)額與小費(fèi)之間的數(shù)額關(guān)系,特從若干名消費(fèi)者中隨機(jī)抽取10消費(fèi)者調(diào)查,所得數(shù)額如下:第7章相關(guān)與回歸分析STAT第7章相關(guān)與回歸分析STAT[例]計(jì)算過(guò)程第7章相關(guān)與回歸分析STAT[解]答:即賬單消費(fèi)額與小費(fèi)之間存在著高度的正相關(guān)關(guān)系。第7章相關(guān)與回歸分析STAT問(wèn):若令賬單消費(fèi)額為Y,小費(fèi)為X,則r的取值是否改變?第7章相關(guān)與回歸分析STAT3.樣本相關(guān)系數(shù)的特性(1)兩變量均為隨機(jī)變量;(2)兩變量的地位是平等的rxy=ryx。(3)其接近于1的程度與樣本容量n有關(guān)。

n小,r1。特例:當(dāng)n=2時(shí),r=1。[例]樣本(x,y)為(6,12.6),(1,3.0),n=2。第7章相關(guān)與回歸分析STAT4.關(guān)于相關(guān)的普通錯(cuò)誤在解釋關(guān)于相關(guān)的結(jié)果中會(huì)出現(xiàn)三種普通的錯(cuò)誤:(1)相關(guān)就一定意味著因果關(guān)系。如:一項(xiàng)研究表明,統(tǒng)計(jì)學(xué)教授的薪金與每人的啤酒消費(fèi)量之間有很強(qiáng)的正相關(guān)關(guān)系,但這兩個(gè)變量都受經(jīng)濟(jì)形勢(shì)的影響。(隱藏變量)(2)相關(guān)系數(shù)為0,一定不相關(guān)。(3)基于平均數(shù)進(jìn)行相關(guān)分析與基于個(gè)體數(shù)據(jù)進(jìn)行相關(guān)分析,其相關(guān)程度不一樣。如:一項(xiàng)研究中,關(guān)于個(gè)人收入和教育的成對(duì)數(shù)據(jù)產(chǎn)生了一個(gè)0.4的線性相關(guān)系數(shù),但當(dāng)使用區(qū)域平均時(shí),線性相關(guān)系數(shù)變?yōu)?.7。第7章相關(guān)與回歸分析STAT四、相關(guān)系數(shù)顯著性檢驗(yàn)相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的,兩個(gè)不相關(guān)的變量,其樣本相關(guān)系數(shù)也可能較高,兩個(gè)相關(guān)性很高的變量,其樣本相關(guān)系數(shù)也可能較低

要從樣本相關(guān)系數(shù)判斷總體是否也具有這樣的關(guān)系,需要對(duì)相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)。第7章相關(guān)與回歸分析STAT四、相關(guān)系數(shù)顯著性檢驗(yàn)第7章相關(guān)與回歸分析STAT四、相關(guān)系數(shù)顯著性檢驗(yàn)第7章相關(guān)與回歸分析STAT四、相關(guān)系數(shù)顯著性檢驗(yàn)【例】檢驗(yàn)生產(chǎn)量與生產(chǎn)費(fèi)用之間的線性相關(guān)性是否顯著。當(dāng)成立時(shí),則統(tǒng)計(jì)量第7章相關(guān)與回歸分析STAT五、斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算※1.等級(jí)相關(guān)的含義就是把有關(guān)聯(lián)的數(shù)量標(biāo)志或品質(zhì)標(biāo)志的具體表現(xiàn)按等級(jí)次序排列,形成X和Y這兩個(gè)序列,再測(cè)定這兩個(gè)序列之間的相關(guān)程度,得到的相關(guān)系數(shù)即為等級(jí)相關(guān)系數(shù)。常用的有斯皮爾曼相關(guān)系數(shù)、肯特爾相關(guān)系數(shù)等。2.等級(jí)相關(guān)的優(yōu)缺點(diǎn)優(yōu)點(diǎn):簡(jiǎn)單易行、應(yīng)用廣泛,適用于不便精確計(jì)量的標(biāo)志(即定序尺度衡量的現(xiàn)象)缺點(diǎn):精確度稍差于按積差法計(jì)算的相關(guān)系數(shù)第7章相關(guān)與回歸分析STAT五、斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算※3.斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算計(jì)算步驟定等級(jí)依此計(jì)算每對(duì)觀察值相應(yīng)的等級(jí)差D計(jì)算D2代入公式例:以下是兩組消費(fèi)者對(duì)十種商品的評(píng)分資料,據(jù)此計(jì)算兩組資料間的等級(jí)相關(guān)系數(shù)計(jì)算等級(jí)相關(guān)系數(shù),首先應(yīng)將原數(shù)據(jù)轉(zhuǎn)化為等級(jí),本例中甲組最低分是68分,則可將它的等級(jí)數(shù)定為1,70分的等級(jí)數(shù)就是2,72分的為3,依次類推,如果兩個(gè)數(shù)值相等,則值以平均位置數(shù)代替。等級(jí)相關(guān)系數(shù)計(jì)算表第7章相關(guān)與回歸分析STAT五、斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算※第7章相關(guān)與回歸分析STAT第二節(jié)回歸分析一、回歸分析概述(一)概念1.線性相關(guān)分析:計(jì)算線性相關(guān)系數(shù)r確定兩變量之間的相關(guān)方向與密切程度?!静蛔恪繜o(wú)法表明兩變量之間的因果關(guān)系無(wú)法從一個(gè)或幾個(gè)變量(xi)的變化來(lái)推測(cè)另一個(gè)變量(y)的變化情況。

10名用餐顧客消費(fèi)金額與所付小費(fèi)數(shù)據(jù)如下:賬單X 33.5 50.7 63.6 78.5 87.9 98.8 107.3 102.3 120.7 140.6 小費(fèi)Y 5.5 5 12 9.4 8.1 17 16 15.4 18.6 22.5 r=0.92第7章相關(guān)與回歸分析STAT2.回歸分析:通過(guò)一個(gè)(些)變量的變化解釋另一變量的變化,包括找出自變量與因變量、設(shè)定數(shù)學(xué)模型、檢驗(yàn)?zāi)P汀⒐烙?jì)預(yù)測(cè)等環(huán)節(jié)。

y=a+bx、y=a+b1x1+bx2

、y=0+1x1+2x2+…+nxn[回歸]英國(guó)生物學(xué)家F·Galton首次提出。父輩身高子輩身高

xy

y=f(x)+人類的平均身高。回歸:退回regression

1877年弗朗西斯?高爾頓爵士遺傳學(xué)研究回歸線平均身高

回歸這個(gè)術(shù)語(yǔ)是由英國(guó)著名統(tǒng)計(jì)學(xué)家FrancisGalton在19世紀(jì)末期研究孩子及他們的父母的身高時(shí)提出來(lái)的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來(lái)并不像他們的父母那樣高。對(duì)于比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們的父母的平均身高高。Galton把這種孩子的身高向中間值靠近的趨勢(shì)稱之為一種回歸效應(yīng),而他發(fā)展的研究?jī)蓚€(gè)數(shù)值變量的方法稱為回歸分析。第7章相關(guān)與回歸分析STAT

自變量(independentvariable):解釋變量,給定的或可以控制的、用來(lái)解釋、預(yù)測(cè)因變量的變量。

因變量(dependentvariable):響應(yīng)變量,由自變量來(lái)解釋其變化的變量。XYXY????????3.回歸分析的特點(diǎn):(1)在兩個(gè)變量之間,必須根據(jù)研究目的確定自變量與因變量。(2)回歸方程的作用在于給出自變量值來(lái)估計(jì)因變量的可能值。(3)兩個(gè)變量之間只有一個(gè)相關(guān)系數(shù),但可能有兩種回歸方程。第7章相關(guān)與回歸分析STAT(4)直線回歸方程中的回歸系數(shù)(即自變量的系數(shù))有正負(fù),分別表示自變量與因變量之間存在正相關(guān)、負(fù)相關(guān)(與相關(guān)系數(shù)相同)。(5)構(gòu)建回歸直線的前提條件:兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系,而且其相關(guān)的緊密程度必須是顯著的,這樣構(gòu)建的直線所出現(xiàn)的誤差較小。第7章相關(guān)與回歸分析STAT(二)回歸分析分類按自變量個(gè)數(shù)分類一元回歸簡(jiǎn)單回歸多元回歸復(fù)回歸按方程式特征分類

線性回歸非線性回歸一元線性回歸SimpleLinearregression(1)簡(jiǎn)單(一元)回歸:自變量只有一個(gè)。[例]y=a+bx一元回歸方程(2)復(fù)(多元)回歸:自變量為2個(gè)或2個(gè)以上。[例]y=0+1x1+2x2+…+nxn(3)線性回歸:因變量為自變量的線性函數(shù)。[例]y=a+bx

一元線性回歸方程※(4)非線性回歸:因變量為自變量的非線性函數(shù)。[例]見(jiàn)教材P192-194第7章相關(guān)與回歸分析STAT回歸分析與相關(guān)分析的區(qū)別:第7章相關(guān)與回歸分析STAT

1.相關(guān)分析中,變量x變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測(cè)因變量的變化;2.相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量;3.相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制。

4.對(duì)兩個(gè)變量x與y來(lái)說(shuō),相關(guān)分析中只能計(jì)算出一個(gè)相關(guān)系數(shù);而回歸分析中有時(shí)可以根據(jù)研究目的的不同建立兩個(gè)不同的回歸方程。聯(lián)系:1)相關(guān)分析是回歸分析的基礎(chǔ)和前提2)回歸分析是相關(guān)分析的深入和繼續(xù)第7章相關(guān)與回歸分析STAT第7章相關(guān)與回歸分析STAT(三)回歸分析的步驟1.確定自變量和因變量;

[例]糧食產(chǎn)量(y)施肥量(x);消費(fèi)支出(y)國(guó)民收入(x);火災(zāi)損失額(y)火災(zāi)發(fā)生地與最近一個(gè)消防站之間的距離(x)。2.確定合適的樣本回歸方程描述變量間的關(guān)系;3.對(duì)回歸方程進(jìn)行統(tǒng)計(jì)檢驗(yàn);4.利用回歸方程,根據(jù)自變量去預(yù)測(cè)或控制因變量。[例]消費(fèi)與收入的回歸方程:y=a+bx

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論