相關(guān)及回歸分析_第1頁
相關(guān)及回歸分析_第2頁
相關(guān)及回歸分析_第3頁
相關(guān)及回歸分析_第4頁
相關(guān)及回歸分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)及回歸分析第1頁,課件共53頁,創(chuàng)作于2023年2月第八章§8.1相關(guān)分析相關(guān)與回歸分析一、相關(guān)關(guān)系的概念現(xiàn)象之間的數(shù)量關(guān)系存在著兩種不同的類型:一種是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。第2頁,課件共53頁,創(chuàng)作于2023年2月函數(shù)關(guān)系指的是變量之間存在著的嚴(yán)格的依存關(guān)系,它們之間的關(guān)系值是固定的,對(duì)于某一變量的每一個(gè)值,都有另一個(gè)變量的完全確定的值與之相對(duì)應(yīng)。例如,圓的面積等于圓周率乘以半徑的平方。S=πr2第3頁,課件共53頁,創(chuàng)作于2023年2月相關(guān)關(guān)系是指變量之間確實(shí)存在的但關(guān)系值不固定的相互依存關(guān)系。在這種關(guān)系中,當(dāng)一個(gè)(或幾個(gè))變量的值確定以后,另一個(gè)變量的值雖與它(或它們)有關(guān),但卻不能完全確定。這是一種非確定性的關(guān)系。例如,電視機(jī)的擁有率與人均收入水平有關(guān),但對(duì)于人均收入水平相同的地區(qū),其電視機(jī)的擁有率可能不盡相同。在客觀事物中,尤其是在經(jīng)濟(jì)現(xiàn)象中,相關(guān)關(guān)系普遍存在。統(tǒng)計(jì)很有必要對(duì)這種關(guān)系進(jìn)行研究。第4頁,課件共53頁,創(chuàng)作于2023年2月在相關(guān)關(guān)系中,通常,在相互聯(lián)系的現(xiàn)象之間存在著一定的因果關(guān)系,這時(shí)就把其中的起著影響作用的現(xiàn)象具體化,通過一定的變量反映出來,這樣的變量稱為自變量。由于受到自變量變動(dòng)的影響而發(fā)生變動(dòng)的變量稱為因變量。第5頁,課件共53頁,創(chuàng)作于2023年2月在相關(guān)關(guān)系中,有時(shí)兩個(gè)變量之間只存在相互聯(lián)系而并不存在明顯的因果關(guān)系。確定哪一個(gè)是自變量,哪一個(gè)是因變量,主要決定于研究的目的。例如,在糧食畝產(chǎn)量與施肥量之間,施肥量這一變量是自變量,畝產(chǎn)量這一變量是因變量。當(dāng)研究的是兩個(gè)變量之間的關(guān)系時(shí),通常以符號(hào)X表示自變量,以符號(hào)Y表示因變量。第6頁,課件共53頁,創(chuàng)作于2023年2月二、相關(guān)關(guān)系的種類相關(guān)關(guān)系從不同的角度可以劃分成不同的類型。(一)正相關(guān)與負(fù)相關(guān)從相關(guān)的方向看,相關(guān)關(guān)系可以分為正相關(guān)和負(fù)相關(guān)。第7頁,課件共53頁,創(chuàng)作于2023年2月負(fù)相關(guān)是指相關(guān)變量之間的變化趨勢(shì)相反,即當(dāng)自變量的值增加,因變量的值隨之減少;當(dāng)自變量的值減少,因變量的值隨之增加。例如,產(chǎn)品產(chǎn)量與單位產(chǎn)品成本之間的關(guān)系。正相關(guān)是指相關(guān)變量之間的變化趨勢(shì)相同,即當(dāng)自變量的值增加,因變量的值也隨之增加;當(dāng)自變量的值減少,因變量的值也隨之減少。例如,汽車的使用年限與汽車的修理費(fèi)用之間的關(guān)系。第8頁,課件共53頁,創(chuàng)作于2023年2月(二)線性相關(guān)與非線性相關(guān)從相關(guān)的形式上來看,相關(guān)關(guān)系可分為線性相關(guān)和非線性相關(guān)。線性相關(guān)也稱直線相關(guān),是指相關(guān)的兩個(gè)變量之間變化的趨勢(shì)呈線性或近似于線性。即自變量發(fā)生變動(dòng),因變量隨之發(fā)生變動(dòng),其增加或減少量是大致均等的,從圖形上看,其觀察點(diǎn)的分布近似表現(xiàn)為直線形式。第9頁,課件共53頁,創(chuàng)作于2023年2月非線性相關(guān)也稱曲線相關(guān),是指相關(guān)的兩個(gè)變量之間變化的趨勢(shì)呈非線性。即自變量發(fā)生變動(dòng),因變量隨之發(fā)生變動(dòng),但其增加或減少量不是均等的,從圖形上看,其觀察點(diǎn)的分布表現(xiàn)為各種曲線形式。第10頁,課件共53頁,創(chuàng)作于2023年2月(三)單相關(guān)和復(fù)相關(guān)從相關(guān)變量的個(gè)數(shù)來看,相關(guān)關(guān)系可分為單相關(guān)和復(fù)相關(guān)。單相關(guān)是指兩個(gè)變量之間的相關(guān)關(guān)系。復(fù)相關(guān)是三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系。例如,僅僅考慮施肥量對(duì)產(chǎn)量的影響,這就是一種單相關(guān);如果除了施肥量之外,再考慮降雨量及深耕程度對(duì)產(chǎn)量的影響,則這種相關(guān)關(guān)系就是一種復(fù)相關(guān)。第11頁,課件共53頁,創(chuàng)作于2023年2月三、回歸與相關(guān)分析的概念在對(duì)變量之間存在的相關(guān)關(guān)系進(jìn)行分析研究時(shí),最常用的方法就是回歸分析和相關(guān)分析?;貧w分析和相關(guān)分析是相互聯(lián)系的,它們從不同方面研究變量之間相關(guān)關(guān)系的本質(zhì)?;貧w分析是用來研究變量之間關(guān)系的可能形式的統(tǒng)計(jì)方法。它把兩個(gè)或兩個(gè)以上變量之間的變動(dòng)關(guān)系加以模型化,用數(shù)學(xué)函數(shù)表達(dá)變量之間的關(guān)系。運(yùn)用這種方法時(shí),最終的目的通常在于預(yù)測(cè)或估計(jì)與某一個(gè)或某幾個(gè)變量的給定值相對(duì)應(yīng)的另一變量的數(shù)值。第12頁,課件共53頁,創(chuàng)作于2023年2月相關(guān)分析是研究如何計(jì)量變量之間關(guān)系強(qiáng)度的統(tǒng)計(jì)方法。它能確定變量之間相關(guān)的程度,即變量之間某種關(guān)系的確切程度有多大?;貧w分析和相關(guān)分析既有聯(lián)系,又有區(qū)別。就其研究對(duì)象來說,兩者都是研究變量之間的相關(guān)關(guān)系。但就彼此研究變量之間關(guān)系的性質(zhì)來看,兩者存在明顯的區(qū)別?;貧w分析中,必須將相關(guān)變量區(qū)分為自變量和因變量,以確定其關(guān)系的可能形式,所研究變量屬于非對(duì)等關(guān)系。相關(guān)分析中,計(jì)量變量之間關(guān)系的強(qiáng)度,不必區(qū)分自變量與因變量,所研究變量屬于對(duì)等的關(guān)系。第13頁,課件共53頁,創(chuàng)作于2023年2月四、相關(guān)圖表對(duì)現(xiàn)象變量之間是否存在相關(guān)關(guān)系以及存在怎樣的相關(guān)關(guān)系進(jìn)行分析、作出判斷,這是進(jìn)行回歸和相關(guān)分析的前提。通過編制相關(guān)表和相關(guān)圖,可以直觀地、大致地判斷現(xiàn)象變量之間是否存在相關(guān)關(guān)系以及關(guān)系的類型。第14頁,課件共53頁,創(chuàng)作于2023年2月(一)相關(guān)表相關(guān)表是表現(xiàn)現(xiàn)象變量之間相關(guān)關(guān)系的表格。例如,為研究商店人均月銷售額和利潤(rùn)率的關(guān)系,調(diào)查10家商店取得10對(duì)數(shù)據(jù),以人均銷售額為自變量,利潤(rùn)率為因變量,編制簡(jiǎn)單相關(guān)表如下表。第15頁,課件共53頁,創(chuàng)作于2023年2月人均銷售額與和利潤(rùn)率相關(guān)表編號(hào)人均月銷售額(千元)利潤(rùn)率(%)1234567891013345667783.06.26.68.110.412.612.316.316.818.5第16頁,課件共53頁,創(chuàng)作于2023年2月(二)相關(guān)圖所謂相關(guān)圖,是把相關(guān)的兩個(gè)變量之間的關(guān)系在平面直角坐標(biāo)(第一象限)中反映出來。通常將自變量(x)置于橫軸上,因變量(y)置于縱軸上,而將兩個(gè)變量相對(duì)應(yīng)的變量值用坐標(biāo)點(diǎn)形式描繪出來。相關(guān)圖就是用相關(guān)點(diǎn)的分布狀況來描述相關(guān)關(guān)系的,所以又稱為散點(diǎn)圖。根據(jù)相關(guān)圖,可以直觀地看出變量之間相關(guān)關(guān)系的模式。第17頁,課件共53頁,創(chuàng)作于2023年2月例如,前述人均月銷售額與利潤(rùn)率的關(guān)系,可用相關(guān)圖表示如下:利潤(rùn)率(%)人均銷售額(千元)1

20人均銷售額與利潤(rùn)率相關(guān)圖51015

2

3

84

567第18頁,課件共53頁,創(chuàng)作于2023年2月從圖中,我們可以清楚地看出,這兩個(gè)變量之間相關(guān)的方向(即正相關(guān))以及相關(guān)的具體形式(直線相關(guān))(a)直線關(guān)系(b)反直線關(guān)系(c)正曲線關(guān)系第19頁,課件共53頁,創(chuàng)作于2023年2月(e)較分散的

反直線關(guān)系(d)反曲線關(guān)系(f)沒有關(guān)系x與y的一些可能關(guān)系的散點(diǎn)圖第20頁,課件共53頁,創(chuàng)作于2023年2月上圖說明了相關(guān)圖中的一些可能關(guān)系。圖(a)和(b)表示的是正的和反的直線關(guān)系,即正線性相關(guān)和負(fù)線性相關(guān)。圖(c)和(d)分別表示的是正的和反的曲線關(guān)系,即正非線性相關(guān)和負(fù)非線性相關(guān)。圖(e)中是散布域很寬的反直線關(guān)系。散布域越寬,則表明變量之間的聯(lián)系程度越差。圖(f)中的圖象表明兩個(gè)變量之間沒有什么關(guān)系。第21頁,課件共53頁,創(chuàng)作于2023年2月§8.2相關(guān)系數(shù)相關(guān)分析是用以說明變量之間相關(guān)程度的統(tǒng)計(jì)工具。相關(guān)分析常常與回歸分析聯(lián)合使用,以衡量回歸方程所表示的因變量變化的精確度如何。相關(guān)分析也可單獨(dú)用于衡量變量之間的聯(lián)系程度。本節(jié)我們討論兩個(gè)變量之間線性相關(guān)程度問題。兩個(gè)變量之間線性相關(guān)程度的描述通常采用相關(guān)系數(shù)。第22頁,課件共53頁,創(chuàng)作于2023年2月一、相關(guān)系數(shù)的意義我們回過頭來考察一下線性回歸中指標(biāo)y的值yi與回歸估計(jì)值yi的離差平方和。記于是有:Q=Lyy(1r2)r稱為相關(guān)系數(shù)。它是在線性相關(guān)條件下用來說明兩個(gè)變量之間相關(guān)關(guān)系密切程度的指標(biāo)。第23頁,課件共53頁,創(chuàng)作于2023年2月因?yàn)镼≥0,Lyy≥0,故相關(guān)系數(shù)有一個(gè)重要性質(zhì):|r|≤1r=1(1)1<r=0(2)r=0(3)r=0(4)0<r<1(5)r=1(6)相關(guān)圖與相關(guān)系數(shù)經(jīng)驗(yàn)關(guān)系第24頁,課件共53頁,創(chuàng)作于2023年2月由于Lyy對(duì)于一組實(shí)測(cè)數(shù)據(jù)來講是定值,故由Q=Lyy(1r2)可知,當(dāng)|r|較大接近于1時(shí),離差平方和Q就較小而接近于0,此時(shí),y與x高度相關(guān)。特別當(dāng)|r|=1時(shí),稱它們是完全相關(guān)的,上圖(1)、(6)所示。當(dāng)|r|較小而接近于0時(shí),Q就大,y與x的相關(guān)關(guān)系很弱,特別當(dāng)r=0時(shí),稱它們線性無關(guān)。如上圖(3)、(4)所示第25頁,課件共53頁,創(chuàng)作于2023年2月由于Lxy可正可負(fù),所以相關(guān)系數(shù)r也可正可負(fù)。若r>0則稱y與x正相關(guān),如上圖(5)、(6)所示。此時(shí),隨著x的增大(或減小),y將呈現(xiàn)增大(或減小)的趨勢(shì)。特別對(duì)于上圖(6)的情形,由于r=1,故稱完全正相關(guān)。若r<0,則稱y與x負(fù)相關(guān),如上圖(1)、(2)所示。此時(shí),隨著x的增大(或減小),y將呈現(xiàn)減小(或增大)的趨勢(shì)。特別對(duì)于圖(1)的情形。由于r=1,故稱為完全負(fù)相關(guān)。第26頁,課件共53頁,創(chuàng)作于2023年2月應(yīng)當(dāng)注意,相關(guān)系數(shù)r只表明x與y之間的線性關(guān)系的密切程度和方向。當(dāng)r很小甚至為0時(shí),只表明x與y之間的線性關(guān)系不密切,或不存在線性關(guān)系,并不表示x與y之間就沒有關(guān)系,可能二者之間有非線性關(guān)系。如上圖(4)所示,x與y之間就存在著曲線關(guān)系。第27頁,課件共53頁,創(chuàng)作于2023年2月二、相關(guān)系數(shù)的計(jì)算我們已經(jīng)知道,相關(guān)系數(shù)的公式為:第二節(jié)中我們介紹了離差乘積的和式:第28頁,課件共53頁,創(chuàng)作于2023年2月于是有:第29頁,課件共53頁,創(chuàng)作于2023年2月如果將分子分母同乘以n,又可得:根據(jù)第二節(jié)中煉鋼廠鋼液含碳量與精煉時(shí)間資料,可計(jì)算相關(guān)系數(shù)。那里,我們已經(jīng)求得:第30頁,課件共53頁,創(chuàng)作于2023年2月于是其相關(guān)系數(shù)為:計(jì)算得出r=0.9892,表明精煉時(shí)間和含碳量之間為正相關(guān)關(guān)系。而且r值接近于1,表示兩者關(guān)系很密切。第31頁,課件共53頁,創(chuàng)作于2023年2月三、線性相關(guān)的顯著性檢驗(yàn)回歸方程在一定程度上揭示了變量之間的內(nèi)在聯(lián)系,但它所揭示的規(guī)律性是否顯著?只有當(dāng)相關(guān)系數(shù)r的絕對(duì)值大到一定程度時(shí),用回歸直線表示x與y之間的關(guān)系,并說明相關(guān)系數(shù)r顯著,配置回歸直線才有意義。那么|r|究竟大到多大時(shí),x與y之間才存在線性關(guān)系,配置回歸直線才有意義呢?第32頁,課件共53頁,創(chuàng)作于2023年2月為了給出相關(guān)系數(shù)的定量刻劃,相關(guān)系數(shù)顯著性檢驗(yàn)表給出了顯著性水平a為0.10,0.05,0.02,0.01,0.001時(shí)的臨界值。如果相關(guān)系數(shù)觀測(cè)值r大于相應(yīng)的臨界值,則認(rèn)為y與x的線性相關(guān)關(guān)系是顯著的,配置回歸直線有意義。否則便認(rèn)為y與x的線性相關(guān)關(guān)系不顯著。查表時(shí),使用的自由度為nm1。其中n為樣本容量,m為參與試驗(yàn)的因素個(gè)數(shù),因而,在一元回歸場(chǎng)合下查表用自由度為n2。第33頁,課件共53頁,創(chuàng)作于2023年2月對(duì)于第二節(jié)中的資料,我們算得相關(guān)系數(shù)r=0.9892。若a=0.01,查表得臨界值:r(0.01;102)=0.7646|0.9892|>r(0.01;102)所以,第二節(jié)中求得的回歸方程所表達(dá)的精煉時(shí)間y與鋼液含碳百分比之間的線性關(guān)系對(duì)于a=0.01是顯著的,也就是說配置的回歸方程有意義。這種顯著性通常稱為高度顯著。第34頁,課件共53頁,創(chuàng)作于2023年2月§8.3一元一次線性回歸一、回歸直線的確定如果變量x和y相關(guān),并且從相關(guān)圖表中可以看出它們之間大致形成一種直線關(guān)系,我們就可在相關(guān)圖上求出一條與各點(diǎn)最相配合的直線。第35頁,課件共53頁,創(chuàng)作于2023年2月由于這些點(diǎn)所代表的若干對(duì)數(shù)據(jù)——觀察值,只是相互有一定關(guān)系的變量x、y的總體中的一個(gè)樣本,故這樣求出的直線是總體回歸直線的估計(jì)線。在估計(jì)線上的點(diǎn)的縱坐標(biāo)是相應(yīng)于x的y的估計(jì)值。y=a+bx如果這個(gè)y的估計(jì)值用y表示,則估計(jì)線的方程可寫為第36頁,課件共53頁,創(chuàng)作于2023年2月這叫做樣本回歸直線。它是y對(duì)x的回歸線,表明y對(duì)x的平均關(guān)系。式中x為受控制的自變量,通常由研究者事先選定數(shù)值。a為樣本回歸直線y的截距,它是樣本回歸直線通過縱軸的點(diǎn)的y坐標(biāo);b為樣本回歸直線的斜率,它表示當(dāng)x增加一個(gè)單位時(shí)y的平均增加數(shù)量,b又稱回歸系數(shù)。第37頁,課件共53頁,創(chuàng)作于2023年2月如何確定回歸直線方程呢?也就是說怎樣確定方程中的參數(shù)a、b呢?若用(xi,yi)(i=1,2,…n)表示n組觀察值,則對(duì)任意給定的xi

,可得y的估計(jì)值為這些數(shù)值同實(shí)際值yi之間存在著誤差;yi=a+bxii=yi

yi=

yi

a

bxi第38頁,課件共53頁,創(chuàng)作于2023年2月Q(a,b)=2=(yabx)2為最小。這樣便把尋找適當(dāng)直線問題轉(zhuǎn)化為使Q(a,b)達(dá)到最小條件下求出a、b的問題。在回歸分析中,人們普遍采用的是最小二乘法原則。根據(jù)最小二乘法的原則,欲使所求回歸直線y=a+bx最適合于實(shí)際資料,必須使每個(gè)xi對(duì)應(yīng)的指標(biāo)實(shí)測(cè)值yi與回歸直線確定的估計(jì)值yi的離差平方之和為最小,即必須使第39頁,課件共53頁,創(chuàng)作于2023年2月因?yàn)镼(a,b)是a、b的非負(fù)二元函數(shù),所以其最小值無疑是存在的。根據(jù)數(shù)學(xué)中的極值原理,令:滿足上述條件的a、b即為所求的未知參數(shù)。由化簡(jiǎn)得(yabx)=0(yabx)x=0第40頁,課件共53頁,創(chuàng)作于2023年2月即:y=na+bxxy=ax+bx2上述方程組稱為標(biāo)準(zhǔn)方程組。解之,得:a=ybx第41頁,課件共53頁,創(chuàng)作于2023年2月因此即可確定回歸方程式為:y=a+bx這個(gè)方程稱為在給定樣本條件下的一元線性回歸方程,對(duì)應(yīng)的直線稱為樣本回歸直線。顯然,回歸方程對(duì)于不同的樣本是有差別的,因而,它具有經(jīng)驗(yàn)的特征,所以在實(shí)用上,也將它叫做經(jīng)驗(yàn)公式。為了簡(jiǎn)化上述回歸系數(shù)b的表達(dá)形式,引入如下離差乘積的和式:Lxy=(xx)(yy)第42頁,課件共53頁,創(chuàng)作于2023年2月Lxx=(xx)2于是,回歸系數(shù)可簡(jiǎn)化為為了相關(guān)性檢驗(yàn)的需要,順便引入關(guān)于y的離差平方和:Lyy=(yy)2第43頁,課件共53頁,創(chuàng)作于2023年2月求回歸方程式的系數(shù)往往是通過列表進(jìn)行的。這里,我們以下表資料為倒,通過求某鋼鐵廠煉鋼精煉時(shí)間對(duì)含碳量的回歸方程,說明回歸方程的確定。10.9100爐次含碳量(%)

(x)精煉時(shí)間(分)

(y)某鋼鐵廠十個(gè)爐次鋼液含碳量和精煉時(shí)間10234567892.01.01.21.41.51.61.71.81.9105235130145170175190190220第44頁,課件共53頁,創(chuàng)作于2023年2月可以看出,x與y之間的關(guān)系近似為直線關(guān)系。我們可以對(duì)其配合一條回歸直線。為計(jì)算回歸方程的系數(shù)a、b,我們先對(duì)原始數(shù)據(jù)進(jìn)行加工。第45頁,課件共53頁,創(chuàng)作于2023年2月yx2y2xy1001051301451701751901902202350.811.001.441.962.252.562.893.243.614.001000011025169002102528900306253610036100484005522590105156203255280323342418470166023.762943002642爐次x123456789100.91.01.21.41.51.61.71.81.92.015.0原始數(shù)據(jù)加工表第46頁,課件共53頁,創(chuàng)作于2023年2月于是:第47頁,課件共53頁,創(chuàng)作于2023年2月所以:故精煉時(shí)間關(guān)于含碳量的回歸方程為:y=14.9525+120.635x第48頁,課件共53頁,創(chuàng)作于2023年2月計(jì)算結(jié)果表明,這個(gè)方程顯示著鋼水溶液的含碳量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論