統(tǒng)計學(xué)課件:相關(guān)與回歸分析_第1頁
統(tǒng)計學(xué)課件:相關(guān)與回歸分析_第2頁
統(tǒng)計學(xué)課件:相關(guān)與回歸分析_第3頁
統(tǒng)計學(xué)課件:相關(guān)與回歸分析_第4頁
統(tǒng)計學(xué)課件:相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

相關(guān)與回歸分析相關(guān)與回歸分析第一節(jié)

相關(guān)分析的意義和種類第二節(jié)

相關(guān)關(guān)系的測定方法第三節(jié)

回歸分析第一節(jié)

相關(guān)分析的意義和種類

一、相關(guān)分析的概念相關(guān)分析(Correlationanalysis)是研究兩個或兩個以上變量之間相關(guān)程度大小以及用一定函數(shù)來表達(dá)現(xiàn)象相互關(guān)系的方法。現(xiàn)象之間的數(shù)量關(guān)系,存在著兩種不同的類型,一是函數(shù)關(guān)系,另一種是相關(guān)關(guān)系。(1)函數(shù)關(guān)系:它反映著現(xiàn)象之間存在著嚴(yán)密的依存關(guān)系,在這種關(guān)系中對于某一變量的一個數(shù)量值,都有另一變量的確定值與之對應(yīng)。(2)相關(guān)關(guān)系:它是指現(xiàn)象之間確實存在的,但關(guān)系值不固定的相互依存關(guān)系。二、回歸分析與相關(guān)分析的作用1、確定特定變量之間是否存在相關(guān)關(guān)系,并根據(jù)觀察資料建立比較合適的回歸方程,從而分析變量之間相互關(guān)系的密切程度。2、根據(jù)一個或幾個變量的數(shù)值預(yù)測或控制另一個變量的數(shù)值,并且了解這種預(yù)測或控制的精確度。3、對共同影響一個變量的許多的變量之間,找出哪些是重要因素,哪些是次要因素。三、相關(guān)分析的種類和特點(一)相關(guān)關(guān)系的種類1、按相關(guān)程度劃分完全相關(guān):Y的變化完全由X的變化確定;不相關(guān):Y與X不相互影響,各自獨立變化;不完全相關(guān):Y與X之間有一定程度的相互影響。2、按相關(guān)方向劃分正相關(guān):X與Y同時變大或變??;負(fù)相關(guān):X變大,Y變小或X變小,Y變大。3、按相關(guān)形式劃分線性相關(guān):Y與X的關(guān)系呈現(xiàn)出線性關(guān)系;非線性相關(guān):Y與X的關(guān)系呈現(xiàn)出非線性關(guān)系。4、按變量多少劃分單相關(guān):指兩個變量間的相關(guān)關(guān)系;復(fù)相關(guān):指三個以上變量間的相關(guān)關(guān)系;偏相關(guān):指多個變量情形下,固定其他變量,只

考慮其中兩個變量間的相關(guān)關(guān)系。(二)相關(guān)分析的特點1、兩變量是對等的關(guān)系。2、相關(guān)分析中,只能計算出一個相關(guān)系數(shù),相關(guān)系數(shù)的絕對值在0和1之間,其值大小反映兩變量間相關(guān)的密切程度。3、相關(guān)系數(shù)有正有負(fù)之分。4、相關(guān)系數(shù)計算的資料要求是:相關(guān)的兩變量必須是隨機的,這也是對等關(guān)系的反映。四、相關(guān)分析的主要目的和內(nèi)容(一)主要目的相關(guān)分析的主要目的,就是對現(xiàn)象間相關(guān)關(guān)系的密切程度和變化規(guī)律進(jìn)行分析,找出相互關(guān)系的模式,以便進(jìn)行統(tǒng)計預(yù)測和推算,為制定計劃、決策提供統(tǒng)計資料。(二)內(nèi)容1、確定現(xiàn)象之間有無相關(guān)關(guān)系。2、確定相關(guān)關(guān)系的表現(xiàn)形式。3、判定相關(guān)關(guān)系的方向和密切程度。4、為達(dá)到一定密切程度的相關(guān)關(guān)系建立適當(dāng)?shù)臄?shù)學(xué)模型(通常稱為回歸方程),以確定自變量與因變量之間數(shù)量變化的規(guī)律性。5、測定數(shù)學(xué)模型代表性大小,并根據(jù)自變量的數(shù)值,對因變量的數(shù)量變化做出具有一定概率保證度的推算和預(yù)測。第二節(jié)

相關(guān)關(guān)系的測定方法一、相關(guān)表根據(jù)資料是否分組,相關(guān)表可分為簡單相關(guān)表和分組相關(guān)表。(一)簡單相關(guān)表對于比較少的資料,可以不加分組,只將某一變量的變量值按從小到大的順序,并將與它可能具有相關(guān)關(guān)系的變量的變量值與之一一對應(yīng),按其相應(yīng)的變量值順序排列,即可編制成簡單相關(guān)表。【例】某廠某產(chǎn)品產(chǎn)量與單位成本相關(guān)表

產(chǎn)量(千件)單位成本(元)19946521995850199695119971148199812491999144820001546200117442002194120032040(二)分組相關(guān)表當(dāng)原始資料很多時,可將原始資料進(jìn)行分組,編制成分組相關(guān)表。1、單變量分組相關(guān)表在原始資料中有兩個變量,只對其中的一個變量分組,對另一個變量不分組,并且對于分組變量計算各組相應(yīng)的次數(shù),對于不分組的變量計算平均數(shù)。這樣編制的相關(guān)表,稱為單變量分組相關(guān)表。(1)單項式分組相關(guān)表【例】(2)組距式分組相關(guān)表【例】某紡織廠118名工人看管機器數(shù)與勞動生產(chǎn)率相關(guān)關(guān)系表按看管機器數(shù)分組(臺)工人人數(shù)(人)勞動生產(chǎn)率(米/小時)5—710148—9141710—11212212—13302513—15333216—17323718—192142∑118—2、雙變量分組相關(guān)表雙變量分組,就是對所研究的兩個變量都加以分組?!纠磕彻?00名職工的工齡和時工資等級相關(guān)關(guān)系表

按工齡分組(年)按時工資級別分組(元)合計1231—56—1011—1516—2021及以上2040241600102426000128202050605020∑1006040200二、相關(guān)圖相關(guān)圖又稱散點圖,是以直角坐標(biāo)系的橫軸代表變量x,縱軸代表變量y,將兩個變量相對應(yīng)的成對數(shù)據(jù)用坐標(biāo)點的形式描繪出來,用于反映兩變量之間的相關(guān)關(guān)系的圖形。相關(guān)關(guān)系的圖示:

不相關(guān)

負(fù)線性相關(guān)

正線性相關(guān)

非線性相關(guān)

完全負(fù)線性相關(guān)完全正線性相關(guān)

三、相關(guān)系數(shù)測定變量之間相關(guān)密切程度的比較完善的指標(biāo)是相關(guān)系數(shù)。(一)相關(guān)系數(shù)的計算【例】某市1998年—2005年的工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額的資料如下表:序號年份x(萬元)y(萬元)11998500120-310-15596100240254805021999540140-270-13572900182253645032000620150-190-12536100156252375042001730200-80-75640056256000520029002809058100254506200397035016075256005625120007200410504502401755760030625420008200511705103602351296005522584600合計64802200--432400155000253300計算結(jié)果表明:該市工資性現(xiàn)金支出與城鎮(zhèn)儲蓄存款余額之間存在著高度正相關(guān)。2、協(xié)方差

xy2的意義它是積差平均數(shù),是度量x,y關(guān)系的一重要指標(biāo)。其作用在于:(1)顯示x與y是正相關(guān)還是負(fù)相關(guān)。(2)協(xié)方差顯示x與y相關(guān)程度的大小。3、標(biāo)準(zhǔn)差

x和

y的作用(1)x,y協(xié)方差是有名數(shù),不同現(xiàn)象的變異情況不同,相關(guān)程度不能直接以協(xié)方差大小加以比較。標(biāo)準(zhǔn)化結(jié)果協(xié)方差化為無名數(shù),就可以比較不同現(xiàn)象相關(guān)程度的高低。(2)x,y協(xié)方差數(shù)值可無限增多或減少,將變量離差標(biāo)準(zhǔn)化的結(jié)果使相關(guān)系數(shù)的絕對值不超過1,即相關(guān)系數(shù)在-1與+1之間變動,就便于說明問題:當(dāng)相關(guān)系數(shù)為±1時,表明x與y完全線性相關(guān);當(dāng)相關(guān)系數(shù)為0時,表示x與y不相關(guān);相關(guān)系數(shù)的絕對值越接近于1,表明x,y的相關(guān)程度越高。(二)相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)相關(guān)等級|r|=10.8≤|r|<10.5≤|r|<0.80.3≤|r|<0.50<|r|<0.3r=0完全線性相關(guān)高度線性相關(guān)顯著線性相關(guān)低度線性相關(guān)微弱線性相關(guān)不存在線性相關(guān)(三)相關(guān)系數(shù)的簡捷計算方法1、資料未分組的計算公式:2、資料分組的計算公式:第三節(jié)

回歸分析一、一元線性回歸分析的概念和特點(一)回歸分析的概念回歸分析就是對具有相關(guān)關(guān)系的兩個變量之間數(shù)量變化的一般關(guān)系進(jìn)行測定,確定一個與之相對應(yīng)的數(shù)學(xué)表達(dá)式,以便進(jìn)行估計或預(yù)測的統(tǒng)計方法。(二)回歸的分類1、按自變量的個數(shù)分為:一元回歸和多元回歸。2、按照回歸線的形狀分為:線性回歸和非線性回歸。(二)一元線性回歸分析的特點1、兩變量中,一個是自變量,一個是因變量。2、回歸方程不是抽象的數(shù)字模型,而是用自變量數(shù)值推算因變量數(shù)值的根據(jù),必須反映變量之間關(guān)系的一般變動情況。3、對于沒有明顯因果關(guān)系的兩個變量,可以確定兩個不能互相替代的回歸方程,一是以x為自變量,以y為因變量的回歸直線方程;另一是以x為因變量,以y為自變量的回歸直線方程,這兩條回歸直線方程斜率不同,意義不同。4、直線回歸方程系數(shù)即斜率有正有負(fù)。5、計算回歸方程的資料要求是,因變量為隨機的,而自變量是給定的數(shù)值,求出回歸方程后,也是給定自變量值,代入方程中,推算出因變量的一般值或平均數(shù)值。二、一元線性回歸模型的建立及應(yīng)用(一)一元線性回歸模型的概念一元線性回歸模型又稱簡單直線回歸模型,它是根據(jù)成對的兩個變量的數(shù)據(jù)而配合的直線方程。(二)一元線性回歸模型的建立yc=a+bx式中:yc—直線的估計值;a—直線的起點值(數(shù)學(xué)意義上的直線縱軸上

的截距),表示當(dāng)x=0時,y的估計值;b—回歸系數(shù)(數(shù)學(xué)意義上的直線的斜率),

表示當(dāng)x增加或減少一個單位時,y平均增

加或減少的數(shù)量。

a、b的確定:

在簡單直線回歸方程中,a、b為待定系數(shù),常用最小平方法來確定,即∑(y-yc)2=最小值。

【例】為研究收入與食品支出的關(guān)系,隨機抽取了10戶家庭的樣本(百元),請擬合樣本回歸方程。解:通過散點圖可近似看出收入與食品支出之間呈線性關(guān)系,故設(shè)兩者有關(guān)系

經(jīng)濟意義:當(dāng)收入為0時,亦須有217.26元的食品支出;收入每增加100元,食品支出平均增加20.23元。三、一元線性回歸的相關(guān)分析與方差分析(一)離差平方和的分解xyy{}}

離差分解圖SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{從圖中可將總變差分解(1)總平方和(SST)反映因變量的n個觀察值與其均值的總離差。(2)回歸平方和(SSR)反映由于x與y之間的線性關(guān)系引起的y的取值變化,也稱可解釋的平方和。說明自變量

x的變化對因變量y取值變化的影響。(3)殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和。(二)決定系數(shù)(r2)決定系數(shù)是回歸平方和占總離差平方和的比例。決定系數(shù)接近于1,說明所有相關(guān)點都接近回歸直線方程,相關(guān)程度就很高。當(dāng)決定系數(shù)等于1時,相關(guān)點就落在回歸直線上,即為完全相關(guān)。四、一元線性回歸估計標(biāo)準(zhǔn)誤差(一)估計標(biāo)準(zhǔn)誤差的概念估計標(biāo)準(zhǔn)誤差是因變量實際值與理論值的平均離差,是用來說明回歸方程代表性大小的統(tǒng)計分析指標(biāo),簡稱為估計標(biāo)準(zhǔn)差。若估計標(biāo)準(zhǔn)差小,表明回歸方程準(zhǔn)確性高,代表性大;反之,若估計標(biāo)準(zhǔn)誤差大,則表明回歸直線代表性小,用它進(jìn)行回歸預(yù)測準(zhǔn)確性低。(二)估計標(biāo)準(zhǔn)誤差的計算方法1、根據(jù)因變量實際值和估計值的離差計算由于實際運用時變量值資料很多,所以計算公式中自由度一般可以忽略,因而估計標(biāo)準(zhǔn)誤差的計算公式可寫成:2、利用參數(shù)a、b的已知值計算五、曲線回歸分析(一)曲線回歸分析的意義在研究現(xiàn)象的相關(guān)關(guān)系時,并不完全呈直線關(guān)系,還會反映出某種非線性的曲線關(guān)系,因此,就應(yīng)配合適當(dāng)?shù)那€形式,為兩個變量擬合一條相應(yīng)的曲線作為回歸線,進(jìn)行曲線回歸分析。(二)曲線回歸方程形式的確定在對實際的客觀現(xiàn)象進(jìn)行定量分析時,選擇回歸方程的具體形式應(yīng)遵循以下原則:方程形式應(yīng)與經(jīng)濟學(xué)的基本理論相一致。方程有較高的擬合程度。方程的數(shù)學(xué)形式要盡可能簡單。(三)曲線回歸方程的求解1、二次曲線回歸方程及其線性化回歸方程為:yc=a+bx+cx2其線性化的方法是:設(shè)x1=x,x2=x2,則二次曲線方程變化為二元一次直線方程:yc=a+bx1+cx2,用二元一次方程求出回歸參數(shù)a、b、c后,再代轉(zhuǎn)去,還原為二次曲線方程。2、指數(shù)曲線回歸方程及其線性化回歸方程為:yc=abx它的線性化用取對數(shù)的方法化為:令lgyc=yc′,lga=a′,lgb=b′,則得:yc′=a′+b′x。用此直線方程求出a′、b′之后,再取反對數(shù)還原為指數(shù)曲線方程。3、生產(chǎn)函數(shù)曲線回歸方程及其線性化回歸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論