




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
STAT
第九章相關(guān)與回歸分析統(tǒng)計實例STAT統(tǒng)計實例
賬單與小費的關(guān)系在西方國家,餐飲等服務行業(yè)有一條不成文的規(guī)定,即發(fā)生餐飲等服務消費時須給侍者一定數(shù)額的小費。許多人都聽說小費應是賬單的16%左右,是否真的如此?統(tǒng)計實例STAT
我們必須關(guān)注的問題是:
1.賬單與小費之間是否確實有關(guān)?
2.若有關(guān),則屬于何種關(guān)系?
3.如何根據(jù)賬單來推算小費的數(shù)額?本章的重點就是根據(jù)成對出現(xiàn)的樣本數(shù)據(jù)做出一些推論。并力求描述賬單與小費之間的數(shù)量關(guān)系,這樣就能找出人們留小費時所應遵循的規(guī)則。第九章相關(guān)與回歸分析STAT
本章重點
1.相關(guān)關(guān)系與回歸方程概述;
2.相關(guān)關(guān)系的測定;
3.回歸方程的擬合:方程的擬合;擬合優(yōu)度的判定指標:判定系數(shù),估計標準誤
4.回歸方程的應用(估計與預測)。
本章難點
1.積差法相關(guān)系數(shù)的計算;
2.擬合優(yōu)度的判定。第九章相關(guān)與回歸分析STAT第一節(jié)相關(guān)關(guān)系概述一、問題的提出
1.單個變量的研究
分布、平均及標準差、推斷等;
2.多個變量的研究
有無關(guān)系、何種關(guān)系、如何推算變量間的影響。(1)計件工資與產(chǎn)量;(2)原材料消耗與產(chǎn)量、單位產(chǎn)量消耗和原材料價格;(3)糧食產(chǎn)量與施肥量;(4)香煙消費與癌癥發(fā)生率;(5)血壓與年齡;(6)父母身高與子女身高;(7)家庭收入與打屁股次數(shù);(8)工資增加與酒價上漲第九章相關(guān)與回歸分析STAT二、變量間的相互關(guān)系(一)函數(shù)關(guān)系
1.定義:完全確定的(數(shù)量)關(guān)系。一一對應關(guān)系?。?)某一變量的變動可由另一(組)變量的變動完全解釋;
計件工資(y)與產(chǎn)量(x)
y=f(x)=10x;原材料消耗總額(y)與產(chǎn)量(x1)、單位產(chǎn)量消耗(x2)和原材料價格(x3)
y=x1·x2·x3。(2)y
被解釋變量(因變量);x
解釋變量(自變量)。(二)相關(guān)關(guān)系
1.定義:不完全確定的關(guān)系。統(tǒng)計關(guān)系,平均對應關(guān)系!第九章相關(guān)與回歸分析STAT身高(y)與體重(x);
A:x=60kg、y=1.70m;B:x=60kg、y=1.72m;
C:x=60kg、y=1.68m;D:x=60kg、y=1.65m。
表述:y=f(x)+
2.相關(guān)關(guān)系的成因(1)某些影響因素尚未被認識;(2)雖已認識但無法測量;(3)測量誤差。
某種水果2元/斤:購買額y=2x
購買量
y=4元、x=2斤
y=2x+=2×1.9+0.2=4元
3.數(shù)量關(guān)系的表現(xiàn)形式第九章相關(guān)與回歸分析STAT(1)單一因果關(guān)系糧食產(chǎn)量與施肥量;(2)互為因果關(guān)系身高與體重;(3)伴隨關(guān)系教師的薪金與酒價。三、相關(guān)關(guān)系的種類(一)按相關(guān)的程度分
1.完全相關(guān):函數(shù)關(guān)系;
2.不相關(guān):沒有關(guān)系;[例]蘇格蘭:虱子數(shù)與健康狀況。
3.不完全相關(guān)。(二)按相關(guān)的方向分
1.正相關(guān):變量的變動方向一致(同增同減);
2.負相關(guān):變量的變動方向相反(一增一減)。第九章相關(guān)與回歸分析STAT(三)按相關(guān)的形式分
1.線性相關(guān);
2.非線性相關(guān)。相關(guān)程度密切相關(guān)程度不密切第九章相關(guān)與回歸分析STAT(四)按影響因素的多少分
1.單(簡)相關(guān):只有一個自變量。
學習成績與學習時間;血壓與年齡;畝產(chǎn)量與施肥量。
2.復(多元)相關(guān):兩個或兩個以上的自變量;
經(jīng)濟增長與人口增長、科技水平、自然資源、管理水平等之間的關(guān)系;體重與身高、食欲、睡眠時間之間的關(guān)系。
3.偏相關(guān):就多個變量測定其中兩個變量的相關(guān)程度而假定其他變量不變。
就y=ax1+bx2+,研究y與x1之間的關(guān)系,假定x2不變。第九章相關(guān)與回歸分析STAT第二節(jié)線性相關(guān)關(guān)系的測定[目的]測定變量間的相關(guān)方向與密切程度。一、相關(guān)圖表(一)相關(guān)表
1.單變量分組相關(guān)表:自變量分組且計算次數(shù),因變量只計算平均數(shù)。第九章相關(guān)與回歸分析STAT
2.雙變量分組相關(guān)表:對自變量與因變量均進行分組。注:自變量X軸;因變量Y軸。(二)相關(guān)圖:散點圖。
不足:難以精確反映相關(guān)的密切程度。第九章相關(guān)與回歸分析STAT●橫軸代表各省份田地種植水稻比例,上海為最高,約90%?!窨v軸代表各省份居民傾向集體主義的比例,上海、江西和重慶為前三位。第九章相關(guān)與回歸分析STAT二、(線性)相關(guān)系數(shù)※(計算方法:積差法,方差法)(一)積差法計算公式變型公式:協(xié)方差是兩個隨機變量相互關(guān)系(“互動性”)的一種統(tǒng)計測度。第九章相關(guān)與回歸分析STAT(二)協(xié)方差sxy的作用
1.顯示x與y之間的相關(guān)方向。(一)
+
+(三)
–
–
sxy
>0
正相關(guān):r>0第九章相關(guān)與回歸分析STAT[負相關(guān)](二)
–
+(四)
+
–
Sxy
0
負相關(guān):r0第九章相關(guān)與回歸分析STAT
2.顯示x與y之間的相關(guān)程度。第九章相關(guān)與回歸分析STAT[負相關(guān)]第九章相關(guān)與回歸分析STAT[判定兩變量是否存在相關(guān)關(guān)系]第九章相關(guān)與回歸分析STAT[歸納]sxy的作用第一,顯示x與y之間的相關(guān)方向第二,顯示x與y之間的相關(guān)密切程度(同一變量水平下)問題:如果變量x>p,y>q(即不同一變量水平下)
;且sxy
>spq
能否認為x與y之間的相關(guān)程度一定會高于p與q?
第九章相關(guān)與回歸分析STAT(三)sx、sy的作用
1.使不同變量的協(xié)方差標準化直接對比。第九章相關(guān)與回歸分析STAT[例]甲、乙兩人有關(guān)食量與體重資料如下(單位:斤)第九章相關(guān)與回歸分析STAT
150152160
-0.76-0.381.13第九章相關(guān)與回歸分析STAT
2.使第九章相關(guān)與回歸分析STAT附:r的變型計算公式推導第九章相關(guān)與回歸分析STAT[r的變型計算公式推導]第九章相關(guān)與回歸分析STAT[r的變型計算式]第九章相關(guān)與回歸分析STAT(四)線性相關(guān)的判斷準則
[例]為了解營業(yè)員每人月平均銷售額(萬元)和利潤率(%)之間的關(guān)系,特從100家商店中隨機抽取10家,得到如下資料,試計算樣本相關(guān)系數(shù)。第九章相關(guān)與回歸分析STAT計算過程:第九章相關(guān)與回歸分析STAT經(jīng)計算得:x=50,y=110.8,x2=294,y2=1465,
xy=654.9,n=10答:人均銷售額與利潤率之間存在著高度的正相關(guān)關(guān)系。第九章相關(guān)與回歸分析STAT問:若令人均銷售額為y,利潤率為x,則r的取值是否改變
?第九章相關(guān)與回歸分析STAT(五)樣本相關(guān)系數(shù)的特性
1.兩變量均為隨機變量。
2.兩變量的地位是平等的rxy=ryx。
3.其接近于1的程度與樣本容量n有關(guān)。
n
小,r1。特例:當n=2時,r=1。
[例]樣本(x,y)為(6,12.6),(1,3.0),n=2。第九章相關(guān)與回歸分析STAT一些人相信手掌生命線的長度可以來預測他們的壽命。M.E.Wilson和L.E.Mather在《美國醫(yī)學協(xié)會學報上》發(fā)表的一封信中,通過對尸體的研究對此給予了駁斥。死亡時的年齡與手掌生命線的長度被一起記錄下來。作者得出死亡時的年齡與生命線的長度不存在顯著相關(guān)的結(jié)論。手相術(shù)失傳了,手也就放下了??词窒啵旱诰耪孪嚓P(guān)與回歸分析STAT(六)線性相關(guān)的顯著性檢驗(不講)
1.t檢驗(R.A.Fisher檢驗)(1)提出假設:H0:=0
H1:0
(2)計算檢驗統(tǒng)計量;(3)將檢驗統(tǒng)計量與臨界值比較,如檢驗統(tǒng)計量的絕對值大于臨界值,則拒絕原假設;反之亦反。
2.r檢驗法:查《相關(guān)系數(shù)檢驗表》,在給定下,若rr
(n-2),則拒絕H0。第九章相關(guān)與回歸分析STAT
[例]為了解營業(yè)員每人月平均銷售額(萬元)和利潤率(%)之間的關(guān)系,特從100家商店中隨機抽取10家,得到如下資料,試計算樣本相關(guān)系數(shù)并進行檢驗(=0.05)。
解:提出假設:H0:=0
H1:0已知:r=0.987,n=10所以,拒絕原假設而接受備擇假設,即檢驗結(jié)果表明,月平均銷售額與利潤率之間確實存在著線性相關(guān)關(guān)系。第九章相關(guān)與回歸分析STAT[r檢驗法]
已知:r=0.987,n=10
n-20.050.016780.7070.6660.6320.8340.7980.765相關(guān)系數(shù)檢驗表第九章相關(guān)與回歸分析STAT第三節(jié)回歸分析一、回歸分析概述(一)概念
1.相關(guān)分析的不足:無法表明兩變量之間的數(shù)量規(guī)律無法從一個變量(x)的變化來推測另一個變量(y)的變化。第九章相關(guān)與回歸分析STAT
2.回歸分析:通過一個(些)變量的變化解釋另一變量的變化y=a+bx、
y=ax1+bx2
。
英國生物學家F·Galton
首次提出。父輩身高
子輩身高
xy
y=f(x)+
人類平均身高(二)回歸分析的種類
1.按自變量的多少分(1)簡單(一元)回歸:自變量只有一個。
y=a+bx
(2)復(多元)回歸:自變量為2個或2個以上。
y=0+1x1+2x2+…+nxn第九章相關(guān)與回歸分析STAT
2.按回歸方程式的特征分(1)線性回歸:因變量為自變量的線性函數(shù)。
y=a+bx
(2)非線性回歸:因變量為自變量的非線性函數(shù)。第九章相關(guān)與回歸分析STAT(三)回歸分析的步驟
1.確定自變量和因變量。消費支出(y,果)國民收入(x,因);
自變量篩選問題:
■消除無關(guān)的變量。農(nóng)副產(chǎn)品出口額=-107.66+0.13社會商品零售總額+0.22
農(nóng)副產(chǎn)品收購額
社會商品零售總額與農(nóng)副產(chǎn)品出口額無直接關(guān)系,更不是影響農(nóng)副產(chǎn)品出口額的原因。
■消除不重要的變量。生產(chǎn)資料進口額=0.73輕工業(yè)投資+0.18生產(chǎn)消費等
輕工業(yè)投資對生產(chǎn)資料進口額雖有影響,但不重要,或不第九章相關(guān)與回歸分析STAT完全,應選擇全社會固定資產(chǎn)投資額?!鱿华毩⒌淖兞?。農(nóng)業(yè)總產(chǎn)值=0.78+0.24糧食產(chǎn)量+0.05農(nóng)機動力-0.21
受災面積糧食產(chǎn)量受農(nóng)機動力和受災面積的影響,它們存在相關(guān)性。
2.確定樣本回歸方程消費支出y與收入x的回歸方程:y=a+bx=200+0.70x
3.統(tǒng)計檢驗:
(1)回歸模型的顯著性檢驗,即反映回歸方程對樣本觀測值的擬合優(yōu)度如何。判定系數(shù)檢驗
(2)回歸參數(shù)的顯著性檢驗,即檢驗變量y與變量x之間能否用線性關(guān)系來描述。線性相關(guān)檢驗
4.預測或控制。已知
x確定y:估計或預測;已知y確定x:控制第九章相關(guān)與回歸分析STAT回歸分析與相關(guān)分析的關(guān)系
(1)聯(lián)系:
■兩者具有互為補充關(guān)系;■兩者存在計算上的聯(lián)系。
(2)區(qū)別:
■兩者在關(guān)心變量性質(zhì)上不同;
■兩者的任務和目的不同;■兩者的使用范圍不同。應用相關(guān)與回歸分析應注意的問題
■必須以定性分析為基礎(chǔ)。
■要注意變量間相關(guān)關(guān)系發(fā)生作用的范圍。如施肥量與農(nóng)作物產(chǎn)量;由愛生恨
■應用回歸方程時不能一概認為自變量與因變量存在因果關(guān)系。第九章相關(guān)與回歸分析STAT二、一元線性回歸方程的擬合(一)總體回歸模型→Y=A+BX+第九章相關(guān)與回歸分析STAT總體回歸方程→E(Y)=A+BX第九章相關(guān)與回歸分析STAT回歸模型建立的假定條件:
1.
y是隨機變量,y的分布是正態(tài)分布,y的平均值在給定x的值的回歸線上。
2.對于任何x值,y分布的方差相等,即具有同方差,即Var()=
2
。
3.隨機誤差項的期望值為零,即;隨機誤差項是相互獨立的,不存在序列相關(guān)。即cov(i,
j)=0,(i≠j)。
4.對多元線性回歸模型,y=a+b1x1+b2x2+…+bkxk+,各個變量是相互獨立的,不存在多重共線性,即cov(xi,xj)=0,(i≠j)。第九章相關(guān)與回歸分析STAT樣本回歸方程的擬合思想:
抽樣N
n,第九章相關(guān)與回歸分析STAT(二)樣本回歸方程的擬合
從總體中隨機取樣,獲取一組樣本觀察值。第九章相關(guān)與回歸分析STAT圖示:步驟:1.擬合樣本回歸方程;2.樣本回歸方程的擬合優(yōu)度第九章相關(guān)與回歸分析STAT(三)樣本回歸方程的擬合方法
常用方法:最小二乘法(OLS法)基本思路:使殘差平方和最小的直線“最優(yōu)直線”。第九章相關(guān)與回歸分析STAT總可以設法找到一對a、b的取值,使Q為最小值。第九章相關(guān)與回歸分析STAT[整理]相關(guān)系數(shù)r與回歸系數(shù)b之間的關(guān)系:第九章相關(guān)與回歸分析STAT(1)兩者是同向的;(2)r反映變量的相關(guān)方向與密切程度;
b反映某一變量變動一個單位時另一變量的平均變動量。第九章相關(guān)與回歸分析STAT
[例]為研究收入與食品支出的關(guān)系,隨機抽取了10戶家庭的樣本(百元),請擬合樣本回歸方程。第九章相關(guān)與回歸分析STAT解:通過散點圖可近似看出收入與食品支出之間呈線性關(guān)系,故設兩者有關(guān)系
經(jīng)濟意義:當收入為0時,亦須有217.26元的食品支出,收入每增加100元,食品支出平均增加20.23元。第九章相關(guān)與回歸分析STAT
參數(shù)a、b的經(jīng)濟含義是:
a代表直線的起點值,為直線的縱軸截距,它表示x=0時y的常數(shù)項。
b稱為回歸系數(shù),表示自變量x增加一個單位時因變量y的平均增加值?;貧w系數(shù)的正負號與相關(guān)系數(shù)是一致的,因此回歸系數(shù)的正負號可用來判斷兩變量相關(guān)的方向,也可利用b求相關(guān)系數(shù)r
。估計與預測:第九章相關(guān)與回歸分析STAT利用b求相關(guān)系數(shù)r解:第九章相關(guān)與回歸分析STAT三、回歸方程的方差分析(回歸方程的擬合優(yōu)度)(一)總離差平方和的分解第九章相關(guān)與回歸分析STAT由:第九章相關(guān)與回歸分析STAT(二)判定系數(shù)(可決系數(shù))→回歸模型擬合程度的測度指標第九章相關(guān)與回歸分析STAT■判定系數(shù)的作用
r2越接近與1,說明模型越有效,r2越接近與0,模型越無效。第九章相關(guān)與回歸分析STAT■判定系數(shù)r2與相關(guān)系數(shù)r的關(guān)系第九章相關(guān)與回歸分析STAT■相關(guān)系數(shù)也從另一角度說明了回歸直線的擬合優(yōu)度,相關(guān)系數(shù)越接近±1,說明回歸直線對觀測數(shù)據(jù)的擬合優(yōu)度越高,但需謹慎!因為r的絕對值總是大于r2
的值(0和1除外)。
例:
r=0.5時,r2=0.25→只能解釋總變差的25%第九章相關(guān)與回歸分析STAT(三)估計標準誤差
1.定義:觀測值與回歸值之間的平均離差。均方殘差的平方根
→說明各觀測值在直線周圍的分散程度??煽醋魇桥懦藊對y的線性影響后,y隨機波動大小的一個估計量。實際意義上,它反映了用估計的回歸方程預測因變量y時預測誤差的大小。
2.公式注:由于求a、b參數(shù)時有兩個方程的約束,所以n-2第九章相關(guān)與回歸分析STAT圖示:第九章相關(guān)與回歸分析STAT估估計標準誤差與判定系數(shù)r2的關(guān)系:
作為回歸模型擬合優(yōu)度的判斷和評價標準,估估計標準誤差顯然不如判定系數(shù)r2,判定系數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 度生產(chǎn)加工合同
- 牛仔布供需合同
- 再生廢物原料國外裝運前檢驗合同全文
- 租賃合同范本:辦公場地篇
- 新版買賣合同模板
- 14《天文學上的曠世之爭》教學設計 2023-2024學年統(tǒng)編版高中語文選擇性必修下冊
- 度醫(yī)院護士勞動合同
- 5《七律·長征》教學設計-2024-2025學年六年級語文上冊統(tǒng)編版
- 企業(yè)戰(zhàn)略聯(lián)盟合同樣本
- 1《春夏秋冬》教學設計-2024-2025學年語文一年級下冊統(tǒng)編版
- 沈陽市地圖課件
- 伯利茲城大藍洞
- 物權(quán)法習題集
- 實訓4瀝青路面滲水試驗
- 專業(yè)勞務派遣服務行業(yè)可行性分析報告
- 金屬非金屬礦山安全生產(chǎn)法規(guī)
- 《商務溝通-策略、方法與案例》課件 第五章 網(wǎng)絡溝通
- 市場調(diào)查 第三版 課件全套 夏學文 單元1-8 市場調(diào)查認知 - 市場調(diào)查報告的撰寫與評估
- 身心活化健康評估老年康體指導初級
- 《公共設施設計》課件
- 2024-2030年中國琥珀酸二辛酯磺酸鈉產(chǎn)業(yè)未來發(fā)展趨勢及投資策略分析報告
評論
0/150
提交評論