版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SANZHANG
第三章統(tǒng)計案例
,你坐過火車、乘過飛機嗎?暈車、暈機與性別有無關(guān)系?肺癌是人類的一大殺手,
吸煙與患肺癌的關(guān)聯(lián)性究竟有多大?你了解過你們班同學(xué)的身高與體重嗎,身高與體重是否
線性相關(guān)?你統(tǒng)計過你們班同學(xué)的考試成績嗎,物理成績的高低與數(shù)學(xué)成績關(guān)聯(lián)度有多
大?……這些都是統(tǒng)計學(xué)研究的內(nèi)容.
本章我們將要學(xué)習(xí)獨立性檢驗和回歸分析的基本思想、方法.學(xué)習(xí)本章要注意學(xué)習(xí)收集、
整理、分析數(shù)據(jù)的方法,體會統(tǒng)計分析的基本思想、建模思想和現(xiàn)代計算技術(shù)在統(tǒng)計中的應(yīng)
用,體會統(tǒng)計思維和確定性思維的差異.
3.1回歸分析的基本思想及其初步應(yīng)用
自主預(yù)習(xí)?探新知
情景引入
2019年6月17日四川宜賓發(fā)生6.1級地震,此后40分鐘內(nèi)連發(fā)四次余震,最高震級
5.1級,此次地震余震頻繁而且震級還高,你知道地震的震級與地震次數(shù)之間有什么關(guān)系嗎?
新知導(dǎo)學(xué)
一、回歸直線方程
1.回歸分析是處理兩個變量之間相關(guān)關(guān)系的一種統(tǒng)計方法.若兩個變量之間具有
線性相關(guān)關(guān)系,則稱相應(yīng)的回歸分析為線性回歸分析.
n__
A-,—
2.回歸直線方程為y=bx+a,其中方=L=^-----=——.a=—y—x
X?曰0二七1
—(工J2)_稱為樣本點的中心?
3.線性相關(guān)關(guān)系強與弱的判斷:用相關(guān)系數(shù)工來描述線性相關(guān)關(guān)系的強弱.
對于變量x、y隨機抽取到的"對數(shù)據(jù)(xi,%)、(物”)、…、(X”,力),其相關(guān)系數(shù)r=
n__n__
y(x/-x)8-y)》沙一〃xy
1=1i=【
A/Z(Xi-X)2s(y,-y)2A(Xxr-nx伙玄彳一”>,2)
\/I=Ii=i\/rij=i
當r>0時,表明兩個變量正相關(guān):當K0時,表明兩個變量負相關(guān),的絕對侑
越接近1,表明兩個變量的線性相關(guān)性越」1_;/?的絕對值接近于0時,表明兩個變量之
間幾乎不存在線性相關(guān)關(guān)系.通常當歷大于0.75時,認為兩個變量有很強的線性相關(guān)關(guān)
系.
二、線性回歸分析
1.隨機誤差
(1)隨機誤差的概念:當樣本點散布在某一條直線的附近,而不是在一條直線上時,不
能用一次函數(shù)),=法+。來描述兩個變量之間的關(guān)系,而是用線性回歸模型y=fer+“+e
來表示,這里x稱為解釋變量,v稱為預(yù)報變量,e稱為隨機誤差,E(e)=0,
D(e)=<r.
(2)隨機誤差及其產(chǎn)生的原因
從散點圖中我們可以看到,樣本點散布在某一條直線附近,而不是在一條直線上,所以
不能用一次函數(shù)y=bx+a來描述它們之間的關(guān)系,我們用下面的線性回歸模型來表示:y
^bx+a+e,其中隊b為模型的未知數(shù),e稱為隨機誤差.產(chǎn)生隨機誤差的主要原因有以
下3個方面:
①用線性回歸模型近似真實模型(真實模型是客觀存在的,通常我們并不知道真實模型
是什么)所引起的誤差.可能存在非線性的函數(shù)能更好地描述y與x之間的關(guān)系,但是現(xiàn)在
卻用線性函數(shù)來表述這種關(guān)系,結(jié)果會產(chǎn)生誤差.這種由模型近似所引起的誤差包含在e
中.
②忽略了某些因素的影響.影響變量y的因素不只變量x,可能還包括其他許多因素(例
如在描述身高和體重關(guān)系的模型中,體重不僅受身高的影響,還會受遺傳基因、飲食習(xí)慣、
生長環(huán)境等其他因素的影響),它們的影響都體現(xiàn)在e中.
③觀測誤差.由于測量工具等原因,導(dǎo)致y的觀測值產(chǎn)生誤差(比如一個人的體重是確
定的數(shù),但由于測量工具的影響和測量人技術(shù)的影響可能會得到不同的觀測值,與真實值之
間存在誤差),這樣的誤差也包含在e中.
2.殘差
對于樣本點(X1,>|)、(X2,次)、…、(Xn,yn),其回歸方程為用),作為回歸模型
[y=bx+a+eA2A
|一、八,、,中6x+a的估計值,隨機誤差ei=VLbxi-a的估計值e:=y,—fer,一a
[E(e)=O,D(e)=(r
_(i=l,2,…,〃),稱為相應(yīng)于點(孫%)的殘差.
3.殘差圖
以為縱坐標,一樣本編號一(或身高數(shù)據(jù),或體重的估計值等)為橫坐標作出的
圖形,稱為殘差圖.
4.在線性回歸模型中,」表示解釋變量對預(yù)報變量變化的一貢獻率一#2越接近于1,
表示解釋變量和預(yù)報變量的線性相關(guān)性越強;反之,改越小,說明隨機誤差對預(yù)報變量的
效應(yīng)越大.
nA
IT
相關(guān)指數(shù)R2的計算公式是/?2=1—什——.
Ji(>'/-y)2
R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果(即回歸效果)越_好_.
在含有一個解釋變量的線性模型中,一恰好等于一相關(guān)系數(shù)匚的平方.
預(yù)習(xí)自測
1.在對兩個變量X,y進行線性回歸分析時,有下列步驟:
①對所求出的回歸直線方程作出解釋;
②收集數(shù)據(jù)(為,%),i—\,2,???,n;
③求線性回歸方程;
④求相關(guān)系數(shù);
⑤根據(jù)所搜集的數(shù)據(jù)繪制散點圖.
如果根據(jù)可行性要求能夠作出變量X,y具有線性相關(guān)的結(jié)論,則在下列操作順序中正
確的是(D)
A.①②⑤③④B.③②④⑤①
C.②④③①⑤D.②⑤④③①
[解析]對兩個變量進行回歸分析時,
首先收集數(shù)據(jù)8,?),i=l,2,…,”;根據(jù)所搜集的數(shù)據(jù)繪制散點圖.
觀察散點圖的形狀,判斷線性相關(guān)關(guān)系的強弱,
求相關(guān)系數(shù),寫出線性回歸方程,
最后依據(jù)所求出的回歸直線方程作出解釋;
故正確順序是②⑤④③①,
故選D.
2.(2020?南充模擬)已知變量x與變量y之間具有相關(guān)關(guān)系,并測得如下一組數(shù)據(jù):
X651012
y6532
則變量尤與),之間的線性回歸直線方程可能為(B)
AA
A.>=0.7》一2.3B.y=-0.7x+10.3
AA
C.y=-10.3x+0.7D.y=10.3x~0.7
[解析1根據(jù)表中數(shù)據(jù),得;
—133
x=4(6+5+10+12)=彳,
—1
y=*+5+3+2)=4,
且變量y隨變量x的增大而減小,是負相關(guān),
所以,驗證x=乎時,y=-0.7X^+10.3^4,
A
即回歸直線y=-0.7x+10.3過樣本中心點(x,y).
故選B.
3.(2020?武漢高二檢測)在一次對人體脂肪含量和年齡關(guān)系的研究中,研究人員獲得了
一組樣本數(shù)據(jù):
年齡2327394145495053565860
脂肪9.517.821.225.927.526.328.229.631.433.535.2
A
通過計算得到回歸方程為y=0.577x—0.448,利用這個方程,我們得到年齡37歲時體內(nèi)
脂肪含量為20.90%,那么數(shù)據(jù)20.90%的意義是(D)
A.某人年齡37歲,他體內(nèi)脂肪含量為20.90%
B.某人年齡37歲,他體內(nèi)脂肪含量為20.90%的概率最大
C.某人年齡37歲,他體內(nèi)脂肪含量的期望值為20.90%
D.20.90%是對年齡為37歲的人群中的大部分人的體內(nèi)脂肪含量所作出的估計
A
[解析]利用回歸方程),=0.577x—0.448,
可得x=37時,£=20.901,
即到年齡37歲時體內(nèi)脂肪含量約為20.90%,
故20.90%是對年齡為37歲的人群中的大部分人的體內(nèi)脂肪含量所作出的估計,
故選D.
4.為了考察兩個變量x和y之間的線性相關(guān)性,甲、乙兩位同學(xué)各自獨立地做了100
次和150次試驗,并且利用線性回歸方法,求得回歸直線分別為6和自已知兩個人在試驗
中發(fā)現(xiàn)對變量x的觀測數(shù)據(jù)的平均值都是s,對變量y的觀測數(shù)據(jù)的平均值都是t,那么下
列說法正確的是(A)
A./i和b有交點(s,f)
B.與/2相交,但交點不一定是(s,f)
C./|與/2必定平行
D.與/2必定重合
I解析]由題意知(S,。是甲、乙兩位同學(xué)所做試驗的樣本點的中心,而線性回歸直線恒
過樣本點的中心,故選A.
5.(202。全國卷I)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率>■和溫度x(單
位:°C)的關(guān)系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)得到下面的散
點圖:
由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫
度x的回歸方程類型的是(D)
A.y—a+bxB.y—a+bx2
C.y=a+be'D.y=a-Yb\nx
[解析]由散點圖分布可知,散點圖分布在一個對數(shù)函數(shù)的圖象附近,因此,最適合作
為發(fā)芽率),和溫度x的回歸方程類型的是y=a+b]nx.
故選D.
互動探究?攻重難
V
V
互動探究解疑
命題方向?
變量間的相關(guān)性檢測
典例1關(guān)于兩個變量X和y的7組數(shù)據(jù)如下表所示:
X21232527293235
y711212466115325
試判斷y與x是否線性相關(guān).
[解析]7=1(21+23+25+27+29+32+35)^27.4,
—1
y=亍(7+11+21+24+66+115+325)^81.3,
7
2>?=212+232+252+272+292+322+352=5414,
/=1
7
f=21X7+23X11+25X21+27X24+29X66+32X115+35X325=18542.
X=1
7
Z^=72+ll2+212+242+662+1152+3252=124393,
1=1
7____
刀渺一7xy
7_7_
(端—7x2)(9-7y2)
i=\i=\
________18542-7X27.4X81.3________
4(5414—7X27.42)X(124393-7X81.32)
2948.66
=0.8639.
3520.92
由于r=0.8639>0.75,??.x與y具有線性相關(guān)關(guān)系.
『規(guī)律總結(jié)』變量間是否具有線性相關(guān)關(guān)系,可通過散點圖或相關(guān)系數(shù)作出判斷,散
點圖只是粗略作出判斷,用相關(guān)系數(shù)能夠較準確的判斷相關(guān)的程度.
II跟蹤練習(xí)1■
現(xiàn)隨機抽取了我校10名學(xué)生在入學(xué)考試中的數(shù)學(xué)成績(X)與入學(xué)后的第一次考試數(shù)學(xué)成
績。),數(shù)據(jù)如下表:
學(xué)生號1234567891()
X12010811710410311010410599108
y84648468696869465771
請問:這10個學(xué)生的兩次數(shù)學(xué)考試成績是否具有顯著的線性相關(guān)關(guān)系?
_1
【解析]x-JQ(120+108H---F99+108)=107.8,
7=-^(84+644---:57+71)=68,
10
1>7=1202+1082H----F992+1082=116584,
1=1
10
Xy?=842+642H----F572+712=47384,
/=1
10
120X84+108X64H----H08X71=73796,
i-i
所以,相關(guān)系數(shù)為
__________73796—10X107.8X68________
16584-10X107.82)(47384-10X68?)
?0.7506,
由0.7506>0.75知,兩次數(shù)學(xué)考試成績有顯著的線性相關(guān)關(guān)系.
命題方向?
求線性回歸方程
典例2某班5名學(xué)生的數(shù)學(xué)和物理成績?nèi)绫?
學(xué)生學(xué)科成績ABCDE
數(shù)學(xué)成績(X)8876736663
物理成績。)7865716461
(1)畫出散點圖;
(2)求物理成績),對數(shù)學(xué)成績x的線性回歸方程;
(3)一名學(xué)生的數(shù)學(xué)成績是96,預(yù)測他的物理成績.
[解析](1)散點圖如圖.
90-
80-?
70-?
60—?—?—?—?—?_?
60657075808590x
——I
⑵x=gX(88+76+73+66+63)=73.2,
—1
y=§X(78+65+71+64+61)=67.8.
5
£@?=88X78+76X65+73X71+66X64+63X61
i=l
=25054.
5
£X?=882+762+732+662+632=27174,
i=\
5_____
8yL5x?y
f=l
所以方=-------------=*0.625,
玉-5工2
1=1
含=y一8工n67.8—0.625X73.2=22.05,
所以y對x的回歸直線方程是$=0.625x+22.05.
(3)當x=96時,2=0.625X96+22.05482,即可以預(yù)測他的物理成績是82.
『規(guī)律總結(jié)』1.散點圖是定義在具有相關(guān)關(guān)系的兩個變量基礎(chǔ)上的,對于性質(zhì)不明確
的兩組數(shù)據(jù),可先作散點圖,從圖中看它們有無關(guān)系,關(guān)系的密切程度,再進行相關(guān)的回歸
分析.
2.求回歸直線方程,首先應(yīng)注意到,只有在散點圖大致呈線性時,求出的回歸直線方
程才有實際意義,否則,求出的回歸直線方程毫無意義.
II跟蹤練習(xí)2.■
(2020.湖南郴州質(zhì)檢)為了探究車流量與PM2.5的濃度是否相關(guān),現(xiàn)采集到北方某城市
2016年12月份某星期星期一到星期日某一時間段車流量與PM2.5的數(shù)據(jù)如下表:
時間星期一星期二星期三星期四星期五星期六星期日
車流量X/萬輛1234567
PM2.5的濃度
28303541495662
M微克/立方米)
(1)由散點圖知y與x具有線性相關(guān)關(guān)系,求了關(guān)于x的線性回歸方程:
⑵①利用⑴所求的回歸方程,預(yù)測該市車流量為8萬輛時PM2.5的濃度;
②規(guī)定:當一天內(nèi)PM2.5的濃度平均值在(0,50]內(nèi),空氣質(zhì)量等級為優(yōu);當一天內(nèi)PM2.5
的濃度平均值在(50,100]內(nèi),空氣質(zhì)量等級為良.為使該市某日空氣質(zhì)量為優(yōu)或良,則應(yīng)控
制當天車流量在多少萬輛以內(nèi)?(結(jié)果以萬輛為單位,保留整數(shù).)
n____
ZAO'I-?Xy
八八八AA_A_
參考公式:回歸直線的方程是其中〃=,a=y~bx.
》,一〃x2
i=?
一1
[解析]⑴由數(shù)據(jù)可得x=,(1+2+3+4+5+6+7)=4,
-177A
y=,(28+30+35+41+49+56+62)=43,1372,140,b=
i=li=\
〉》一7xy
/=I1372-1204A_A_
=~-=6,u=y—bx=43-6X4=19,故y關(guān)于x的線性回歸方
7_140—112
-7x2
i=l
程為y=6x+19.
(2)①當車流量為8萬輛,即x=8時,f=6X8+19=67.故當車流量為8萬輛時,PM2.5
的濃度約為67微克/立方米.
②根據(jù)題意得6x+19W100,即XW13.5,故要使該市某日空氣質(zhì)量為優(yōu)或良,應(yīng)控制
當天車流量在13萬輛以內(nèi).
命題方向?
線性回歸分析
典例3某運動員訓(xùn)練次數(shù)與訓(xùn)練成績之間的數(shù)據(jù)關(guān)系如下:
次數(shù)(X)3033353739444650
成績。)3034373942464851
(1)作出散點圖;
(2)求出回歸方程;
(3)作出殘差圖;
(4)計算R2,并說明運動員的訓(xùn)練次數(shù)對成績的影響占百分之幾.
I解析[(1)作出該運動員訓(xùn)練次數(shù)x與成績y的散點圖,如圖所示.由散點圖可知,它
們之間具有相關(guān)關(guān)系.
60
50J
4。.1
3()?*
20
10
TJl-102030405060x
__88
(2)X=39.25,y=40.875,)=12656,力渺=13180,
/=!/=!
8__
X(加一次)8-y)
Ai=l
所以6=---;-------------、1.04]5,
E(為一x)2
i=\
A____A
a=~~bx=-0.003875,
A
.,.回歸直線方程為y=1.0415x-0.003875.
(3)殘差分析:下面的表格列出了運動員訓(xùn)練次數(shù)和成績的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)
據(jù).
AA
Xy
3030-1.2411
3334-0.3656
35370.5514
37390.4684
39421.3854
44460.1779
46480.0949
5051-1.0711
作殘差圖如圖所示.
由圖可知,殘差點比較均勻地分布在水平帶狀區(qū)域內(nèi),說明選擇的模型比較合適.
(4)計算相關(guān)指數(shù)R2比0.9855,說明了該運動員的成績的差異有98.55%是由訓(xùn)練次數(shù)引
起的.
『規(guī)律總結(jié)』1.解答本類題目應(yīng)先通過散點圖來分析兩個變量間的關(guān)系是否線性相
關(guān),再利用求回歸方程的公式求解回歸方程,并利用殘差圖或R2來分析函數(shù)模型的擬合效
果,在此基礎(chǔ)上,借助回歸方程對實際問題進行分析.
2.“咫、殘差圖”在回歸分析中的作用:
nA
ZGif/
i=\
(1)R2是用來刻畫回歸效果的,由R2=l------------------可知/?2越大,意味著殘差平方和
n-
£yy
/-i
越小,也就是說模型的擬合效果就越好.
(2)殘差圖也是用來刻畫回歸效果的,判斷依據(jù)是:殘差點比較均勻地分布在水平帶狀
區(qū)域中,帶狀區(qū)域越窄,說明模型擬合精度越高,回歸方程預(yù)報精度越高.
II跟蹤練習(xí)3一■
為研究質(zhì)量x(單位:克)對彈簧長度),(單位:厘米)的影響,對不同質(zhì)量的6個物體進行
測量,數(shù)據(jù)如表所示:
X51015202530
y7.258.128.959.9010.911.8
(1)作出散點圖,并求線性回歸方程;
(2)求出R?;
(3)進行殘差分析.
I解析I(1)散點圖如圖所示.
——1
因為X=不乂(5+10+15+20+25+30)=17.5,
7=、X(7.25+8.12+8.95+9.90+10.9+11.8戶9.487,
66
??=2275,1076.2
/=1
AA
計算得,40.183,a七6.285,
所求線性回歸方程為y=0.183x+6.285.
(2)列表如下:
A
yi-yi0.050.005-0.08-0.0450.040.025
yi-y-2.24-1.37-0.540.411.412.31
6A6―
所以Z8一對2*0.01318,Z(y,—y)2=14.6784.
/=1f=l
所以,必=1—:):)祟上0.9991,
14.0/O4
回歸模型的擬合效果較好.
(3)由殘差表中的數(shù)值可以看出第3個樣本點的殘差比較大,需要確認在采集這個數(shù)據(jù)
的時候是否有人為的錯誤,如果有的話,需要糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可
以看出殘差點比較均勻地落在不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸
模型的精度較高,由以上分析可知,彈簧長度與重量成線性關(guān)系.
命題方向?
非線性回歸問題
典例4有一測量水流的實驗裝置——量水堰,測得試驗數(shù)據(jù)如下表:
i1234567
水高Zz(厘米)0.71.12.54.98.110.213.5
流量。(升/分)0.0820.251.811.237.866.5134
根據(jù)表中數(shù)據(jù),建立。與〃之間的回歸方程.
[思路分析]作散點圖,觀察確定y與x的近似函數(shù)關(guān)系,作變量替換,列出新的對應(yīng)
值表求出對應(yīng)的線性回歸方程,再作變量替換得回歸方程.
[解析1根據(jù)測得數(shù)據(jù)作出散點圖,如圖,根據(jù)已有的函數(shù)知識,可以發(fā)現(xiàn)樣本點分布
在某一條嘉函數(shù)型曲線。=a/(a、夕是待定的正常數(shù))①的周圍.為此將Q=a/兩邊取對數(shù),
得到lgQ=/flg/z+lga②,令lgQ=y,lg〃=x,于是②式可化為y=/r+lga.這樣y就是x的線
性函數(shù)了.可以利用線性回歸模型來建立y和x之間的線性回歸方程y=bx+“3=〃,lga=
〃)了.
ihiQiXi=lghixi孫?
10.70.082-0.1549-1.08620.0240.1683
21.10.250.0414一0.60210.0017-0.0249
32.51.80.39790.25530.15830.1016
44.911.20.69021.04920.47640.7242
58.137.80.90851.57400.82541.4300
610.266.51.00861.82281.01731.8385
713.51341.13032.12711.27762.4043
7777
L2為=4.022ZM=5.1401Z%?=3.7807X和尸6.642
尸i/=]廠i
先作出上面數(shù)據(jù)表,由表得到£比2.5097,lga~-0.7077,則。p0.1960.于是所得的
回歸方程為。=0.193廬5097.
『規(guī)律總結(jié)』1.在建立經(jīng)驗公式時,選擇合適的函數(shù)類型是十分重要的.通常是根據(jù)
實驗數(shù)據(jù),畫出散點圖,從中觀察其變化規(guī)律,并與已知函數(shù)的圖象對比,看接近于什么函
數(shù),根據(jù)實踐經(jīng)驗來決定選取公式的類型,所選的類型是否符合實際,還需要通過實踐來檢
驗.有時候還需要選擇不同的模擬函數(shù)作比較.
2.如果觀察散點圖,發(fā)現(xiàn)點的分布不呈條狀分布,而是與某種曲線相近,這時可選擇
這條曲線對應(yīng)的函數(shù)作為擬合函數(shù),作恰當變換,轉(zhuǎn)化為線性函數(shù),用線性回歸模型求解.
例如:
h1
①反比例函數(shù)可作變換t=~,得
②寐函數(shù)型>=加">0)可作變換Y=lny,m=}na,t—\nx,則有
Y=m+bt.
③指數(shù)型函數(shù)y=k?v(a>0且“Wl,k>0)可作變換Y=\ny,m=\nk,則有:Y=m+(b\na)x
II跟蹤練習(xí)4_?
為了研究某種細菌隨時間x的變化繁殖個數(shù)y的變化,收集數(shù)據(jù)如下:
時間x/天123456
繁殖個數(shù)y612254995190
(1)將天數(shù)作解釋變量,繁殖個數(shù)作預(yù)報變量,作出這些數(shù)據(jù)的散點圖;
(2)描述解釋變量與預(yù)報變量之間的關(guān)系;
(3)計算殘差、相關(guān)指數(shù)
|解析|(1)由表中數(shù)據(jù)作散點圖如下圖所示.
“個
200
80
60
40
20
00
80
60
40
20
--■--
23456
(2)由散點圖看出樣本點分布在一條指數(shù)函數(shù)y=ciec加的圖象的周圍,其中。和。2是待
定系數(shù).于是令z=lny,則z=〃x+a(n=lna,b-c2),因此變換后的樣本點應(yīng)該分布在直
線z=%x+〃的周圍,因此可以用線性回歸模型來擬合z與x的關(guān)系,則變換后的樣本數(shù)據(jù)
如下表:
X123456
Z1.792.483.223.894.555.25
由表中數(shù)據(jù)得到線性回歸方程?=0.69x+1.115.
因此細菌繁殖個數(shù)關(guān)于時間的回歸方程為£=e°69/LU5.
(3)列出殘差表:
編號i123456
A6.0812.1224.1796.06191.52
V/48.18
%612254995190
A
ei-0.08-0.120.830.82-1.06-1.52
6A6八
E〃=£Gf)2=4.8161,
/=1/=1
6_
X(M-y)2=24630.1,
i=l
乃=I__48161_9998
K1241630.1
故解釋變量天數(shù)對預(yù)報變量繁殖個數(shù)解釋了99.98%,說明該回歸模型擬合效果非常好.
學(xué)科核心素養(yǎng)
利用線性回歸方程進行預(yù)報變量的估計(規(guī)律方法)
利用線性回歸方程可以進行預(yù)報,線性回歸方程將部分觀測值所反映的規(guī)律進行延伸,
是我們對有線性相關(guān)關(guān)系的兩個變量進行分析和控制的依據(jù).
典例5(2020?福州模擬)對具有線性相關(guān)關(guān)系的變量x,y,測得一組數(shù)據(jù)如
下表:
X24568
y2040607980
AA
根據(jù)上表,利用最小二乘法得它們的回歸直線方程為y=10.5x+〃,據(jù)此模型來預(yù)測當x
=20時,y的估計值為(C)
A.210B.210.5
C.211.5D.212.5
————AAA
[解析]由已知得x=5,y=54,則(5,54)滿足回歸直線方程)=10.5]+“,解得4=1.5.
因此f=10.5x+1.5,當x=20時,£=10.5X20+1.5=211.5.故選C.
『規(guī)律總結(jié)』已知變量的某個值去預(yù)測相應(yīng)預(yù)報變量的某個值時,先求出其所滿足的
回歸直線方程£=>+2把已知x取某一個值代入回歸方程£=晨+1中,從而可求出y的估
計值.
II跟蹤練習(xí)工■
某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此做了4次試驗,得到
數(shù)據(jù)如下:
零件的個數(shù)M個)2345
加工的時間y(小時)2.5344.5
(1)在給定的坐標系中畫出表中數(shù)據(jù)的散點圖;
y
5----:一…?;
4---;--J--W---;--?
2--W..I..i---i--1
1……-i……-i……-i……\……i
-01~~2~~3~45x
AAA
(2)求y關(guān)于x的線性回歸方程y=bx+〃;
(3)試預(yù)測加工10個零件需要的時間.
Z(為一x)8-y)Xx-yi-nxy
Ai=\i=l
b-=
參考公式:<i(xi~~)2f^-nT2
i=li=\
A—人—
、a=y-bx
[解析](1)散點圖如圖所示:
y
012345%
(2)由題中表格數(shù)據(jù)得x=3.5,y=3.5,
4__4_
X(羽一x)8-y)=3.5,X(為一工y=5.
/=1i=\
4__
z(X/—x)(yi-y)
由公式計算得,=二------------A——A—
=0.7,a=y-bx,
4_
Z(Xi-X尸
所以所求線性回歸方程為f=6x+1=0.7x+1.05.
AAA
⑶當x=10時,y=6x+a=0.7X10+1.05=8.05,
所以預(yù)測加工10個零件需要8.05小時.
V
V
易混易錯警示
求回歸方程
典例6在一化學(xué)反應(yīng)過程中,某化學(xué)物質(zhì)的反應(yīng)速度y(g/min)與一種催化劑
的量x(g)有關(guān),現(xiàn)收集了如表所示的8組數(shù)據(jù),則y與x的回歸方程是f=e°-⑻2L°=85.
催化劑是x(g)1518212427303336
化學(xué)物質(zhì)反應(yīng)速度Mg/min)6830277020565350
——88
[錯解]由表中數(shù)據(jù)可得x=25.5,>=95.125,??=5580,£卬,,=24297,
i=li=\
8__
2>加一8xy
A1=1八__A__八
所以6=----------------------七12.94,a=~~b~=-234.845.所以回歸方程式為y=一
8_
8X2
i=l
234.845+12.94元
[辨析]錯誤原因:未畫散點圖來確定回歸類型,題中要求回歸方程但不一定是回歸直
線方程,錯解中盲目地求成了回歸直線方程.
防范措施:回歸分析時,必須先畫散點圖,確定兩個變量是否有關(guān)系,有什么樣的關(guān)系,
然后確定是哪種回歸模型才能進一步求解.
I正解]根據(jù)收集的數(shù)據(jù)作散點圖,如圖所示.
化學(xué)物質(zhì)反應(yīng)速度
400
350?
300
250
200?
150
100
50,
0I??*'_1_1~―-
121518212427303336催化劑量/&
根據(jù)樣本點的分布情況,可選用指數(shù)型函數(shù)模型、=。但。21=(口,C2為待定的參數(shù)),令
z=\ny,則z=C2x+lnc”即變換后樣本點應(yīng)該分布在直線z=fer+〃(〃=ln臼,/?=◎)的周圍,
由y與X的數(shù)據(jù)表得Z與X的數(shù)據(jù)表如下:
化學(xué)物質(zhì)反應(yīng)速度的對數(shù)
8
6,??
4,?
2,?'"
_,_,_,_,_,-----.
10152025303540催化劑敏/g
X1518212427303336
Z1.7922.0793.4013.2964.2485.3234.1745.858
作出Z與X的散點圖,如圖所示,由圖可以看出變換后的樣本點分布在一條直線附近,
所以可用線性回歸方程來擬合.
由表中數(shù)據(jù)可得6^0.1812,-0.8485,故2=0.1812%—0.8485,所以£=一⑻浜-。的
5,因此該化學(xué)物質(zhì)的反應(yīng)速度與催化劑的量的非線性回歸方程為f=e。?⑻2「。.8485.
課堂達標?固基礎(chǔ)
1.關(guān)于回歸分析,下列說法錯誤的是(D)
A.回歸分析是研究兩個具有相關(guān)關(guān)系的變量的方法
B.散點圖中,解釋變量在x軸,預(yù)報變量在),軸
C.回歸模型中一定存在隨機誤差
D.散點圖能明確反映變量間的關(guān)系
[解析】用散點圖反映兩個變量間的關(guān)系時,存在誤差.
2.甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時,分別選擇了4種不同模型,
計算可得它們的相關(guān)指數(shù)K分別如下表:
甲乙丙T
R20.980.780.500.85
哪位同學(xué)建立的回歸模型擬合效果最好(A)
A.甲B.乙
C.丙D.丁
[解析]相關(guān)指數(shù)收越大,表示回歸模型的效果越好.
3.設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系.根據(jù)一組
樣本數(shù)據(jù)(為,…,n),用最小二乘法建立的回歸方程為£=0.85x—85.71,則下列
結(jié)論中不正確的是(D)
A.),與x具有正的線性相關(guān)關(guān)系
B.回歸直線過樣本點的中心(二,7)
C.若該大學(xué)某女生身高增加1cm,則其體重約增加0.85kg
D.若該大學(xué)某女生身高為170cm,則可斷定其體重必為58.79kg
[解析]A,B,C均正確,是回歸方程的性質(zhì),D項是錯誤的,線性回歸方程只能預(yù)測
學(xué)生的體重,選項D應(yīng)改為“若該大學(xué)生某女生身高為170cm,則估計其體重大約為58.79
kg”.
4.某單位為了了解用電量y度與氣溫x"C之間的關(guān)系,隨機統(tǒng)計了某4天的用電量與
當天氣溫,并制作了對照表:
氣溫(℃)181310-1
用電量(度)24343864
由表中數(shù)據(jù)得線性回歸方程£=隊+〃中匕=-2,預(yù)測當氣溫為一4℃時,用電
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中秋節(jié)習(xí)俗探究
- 專業(yè)國際貿(mào)易居間協(xié)議范本(2024版)
- 2025年度數(shù)據(jù)中心場地租賃及設(shè)施升級維護合同4篇
- 2025年度插班生入校社會實踐協(xié)議范本4篇
- 2025年度建筑安全施工安全監(jiān)督檢驗合同范本3篇
- 專項協(xié)議:2024版研究報告服務(wù)條款版A版
- 2025年度產(chǎn)業(yè)園租賃及產(chǎn)業(yè)技術(shù)創(chuàng)新合同4篇
- 二零二四年事業(yè)單位工程技術(shù)崗位勞動合同(含技術(shù)培訓(xùn))3篇
- 2025年叉車租賃服務(wù)與技術(shù)支持合同4篇
- 2024油漆涂料倉庫租賃與管理合同
- 2024版智慧電力解決方案(智能電網(wǎng)解決方案)
- 公司SWOT分析表模板
- 小學(xué)預(yù)防流行性感冒應(yīng)急預(yù)案
- 肺癌術(shù)后出血的觀察及護理
- 生物醫(yī)藥大數(shù)據(jù)分析平臺建設(shè)-第1篇
- 基于Android的天氣預(yù)報系統(tǒng)的設(shè)計與實現(xiàn)
- 沖鋒舟駕駛培訓(xùn)課件
- 美術(shù)家協(xié)會會員申請表
- 聚合收款服務(wù)流程
- 中石化浙江石油分公司中石化溫州靈昆油庫及配套工程項目環(huán)境影響報告書
- 搞笑朗誦我愛上班臺詞
評論
0/150
提交評論