高中數(shù)學(xué)《最小二乘估計》導(dǎo)學(xué)案_第1頁
高中數(shù)學(xué)《最小二乘估計》導(dǎo)學(xué)案_第2頁
高中數(shù)學(xué)《最小二乘估計》導(dǎo)學(xué)案_第3頁
高中數(shù)學(xué)《最小二乘估計》導(dǎo)學(xué)案_第4頁
高中數(shù)學(xué)《最小二乘估計》導(dǎo)學(xué)案_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

n.第日章統(tǒng)計

DIYlZHANG§1.8最小二乘估計

課前新知預(yù)習(xí)

[航向標(biāo).學(xué)習(xí)目標(biāo)]

i.在探索多種方法確定線性回歸直線的過程中,體會最小二乘的思想方法.

2.能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.

[讀教材?自主學(xué)習(xí)]

1.最小二乘法:如果有〃個點:(X1,yi),(X2,刈),…,(xn,%),可以用下

面的表達式來刻畫這些點與直線y=a+bx的接近程度:

回[丫1-(a+公])]2+卜2—(v+]2H----1-[%—(a+bx0]2.

使得上式達到最小值的直線y=a+bx就是我們所要求的直線,這種方法稱為

園最小二乘法.

,be—_____X1+X2+…+*"m.___Vl+V2+??,+¥?

2.線性回歸方程:如果用x表示工,用y表水~,

則可以求得8=

(X1二X)8二),)+&2-X)(),2-))H-----F(X?-X)(),"-y)=但

22

(X|-X)+(X2-X)+,,,+(xn-X)2

用+二十*,四-2九y.〃=歹一匕三.這樣得到的直線方程稱為線性回歸方

?4+於H—I-焉一〃x2

程,a,。是線性回歸方程的系數(shù).

[看名師?疑難剖析]

1.求線性回歸方程的步驟

⑴列表X”M,孫.

__nn

⑵計算x,y,£4,以必

/=1/=1

Y^iy—nxy

i=\

(3)代入公式。=-----------,o=y—求出A,a.

x2

i=\

A

(4)寫出直線方程:y=hx+a.

2.線性回歸方程系數(shù)公式的推導(dǎo)過程

首先將S—(4+人為)]2+[竺一3+bx2)]2H-----(a+bx”)]?化成關(guān)于未知數(shù)

a的一元二次多項式形式:

na2+2n(bx-y)a+[(y-bx\)2+(y2—bx*。+…+(y?—Z?x?)2]=+(Z?x-

22-2

y)f—〃Sx—y)+[(yi-i)+(y2bx^H----F(y?—Z?x?)]

因此當(dāng)時,上式取得最小值,將這個關(guān)系代入上式,整理成關(guān)于

未知數(shù)b的一元二次多項式的形式:

22

[yi—(?+Z?Xi)]+[y2—(?+bx2)]-\----FD”—(a+bx,^

22

=[(yi—y)-b(x\—x)]+[(j2-y)~bg~X)]4-----卜[(y?-y)~b(xn—

x)]2

222

=/?[(x|—Xy+(X2-X)H-----F(x?—X)]—2&[(X1—X)-1—y)+(丁一x)(y2

22

—y)H-----<-(%?—x)(yM—y)]+[(yi—y)+(y2—y)-l-----b(y“一yf],因此,當(dāng)b

(xi一x)(yi—)')+。2―%)(m—y)H-----x)&"-y)

(X1-X)2+(X2—X)2+X)2

n_____

Xxiyi-nxy

i=\

Xiyi十彳2丁2~1----|-%,加|一〃九

時點(修,yD(X2,")…(X",%)與直線y

於+於H----1-焉一〃x2

i=l

=a+bx最接近(注意并不是點到直線距離之和最?。?a,b的意義是:以。為基

數(shù),x每增加一個單位,y相應(yīng)的平均增加/?個單位.

課堂師生共研

考點一線性回歸方程的概念

例1設(shè)有一個線性回歸方程為y=4—2x,則變量x增加2個單位時()

A.y平均增加1.5個單位B.y平均減少1.5個單位

C.y平均增加4個單位D.y平均減少4個單位

[解析]該題考查線性回歸方程的兩個變量之間的線性關(guān)系問題.由回歸直

線方程y=4-2x,知斜率為一2,所以變量x每增加1個單位,y平均減少2個單

位,故當(dāng)變量x增加2個單位時,)平均減少4個單位,所以選D.

[答案]D

類題通法

根據(jù)線性回歸方程可獲得對兩個變量之間整體關(guān)系的了解,對于已知的變量

x,可以相應(yīng)估計出變量y的值.

[變式訓(xùn)練1]工人月工資(元)依勞動生產(chǎn)率(千元)變化的線性回歸方程為y

=50+80x,下列判斷正確的是()

A.勞動生產(chǎn)率為1000元時,工資為130元

B.勞動生產(chǎn)率提高1000元時,工資平均提高80元

C.勞動生產(chǎn)率提高1000元時,工資平均提高130元

D.當(dāng)月工資為210元時,勞動生產(chǎn)率為2000元

答案B

解析線性回歸方程中匕的意義是當(dāng)x增加一個單位時,y的值平

均變化。個單位,這是一個平均變化率.線性回歸方程只能用于預(yù)測變量的值.

考點二求線性回歸方程

例2每立方米混凝土的水泥用量式單位:kg)與28天后混凝土的抗壓強度

y(單位:kg/cn?)之間的關(guān)系有如下數(shù)據(jù):

X150160170180190200210220230240250260

y56.958.361.664.668.171.374.177.480.282.686.489.7

求兩變量間的回歸直線方程.

[分析]由題目可獲取以下主要信息:

①兩變量具有線性相關(guān)關(guān)系;

②由兩變量的對應(yīng)數(shù)據(jù)求回歸直線方程.

解答本題要先列出相應(yīng)的表格,有了表格中的那些相關(guān)數(shù)據(jù),回歸方程中的

系數(shù)就都容易求出了.

[解]列表如下:

i123456

Xi150160170180190200

M56.958.361.664.668.171.3

孫8535932810472116281293914260

i789101112

Xi210220230240250260

yi74.177.480.282.686.489.7

孫155611702818446198242160023322

x=205,y=726

121212

Z>-=518600,2y=64572.94,力渺=182943

?=i/=iz=i

.182943—12X205X72.64347

"b=-518600-12X2052-=14300^0'304,

a=^-b~x=72.6-0.304X205=10.28.

A

于是所求的回歸方程是y=0.304x+10.28.

類題通法

用公式求回歸方程的一般步驟是:

①列表孫孫孫.

②計算x,y,ZAH£漱,以必

i=1i=1i=1

③代入公式計算力、a的值.

④寫出回歸直線方程.

[變式訓(xùn)練2]為了解兒子身高與其父親身高的關(guān)系,隨機抽取5對父子的身

高數(shù)據(jù)如下:

父親身高x(cm)174176176176178

兒子身高>,(cm)175175176177177

則y對無的線性回歸方程為()

A.y=x-1B.y=x+l

C.y=88+5D.y=176

答案C

解析本題考查線性回歸方程的求法.設(shè)y對x的線性回歸方程為

-2X(—1)+OX(-1)+OXO+OX1+2X11

因為b=a=176—176=

(-2)2+2221

88,所以y對x的線性回歸方程為y=1x+88.選C.

規(guī)范答題思維

規(guī)范答題線性相關(guān)關(guān)系的判斷及線性回歸方程的求解

[例](12分)假設(shè)關(guān)于某設(shè)備使用年限x(年)和所支出的維修費用y(萬元)有如

下統(tǒng)計資料:

X23456

y2.23.85.56.57.0

(1)請畫出上表數(shù)據(jù)的散點圖,判斷它們是否具有線性相關(guān)關(guān)系;若線性相關(guān),

用最小二乘法求出y關(guān)于x的線性回歸方程;

(2)試根據(jù)(1)求出的線性回歸方程,預(yù)測使用年限為10年時,維修費用是多

少?

(一)精妙思路點撥

(二)分層規(guī)范細(xì)解

(1)散點圖①如圖所示:

由散點圖可知,兩變量之間具有相關(guān)關(guān)系,且為線性相關(guān)關(guān)系.4分

下面用最小二乘法求線性回歸方程:

列表,計算

i12345

Xi23456

%2.23.85.56.57.0

孫4.411.422.032.542.0

49162536

弟=90,玄力=112.3②

x=4,y=5,

<=1/=1

設(shè)所求回歸方程為:y=bx+a,則由上表可得

5____

?以一5xy

___________112.3-5X4X512.3,田

b~5—90-5X42—10—L23

i=\

8分

■^―②

a=y=5-1.23X4=0.08.

二線性回歸方程為y=1.23x+0.08.10分

(2)把尤=10代入(1)中所求得的線性回歸方程得:

y=1.23X10+0.08=12.38,11分

即使用年限為10年時,維修費用約是12.38萬元③.12分

(三)來自一線的報告

通過閱卷后分析,對解答本題的失分警示和解題啟示總結(jié)如下:(注:此處的

①②③見分層規(guī)范細(xì)解過程)

在解答過程中,①處散點圖的畫法中,橫、縱

①坐標(biāo)的刻度選取不當(dāng),不易觀察散點分布,

會丟失2分;或選取樣本數(shù)據(jù)出現(xiàn)描點錯

誤,也會失2分.

分在解答過程中,②處的計算都很復(fù)雜,易出

警錯,致使后面的解答也易出錯,若出錯,在考

試中最多得5分.

在解答過程中,由回歸方程計算得到的

12.38萬元只是一個預(yù)測值,是實際問題的

一個估計值,因此若最后③處回答中無“約”

字,則會失掉1分.

(1)在解題中注意運用數(shù)形結(jié)合法,正確地畫出圖形.

(2)求線性回歸方程時,注意數(shù)字的運算技巧,提高

啟運算能力.

(3)體會理解公式的作用,在記憶公式的同時,加深

理解公式的特點和規(guī)律.

(四)類題練筆掌握

以下是某地搜集到的新房屋的銷售價格y和房屋的面積x的數(shù)據(jù):

房屋面積Mn?)80105110115135

銷售價格y(萬元)18.42221.624.829.2

(1)畫出數(shù)據(jù)對應(yīng)的散點圖;

(2)求線性回歸方程,并在散點圖中加上回歸直線;

⑶試預(yù)測90m2的房屋,銷售價格是多少?(精確到0.01)

解(1)根據(jù)表中所列數(shù)據(jù)可得散點圖如下:

由圖可見兩者之間是線性相關(guān)的.

(2)列表,計算:

i12345

Xi80105110115135

18.42221.624.829.2

X〉i14722310237628523942

xi640011025121001322518225

__55

x=109,y=23.2,)=60975,12952

2=1/=1

故可求得:

5_____

xy

1=1

b=

ixi-572

7=1

12952—5X109X23,2_

=―60975-5XI092—2°1962'

a=y-Z?x=23.2-0.1962X109=1.8142,

所以,線性回歸方程為y=0196Zc+1.8142,回歸直線如(1)中圖.

(3)把x=90代入上述回歸方程y=0.1962x+1.8142,

即^=0.1962X90+1.8142^19.47,即這種90m2的房屋,銷售價格約是19.47

萬元.

(五)解題設(shè)問

畫出散點圖的作用是什么?.

答案判斷數(shù)據(jù)是否線性相關(guān)

檢測學(xué)業(yè)達標(biāo)

1.設(shè)有一個回歸方程為y=2—1.5x,則變量光增加一個單位時()

A.y平均增加1.5個單位B.y平均增加2個單位

C.y平均減小1.5個單位D.y平均減少2個單位

答案C

解析由相關(guān)系數(shù)的意義可知C正確.

2.線性回歸方程表示的直線y=a+法必定過(

A.(0,0)點B.(x,0)點

C.(0,歹)點D.(x,

答案D

3.試驗測得四組(x,>)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的線

性回歸方程為()

A.y=x+lB.y=x+2

C.y=2x+\D.y=x—1

答案A

解析作散點圖,利用最小二乘法求線性回歸方程.

4.施化肥量xkg與水稻產(chǎn)量ykg在一定范圍內(nèi)線性相關(guān),若線性回歸方程

為y=5x+250,當(dāng)施化肥量為80kg時,預(yù)計水稻的產(chǎn)量為.

答案650kg

解析將x的值代入線性回歸方程即可.

5.假設(shè)學(xué)生在七年級和八年級的數(shù)學(xué)成績是線性相關(guān)的,若10個學(xué)生七年

級㈤和八年級0)數(shù)學(xué)分?jǐn)?shù)如下:

X74717268767367706574

y76757170767965776272

試求七年級和八年級數(shù)學(xué)分?jǐn)?shù)間的回歸直線方程.

解因為三=71,£^=50520,

10

9=72.3,》科=51467,

51467—10X71X72.3

所以b=—50520-10X712=1.2182,

a=72.3—1.2182X71=—14.192.

A

回歸直線方程是y=1.2182x—14.192.

課后梯度測評

一'選擇題

1.過三點(3,10),(7,20),(11,24)的線性回歸直線方程是()

A.y=1.75-5.75%B.-1.75+5.75%

C.y=5.75+1.75xD.y=5.75—1.75x

答案C

解析根據(jù)求線性回歸方程的方法,利用公式可得到答案.

2.抽測10只某種白熾燈的使用壽命尤,結(jié)果如下(單位:力:1067,919,1196,785,

A936,918,1156,920,918,若4=997,則/大約是()

A.1120B.1124C.1155D.1128

答案C

3.在線性回歸方程中,b表示()

A.當(dāng)x增加一個單位時,y增加a的數(shù)量

B.當(dāng)y增加一個單位時,x增加b的數(shù)量

C.當(dāng)x增加一個單位時,y的平均變化量

D.當(dāng)y增加一個單位時,x的平均變化量

答案C

解析本題主要考查線性回歸方程中m。的含義.

4.由一組樣本數(shù)據(jù)8,yi),(%2,)2),…,(X”,%)得到線性回歸方程y=bx

+“,那么下列說法中錯誤的是()

A.直線y=b:+a必經(jīng)過點(x,y)

B.直線y=/zr+a至少經(jīng)過點(修,力),(物”),…,(尤"%)中的一個點

y

f=l

C.直線y=bx+a的斜率為b=-----------

2

<=1

n

D.直線y=bx+a和各點(xi,%),(檢,"),…,(x”,%)的偏差的平方和

i=i

兇一(如+喇2是該坐標(biāo)平面上所有直線與這些點的偏差的平方和中最小的

答案B

解析理解線性回歸方程的真正含義.因為7=人工+。,其中三=/沏+%2

HFx?)?y=%i+y2Tl-yn),顯然回歸直線經(jīng)過點(x,y).故A是正確的.回

歸直線最能近似刻畫點(汨,yi),(X2,"),…,(X”,y”)的變化趨勢,但并不一定

經(jīng)過某些點.故B是錯誤的.對于C、D只需了解相應(yīng)概念便會得出正確結(jié)論.

5.下列敘述中:

①變量間關(guān)系有函數(shù)關(guān)系,還有相關(guān)關(guān)系;

②回歸函數(shù)即用函數(shù)關(guān)系近似地描述相互關(guān)系;

n

③營商=修+尬+…

n__

"£(即一x)(y-y)__

④線性回歸方程y=/?x+a中,b=71二,a=y~bx;

石(x-x)2

⑤線性回歸方程一定可以近似地表示所有相關(guān)關(guān)系.

其中正確的有()

A.①②③B.①②④⑤

C.①②③④D.③④⑤

答案C

解析利用直接法逐個判斷可知,①②③④正確,而⑤線性回歸方程可以近

似地表示具有線性相關(guān)關(guān)系,而不能表示其他相關(guān)關(guān)系.

6.某化工廠為預(yù)測某產(chǎn)品的回收率y,需要研究它和原料有效成份含量x之

888

間的相關(guān)關(guān)系,現(xiàn)取了8對觀察值,計算得:石片=52,石%=228,,?肅=478,

8

X=RY=1849,則y與x的回歸方程是()

l1

AA

A.y=11.47+2.62rB.y=-11.47+2.62%

C.y=2.62+22.47xDj=11.47-2.62%

答案A

解析把題目所給的數(shù)據(jù)代入公式分別求系數(shù)。和人即可.

二、填空題

7.調(diào)查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬

元),調(diào)查顯示年收入尤與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)

對尤的回歸直線方程:;=0.254x+0.321.由回歸直線方程可知,家庭年收入每增

加1萬元,年飲食支出平均增加萬元.

答案0.254

解析本小題主要考查了利用回歸直線方程,對數(shù)據(jù)進行估計.以x+1代X,

得0.254(x+1)+0.321,與0.254x+0.321相減可得,年飲食支出平均增加0.254

萬元.

8.某商店統(tǒng)計了最近6個月某商品的進價x與售價y(單位:元)的對應(yīng)數(shù)據(jù)

如下:

X3528912

y46391214

__66

則尤=,y=,耳6=,N項y尸,回歸

方程為.

A

答案6.58327396y=1.4x+0.571

6

解析根據(jù)公式代入即可求得,也可以利用計算器求得,7=6.5,7=8,

6A

焉=327,石x,y=396,回歸方程為y=1.4x+0.571.

9.假設(shè)學(xué)生在初中的英語成績和高一英語成績是線性相關(guān)的.現(xiàn)有10名學(xué)

解析求斜率即求回歸方程中的。,按照公式進行即可,即需要依次計算出工

10_1051467-10X71X72.3

-71,gx--50520,y—72.3,石1%-51467,所以b-

50520-10X712

^1.2182,所以斜率為1.2182.

三'解答題

10.在10年期間,一城市居民的年收入與某種商品的銷售額有如下數(shù)據(jù):

第幾年12345678910

城市居

民年收入32.231.132.935.837.138.039.043.044.646.0

7(億元)

某種商品

銷售額25.030.031.037.039.041.042.044.048.051.0

y(萬元)

(1)畫出散點圖;

(2)如果散點圖中的各點大致分布在一條直線的附近,求y與x之間的線性回

歸方程.

解(1)散點圖如圖.

銷售額(萬元)

52

48

44

40

36

32

28

24

人人八人111111111___________-

0T303234363840424446年收入(億元)

(2)由圖可知,y與x線性相關(guān),列表計算如下:

1乃y石”

132.225.0805

231.130.0933

332.934.01118.6

T=37.97,5=39.1

435.837.01324.69

10。

£—=14663.67,

537.139.01446.9r=1

10

638.041.01558=15202.9

/=1

739.042.01638

843.044.01892

944.648.02140.8

1046.051.02346

-X_____

心-15202.9-10X37.97X39.1

所以b=14663.67—10X37.972乂一,,=39.1-1.447X37.97--

15.843,因此,所求線性回歸方程為y=1.447x-15.843.

11.PM2.5是指空氣中直徑小于或等于2.5微米的顆粒物(也稱可入肺顆粒物),

為了探究車流量與PM2.5的濃度是否相關(guān),現(xiàn)采集到某城市周一至周五某時間段

車流量與PM2.5濃度的數(shù)據(jù)如下表:

時間周一周二周三周四周五

車流量M萬輛)100102108114116

濃度y(微克/立方米)7880848890

(1)根據(jù)上表數(shù)據(jù),用最小二乘法求出y與x的線性回歸方程;

(2)若周六同一時段車流量是200萬輛,試根據(jù)⑴求出的線性回歸方程,預(yù)測

此時PM2.5的濃度為多少?

_15540

解(1)由條件可知,x產(chǎn)5=1。8,

/=1

-14200

5—84,

i=l

5__

z(即-X)(M-y)=(—8)義(-6)+(—6)X(—4)+0X0+6X4+8X6=144,

/=1

5_

Z(X/—x『=(—8)2+(—6)2+02+62+82=200,

/=!

5__

Z8-X)(y-y)

/=1144

b=—;2=200=°-72,

X(XLX)2

Z=1

a=y一〃x=84—0.72義108=6.24,

A

故y關(guān)于x的線性回歸方程為y=0.72x+6.24.

A

(2)當(dāng)尤=200時,y=0.72X200+6.24=150.24.

所以可以預(yù)測此時PM2.5的濃度約為150.24微克/立方米.

12.某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù):

年份20102012201420162018

需求量(萬噸)236246257276286

(1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程y=foc+a;

(2)利用(1)中所求出的直線方程預(yù)測該地2020年的糧食需求量.

解本題考查回歸分析的基本思想及其初步應(yīng)用、回歸直線的意義和求法、

數(shù)據(jù)處理的基本方法和能力,考查運用統(tǒng)計知識解決簡單實際應(yīng)用問題的能力.

(1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升,下面來求回歸直

線方程.為此對數(shù)據(jù)預(yù)處理如下:

年份一2014-4-2024

需求量一257-21-1101929

對預(yù)處理后的數(shù)據(jù),容易算得意=0,7=3.2,

(-4)X(-21)+(-2)X(-ll)+2X19+4X29

b=42+22+22+42

6z2—yhx=3.2.

由上述計算結(jié)果,知所求回歸直線方程為y—257=b(x—2014)+a=6.5(x—

2014)+3.2,

A

即產(chǎn)6.5?!?014)+2602①

(2)利用直線方程①,可預(yù)測2020年的糧食需求量為

6.5X(2020—2014)+260.2=6.5X6+260.2=299.2(萬噸)Q300(萬噸).(未寫

近似值不扣分)

13.日常生活中,某些東西所含的熱量比較高,對我們的身體有一定的影響,

下表給出了不同類型八種餅干的數(shù)據(jù),第一列數(shù)據(jù)表示八種餅干各含熱量的百分

比,第二列數(shù)據(jù)表示顧客對八種餅干所給予分?jǐn)?shù)(百分制).

品種所含熱量的百分比口味記錄

125

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論