




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第3節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計案例
知識分類落實回扣知識?夯實基礎(chǔ)
知識梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,
這種關(guān)系稱為相關(guān)關(guān)系.
(2)正相關(guān)、負(fù)相關(guān)
從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,
我們就稱這兩個變量正相關(guān);如果一個變量值增加時,另一個變量的相應(yīng)值呈現(xiàn)
減少的趨勢,則稱這兩個變量負(fù)相關(guān).
(3)線性相關(guān)
一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條線附近,
我們就稱這兩個變量線性相關(guān).
一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量
非線性相關(guān)或曲線相關(guān).
2.樣本相關(guān)系數(shù)
⑴相關(guān)系數(shù)r的計算
變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:
n__
£(x(—JC)(y(—y)
①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)/<0時,成對樣本數(shù)據(jù)魚相關(guān);當(dāng)/?=()
時,成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為f—1,11.
當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)卜|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
(1)線性回歸方程與最小二乘法
我們將j=£+聯(lián)稱為y關(guān)于x的線性回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公
式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求
得的2,展叫做。,。的最小二乘估計,
其中
"〃-?―
£(XLX)(?-y)S.w一欣)
Z(X/_x)2
i=1i=l
A—A—
<a=y-bx.
⑵利用相關(guān)指數(shù)W刻畫回歸效果
n
£(W)2
i=1
R2=l----------,心越大,即擬合效果越好,N越小,模型擬合效果越
n_——
£(y_y)2
z=l
差.
4.列聯(lián)表與獨(dú)立性檢驗
⑴2X2列聯(lián)表
一般地,假設(shè)有兩個分類變量X和K它們的取值分別為{xi,及}和{6,"},其
2X2列聯(lián)表為
合計
X\aba+b
X2Cdc+d
合計a+cb+do+b+c+d
(2)臨界值
H(nd—be)2
尸(工八,、萬?忽略/的實際分布與該近似分布的誤
A<a+b)J\c+a)(a4+c)\“b4+d)A
差后,對于任何小概率值a,可以找到相應(yīng)的正實數(shù)%,使得Pdexa):。成立.
我們稱均為a的臨界值,這個臨界值就可作為判斷Z2大小的標(biāo)準(zhǔn).
(3)獨(dú)立性檢驗
基于小概率值a的檢驗規(guī)則是:
當(dāng)爐2刈時,我們就推斷法不成立,即認(rèn)為X和丫不獨(dú)立,該推斷犯錯誤的概
率不超過a;
當(dāng)/〈玄時,我們沒有充分證據(jù)推斷從不成立,可以認(rèn)為X和丫獨(dú)立.
這種利用Z2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為Z2獨(dú)立性檢驗,讀
作“卡方獨(dú)立性檢驗”,簡稱獨(dú)立性檢驗.
下表給出了Z2獨(dú)立性檢驗中幾個常用的小概率值和相應(yīng)的臨界值
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
?—常用結(jié)論與微點(diǎn)提醒
1.求解回歸方程的關(guān)鍵是確定回歸系數(shù)展,Z,應(yīng)充分利用回歸直線過樣本點(diǎn)的中
心(尤,y).
2.根據(jù)回歸方程計算的;值,僅是一個預(yù)報值,不是真實發(fā)生的值.
3.根據(jù)爐的值可以判斷兩個分類變量有關(guān)的可信程度,若/越大,則兩分類變
量有關(guān)的把握越大.
診斷自測
??思考辨析
1.判斷下列結(jié)論正誤(在括號內(nèi)打“J”或“義”)
⑴“名師出高徒”可以解釋為教師的教學(xué)水平與學(xué)生的水平成正相關(guān)關(guān)
系.()
(2)通過回歸直線方程;=晨+2可以估計預(yù)報變量的取值和變化趨勢.()
(3)只有兩個變量有相關(guān)關(guān)系,所得到的回歸模型才有預(yù)測價值.()
(4)事件X,V關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的蜉的觀測值越大.()
答案(1”(2)7(3)7(4)7
〉教材衍化
2.為調(diào)查中學(xué)生近視情況,測得某校在150名男生中有80名近視,在140名女
生中有70名近視.在檢驗這些學(xué)生眼睛近視是否與性別有關(guān)時,用下列哪種方
法最有說服力()
A.回歸分析B.均值與方差
C.獨(dú)立性檢驗D.概率
答案C
解析“近視”與“性別”是兩類變量,其是否有關(guān),應(yīng)用獨(dú)立性檢驗判斷.
3.(多選題)在統(tǒng)計中,由一組樣本數(shù)據(jù)(*[,>1),。2,>2),…,(X",力)利用最小
二乘法得到兩個變量的線性回歸方程為:=£+;那么下列說法正確的是()
A.相關(guān)系數(shù)r不可能等于1
AAA——
B.直線y=bx+a必經(jīng)過點(diǎn)(x,y)
C.直線(=£+)表示最接近y與x之間真實關(guān)系的一條直線
D.相關(guān)系數(shù)為「,且|r|越接近于1,相關(guān)程度越大;田越接近于0,相關(guān)程度越
小
答案BCD
解析相關(guān)系數(shù)的取值范圍是|r|Wl,故A錯誤;直線;=£+:必過樣本點(diǎn)中心
即點(diǎn)(;,y),故B正確;直線;=£+聯(lián)是采用最小二乘法求解出的直線方程,接
近真實關(guān)系,故C正確;相關(guān)系數(shù)r的絕對值越接近于1,表示相關(guān)程度越強(qiáng),
越接近于0,相關(guān)程度越弱,故D正確.故選BCD.
>考題體驗
4.(2020?貴陽期末)已知關(guān)于變量x,y的線性回歸方程為<=0.25x+0.55,且x,
y的相關(guān)數(shù)據(jù)如下表所示,則表格中加的值為()
X1234
y0.8m1.41.5
A.lB.1.05C.1.2D.2
答案A
解析由題意知;="27+4=2.5,
O.8+/71+1.4+1.53.7+用
尸4,
所以樣本點(diǎn)的中心為(2.5,安竺),
3.7+機(jī)
代入線性回歸方程y=0.25x+0.55,得J—=0.25X2.5+0.55,解得m=l.
5.(2020.全國I卷)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度
x(單位:℃)的關(guān)系,在20個不同的溫度條件下進(jìn)行種子發(fā)芽實驗,由實驗數(shù)據(jù)
(Xi,yi)(i=l,2,…,20)得到下面的散點(diǎn)圖:
100%
80%
出60%
孤40%
203()40
由此散點(diǎn)圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率
y和溫度x的回歸方程類型的是()
A.y=a-\~bxB.y=a+bx1
C.y=a+beD.y=a+b\nx
答案D
解析由散點(diǎn)圖可以看出,這些點(diǎn)大致分布在對數(shù)型函數(shù)的圖象附近.故選D.
6.(2020.聊城模擬)某校為了研究“學(xué)生的性別”和“對待某一活動的態(tài)度”是
2
否有關(guān),運(yùn)用2X2列聯(lián)表進(jìn)行獨(dú)立性檢驗,經(jīng)計算/=7.069,則認(rèn)為“學(xué)生性
別與支持某項活動有關(guān)系”的犯錯誤的概率不超過()
A.0.1%B.1%
C.99%D.99.9%
答案B
2
解析V/=7.O69>6.635=XO.OI,
???認(rèn)為“學(xué)生性別與支持某項活動有關(guān)系”的犯錯誤的概率不超過1%.
考點(diǎn)分層突破考點(diǎn)聚焦?題型剖析
考點(diǎn)一相關(guān)關(guān)系的判斷自主演練
1.下列四個散點(diǎn)圖中,變量x與y之間具有負(fù)的線性相關(guān)關(guān)系的是()
xO
AB
CD
答案D
解析觀察散點(diǎn)圖可知,只有D選項的散點(diǎn)圖表示的是變量x與y之間具有負(fù)
的線性相關(guān)關(guān)系.故選D.
2.(2020.重慶診斷)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率
統(tǒng)計表如下:
月份123456
人均銷售額658347
利潤率(%)12.610.418.53.08.116.3
根據(jù)表中數(shù)據(jù),下列說法正確的是()
A.利潤率與人均銷售額成正相關(guān)關(guān)系
B.利潤率與人均銷售額成負(fù)相關(guān)關(guān)系
C.利潤率與人均銷售額成正比例函數(shù)關(guān)系
D.利潤率與人均銷售額成反比例函數(shù)關(guān)系
答案A
解析由統(tǒng)計表可得利潤率與人均銷售額不是正比例關(guān)系,也不是反比例關(guān)系,
排除C和D;其屬于正相關(guān)關(guān)系,A正確,B錯誤.
3.(多選題)(2020?淄博模擬)2019年女排世界杯是由國際排聯(lián)(FIVB)舉辦的第13
屆世界杯賽事,比賽于2019年9月14日至9月29日在日本舉行,共有12支參
賽隊伍.最終,中國女排以11戰(zhàn)全勝且只丟3局的成績成功衛(wèi)冕本屆世界杯冠
軍.中國女排的影響力早已超越體育本身的意義,不僅是時代的集體記憶,更是
激勵國人持續(xù)奮斗、自強(qiáng)不息的精神符號.以下是本屆世界杯比賽最終結(jié)果的相
關(guān)數(shù)據(jù),記每個隊的勝場數(shù)為變量x,積分為變量y(只列出了前6名).
排名123456
勝場數(shù)X11108766
積分y322823211918
若y與X之間具有線性相關(guān)關(guān)系,根據(jù)表中數(shù)據(jù)可求得y關(guān)于X的回歸直線方程
為;=2.59x+聯(lián),則下列說法正確的有()
A.a的值為2.78
B.a的值為2.14
C.若整隊在此次比賽中獲勝的場數(shù)是4,根據(jù)線性回歸方程其得分為13分(精
確到整數(shù))
D.由線性回歸方程可知,當(dāng)某個隊伍勝場增加1時,其積分約增加2.59分
答案ACD
——AAA
解析由題知,x=8,y=23.5,代入方程y=2.59x+a,計算得a=2.78,故A正
AA
確,B不正確;將x=4代入方程y=2.59x+2.78,計算得y=13.14仁13,故C正
確;回歸方程中x的系數(shù)是2.59,故D正確.
感悟升華判斷相關(guān)關(guān)系的兩種方法:
(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就
有相關(guān)關(guān)系;如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有
線性相關(guān)關(guān)系.
(2)相關(guān)系數(shù)法:利用相關(guān)系數(shù)判定,川越趨近于1,相關(guān)性越強(qiáng).
考點(diǎn)二回歸分析多維探究
角度1線性回歸方程及應(yīng)用
【例1】下面給出了根據(jù)我國2012?2018年水果人均占有量y(單位:kg)和年份
代碼x繪制的散點(diǎn)圖和線性回歸方程的殘差圖.(2012年?2018年的年份代碼x
分別為1?7)
(
W
B我國2012年~2018年水果人均占有量散點(diǎn)圖
.1
_1?(
7(
sr1
.=16(
間15(
工14(
3(
叼1
2(
XY-1234567
年份代碼K
(
胃2我國2012年~2018年水果人均占有量殘差圖
包1
外0
1
嬴2
望1234567
年份代碼1
⑴根據(jù)散點(diǎn)圖分析y與光之間的相關(guān)關(guān)系;
77
⑵根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計算得£?=1074,£X?=4517,求y關(guān)于元的線性回歸
方程;(精確到0.01)
(3)根據(jù)線性回歸方程的殘差圖,分析線性回歸方程的擬合效果.
附:回歸方程;=:+&中斜率和截距的最小二乘估計公式分別為,=
n--n—
高(為一無)(%一))Y^Xiyi—nxy人_A_
-,ci~y-bx.
玄(%,—%)2Y^—nx1
解(1)從散點(diǎn)圖可以看出,這些點(diǎn)的分布整體上在一條直線附近,且當(dāng)x由小
變大時,y也由小變大,
所以y與x之間具有線性相關(guān)關(guān)系,且是正相關(guān).
1+2+3+4+5+6+7.
(2)由題意可知,x==4,
1工1074
y書y尸〒,
7
£斤=12+22+32+42+52+62+72=140,
7.,、1074
人石孫一7xy4517-7X4X722J_
否_俁=-140—7X42—=而“7.89,
/=!
'-"1074
一氏r=-y—7.89X4^121.87,
A
關(guān)于x的線性回歸方程為y=7.89x+121.87.
(3)由殘差圖可以看出歷年數(shù)據(jù)的殘差均分布在一2?2之間,且圖中各點(diǎn)比較均
勻地分布在數(shù)值0所在直線附近,帶狀區(qū)域很窄,說明對應(yīng)的回歸直線擬合效果
較好.
角度2非線性回歸方程及應(yīng)用
【例2】(2021?四川七市一診)已知某地區(qū)某種昆蟲產(chǎn)卵數(shù)和溫度有關(guān).現(xiàn)收集了
一只該品種昆蟲的產(chǎn)卵數(shù)y(個)和溫度式℃)的7組觀測數(shù)據(jù),其散點(diǎn)圖如圖所示:
產(chǎn)卵數(shù)“個)
30()
250
200
150*
100
-..?
5()
oL.一—::.........
1820222426283()3?23436溫度*(七)
根據(jù)散點(diǎn)圖,結(jié)合函數(shù)知識,可以發(fā)現(xiàn)產(chǎn)卵數(shù)y和溫度x可用方程y=芭'+。來擬
合,令z=lny,結(jié)合樣本數(shù)據(jù)可知z與溫度x可用線性回歸方程來擬合.
根據(jù)收集到的數(shù)據(jù),計算得到如下值:
7-7一一
2£⑵-Z)2
Xyz石(Xi-X)高(X,—x)(z,—Z)
27743.53718211.946.418
表中Zj=lny”z=
⑴求z和溫度x的回歸方程(回歸系數(shù)結(jié)果準(zhǔn)確到0.001);
(2)求產(chǎn)卵數(shù)y關(guān)于溫度x的回歸方程;若該地區(qū)一段時間內(nèi)的氣溫在26℃~36℃
之間(包括26℃與36℃),估計該品種一只昆蟲的產(chǎn)卵數(shù)的范圍.(參考數(shù)據(jù)
37925832:60876342
e3.282g27,e^44fe=?341,e^440,e?=568)
AAA
附:對于一組數(shù)據(jù)(o1,Vl),(692,02),....,{(On,Vn),其回歸直線0=a+伙0
〃一一
A11((Di—CD)(Vi-V)A-A-
的斜率和截距的最小二乘估計分別為尸----------2------------,a=v-/3co.
(如一①)2
zE^l.
解(1)由題意,z和溫度尤可以用線性回歸方程擬合,設(shè);=£+;則2=
7
(X/-X)(Z/-Z)
石46.418
7心0.2550,
N(X;—X)2182
a=z-/?x=3.537—0.2550X27=-3.348,
故z關(guān)于x的線性回歸方程為z=0.255x-3.348.
(2)由(1)可得,lny=0.255x-3.348,
于是產(chǎn)卵數(shù)y關(guān)于溫度X的回歸方程為y=eO255L3.348.
當(dāng)X=26時,y=e°255X26-3.348=e3282心27;
當(dāng)X=36時,y=e0255x36-3.348=e5.832心341.
函數(shù)y=2255廠3.348為增函數(shù),
二氣溫在26℃?36c之間時,估計該品種一只昆蟲的產(chǎn)卵數(shù)的范圍是[27,341]
內(nèi)的正整數(shù).
感悟升華回歸分析問題的類型及解題方法
(1)求回歸方程
①根據(jù)散點(diǎn)圖判斷兩變量是否線性相關(guān),如不是,應(yīng)通過換元構(gòu)造線性相關(guān).
②利用公式,求出回歸系數(shù)
③待定系數(shù)法:利用回歸直線過樣本點(diǎn)的中心求系數(shù)。
(2)利用回歸方程進(jìn)行預(yù)測,把線性回歸方程看作一次函數(shù),求函數(shù)值.
(3)利用回歸直線判斷正、負(fù)相關(guān),決定正相關(guān)還是負(fù)相關(guān)的是系數(shù)江
(4)回歸方程的擬合效果,可以利用相關(guān)系數(shù)判斷,當(dāng)川越趨近于1時,兩變量的
線性相關(guān)性越強(qiáng).
【訓(xùn)練1】(2021.榆林模擬)根據(jù)統(tǒng)計,某蔬菜基地西紅柿畝產(chǎn)量的增加量y(百千
克)與某種液體肥料每畝使用量M千克)之間的對應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示:
>(百千克)
7---------------------------?
6------------------?;
5----------------;;
4-------?;::
3------?:::;
°2456?支(千克)
(1)依據(jù)數(shù)據(jù)的散點(diǎn)圖可以看出,可用線性回歸模型擬合y與X的關(guān)系,請計算相
關(guān)系數(shù)并加以說明(若力>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);
(2)求y關(guān)于x的回歸方程,并預(yù)測液體肥料每畝使用量為12千克時,西紅柿畝
產(chǎn)量的增加量約為多少.
t(xi—x)(y-y)
附:相關(guān)系數(shù)/■二歸工2圖%一旅
n
回歸直線(=Z*+2的斜率和截距的最小二乘估計分別為,=
a=y-bx.
占Cxi-x)2
2+4+5+6+8-34-4+5+6+7
解(l)x==5,y==5.
石(x,—x)(y/-y)=(-3)X(-2)+(-1)X(-1)+OXO+1X1+3X2=14,
£(x,—X)2=(-3)2+(-1)2+02+12+32=20,
5一
玄(y1—y)2=(-2)2+(-I)2+O2+I2+22=IO.
14_7J2
._:?(電一五)2,£(沙一()2V20XVw10
,.r—7m「i>0.75,
...可用線性回歸模型擬合y與x的關(guān)系.
5-
八g(為—x)(?一?。?4
(2)A—5~~on-0.7,
2
目11(劉一x)
則。=了一"=5—0.7義5=1.5,
Ay=0.7x+1.5.
A
當(dāng)x=12時,y=0.7X12+1.5=9.9,
???預(yù)測液體肥料每畝使用量為12千克時,西紅柿畝產(chǎn)量的增加量約為9.9百千
克.
考點(diǎn)三獨(dú)立性檢驗師生共研
【例31(2020.全國III卷)某學(xué)生興趣小組隨機(jī)調(diào)查了某市100天中每天的空氣
質(zhì)量等級和當(dāng)天到某公園鍛煉的人次,整理數(shù)據(jù)得到下表(單位:天):
煉人次
空氣質(zhì)量等^[0,200](200,400](400,600]
1(優(yōu))21625
2(良)51012
3(輕度污染)678
4(中度污染)720
(1)分別估計該市一天的空氣質(zhì)量等級為1,2,3,4的概率;
(2)求一天中到該公園鍛煉的平均人次的估計值(同一組中的數(shù)據(jù)用該組區(qū)間的中
點(diǎn)值為代表);
(3)若某天的空氣質(zhì)量等級為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)
量等級為3或4,則稱這天“空氣質(zhì)量不好”.根據(jù)所給數(shù)據(jù),完成下面的2X2
列聯(lián)表,并根據(jù)列聯(lián)表,能否在犯錯誤的概率不超過0.05的前提下,認(rèn)為一天
中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量有關(guān)?
人次近400人次>400
空氣質(zhì)量好
空氣質(zhì)量不好
n(ad-be)2
(a+Z?)(c+d)(a+c)(b+d)'
a0.0500.0100.001
Xa3.8416.63510.828
解(1)由所給數(shù)據(jù),得該市一天的空氣質(zhì)量等級為1,2,3,4的概率的估計值
如下表:
空氣質(zhì)量等級1234
概率的估計值0.430.270.210.09
(2)一天中到該公園鍛煉的平均人次的估計值為
?^(100X20+300X35+500X45)=350.
(3)根據(jù)所給數(shù)據(jù),可得2X2列聯(lián)表:
人次W400人次>400
空氣質(zhì)量好3337
空氣質(zhì)量不好228
零假設(shè)為Ho:
一天中到該公園鍛煉的人次與該市當(dāng)天的空氣質(zhì)量無關(guān).
根據(jù)列聯(lián)表得
,100X(33X8-22X37)2
工=55X45X70X30^5.820>3.841=%.
根據(jù)小概率值a=0.050的/獨(dú)立性檢驗,可推斷Ho不成立,所以在犯錯誤的概
率不超過0.05的前提下,可認(rèn)為一天中到該公園鍛煉的人次與該市當(dāng)天的空氣
質(zhì)量有關(guān).
感悟升華1.在2X2列聯(lián)表中,如果兩個變量沒有關(guān)系,則應(yīng)滿足"一次七0.園
一反|越小,說明兩個變量之間關(guān)系越弱;園一陽越大,說明兩個變量之間關(guān)系
越強(qiáng).
2.解決獨(dú)立性檢驗的應(yīng)用問題,一定要按照獨(dú)立性檢驗的步驟得出結(jié)論.獨(dú)立性檢
驗的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表:
-2,〃(ad-be)-_
(2)根據(jù)么式/=Q+MQ+C)(b+d)(c+d)計算/;
(3)通過比較/與臨界值的大小關(guān)系來作統(tǒng)計推斷.
【訓(xùn)練2]為了探究學(xué)生選報文、理科是否與對外語的興趣有關(guān),某同學(xué)調(diào)查
了361名高二在校學(xué)生,調(diào)查結(jié)果如下:理科生對外語有興趣的有138人,無興
趣的有98人,文科生對外語有興趣的有73人,無興趣的有52人.試分析學(xué)生選
報文、理科與對外語的興趣是否有關(guān)?
解零假設(shè)為法:選報文、理科與對外語的興趣無關(guān).
列出2X2列聯(lián)表
理文合計
有興趣13873211
無興趣9852150
合計236125361
代入公式得
,361X(138X52—73X98)】
工=236X125X211X150
V1.871X1O^4<2.7O6=XO.I,
根據(jù)小概率值a=0.1的三獨(dú)立性檢驗,沒有充分證據(jù)推斷“o不成立,即選報文、
理科與對外語的興趣無關(guān).
課后鞏固作業(yè)分層訓(xùn)練?提升能力
A級基礎(chǔ)鞏固
一、選擇題
1.對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正
確的是()
()51()1520253()35°51()1520253035
相關(guān)系數(shù)為。相關(guān)系數(shù)為七
(1)(2)
051()1520253035051()1520253035
相關(guān)系數(shù)為匚1相關(guān)系數(shù)為口
(3)(4)
A.-2<-4<0<r3<〃B.r4<f2<0<n<r3
C-r4<r2<0<r3<nD.r2<^4<0<n<r3
答案A
解析由散點(diǎn)圖知圖(1)與圖(3)是正相關(guān),故n>0,r3>0,圖(2)與圖(4)是負(fù)相關(guān),
故r2<0,r4<0,且圖⑴與圖(2)的樣本點(diǎn)集中在一條直線附近,因此r2<r4<0<r3<n,
故選A.
2.有下列說法:①在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說
明選用的模型比較合適;②用相關(guān)指數(shù)R2來刻畫回歸的效果,火2值越接近于1,
說明模型的擬合效果越好;③比較兩個模型的擬合效果,可以比較殘差平方和的
大小,殘差平方和越小的模型,擬合效果越好.正確的是()
A.①②B.②③C.①③D.①②③
答案D
3.(多選題)(2020.棗莊模擬)某大學(xué)為了解學(xué)生對學(xué)校食堂服務(wù)的滿意度,隨機(jī)調(diào)
查了50名男生和50名女生,每位學(xué)生對食堂的服務(wù)給出滿意或不滿意的評價,
得到如下所示的列聯(lián)表,經(jīng)計算小心4.762,則可以推斷出()
滿意不滿意
男3020
女4010
a0.1000.0500.010
Xa2.7063.8416.635
3
A.該學(xué)校男生對食堂服務(wù)滿意的概率的估計值為;
B.調(diào)研結(jié)果顯示,該學(xué)校男生比女生對食堂服務(wù)更滿意
C.認(rèn)為男、女生對該食堂服務(wù)的評價有差異此推斷犯錯誤的概率不超過0.05
D.認(rèn)為男、女生對該食堂服務(wù)的評價有差異此推斷犯錯誤的概率不超過0.01
答案AC
303
解析對于選項A,該學(xué)校男生對食堂服務(wù)滿意的概率的估計值為就用=巳
INV/J
故A正確;
對于選項B,該學(xué)校女生對食堂服務(wù)滿意的概率的估計值為4常0行=々4>與3,故B
錯誤;
因為/心4.762>3.841=處05,認(rèn)為男、女生對該食堂服務(wù)的評價有差異,此推
斷犯錯誤的概率不超過0.05,故C正確,D錯誤.
4.(多選題)(2021.武漢調(diào)研)已知某產(chǎn)品的銷售額y(單位:萬元)與廣告費(fèi)用x(單
位:萬元)之間的關(guān)系如下表:
x(單位:萬元)01234
y(單位:萬元)1015m3035
若根據(jù)表中的數(shù)據(jù)用最小二乘法求得),與x的回歸直線方程為;=6.5x+9,則下
列說法中正確的是()
A.產(chǎn)品的銷售額與廣告費(fèi)用成正相關(guān)
B.該回歸直線過點(diǎn)(2,22)
C.當(dāng)廣告費(fèi)用為10萬元時,銷售額一定為74萬元
D.初的值是20
答案ABD
解析由線性回歸方程;=6.5尤+9中的回歸系數(shù)6.5〉0,可知產(chǎn)品的銷售額與廣
告費(fèi)用成正相關(guān),故A中的說法正確;
0+1+2+3+4-10+15+ni+30+3590+mA
尤=5=2,y=5=——代入y=6.5x+9,得
90|YY\.
-^―=6.5X2+9,解得加=20,故D中的說法正確;
90+加90+20
不一=—?—=22,則該回歸直線過點(diǎn)(2,22),故B中的說法正確A;
當(dāng)x=10時,>=6.5X10+9=74,說明當(dāng)廣告費(fèi)用為10萬元時,銷售額預(yù)計為
74萬元,故C中的說法錯誤.故選ABD.
5.(多選題)(2021.廣東百校聯(lián)考)下表是我國某城市在2019年1月份至10月份
期間各月最低溫度與最高溫度(單位:。C)的數(shù)據(jù)一覽表.
月份12345678910
最高溫
59911172427303121
度/℃
最低溫
-12-31-271719232510
度/℃
已知該城市的各月最低溫度與最高溫度具有相關(guān)關(guān)系,根據(jù)該一覽表,則下列結(jié)
論正確的是()
A.最低溫度與最高溫度為正相關(guān)
B.每月最高溫度與最低溫度的平均值在前8個月逐月增加
C.月溫差(最高溫度減最低溫度)的最大值出現(xiàn)在1月
D.1月至4月的月溫差(最高溫度減最低溫度)相對于7月至10月,波動性更大
答案ACD
解析將最高溫度、最低溫度、溫差列表如下:
月份12345678910
最高溫
59911172427303121
度/℃
最低溫-12-31-271719232510
度/℃
溫差
171281310787611
度/℃
由表格可知,最低溫度大致隨最高溫度的升高而升高,A正確;
每月最高溫度與最低溫度的平均值在前8個月不是逐月增加,B錯誤;
月溫差的最大值出現(xiàn)在1月,C正確;
1月至4月的月溫差相對于7月至10月,波動性更大,D正確.
6.2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個中國城市入
選,美麗的黃山風(fēng)景和人文景觀迎來眾多賓客.現(xiàn)在很多人喜歡“自助游”,某
調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了
100人,得如下所示的列聯(lián)表:
贊成“自助游”不贊成“自助游”總計
男性301545
女性451055
總計7525100
公上八a,nQad-bc)2
參考公式:兄=(c++(〃+c)(b+d),其中〃=a+,+c+”
a0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
Xa
參照公式,得到的正確結(jié)論是()
A.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別無關(guān)”
B.有99.5%以上的把握認(rèn)為“贊成'自助游'與性別有關(guān)”
C.在犯錯誤的概率不超過0.1的前提下,認(rèn)為“贊成'自助游'與性別無關(guān)”
D.在犯錯誤的概率不超過0.1的前提下,認(rèn)為“贊成‘自助游'與性別有關(guān)”
答案D
解析將2X2列聯(lián)表中的數(shù)據(jù)代入計算,得
43zxJJ/J/XZD
^3.030>2.706=X()J,
...在犯錯誤的概率不超過0.1的前提下,可以認(rèn)為“贊成‘自助游’與性別有
二'填空題
7.已知x和y的散點(diǎn)圖如圖所示,在相關(guān)關(guān)系中,若用y=ciec2X擬合時的相關(guān)
指數(shù)為品用;=£+聯(lián)擬合時的相關(guān)指數(shù)為臉則冊虺中較大的是.
y
3(XX)"■
2500?
2000*
15(X)?
1(XX)??.
5(X),..
012345678910x
答案/?T
解析由散點(diǎn)圖知,用y=aec>擬合的效果比擬合的效果要好,所以
7?T>/?2,故較大者為此.
8.在一次對人體脂肪含量和年齡的關(guān)系的研究中,研究人員獲得了一組樣本數(shù)
據(jù),并制成如圖所示的人體脂肪含量與年齡的關(guān)系的散點(diǎn)圖,下列結(jié)論中正確的
是(填序號).
脂肪含量/%
35
30■??
25■??
2()?
10?
一?
5?
口1520253()3540455()5560年齡/歲
①人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)等于20%;
②人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于20%;
③人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)等于20%;
④人體脂肪含量與年齡負(fù)相關(guān),且脂肪含量的中位數(shù)小于20%.
答案②
解析觀察圖形,可知人體脂肪含量與年齡正相關(guān),且脂肪含量的中位數(shù)小于
20%.
9.某醫(yī)療研究所為了檢驗?zāi)撤N血清預(yù)防感冒的作用,把500名使用血清的人與另
外500名未使用血清的人一年中的感冒記錄作比較,提出假設(shè)”0:“這種血清
不能起到預(yù)防感冒的作用”,利用2X2列聯(lián)表計算得三q3.918,經(jīng)查臨界值表
知孫.05=3.841.則下列結(jié)論中,正確結(jié)論的序號是.
①認(rèn)為“這種血清能起到預(yù)防感冒的作用”犯錯誤的概率不超過0.05;②若某人
未使用該血清,那么他在一年中有95%的可能性得感冒;③這種血清預(yù)防感冒的
有效率為95%;④這種血清預(yù)防感冒的有效率為5%.
答案①
解析Z2^3.918^3.841=X(),()5,所以認(rèn)為“這種血清能起到預(yù)防感冒的作用”,
這種推斷犯錯誤的概率不超過0.05.要注意我們檢驗的是假設(shè)是否成立和該血清
預(yù)防感冒的有效率是沒有關(guān)系的,不是同一個問題,不要混淆.
三'解答題
10.(2020.全國H卷)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)
量有所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地
塊,從這些地塊中用簡單隨機(jī)抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)
據(jù)⑶,y)(i=l,2,…,20),其中劉和y?分別表示第i個樣區(qū)的植物覆蓋面積(單
202020
位:公頃)和這種野生動物的數(shù)量,并計算得£為=60,£?=1200,£(Xi-X)2
20-20--
2
=80,£(y(—y)=9000,E.(x,—x)(y/—y)=800.
(1)求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣區(qū)這
種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));
(2)求樣本?,y,)(z=l,2,…,20)的相關(guān)系數(shù)(精確到0.01);
(3)根據(jù)現(xiàn)有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性
以獲得該地區(qū)這種野生動物數(shù)量更準(zhǔn)確的估計,請給出一種你認(rèn)為更合理的抽樣
方法,并說明理由.
n一
X(即一x)(y—y)
附:相關(guān)系數(shù)r=j:.,:.一,6七1.414.
(XLX)(%一丁)2
-120
解(1)由已知得樣本平均數(shù)曠=m1>=60,從而該地區(qū)這種野生動物數(shù)量的估
計值為60X200=12000.
(2)樣本⑶,%)(i=l,2,…,20)的相關(guān)系數(shù)
20--
石(為一x)(M—y)8002/八、
?2y(工一^80X900?!?七?4.
2高(為一》)(y,一y)丫
(3)分層抽樣:根據(jù)植物覆蓋面積的大小對地塊分層,再對200個地塊進(jìn)行分層
抽樣.
理由如下:由(2)知各樣區(qū)的這種野生動物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān)
性.由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動物數(shù)量差異
也很大,采用分層抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高
了樣本的代表性,從而可以獲得該地區(qū)這種野生動物數(shù)量更準(zhǔn)確的估計.
11.某公司為了準(zhǔn)確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進(jìn)行整
理得到了第x年與年銷售量y(單位:萬件)之間的關(guān)系如下表:
X1234
y12284256
(1)在圖中畫出表中數(shù)據(jù)的散點(diǎn)缸
tw萬件
60
5()
40
30
20
1()
o\i234
(2)根據(jù)散點(diǎn)圖選擇合適的回歸模型擬合y與x的關(guān)系(不必說明理由);
(3)建立y關(guān)于x的回歸方程,預(yù)測第5年的銷售量.
參考公式:回歸直線x的斜率和截距的最小二乘估計分別為
2(看一工)(y-亍)£①3i—nxy
?=I1
A—x)2*—TlNa-a-
b=i=1i=ia=y-bx.
解(1)作出的散點(diǎn)圖如圖:
t"萬件
6().
50-
40■,
20-
10-,
"O|~1234
(2)根據(jù)散點(diǎn)圖觀察,可以用線性回歸模型擬合y與x的關(guān)系.
(3)觀察(1)中散點(diǎn)圖可知各點(diǎn)大致分布在一條直線附近,列出表格:,
iXiXi孫
1112112
2228456
33429126
445616224
E1013830418
可得尤-=宗569
產(chǎn)不
4)亍
i=l569
418-4X^Xy_
AS7^—4T273
所以方=i1'
30-4蜀25
片『屋增‘義|=—2.
A73
故回歸直線方程為y=下一2.
A73
當(dāng)尸5時,尸亍X5—2=7L
故預(yù)測第5年的銷售量大約為71萬件.
B級能力提升
12.在吸煙與患肺癌這兩個分類變量的獨(dú)立性檢驗的計算中,下列說法正確的是
()
A.若/=6.635,在犯錯誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌有關(guān)系,
那么在100個吸煙的人中必有99人患有肺癌
B.由獨(dú)立性檢驗可知,在犯錯誤的概率不超過0.01的前提下認(rèn)為吸煙與患肺癌
有關(guān)系時,我們說某人吸煙,那么他有99%的可能患有肺癌
C.若從統(tǒng)計量中求出在犯錯誤的概率不超過0.01的前提下認(rèn)為吸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園年終個人工作總結(jié)范文(35篇)
- 2025年監(jiān)督員工作總結(jié)范文(18篇)
- 人教版八年級數(shù)學(xué)下冊《19.2.3一次函數(shù)與方程、不等式》同步測試題(附答案)
- 《自主學(xué)習(xí)分類》課件
- 爭當(dāng)文明學(xué)生演講稿三分鐘(4篇)
- 有關(guān)合伙經(jīng)營合同范文(15篇)
- 企業(yè)員工辭職報告(15篇)
- 教師會議發(fā)言稿范文(19篇)
- 教學(xué)設(shè)計方案(17篇)
- 2025年建筑承包合同樣本(16篇)
- 企業(yè)所得稅匯算清繳申報表電子表格版(帶公式-自動計算)
- 舞蹈與健康智慧樹知到期末考試答案章節(jié)答案2024年武漢科技大學(xué)
- 2024年四川省成都市溫江區(qū)中考數(shù)學(xué)二診試卷(含答案)
- 《電網(wǎng)工程監(jiān)理導(dǎo)則》
- 超星爾雅學(xué)習(xí)通《形象管理(南開大學(xué))》2024章節(jié)測試答案
- 2024年上海市虹口區(qū)街道社區(qū)工作者招聘筆試沖刺題(帶答案解析)
- 堅持制度自信
- 2024年廣東省珠海高新技術(shù)創(chuàng)新創(chuàng)業(yè)服務(wù)中心招聘歷年高頻考題難、易錯點(diǎn)模擬試題(共500題)附帶答案詳解
- 第二章有機(jī)物分子中共線共面的判斷(帶答案解析)高二化學(xué)精講講義(人教版2019選擇性必修3)
- 急診科護(hù)理金點(diǎn)子
- SN-T0273-2014出口商品運(yùn)輸包裝木箱檢驗檢疫規(guī)程
評論
0/150
提交評論