




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
專題57成對數(shù)據(jù)的統(tǒng)計分析(新高考專用)
目錄
【知識梳理】................................................................2
【真題自測】................................................................4
【考點(diǎn)突破】...............................................................14
【考點(diǎn)1】成對數(shù)據(jù)的相關(guān)性..................................................14
【考點(diǎn)2】回歸分析..........................................................17
【考點(diǎn)3】獨(dú)立性檢驗(yàn)........................................................25
【分層檢測】...............................................................35
【基礎(chǔ)篇】.................................................................35
【能力篇】.................................................................43
考試要求:
1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義.
2.了解一元線性回歸模型和2X2列聯(lián)表,會運(yùn)用這些方法解決簡單的實(shí)際問題.
3.會利用統(tǒng)計軟件進(jìn)行數(shù)據(jù)分析.
融知識梳理
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系
兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為
相關(guān)關(guān)系.
(2)相關(guān)關(guān)系的分類:正相關(guān)和負(fù)相關(guān).
(3)線性相關(guān)
一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我們就稱這
兩個變量線性相關(guān).
一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或
曲線相關(guān).
2.樣本相關(guān)系數(shù)
⑴相關(guān)系數(shù)廠的計算
變量x和變量y的樣本相關(guān)系數(shù)r的計算公式如下:
11
S一M-y)
?=1
(2)相關(guān)系數(shù)r的性質(zhì)
①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,成對樣本數(shù)據(jù)負(fù)相關(guān);當(dāng)r=0時,成對樣
本數(shù)據(jù)間沒有線性相關(guān)關(guān)系.
②樣本相關(guān)系數(shù)r的取值范圍為「一1,11
當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);
當(dāng)|r|越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.
3.一元線性回歸模型
(1)經(jīng)驗(yàn)回歸方程與最小二乘法
我們將〈=£+:稱為y關(guān)于%的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱
為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的3二叫做。的最小二
2
乘估計,
其中
nn
y
—?一1)(”?—J)Hx,yl,~ln^Jc~y
-i=i=1
b=—n
2v2
S(JC,—JC)ZJ/i-nx
=1i=i
a=y-bx.
(2)利用決定系數(shù)F刻畫回歸效果
(乂一3,尸
z
J?=l-—n
\、
:=1,收越大,即擬合效果越好,F(xiàn)越小,模型擬合效果越差.
4.列聯(lián)表與獨(dú)立性檢驗(yàn)
(1)2X2列聯(lián)表
一般地,假設(shè)有兩個分類變量X和匕它們的取值分別為{xi,基}和{”,"},其2X2列聯(lián)表
為
y
X合計
尸券
X~X\aba+b
X~X2cdc~\~d
合計a~\~cb+dn—a~\~b~\~c~\~d
⑵臨界值
H(nd-be")2
/=(小)(c+d)Q+c)?忽略/的實(shí)際分布與該近似分布的誤差后,對于任何
小概率值a,可以找到相應(yīng)的正實(shí)數(shù)Xa,使得「&三發(fā))=&成立.我們稱Xa為a的臨界值,這
個臨界值就可作為判斷H大小的標(biāo)準(zhǔn).
(3)獨(dú)立性檢驗(yàn)
基于小概率值a的檢驗(yàn)規(guī)則是:
當(dāng)三、我時,我們就推斷Ho不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的概率不超過a;
當(dāng)/2<羽時,我們沒有充分證據(jù)推斷Ho不成立,可以認(rèn)為X和y獨(dú)立.
這種利用X2的取值推斷分類變量X和y是否獨(dú)立的方法稱為X2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立
性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).
下表給出了X2獨(dú)立性檢驗(yàn)中幾個常用的小概率值和相應(yīng)的臨界值
3
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
I常用結(jié)論
1.求解經(jīng)驗(yàn)回歸方程的關(guān)鍵是確定回歸系數(shù):,b,應(yīng)充分利用回歸直線過樣本點(diǎn)的中心(x,y).
2.根據(jù)經(jīng)驗(yàn)回歸方程計算的(值,僅是一個預(yù)報值,不是真實(shí)發(fā)生的值.
3.根據(jù)/的值可以判斷兩個分類變量有關(guān)的可信程度,若/越大,則兩分類變量有關(guān)的把握越
大.
BE真題自測
一、單選題
1.(2024?全國?高考真題)某農(nóng)業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的
畝產(chǎn)量(單位:kg)并整理如下表
畝產(chǎn)
[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)
量
頻數(shù)61218302410
根據(jù)表中數(shù)據(jù),下列結(jié)論中正確的是()
A.100塊稻田畝產(chǎn)量的中位數(shù)小于1050kg
B.100塊稻田中畝產(chǎn)量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產(chǎn)量的極差介于200kg至300kg之間
D.100塊稻田畝產(chǎn)量的平均值介于900kg至1000kg之間
2.(2023?全國?高考真題)某學(xué)校為了解學(xué)生參加體育運(yùn)動的情況,用比例分配的分層隨機(jī)抽樣方法作抽樣
調(diào)查,擬從初中部和高中部兩層共抽取60名學(xué)生,已知該校初中部和高中部分別有400名和200名學(xué)生,
則不同的抽樣結(jié)果共有().
A.C-C短種B.CMC鼠種
C.CQc禽種D.C%C北種
二、多選題
3.(2023?全國?高考真題)有一組樣本數(shù)據(jù)%,…其中4是最小值,%是最大值,則()
A.無2,無3,羽,尤5的平均數(shù)等于不,%,…,%的平均數(shù)
B.毛,尤3,4尤5的中位數(shù)等于百,%,1%的中位數(shù)
4
C.x2,x3,x4,x5的標(biāo)準(zhǔn)差不小于占,馬,…,毛的標(biāo)準(zhǔn)差
D.尤3,%毛的極差不大于百,…,毛的極差
三、解答題
4.(2024?全國?高考真題)某工廠進(jìn)行生產(chǎn)線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產(chǎn)
品中隨機(jī)抽取150件進(jìn)行檢驗(yàn),數(shù)據(jù)如下:
優(yōu)級品合格品不合格品總計
甲車間2624050
乙車間70282100
總計96522150
⑴填寫如下列聯(lián)表:
優(yōu)級品非優(yōu)級品
甲車間
乙車間
能否有95%的把握認(rèn)為甲、乙兩車間產(chǎn)品的優(yōu)級品率存在差異?能否有99%的把握認(rèn)為甲,乙兩車間產(chǎn)品
的優(yōu)級品率存在差異?
(2)已知升級改造前該工廠產(chǎn)品的優(yōu)級品率p=0.5,設(shè)萬為升級改造后抽取的n件產(chǎn)品的優(yōu)級品率.如果
萬〉P+1.65J上,二口,則認(rèn)為該工廠產(chǎn)品的優(yōu)級品率提高了,根據(jù)抽取的150件產(chǎn)品的數(shù)據(jù),能否認(rèn)為生
產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品率提高了?(麗*12.247)
n(ad-bc)2
(〃+Z?)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
5.(2023?全國?高考真題)一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng),試驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20
只分配到試驗(yàn)組,另外20只分配到對照組,試驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).試驗(yàn)結(jié)果如下:
5
對照組的小白鼠體重的增加量從小到大排序?yàn)?/p>
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
試驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)?/p>
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
⑴計算試驗(yàn)組的樣本平均數(shù);
(2)(回)求40只小白鼠體重的增加量的中位數(shù)加,再分別統(tǒng)計兩樣本中小于,"與不小于機(jī)的數(shù)據(jù)的個數(shù),
完成如下列聯(lián)表
n<m>m
對照組□□
試驗(yàn)組□□
(回)根據(jù)G)中的列聯(lián)表,能否有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加
量有差異?
n(ad-bc)2
(a+6)(c+d)(a+c)(6+d),
P(K2>k]0.1000.0500.010
k2.7063.8416.635
6.(2023?全國,高考真題)一項(xiàng)試驗(yàn)旨在研究臭氧效應(yīng).實(shí)驗(yàn)方案如下:選40只小白鼠,隨機(jī)地將其中20
只分配到實(shí)驗(yàn)組,另外20只分配到對照組,實(shí)驗(yàn)組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).
⑴設(shè)X表示指定的兩只小白鼠中分配到對照組的只數(shù),求X的分布列和數(shù)學(xué)期望;
⑵實(shí)驗(yàn)結(jié)果如下:
對照組的小白鼠體重的增加量從小到大排序?yàn)椋?/p>
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
實(shí)驗(yàn)組的小白鼠體重的增加量從小到大排序?yàn)椋?/p>
6
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
(i)求40只小鼠體重的增加量的中位數(shù)機(jī),再分別統(tǒng)計兩樣本中小于機(jī)與不小于的數(shù)據(jù)的個數(shù),完成如下
列聯(lián)表:
n<m>m
對照組□□
實(shí)驗(yàn)組U□
(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量
有差異.
n^ad-bcy
附:K2=
(a+6)(c+d)(a+c)(b+d),
0.1000.0500.010
2
P(K>k0)2.7063.8416.635
7.(2023?全國?高考真題)某廠為比較甲乙兩種工藝對橡膠產(chǎn)品伸縮率的處理效應(yīng),進(jìn)行10次配對試驗(yàn),
每次配對試驗(yàn)選用材質(zhì)相同的兩個橡膠產(chǎn)品,隨機(jī)地選其中一個用甲工藝處理,另一個用乙工藝處理,測
量處理后的橡膠產(chǎn)品的伸縮率.甲、乙兩種工藝處理后的橡膠產(chǎn)品的伸縮率分別記為%,%[=1,2,…,10).試
驗(yàn)結(jié)果如下:
試驗(yàn)序號i12345678910
伸縮率看545533551522575544541568596548
伸縮率力536527543530560533522550576536
記入=%記的樣本平均數(shù)為樣本方差為?.
=1,2,…,10),4,Z2,…,z10z,
⑴求1/;
(2)判斷甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率是否有顯著提高(如果
z>2.£,則認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高,否
V10
7
則不認(rèn)為有顯著提高)
8.(2023?全國?高考真題)某研究小組經(jīng)過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項(xiàng)醫(yī)學(xué)指標(biāo)有明顯差
異,經(jīng)過大量調(diào)查,得到如下的患病者和未患病者該指標(biāo)的頻率分布直方圖:
利用該指標(biāo)制定一個檢測標(biāo)準(zhǔn),需要確定臨界值c,將該指標(biāo)大于。的人判定為陽性,小于或等于c的人判
定為陰性.此檢測標(biāo)準(zhǔn)的漏診率是將患病者判定為陰性的概率,記為。9);誤診率是將未患病者判定為陽
性的概率,記為我。).假設(shè)數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率.
⑴當(dāng)漏診率p(c)=0.5%時,求臨界值c和誤診率4(c);
(2)設(shè)函數(shù)〃c)=p(c)+q(c),當(dāng)ce[95,105]時,求/(c)的解析式,并求/(c)在區(qū)間[95,105]的最小值.
參考答案:
題號123
答案CDBD
1.C
【分析】計算出前三段頻數(shù)即可判斷A;計算出低于1100kg的頻數(shù),再計算比例即可判斷B;根據(jù)極差計
算方法即可判斷C;根據(jù)平均值計算公式即可判斷D.
【詳解】對于A,根據(jù)頻數(shù)分布表可知,6+12+18=36<50,
所以畝產(chǎn)量的中位數(shù)不小于1050kg,故A錯誤;
對于B,畝產(chǎn)量不低于1100kg的頻數(shù)為24+10=34,
所以低于1100kg的稻田占比為:00=66%,故B錯誤;
對于C,稻田畝產(chǎn)量的極差最大為1200-900=300,最小為1150-950=200,故C正確;
對于D,由頻數(shù)分布表可得,平均值為
—x(6x925+12x975+18xl025+30xl075+24xll25+10xl175)-1067,故D錯誤.
8
故選;C.
2.D
【分析】利用分層抽樣的原理和組合公式即可得到答案.
【詳解】根據(jù)分層抽樣的定義知初中部共抽取60義照=40人,高中部共抽取60義嬰=20,
根據(jù)組合公式和分步計數(shù)原理則不同的抽樣結(jié)果共有C%C2種.
故選:D.
3.BD
【分析】根據(jù)題意結(jié)合平均數(shù)、中位數(shù)、標(biāo)準(zhǔn)差以及極差的概念逐項(xiàng)分析判斷.
【詳解】對于選項(xiàng)A:設(shè)兀2,兀3,%4,%5的平均數(shù)為相,再,々,…,%6的平均數(shù)為〃,
則Xy++玉+工4+無5+,6%2+玉+*4+芯52(%+)一(/+X)+X3+芯4)
、n~m~64—12
因?yàn)闆]有確定2(玉+工6),/+尤2+犬3+%4的大小關(guān)系,所以無法判斷根,〃的大小,
例如:1,2,3,4,5,6,可得加=〃=3.5;
例如1,1,1,1,1,7,可得根=1,〃=2;
例如1,2,2,2,2,2,可得帆=2,"=,;故A錯誤;
6
對于選項(xiàng)B:不妨設(shè)再工匕(飛W尤6,
可知尤2,三,%,%的中位數(shù)等于國,今,…%的中位數(shù)均為■^滬,故B正確;
對于選項(xiàng)C:因?yàn)檎际亲钚≈?,血是最大值?/p>
則%,當(dāng),工4,尤5的波動性不大于玉,工2,…,%的波動性,即X2,X3,X4,X5的標(biāo)準(zhǔn)差不大于玉,馬,…,%的標(biāo)準(zhǔn)差,
例如:2,4,6,8,10,12,則平均數(shù)"=:(2+4+6+8+10+12)=7,
4,6,8,10,則平均數(shù)%=;(4+6+8+10)=7,
2222
標(biāo)準(zhǔn)差$2=^[(4-7)+(6-7)+(8-7)+(10-7)]=^5,
顯然叵>6,即。>$2;故c錯誤;
3
對于選項(xiàng)D:不妨設(shè)x,<x2<x3<x4<x5<x6,
則%-玉之三-3,當(dāng)且僅當(dāng)玉=%,%=%時,等號成立,故D正確;
9
故選:BD.
4.(1)答案見詳解
(2)答案見詳解
【分析】(1)根據(jù)題中數(shù)據(jù)完善列聯(lián)表,計算K?,并與臨界值對比分析;
(2)用頻率估計概率可得萬=0.64,根據(jù)題意計算p+1.65、陛二2,結(jié)合題意分析判斷.
Vn
【詳解】(1)根據(jù)題意可得列聯(lián)表:
優(yōu)級品非優(yōu)級品
甲車間2624
乙車間7030
可得爪2「50(26x30-24x70)275
—=4.6875
'50x100x96x5416
因?yàn)?.841<4.6875<6.635,
所以有95%的把握認(rèn)為甲、乙兩車間產(chǎn)品的優(yōu)級品率存在差異,沒有99%的把握認(rèn)為甲,乙兩車間產(chǎn)品的
優(yōu)級品率存在差異.
(2)由題意可知:生產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品的頻率為9需6=0.64,
用頻率估計概率可得7=0.64,
又因?yàn)樯壐脑烨霸摴S產(chǎn)品的優(yōu)級品率P=。.5,
貝IJ0+1.65EHU=0.5+1.65)。50_。??0.5+1.65x工0.567,
\nV15012.247
可知萬〉p+1.65回三五,
Vn
所以可以認(rèn)為生產(chǎn)線智能化升級改造后,該工廠產(chǎn)品的優(yōu)級品率提高了.
5.(1)19.8
(2)(i)m=23.4;列聯(lián)表見解析,(ii)能
【分析】(1)直接根據(jù)均值定義求解;
(2)(i)根據(jù)中位數(shù)的定義即可求得利=23.4,從而求得列聯(lián)表;
(ii)利用獨(dú)立性檢驗(yàn)的卡方計算進(jìn)行檢驗(yàn),即可得解.
【詳解】(工)試驗(yàn)組樣本平均數(shù)為:
10
^(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2
396
+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=—=19.8
(2)(i)依題意,可知這40只小鼠體重的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排后第20位與第21位
數(shù)據(jù)的平均數(shù),
由原數(shù)據(jù)可得第11位數(shù)據(jù)為可.8,后續(xù)依次為19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…,
故第20位為23.2,第21位數(shù)據(jù)為23.6,
23.2+23.6-/
所以機(jī)=---------=23.4,
2
故列聯(lián)表為:
<m>m合計
對照組61420
試驗(yàn)組14620
合計202040
2
,—r,B240x(6x6-14xl4)乙/八八oO/l1
(II)由(i)可得,K=----------------—=6.400>3.841,
20x20x20x20
所以能有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異.
6.⑴分布列見解析,E(X)=1
(2)(i)機(jī)=23.4;列聯(lián)表見解析,(ii)能
【分析】(1)利用超幾何分布的知識即可求得分布列及數(shù)學(xué)期望;
(2)(i)根據(jù)中位數(shù)的定義即可求得m=23.4,從而求得列聯(lián)表;
(ii)利用獨(dú)立性檢驗(yàn)的卡方計算進(jìn)行檢驗(yàn),即可得解.
【詳解】(1)依題意,X的可能取值為01,2,
1Q「1019of)「20181Q
則尸(X=0)=旨4,尸(X=l)=壽=黑P(x=2)=皆/
所以X的分布列為:
X012
192019
P
783978
192019
故E(X)=0x——+lx——+2x——=l.
783978
11
(2)(i)依題意,可知這40只小白鼠體重增量的中位數(shù)是將兩組數(shù)據(jù)合在一起,從小到大排后第20位與
第21位數(shù)據(jù)的平均數(shù),觀察數(shù)據(jù)可得第20位為23.2,第21位數(shù)據(jù)為23.6,
23.2+23.6
所以根==23.4,
2
故列聯(lián)表為:
<m>m合計
對照組61420
實(shí)驗(yàn)組14620
合計202040
40x(6x6—14x14)2
(ii)由(i)可得,=6.400>3.841,
20x20x20x20
所以能有95%的把握認(rèn)為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.
7.(l)z=ll,$2=61;
⑵認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.
【分析】(1)直接利用平均數(shù)公式即可計算出工亍,再得到所有的z,值,最后計算出方差即可;
(2)根據(jù)公式計算出2、工的值,和[比較大小即可.
V10
,、_545+533+551+522+575+544+541+568+596+548廠廠。。
(1)x=-----------------------------------------------------=552.3,
_536+527+543+530+560+533+522+550+576+536一]。
y=-----------------------------------------------------=541.3,
10
彳=元一9=552.3—541.3=11,
z小一。的值分別為:9,6,8,-8,15,11,19,18,20,12,
痂2_(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2
RA.S=
10
區(qū),2=2府=^M^,故有222」工,
(2)由(1)知:2=11,2.
10V10
所以認(rèn)為甲工藝處理后的橡膠產(chǎn)品的伸縮率較乙工藝處理后的橡膠產(chǎn)品的伸縮率有顯著提高.
8.(l)c=97.5,“(c)=3.5%;
-0.008c+0.82,95100
(2)/(c)=,最小值為0.02.
0.01c-0.98,100<c<105
12
【分析】(1)根據(jù)題意由第一個圖可先求出C,再根據(jù)第二個圖求出C297.5的矩形面積即可解出;
(2)根據(jù)題意確定分段點(diǎn)100,即可得出/(c)的解析式,再根據(jù)分段函數(shù)的最值求法即可解出.
【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為5x0.002>0.5%,所以95<c<100,
所以(0-95)x0.002=0.5%,解得:c=97.5,
4(c)=0.01x(100-97.5)+5x0.002=0.035=3.5%.
(2)當(dāng)ce[95,100]時,
/(c)=p(c)+q(c)=(c-95)X0.002+(100-c)x0.01+5x0.002=-0.008c+0.82>0.02;
當(dāng)ce(100,105]時,
/(c)=p(c)+q(c)=5x0.002+(c-100)x0.012+(105-c)x0.002=0.01c-0.98>0,02,
f—0.008c+0.82,95<c<100
故/?=《,
[0.01c-0.98,100<c<105
所以/(c)在區(qū)間[95,105]的最小值為0.02.
.考點(diǎn)突破
【考點(diǎn)1】成對數(shù)據(jù)的相關(guān)性
一、單選題
1.(2024?四川成都?二模)對變量蒼丁有觀測數(shù)據(jù)(x,,yJ(ieN*),得散點(diǎn)圖1;對變量""有觀測數(shù)據(jù)
(%加J(ieN*),得散點(diǎn)圖2/表示變量羽>之間的線性相關(guān)系數(shù),4表示變量“#之間的線性相關(guān)系數(shù),則
下列說法正確的是()
A.變量尤與y呈現(xiàn)正相關(guān),且用〈同B.變量x與y呈現(xiàn)負(fù)相關(guān),且用〉同
C.變量尤與y呈現(xiàn)正相關(guān),且用>同D.變量X與y呈現(xiàn)負(fù)相關(guān),且用〈同
2.(2024?四川涼山?三模)調(diào)查某校高三學(xué)生的身高尤和體重y得到如圖所示散點(diǎn)圖,其中身高x和體重,相
關(guān)系數(shù)r=0.8255,則下列說法正確的是(
13
A.學(xué)生身高和體重沒有相關(guān)性
B.學(xué)生身高和體重呈正相關(guān)
C.學(xué)生身高和體重呈負(fù)相關(guān)
D.若從樣本中抽取一部分,則這部分的相關(guān)系數(shù)一定是0.8255
二、多選題
3.(22-23高三上?江蘇無錫?期末)已知由樣本數(shù)據(jù)(42,3,…,10)組成的一個樣本,得到經(jīng)驗(yàn)回歸方
程為尸2X-0.4,且元=2,去除兩個樣本點(diǎn)(-2,1)和(2,-1)后,得到新的經(jīng)驗(yàn)回歸方程為$=3x+g.在余
下的8個樣本數(shù)據(jù)和新的經(jīng)驗(yàn)回歸方程中().
A.相關(guān)變量x,y具有正相關(guān)關(guān)系
B.新的經(jīng)驗(yàn)回歸方程為9=3x-3
C.隨著自變量尤值增加,因變量y值增加速度變小
D.樣本(4,8.9)的殘差為-0.1
4.(2024?湖南衡陽?模擬預(yù)測)為了研發(fā)某種流感疫苗,某研究團(tuán)隊(duì)收集了10組抗體藥物的攝入量與體內(nèi)
抗體數(shù)量的數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計量的值,抗體藥物攝
入量為單位:mg),體內(nèi)抗體數(shù)量為y(單位:AU/mL).根據(jù)散點(diǎn)圖,可以得到回歸直線方程為:
y=0.34尤+0.05.下列說法正確的是()
咋
17.2-
17.1-.
17-???
16.9-?
16.8-??
16.7-??
16.6-?
16.51----1----------1----------1----------1----------1----------1----------1---------1—->
48.84949.249.449.649.85050.250.4X
A.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的線性相關(guān)關(guān)系
B.回歸直線方程表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的函數(shù)關(guān)系
C.回歸直線方程可以精確反映體內(nèi)抗體數(shù)量與抗體藥物攝入量的變化趨勢
14
D.回歸直線方程可以用來預(yù)測攝入抗體藥物后體內(nèi)抗體數(shù)量的變化
三、填空題
5.(23-24高三上?浙江?開學(xué)考試)已知成對樣本數(shù)據(jù)(4%),(%,%),???,(尤“,%2亞3)中占,馬,…,當(dāng)互不相等,
且所有樣本點(diǎn)(4%)(1=1,2,-,?)都在直線y=-白+1上,則這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)r=
參考答案:
題號1234
答案CBABDAD
1.C
【分析】利用散點(diǎn)圖,結(jié)合相關(guān)系數(shù)的知識可得答案.
【詳解】由題意可知,變量羽y的散點(diǎn)圖中,、隨x的增大而增大,所以變量尤與y呈現(xiàn)正相關(guān);
再分別觀察兩個散點(diǎn)圖,圖1比圖2點(diǎn)更加集中,相關(guān)性更好,所以線性相關(guān)系數(shù)用>同.
故選:c.
2.B
【分析】由散點(diǎn)圖的特點(diǎn)可分析相關(guān)性的問題,從而判斷選項(xiàng)ABC,根據(jù)相關(guān)系數(shù)的定義可判斷選項(xiàng)D.
【詳解】由散點(diǎn)圖可知,散點(diǎn)的分布集中在一條直線附近,
所以學(xué)生身高和體重具有相關(guān)性,A不正確;
又身高尤和體重'的相關(guān)系數(shù)為r=0.8255,相關(guān)系數(shù)r>0,
所以學(xué)生身高和體重呈正相關(guān),B正確,C不正確;
從樣本中抽取一部分,相關(guān)性可能變強(qiáng),也可能變?nèi)?,所以這部分的相關(guān)系數(shù)不一定是0.8255,D不正確.
故選:B.
3.ABD
【分析】根據(jù)線性回歸方程的求法、意義可判斷ABC,再由殘差的概念判斷D.
101
【詳解】£玉=20,X新平均數(shù)gx20=2.5,y=2x2-04=3.6.
i=l8
y新平均數(shù):xl0x3.6=4.5,134.5=3x2.5+2,團(tuán)B=一3?
o
新的線性回歸方程$=3X+5,x,y具有正相關(guān)關(guān)系,A對.
新的線性回歸方程:9=3X-3,B對.
由線性回歸方程知,隨著自變量x值增加,因變量y值增加速度恒定,C錯;
X=4,y=9,8.9—9=-0.1,D對.
故選:ABD.
15
4.AD
【分析】根據(jù)回歸方程的意義判斷即可.
【詳解】回歸直線方程只能表示體內(nèi)抗體數(shù)量與抗體藥物攝入量之間的線性相關(guān)關(guān)系,不是函數(shù)關(guān)系,A正
確,B錯誤,
回歸直線方程不能精確反映體內(nèi)抗體數(shù)量與抗體藥物攝入量的變化趨勢,但可以用來預(yù)測攝入抗體藥物后
體內(nèi)抗體數(shù)量的變化,C錯誤,D正確.
故選:AD.
5.-1
【分析】根據(jù)給定條件,利用相關(guān)系數(shù)的定義求解作答.
【詳解】因?yàn)樗袠颖军c(diǎn)(4%)"=1,2,…㈤都在直線>=_;X+1上,顯然直線y=-;x+l的斜率一;<0,
所以樣本數(shù)據(jù)成負(fù)相關(guān),相關(guān)系數(shù)為-L
故答案為:—1
反思提升:
判斷相關(guān)關(guān)系的兩種方法:
(1)散點(diǎn)圖法:如果樣本點(diǎn)的分布從整體上看大致在某一曲線附近,變量之間就有相關(guān)關(guān)系;
如果樣本點(diǎn)的分布從整體上看大致在某一直線附近,變量之間就有線性相關(guān)關(guān)系.
(2)決定系數(shù)法:利用決定系數(shù)判定,F(xiàn)越趨近1,擬合效果越好,相關(guān)性越強(qiáng).
【考點(diǎn)2】回歸分析
一、單選題
1.(2024?四川綿陽?二模)已知變量x,y之間的線性回歸方程為9=2x+l,且變量x,y之間的一組相關(guān)數(shù)
據(jù)如表所示,
X2468
y58.213m
則下列說法正確的是()
A.m=17
B.變量y與x是負(fù)相關(guān)關(guān)系
C.該回歸直線必過點(diǎn)(5,11)
D.x增加1個單位,y一定增加2個單位
2.(2024?全國?模擬預(yù)測)2023年第19屆亞運(yùn)會在杭州舉行,亞運(yùn)會的吉祥物琮琮、蓮蓮、宸宸深受大家
喜愛,某商家統(tǒng)計了最近5個月銷量,如表所示:若y與無線性相關(guān),且線性回歸方程為夕=-0.6元+心則
下列說法不正確的是()
16
時間X12345
銷售量y/萬只54.543.52.5
A.由題中數(shù)據(jù)可知,變量y與x負(fù)相關(guān)
B.當(dāng)x=5時,殘差為0.2
C.可以預(yù)測當(dāng)x=6時銷量約為2.1萬只
D.線性回歸方程9=-0.6x+d中?=5.7
二、多選題
3.(23-24高三上?廣東揭陽,期末)2023年入冬以來,流感高發(fā),某醫(yī)院統(tǒng)計了一周中連續(xù)5天的流感就診
人數(shù)y與第x(x=l,2,3,4,5)天的數(shù)據(jù)如表所示.
X12345
y2110a15a90109
根據(jù)表中數(shù)據(jù)可知無,y具有較強(qiáng)的線性相關(guān)關(guān)系,其經(jīng)驗(yàn)回歸方程為歹=20元+10,則()
A.樣本相關(guān)系數(shù)在(0』內(nèi)B.當(dāng)x=2時,殘差為-2
C.點(diǎn)(3,15a)一定在經(jīng)驗(yàn)回歸直線上D.第6天到該醫(yī)院就診人數(shù)的預(yù)測值為130
4.(2024?全國?模擬預(yù)測)為了預(yù)測某地的經(jīng)濟(jì)增長情況,某經(jīng)濟(jì)學(xué)專家根據(jù)該地2023年1?6月的GDP
的數(shù)據(jù)y(單位:百億元)建立了線性回歸模型,得到的經(jīng)驗(yàn)回歸方程為y=o.42x+a,其中自變量x指的
是1?6月的編號,其中部分?jǐn)?shù)據(jù)如表所示:
時間2023年)月2023年2月2023年3月2023年4月2023年5月2023年6月
編號X123456
y/百億元)1為%11.107為為
參考數(shù)據(jù):Ex2=796,^(y,.-y)2=70.
i=li=l
則下列說法正確的是()
A.經(jīng)驗(yàn)回歸直線經(jīng)過點(diǎn)(3.5,11)
B.<7=10.255
C.根據(jù)該模型,該地2023年12月的GDP的預(yù)測值為14.57百億元
D.相應(yīng)于點(diǎn)(%,%)的殘差為。二。3
17
三、填空題
5.(2024?江蘇?一模)已知變量尤,y的統(tǒng)計數(shù)據(jù)如下表,對表中數(shù)據(jù)作分析,發(fā)現(xiàn)y與X之間具有線性相關(guān)
關(guān)系,利用最小二乘法,計算得到經(jīng)驗(yàn)回歸直線方程為N=08x+&,據(jù)此模型預(yù)測當(dāng)x=10時3的值
為.
X56789
y3.54566.5
6.(2024?陜西渭南?一模)己知一組數(shù)據(jù)點(diǎn)(4%)(1=1,2,…,7),用最小二乘法得到其線性回歸方程為
77
y=—2x+4,若X%=7,貝1JZ-
i=li=l
四、解答題
7.(2024?山東日照?二模)某公司為考核員工,采用某方案對員工進(jìn)行業(yè)務(wù)技能測試,并統(tǒng)計分析測試成績
以確定員工績效等級.
⑴已知該公司甲部門有3名負(fù)責(zé)人,乙部門有4名負(fù)責(zé)人,該公司從甲、乙兩部門中隨機(jī)選取3名負(fù)責(zé)人
做測試分析,記負(fù)責(zé)人來自甲部門的人數(shù)為X,求X的最有可能的取值:
2%馬一7點(diǎn)
-------------0.02
-7/
i=l
(回)已知某部門測試的平均成績?yōu)?0分,估計其績效等級優(yōu)秀率;
(回)根據(jù)統(tǒng)計分析,大致認(rèn)為各部門測試平均成績*?其中〃近似為樣本平均數(shù)元,〃近似為
樣本方差$2.經(jīng)計算20,求某個部門績效等級優(yōu)秀率不低于0.78的概率.
參考公式與數(shù)據(jù):(1)in0.15?-1.9,e12?3.32,ln5.2?1.66.
〃__
八Z%,y一心丁
②線性回歸方程9=加+4中,》=號---------,d=y-bx.
「xf-nx2
i=l
③若隨機(jī)變量X~N(〃,CT2),則尸—bvXv〃+b)=0.6826,P3—2(J<X<〃+2b)=0.9544,
18
P(〃-3b<X<M+3b)=0.9974.
8.(22-23高三上?山東青島?期末)由個小正方形構(gòu)成長方形網(wǎng)格有行和〃列.每次將一個小球放到一個
小正方形內(nèi),放滿為止,記為一輪.每次放白球的頻率為P,放紅球的概率為q,P+4=L
⑴若根=2,p=q=g,記y表示100輪放球試驗(yàn)中"每一列至少一個紅球”的輪數(shù),統(tǒng)計數(shù)據(jù)如表:
n12345
y7656423026
求y關(guān)于"的回歸方程Iny=訪+4,并預(yù)測〃=10時,y的值;(精確到1)
1?
(2)若〃?=2,〃=2,p=§,q=~,記在每列都有白球的條件下,含紅球的行數(shù)為隨機(jī)變量X,求X的分
布列和數(shù)學(xué)期望;
⑶求事件"不是每一列都至少一個紅球"發(fā)生的概率,并證明:(1-//"丫+(1-
k
YjXj^kx-y$一
附:經(jīng)驗(yàn)回歸方程系數(shù):g=上4--------------,a=y-bx,\>,Jn%=53,記=3.8.
一履?1=1
f=l
參考答案:
題號1234
答案CBADAC
1.C
【分析】根據(jù)給定數(shù)據(jù)及回歸方程求出樣本中心點(diǎn),再逐項(xiàng)判斷即可得解.
—2+4+6+8「-5+8.2+13+zn26.2+
【詳解】依題意,
4―4
262+m
由不=2x5+1,解得根*8,A錯誤;
回歸方程3=2尤+1中,2>0,則變量y與x是正相關(guān)關(guān)系,B錯誤;
由于樣本中心點(diǎn)為(5,11),因此該回歸直線必過點(diǎn)(5,11),C正確;
由回歸方程知,x增加1個單位,y大約增加2個單位,D錯誤.
故選:C
2.B
【分析】對于選項(xiàng)A,利用表中數(shù)據(jù)變化情況或看回歸方程的方正負(fù)均可求解;對于選項(xiàng)B,利用樣本中心
點(diǎn)求出線性回歸方程,再利用回歸方程即可求出預(yù)測值,進(jìn)而可求出殘差;對于選項(xiàng)C,利用回歸方程即可
求出預(yù)測值;對于選項(xiàng)D,利用回歸方程一定過樣本中心點(diǎn)即可求解.
19
【詳解】對于選項(xiàng)A,從數(shù)據(jù)看,y隨x的增大而減小,所以變量y與元負(fù)相關(guān),故A正確;
1+2+3+4+5。5+4.5+4+3.5+2.5
對于選項(xiàng)B,由表中數(shù)據(jù)知亍=------------=33.9,
55
所以樣本中心點(diǎn)為(3,3.9),將樣本中心點(diǎn)(3,3.9)代入£=—0.6%+6中得6=3.9+1.8=5.7,
所以線性回歸方程為a=-0.6犬+5.7,所以為=-0.6x5+5.7=2.7,殘差2=2.5—2.7=-0.2,故B錯誤;
對于選項(xiàng)C,當(dāng)x=6時銷量約為夕=-0.6><6+5.7=2.1(萬只),故C正確.
對于選項(xiàng)D,由B選項(xiàng)可知3=3.9+1.8=5.7,故D正確.
故選:B.
3.AD
【分析】x,y具有較強(qiáng)的正相關(guān)關(guān)系,可判斷相關(guān)系數(shù)的范圍,判斷A;計算x,y的平均值,代入回歸直
線方程求出。的值,即可求出x=2時的預(yù)測值,求得殘差,判斷B;看(3,15a)是否適合回歸直線方程,判
斷C;將x=6代入回歸直線方程,求出預(yù)測值,判斷D.
【詳解】由題意可知x,y具有較強(qiáng)的正相關(guān)關(guān)系,故樣本相關(guān)系數(shù)在(0』內(nèi),A正確;
1+2+3+4+521+10々+15。+90+1090匚
根據(jù)題意得:==3,y=--------------------=44+5〃,
5
故44+51=20x3+10,解得a=5.2,
故當(dāng)元=2時,9=20x2+10=50,殘差為10a—50=2,B錯誤;
點(diǎn)(3,15。)即點(diǎn)(3,78),當(dāng)x=3時,9=20x3+10=70,
即點(diǎn)(3,15a)不在經(jīng)驗(yàn)回歸直線上,C錯誤;
當(dāng)x=6時,y=20x6+10=130,即第6天到該醫(yī)院就診人數(shù)的預(yù)測值為130,D正確,
故選:AD
4.AC
【分析】求得數(shù)據(jù)的樣本中心點(diǎn),即可判斷A;結(jié)合回歸直線方程求出°可判斷B;將x=12代入回歸直線
方程求得預(yù)測值,可判斷C;根據(jù)殘差的計算可判斷D.
【詳解】選項(xiàng)A:由題意得:于=2x(l+2+3+4+5+6)=3.5,
6
因?yàn)椤辍甓?96,2卜廠司=?;—692=70,所以796—6歹2=70,得歹二11,
i=li=l'i=l
因此該經(jīng)驗(yàn)回歸直線經(jīng)過樣本點(diǎn)的中心(3.5,11),故A正確;
選項(xiàng)B:由A知,11=0.42x3.5+4,得a=9.53,故B錯誤;
選項(xiàng)C:由B得£=0.42X+9.53,貝lj當(dāng)x=12時,£=14.57,
20
故該地2023年12月的GDP的預(yù)測值為14.57百億元,故C正確;
選項(xiàng)D:當(dāng)x=4時,9=0.21,相應(yīng)于點(diǎn)(%%)的殘差為1L107-11.21=-0.103,
(相應(yīng)于點(diǎn)(%,%)的殘差3=%-少),故D錯誤,
故選:AC
5.7.4
【分析】經(jīng)驗(yàn)回歸直線方程夕=嬴+4過樣本點(diǎn)的中心(3),所以把伍工)代入R0.8X+G求得G的值,再
代入x=10求解即可.
【詳解】由已知得了=7,9=5,即樣本點(diǎn)中心(7,5),
因?yàn)榻?jīng)驗(yàn)回歸直線方程亍=0.8x+
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝設(shè)計中的傳統(tǒng)文化融合與創(chuàng)新考核試卷
- 危險廢物處理與環(huán)保產(chǎn)業(yè)市場準(zhǔn)入制度考核試卷
- 住宅建筑與社區(qū)居民社區(qū)兒童教育考核試卷
- 勘察項(xiàng)目項(xiàng)目管理海洋工程海洋環(huán)境保護(hù)與勘察考核試卷
- 托兒所服務(wù)的沉浸式教育與虛擬現(xiàn)實(shí)考核試卷
- 托兒所服務(wù)的安全管理與緊急救援考核試卷
- 地質(zhì)勘探設(shè)備在地震勘探中的物聯(lián)網(wǎng)應(yīng)用案例考核試卷
- 微特電機(jī)散熱問題解決方案考核試卷
- 鎖匯合同范本
- 外賣小哥租車合同范本
- 嚴(yán)重精神障礙患者管理培訓(xùn)課件
- 2024甘肅路橋建設(shè)集團(tuán)招聘專業(yè)技術(shù)人員199人管理單位遴選500模擬題附帶答案詳解
- 中建混凝土工程專項(xiàng)施工方案
- 《黃金基礎(chǔ)知識培訓(xùn)》課件
- 中小學(xué)數(shù)學(xué)新課程標(biāo)準(zhǔn)試題及答案
- 小學(xué)2年級心理健康教育課件《智斗“攔路虎”-人人都會有困難》
- 硬件測試崗位招聘面試題及回答建議2024年
- 腦梗死恢復(fù)期護(hù)理查房
- 個人證券賬戶管理協(xié)議三篇
- 焊工(初級)考試題庫及答案
- 2024年云南省中考物理試題含答案
評論
0/150
提交評論