




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專題57成對數(shù)據(jù)的統(tǒng)計分析(新高考專用)
目錄
【知識梳理】................................................................2
【真題自測】................................................................4
【考點突破】................................................................9
【考點1】成對數(shù)據(jù)的相關性..................................................9
【考點2】回歸分析..........................................................11
【考點3】獨立性檢驗........................................................14
【分層檢測】...............................................................18
【基礎篇】.................................................................18
【能力篇】.................................................................22
考試要求:
1.了解樣本相關系數(shù)的統(tǒng)計含義.
2.了解一元線性回歸模型和2X2列聯(lián)表,會運用這些方法解決簡單的實際問題.
3.會利用統(tǒng)計軟件進行數(shù)據(jù)分析.
■“知識梳理
1.變量的相關關系
(1)相關關系
兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為
相關關系.
(2)相關關系的分類:正相關和負相關.
(3)線性相關
一般地,如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在一條直線附近,我們就稱這
兩個變量線性相關.
一般地,如果兩個變量具有相關性,但不是線性相關,那么我們就稱這兩個變量非線性相關或
曲線相關.
2.樣本相關系數(shù)
⑴相關系數(shù)廠的計算
變量x和變量y的樣本相關系數(shù)r的計算公式如下:
11
S一M-y)
?=1
(2)相關系數(shù)r的性質
①當r>0時,稱成對樣本數(shù)據(jù)正相關;當r<0時,成對樣本數(shù)據(jù)負相關;當r=0時,成對樣
本數(shù)據(jù)間沒有線性相關關系.
②樣本相關系數(shù)r的取值范圍為「一1,11
當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關程度越強;
當|r|越接近0時,成對樣本數(shù)據(jù)的線性相關程度越弱.
3.一元線性回歸模型
(1)經驗回歸方程與最小二乘法
我們將〈=£+:稱為y關于%的經驗回歸方程,也稱經驗回歸函數(shù)或經驗回歸公式,其圖形稱
為經驗回歸直線.這種求經驗回歸方程的方法叫做最小二乘法,求得的3二叫做。的最小二
2
乘估計,
其中
nn
y
—?一1)(”?—J)Hx,yl,~ln^Jc~y
-i=i=1
b=—n
2v2
S(JC,—JC)ZJ/i-nx
=1i=i
a=y-bx.
(2)利用決定系數(shù)F刻畫回歸效果
(乂一3,尸
z
J?=l-—n
\、
:=1,收越大,即擬合效果越好,F(xiàn)越小,模型擬合效果越差.
4.列聯(lián)表與獨立性檢驗
(1)2X2列聯(lián)表
一般地,假設有兩個分類變量X和匕它們的取值分別為{xi,基}和{”,"},其2X2列聯(lián)表
為
y
X合計
尸券
X~X\aba+b
X~X2cdc~\~d
合計a~\~cb+dn—a~\~b~\~c~\~d
⑵臨界值
H(nd-be")2
/=(小)(c+d)Q+c)?忽略/的實際分布與該近似分布的誤差后,對于任何
小概率值a,可以找到相應的正實數(shù)Xa,使得「&三發(fā))=&成立.我們稱Xa為a的臨界值,這
個臨界值就可作為判斷H大小的標準.
(3)獨立性檢驗
基于小概率值a的檢驗規(guī)則是:
當三、我時,我們就推斷Ho不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過a;
當/2<羽時,我們沒有充分證據(jù)推斷Ho不成立,可以認為X和y獨立.
這種利用X2的取值推斷分類變量X和y是否獨立的方法稱為X2獨立性檢驗,讀作“卡方獨立
性檢驗”,簡稱獨立性檢驗.
下表給出了X2獨立性檢驗中幾個常用的小概率值和相應的臨界值
3
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
I常用結論
1.求解經驗回歸方程的關鍵是確定回歸系數(shù):,b,應充分利用回歸直線過樣本點的中心(x,y).
2.根據(jù)經驗回歸方程計算的(值,僅是一個預報值,不是真實發(fā)生的值.
3.根據(jù)/的值可以判斷兩個分類變量有關的可信程度,若/越大,則兩分類變量有關的把握越
大.
真題自測
一、單選題
1.(2024?全國?高考真題)某農業(yè)研究部門在面積相等的100塊稻田上種植一種新型水稻,得到各塊稻田的
畝產量(單位:kg)并整理如下表
畝產
[900,950)[950,1000)[1000,1050)[1050,1100)[1100,1150)[1150,1200)
量
頻數(shù)61218302410
根據(jù)表中數(shù)據(jù),下列結論中正確的是()
A.100塊稻田畝產量的中位數(shù)小于1050kg
B.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產量的極差介于200kg至300kg之間
D.100塊稻田畝產量的平均值介于900kg至1000kg之間
2.(2023?全國?高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣
調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,
則不同的抽樣結果共有().
A.C-C短種B.CMC鼠種
C.CQC禽種D.C%c北種
二、多選題
3.(2023?全國?高考真題)有一組樣本數(shù)據(jù)%,%,…,%,其中4是最小值,%是最大值,則()
A.無2,無3,羽,無5的平均數(shù)等于不,%,…,%的平均數(shù)
B.毛,尤3,4尤5的中位數(shù)等于百,%,1%的中位數(shù)
4
C.x2,x3,x4,x5的標準差不小于占,馬,…,毛的標準差
D.尤3,%毛的極差不大于百,…,毛的極差
三、解答題
4.(2024?全國?高考真題)某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產
品中隨機抽取150件進行檢驗,數(shù)據(jù)如下:
優(yōu)級品合格品不合格品總計
甲車間2624050
乙車間70282100
總計96522150
⑴填寫如下列聯(lián)表:
優(yōu)級品非優(yōu)級品
甲車間
乙車間
能否有95%的把握認為甲、乙兩車間產品的優(yōu)級品率存在差異?能否有99%的把握認為甲,乙兩車間產品
的優(yōu)級品率存在差異?
(2)已知升級改造前該工廠產品的優(yōu)級品率p=0.5,設萬為升級改造后抽取的n件產品的優(yōu)級品率.如果
萬>P+1.65J約二",則認為該工廠產品的優(yōu)級品率提高了,根據(jù)抽取的150件產品的數(shù)據(jù),能否認為生
產線智能化升級改造后,該工廠產品的優(yōu)級品率提高了?(麗之2.247)
n(ad-bc)2
(〃+Z?)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
5.(2023?全國?高考真題)一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20
只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).試驗結果如下:
5
對照組的小白鼠體重的增加量從小到大排序為
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
試驗組的小白鼠體重的增加量從小到大排序為
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
⑴計算試驗組的樣本平均數(shù);
(2)(回)求40只小白鼠體重的增加量的中位數(shù)加,再分別統(tǒng)計兩樣本中小于,"與不小于機的數(shù)據(jù)的個數(shù),
完成如下列聯(lián)表
n<m>m
對照組□□
試驗組□□
(回)根據(jù)G)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加
量有差異?
n(ad-bc)2
(a+6)(c+d)(a+c)(6+d),
P(K2>k]0.1000.0500.010
k2.7063.8416.635
6.(2023?全國,高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20
只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)
在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).
⑴設X表示指定的兩只小白鼠中分配到對照組的只數(shù),求X的分布列和數(shù)學期望;
⑵實驗結果如下:
對照組的小白鼠體重的增加量從小到大排序為:
15.218.820.221.322.523.225.826.527.530.1
32.634.334.835.635.635.836.237.340.543.2
實驗組的小白鼠體重的增加量從小到大排序為:
6
7.89.211.412.413.215.516.518.018.819.2
19.820.221.622.823.623.925.128.232.336.5
(i)求40只小鼠體重的增加量的中位數(shù)機,再分別統(tǒng)計兩樣本中小于機與不小于的數(shù)據(jù)的個數(shù),完成如下
列聯(lián)表:
n<m>m
對照組□□
實驗組U□
(ii)根據(jù)(i)中的列聯(lián)表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量
有差異.
n(ad-bc)2
附:K2=
(a+6)(c+d)(a+c)(b+d))
0.1000.0500.010
2
P(K>k0)2.7063.8416.635
7.(2023?全國?高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,
每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測
量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為%,%(7=1,2,…,10).試
驗結果如下:
試驗序號i12345678910
伸縮率看545533551522575544541568596548
伸縮率力536527543530560533522550576536
記%記的樣本平均數(shù)為樣本方差為?.
=1,2,…,10),4,Z?,z10z,
⑴求1/;
(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果
z>2.£,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否
V10
7
則不認為有顯著提高)
8.(2023?全國?高考真題)某研究小組經過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項醫(yī)學指標有明顯差
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于。的人判定為陽性,小于或等于c的人判
定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,記為。9);誤診率是將未患病者判定為陽
性的概率,記為我。).假設數(shù)據(jù)在組內均勻分布,以事件發(fā)生的頻率作為相應事件發(fā)生的概率.
⑴當漏診率p(c)=0.5%時,求臨界值c和誤診率4(c);
(2)設函數(shù)〃c)=p(c)+q(c),當ce[95,105]時,求/(c)的解析式,并求/(c)在區(qū)間[95,105]的最小值.
考點突破
【考點1]成對數(shù)據(jù)的相關性
一、單選題
1.(2024?四川成都?二模)對變量蒼丁有觀測數(shù)據(jù)Q,yJ(ieN*),得散點圖1;對變量”#有觀測數(shù)據(jù)
(M;,V;)(ZGN*),得散點圖24表示變量彳,丫之間的線性相關系數(shù),4表示變量以v之間的線性相關系數(shù),則
A.變量X與y呈現(xiàn)正相關,且用〈閭B.變量X與y呈現(xiàn)負相關,且用〉同
8
C.變量尤與y呈現(xiàn)正相關,且間>團D.變量X與y呈現(xiàn)負相關,且用〈同
2.(2024?四川涼山?三模)調查某校高三學生的身高X和體重y得到如圖所示散點圖,其中身高X和體重V相
B.學生身高和體重呈正相關
C.學生身高和體重呈負相關
D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是0.8255
二、多選題
3.(22-23高三上?江蘇無錫?期末)已知由樣本數(shù)據(jù)(4%)[=1,2,3,…,10)組成的一個樣本,得到經驗回歸方
程為夕=2x-0.4,且元=2,去除兩個樣本點(-2,1)和(2,-1)后,得到新的經驗回歸方程為$=3x+g.在余
下的8個樣本數(shù)據(jù)和新的經驗回歸方程中().
A.相關變量x,y具有正相關關系
B.新的經驗回歸方程為9=3X-3
C.隨著自變量x值增加,因變量y值增加速度變小
D.樣本(4,8.9)的殘差為-0.1
4.(2024?湖南衡陽?模擬預測)為了研發(fā)某種流感疫苗,某研究團隊收集了10組抗體藥物的攝入量與體內
抗體數(shù)量的數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點圖及一些統(tǒng)計量的值,抗體藥物攝
入量為x(單位:mg),體內抗體數(shù)量為y(單位:AU/mL).根據(jù)散點圖,可以得到回歸直線方程為:
y=0.34x+0.05.下列說法正確的是()
^
12
1
11
1
7
9
1
1
8
1
1
7
1
1
6
1
15
1
1
48.84949.249.449.649.85050.250.4*
9
A.回歸直線方程表示體內抗體數(shù)量與抗體藥物攝入量之間的線性相關關系
B.回歸直線方程表示體內抗體數(shù)量與抗體藥物攝入量之間的函數(shù)關系
C.回歸直線方程可以精確反映體內抗體數(shù)量與抗體藥物攝入量的變化趨勢
D.回歸直線方程可以用來預測攝入抗體藥物后體內抗體數(shù)量的變化
三、填空題
5.(23-24高三上?浙江,開學考試)已知成對樣本數(shù)據(jù)(4%),(%,%),…,(五,”)(北3)中士,馬,…,當互不相等,
且所有樣本點(4%)(7=1,2,…㈤都在直線y=-gx+l上,則這組成對樣本數(shù)據(jù)的樣本相關系數(shù)r=
反思提升:
判斷相關關系的兩種方法:
(1)散點圖法:如果樣本點的分布從整體上看大致在某一曲線附近,變量之間就有相關關系;
如果樣本點的分布從整體上看大致在某一直線附近,變量之間就有線性相關關系.
(2)決定系數(shù)法:利用決定系數(shù)判定,F(xiàn)越趨近1,擬合效果越好,相關性越強.
【考點2】回歸分析
一、單選題
1.(2024?四川綿陽?二模)已知變量x,y之間的線性回歸方程為9=2x+l,且變量x,y之間的一組相關數(shù)
據(jù)如表所示,
X2468
y58.213m
則下列說法正確的是()
A.〃?=17
B.變量y與x是負相關關系
C.該回歸直線必過點(5,11)
D.x增加1個單位,y一定增加2個單位
2.(2024?全國?模擬預測)2023年第19屆亞運會在杭州舉行,亞運會的吉祥物琮琮、蓮蓮、宸宸深受大家
喜愛,某商家統(tǒng)計了最近5個月銷量,如表所示:若y與x線性相關,且線性回歸方程為?=-。6元+0,則
下列說法不正確的是()
時間X12345
銷售量W萬只54.543.52.5
A.由題中數(shù)據(jù)可知,變量y與無負相關
10
B.當x=5時,殘差為0.2
C.可以預測當x=6時銷量約為2.1萬只
D.線性回歸方程9=-0.6x+d中4=5.7
二、多選題
3.(23-24高三上?廣東揭陽,期末)2023年入冬以來,流感高發(fā),某醫(yī)院統(tǒng)計了一周中連續(xù)5天的流感就診
人數(shù)y與第%(%=1,2,3,4,5)天的數(shù)據(jù)如表所示.
X12345
y21IQa15a90109
根據(jù)表中數(shù)據(jù)可知尤,y具有較強的線性相關關系,其經驗回歸方程為y=20尤+10,則()
A.樣本相關系數(shù)在(0』內B.當x=2時,殘差為-2
C.點(3,15a)一定在經驗回歸直線上D.第6天到該醫(yī)院就診人數(shù)的預測值為130
4.(2024?全國?模擬預測)為了預測某地的經濟增長情況,某經濟學專家根據(jù)該地2023年1?6月的GDP
的數(shù)據(jù)y(單位:百億元)建立了線性回歸模型,得到的經驗回歸方程為y=0.42x+a,其中自變量x指的
是1?6月的編號,其中部分數(shù)據(jù)如表所示:
時間2023年)月2023年2月2023年3月2023年4月2023年5月2023年6月
編號X123456
W百億元為%11.107%線
參考數(shù)據(jù):£W=796,-?2=70.
i=li=l
則下列說法正確的是()
A.經驗回歸直線經過點(3511)
B.<7=10.255
C.根據(jù)該模型,該地2023年12月的GDP的預測值為14.57百億元
D.相應于點(%,%)的殘差為0二03
三、填空題
5.(2024?江蘇?一模)已知變量x,y的統(tǒng)計數(shù)據(jù)如下表,對表中數(shù)據(jù)作分析,發(fā)現(xiàn)y與X之間具有線性相關
關系,利用最小二乘法,計算得到經驗回歸直線方程為9=0.8尤+&,據(jù)此模型預測當x=10時亍的值
為.
11
X56789
y3.54566.5
6.(2024?陜西渭南?一模)已知一組數(shù)據(jù)點(4%)(,=1,2,,7),用最小二乘法得到其線性回歸方程為
77
y——2x+4,若Z玉=7,則£%=?
i=l?=1
四、解答題
7.(2024?山東日照?二模)某公司為考核員工,采用某方案對員工進行業(yè)務技能測試,并統(tǒng)計分析測試成績
以確定員工績效等級.
⑴已知該公司甲部門有3名負責人,乙部門有4名負責人,該公司從甲、乙兩部門中隨機選取3名負責人
做測試分析,記負責人來自甲部門的人數(shù)為X,求X的最有可能的取值:
-7xz
------------x0.02
(0)已知某部門測試的平均成績?yōu)?0分,估計其績效等級優(yōu)秀率;
5)根據(jù)統(tǒng)計分析,大致認為各部門測試平均成績尤?其中〃近似為樣本平均數(shù)元,/近似為
樣本方差經計算s。20,求某個部門績效等級優(yōu)秀率不低于0.78的概率.
參考公式與數(shù)據(jù):①ln0.15工-1.9,e1'2?3.32,ln5.2a1.66.
n__
八Y^-nxy
②線性回歸方程9=加+6中,》=弓--------,d=y-bx.
2—2
2^xi-nx
i=i
③若隨機變量X?,貝P(〃-cr<X<〃+cr)=0.6826,P(〃—2b<X<〃+2cr)=0.9544,
P(〃-3cr<X<〃+3b)=0.9974.
8.(22-23高三上?山東青島?期末)由相〃個小正方形構成長方形網格有機行和〃列.每次將一個小球放到一個
小正方形內,放滿為止,記為一輪.每次放白球的頻率為P,放紅球的概率為q,P+4=l.
12
⑴若根=2,P=q=;,記y表示100輪放球試驗中"每一列至少一個紅球”的輪數(shù),統(tǒng)計數(shù)據(jù)如表:
n12345
y7656423026
求y關于〃的回歸方程Iny=加+。,并預測〃=10時,y的值;(精確到1)
1?
(2)若m=2,n=2,p=~,q=~,記在每列都有白球的條件下,含紅球的行數(shù)為隨機變量X,求X的分
布列和數(shù)學期望;
⑶求事件〃不是每一列都至少一個紅球〃發(fā)生的概率,并證明:(i-yw)n+(i-^f>1.
k
-X七%-反守5_
附:經驗回歸方程系數(shù):5=37--------------,a=y-bx,2%/ny,=53,百]=3.8.
_居2i=l
z=l
反思提升:
n——
A^^.XiyiYLJQyAA—A—A
(1)求經驗回歸方程:利用公式,二.求0;利用a=y一以求a,寫出經驗回歸方程.
Y^Xi—nx2
(2)經驗回歸方程的擬合效果,可以利用相關系數(shù)卜|判斷,當|r|越趨近于1時,兩變量的線性相
關性越強.或利用決定系數(shù)K判斷,F(xiàn)越大,擬合效果越好.
⑶非線性經驗回歸方程轉化為線性經驗回歸方程的方法
AAAAAAAAAAA
①若y=a+by[x,設£=疝,則y=a+初;②若滿足對數(shù)式:y=a+blnx,設,=ln%,則y=a+
A
bt-,③若滿足指數(shù)式:y=ciec2x,兩邊取對數(shù)解Iny=lnci+czx,設z=lny,a=lnci,b=ci,
貝Uz=a+bx.
【考點3】獨立性檢驗
一、單選題
1.(2024?黑龍江哈爾濱?二模)針對2025年第九屆亞冬會在哈爾濱舉辦,校團委對"是否喜歡冰雪運動與學
生性別的關系”進行了一次調查,其中被調查的男、女生人數(shù)相同,男生中喜歡冰雪運動的人數(shù)占男生人數(shù)
的三,女生中喜歡冰雪運動的人數(shù)占女生人數(shù)的;,若依據(jù)&=0.05的獨立性檢驗,認為是否喜歡冰雪運動
63
與學生性別有關,則被調查的學生中男生的人數(shù)不可能是()
2_n{ad-be)2
(a+b)(c+d)(a+c)(b+d)
a0.10.050.010.0050.001
13
%2.7063.8416.6357.87910.828
A.48B.54C.60D.66
2.(2024?寧夏銀川?一模)有甲、乙兩個班級進行數(shù)學考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)
秀統(tǒng)計成績,得到如下所示的列聯(lián)表:
優(yōu)秀非優(yōu)秀總計
甲班10b
乙班C30
合計
A.列聯(lián)表中c的值為30,6的值為35
B.列聯(lián)表中c的值為15,b的值為50
C.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,能認為"成績與班級有關系”
D.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,不能認為"成績與班級有關系”
二、多選題
3.(2024?山東臨沂?一模)下列結論正確的是()
A.一組樣本數(shù)據(jù)的散點圖中,若所有樣本點a,%)都在直線^=0.95%+1上,則這組樣本數(shù)據(jù)的樣本相
關系數(shù)為0.95
B.已知隨機變量,N(3,4),若J=2〃+l,則
C.在2x2列聯(lián)表中,若每個數(shù)據(jù)a,》,c,d均變成原來的2倍,則/也變成原來的2倍
2
,2n(ad-be)_,、
CX-7i/\/j,其中〃=a+6+c+d)
(a+b)(c+d)(a+c)[b+d)
D.分別拋擲2枚質地均勻的骰子,若事件A="第一枚骰子正面向上的點數(shù)是奇數(shù)",3="2枚骰子正面
向上的點數(shù)相同",則A2互為獨立事件
4.(22-23高三下?浙江?開學考試)下列結論中,正確的有()
14
A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為5
B.若隨機變量舁"(1,4),尸(空一2)=0.21,則尸(公4)=0.79
C.己知經驗回歸方程為夕=Bx+1.8,B.x=2,y=20,則B=9.1
D.根據(jù)分類變量X與¥的成對樣本數(shù)據(jù),計算得到f=9.632,依據(jù)小概率值a=0.001的/獨立性檢
驗(%0m=10.828),可判斷X與Y有關聯(lián),此推斷犯錯誤的概率不大于0.001
三、填空題
5.(21-22高二下?福建福州?期末)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下列聯(lián)表:
疾病
藥物合計
未患病患病
服用a50—a50
未服用80—。a—3050
合計8020100
若在本次考察中得出"在犯錯誤的概率不超過0.01的前提下認為藥物有效”的結論,則a的最小值
為.(其中心40且aeN*)(參考數(shù)據(jù):76.635?2.58,J10.828—3.29)
2n(ad-bc]
附:%=-,---------77—^~77——------------7,ll=a+b+C+d
(a+6)(c+d)(a+c)(6+d)
a0.10.050.010.0050.001
xa2.7063.8416.6357.87910.828
6.(2024?上海金山?二模)為了考察某種藥物預防疾病的效果,進行動物試驗,得到如下圖所示列聯(lián)表:
疾病
藥物合計
未患病患病
服用m50-m50
未服用80—mm—3050
合計8020100
取顯著性水平a=0.05,若本次考察結果支持“藥物對疾病預防有顯著效果",則加(〃二40,meN)的最小值
為_________
15
n(ad-be)2
(參考公式:/=;參考值:P(Z2>3.841)?0.05)
(a+b)(c+d)(a+c)(b+d)
四、解答題
7.(2023,廣東深圳?二模)飛盤運動是一項入門簡單,又具有極強的趣味性和社交性的體育運動,目前已經
成為了年輕人運動的新潮流.某俱樂部為了解年輕人愛好飛盤運動是否與性別有關,對該地區(qū)的年輕人進行
了簡單隨機抽樣,得到如下列聯(lián)表:
飛盤運動
性別合計
不愛好愛好
男61622
女42428
合計104050
⑴在上述愛好飛盤運動的年輕人中按照性別采用分層抽樣的方法抽取10人,再從這10人中隨機選取3人
訪談,記參與訪談的男性人數(shù)為X,求X的分布列和數(shù)學期望;
(2)依據(jù)小概率值。=0.01的獨立性檢驗,能否認為愛好飛盤運動與性別有關聯(lián)?如果把上表中所有數(shù)據(jù)都擴
大到原來的10倍,在相同的檢驗標準下,再用獨立性檢驗推斷愛好飛盤運動與性別之間的關聯(lián)性,結論還
一樣嗎?請解釋其中的原因.
附./_"(ad-bc》
其中“=a+b+c+d.
(a+b)(c+d)(a+c)(b+d)
a0.10.010.001
Xa2.7066.63510.828
8.(2024?吉林?模擬預測)短視頻已成為當下宣傳的重要手段,東北某著名景點利用短視頻宣傳增加旅游熱
度,為調查某天南北方游客來此景點旅游是否與收看短視頻有關,該景點對當天前來旅游的500名游客調
查得知,南方游客有300人,因收看短視頻而來的280名游客中南方游客有200人.
⑴依據(jù)調查數(shù)據(jù)完成如下列聯(lián)表,根據(jù)小概率值a=0.001的獨立性檢驗,分析南北方游客來此景點旅游是
否與收看短視潁有關聯(lián):單位:人
短視頻
游客合計
收看未看
16
南方游客
北方游客
合計
⑵為了增加游客的旅游樂趣,該景點設置一款5人傳球游戲,每個人得到球后都等可能地傳給其余4人之
一,現(xiàn)有甲、乙等5人參加此游戲,球首先由甲傳出.
(i)求經過,次傳遞后球回到甲的概率;
(ii)記前機次傳遞中球傳到乙的次數(shù)為X,求X的數(shù)學期望.
n(ad-be,f_tn\jn_
參考公式:z2=其中〃=a+/?+c+d;E\=ZE(Xj
(a+b)(c+d)(Q+c)(Z?+d)VZ=17z=l
附表:
a0.10.050.010.0050.001
2.7063.8416.6357.87910.828
反思提升:
L在2X2列聯(lián)表中,如果兩個變量沒有關系,則應滿足ad—尻心0.|〃一陽越小,說明兩個變
量之間關系越弱;|ad一尻|越大,說明兩個變量之間關系越強.
2.解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結論.獨立性檢驗的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表:
(2)根據(jù)公式/=
〃(ad-bc)之
計算X2;
(a+6)(a+c)(b+d)(c+d)
(3)通過比較/與臨界值的大小關系來作統(tǒng)計推斷.
分層檢測
【基礎篇】
一、單選題
1.(2024?浙江寧波?二模)某校數(shù)學建模興趣小組為研究本地區(qū)兒子身高y(cm)與父親身高x(cm)之間的關
系,抽樣調查后得出'與x線性相關,且經驗回歸方程為9=O.85X+29.5.調查所得的部分樣本數(shù)據(jù)如下:
父親身高x(cm)164166170173173174180
兒子身高y(cm)165168176170172176178
17
則下列說法正確的是()
A.兒子身高了(cm)是關于父親身高x(cm)的函數(shù)
B.當父親身高增加1cm時,兒子身高增加0.85cm
C.兒子身高為172cm時,父親身高一定為173cm
D.父親身高為170cm時,兒子身高的均值為174cm
2.(2024?天津河西?一模)隨著居民家庭收入的不斷提高,人們對居住條件的改善的需求也在逐漸升溫.某
城市統(tǒng)計了最近5個月的房屋交易量,如下表所示:
時間尤12345
交易量y(萬套)0.50.81.01.21.5
若丫與尤滿足一元線性回歸模型,且經驗回歸方程為a=o-24x+e,則下列說法錯誤的是()
A.根據(jù)表中數(shù)據(jù)可知,變量'與x正相關
B.經驗回歸方程f=0.24x+C中&=0.28
C.可以預測x=6時房屋交易量約為1.72(萬套)
D.x=5時,殘差為-0.02
3.(2024?天津?一模)下列說法正確的是()
A.一組數(shù)據(jù)7,8,8,9,11/3,15,17,20,22的第80百分位數(shù)為17;
B.根據(jù)分類變量X與丫的成對樣本數(shù)據(jù),計算得到力2=4.712,根據(jù)小概率值a=Q05的獨立性檢驗
(馬05=3.841),可判斷X與y有關聯(lián),此推斷犯錯誤的概率不大于0.05;
C.兩個隨機變量的線性相關性越強,相關系數(shù)的絕對值越接近于0;
D.若隨機變量。,〃滿足〃=3。-2,則。⑻=3。0-2.
4.(23-24高三上?天津北辰?期中)下列結論中,錯誤的是()
A.數(shù)據(jù)4,1,6,2,9,5,8的第60百分位數(shù)為6
B.若隨機變量尸偌4-2)=0.21,則P(JW4)=0.79
C.已知經驗回歸方程為y=〃x+1.8,且x=2,y=20,貝心=9.1
D.根據(jù)分類變量X與丫成對樣本數(shù)據(jù),計算得到*2=9.632,依據(jù)小概率值a=0.001的/獨立性檢驗
(^0,001=10.828),可判斷x與y有關聯(lián),此推斷犯錯誤的概率不大于0.001
二、多選題
5.(2023?湖北?模擬預測)下列命題中正確的是()
18
A.若樣本數(shù)據(jù)耳,々,L,尤20的樣本方差為3,則數(shù)據(jù)25+1,2X2+1,L,2X20+1的方差為7
B.經驗回歸方程為a=0.3-0.7x時,變量x和y負相關
C.對于隨機事件A與'P(A)>0,P(B)>0,若P(A|B)=P(A),則事件A與B相互獨立
D.若乂~《7,£|,則P(X=L)取最大值時左=4
6.(2024?山東棗莊?模擬預測)已知兩個變量y與尤對應關系如下表:
X12345
y5m8910.5
若y與無滿足一元線性回歸模型,且經驗回歸方程為9=L25x+4.25,則()
A.y與尤正相關B.m=7
C.樣本數(shù)據(jù)y的第60百分位數(shù)為8D.各組數(shù)據(jù)的殘差和為0
7.(2024?湖北武漢?二模)下列結論正確的是()
A.一組數(shù)據(jù)7,8,8,9,11,13,15,17,20,22的第80百分位數(shù)為17
B.若隨機變量機〃滿足〃=3”2,則。(〃)=3。?-2
C.若隨機變量tN(4,(T2),且尸C<6)=0.8,貝。2(2<4<6)=。.6
D.根據(jù)分類變量X與V的成對樣本數(shù)據(jù),計算得到力2=4.712.依據(jù)e=0.05的獨立性檢驗(xo,o5=3-841),
可判斷x與y有關
三、填空題
8.(23-24高三下?上海嘉定?階段練習)某產品的廣告支出費用無(單位:萬元)與銷售額y(單位:萬元)
的數(shù)據(jù)如下表:
X24568
y3040a5070
已知y關于x的線性回歸方程為y=6.5x+15.1,則表格中實數(shù)a的值為.
9.(23-24高二下?江西贛州?期中)甲、乙、丙、丁各自研究兩個隨機變量的數(shù)據(jù),若甲、乙、丙、丁計算
得到各自研究的兩個隨機變量的線性相關系數(shù)分別為4=066,々=-0.97,4=092,〃=0.89,則這四人
中,研究的兩個隨機變量的線性相關程度最高.
10.(2024?上海長寧?二模)收集數(shù)據(jù),利用2x2列聯(lián)表,分析學習成績好與上課注意力集中是否有關時,
提出的零假設為:學習成績好與上課注意力集中(填:有關或無關)
19
四、解答題
11.(2024?四川成都?模擬預測)數(shù)據(jù)顯示,中國在線直播用戶規(guī)模及在線直播購物規(guī)模近幾年都保持高速
增長態(tài)勢,某線下家電商場為提升人氣和提高營業(yè)額也開通了在線直播,下表統(tǒng)計了該商場開通在線直播
⑵根據(jù)第1至第5天的數(shù)據(jù)分析,可用線性回歸模型擬合y與尤的關系,試求出該線性回歸方程并估計該商
場開通在線直播的第10天的線下顧客人數(shù).
n
(參考公式:相關系數(shù)7=I,TI,_,參考數(shù)據(jù):同。13.038
店(x廠方區(qū)(%-丫)2
Vi=lVi=l
£(%一元)(外一歹)£七y一"無》
回歸方程:y=bx+a^其中匕=3-,a=y-bx)
方(占-可2h位2
1=11=1
12.(2024,四川內江?三模)2024年2月10日至17日(正月初一至初八),"2024?內江市中區(qū)新春極光焰火
草地狂歡節(jié)"在川南大草原舉行,共舉行了8場精彩的煙花秀節(jié)目.前5場的觀眾人數(shù)(單位:萬人)與場
次的統(tǒng)計數(shù)據(jù)如表所示:
場次編號X12345
觀眾人數(shù)y0.70.811.21.3
⑴已知可用線性回歸模型擬合y與尤的關系,請建立V關于X的線性回歸方程;
(2)若該煙花秀節(jié)目分A、B、C三個等次的票價,某機構隨機調查了該煙花秀節(jié)目現(xiàn)場200位觀眾的性別與
購票情況,得到的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 夢魘的臨床護理
- 工程新質生產力
- 邵陽初三聯(lián)考試卷及答案
- 山西高一文科試卷及答案
- 三中地理會考試卷及答案
- 礦山機械企業(yè)管理與創(chuàng)新能力考核試卷
- 電光源光生物安全性與健康影響考核試卷
- 家用電器產品創(chuàng)新設計理念探討考核試卷
- 棉織造行業(yè)智能物流系統(tǒng)設計考核試卷
- 咖啡大師考試試題及答案
- (完整版)混凝土樁鉆芯法檢測題庫
- 稅務行政執(zhí)法證據(jù)淺析
- 三軸攪拌樁安全操作規(guī)程
- 上海市中學藝術課程標準(征求意見稿)說明
- QCC改善案例(超經典)
- LED制程與工藝介紹
- 《馬克思主義中國化思想通史》導讀-南京林業(yè)大學中國大學mooc課后章節(jié)答案期末考試題庫2023年
- 復合銅箔項目可行性研究報告(范文模板)
- 高等學校體育工作基本標準
- 北京中考語文詞語表
- 病理學心血管系統(tǒng)疾病課件
評論
0/150
提交評論