版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第83講統(tǒng)計
知識梳理
知識點一、抽樣
1、抽樣調查
(1)總體:統(tǒng)計中所考察對象的某一數(shù)值指標的全體構成的集合稱為總體.
(2)個體:構成總體的每一個元素叫做個體.
(3)樣本:從總體中抽取若干個個體進行考察,這若干個個體所構成的集合叫做總體
的一個樣本,樣本中個體的數(shù)目叫做樣本容量.
2、簡單隨機抽樣
(1)定義
一般地,設一個總體含有N個個體,從中逐個不放回地抽取〃個個體作為樣本
(wWN),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫
做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.
(2)兩種常用的簡單隨機抽樣方法
①抽簽法:一般地,抽簽法就是把總體中的N個個體編號,把號碼寫在號簽上,將號
簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續(xù)抽取w次,就得到一個容
量為”的樣本.
②隨機數(shù)法:即利用隨機數(shù)表、隨機數(shù)骰子或計算機產生的隨機數(shù)進行抽樣.這里僅
介紹隨機數(shù)表法.隨機數(shù)表由數(shù)字0,1,2,…,9組成,并且每個數(shù)字在表中各個位置
出現(xiàn)的機會都是一樣的.
注意:為了保證所選數(shù)字的隨機性,需在查看隨機數(shù)表前就指出開始數(shù)字的橫、縱位
置.
(3)抽簽法與隨機數(shù)法的適用情況
抽簽法適用于總體中個體數(shù)較少的情況,隨機數(shù)法適用于總體中個體數(shù)較多的情況,
但是當總體容量很大時,需要的樣本容量也很大時,利用隨機數(shù)法抽取樣本仍不方便.
(4)簡單隨機抽樣的特征
①有限性:簡單隨機抽樣要求被抽取的樣本的總體個數(shù)是有限的,便于通過樣本對總體
進行分析.
②逐一性:簡單隨機抽樣是從總體中逐個地進行抽取,便于實踐中操作.
③不放回性:簡單隨機抽樣是一種不放回抽樣,便于進行有關的分析和計算.
④等可能性:簡單單隨機抽樣中各個個體被抽到的機會都相等,從而保證了抽樣方法的
公平.
只有四個特點都滿足的抽樣才是簡單隨機抽樣.
3、分層抽樣
(1)定義
一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地
抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法叫做分層抽
樣.
分層抽樣適用于已知總體是由差異明顯的幾部分組成的.
(2)分層抽樣問題類型及解題思路
①求某層應抽個體數(shù)量:按該層所占總體的比例計算.
②己知某層個體數(shù)量,求總體容量或反之求解:根據(jù)分層抽樣就是按比例抽樣,列比
例式進行計算.
樣本容量
③分層抽樣的計算應根據(jù)抽樣比構造方程求解,其中“抽樣比=蜂卷=
各層樣本數(shù)量,,
各層個體數(shù)量
注意:分層抽樣時,每層抽取的個體可以不一樣多,但必須滿足抽?。?竺
㈠=1,2,…#)個個體(其中,是層數(shù),w是抽取的樣本容量,乂是第,層中個體的個
數(shù),N是總體容量).
知識點二、用樣本估計總體
1、頻率分布直方圖
(1)頻率、頻數(shù)、樣本容量的計算方法
頻率
端歪x組距=頻率.
頻數(shù)頻數(shù)
②武)量=頻率'命第=樣本容量,樣本容量X頻率=頻數(shù).
③頻率分布直方圖中各個小方形的面積總和等于1.
2、頻率分布直方圖中數(shù)字特征的計算
(1)最高的小長方形底邊中點的橫坐標即是眾數(shù).
(2)中位數(shù)左邊和右邊的小長方形的面積和是相等的.設中位數(shù)為x,利用x左
(右)側矩形面積之和等于0.5,即可求出x.
(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面
積乘以小長方形底邊中點的橫坐標之和,即有工二國網+網月+…+七衛(wèi),其中當為每個小
長方形底邊的中點,為每個小長方形的面積.
3、百分位數(shù)
(1)定義
一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小于或等
于這個值,且至少有(100-0%的數(shù)據(jù)大于或等于這個值.
(2)計算一組〃個數(shù)據(jù)的的第p百分位數(shù)的步驟
①按從小到大排列原始數(shù)據(jù).
②計算i=p%.
③若,不是整數(shù)而大于i的比鄰整數(shù)j,則第p百分位數(shù)為第/項數(shù)據(jù);若,是整數(shù),則
第p百分位數(shù)為第i項與第i+1項數(shù)據(jù)的平均數(shù).
(3)四分位數(shù)
我們之前學過的中位數(shù),相當于是第50百分位數(shù).在實際應用中,除了中位數(shù)外,常
用的分位數(shù)還有第25百分位數(shù),第75百分位數(shù).這三個分位數(shù)把一組由小到大排列后的數(shù)
據(jù)分成四等份,因此稱為四分位數(shù).
4、樣本的數(shù)字特征
(1)眾數(shù)、中位數(shù)、平均數(shù)
①眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)叫眾數(shù),眾數(shù)反應一組數(shù)據(jù)的多數(shù)水平.
②中位數(shù):將一組數(shù)據(jù)按大小順序依次排列,把處在最中間位置的一個數(shù)據(jù)(或最中間
兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),中位數(shù)反應一組數(shù)據(jù)的中間水平.
③平均數(shù):〃個樣本數(shù)據(jù)公尤2,…,7的平均數(shù)為1=>+"2+…,反應一組數(shù)據(jù)的平
n
均水平,公式變形:=nx.
Z=1
5、標準差和方差
(1)定義
①標準差:標準差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s表示.假設樣本數(shù)
據(jù)是和々,…,X”,X表示這組數(shù)據(jù)的平均數(shù),則標準差
s=-尤)2+(x-x)2+■-■+(x?-x)2].
Vn2
②方差:方差就是標準差的平方,即$2=—[(玉-”了+卜-左丁+…+⑸-幻」.顯然,
n
在刻畫樣本數(shù)據(jù)的分散程度上,方差與標準差是一樣的.在解決實際問題時,多采用標準差.
(2)數(shù)據(jù)特征
標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動程度的大小.標準差、方差越大,則數(shù)據(jù)
的離散程度越大;標準差、方差越小,數(shù)據(jù)的離散程度越小.反之亦可由離散程度的大小推
算標準差、方差的大小.
(3)平均數(shù)、方差的性質
如果數(shù)據(jù)玉,々,……,七的平均數(shù)為最,方差為S',那么
2
①一組新數(shù)據(jù)玉+b,x2+b,...xn+b的平均數(shù)為尤+b,方差是s.
②一組新數(shù)據(jù)...,axn的平均數(shù)為ax,方差是/s?.
③一組新數(shù)據(jù)叫+b,ax2+b,...,axn+Z?的平均數(shù)為ax+b,方差是a2s
必考題型全歸納
題型一:隨機抽樣、分層抽樣
例1.(2024?全國?高三專題練習)某工廠為了對產品質量進行嚴格把關,從500件產品
中隨機抽出50件進行檢驗,對這500件產品進行編號001,002,500,從下列隨機數(shù)
表的第二行第三組第一個數(shù)字開始,每次從左往右選取三個數(shù)字,則抽到第四件產品的編
號為()
283931258395952472328995
721628843660107343667575
943661184479514096949592
601749514068751632414782
A.447B.366C.140D.118
例2.(2024?河南?校聯(lián)考模擬預測)已知某班共有學生46人,該班語文老師為了了解
學生每天閱讀課外書籍的時長情況,決定利用隨機數(shù)表法從全班學生中抽取10人進行調
查.將46名學生按01,02,…,46進行編號.現(xiàn)提供隨機數(shù)表的第7行至第9行:
84421753315724550688770474476721763350258392120676
63016378591695565719981050717512867358074439523879
33211234297864560782524207443815510013429966027954
若從表中第7行第41列開始向右依次讀取2個數(shù)據(jù),每行結束后,下一行依然向右讀數(shù),
則得到的第8個樣本編號是()
A.07B.12C.39D.44
例3.(2024?全國?高三專題練習)現(xiàn)要完成下列2項抽樣調查:
①從10盒酸奶中抽取3盒進行食品衛(wèi)生檢查;
②東方中學共有160名教職工,其中教師120名,行政人員16名,后勤人員24名.為了
了解教職工對學校在校務公開方面的意見,擬抽取一個容量為20的樣本.
較為合理的抽樣方法是()
A.①抽簽法,②分層隨機抽樣B.①隨機數(shù)法,②分層隨機抽樣
C.①隨機數(shù)法,②抽簽法D.①抽簽法,②隨機數(shù)法
變式1.(2024?安徽阜陽?高三安徽省臨泉第一中學??茧A段練習)在二戰(zhàn)期間,技術先
進的德國坦克使德軍占據(jù)了戰(zhàn)場主動權,了解德軍坦克的生產能力對盟軍具有非常重要的
戰(zhàn)略意義,盟軍請統(tǒng)計學家參與情報的收集和分析工作.在繳獲的德軍坦克上發(fā)現(xiàn)每輛坦
克都有獨一無二的發(fā)動機序列號,前6位表示生產的年月,最后4位是按生產順序開始的
連續(xù)編號.統(tǒng)計學家將繳獲的德軍坦克序列號作為樣本,用樣本估計總體的方法推斷德軍
每月生產的坦克數(shù).假設德軍某月生產的坦克總數(shù)為N,繳獲的該月生產的〃輛坦克編號
從小到大為毛,巧,L,xn,繳獲的坦克是從所生產的坦克中隨機獲取的,繳獲坦克的
編號4,巧,L,Z,相當于從[1,N]中隨機抽取的”個整數(shù),這幾個數(shù)將區(qū)間[0,N]分
成(W+1)個小區(qū)間(如圖).可以用前"個區(qū)間的平均長度土估計所有5+1)個區(qū)間的平均
n
N
長度」7,進而得到N的估計.如果繳獲的坦克編號為:35,67,90,127,185,245,
n+1
287.則可以估計德軍每月生產的坦克數(shù)為()
III____________________|____I?
0即…NX
A.288B.308C.328D.348
變式2.(2024?江蘇?高三江蘇省梁豐高級中學校聯(lián)考階段練習)為了慶祝中國共產黨第
二十次全國代表大會,學校采用按比例分配的分層隨機抽樣的方法從高一1002人,高二
1002人,高三1503人中抽取126人觀看“中國共產黨第二十次全國代表大會”直播,那么
高三年級被抽取的人數(shù)為()
A.36B.42C.50D.54
變式3.(2024?北京?高三強基計劃)某校共2017名學生,其中每名學生至少要選A,B
兩門課中的一門,也有些學生選了兩門課.已知選A的人數(shù)占全校人數(shù)的百分比在70%到
75%之間,選8的人數(shù)占全校人數(shù)的百分比在40%到45%之間.則下列結論中正確的是
()
A.同時選A,8的可能有200人B.同時選A,8的可能有300人
C.同時選A,8的可能有400人D.同時選A,8的可能有500人
變式4.(2024?河南?襄城高中校聯(lián)考三模)現(xiàn)有300名老年人,500名中年人,400名
青年人,從中按比例用分層隨機抽樣的方法抽取,人,若抽取的老年人與青年人共21名,
則〃的值為()
A.15B.30C.32D.36
【解題方法總結】
不論哪種抽樣方法,總體中的每一個個體入樣的概率都是相同的.
題型二:統(tǒng)計圖表
例4.(多選題)(2024?河北石家莊?高三校聯(lián)考期中)恩格爾系數(shù)是食品支出總額占個
人消費支出總額的比重,它在一定程度上可以用來反映人民生活水平.恩格爾系數(shù)的一般
規(guī)律:收入越低的家庭,恩格爾系數(shù)就越大;收入越高的家庭,恩格爾系數(shù)就越小.國際
上一般認為,當恩格爾系數(shù)大于0.6時,居民生活處于貧困狀態(tài);在0.5-0.6之間,居民生
活水平處于溫飽狀態(tài);在0.4-0.5之間,居民生活水平達到小康;在0.3-0.4之間,居民生
活水平處于富裕狀態(tài);當小于0.3時,居民生活達到富有.下面是某地區(qū)2022年兩個統(tǒng)計
圖,它們分別為城鄉(xiāng)居民恩格爾系數(shù)統(tǒng)計圖和城鄉(xiāng)居民家庭人均可支配收入統(tǒng)計圖,請你
依據(jù)統(tǒng)計圖進行分析判斷,下列結論錯誤的是()
城鄉(xiāng)居民恩格爾系數(shù)(%)
35_____________________________________________31.6
3028.327.427.728.326.1
2522.7[~]23.1口23.8口24_
20—
15—
10—
5—
20172018201920202021
口城鎮(zhèn)居民口農村居民
圖1
城鄉(xiāng)居民家庭人均可支配收人(元)
140000
120000
8326284793
100000
7735279132題92
80000
6000040。8240Z884屋50系甌
40000
43878
20000
20172018201920202021
農村居民城鎮(zhèn)居民
圖2
A.農村居民自2017年到2021年,居民生活均達到富有
B.近五年城鄉(xiāng)居民家庭人均可支配收入差異最大的年份是2020年
C.城鄉(xiāng)居民恩格爾系數(shù)差異最小的年份是2019年
D.2022年該地區(qū)城鎮(zhèn)居民和農村居民的生活水平已經全部處于富有狀態(tài)
例5.(多選題)(2024?河北唐山?遷西縣第一中學校考二模)2022年的夏季,全國多地
迎來罕見極端高溫天氣.某課外小組通過當?shù)貧庀蟛块T統(tǒng)計了當?shù)仄咴路萸?0天每天的最
高氣溫與最低氣溫,得到如下圖表,則根據(jù)圖表,下列判斷正確的是()
B.七月份前20天中最高氣溫的極差大于最低氣溫的極差
C.七月份前20天最高氣溫的平均數(shù)高于40℃
D.七月份前10天(1—10日)最高氣溫的方差大于最低氣溫的方差
例6.(多選題)(2024?山西忻州?高三校聯(lián)考開學考試)航海模型項目在我國已開展四
十余年,深受青少年的喜愛.該項目整合國防、科技、工程、藝術、物理、數(shù)學等知識,主
要通過讓參賽選手制作、遙控各類船只、艦艇等模型航行,普及船艇知識,探究海洋奧
秘,助力培養(yǎng)未來海洋強國的建設者.某學樣為了解學生對航海模型項目的喜愛程度,用比
例分配的分層隨機抽樣法從某校高一、高二、高三年級所有學生中抽取部分學生做抽樣調
查.已知該學校高一、高二、高三年級學生人數(shù)的比例如圖所示,若抽取的樣本中高三年級
學生有32人,則下列說法正確的是()
A.該校高一學生人數(shù)是2000
B.樣本中高二學生人數(shù)是28
C.樣本中高三學生人數(shù)比高一學生人數(shù)多12
D.該校學生總人數(shù)是8000
變式5.(多選題)(2024?湖南株洲?高三??茧A段練習)某公司統(tǒng)計了2024年1月至6
月的月銷售額(單位:萬元),并與2022年比較,得到同比增長率數(shù)據(jù),繪制了如圖所示
的統(tǒng)計圖,則下列說法正確的是()
注:同比增長率=(今年月銷售額一去年同期月銷售額);去年同期月銷售額x100%.
B.2024年1月至6月的月銷售額的第60百分位數(shù)為8
C.2024年1月至6月的月銷售額的中位數(shù)為9.5
D.2022年5月的月銷售額為10萬元
變式6.(多選題)(2024?廣東梅州?統(tǒng)考三模)某公司經營五種產業(yè),為應對市場變
化,在五年前進行了產業(yè)結構調整,優(yōu)化后的產業(yè)結構使公司總利潤不斷增長,今年總利
潤比五年前增加了一倍,調整前后的各產業(yè)利潤與總利潤的占比如圖所示,則下列結論錯
誤的是()
傳媒因手
書
73傳?
2^32%J\
25%寸雜志
K\5y\
2*23%7
房地產卷房地產試卷
調整前調整后
A.調整后傳媒的利潤增量小于雜志
B.調整后房地產的利潤有所下降
C.調整后試卷的利潤增加不到一倍
D.調整后圖書的利潤增長了一倍以上
變式7.(多選題)(2024?福建福州?福州三中??寄M預測)某調查機構對我國若干大
型科技公司進行調查統(tǒng)計,得到了從事芯片、軟件兩個行業(yè)從業(yè)者的年齡分布的餅形圖和
“90后”從事這兩個行業(yè)的崗位分布雷達圖,則下列說法中一定正確的是()
90后從事芯片、軟件芯片、軟件行業(yè)
行業(yè)崗位的分布從業(yè)者年齡分布
A.芯片、軟件行業(yè)從業(yè)者中,“90后”占總人數(shù)的比例超過50%
B.芯片、軟件行業(yè)中從事技術、設計崗位的“90后”人數(shù)超過總人數(shù)的25%
C.芯片、軟件行業(yè)從事技術崗位的人中,“90后”比“80后”多
D.芯片、軟件行業(yè)中,“90后”從事市場崗位的人數(shù)比“80前”的總人數(shù)多
變式8.(多選題)(2024?河北?統(tǒng)考模擬預測)某地環(huán)保部門公布了該地A,8兩個景區(qū)
2016年至2022年各年的全年空氣質量優(yōu)良天數(shù)的數(shù)據(jù).現(xiàn)根據(jù)這組數(shù)據(jù)繪制了如圖所示的
散點圖,則由該圖得出的下列結論中正確的是()
數(shù)
天
34O
32O
30O1
301
2X0上293£80上283一,293
260________________▲262上266▲262
240.254?254人255一
皴。217.203、
02016年2017年2018年2019年2020年2021年2022年年份
?景區(qū)A▲景區(qū)B
A.景區(qū)A這7年的空氣質量優(yōu)良天數(shù)的中位數(shù)為254
B.景區(qū)8這7年的空氣質量優(yōu)良天數(shù)的第80百分位數(shù)為280
C.這7年景區(qū)A的空氣質量優(yōu)良天數(shù)的標準差比景區(qū)8的空氣質量優(yōu)良天數(shù)的標準差
大
D.這7年景區(qū)A的空氣質量優(yōu)良天數(shù)的平均數(shù)比景區(qū)3的空氣質量優(yōu)良天數(shù)的平均數(shù)
大
【解題方法總結】
統(tǒng)計圖表的主要應用
扇形圖:直觀描述各類數(shù)據(jù)占總數(shù)的比例;
折線圖:描述數(shù)據(jù)隨時間的變化趨勢;
條形圖和直方圖:直觀描述不同類別或分組數(shù)據(jù)的頻數(shù)和頻率.
題型三:頻率分布直方圖
例7.(2024?四川成都?高三成都七中校考階段練習)某區(qū)為了解全區(qū)12000名高二學生
的體能素質情況,在全區(qū)高二學生中隨機抽取了1000名學生進行體能測試,并將這1000名
的體能測試成績整理成如下頻率分布直方圖.根據(jù)此頻率分布直方圖,這1000名學生平均
成績的估計值為.
例8.(2024?云南?統(tǒng)考二模)某大學有男生2000名.為了解該校男生的身體體重情
況,隨機抽查了該校100名男生的體重,并將這100名男生的體重(單位:kg)分成以下
六組:[54,58)、[58,62)、[62,66)、[66,70)、[70,74)、[74,78],繪制成如下的頻率分布
該校體重(單位:kg)在區(qū)間[70,78]上的男生大約有人.
例9.(2024?全國?高三專題練習)2022年12月4日是第九個國家憲法日,主題為“學習
宣傳貫徹黨的二十大精神,推動全面貫徹實施憲法”,某校由學生會同學制作了憲法學習問
卷,收獲了有效答卷2000份,先對其得分情況進行了統(tǒng)計,按照[50,60)、[60,70).........
[90,100]分成5組,并繪制了如圖所示的頻率分布直方圖,則圖中工=.
變式9.(2024?上海浦東新?高三上海市建平中學??奸_學考試)從某小學所有學生中隨
機抽取100名學生,將他們的身高(單位:cm)數(shù)據(jù)繪制成頻率分布直方圖(如圖),其
中樣本數(shù)據(jù)分組口。0,11。),口1。,120),[120,130),[130,140),[140,150),若要從身高在
[120,130),[130,140),口40,150)三組內的學生中,用分層抽樣的方法抽取12人參加一項
活動,則從身高在口30,140)內的學生中抽取的人數(shù)應為.
變式10.(2024?上海普陀?高三曹楊二中??茧A段練習)某校調查了200名學生每周的
自習時間(單位:小時),制成了如圖所示的的頻率分布直方圖,根據(jù)直方圖,這200名學
生中每周的自習時間不少于22.5小時的人數(shù)為:.
變式11.(2024?內蒙古呼倫貝爾?高三海拉爾第一中學??茧A段練習)某蔬菜批發(fā)市場
銷售某種蔬菜.在一個銷售周期內,每售出1噸該蔬菜獲利500元,未售出的蔬菜低價處
理,每噸虧損100元.統(tǒng)計該蔬菜在過去的100個銷售周期內的市場需求量所得頻率分布直
方圖如下:
(1)求圖中a的值并求100個銷售周期的平均市場需求量;
(2)若經銷商在下一個銷售周期購入19。噸該蔬菜,設>為銷售周期所得利潤(單位:
元),x為該銷售周期的市場需求量(單位:噸),求x,y的函數(shù)關系式,并估計銷售的利
潤不少于86000元的概率.
【解題方法總結】
(1)利用頻率分布直方圖求頻率、頻數(shù);
(2)利用頻率分布直方圖估計總體.
(3)頻率分布直方圖的縱坐標是繁,而不是頻率.
組距
題型四:百分位數(shù)
例10.(2024?上海?高三專題練習)以下數(shù)據(jù)為參加數(shù)學競賽決賽的15人的成績(單
位:分),分數(shù)從低到高依次:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,則這15人成
績的第80百分位數(shù)是.
例11.(2024?上海浦東新?高三上海市建平中學校考階段練習)某校為了了解高三年級
學生的身體素質狀況,在開學初舉行了一場身體素質體能測試,以便對體能不達標的學生
進行有針對性的訓練,促進他們體能的提升,現(xiàn)從整個年級測試成績中抽取100名學生的
測試成績,并把測試成績分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六組,繪制
成頻率分布直方圖(如圖所示).其中分數(shù)在[90,100]這一組中的縱坐標為“,則該次體能
測試成績的80%分位數(shù)約為分.
例12.(2024?安徽?校聯(lián)考二模)國慶節(jié)前夕,某市舉辦以“紅心頌黨恩、喜迎二十大”
為主題的青少年學生演講比賽,其中10人比賽的成績從低到高依次為:85,86,88,88,
89,90,92,93,94,98(單位:分),則這10人成績的第75百分位數(shù)是.
變式12.(2024?黑龍江哈爾濱?高一哈爾濱市第四中學校校考期末)已知一組數(shù)據(jù):
24,30,40,44,48,52.則這組數(shù)據(jù)的第30百分位數(shù)、第50百分位數(shù)的平均數(shù)為.
變式13.(2024?全國?高三專題練習)為了養(yǎng)成良好的運動習慣,某人記錄了自己一周
內每天的運動時長(單位:分鐘),分別為53,57,45,61,79,49,x,若這組數(shù)據(jù)的第
80百分位數(shù)與第60百分位數(shù)的差為3,則%=()
A.58或64B.59或64C.58D.59
【解題方法總結】
計算一組”個數(shù)據(jù)的的第p百分位數(shù)的步驟
①按從小到大排列原始數(shù)據(jù).
②計算i=p%■
③若,不是整數(shù)而大于,的比鄰整數(shù)j,則第p百分位數(shù)為第,項數(shù)據(jù);若,.是整數(shù),則
第p百分位數(shù)為第i項與第i+1項數(shù)據(jù)的平均數(shù).
題型五:樣本的數(shù)字特征
例13.(多選題)(2024?廣東惠州?高三統(tǒng)考階段練習)有一組樣本數(shù)據(jù):4%,…,飛,
其平均數(shù)為2,由這組樣本數(shù)據(jù)得到新樣本數(shù)據(jù):見,馬,…,演,2,那么這兩組樣本數(shù)據(jù)一定
有相同的()
A.平均數(shù)B.中位數(shù)C.方差D.極差
例14.(多選題)(2024?吉林?高一榆樹市實驗高級中學校校聯(lián)考期末)已知數(shù)據(jù)1:
3,巧,L,xn,數(shù)據(jù)2:2玉-1,2X2-1,L,則下列統(tǒng)計量中,數(shù)據(jù)2不是
數(shù)據(jù)1的兩倍的有()
A.平均數(shù)B.極差C.中位數(shù)D.標準差
例15.(2024?貴州黔東南?凱里一中??寄M預測)“說文明話、辦文明事、做文明人,
樹立城市新風尚!創(chuàng)建文明城市,你我共同參與!”為宣傳創(chuàng)文精神,華強實驗中學高一
(2)班組織了甲乙兩名志愿者,利用一周的時間在街道對市民進行宣傳,將每天宣傳的次
數(shù)繪制成如下頻數(shù)分布折線圖,則以下說法不正理的為()
甲、乙志愿者宣傳次數(shù)的頻數(shù)分布折線圖
A.甲的眾數(shù)小于乙的眾數(shù)B.乙的極差小于甲的極差
C.甲的方差大于乙的方差D,乙的平均數(shù)大于甲的平均數(shù)
變式14.(2024?河南?襄城高中校聯(lián)考三模)某學校對班級管理實行量化打分,每周一
總結,若一個班連續(xù)5周的量化打分不低于80分,則為優(yōu)秀班級.下列能斷定該班為優(yōu)秀
班級的是()
A.某班連續(xù)5周量化打分的平均數(shù)為83,中位數(shù)為81
B.某班連續(xù)5周量化打分的平均數(shù)為83,方差大于0
C.某班連續(xù)5周量化打分的中位數(shù)為81,眾數(shù)為83
D.某班連續(xù)5周量化打分的平均數(shù)為83,方差為1
變式15.(2024?河南鄭州?統(tǒng)考模擬預測)已知一組數(shù)據(jù):2,3,4,6,m,則下列說法
不正確的是()
A.若m=7,則平均數(shù)為4.4B.若m=4,則眾數(shù)為4
C.若機=6,則中位數(shù)為4D.若加=10,則方差為40
變式16.(2024?貴州銅仁?高二貴州省銅仁第一中學??奸_學考試)根據(jù)氣象學上的標
準,連續(xù)5天的日平均氣溫低于10。。即為入冬,將連續(xù)5天的日平均溫度的記錄數(shù)據(jù)(記
錄數(shù)據(jù)都是自然數(shù))作為一組樣本,現(xiàn)有4組樣本①、②、③、④,依次計算得到結果如
下:
①平均數(shù)元<4;
②平均數(shù)x<4且極差小于或等于3;
③平均數(shù)于<4且標準差sV4;
④眾數(shù)等于5且極差小于或等于4.
則4組樣本中一定符合入冬指標的共有()
A.1組B.2組C.3組D.4組
變式17.(2024?天津河東?高一統(tǒng)考期末)數(shù)學興趣小組的四名同學各自拋擲骰子5
次,分別記錄每次骰子出現(xiàn)的點數(shù),四名同學的部分統(tǒng)計結果如下:
甲同學:中位數(shù)為3,方差為2.8;乙同學:平均數(shù)為3.4,方差為1.04;
丙同學:中位數(shù)為3,眾數(shù)為3;丁同學:平均數(shù)為3,中位數(shù)為2.
根據(jù)統(tǒng)計結果,數(shù)據(jù)中肯定沒有出現(xiàn)點數(shù)6的是同學.
變式18.(2024?云南大理?高一??茧A段練習)根據(jù)氣象學上的標準,連續(xù)5天的日平
均氣溫低于10℃即為入冬.現(xiàn)有甲、乙、丙、丁四地連續(xù)5天的日平均溫度的記錄數(shù)據(jù)
(記錄數(shù)據(jù)都是正整數(shù)):
①甲地:5個數(shù)據(jù)的中位數(shù)為7,眾數(shù)為6;②乙地:5個數(shù)據(jù)的平均數(shù)為8,極差為3;
③丙地:5個數(shù)據(jù)的平均數(shù)為5,中位數(shù)為4;④丁地:5個數(shù)據(jù)的平均數(shù)為6,方差小于
3.
則肯定進入冬季的地區(qū)是()
A.甲地B.乙地
C.丙地D.丁地
變式19.(2024?河北滄州?高二肅寧縣第一中學??茧A段練習)氣象意義上的春季進入
夏季的標志為連續(xù)5天的日平均溫度不低于22°C.現(xiàn)有甲、乙、丙三地連續(xù)5天的日平均
氣溫的記錄數(shù)據(jù)(記錄數(shù)據(jù)都是正整數(shù)):
①甲地:5個數(shù)據(jù)是中位數(shù)為24,眾數(shù)為22;
②乙地:5個數(shù)據(jù)是中位數(shù)為27,總體均值為24;
③丙地:5個數(shù)據(jù)中有一個數(shù)據(jù)是32,總體均值為26,總體方差為10.8
則肯定進入夏季的地區(qū)有
A.①②③B.①③C.②③D.①
變式20.(2024?吉林長春?高一長春市第五中學??计谀┫铝忻}中是真命題的是
()
A.一組數(shù)據(jù)2,1,4,3,5,3的平均數(shù)、眾數(shù)、中位數(shù)相同;
B.有A、B、C三種個體按3:1:2的比例分層抽樣調查,如果抽取的A個體數(shù)為9,則
樣本容量為30;
C.若甲組數(shù)據(jù)的方差為5,乙組數(shù)據(jù)為5,6,9,10,5,則這兩組數(shù)據(jù)中較穩(wěn)定的
是甲;
D.一組數(shù)1,2,2,2,3,3,3,4,5,6的80%分位數(shù)為4.
【解題方法總結】
(1)平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢,方差和標準差描述波動大小.
(2)方差的簡化計算公式:s2=%(x:+x;+…+靖-癡1或寫成
S?+—+*)_£,即方差等于原數(shù)據(jù)平方的平均數(shù)減去平均數(shù)的平方.
題型六:總體集中趨勢的估計
例16.(2024?湖北孝感?高二孝昌縣第一高級中學校聯(lián)考階段練習)文明城市是反映城
市整體文明水平的綜合性榮譽稱號,作為普通市民,既是文明城市的最大受益者,更是文
明城市的主要創(chuàng)造者.某市為提高市民對文明城市創(chuàng)建的認識,舉辦了“創(chuàng)建文明城市”知識
競賽,從所有答卷中隨機抽取100份作為樣本,將樣本的成績(滿分100分,成績均為不
低于40分的整數(shù))分成六段:[40,50),[50,60),…,[90,100]得到如圖所示的頻率分布
(1)求頻率分布直方圖中。的值;
(2)求樣本成績的第75百分位數(shù);
⑶已知落在[50,60)的平均成績是61,方差是7,落在[60,70)的平均成績?yōu)?0,方差是
4,求兩組成績的總平均數(shù)三和總方差,2.
例17.(2024?河南南陽?高一統(tǒng)考期末)2022年入冬以來,為進一步做好疫情防控工
作,避免疫情的再度爆發(fā),A地區(qū)規(guī)定居民出行或者出席公共場合均需佩戴口罩,現(xiàn)將A
地區(qū)20000個居民一周的口罩使用個數(shù)統(tǒng)計如下表所示,其中每周的口罩使用個數(shù)在6以
024681012x/口罩使用個數(shù)
(1)求引力的值,根據(jù)表中數(shù)據(jù),完善上面的頻率分布直方圖;(只畫圖,不要過程)
(2)根據(jù)頻率分布直方圖估計A地區(qū)居民一周口罩使用個數(shù)的75%分位數(shù)和中位數(shù);(四舍
五入,精確到0』)
(3)根據(jù)頻率分布直方圖估計A地區(qū)居民一周口罩使用個數(shù)的平均數(shù)以及方差.(每組數(shù)據(jù)
用每組中點值代替)
例18.(2024?河北邯鄲?高二??奸_學考試)某工廠在加大生產量的同時,狠抓質量管
理,不定時抽查產品質量.該企業(yè)質檢人員從所生產的產品中隨機抽取了100個,將其質
量指標值分成以下六組:[40,50),[50,60),[60,70),…,[90,100].得到如下頻率分布直方
⑴求出直方圖中m的值;
(2)利用樣本估計總體的思想,估計該企業(yè)所生產的口罩的質量指標值的平均數(shù)和60%分位
數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間中點值作代表,60%分位數(shù)精確到0.01).
變式21.(2024?福建?高二校聯(lián)考開學考試)小晟統(tǒng)計了他6月份的手機通話明細清
單,發(fā)現(xiàn)自己該月共通話100次,小晟將這10。次通話的通話時間(單位:分鐘)按照
(0,4),[4,8),[8,12),[12,16),[16,20),[20,24]分成6組,畫出的頻率分布直方圖如圖
所示.
⑴求a的值;
⑵求通話時間在區(qū)間[4,12)內的通話次數(shù);
(3)試估計小晟這100次通話的平均時間(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表).
變式22.(2024?浙江溫州?高二樂清市知臨中學??奸_學考試)為了迎接新高考,某校
舉行物理和化學等選科考試,其中,600名學生化學成績(滿分100分)的頻率分布直方
圖如圖所示,其中成績分組區(qū)間是:第一組[45,55),第二組[55,65),第三組[65,75),第
四組[75,85),第五組[85,95).已知圖中第三組頻率為0.45,第一組和第五組的頻率相同.
(1)求a,b的值;
⑵估算高分(大于等于80分)人數(shù);
(3)估計這600名學生化學成績的平均值(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表)和
中位數(shù).(中位數(shù)精確到0.1)
變式23.(2024?湖北武漢?高二統(tǒng)考開學考試)某學校為了了解老師對“民法典”知識的
認知程度,針對不同年齡的老師舉辦了一次“民法典”知識競答,滿分100分(95分及以上
為認知程度高),結果認知程度高的有心人,按年齡分成5組,其中第一組:[20,25),第
二組:[25,30),第三組:[30,35),第四組:[35,40),第五組:[40,45],得到如圖所示的
頻率分布直方圖,已知第一組有10人.
(1)根據(jù)頻率分布直方圖,估計這〃,人年齡的第75百分位數(shù);
(2)現(xiàn)從以上各組中用分層隨機抽樣的方法抽取40人,擔任“民法典”知識的宣傳使者.
①若有甲(年齡23),乙(年齡43)兩人已確定入選宣傳使者,現(xiàn)計劃從第一組和第五組
被抽到的使者中,再隨機抽取2名作為組長,求甲、乙兩人恰有一人被選上的概率;
②若第四組宣傳使者的年齡的平均數(shù)與方差分別為36和1,第五組宣傳使者的年齡的平均
數(shù)與方差分別為42和2,據(jù)此估計這用人中35-45歲所有人的年齡的方差.
【解題方法總結】
頻率分布直方圖的數(shù)字特征
(1)眾數(shù):最高矩形的底邊中點的橫坐標.
(2)中位數(shù):中位數(shù)左邊和右邊的矩形的面積和應該相等.
(3)平均數(shù):平均數(shù)在頻率分布直方圖中等于各組區(qū)間的中點值與對應頻率之積的和.
題型七:總體離散程度的估計
例19.(2024?高一課時練習)某學校高一100名學生參加數(shù)學考試,成績均在40分到100
分之間,學生成績的頻率分布直方圖如下圖:
(I)估計這1。0名學生分數(shù)的中位數(shù)與平均數(shù);(精確到0.1)
⑵某老師抽取了10名學生的分數(shù):小與七,…,/,已知這10個分數(shù)的平均數(shù)元=90,標準
差s=6,若剔除其中的100和80兩個分數(shù),求剩余8個分數(shù)的平均數(shù)與標準差.
(參考公式:[無;一疝*
s=|------------
n
例20.(2024?四川綿陽?綿陽中學??级#?022年4月16日,神舟十三號載人飛船返
回艙成功著陸,航天員翟志剛、王亞平、葉光富完成在軌駐留半年的太空飛行任務,標志
著中國空間站關鍵技術驗證階段圓滿完成.并將進入建造階段某地區(qū)為了激發(fā)人們對天文
學的興趣,開展了天文知識比賽,滿分100分(95分及以上為認知程度高),結果認知程度
高的有機人,這加人按年齡分成5組,其中第一組:[20,25),第二組:[25,30),第三
組:[30,35),第四組:[35,40),第五組:[40,45],得到如圖所示的頻率分布直方圖,已
知第一組有10人.
頻率
(1)根據(jù)頻率分布直方圖,估計這,"人的第80百分位數(shù)(中位數(shù)=第50百分位數(shù));
(2)現(xiàn)從以上各組中用分層隨機抽樣的方法抽取20人,擔任“黨章黨史”的宣傳使者.
①若有甲(年齡36),乙(年齡42)兩人已確定入選宣傳使者,現(xiàn)計劃從第四組和第五組
被抽到的使者中,再隨機抽取2名作為組長,求甲、乙兩人至少有一人被選上的概率;
②若第四組宣傳使者的年齡的平均數(shù)與方差分別為36和,第五組宣傳使者的年齡的平均
數(shù)與方差分別為42和1,據(jù)此估計這根人中35?45歲所有人的年齡的平均數(shù)和方差.
例21.(2024?北京?高三??茧A段練習)某學校為了解學生的體質健康狀況,對高一、
高二兩個年級的學生進行體質健康測試.現(xiàn)從兩個年級學生中各隨機抽取20人,將他們的
測試數(shù)據(jù)用莖葉圖表示如下:
高一高二
6439058
962381458
9852172339
9776464578
8305026
402
《國家學生體質健康標準》的等級標準如下表.規(guī)定:測試數(shù)據(jù)次0,體質健康為合格.
等級優(yōu)秀良好及格不及格
測試數(shù)據(jù)[90,100][80,89][60,79][0,59]
(1)從該校高二年級學生中隨機抽取一名學生,試估計這名學生體質健康合格的概率;
(2)從兩個年級等級為優(yōu)秀的樣本中各隨機選取一名學生,求選取的兩名學生的測試數(shù)據(jù)平
均數(shù)大于95的概率;
(3)設該校高一學生測試數(shù)據(jù)的平均數(shù)和方差分別為工用,高二學生測試數(shù)據(jù)的平均數(shù)和方
差分別為兀,s;,試比較X與E、s:與s;的大小.(只需寫出結論)
變式24.(2024?廣西?高一期末)某中學400名學生參加全市高中數(shù)學競賽,根據(jù)男女
學生人數(shù)比例,使用分層抽樣的方法從中隨機抽取了100名學生,記錄他們的分數(shù),將數(shù)
據(jù)分成7組:[20,30),[30,40),…,怪0,90],并整理得到如下頻率分布直方圖:
f頻率/組距
0.04------------------------------1—1
0.02----------------------------------------
o.oi-------
)~~~~~I1111r
o2030405060708090分數(shù)
(1)由頻率直方圖求樣本中分數(shù)的中位數(shù);
⑵已知樣本中分數(shù)在[40,50)的學生有5人,試估計總體中分數(shù)小于40的人數(shù);
(3)已知樣本中男生與女生的比例是3:1,男生樣本的均值為70,方差為10,女生樣本的均
值為80,方差為12,請計算出總體的方差.
變式25.(2024?湖北武漢?高一期末)某中學為了貫策教育部對學生的五項管理中的體
質管理,對高一年級學生身高進行調查,在調查中,采用樣本量比例分配的分層隨機抽
樣,如果不知道樣本數(shù)據(jù),只知道抽取了男34人,其平均數(shù)和方差分別為170.5和15,抽
取了女生16人,其平均數(shù)和方差分別為160.5和35.
(1)由這些數(shù)據(jù)計算總樣本的平均數(shù);
(2)由這些數(shù)據(jù)計算出總樣本的方差,并對高一年級全體學生的身高方差作出估計.
參考數(shù)據(jù):(15+3.22)x34=858.16,(35+6.82)x16=1299.84
變式26.(2024?湖北武漢?高一期末)為了監(jiān)控某種裝件的一條生產線的生產過程,檢
驗員每天從該生產線上隨機抽取16個零件,并測量其尺寸(單位:cm).其中于元近似為
樣本平均數(shù),s近似為樣本的標準差,用樣本平均數(shù)方和標準差s能夠反映數(shù)據(jù)取值的信
息.根據(jù)長期生產經驗,一天內抽檢零件中,如果出現(xiàn)了尺寸在(元-3s,元+3s)之外的零
件,就認為這條生產線在這一天的生產過程可能出現(xiàn)了異常情況,需對當天的生產過程進
行檢查.下面是檢驗員在一天內抽取的16個零件的尺寸:
9.910.110.210.29.99.810.110
10.210.39.110.19.99.910.110.2
116
經計算得元=白20.280,16x0.282?
16,=1
1.25,15x10.062?1518.05,V0.026?0.16,其中為為抽取的第i個零件的尺寸,i=l,2,…,16.
(1)利用估計值判斷是否需對當天的生產過程進行檢查?
(2)剔除叵-3s,元+3s)之外的數(shù)據(jù),用剩下的數(shù)據(jù)估計樣本平均數(shù)元和樣本標準差,(精確
到0.01).
變式27.(2024?廣西玉林?高一校聯(lián)考期末)某學校為了了解高二年級學生數(shù)學運算能
力,對高二年級的300名學生進行了一次測試.已知參加此次測試的學生的分數(shù)
玳,=1,2,…,300)全部介于45分到95分之間,該校將所有分數(shù)分成5組:
[45,55),[55,65),...,[85,95],整理得到如下頻率分布直方圖(同組數(shù)據(jù)以這組數(shù)據(jù)的中間值
(1)求加的值,并估計此次校內測試分數(shù)的平均值元;
(2)學校要求按照分數(shù)從高到低選拔前30名的學生進行培訓,試估計這30名學生的最低分
數(shù);
⑶試估計這300名學生的分數(shù)%1=1,2,…,300)的方差S2,并判斷此次得分為52分和94
分的兩名同學的成績是否進入到了巨-2s,元+2s]范圍內?
22
(參考公式:s=-^f\Xi-x),其中力為各組頻數(shù);參考數(shù)據(jù):V129?11.4)
幾1=1
變式28.(2024?黑龍江牡丹江?高一牡丹江一中??计谀?月23日是世界讀書日,樹
人中學為了解本校學生課外閱讀情況,按性別進行分層,用分層隨機抽樣的方法從全校學
生中抽出一個容量為100的樣本,其中男生40名,女生60名.經調查統(tǒng)計,分別得到
40名男生一周課外閱讀時間(單位:小時)的頻數(shù)分布表和60名女生一周課外閱讀時間(單
位:小時)的頻率分布直方圖.(以各組的區(qū)間中點值代表該組的各個值)
男生一周課外閱讀時間頻數(shù)分布表
小時頻數(shù)
[0,2)9
[2,4)25
[4,6)3
[6網3
(1)從一周課外閱讀時間為[4,6)的學生中按比例分配抽取6人,再從這6名學生中選出2名
同學調查他們閱讀書目.求這兩人都是女生的概率;
⑵分別估計男生和女生一周課外閱讀時間的平均數(shù)U;
(3)估計總樣本的平均數(shù)5和方差小.
參考數(shù)據(jù)和公式:男生和女生一周課外閱讀時間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中考道德與法治一輪復習之民主與法治
- 美容行業(yè)美發(fā)技術培訓心得
- 教研工作推動學術進步
- 電力系統(tǒng)通信(完整版)資料
- 時尚行業(yè)美工工作總結
- 電子行業(yè)電子設備維護培訓總結
- 2024年管理部門安全管理制度
- 2025屆【首發(fā)】河北省衡水市棗強縣中考試題猜想生物試卷含解析
- 2025關于押運服務合同書的范本
- 2024年度天津市公共營養(yǎng)師之二級營養(yǎng)師通關題庫(附帶答案)
- 2024-2025學年年八年級數(shù)學人教版下冊專題整合復習卷第11章 全等三角形單元試卷(含答案)
- 蜜雪冰城合作加盟合同
- 青海省西寧市2021-2022學年八年級上學期期末歷史試題(解析版)
- 2024年外科的工作計劃和建議外科工作計劃
- 陪診培訓課件
- 專題3-6 雙曲線的離心率與常用二級結論【12類題型】(解析版)-A4
- 醫(yī)療行業(yè)銷售內勤工作匯報
- 光伏電站運維課件
- 浙江省杭州市西湖區(qū)2023-2024學年九年級上學期期末考試語文試卷+
- 兼職客服簽約合同范例
- 【初中地理】《世界的聚落》課件-2024-2025學年湘教版地理七年級上冊
評論
0/150
提交評論