版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計
捱高考要求
要求
重難點
層次
簡單隨機抽樣B(1)隨機抽樣
①理解隨機抽樣的必要性和重要性.
隨機抽樣分層抽樣和
A@會用簡單隨機抽樣方法從總體中抽取
系統(tǒng)抽樣樣本;了解分層抽樣和系統(tǒng)抽樣方法
頻率分布表,(2)總體估計
直方圖、①了解分布的意義和作用,
B
折線圖、會列頻率分布表,
會畫頻率分布直方圖、
莖葉圖
頻率折線圖、
樣本數(shù)據(jù)的基本的數(shù)
莖葉圖,
用樣本估字特征(如平均數(shù)、標(biāo)B理解它們各自的特點.
計總體準(zhǔn)差)(2)理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,
用樣本的頻率分布估會計算數(shù)據(jù)標(biāo)準(zhǔn)差.
計總體分布,(3)能從樣本數(shù)據(jù)中提取基本的數(shù)字特征
用樣本的基本數(shù)字特C(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋.
④會用樣本的頻率分布估計總體分布,
征估計總體的基本數(shù)
會用樣本的基本數(shù)字特征估計總體的基本
字特征
數(shù)字特征,理解用樣本估計總體的思想.
⑤會用隨機抽樣的基本方法和樣本估計
總體的思想解決一些簡單的實際問題.
(2)變量的相關(guān)性
變量的相①會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點
線性回歸方程B
關(guān)性圖,會利用散點圖認識變量間的相關(guān)關(guān)系.
②了解最小二乘法的思想,能根據(jù)給出
的線性回歸方程系數(shù)公式建立線性回歸方
程.
目刨帽知識內(nèi)容
隨機抽樣
1.隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經(jīng)常采用的隨機抽樣方
法:
⑴簡單隨機抽樣:從元素個數(shù)為N的總體中不放回地抽取容量為〃的樣本,如果每一次抽
取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.
抽出辦法:①抽簽法:用紙片或小球分別標(biāo)號后抽簽的方法.
②隨機數(shù)表法:隨機數(shù)表是使用計算器或計算機的應(yīng)用程序生成隨機數(shù)的功能生成的一張
數(shù)表.表中每一位置出現(xiàn)各個數(shù)字的可能性相同.
隨機數(shù)表法是對樣本進行編號后,按照一定的規(guī)律從隨機數(shù)表中讀數(shù),并取出相應(yīng)的樣本的
方法.
簡單隨機抽樣是最簡單、最基本的抽樣方法.
⑵系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個
個體,得到所需要的樣本的抽樣方法.
抽出辦法:從元素個數(shù)為N的總體中抽取容量為,,的樣本,如果總體容量能被樣本容量整
除,設(shè)《=多,先對總體進行編號,號碼從1到N,再從數(shù)字1到4中隨機抽取一個數(shù)s作
n
為起始數(shù),然后順次抽取第s+A,s+2A,,s+(〃-1火個數(shù),這樣就得到容量為〃的樣
本.如果總體容量不能被樣本容量整除,可隨機地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣
方法進行抽樣.
系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.
⑶分層抽樣:當(dāng)總體有明顯差別的幾部分組成時,要反映總體情況,常采用分層抽樣,使
總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按
層在總體中所占比例進行簡單隨機抽樣,這種抽樣方法叫做分層抽樣.
分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,
應(yīng)用廣泛.
2.簡單隨機抽樣必須具備下列特點:
⑴簡單隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的.
⑵簡單隨機樣本數(shù)〃小于等于樣本總體的個數(shù)N.
⑶簡單隨機樣本是從總體中逐個抽取的.
⑷簡單隨機抽樣是一種不放回的抽樣.
⑸簡單隨機抽樣的每個個體入樣的可能性均為金.
3.系統(tǒng)抽樣時,當(dāng)總體個數(shù)N恰好是樣本容量”的整數(shù)倍時,取k=電;
n
若四不是整數(shù)時,先從總體中隨機地剔除凡個個體,使得總體中剩余的個體數(shù)能被樣本容
n
量〃整除.因為每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍
然相等,為上.
n
—.頻率直方圖
列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:
①計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差;
②決定組距與組數(shù):取組距,用黑決定組數(shù);
組距
③決定分點:決定起點,進行分組;
④列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得
到各小組的頻率.
頻率
⑤繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖,
知小長方形的面積=組距x槃=頻率.
組距
頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分
布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.
總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布
直方圖可以用一條光滑曲線y=/(x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度
曲線精確地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律.
三.莖葉圖
制作莖葉圖的步驟:
①將數(shù)據(jù)分為“莖”、“葉”兩部分;
。將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;
國將各個數(shù)據(jù)的“葉”在分界線的一側(cè)對應(yīng)莖處同行列出.
四.統(tǒng)計數(shù)據(jù)的數(shù)字特征
用樣本平均數(shù)估計總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差.
數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.
極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度;
樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.
一般地,設(shè)樣本的元素為不,%,,毛樣本的平均數(shù)為元,
定義樣本方差為$2=(*—-+(*一下)、+(玉一,:,
n
樣本標(biāo)準(zhǔn)差S=仍一寸+小一無K++&"亙
Vn
22
簡化公式:s=—[(X,2+x^++x^)-rix].
五.獨立性檢驗
1.兩個變量之間的關(guān)系;
常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系
所要求的確定性,它們的關(guān)系是帶有一定隨機性的.當(dāng)一個變量取值一定時,另一個變量的
取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.
2.散點圖:將樣本中的〃個數(shù)據(jù)點(x,,y,)(i=l,2,,〃)描在平面直角坐標(biāo)系中,就得到
了散點圖.
散點窗形象地反映了各個數(shù)據(jù)的密切程度,根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個
變量的關(guān)系.
3.如果£二個變量的值變大時,另一個變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時,
散點圖中的點在從左下角到右上角的區(qū)域.
反之,一個變量的值變大時,另一個變量的值由大變小,這種相關(guān)稱為負相關(guān).此時,散點
圖中的點在從左上角到右下角的區(qū)域.
散點圖可以判斷兩個變量之間有沒有相關(guān)關(guān)系.
4.統(tǒng)計假設(shè):如果事件A與8獨立,這時應(yīng)該有P(A8)=P(A)P(8),用字母兒表示此式,
即40:尸(A3)=尸(A)尸(B),稱之為統(tǒng)計假設(shè).
5.讀作“卡方”)統(tǒng)計量:
統(tǒng)計學(xué)中有一個非常有用的統(tǒng)計量,它的表達式為個=,用它的大小可以
〃|+%+W+2
用來決定是否拒絕原來的統(tǒng)計假設(shè)如果力2的值較大,就拒絕“。,即認為A與B是有
關(guān)的.
力2統(tǒng)計量的兩個臨界值:3.841、6.635;當(dāng)%?>3.841時,有95%的把握說事件A與8有
關(guān);當(dāng)/>6.635時,有99%的把握說事件A與8有關(guān);當(dāng)/W3.841時,認為事件A與8
是無關(guān)的.
獨立性檢驗的基本思想與反證法類似,由結(jié)論不成立時推出有利于結(jié)論成立的小概率事件發(fā)
生,而小概率事件在一次試驗中通常是不會發(fā)生的,所以認為結(jié)論在很大程度上是成立的.
1.獨立性檢驗的步驟:統(tǒng)計假設(shè):Hn;列出2x2聯(lián)表;計算/統(tǒng)計量;查對臨界值表,
作出判斷.
2.幾個臨界值:P(x222.706)=0.10,P(%2>3.841)?0.05,P(*與6.635)=0.01.
2x2聯(lián)表的獨立性檢驗:
如果對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個情況,這樣排成一張2x2的表,如
下:
狀態(tài)3狀態(tài)看合計
狀態(tài)A%
狀態(tài)入n2\〃224+
%〃+2n
如果有調(diào)查得來的四個數(shù)據(jù)孫,與,嗎?,n22.并希望根據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種
狀態(tài)A與8是否有關(guān),就稱之為2x2聯(lián)表屆獨立性檢驗.
六.回歸分析
1.回歸分析:對于具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析,即回歸分
析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.
回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性
相關(guān)關(guān)系,這條直線叫做回歸直線.
2.最小二乘法:
記回歸直線方程為:y=a+bx,稱為變量丫對變量x的回歸直線方程,其中。"叫做回歸
系數(shù).
?是為了區(qū)分丫的實際值y,當(dāng)x取值片時,變量丫的相應(yīng)觀察值為y,而直線上對應(yīng)于x,
的縱坐標(biāo)是y;=a+bx;.
設(shè)的一組觀察值為(乙,%),i=l,2,,n,且回歸直線方程為》=。+法,
當(dāng)x取值.時,丫的相應(yīng)觀察值為%,差%-洶=1,2,,〃)刻畫了實際觀察值y與回歸
直線上相應(yīng)點的縱坐標(biāo)之間的偏離程度,稱這些值為離差.
我們希望這"個離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點.
記Q=f(%-〃一次,)2,回歸直線就是所有直線中。取最小值的那條.
i=\
這種使“離差平方和為最小”的方法,叫做最小二乘法.
用最小二乘法求回歸系數(shù)4,6有如下的公式:
刃=嚀---------a=y-bx,其中a"上方加“人”,表示是由觀察值按最小二乘法求得的
f*:一戒2
1=1
回歸系數(shù).
3.線性回歸模型:將用于估計y值的線性函數(shù)a+反作為確定性函數(shù);y的實際值與估計
值之間的誤差記為£,稱之為隨機誤差;將y=a+反+£稱為線性回歸模型.
產(chǎn)生隨機誤差的主要原因有:
①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;
②忽略了某些因素的影響,通常這些影響都比較??;
③由于測量工具等原因,存在觀測誤差.
4.線性回歸系數(shù)的最佳估計值:
利用最小二乘法可以得到33的計算公式為
b
=-^—;,------------------=-r---------------a=y-bx,其中》=一之七,>=一£%
i=lj=l
由此得到的直線3=G+6x就稱為回歸直線,此直線方程即為線性回歸方程.其中6,b6
別為a,b的估計值,&稱為回歸截距,6稱為回歸系數(shù),》稱為回歸值.
5.相關(guān)系數(shù):
E(七-x)(%-y)zX*-nxy
,=2=/I
J.、一,J(—x:一心)2)(汽才一"(yf)
Vi=lJ=IV/=1i=l
6.相關(guān)系數(shù)「的性質(zhì):
⑴|r|Wl;
⑵|川越接近于1,x,y的線性相關(guān)程度越強;
⑶|川越接近于0,x,y的線性相關(guān)程度越弱.
可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān).
7.轉(zhuǎn)化思想:
根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)
化為線性回歸方程,從而確定未知參數(shù).
8.一些備案
①回歸(regression)一詞的來歷:“回歸”這個詞英國統(tǒng)計學(xué)家FrancilsGalton提出來的.1889
年,他在研究祖先與后代的身高之間的關(guān)系時發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,
但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,
但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近
的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱
為回歸分析.
②回歸系數(shù)的推導(dǎo)過程:
Q=ZKy--如]2=Zy;-2azy.+〃“2-2/?ZX/+匕+/Zx;
=na2+2asz苦-ZX)+〃Z考一2Z,E+EE,
把上式看成a的二次函數(shù),/的系數(shù)〃>0,
因此當(dāng)a=-2(/£-£上)=EX-£時取最小值.
2nn
同理,把。的展開式按6的降基排列,看成6的二次函數(shù),當(dāng)匕=時取最小值.
Z(%-君(%一歹)
解得:6=勺-------a=y-bx,
2%_君2
汽X”版2
1=1
其中歹=1〉;%,元,是樣本平均數(shù).
nn
9.對相關(guān)系數(shù)r進行相關(guān)性檢驗的步驟:
①提出統(tǒng)計假設(shè)”。:變量x,y不具有線性相關(guān)關(guān)系;
②如果以95%的把握作出推斷,那么可以根據(jù)1-0.95=0.05與〃-2(“是樣本容量)在相
關(guān)性檢驗的臨界值表中查出一個r的臨界值4.05(其中「0.95=0.05稱為檢驗水平);
③計算樣本相關(guān)系數(shù).
④作出統(tǒng)計推斷:若1川>%。5,則否定表明有95%的把握認為變量y與x之間具有線
性相關(guān)關(guān)系;若IrlW^os,則沒有理由拒絕“。,即就目前數(shù)據(jù)而言,沒有充分理由認為變
量y與X之間具有線性相關(guān)關(guān)系.
說明:
⑴對相關(guān)系數(shù)r進行顯著性檢驗,一般取檢驗水平a=0.05,即可靠程度為95%.
⑵這里的,?指的是線性相關(guān)系數(shù),;■的絕對值很小,只是說明線性相關(guān)程度低,不一定不相
關(guān),可能是非線性相關(guān)的某種關(guān)系.
⑶這里的r是對抽樣數(shù)據(jù)而言的.有時即使|川=1,兩者也不一定是線性相關(guān)的.故在統(tǒng)計
分析時,不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實際情況進行合理解釋.
且tM唯典例分析
板塊一隨機抽樣
【例1】為了了解參加運動會的2000名運動員的年齡情況,從中抽取100名運動員;就
這個問題,下列說法中正確的有()個
①2000名運動員是總體;
②每個運動員是個體;
③所抽取的100名運動員是一個樣本;
④樣本容量為100;
⑤這個抽樣方法可采用按年齡進行分層抽樣;
⑥每個運動員被抽到的概率相等
A.1B.2C.3D.4
【難度】(4)
【解析】B:
2000名運動員的年齡是總體,抽取的100名運動員的年齡是一個樣本,只有④⑥
正確.
【例2】(1)某社區(qū)有400戶家庭,其中高收入家庭25戶,中收入家庭280戶,低收入
家庭95戶,為了了解社會購買力的某項指標(biāo),要從中抽取一個容量為100的樣
本;
⑵從10名職工中抽取3名參加座談會;
⑶一個年級有10個班,每個班有50名同學(xué),隨機編為1至50號,為了了解他
們的學(xué)習(xí)情況,要求每個班的30號同學(xué)留下來進行問卷調(diào)查.
以上問題各對應(yīng)哪種隨機抽樣方法?
【難度】(4)
【解析】⑴分層抽樣;⑵簡單隨機抽樣;⑶系統(tǒng)抽樣.
【例3】采用系統(tǒng)抽樣法,從121人中抽取一個容量為12人的樣本,寫出抽樣的步驟,
并求每人被抽取的機率.
【難度】(4)
【解析】抽樣步驟:
因12不能整除121,故先隨機剔除一個人,將余下的人從1~120進行編號,在
1~10中用抽簽法抽出k號(1WZW10),然后依次順序抽取
\0+k,20+k,,110+左,得到一個12人的樣本.
被抽取的機率:系統(tǒng)抽樣無論有無剔除都是等機率抽樣,因為被剔除的機率也
是相同的,故被抽取的機率為12*.
121
【例4】用系統(tǒng)抽樣法要從160名學(xué)生中抽取容量為20的樣本,將160名學(xué)生隨機地
從1?160編號,按編號順序平均分成20組(1~8號,9~16號,…,153-160
號),若第16組抽出的號碼為126,則第1組中用抽簽的方法確定的號碼是
【難度】(2)
【解析】不妨設(shè)在第1組中隨機抽到的號碼為x,則在第16組中應(yīng)抽出的號碼為120+x.
設(shè)第1組抽出的號碼為x,則第16組應(yīng)抽出的號碼是8xl5+x=126,二x=6.
【例5】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個容量為
〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個體;如果樣本
容量增加1個,則在采用系統(tǒng)抽樣時,需要在總體中先剔除1個個體,則樣本容
量為.
【難度】(6)
【解析】6;
總體容量N=36(人),
當(dāng)樣本容量為〃時,系統(tǒng)抽樣間隔為死eN*.
n
分層抽樣的抽樣比為二,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為2,烏,4,
36632
所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.
35
當(dāng)樣本容量為〃+1時,總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-EN*,
n+l
所以〃只能是6.
【例6】一個總體中有100個個體,隨機編號0,1,2,99,依編號順序平均分成
10個小組,組號依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量
為10的樣本,規(guī)定如果在第1組隨機抽取的號碼為機,那么在第%組中抽取的
號碼個位數(shù)字與m+左的個位數(shù)字相同,若機=6,則在第7組中抽取的號碼
是.
【難度】(4)
【解析】63;第/組的號碼為(無-1)*10,依-1)*10+1,…,(4-1)*10+9,當(dāng)機=6時,
第k組抽取的號的個位數(shù)字為加+女的個位數(shù)字,所以第7組中抽取的號碼的個
位數(shù)字為3,所以抽取號碼為63.
【例7】(北京市西城區(qū)2009年4月高三一模抽樣測試)
某單位有27名老年人,54名中年人,81名青年人.為了調(diào)查他們的身體情況,
用分層抽樣的方法從他們中抽取了"個人進行體檢,其中有6名老年人,那么
n=.
【難度】(2)
【解析】由比例可得抽取的中年職工共有12人,青年職工共有18人,于是
/?=6+12+18=36o
【例8】(2009湖南)
一個總體分為A,8兩層,其個體數(shù)之比為4:1,用分層抽樣方法從總體中抽取
一個容量為10的樣本,已知8層中甲、乙都被抽到的概率為-L,則總體中的
28
個體數(shù)為.
【難度】(4)
【解析】由條件易知B層中抽取的樣本數(shù)是2,設(shè)8層總體數(shù)是〃,則又由B層中甲、
乙都被抽到的概率是與=,可解得〃=8,所以總體中的個體數(shù)是
C28
4x8+8=40.
【例9】(05年湖南)某工廠生產(chǎn)了某種產(chǎn)品16800件,它們來自甲、乙、丙三條生產(chǎn)
線.為檢查產(chǎn)品的質(zhì)量,決定采用分層抽樣法進行抽樣.已知甲、乙、丙三條
生產(chǎn)線抽取的個數(shù)成等差數(shù)列,則乙生產(chǎn)了件產(chǎn)品.
【難度】(4)
【解析】根據(jù)分層抽樣的抽樣比相等知:甲、乙、丙三條生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量比等于
抽取的樣品容量比.
又這三條生產(chǎn)線抽取的產(chǎn)品個數(shù)成等差數(shù)列,根據(jù)等差數(shù)列的性質(zhì)知,它們生產(chǎn)的
產(chǎn)品也成等差數(shù)列.
又乙生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量為甲、丙的等差中項,且和為16800,
故乙生產(chǎn)的產(chǎn)品數(shù)量為:度也=5600件.
3
【例10】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個容量為
〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個體;如果樣本
容量增加1個,則在采用系統(tǒng)抽樣時,需要在總體中先剔除1個個體,則樣本容
量為.
【難度】(4)
【解析】總體容量N=36(人),
當(dāng)樣本容量為〃時,系統(tǒng)抽樣間隔為地eN*.
n
分層抽樣的抽樣比為2,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為4,3巳,
36632
所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.
當(dāng)樣本容量為〃+1時,總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-£N*,
n+\
所以〃只能是6.
【例11】(2008廣東19)
某初級中學(xué)共有學(xué)生2000名,各年級男、女生人數(shù)如下表:
初一年級初二年級初三年級
女生373Xy
男生377370Z
已知在全校學(xué)生中隨機抽取1名,抽到初二年級女生的概率是0.19.
⑴求x的值;
⑵現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,問應(yīng)在初三年級抽取多少名?
(3)已知y,245,z2245,求初三年級中女生比男生多的概率.
【難度】(8)
【解析】=0.19,Ax=380;
2000
⑵初三年級人數(shù)為y+z=2000-(373+377+380+370)=500,
現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,
48
應(yīng)在初三年級抽取的人數(shù)為:--x500=12名.
2000
(3)設(shè)初三年級女生比男生多的事件為A,初三年級女生男生數(shù)記為(y,z);
由⑵知y+z=500,且y,zeN,基本事件空間包含的基本事件有:(245,255)、
(246,254)、(247,253)、.…(255,245)共11個.
事件A包含的基本事件有:
(251,249)、(252,248)、(253,247)、(254,246)、(255,245),共5個.
P(A)=—.
II
板塊二頻率直方圖“莖葉圖
【例1】(2009湖北15)
下圖是樣本容量為200的頻率分布直方圖.
根據(jù)樣本的頻率分布直方圖估計,樣本數(shù)據(jù)落在[6,10)內(nèi)的頻數(shù)為,數(shù)據(jù)
落在[2,10)內(nèi)的概率約為.
【難度】(2)
【解析】64,0.4;
觀察直方圖易得頻數(shù)為200*0.08x4=64,頻率為(0.02+0.08)x4=0.4.
【例2】為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的
數(shù)量.產(chǎn)品數(shù)量的分組區(qū)間為[45,55),[55,65),[65,75),[75,85),[85,95)
由此得到頻率分布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量在[55,75)
的人數(shù)是
頻率,組距
0.040「I-----------1
0.035卜
0.030卜
0.025卜---
0.020[-----------
0.015卜
0.010[----------
5
°-°°1IIIII~~I一
°455565758595產(chǎn)品數(shù)量
【難度】
【解析】13;
20x(0.065x10)=13,故答案為13.
【例3】如圖為某樣本數(shù)據(jù)的頻率分布直方圖,則下列說法不正確的是()
A.[6,10)的頻率為0.32
B.若樣本容量為100,貝I][10,14)的頻數(shù)為40
C.若樣本容量為100,則(3,10]的頻數(shù)為40
D.由頻率分布布直方圖可得出結(jié)論:估計總體大約有10%分布在[10,14)
【難度】(4)
【解析】D;
口0,14)的頻率為0.1x4=0.4,因此估計總體大約有40%分布在[10,14).
【例4】為了讓學(xué)生了解環(huán)保知識,增強環(huán)保意識,某中學(xué)舉行了一次"環(huán)保知識競賽",共
有900名學(xué)生參加了這次競賽.為了解本次競賽成績情況,從中抽取了部分學(xué)生
的成績(得分均為整數(shù),滿分為100分)進行統(tǒng)計.請你根據(jù)尚未完成并有局部
污損的頻率分布表和頻數(shù)分布直方圖,解答下列問題:
(1)填充頻率分布表的空格(將答案直接填在表格內(nèi));
⑵補全頻數(shù)條形圖;
(3)若成績在75.5-85.5分的學(xué)生為二等獎,問獲得二等獎的學(xué)生約為多少人?
【難度】(6)
【解析】⑴
分組頻數(shù)頻率
50.5~60.540.08
60.5?70.580.16
70.5?80.5100.20
80.5?90.5160.32
90.5?100.5120.24
合計501.00
(3)成績在75.5?80.5分的學(xué)生占70.5?80.5分的學(xué)生的因為成績在
10
70.5?80.5分的學(xué)生頻率為0.2,所以成績在76.5?80.5分的學(xué)生頻率為0.1,成績
在80.5?85.5分的學(xué)生占80.5?90.5分的學(xué)生的上,因為成績在80.5?90.5分的學(xué)
10
生頻率為0.30所以成績在80.5?85.5分的學(xué)生頻率為0.16,所以成績在
76.5?85.5分的學(xué)生頻率為0.26,由于有900名學(xué)生參加了這次競賽,所以該校獲
得二等獎的學(xué)生約為0.26x900=234(人)
【例5】右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,
甲乙
5315
368245
47932678
1457
則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()
A.62B.63C.64D.65
【難度】(4)
【解析】C;28+36=64.
【例6】(2009年福建12)
某校開展"愛我海西、愛我家鄉(xiāng)”攝影比賽,9位
評委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示,記
分員在去掉一個最高分和一個最低分后,算得平:;714
均分為91,復(fù)核員在復(fù)核時,發(fā)現(xiàn)有一個數(shù)字(莖
葉圖中的x)無法看清.若記分員計算無誤,則數(shù)字x應(yīng)該是.
【難度】(6)
【解析】1:
由莖葉圖可知所有評分為:88,89,89,92,93,9%,92,91,94,若x>4,去掉9x,
易知剩下的數(shù)的平均數(shù)大于91;故94為最高分,去掉88與94后,有
89+891-92-95?)+9=1>,解得x=l.
【例7】某班甲、乙兩學(xué)生的高考備考成績?nèi)缦拢?/p>
甲:512554528549536556534541522538
乙:515558521543532559536548527531
⑴用莖葉圖表示兩學(xué)生的成績;
⑵分別求兩學(xué)生成績的中位數(shù)和平均分.
【難度】(4)
【解析】⑴兩學(xué)生成績績的莖葉圖如右所示
甲乙
2515
285217
84653261
195438
645589
⑵將甲、乙兩學(xué)生的成績從小到大排列為:
甲:512522528534536538541549554556,
乙:515521527531532536543548558559.
從以上排列可知甲學(xué)生成績的中位數(shù)為空上空=537,
2
乙學(xué)生成績的中位數(shù)為衛(wèi)注=534.
2
甲學(xué)生成績的平均數(shù)為:
9、12+22+28+34+36+38+41+49+54+56
500+--------------------------------------=537,
10
乙學(xué)生成績的平均數(shù)為:
…15+21+27+31+32+36+43+48+58+59―
500+--------------------------------------=537.
10
【例8】某電腦雜志的一篇文章中,每個句子的字?jǐn)?shù)如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
翥報紙的一篇文章中,每個句子所含的字?jǐn)?shù)如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
⑴將兩組數(shù)據(jù)用莖葉圖表示;
⑵比較分析,能得到什么結(jié)論?
【難度】(4)
【解析】⑴莖葉圖如右.
電腦雜志報紙文章
9877554102389
8777654432022347778
612233569
116
⑵電腦雜志上每個句子的字?jǐn)?shù)集中在10~30之間,中位數(shù)為23;而報紙上每個句
子的字?jǐn)?shù)集中在20~40之間,中位數(shù)為28.電腦雜志上每個句子的平均字?jǐn)?shù)比報
紙上的平均字?jǐn)?shù)
要少.說明電腦雜志作為科普讀物需要簡明.
板塊三數(shù)字特征,獨立及回歸
【例1】已知一組數(shù)據(jù)孑,々,,指的方差是2,
且(占-3)2+(%-3)2++(/-3)2=380,則這組數(shù)據(jù)的平均數(shù)x=
【難度】(2)
【解析】9或-3;
依題設(shè)有(.一.)-+(吃X)-++(X|()x)2=2展開變形得
10
(X:+A?2++x3)+1Ox~—2x(X]+/++芯0)=20........
同樣的,(%—3)2+(專一3)2++(4)-3)2=380,展開變形得
(x[+x;++X[:))+10x9—6?(X]+X,++XJQ)=380.......(2)
②一①并化簡得了2—6元-27=0.解得了=一3或元=9.
【例2】求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到0.1),并分析由這些結(jié)果可得出什么更
一般的結(jié)論.
(1)123456789;
(2)111213141516171819;
(3)24681012141618
【難度】(4)
【解析】(1)工=」(1+2++9)=5,
9
22222
5(=^(1+2++9-9x5)=y?6.7,M=楞弓2.6;
(2)=-(11+12++19)=15
-9
I20
22
]_15)2+(I2-15)++(19-15)]=y-6.7,
52=-^y-2-6:
(3)^=-(2+4++18)=10
,1,,80
s;=-[(2-10)*+(4-10)92++(18-10)2]=丁26.7,
一組數(shù)都加上相同的數(shù)后,方差不變,都乘以相同的倍數(shù)〃后,標(biāo)準(zhǔn)差變?yōu)樵瓉淼?/p>
"倍,方差變?yōu)樵瓉淼摹?倍.即X,,々,,毛的方差為S,,則
%+a,/。,,X”+a的方差仍為/,
22
nxt,nx2,,町,的方差為ns.
【例3】(2009上海18)
在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機構(gòu)認為該事件在一段時間內(nèi)沒有發(fā)生大規(guī)模
群體感染的標(biāo)志為"連續(xù)10天,每天新增疑似病例不超過7人”.根據(jù)過去10天甲、
乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標(biāo)志的是()
A.甲地:總體均為3,中位數(shù)為4B.乙地:總體均值為1,總體方差大于0
C.丙地:中位數(shù)為2,眾數(shù)為3D.丁地:總體均值為2,總體方差為3
【難度】⑷
【解析】D;
根據(jù)信息可知,連續(xù)10天內(nèi),每天的新增疑似病例不能有超過7的數(shù),選項A中,
中位數(shù)為4,可能存在大于7的數(shù);
同理,在選項C中也有可能;
選項B中,如果某天數(shù)據(jù)為10,其余9天為0,則不符合標(biāo)志:
選項D中,根據(jù)公式,若有大于7的數(shù)存在,則方差至少為:[(8-2『+]》3.6.
【例4】(2008上海9)
已知總體的各個體的值由小到大依次為2,3,3,7,4,6,12,13.7,18.3,20,且總
體的中位數(shù)為10.5,若要使該總體的方差最小,則〃、〃的取值分別是.
【難度】(6)
【解析】10.5,10.5:
絲2=10.5=a+/j=21,要使方差最小,只需(a—10.5)2+3—10.5)2最小,當(dāng)且
2
僅當(dāng)片+加最小,顯然當(dāng).=《=10.5時取到最小值.
【例5】對變量X與丫的卡方統(tǒng)計量/的值,說法正確的是()
A./越大,"X與y有關(guān)系”可信程度越??;
B./越小,"X與y有關(guān)系,,可信程度越小;
C./越接近0,,,x與y無關(guān)"程度越小;
D./越大,,,x與y無關(guān)"程度越大.
【難度】⑵
【解析】B
【例6】某高校食堂隨機調(diào)查了一些學(xué)生是否因距離遠近而選擇食堂就餐的情況,經(jīng)計算得
至IJ/=4.932.所以判定距離遠近與選擇食堂有關(guān)系,那么這種判斷出錯的可能性
為多少?
【難度】(2)
【解析】因為力223.841,所以出錯的可能性為5%.
【例7】下表中給出了某周內(nèi)中學(xué)生是否喝過酒的隨機調(diào)查結(jié)果,若要使結(jié)論的可靠性不低
于95%,根據(jù)所調(diào)查的數(shù)據(jù),能否作出該周內(nèi)中學(xué)生是否喝過酒與性別有關(guān)的結(jié)
論?
喝過酒沒喝過酒總計
生
男77404481
生
女
16122138
計
總
93526619
【難度】(4)
【解析】提出假設(shè)”。:該周內(nèi)中學(xué)生是否喝過酒與性別無關(guān).
由列聯(lián)表中的數(shù)據(jù),算出力、1.6366,
當(dāng)b°成立時,/23.841的概率約為0.05,而這里/=1.6366<3.841,
所以,不能推斷出喝酒與性別有關(guān)的結(jié)論.
【例8】為研究不同的給藥方式(口服或注射)和藥的效果(有效與無效)是否有關(guān),進行
了相應(yīng)的抽樣調(diào)查,調(diào)查結(jié)果如表所示.根據(jù)所選擇的193個病人的數(shù)據(jù),能否
作出藥的效果與給藥方式有關(guān)的結(jié)論?
有效無效合計
口服584098
注射643195
合計12271193
【難度】(4)
5864
【解析】在口服的病人中,有一*59%的人有效;在注射的病人中,有上*67%的人有
9895
效.從直觀上來看,口服與注射的病人的用藥效果的有效率有一定的差異,能否認
為用藥效果與用藥方式一定有關(guān)呢?下面用獨立性檢臉的方法加以說明.
提出假設(shè)“0:藥的效果與給藥方式?jīng)]有關(guān)系.由列聯(lián)表中的數(shù)據(jù),算出
2=193x(58x31-40*64)2。j38%查表有尸(222.072)=0.15.
122x71x98x95
當(dāng)兒成立時,/2I.3896的概率大于15%,這個概率比較大,所以根據(jù)目前的
調(diào)查數(shù)據(jù),不能否定假設(shè)H。,即不能作出藥的效果與給藥方式有關(guān)的結(jié)論.
點評:如果觀測值/2W2.706,那么就認為沒有充分的證據(jù)顯示兩個分類變量有
關(guān)系,但也不能作出結(jié)論"兒成立",即兩個變量沒有關(guān)系.
【例9】(2009遼寧20)
某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在
[29.9430.0*的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中個抽出500件,量其內(nèi)
徑尺寸,的結(jié)果如下表:
甲廠:
[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,
分組
29.90)29.94)29.98)30.02)30.06)30.10)30.14)
頻數(shù)12638618292614
乙廠:
[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,
分組
29.90)29.94)29.98)30.02)30.06)30.10)30.14)
頻數(shù)297185159766218
⑴試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;
⑵由于以上統(tǒng)計數(shù)據(jù)填下面2x2列聯(lián)表,并問是否有99%的把握認為"兩個分廠生
產(chǎn)的零件的質(zhì)量有差異”.
甲廠乙廠合計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度美容美發(fā)行業(yè)品牌推廣與廣告投放合同4篇
- 2025版五金制品研發(fā)、生產(chǎn)與銷售合作協(xié)議2篇
- 2025年度鋁合金門窗維修保養(yǎng)服務(wù)合同模板4篇
- 2025年度高速公路路基采石供應(yīng)合同3篇
- 2025年行政法律文書數(shù)字化處理及輸出合同3篇
- 精準(zhǔn)農(nóng)業(yè)2025年度糧食儲備風(fēng)險管理與保險合同3篇
- 二零二五紅酒年份酒定制銷售及品牌合作合同范本3篇
- 二零二五版門窗行業(yè)環(huán)保材料采購合同8篇
- 2025年度鋁窗產(chǎn)品研發(fā)與創(chuàng)新激勵合同4篇
- 2025年度道路施工勞務(wù)分包合同4篇
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級上冊 期末綜合試卷(含答案)
- 收養(yǎng)能力評分表
- 山東省桓臺第一中學(xué)2024-2025學(xué)年高一上學(xué)期期中考試物理試卷(拓展部)(無答案)
- 中華人民共和國保守國家秘密法實施條例培訓(xùn)課件
- 管道坡口技術(shù)培訓(xùn)
- 2024年全國統(tǒng)一高考英語試卷(新課標(biāo)Ⅰ卷)含答案
- 2024年認證行業(yè)法律法規(guī)及認證基礎(chǔ)知識 CCAA年度確認 試題與答案
- 皮膚儲存新技術(shù)及臨床應(yīng)用
- 外研版七年級英語上冊《閱讀理解》專項練習(xí)題(含答案)
- 2024年遼寧石化職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫必考題
- 上海市復(fù)旦大學(xué)附中2024屆高考沖刺模擬數(shù)學(xué)試題含解析
評論
0/150
提交評論