高考數(shù)學(xué)講義統(tǒng)計(jì)參考教案_第1頁
高考數(shù)學(xué)講義統(tǒng)計(jì)參考教案_第2頁
高考數(shù)學(xué)講義統(tǒng)計(jì)參考教案_第3頁
高考數(shù)學(xué)講義統(tǒng)計(jì)參考教案_第4頁
高考數(shù)學(xué)講義統(tǒng)計(jì)參考教案_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)

捱高考要求

要求

重難點(diǎn)

層次

簡單隨機(jī)抽樣B(1)隨機(jī)抽樣

①理解隨機(jī)抽樣的必要性和重要性.

隨機(jī)抽樣分層抽樣和

A@會(huì)用簡單隨機(jī)抽樣方法從總體中抽取

系統(tǒng)抽樣樣本;了解分層抽樣和系統(tǒng)抽樣方法

頻率分布表,(2)總體估計(jì)

直方圖、①了解分布的意義和作用,

B

折線圖、會(huì)列頻率分布表,

會(huì)畫頻率分布直方圖、

莖葉圖

頻率折線圖、

樣本數(shù)據(jù)的基本的數(shù)

莖葉圖,

用樣本估字特征(如平均數(shù)、標(biāo)B理解它們各自的特點(diǎn).

計(jì)總體準(zhǔn)差)(2)理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,

用樣本的頻率分布估會(huì)計(jì)算數(shù)據(jù)標(biāo)準(zhǔn)差.

計(jì)總體分布,(3)能從樣本數(shù)據(jù)中提取基本的數(shù)字特征

用樣本的基本數(shù)字特C(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋.

④會(huì)用樣本的頻率分布估計(jì)總體分布,

征估計(jì)總體的基本數(shù)

會(huì)用樣本的基本數(shù)字特征估計(jì)總體的基本

字特征

數(shù)字特征,理解用樣本估計(jì)總體的思想.

⑤會(huì)用隨機(jī)抽樣的基本方法和樣本估計(jì)

總體的思想解決一些簡單的實(shí)際問題.

(2)變量的相關(guān)性

變量的相①會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)

線性回歸方程B

關(guān)性圖,會(huì)利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系.

②了解最小二乘法的思想,能根據(jù)給出

的線性回歸方程系數(shù)公式建立線性回歸方

程.

目刨帽知識(shí)內(nèi)容

隨機(jī)抽樣

1.隨機(jī)抽樣:滿足每個(gè)個(gè)體被抽到的機(jī)會(huì)是均等的抽樣,共有三種經(jīng)常采用的隨機(jī)抽樣方

法:

⑴簡單隨機(jī)抽樣:從元素個(gè)數(shù)為N的總體中不放回地抽取容量為〃的樣本,如果每一次抽

取時(shí)總體中的各個(gè)個(gè)體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機(jī)抽樣.

抽出辦法:①抽簽法:用紙片或小球分別標(biāo)號(hào)后抽簽的方法.

②隨機(jī)數(shù)表法:隨機(jī)數(shù)表是使用計(jì)算器或計(jì)算機(jī)的應(yīng)用程序生成隨機(jī)數(shù)的功能生成的一張

數(shù)表.表中每一位置出現(xiàn)各個(gè)數(shù)字的可能性相同.

隨機(jī)數(shù)表法是對(duì)樣本進(jìn)行編號(hào)后,按照一定的規(guī)律從隨機(jī)數(shù)表中讀數(shù),并取出相應(yīng)的樣本的

方法.

簡單隨機(jī)抽樣是最簡單、最基本的抽樣方法.

⑵系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個(gè)

個(gè)體,得到所需要的樣本的抽樣方法.

抽出辦法:從元素個(gè)數(shù)為N的總體中抽取容量為,,的樣本,如果總體容量能被樣本容量整

除,設(shè)《=多,先對(duì)總體進(jìn)行編號(hào),號(hào)碼從1到N,再從數(shù)字1到4中隨機(jī)抽取一個(gè)數(shù)s作

n

為起始數(shù),然后順次抽取第s+A,s+2A,,s+(〃-1火個(gè)數(shù),這樣就得到容量為〃的樣

本.如果總體容量不能被樣本容量整除,可隨機(jī)地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣

方法進(jìn)行抽樣.

系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.

⑶分層抽樣:當(dāng)總體有明顯差別的幾部分組成時(shí),要反映總體情況,常采用分層抽樣,使

總體中各個(gè)個(gè)體按某種特征分成若干個(gè)互不重疊的幾部分,每一部分叫做層,在各層中按

層在總體中所占比例進(jìn)行簡單隨機(jī)抽樣,這種抽樣方法叫做分層抽樣.

分層抽樣的樣本具有較強(qiáng)的代表性,而且各層抽樣時(shí),可靈活選用不同的抽樣方法,

應(yīng)用廣泛.

2.簡單隨機(jī)抽樣必須具備下列特點(diǎn):

⑴簡單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)N是有限的.

⑵簡單隨機(jī)樣本數(shù)〃小于等于樣本總體的個(gè)數(shù)N.

⑶簡單隨機(jī)樣本是從總體中逐個(gè)抽取的.

⑷簡單隨機(jī)抽樣是一種不放回的抽樣.

⑸簡單隨機(jī)抽樣的每個(gè)個(gè)體入樣的可能性均為金.

3.系統(tǒng)抽樣時(shí),當(dāng)總體個(gè)數(shù)N恰好是樣本容量”的整數(shù)倍時(shí),取k=電;

n

若四不是整數(shù)時(shí),先從總體中隨機(jī)地剔除凡個(gè)個(gè)體,使得總體中剩余的個(gè)體數(shù)能被樣本容

n

量〃整除.因?yàn)槊總€(gè)個(gè)體被剔除的機(jī)會(huì)相等,因而整個(gè)抽樣過程中每個(gè)個(gè)體被抽取的機(jī)會(huì)仍

然相等,為上.

n

—.頻率直方圖

列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:

①計(jì)算極差:找出數(shù)據(jù)的最大值與最小值,計(jì)算它們的差;

②決定組距與組數(shù):取組距,用黑決定組數(shù);

組距

③決定分點(diǎn):決定起點(diǎn),進(jìn)行分組;

④列頻率分布直方圖:對(duì)落入各小組的數(shù)據(jù)累計(jì),算出各小數(shù)的頻數(shù),除以樣本容量,得

到各小組的頻率.

頻率

⑤繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖,

知小長方形的面積=組距x槃=頻率.

組距

頻率分布折線圖:將頻率分布直方圖各個(gè)長方形上邊的中點(diǎn)用線段連接起來,就得到頻率分

布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點(diǎn)沒有實(shí)際意義.

總體密度曲線:樣本容量不斷增大時(shí),所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布

直方圖可以用一條光滑曲線y=/(x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度

曲線精確地反映了一個(gè)總體在各個(gè)區(qū)域內(nèi)取值的規(guī)律.

三.莖葉圖

制作莖葉圖的步驟:

①將數(shù)據(jù)分為“莖”、“葉”兩部分;

。將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;

國將各個(gè)數(shù)據(jù)的“葉”在分界線的一側(cè)對(duì)應(yīng)莖處同行列出.

四.統(tǒng)計(jì)數(shù)據(jù)的數(shù)字特征

用樣本平均數(shù)估計(jì)總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差.

數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.

極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動(dòng)幅度;

樣本方差描述了一組數(shù)據(jù)平均數(shù)波動(dòng)的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.

一般地,設(shè)樣本的元素為不,%,,毛樣本的平均數(shù)為元,

定義樣本方差為$2=(*—-+(*一下)、+(玉一,:,

n

樣本標(biāo)準(zhǔn)差S=仍一寸+小一無K++&"亙

Vn

22

簡化公式:s=—[(X,2+x^++x^)-rix].

五.獨(dú)立性檢驗(yàn)

1.兩個(gè)變量之間的關(guān)系;

常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系

所要求的確定性,它們的關(guān)系是帶有一定隨機(jī)性的.當(dāng)一個(gè)變量取值一定時(shí),另一個(gè)變量的

取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系.

2.散點(diǎn)圖:將樣本中的〃個(gè)數(shù)據(jù)點(diǎn)(x,,y,)(i=l,2,,〃)描在平面直角坐標(biāo)系中,就得到

了散點(diǎn)圖.

散點(diǎn)窗形象地反映了各個(gè)數(shù)據(jù)的密切程度,根據(jù)散點(diǎn)圖的分布趨勢可以直觀地判斷分析兩個(gè)

變量的關(guān)系.

3.如果£二個(gè)變量的值變大時(shí),另一個(gè)變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時(shí),

散點(diǎn)圖中的點(diǎn)在從左下角到右上角的區(qū)域.

反之,一個(gè)變量的值變大時(shí),另一個(gè)變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時(shí),散點(diǎn)

圖中的點(diǎn)在從左上角到右下角的區(qū)域.

散點(diǎn)圖可以判斷兩個(gè)變量之間有沒有相關(guān)關(guān)系.

4.統(tǒng)計(jì)假設(shè):如果事件A與8獨(dú)立,這時(shí)應(yīng)該有P(A8)=P(A)P(8),用字母兒表示此式,

即40:尸(A3)=尸(A)尸(B),稱之為統(tǒng)計(jì)假設(shè).

5.讀作“卡方”)統(tǒng)計(jì)量:

統(tǒng)計(jì)學(xué)中有一個(gè)非常有用的統(tǒng)計(jì)量,它的表達(dá)式為個(gè)=,用它的大小可以

〃|+%+W+2

用來決定是否拒絕原來的統(tǒng)計(jì)假設(shè)如果力2的值較大,就拒絕“。,即認(rèn)為A與B是有

關(guān)的.

力2統(tǒng)計(jì)量的兩個(gè)臨界值:3.841、6.635;當(dāng)%?>3.841時(shí),有95%的把握說事件A與8有

關(guān);當(dāng)/>6.635時(shí),有99%的把握說事件A與8有關(guān);當(dāng)/W3.841時(shí),認(rèn)為事件A與8

是無關(guān)的.

獨(dú)立性檢驗(yàn)的基本思想與反證法類似,由結(jié)論不成立時(shí)推出有利于結(jié)論成立的小概率事件發(fā)

生,而小概率事件在一次試驗(yàn)中通常是不會(huì)發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的.

1.獨(dú)立性檢驗(yàn)的步驟:統(tǒng)計(jì)假設(shè):Hn;列出2x2聯(lián)表;計(jì)算/統(tǒng)計(jì)量;查對(duì)臨界值表,

作出判斷.

2.幾個(gè)臨界值:P(x222.706)=0.10,P(%2>3.841)?0.05,P(*與6.635)=0.01.

2x2聯(lián)表的獨(dú)立性檢驗(yàn):

如果對(duì)于某個(gè)群體有兩種狀態(tài),對(duì)于每種狀態(tài)又有兩個(gè)情況,這樣排成一張2x2的表,如

下:

狀態(tài)3狀態(tài)看合計(jì)

狀態(tài)A%

狀態(tài)入n2\〃224+

%〃+2n

如果有調(diào)查得來的四個(gè)數(shù)據(jù)孫,與,嗎?,n22.并希望根據(jù)這樣的4個(gè)數(shù)據(jù)來檢驗(yàn)上述的兩種

狀態(tài)A與8是否有關(guān),就稱之為2x2聯(lián)表屆獨(dú)立性檢驗(yàn).

六.回歸分析

1.回歸分析:對(duì)于具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析,即回歸分

析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.

回歸直線:如果散點(diǎn)圖中的各點(diǎn)都大致分布在一條直線附近,就稱這兩個(gè)變量之間具有線性

相關(guān)關(guān)系,這條直線叫做回歸直線.

2.最小二乘法:

記回歸直線方程為:y=a+bx,稱為變量丫對(duì)變量x的回歸直線方程,其中。"叫做回歸

系數(shù).

?是為了區(qū)分丫的實(shí)際值y,當(dāng)x取值片時(shí),變量丫的相應(yīng)觀察值為y,而直線上對(duì)應(yīng)于x,

的縱坐標(biāo)是y;=a+bx;.

設(shè)的一組觀察值為(乙,%),i=l,2,,n,且回歸直線方程為》=。+法,

當(dāng)x取值.時(shí),丫的相應(yīng)觀察值為%,差%-洶=1,2,,〃)刻畫了實(shí)際觀察值y與回歸

直線上相應(yīng)點(diǎn)的縱坐標(biāo)之間的偏離程度,稱這些值為離差.

我們希望這"個(gè)離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點(diǎn).

記Q=f(%-〃一次,)2,回歸直線就是所有直線中。取最小值的那條.

i=\

這種使“離差平方和為最小”的方法,叫做最小二乘法.

用最小二乘法求回歸系數(shù)4,6有如下的公式:

刃=嚀---------a=y-bx,其中a"上方加“人”,表示是由觀察值按最小二乘法求得的

f*:一戒2

1=1

回歸系數(shù).

3.線性回歸模型:將用于估計(jì)y值的線性函數(shù)a+反作為確定性函數(shù);y的實(shí)際值與估計(jì)

值之間的誤差記為£,稱之為隨機(jī)誤差;將y=a+反+£稱為線性回歸模型.

產(chǎn)生隨機(jī)誤差的主要原因有:

①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;

②忽略了某些因素的影響,通常這些影響都比較小;

③由于測量工具等原因,存在觀測誤差.

4.線性回歸系數(shù)的最佳估計(jì)值:

利用最小二乘法可以得到33的計(jì)算公式為

b

=-^—;,------------------=-r---------------a=y-bx,其中》=一之七,>=一£%

i=lj=l

由此得到的直線3=G+6x就稱為回歸直線,此直線方程即為線性回歸方程.其中6,b6

別為a,b的估計(jì)值,&稱為回歸截距,6稱為回歸系數(shù),》稱為回歸值.

5.相關(guān)系數(shù):

E(七-x)(%-y)zX*-nxy

,=2=/I

J.、一,J(—x:一心)2)(汽才一"(yf)

Vi=lJ=IV/=1i=l

6.相關(guān)系數(shù)「的性質(zhì):

⑴|r|Wl;

⑵|川越接近于1,x,y的線性相關(guān)程度越強(qiáng);

⑶|川越接近于0,x,y的線性相關(guān)程度越弱.

可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān).

7.轉(zhuǎn)化思想:

根據(jù)專業(yè)知識(shí)或散點(diǎn)圖,對(duì)某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)

化為線性回歸方程,從而確定未知參數(shù).

8.一些備案

①回歸(regression)一詞的來歷:“回歸”這個(gè)詞英國統(tǒng)計(jì)學(xué)家FrancilsGalton提出來的.1889

年,他在研究祖先與后代的身高之間的關(guān)系時(shí)發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,

但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,

但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近

的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個(gè)變量的變化去推測另一個(gè)變量的變化的方法稱

為回歸分析.

②回歸系數(shù)的推導(dǎo)過程:

Q=ZKy--如]2=Zy;-2azy.+〃“2-2/?ZX/+匕+/Zx;

=na2+2asz苦-ZX)+〃Z考一2Z,E+EE,

把上式看成a的二次函數(shù),/的系數(shù)〃>0,

因此當(dāng)a=-2(/£-£上)=EX-£時(shí)取最小值.

2nn

同理,把。的展開式按6的降基排列,看成6的二次函數(shù),當(dāng)匕=時(shí)取最小值.

Z(%-君(%一歹)

解得:6=勺-------a=y-bx,

2%_君2

汽X”版2

1=1

其中歹=1〉;%,元,是樣本平均數(shù).

nn

9.對(duì)相關(guān)系數(shù)r進(jìn)行相關(guān)性檢驗(yàn)的步驟:

①提出統(tǒng)計(jì)假設(shè)”。:變量x,y不具有線性相關(guān)關(guān)系;

②如果以95%的把握作出推斷,那么可以根據(jù)1-0.95=0.05與〃-2(“是樣本容量)在相

關(guān)性檢驗(yàn)的臨界值表中查出一個(gè)r的臨界值4.05(其中「0.95=0.05稱為檢驗(yàn)水平);

③計(jì)算樣本相關(guān)系數(shù).

④作出統(tǒng)計(jì)推斷:若1川>%。5,則否定表明有95%的把握認(rèn)為變量y與x之間具有線

性相關(guān)關(guān)系;若IrlW^os,則沒有理由拒絕“。,即就目前數(shù)據(jù)而言,沒有充分理由認(rèn)為變

量y與X之間具有線性相關(guān)關(guān)系.

說明:

⑴對(duì)相關(guān)系數(shù)r進(jìn)行顯著性檢驗(yàn),一般取檢驗(yàn)水平a=0.05,即可靠程度為95%.

⑵這里的,?指的是線性相關(guān)系數(shù),;■的絕對(duì)值很小,只是說明線性相關(guān)程度低,不一定不相

關(guān),可能是非線性相關(guān)的某種關(guān)系.

⑶這里的r是對(duì)抽樣數(shù)據(jù)而言的.有時(shí)即使|川=1,兩者也不一定是線性相關(guān)的.故在統(tǒng)計(jì)

分析時(shí),不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實(shí)際情況進(jìn)行合理解釋.

且tM唯典例分析

板塊一隨機(jī)抽樣

【例1】為了了解參加運(yùn)動(dòng)會(huì)的2000名運(yùn)動(dòng)員的年齡情況,從中抽取100名運(yùn)動(dòng)員;就

這個(gè)問題,下列說法中正確的有()個(gè)

①2000名運(yùn)動(dòng)員是總體;

②每個(gè)運(yùn)動(dòng)員是個(gè)體;

③所抽取的100名運(yùn)動(dòng)員是一個(gè)樣本;

④樣本容量為100;

⑤這個(gè)抽樣方法可采用按年齡進(jìn)行分層抽樣;

⑥每個(gè)運(yùn)動(dòng)員被抽到的概率相等

A.1B.2C.3D.4

【難度】(4)

【解析】B:

2000名運(yùn)動(dòng)員的年齡是總體,抽取的100名運(yùn)動(dòng)員的年齡是一個(gè)樣本,只有④⑥

正確.

【例2】(1)某社區(qū)有400戶家庭,其中高收入家庭25戶,中收入家庭280戶,低收入

家庭95戶,為了了解社會(huì)購買力的某項(xiàng)指標(biāo),要從中抽取一個(gè)容量為100的樣

本;

⑵從10名職工中抽取3名參加座談會(huì);

⑶一個(gè)年級(jí)有10個(gè)班,每個(gè)班有50名同學(xué),隨機(jī)編為1至50號(hào),為了了解他

們的學(xué)習(xí)情況,要求每個(gè)班的30號(hào)同學(xué)留下來進(jìn)行問卷調(diào)查.

以上問題各對(duì)應(yīng)哪種隨機(jī)抽樣方法?

【難度】(4)

【解析】⑴分層抽樣;⑵簡單隨機(jī)抽樣;⑶系統(tǒng)抽樣.

【例3】采用系統(tǒng)抽樣法,從121人中抽取一個(gè)容量為12人的樣本,寫出抽樣的步驟,

并求每人被抽取的機(jī)率.

【難度】(4)

【解析】抽樣步驟:

因12不能整除121,故先隨機(jī)剔除一個(gè)人,將余下的人從1~120進(jìn)行編號(hào),在

1~10中用抽簽法抽出k號(hào)(1WZW10),然后依次順序抽取

\0+k,20+k,,110+左,得到一個(gè)12人的樣本.

被抽取的機(jī)率:系統(tǒng)抽樣無論有無剔除都是等機(jī)率抽樣,因?yàn)楸惶蕹臋C(jī)率也

是相同的,故被抽取的機(jī)率為12*.

121

【例4】用系統(tǒng)抽樣法要從160名學(xué)生中抽取容量為20的樣本,將160名學(xué)生隨機(jī)地

從1?160編號(hào),按編號(hào)順序平均分成20組(1~8號(hào),9~16號(hào),…,153-160

號(hào)),若第16組抽出的號(hào)碼為126,則第1組中用抽簽的方法確定的號(hào)碼是

【難度】(2)

【解析】不妨設(shè)在第1組中隨機(jī)抽到的號(hào)碼為x,則在第16組中應(yīng)抽出的號(hào)碼為120+x.

設(shè)第1組抽出的號(hào)碼為x,則第16組應(yīng)抽出的號(hào)碼是8xl5+x=126,二x=6.

【例5】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個(gè)容量為

〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個(gè)體;如果樣本

容量增加1個(gè),則在采用系統(tǒng)抽樣時(shí),需要在總體中先剔除1個(gè)個(gè)體,則樣本容

量為.

【難度】(6)

【解析】6;

總體容量N=36(人),

當(dāng)樣本容量為〃時(shí),系統(tǒng)抽樣間隔為死eN*.

n

分層抽樣的抽樣比為二,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為2,烏,4,

36632

所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.

35

當(dāng)樣本容量為〃+1時(shí),總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-EN*,

n+l

所以〃只能是6.

【例6】一個(gè)總體中有100個(gè)個(gè)體,隨機(jī)編號(hào)0,1,2,99,依編號(hào)順序平均分成

10個(gè)小組,組號(hào)依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個(gè)容量

為10的樣本,規(guī)定如果在第1組隨機(jī)抽取的號(hào)碼為機(jī),那么在第%組中抽取的

號(hào)碼個(gè)位數(shù)字與m+左的個(gè)位數(shù)字相同,若機(jī)=6,則在第7組中抽取的號(hào)碼

是.

【難度】(4)

【解析】63;第/組的號(hào)碼為(無-1)*10,依-1)*10+1,…,(4-1)*10+9,當(dāng)機(jī)=6時(shí),

第k組抽取的號(hào)的個(gè)位數(shù)字為加+女的個(gè)位數(shù)字,所以第7組中抽取的號(hào)碼的個(gè)

位數(shù)字為3,所以抽取號(hào)碼為63.

【例7】(北京市西城區(qū)2009年4月高三一模抽樣測試)

某單位有27名老年人,54名中年人,81名青年人.為了調(diào)查他們的身體情況,

用分層抽樣的方法從他們中抽取了"個(gè)人進(jìn)行體檢,其中有6名老年人,那么

n=.

【難度】(2)

【解析】由比例可得抽取的中年職工共有12人,青年職工共有18人,于是

/?=6+12+18=36o

【例8】(2009湖南)

一個(gè)總體分為A,8兩層,其個(gè)體數(shù)之比為4:1,用分層抽樣方法從總體中抽取

一個(gè)容量為10的樣本,已知8層中甲、乙都被抽到的概率為-L,則總體中的

28

個(gè)體數(shù)為.

【難度】(4)

【解析】由條件易知B層中抽取的樣本數(shù)是2,設(shè)8層總體數(shù)是〃,則又由B層中甲、

乙都被抽到的概率是與=,可解得〃=8,所以總體中的個(gè)體數(shù)是

C28

4x8+8=40.

【例9】(05年湖南)某工廠生產(chǎn)了某種產(chǎn)品16800件,它們來自甲、乙、丙三條生產(chǎn)

線.為檢查產(chǎn)品的質(zhì)量,決定采用分層抽樣法進(jìn)行抽樣.已知甲、乙、丙三條

生產(chǎn)線抽取的個(gè)數(shù)成等差數(shù)列,則乙生產(chǎn)了件產(chǎn)品.

【難度】(4)

【解析】根據(jù)分層抽樣的抽樣比相等知:甲、乙、丙三條生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量比等于

抽取的樣品容量比.

又這三條生產(chǎn)線抽取的產(chǎn)品個(gè)數(shù)成等差數(shù)列,根據(jù)等差數(shù)列的性質(zhì)知,它們生產(chǎn)的

產(chǎn)品也成等差數(shù)列.

又乙生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量為甲、丙的等差中項(xiàng),且和為16800,

故乙生產(chǎn)的產(chǎn)品數(shù)量為:度也=5600件.

3

【例10】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個(gè)容量為

〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個(gè)體;如果樣本

容量增加1個(gè),則在采用系統(tǒng)抽樣時(shí),需要在總體中先剔除1個(gè)個(gè)體,則樣本容

量為.

【難度】(4)

【解析】總體容量N=36(人),

當(dāng)樣本容量為〃時(shí),系統(tǒng)抽樣間隔為地eN*.

n

分層抽樣的抽樣比為2,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為4,3巳,

36632

所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.

當(dāng)樣本容量為〃+1時(shí),總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-£N*,

n+\

所以〃只能是6.

【例11】(2008廣東19)

某初級(jí)中學(xué)共有學(xué)生2000名,各年級(jí)男、女生人數(shù)如下表:

初一年級(jí)初二年級(jí)初三年級(jí)

女生373Xy

男生377370Z

已知在全校學(xué)生中隨機(jī)抽取1名,抽到初二年級(jí)女生的概率是0.19.

⑴求x的值;

⑵現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,問應(yīng)在初三年級(jí)抽取多少名?

(3)已知y,245,z2245,求初三年級(jí)中女生比男生多的概率.

【難度】(8)

【解析】=0.19,Ax=380;

2000

⑵初三年級(jí)人數(shù)為y+z=2000-(373+377+380+370)=500,

現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,

48

應(yīng)在初三年級(jí)抽取的人數(shù)為:--x500=12名.

2000

(3)設(shè)初三年級(jí)女生比男生多的事件為A,初三年級(jí)女生男生數(shù)記為(y,z);

由⑵知y+z=500,且y,zeN,基本事件空間包含的基本事件有:(245,255)、

(246,254)、(247,253)、.…(255,245)共11個(gè).

事件A包含的基本事件有:

(251,249)、(252,248)、(253,247)、(254,246)、(255,245),共5個(gè).

P(A)=—.

II

板塊二頻率直方圖“莖葉圖

【例1】(2009湖北15)

下圖是樣本容量為200的頻率分布直方圖.

根據(jù)樣本的頻率分布直方圖估計(jì),樣本數(shù)據(jù)落在[6,10)內(nèi)的頻數(shù)為,數(shù)據(jù)

落在[2,10)內(nèi)的概率約為.

【難度】(2)

【解析】64,0.4;

觀察直方圖易得頻數(shù)為200*0.08x4=64,頻率為(0.02+0.08)x4=0.4.

【例2】為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機(jī)抽查了20位工人某天生產(chǎn)該產(chǎn)品的

數(shù)量.產(chǎn)品數(shù)量的分組區(qū)間為[45,55),[55,65),[65,75),[75,85),[85,95)

由此得到頻率分布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量在[55,75)

的人數(shù)是

頻率,組距

0.040「I-----------1

0.035卜

0.030卜

0.025卜---

0.020[-----------

0.015卜

0.010[----------

5

°-°°1IIIII~~I一

°455565758595產(chǎn)品數(shù)量

【難度】

【解析】13;

20x(0.065x10)=13,故答案為13.

【例3】如圖為某樣本數(shù)據(jù)的頻率分布直方圖,則下列說法不正確的是()

A.[6,10)的頻率為0.32

B.若樣本容量為100,貝I][10,14)的頻數(shù)為40

C.若樣本容量為100,則(3,10]的頻數(shù)為40

D.由頻率分布布直方圖可得出結(jié)論:估計(jì)總體大約有10%分布在[10,14)

【難度】(4)

【解析】D;

口0,14)的頻率為0.1x4=0.4,因此估計(jì)總體大約有40%分布在[10,14).

【例4】為了讓學(xué)生了解環(huán)保知識(shí),增強(qiáng)環(huán)保意識(shí),某中學(xué)舉行了一次"環(huán)保知識(shí)競賽",共

有900名學(xué)生參加了這次競賽.為了解本次競賽成績情況,從中抽取了部分學(xué)生

的成績(得分均為整數(shù),滿分為100分)進(jìn)行統(tǒng)計(jì).請(qǐng)你根據(jù)尚未完成并有局部

污損的頻率分布表和頻數(shù)分布直方圖,解答下列問題:

(1)填充頻率分布表的空格(將答案直接填在表格內(nèi));

⑵補(bǔ)全頻數(shù)條形圖;

(3)若成績?cè)?5.5-85.5分的學(xué)生為二等獎(jiǎng),問獲得二等獎(jiǎng)的學(xué)生約為多少人?

【難度】(6)

【解析】⑴

分組頻數(shù)頻率

50.5~60.540.08

60.5?70.580.16

70.5?80.5100.20

80.5?90.5160.32

90.5?100.5120.24

合計(jì)501.00

(3)成績?cè)?5.5?80.5分的學(xué)生占70.5?80.5分的學(xué)生的因?yàn)槌煽冊(cè)?/p>

10

70.5?80.5分的學(xué)生頻率為0.2,所以成績?cè)?6.5?80.5分的學(xué)生頻率為0.1,成績

在80.5?85.5分的學(xué)生占80.5?90.5分的學(xué)生的上,因?yàn)槌煽冊(cè)?0.5?90.5分的學(xué)

10

生頻率為0.30所以成績?cè)?0.5?85.5分的學(xué)生頻率為0.16,所以成績?cè)?/p>

76.5?85.5分的學(xué)生頻率為0.26,由于有900名學(xué)生參加了這次競賽,所以該校獲

得二等獎(jiǎng)的學(xué)生約為0.26x900=234(人)

【例5】右圖是某賽季甲、乙兩名籃球運(yùn)動(dòng)員每場比賽得分的莖葉圖,

甲乙

5315

368245

47932678

1457

則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()

A.62B.63C.64D.65

【難度】(4)

【解析】C;28+36=64.

【例6】(2009年福建12)

某校開展"愛我海西、愛我家鄉(xiāng)”攝影比賽,9位

評(píng)委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示,記

分員在去掉一個(gè)最高分和一個(gè)最低分后,算得平:;714

均分為91,復(fù)核員在復(fù)核時(shí),發(fā)現(xiàn)有一個(gè)數(shù)字(莖

葉圖中的x)無法看清.若記分員計(jì)算無誤,則數(shù)字x應(yīng)該是.

【難度】(6)

【解析】1:

由莖葉圖可知所有評(píng)分為:88,89,89,92,93,9%,92,91,94,若x>4,去掉9x,

易知剩下的數(shù)的平均數(shù)大于91;故94為最高分,去掉88與94后,有

89+891-92-95?)+9=1>,解得x=l.

【例7】某班甲、乙兩學(xué)生的高考備考成績?nèi)缦拢?/p>

甲:512554528549536556534541522538

乙:515558521543532559536548527531

⑴用莖葉圖表示兩學(xué)生的成績;

⑵分別求兩學(xué)生成績的中位數(shù)和平均分.

【難度】(4)

【解析】⑴兩學(xué)生成績績的莖葉圖如右所示

甲乙

2515

285217

84653261

195438

645589

⑵將甲、乙兩學(xué)生的成績從小到大排列為:

甲:512522528534536538541549554556,

乙:515521527531532536543548558559.

從以上排列可知甲學(xué)生成績的中位數(shù)為空上空=537,

2

乙學(xué)生成績的中位數(shù)為衛(wèi)注=534.

2

甲學(xué)生成績的平均數(shù)為:

9、12+22+28+34+36+38+41+49+54+56

500+--------------------------------------=537,

10

乙學(xué)生成績的平均數(shù)為:

…15+21+27+31+32+36+43+48+58+59―

500+--------------------------------------=537.

10

【例8】某電腦雜志的一篇文章中,每個(gè)句子的字?jǐn)?shù)如下:

10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17

翥報(bào)紙的一篇文章中,每個(gè)句子所含的字?jǐn)?shù)如下:

27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22

⑴將兩組數(shù)據(jù)用莖葉圖表示;

⑵比較分析,能得到什么結(jié)論?

【難度】(4)

【解析】⑴莖葉圖如右.

電腦雜志報(bào)紙文章

9877554102389

8777654432022347778

612233569

116

⑵電腦雜志上每個(gè)句子的字?jǐn)?shù)集中在10~30之間,中位數(shù)為23;而報(bào)紙上每個(gè)句

子的字?jǐn)?shù)集中在20~40之間,中位數(shù)為28.電腦雜志上每個(gè)句子的平均字?jǐn)?shù)比報(bào)

紙上的平均字?jǐn)?shù)

要少.說明電腦雜志作為科普讀物需要簡明.

板塊三數(shù)字特征,獨(dú)立及回歸

【例1】已知一組數(shù)據(jù)孑,々,,指的方差是2,

且(占-3)2+(%-3)2++(/-3)2=380,則這組數(shù)據(jù)的平均數(shù)x=

【難度】(2)

【解析】9或-3;

依題設(shè)有(.一.)-+(吃X)-++(X|()x)2=2展開變形得

10

(X:+A?2++x3)+1Ox~—2x(X]+/++芯0)=20........

同樣的,(%—3)2+(專一3)2++(4)-3)2=380,展開變形得

(x[+x;++X[:))+10x9—6?(X]+X,++XJQ)=380.......(2)

②一①并化簡得了2—6元-27=0.解得了=一3或元=9.

【例2】求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到0.1),并分析由這些結(jié)果可得出什么更

一般的結(jié)論.

(1)123456789;

(2)111213141516171819;

(3)24681012141618

【難度】(4)

【解析】(1)工=」(1+2++9)=5,

9

22222

5(=^(1+2++9-9x5)=y?6.7,M=楞弓2.6;

(2)=-(11+12++19)=15

-9

I20

22

]_15)2+(I2-15)++(19-15)]=y-6.7,

52=-^y-2-6:

(3)^=-(2+4++18)=10

,1,,80

s;=-[(2-10)*+(4-10)92++(18-10)2]=丁26.7,

一組數(shù)都加上相同的數(shù)后,方差不變,都乘以相同的倍數(shù)〃后,標(biāo)準(zhǔn)差變?yōu)樵瓉淼?/p>

"倍,方差變?yōu)樵瓉淼摹?倍.即X,,々,,毛的方差為S,,則

%+a,/。,,X”+a的方差仍為/,

22

nxt,nx2,,町,的方差為ns.

【例3】(2009上海18)

在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機(jī)構(gòu)認(rèn)為該事件在一段時(shí)間內(nèi)沒有發(fā)生大規(guī)模

群體感染的標(biāo)志為"連續(xù)10天,每天新增疑似病例不超過7人”.根據(jù)過去10天甲、

乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標(biāo)志的是()

A.甲地:總體均為3,中位數(shù)為4B.乙地:總體均值為1,總體方差大于0

C.丙地:中位數(shù)為2,眾數(shù)為3D.丁地:總體均值為2,總體方差為3

【難度】⑷

【解析】D;

根據(jù)信息可知,連續(xù)10天內(nèi),每天的新增疑似病例不能有超過7的數(shù),選項(xiàng)A中,

中位數(shù)為4,可能存在大于7的數(shù);

同理,在選項(xiàng)C中也有可能;

選項(xiàng)B中,如果某天數(shù)據(jù)為10,其余9天為0,則不符合標(biāo)志:

選項(xiàng)D中,根據(jù)公式,若有大于7的數(shù)存在,則方差至少為:[(8-2『+]》3.6.

【例4】(2008上海9)

已知總體的各個(gè)體的值由小到大依次為2,3,3,7,4,6,12,13.7,18.3,20,且總

體的中位數(shù)為10.5,若要使該總體的方差最小,則〃、〃的取值分別是.

【難度】(6)

【解析】10.5,10.5:

絲2=10.5=a+/j=21,要使方差最小,只需(a—10.5)2+3—10.5)2最小,當(dāng)且

2

僅當(dāng)片+加最小,顯然當(dāng).=《=10.5時(shí)取到最小值.

【例5】對(duì)變量X與丫的卡方統(tǒng)計(jì)量/的值,說法正確的是()

A./越大,"X與y有關(guān)系”可信程度越??;

B./越小,"X與y有關(guān)系,,可信程度越?。?/p>

C./越接近0,,,x與y無關(guān)"程度越小;

D./越大,,,x與y無關(guān)"程度越大.

【難度】⑵

【解析】B

【例6】某高校食堂隨機(jī)調(diào)查了一些學(xué)生是否因距離遠(yuǎn)近而選擇食堂就餐的情況,經(jīng)計(jì)算得

至IJ/=4.932.所以判定距離遠(yuǎn)近與選擇食堂有關(guān)系,那么這種判斷出錯(cuò)的可能性

為多少?

【難度】(2)

【解析】因?yàn)榱?23.841,所以出錯(cuò)的可能性為5%.

【例7】下表中給出了某周內(nèi)中學(xué)生是否喝過酒的隨機(jī)調(diào)查結(jié)果,若要使結(jié)論的可靠性不低

于95%,根據(jù)所調(diào)查的數(shù)據(jù),能否作出該周內(nèi)中學(xué)生是否喝過酒與性別有關(guān)的結(jié)

論?

喝過酒沒喝過酒總計(jì)

男77404481

16122138

計(jì)

93526619

【難度】(4)

【解析】提出假設(shè)”。:該周內(nèi)中學(xué)生是否喝過酒與性別無關(guān).

由列聯(lián)表中的數(shù)據(jù),算出力、1.6366,

當(dāng)b°成立時(shí),/23.841的概率約為0.05,而這里/=1.6366<3.841,

所以,不能推斷出喝酒與性別有關(guān)的結(jié)論.

【例8】為研究不同的給藥方式(口服或注射)和藥的效果(有效與無效)是否有關(guān),進(jìn)行

了相應(yīng)的抽樣調(diào)查,調(diào)查結(jié)果如表所示.根據(jù)所選擇的193個(gè)病人的數(shù)據(jù),能否

作出藥的效果與給藥方式有關(guān)的結(jié)論?

有效無效合計(jì)

口服584098

注射643195

合計(jì)12271193

【難度】(4)

5864

【解析】在口服的病人中,有一*59%的人有效;在注射的病人中,有上*67%的人有

9895

效.從直觀上來看,口服與注射的病人的用藥效果的有效率有一定的差異,能否認(rèn)

為用藥效果與用藥方式一定有關(guān)呢?下面用獨(dú)立性檢臉的方法加以說明.

提出假設(shè)“0:藥的效果與給藥方式?jīng)]有關(guān)系.由列聯(lián)表中的數(shù)據(jù),算出

2=193x(58x31-40*64)2。j38%查表有尸(222.072)=0.15.

122x71x98x95

當(dāng)兒成立時(shí),/2I.3896的概率大于15%,這個(gè)概率比較大,所以根據(jù)目前的

調(diào)查數(shù)據(jù),不能否定假設(shè)H。,即不能作出藥的效果與給藥方式有關(guān)的結(jié)論.

點(diǎn)評(píng):如果觀測值/2W2.706,那么就認(rèn)為沒有充分的證據(jù)顯示兩個(gè)分類變量有

關(guān)系,但也不能作出結(jié)論"兒成立",即兩個(gè)變量沒有關(guān)系.

【例9】(2009遼寧20)

某企業(yè)有兩個(gè)分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在

[29.9430.0*的零件為優(yōu)質(zhì)品.從兩個(gè)分廠生產(chǎn)的零件中個(gè)抽出500件,量其內(nèi)

徑尺寸,的結(jié)果如下表:

甲廠:

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)12638618292614

乙廠:

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)297185159766218

⑴試分別估計(jì)兩個(gè)分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;

⑵由于以上統(tǒng)計(jì)數(shù)據(jù)填下面2x2列聯(lián)表,并問是否有99%的把握認(rèn)為"兩個(gè)分廠生

產(chǎn)的零件的質(zhì)量有差異”.

甲廠乙廠合計(jì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論