高考數(shù)學(xué)講義統(tǒng)計參考教案_第1頁
高考數(shù)學(xué)講義統(tǒng)計參考教案_第2頁
高考數(shù)學(xué)講義統(tǒng)計參考教案_第3頁
高考數(shù)學(xué)講義統(tǒng)計參考教案_第4頁
高考數(shù)學(xué)講義統(tǒng)計參考教案_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計

捱高考要求

要求

重難點

層次

簡單隨機抽樣B(1)隨機抽樣

①理解隨機抽樣的必要性和重要性.

隨機抽樣分層抽樣和

A@會用簡單隨機抽樣方法從總體中抽取

系統(tǒng)抽樣樣本;了解分層抽樣和系統(tǒng)抽樣方法

頻率分布表,(2)總體估計

直方圖、①了解分布的意義和作用,

B

折線圖、會列頻率分布表,

會畫頻率分布直方圖、

莖葉圖

頻率折線圖、

樣本數(shù)據(jù)的基本的數(shù)

莖葉圖,

用樣本估字特征(如平均數(shù)、標(biāo)B理解它們各自的特點.

計總體準(zhǔn)差)(2)理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,

用樣本的頻率分布估會計算數(shù)據(jù)標(biāo)準(zhǔn)差.

計總體分布,(3)能從樣本數(shù)據(jù)中提取基本的數(shù)字特征

用樣本的基本數(shù)字特C(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋.

④會用樣本的頻率分布估計總體分布,

征估計總體的基本數(shù)

會用樣本的基本數(shù)字特征估計總體的基本

字特征

數(shù)字特征,理解用樣本估計總體的思想.

⑤會用隨機抽樣的基本方法和樣本估計

總體的思想解決一些簡單的實際問題.

(2)變量的相關(guān)性

變量的相①會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點

線性回歸方程B

關(guān)性圖,會利用散點圖認識變量間的相關(guān)關(guān)系.

②了解最小二乘法的思想,能根據(jù)給出

的線性回歸方程系數(shù)公式建立線性回歸方

程.

目刨帽知識內(nèi)容

隨機抽樣

1.隨機抽樣:滿足每個個體被抽到的機會是均等的抽樣,共有三種經(jīng)常采用的隨機抽樣方

法:

⑴簡單隨機抽樣:從元素個數(shù)為N的總體中不放回地抽取容量為〃的樣本,如果每一次抽

取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡單隨機抽樣.

抽出辦法:①抽簽法:用紙片或小球分別標(biāo)號后抽簽的方法.

②隨機數(shù)表法:隨機數(shù)表是使用計算器或計算機的應(yīng)用程序生成隨機數(shù)的功能生成的一張

數(shù)表.表中每一位置出現(xiàn)各個數(shù)字的可能性相同.

隨機數(shù)表法是對樣本進行編號后,按照一定的規(guī)律從隨機數(shù)表中讀數(shù),并取出相應(yīng)的樣本的

方法.

簡單隨機抽樣是最簡單、最基本的抽樣方法.

⑵系統(tǒng)抽樣:將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個

個體,得到所需要的樣本的抽樣方法.

抽出辦法:從元素個數(shù)為N的總體中抽取容量為,,的樣本,如果總體容量能被樣本容量整

除,設(shè)《=多,先對總體進行編號,號碼從1到N,再從數(shù)字1到4中隨機抽取一個數(shù)s作

n

為起始數(shù),然后順次抽取第s+A,s+2A,,s+(〃-1火個數(shù),這樣就得到容量為〃的樣

本.如果總體容量不能被樣本容量整除,可隨機地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣

方法進行抽樣.

系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.

⑶分層抽樣:當(dāng)總體有明顯差別的幾部分組成時,要反映總體情況,常采用分層抽樣,使

總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按

層在總體中所占比例進行簡單隨機抽樣,這種抽樣方法叫做分層抽樣.

分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可靈活選用不同的抽樣方法,

應(yīng)用廣泛.

2.簡單隨機抽樣必須具備下列特點:

⑴簡單隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的.

⑵簡單隨機樣本數(shù)〃小于等于樣本總體的個數(shù)N.

⑶簡單隨機樣本是從總體中逐個抽取的.

⑷簡單隨機抽樣是一種不放回的抽樣.

⑸簡單隨機抽樣的每個個體入樣的可能性均為金.

3.系統(tǒng)抽樣時,當(dāng)總體個數(shù)N恰好是樣本容量”的整數(shù)倍時,取k=電;

n

若四不是整數(shù)時,先從總體中隨機地剔除凡個個體,使得總體中剩余的個體數(shù)能被樣本容

n

量〃整除.因為每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍

然相等,為上.

n

—.頻率直方圖

列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:

①計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差;

②決定組距與組數(shù):取組距,用黑決定組數(shù);

組距

③決定分點:決定起點,進行分組;

④列頻率分布直方圖:對落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得

到各小組的頻率.

頻率

⑤繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以的值為縱坐標(biāo)繪制直方圖,

知小長方形的面積=組距x槃=頻率.

組距

頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分

布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.

總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布

直方圖可以用一條光滑曲線y=/(x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度

曲線精確地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律.

三.莖葉圖

制作莖葉圖的步驟:

①將數(shù)據(jù)分為“莖”、“葉”兩部分;

。將最大莖與最小莖之間的數(shù)字按大小順序排成一列,并畫上豎線作為分隔線;

國將各個數(shù)據(jù)的“葉”在分界線的一側(cè)對應(yīng)莖處同行列出.

四.統(tǒng)計數(shù)據(jù)的數(shù)字特征

用樣本平均數(shù)估計總體平均數(shù);用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差.

數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.

極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度;

樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.

一般地,設(shè)樣本的元素為不,%,,毛樣本的平均數(shù)為元,

定義樣本方差為$2=(*—-+(*一下)、+(玉一,:,

n

樣本標(biāo)準(zhǔn)差S=仍一寸+小一無K++&"亙

Vn

22

簡化公式:s=—[(X,2+x^++x^)-rix].

五.獨立性檢驗

1.兩個變量之間的關(guān)系;

常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系

所要求的確定性,它們的關(guān)系是帶有一定隨機性的.當(dāng)一個變量取值一定時,另一個變量的

取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.

2.散點圖:將樣本中的〃個數(shù)據(jù)點(x,,y,)(i=l,2,,〃)描在平面直角坐標(biāo)系中,就得到

了散點圖.

散點窗形象地反映了各個數(shù)據(jù)的密切程度,根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個

變量的關(guān)系.

3.如果£二個變量的值變大時,另一個變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時,

散點圖中的點在從左下角到右上角的區(qū)域.

反之,一個變量的值變大時,另一個變量的值由大變小,這種相關(guān)稱為負相關(guān).此時,散點

圖中的點在從左上角到右下角的區(qū)域.

散點圖可以判斷兩個變量之間有沒有相關(guān)關(guān)系.

4.統(tǒng)計假設(shè):如果事件A與8獨立,這時應(yīng)該有P(A8)=P(A)P(8),用字母兒表示此式,

即40:尸(A3)=尸(A)尸(B),稱之為統(tǒng)計假設(shè).

5.讀作“卡方”)統(tǒng)計量:

統(tǒng)計學(xué)中有一個非常有用的統(tǒng)計量,它的表達式為個=,用它的大小可以

〃|+%+W+2

用來決定是否拒絕原來的統(tǒng)計假設(shè)如果力2的值較大,就拒絕“。,即認為A與B是有

關(guān)的.

力2統(tǒng)計量的兩個臨界值:3.841、6.635;當(dāng)%?>3.841時,有95%的把握說事件A與8有

關(guān);當(dāng)/>6.635時,有99%的把握說事件A與8有關(guān);當(dāng)/W3.841時,認為事件A與8

是無關(guān)的.

獨立性檢驗的基本思想與反證法類似,由結(jié)論不成立時推出有利于結(jié)論成立的小概率事件發(fā)

生,而小概率事件在一次試驗中通常是不會發(fā)生的,所以認為結(jié)論在很大程度上是成立的.

1.獨立性檢驗的步驟:統(tǒng)計假設(shè):Hn;列出2x2聯(lián)表;計算/統(tǒng)計量;查對臨界值表,

作出判斷.

2.幾個臨界值:P(x222.706)=0.10,P(%2>3.841)?0.05,P(*與6.635)=0.01.

2x2聯(lián)表的獨立性檢驗:

如果對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個情況,這樣排成一張2x2的表,如

下:

狀態(tài)3狀態(tài)看合計

狀態(tài)A%

狀態(tài)入n2\〃224+

%〃+2n

如果有調(diào)查得來的四個數(shù)據(jù)孫,與,嗎?,n22.并希望根據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種

狀態(tài)A與8是否有關(guān),就稱之為2x2聯(lián)表屆獨立性檢驗.

六.回歸分析

1.回歸分析:對于具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析,即回歸分

析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.

回歸直線:如果散點圖中的各點都大致分布在一條直線附近,就稱這兩個變量之間具有線性

相關(guān)關(guān)系,這條直線叫做回歸直線.

2.最小二乘法:

記回歸直線方程為:y=a+bx,稱為變量丫對變量x的回歸直線方程,其中。"叫做回歸

系數(shù).

?是為了區(qū)分丫的實際值y,當(dāng)x取值片時,變量丫的相應(yīng)觀察值為y,而直線上對應(yīng)于x,

的縱坐標(biāo)是y;=a+bx;.

設(shè)的一組觀察值為(乙,%),i=l,2,,n,且回歸直線方程為》=。+法,

當(dāng)x取值.時,丫的相應(yīng)觀察值為%,差%-洶=1,2,,〃)刻畫了實際觀察值y與回歸

直線上相應(yīng)點的縱坐標(biāo)之間的偏離程度,稱這些值為離差.

我們希望這"個離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點.

記Q=f(%-〃一次,)2,回歸直線就是所有直線中。取最小值的那條.

i=\

這種使“離差平方和為最小”的方法,叫做最小二乘法.

用最小二乘法求回歸系數(shù)4,6有如下的公式:

刃=嚀---------a=y-bx,其中a"上方加“人”,表示是由觀察值按最小二乘法求得的

f*:一戒2

1=1

回歸系數(shù).

3.線性回歸模型:將用于估計y值的線性函數(shù)a+反作為確定性函數(shù);y的實際值與估計

值之間的誤差記為£,稱之為隨機誤差;將y=a+反+£稱為線性回歸模型.

產(chǎn)生隨機誤差的主要原因有:

①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;

②忽略了某些因素的影響,通常這些影響都比較??;

③由于測量工具等原因,存在觀測誤差.

4.線性回歸系數(shù)的最佳估計值:

利用最小二乘法可以得到33的計算公式為

b

=-^—;,------------------=-r---------------a=y-bx,其中》=一之七,>=一£%

i=lj=l

由此得到的直線3=G+6x就稱為回歸直線,此直線方程即為線性回歸方程.其中6,b6

別為a,b的估計值,&稱為回歸截距,6稱為回歸系數(shù),》稱為回歸值.

5.相關(guān)系數(shù):

E(七-x)(%-y)zX*-nxy

,=2=/I

J.、一,J(—x:一心)2)(汽才一"(yf)

Vi=lJ=IV/=1i=l

6.相關(guān)系數(shù)「的性質(zhì):

⑴|r|Wl;

⑵|川越接近于1,x,y的線性相關(guān)程度越強;

⑶|川越接近于0,x,y的線性相關(guān)程度越弱.

可見,一條回歸直線有多大的預(yù)測功能,和變量間的相關(guān)系數(shù)密切相關(guān).

7.轉(zhuǎn)化思想:

根據(jù)專業(yè)知識或散點圖,對某些特殊的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)

化為線性回歸方程,從而確定未知參數(shù).

8.一些備案

①回歸(regression)一詞的來歷:“回歸”這個詞英國統(tǒng)計學(xué)家FrancilsGalton提出來的.1889

年,他在研究祖先與后代的身高之間的關(guān)系時發(fā)現(xiàn),身材較高的父母,他們的孩子也較高,

但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,

但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近

的趨勢稱為“回歸現(xiàn)象”.后來,人們把由一個變量的變化去推測另一個變量的變化的方法稱

為回歸分析.

②回歸系數(shù)的推導(dǎo)過程:

Q=ZKy--如]2=Zy;-2azy.+〃“2-2/?ZX/+匕+/Zx;

=na2+2asz苦-ZX)+〃Z考一2Z,E+EE,

把上式看成a的二次函數(shù),/的系數(shù)〃>0,

因此當(dāng)a=-2(/£-£上)=EX-£時取最小值.

2nn

同理,把。的展開式按6的降基排列,看成6的二次函數(shù),當(dāng)匕=時取最小值.

Z(%-君(%一歹)

解得:6=勺-------a=y-bx,

2%_君2

汽X”版2

1=1

其中歹=1〉;%,元,是樣本平均數(shù).

nn

9.對相關(guān)系數(shù)r進行相關(guān)性檢驗的步驟:

①提出統(tǒng)計假設(shè)”。:變量x,y不具有線性相關(guān)關(guān)系;

②如果以95%的把握作出推斷,那么可以根據(jù)1-0.95=0.05與〃-2(“是樣本容量)在相

關(guān)性檢驗的臨界值表中查出一個r的臨界值4.05(其中「0.95=0.05稱為檢驗水平);

③計算樣本相關(guān)系數(shù).

④作出統(tǒng)計推斷:若1川>%。5,則否定表明有95%的把握認為變量y與x之間具有線

性相關(guān)關(guān)系;若IrlW^os,則沒有理由拒絕“。,即就目前數(shù)據(jù)而言,沒有充分理由認為變

量y與X之間具有線性相關(guān)關(guān)系.

說明:

⑴對相關(guān)系數(shù)r進行顯著性檢驗,一般取檢驗水平a=0.05,即可靠程度為95%.

⑵這里的,?指的是線性相關(guān)系數(shù),;■的絕對值很小,只是說明線性相關(guān)程度低,不一定不相

關(guān),可能是非線性相關(guān)的某種關(guān)系.

⑶這里的r是對抽樣數(shù)據(jù)而言的.有時即使|川=1,兩者也不一定是線性相關(guān)的.故在統(tǒng)計

分析時,不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實際情況進行合理解釋.

且tM唯典例分析

板塊一隨機抽樣

【例1】為了了解參加運動會的2000名運動員的年齡情況,從中抽取100名運動員;就

這個問題,下列說法中正確的有()個

①2000名運動員是總體;

②每個運動員是個體;

③所抽取的100名運動員是一個樣本;

④樣本容量為100;

⑤這個抽樣方法可采用按年齡進行分層抽樣;

⑥每個運動員被抽到的概率相等

A.1B.2C.3D.4

【難度】(4)

【解析】B:

2000名運動員的年齡是總體,抽取的100名運動員的年齡是一個樣本,只有④⑥

正確.

【例2】(1)某社區(qū)有400戶家庭,其中高收入家庭25戶,中收入家庭280戶,低收入

家庭95戶,為了了解社會購買力的某項指標(biāo),要從中抽取一個容量為100的樣

本;

⑵從10名職工中抽取3名參加座談會;

⑶一個年級有10個班,每個班有50名同學(xué),隨機編為1至50號,為了了解他

們的學(xué)習(xí)情況,要求每個班的30號同學(xué)留下來進行問卷調(diào)查.

以上問題各對應(yīng)哪種隨機抽樣方法?

【難度】(4)

【解析】⑴分層抽樣;⑵簡單隨機抽樣;⑶系統(tǒng)抽樣.

【例3】采用系統(tǒng)抽樣法,從121人中抽取一個容量為12人的樣本,寫出抽樣的步驟,

并求每人被抽取的機率.

【難度】(4)

【解析】抽樣步驟:

因12不能整除121,故先隨機剔除一個人,將余下的人從1~120進行編號,在

1~10中用抽簽法抽出k號(1WZW10),然后依次順序抽取

\0+k,20+k,,110+左,得到一個12人的樣本.

被抽取的機率:系統(tǒng)抽樣無論有無剔除都是等機率抽樣,因為被剔除的機率也

是相同的,故被抽取的機率為12*.

121

【例4】用系統(tǒng)抽樣法要從160名學(xué)生中抽取容量為20的樣本,將160名學(xué)生隨機地

從1?160編號,按編號順序平均分成20組(1~8號,9~16號,…,153-160

號),若第16組抽出的號碼為126,則第1組中用抽簽的方法確定的號碼是

【難度】(2)

【解析】不妨設(shè)在第1組中隨機抽到的號碼為x,則在第16組中應(yīng)抽出的號碼為120+x.

設(shè)第1組抽出的號碼為x,則第16組應(yīng)抽出的號碼是8xl5+x=126,二x=6.

【例5】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個容量為

〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個體;如果樣本

容量增加1個,則在采用系統(tǒng)抽樣時,需要在總體中先剔除1個個體,則樣本容

量為.

【難度】(6)

【解析】6;

總體容量N=36(人),

當(dāng)樣本容量為〃時,系統(tǒng)抽樣間隔為死eN*.

n

分層抽樣的抽樣比為二,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為2,烏,4,

36632

所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.

35

當(dāng)樣本容量為〃+1時,總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-EN*,

n+l

所以〃只能是6.

【例6】一個總體中有100個個體,隨機編號0,1,2,99,依編號順序平均分成

10個小組,組號依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量

為10的樣本,規(guī)定如果在第1組隨機抽取的號碼為機,那么在第%組中抽取的

號碼個位數(shù)字與m+左的個位數(shù)字相同,若機=6,則在第7組中抽取的號碼

是.

【難度】(4)

【解析】63;第/組的號碼為(無-1)*10,依-1)*10+1,…,(4-1)*10+9,當(dāng)機=6時,

第k組抽取的號的個位數(shù)字為加+女的個位數(shù)字,所以第7組中抽取的號碼的個

位數(shù)字為3,所以抽取號碼為63.

【例7】(北京市西城區(qū)2009年4月高三一模抽樣測試)

某單位有27名老年人,54名中年人,81名青年人.為了調(diào)查他們的身體情況,

用分層抽樣的方法從他們中抽取了"個人進行體檢,其中有6名老年人,那么

n=.

【難度】(2)

【解析】由比例可得抽取的中年職工共有12人,青年職工共有18人,于是

/?=6+12+18=36o

【例8】(2009湖南)

一個總體分為A,8兩層,其個體數(shù)之比為4:1,用分層抽樣方法從總體中抽取

一個容量為10的樣本,已知8層中甲、乙都被抽到的概率為-L,則總體中的

28

個體數(shù)為.

【難度】(4)

【解析】由條件易知B層中抽取的樣本數(shù)是2,設(shè)8層總體數(shù)是〃,則又由B層中甲、

乙都被抽到的概率是與=,可解得〃=8,所以總體中的個體數(shù)是

C28

4x8+8=40.

【例9】(05年湖南)某工廠生產(chǎn)了某種產(chǎn)品16800件,它們來自甲、乙、丙三條生產(chǎn)

線.為檢查產(chǎn)品的質(zhì)量,決定采用分層抽樣法進行抽樣.已知甲、乙、丙三條

生產(chǎn)線抽取的個數(shù)成等差數(shù)列,則乙生產(chǎn)了件產(chǎn)品.

【難度】(4)

【解析】根據(jù)分層抽樣的抽樣比相等知:甲、乙、丙三條生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量比等于

抽取的樣品容量比.

又這三條生產(chǎn)線抽取的產(chǎn)品個數(shù)成等差數(shù)列,根據(jù)等差數(shù)列的性質(zhì)知,它們生產(chǎn)的

產(chǎn)品也成等差數(shù)列.

又乙生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量為甲、丙的等差中項,且和為16800,

故乙生產(chǎn)的產(chǎn)品數(shù)量為:度也=5600件.

3

【例10】某單位有工程師6人,技術(shù)員12人,技工18人,要從這些人中抽取一個容量為

〃的樣本;如果采用系統(tǒng)抽樣和分層抽樣方法抽取,不用剔除個體;如果樣本

容量增加1個,則在采用系統(tǒng)抽樣時,需要在總體中先剔除1個個體,則樣本容

量為.

【難度】(4)

【解析】總體容量N=36(人),

當(dāng)樣本容量為〃時,系統(tǒng)抽樣間隔為地eN*.

n

分層抽樣的抽樣比為2,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為4,3巳,

36632

所以〃應(yīng)是6的倍數(shù),36的約數(shù),即〃=6,12,18.

當(dāng)樣本容量為〃+1時,總體中先剔除1人,還有35人,系統(tǒng)抽樣間隔為3-£N*,

n+\

所以〃只能是6.

【例11】(2008廣東19)

某初級中學(xué)共有學(xué)生2000名,各年級男、女生人數(shù)如下表:

初一年級初二年級初三年級

女生373Xy

男生377370Z

已知在全校學(xué)生中隨機抽取1名,抽到初二年級女生的概率是0.19.

⑴求x的值;

⑵現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,問應(yīng)在初三年級抽取多少名?

(3)已知y,245,z2245,求初三年級中女生比男生多的概率.

【難度】(8)

【解析】=0.19,Ax=380;

2000

⑵初三年級人數(shù)為y+z=2000-(373+377+380+370)=500,

現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生,

48

應(yīng)在初三年級抽取的人數(shù)為:--x500=12名.

2000

(3)設(shè)初三年級女生比男生多的事件為A,初三年級女生男生數(shù)記為(y,z);

由⑵知y+z=500,且y,zeN,基本事件空間包含的基本事件有:(245,255)、

(246,254)、(247,253)、.…(255,245)共11個.

事件A包含的基本事件有:

(251,249)、(252,248)、(253,247)、(254,246)、(255,245),共5個.

P(A)=—.

II

板塊二頻率直方圖“莖葉圖

【例1】(2009湖北15)

下圖是樣本容量為200的頻率分布直方圖.

根據(jù)樣本的頻率分布直方圖估計,樣本數(shù)據(jù)落在[6,10)內(nèi)的頻數(shù)為,數(shù)據(jù)

落在[2,10)內(nèi)的概率約為.

【難度】(2)

【解析】64,0.4;

觀察直方圖易得頻數(shù)為200*0.08x4=64,頻率為(0.02+0.08)x4=0.4.

【例2】為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的

數(shù)量.產(chǎn)品數(shù)量的分組區(qū)間為[45,55),[55,65),[65,75),[75,85),[85,95)

由此得到頻率分布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量在[55,75)

的人數(shù)是

頻率,組距

0.040「I-----------1

0.035卜

0.030卜

0.025卜---

0.020[-----------

0.015卜

0.010[----------

5

°-°°1IIIII~~I一

°455565758595產(chǎn)品數(shù)量

【難度】

【解析】13;

20x(0.065x10)=13,故答案為13.

【例3】如圖為某樣本數(shù)據(jù)的頻率分布直方圖,則下列說法不正確的是()

A.[6,10)的頻率為0.32

B.若樣本容量為100,貝I][10,14)的頻數(shù)為40

C.若樣本容量為100,則(3,10]的頻數(shù)為40

D.由頻率分布布直方圖可得出結(jié)論:估計總體大約有10%分布在[10,14)

【難度】(4)

【解析】D;

口0,14)的頻率為0.1x4=0.4,因此估計總體大約有40%分布在[10,14).

【例4】為了讓學(xué)生了解環(huán)保知識,增強環(huán)保意識,某中學(xué)舉行了一次"環(huán)保知識競賽",共

有900名學(xué)生參加了這次競賽.為了解本次競賽成績情況,從中抽取了部分學(xué)生

的成績(得分均為整數(shù),滿分為100分)進行統(tǒng)計.請你根據(jù)尚未完成并有局部

污損的頻率分布表和頻數(shù)分布直方圖,解答下列問題:

(1)填充頻率分布表的空格(將答案直接填在表格內(nèi));

⑵補全頻數(shù)條形圖;

(3)若成績在75.5-85.5分的學(xué)生為二等獎,問獲得二等獎的學(xué)生約為多少人?

【難度】(6)

【解析】⑴

分組頻數(shù)頻率

50.5~60.540.08

60.5?70.580.16

70.5?80.5100.20

80.5?90.5160.32

90.5?100.5120.24

合計501.00

(3)成績在75.5?80.5分的學(xué)生占70.5?80.5分的學(xué)生的因為成績在

10

70.5?80.5分的學(xué)生頻率為0.2,所以成績在76.5?80.5分的學(xué)生頻率為0.1,成績

在80.5?85.5分的學(xué)生占80.5?90.5分的學(xué)生的上,因為成績在80.5?90.5分的學(xué)

10

生頻率為0.30所以成績在80.5?85.5分的學(xué)生頻率為0.16,所以成績在

76.5?85.5分的學(xué)生頻率為0.26,由于有900名學(xué)生參加了這次競賽,所以該校獲

得二等獎的學(xué)生約為0.26x900=234(人)

【例5】右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,

甲乙

5315

368245

47932678

1457

則甲、乙兩人這幾場比賽得分的中位數(shù)之和是()

A.62B.63C.64D.65

【難度】(4)

【解析】C;28+36=64.

【例6】(2009年福建12)

某校開展"愛我海西、愛我家鄉(xiāng)”攝影比賽,9位

評委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示,記

分員在去掉一個最高分和一個最低分后,算得平:;714

均分為91,復(fù)核員在復(fù)核時,發(fā)現(xiàn)有一個數(shù)字(莖

葉圖中的x)無法看清.若記分員計算無誤,則數(shù)字x應(yīng)該是.

【難度】(6)

【解析】1:

由莖葉圖可知所有評分為:88,89,89,92,93,9%,92,91,94,若x>4,去掉9x,

易知剩下的數(shù)的平均數(shù)大于91;故94為最高分,去掉88與94后,有

89+891-92-95?)+9=1>,解得x=l.

【例7】某班甲、乙兩學(xué)生的高考備考成績?nèi)缦拢?/p>

甲:512554528549536556534541522538

乙:515558521543532559536548527531

⑴用莖葉圖表示兩學(xué)生的成績;

⑵分別求兩學(xué)生成績的中位數(shù)和平均分.

【難度】(4)

【解析】⑴兩學(xué)生成績績的莖葉圖如右所示

甲乙

2515

285217

84653261

195438

645589

⑵將甲、乙兩學(xué)生的成績從小到大排列為:

甲:512522528534536538541549554556,

乙:515521527531532536543548558559.

從以上排列可知甲學(xué)生成績的中位數(shù)為空上空=537,

2

乙學(xué)生成績的中位數(shù)為衛(wèi)注=534.

2

甲學(xué)生成績的平均數(shù)為:

9、12+22+28+34+36+38+41+49+54+56

500+--------------------------------------=537,

10

乙學(xué)生成績的平均數(shù)為:

…15+21+27+31+32+36+43+48+58+59―

500+--------------------------------------=537.

10

【例8】某電腦雜志的一篇文章中,每個句子的字?jǐn)?shù)如下:

10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17

翥報紙的一篇文章中,每個句子所含的字?jǐn)?shù)如下:

27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22

⑴將兩組數(shù)據(jù)用莖葉圖表示;

⑵比較分析,能得到什么結(jié)論?

【難度】(4)

【解析】⑴莖葉圖如右.

電腦雜志報紙文章

9877554102389

8777654432022347778

612233569

116

⑵電腦雜志上每個句子的字?jǐn)?shù)集中在10~30之間,中位數(shù)為23;而報紙上每個句

子的字?jǐn)?shù)集中在20~40之間,中位數(shù)為28.電腦雜志上每個句子的平均字?jǐn)?shù)比報

紙上的平均字?jǐn)?shù)

要少.說明電腦雜志作為科普讀物需要簡明.

板塊三數(shù)字特征,獨立及回歸

【例1】已知一組數(shù)據(jù)孑,々,,指的方差是2,

且(占-3)2+(%-3)2++(/-3)2=380,則這組數(shù)據(jù)的平均數(shù)x=

【難度】(2)

【解析】9或-3;

依題設(shè)有(.一.)-+(吃X)-++(X|()x)2=2展開變形得

10

(X:+A?2++x3)+1Ox~—2x(X]+/++芯0)=20........

同樣的,(%—3)2+(專一3)2++(4)-3)2=380,展開變形得

(x[+x;++X[:))+10x9—6?(X]+X,++XJQ)=380.......(2)

②一①并化簡得了2—6元-27=0.解得了=一3或元=9.

【例2】求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到0.1),并分析由這些結(jié)果可得出什么更

一般的結(jié)論.

(1)123456789;

(2)111213141516171819;

(3)24681012141618

【難度】(4)

【解析】(1)工=」(1+2++9)=5,

9

22222

5(=^(1+2++9-9x5)=y?6.7,M=楞弓2.6;

(2)=-(11+12++19)=15

-9

I20

22

]_15)2+(I2-15)++(19-15)]=y-6.7,

52=-^y-2-6:

(3)^=-(2+4++18)=10

,1,,80

s;=-[(2-10)*+(4-10)92++(18-10)2]=丁26.7,

一組數(shù)都加上相同的數(shù)后,方差不變,都乘以相同的倍數(shù)〃后,標(biāo)準(zhǔn)差變?yōu)樵瓉淼?/p>

"倍,方差變?yōu)樵瓉淼摹?倍.即X,,々,,毛的方差為S,,則

%+a,/。,,X”+a的方差仍為/,

22

nxt,nx2,,町,的方差為ns.

【例3】(2009上海18)

在發(fā)生某公共衛(wèi)生事件期間,有專業(yè)機構(gòu)認為該事件在一段時間內(nèi)沒有發(fā)生大規(guī)模

群體感染的標(biāo)志為"連續(xù)10天,每天新增疑似病例不超過7人”.根據(jù)過去10天甲、

乙、丙、丁四地新增疑似病例數(shù)據(jù),一定符合該標(biāo)志的是()

A.甲地:總體均為3,中位數(shù)為4B.乙地:總體均值為1,總體方差大于0

C.丙地:中位數(shù)為2,眾數(shù)為3D.丁地:總體均值為2,總體方差為3

【難度】⑷

【解析】D;

根據(jù)信息可知,連續(xù)10天內(nèi),每天的新增疑似病例不能有超過7的數(shù),選項A中,

中位數(shù)為4,可能存在大于7的數(shù);

同理,在選項C中也有可能;

選項B中,如果某天數(shù)據(jù)為10,其余9天為0,則不符合標(biāo)志:

選項D中,根據(jù)公式,若有大于7的數(shù)存在,則方差至少為:[(8-2『+]》3.6.

【例4】(2008上海9)

已知總體的各個體的值由小到大依次為2,3,3,7,4,6,12,13.7,18.3,20,且總

體的中位數(shù)為10.5,若要使該總體的方差最小,則〃、〃的取值分別是.

【難度】(6)

【解析】10.5,10.5:

絲2=10.5=a+/j=21,要使方差最小,只需(a—10.5)2+3—10.5)2最小,當(dāng)且

2

僅當(dāng)片+加最小,顯然當(dāng).=《=10.5時取到最小值.

【例5】對變量X與丫的卡方統(tǒng)計量/的值,說法正確的是()

A./越大,"X與y有關(guān)系”可信程度越??;

B./越小,"X與y有關(guān)系,,可信程度越小;

C./越接近0,,,x與y無關(guān)"程度越小;

D./越大,,,x與y無關(guān)"程度越大.

【難度】⑵

【解析】B

【例6】某高校食堂隨機調(diào)查了一些學(xué)生是否因距離遠近而選擇食堂就餐的情況,經(jīng)計算得

至IJ/=4.932.所以判定距離遠近與選擇食堂有關(guān)系,那么這種判斷出錯的可能性

為多少?

【難度】(2)

【解析】因為力223.841,所以出錯的可能性為5%.

【例7】下表中給出了某周內(nèi)中學(xué)生是否喝過酒的隨機調(diào)查結(jié)果,若要使結(jié)論的可靠性不低

于95%,根據(jù)所調(diào)查的數(shù)據(jù),能否作出該周內(nèi)中學(xué)生是否喝過酒與性別有關(guān)的結(jié)

論?

喝過酒沒喝過酒總計

男77404481

16122138

93526619

【難度】(4)

【解析】提出假設(shè)”。:該周內(nèi)中學(xué)生是否喝過酒與性別無關(guān).

由列聯(lián)表中的數(shù)據(jù),算出力、1.6366,

當(dāng)b°成立時,/23.841的概率約為0.05,而這里/=1.6366<3.841,

所以,不能推斷出喝酒與性別有關(guān)的結(jié)論.

【例8】為研究不同的給藥方式(口服或注射)和藥的效果(有效與無效)是否有關(guān),進行

了相應(yīng)的抽樣調(diào)查,調(diào)查結(jié)果如表所示.根據(jù)所選擇的193個病人的數(shù)據(jù),能否

作出藥的效果與給藥方式有關(guān)的結(jié)論?

有效無效合計

口服584098

注射643195

合計12271193

【難度】(4)

5864

【解析】在口服的病人中,有一*59%的人有效;在注射的病人中,有上*67%的人有

9895

效.從直觀上來看,口服與注射的病人的用藥效果的有效率有一定的差異,能否認

為用藥效果與用藥方式一定有關(guān)呢?下面用獨立性檢臉的方法加以說明.

提出假設(shè)“0:藥的效果與給藥方式?jīng)]有關(guān)系.由列聯(lián)表中的數(shù)據(jù),算出

2=193x(58x31-40*64)2。j38%查表有尸(222.072)=0.15.

122x71x98x95

當(dāng)兒成立時,/2I.3896的概率大于15%,這個概率比較大,所以根據(jù)目前的

調(diào)查數(shù)據(jù),不能否定假設(shè)H。,即不能作出藥的效果與給藥方式有關(guān)的結(jié)論.

點評:如果觀測值/2W2.706,那么就認為沒有充分的證據(jù)顯示兩個分類變量有

關(guān)系,但也不能作出結(jié)論"兒成立",即兩個變量沒有關(guān)系.

【例9】(2009遼寧20)

某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在

[29.9430.0*的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中個抽出500件,量其內(nèi)

徑尺寸,的結(jié)果如下表:

甲廠:

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)12638618292614

乙廠:

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)297185159766218

⑴試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;

⑵由于以上統(tǒng)計數(shù)據(jù)填下面2x2列聯(lián)表,并問是否有99%的把握認為"兩個分廠生

產(chǎn)的零件的質(zhì)量有差異”.

甲廠乙廠合計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論