高考數(shù)學(xué)講義統(tǒng)計參考教案

上傳人：追*** IP屬地：河北上傳時間：2024-08-13 格式：PDF 頁數(shù)：19 大小：2.95MB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計

捱高考要求

要求

重難點

層次

簡單隨機抽樣B（1）隨機抽樣

①理解隨機抽樣的必要性和重要性.

隨機抽樣分層抽樣和

A@會用簡單隨機抽樣方法從總體中抽取

系統(tǒng)抽樣樣本；了解分層抽樣和系統(tǒng)抽樣方法

頻率分布表，（2）總體估計

直方圖、①了解分布的意義和作用，

折線圖、會列頻率分布表，

會畫頻率分布直方圖、

莖葉圖

頻率折線圖、

樣本數(shù)據(jù)的基本的數(shù)

莖葉圖，

用樣本估字特征（如平均數(shù)、標(biāo)B理解它們各自的特點.

計總體準(zhǔn)差）（2）理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用，

用樣本的頻率分布估會計算數(shù)據(jù)標(biāo)準(zhǔn)差.

計總體分布，（3）能從樣本數(shù)據(jù)中提取基本的數(shù)字特征

用樣本的基本數(shù)字特C（如平均數(shù)、標(biāo)準(zhǔn)差），并作出合理的解釋.

④會用樣本的頻率分布估計總體分布，

征估計總體的基本數(shù)

會用樣本的基本數(shù)字特征估計總體的基本

字特征

數(shù)字特征，理解用樣本估計總體的思想.

⑤會用隨機抽樣的基本方法和樣本估計

總體的思想解決一些簡單的實際問題.

（2）變量的相關(guān)性

變量的相①會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點

線性回歸方程B

關(guān)性圖，會利用散點圖認識變量間的相關(guān)關(guān)系.

②了解最小二乘法的思想，能根據(jù)給出

的線性回歸方程系數(shù)公式建立線性回歸方

程.

目刨帽知識內(nèi)容

隨機抽樣

1.隨機抽樣：滿足每個個體被抽到的機會是均等的抽樣，共有三種經(jīng)常采用的隨機抽樣方

法：

⑴簡單隨機抽樣：從元素個數(shù)為N的總體中不放回地抽取容量為〃的樣本，如果每一次抽

取時總體中的各個個體有相同的可能性被抽到，這種抽樣方法叫做簡單隨機抽樣.

抽出辦法：①抽簽法：用紙片或小球分別標(biāo)號后抽簽的方法.

②隨機數(shù)表法：隨機數(shù)表是使用計算器或計算機的應(yīng)用程序生成隨機數(shù)的功能生成的一張

數(shù)表.表中每一位置出現(xiàn)各個數(shù)字的可能性相同.

隨機數(shù)表法是對樣本進行編號后，按照一定的規(guī)律從隨機數(shù)表中讀數(shù)，并取出相應(yīng)的樣本的

方法.

簡單隨機抽樣是最簡單、最基本的抽樣方法.

⑵系統(tǒng)抽樣：將總體分成均衡的若干部分，然后按照預(yù)先制定的規(guī)則，從每一部分抽取一個

個體，得到所需要的樣本的抽樣方法.

抽出辦法：從元素個數(shù)為N的總體中抽取容量為，，的樣本，如果總體容量能被樣本容量整

除，設(shè)《=多，先對總體進行編號，號碼從1到N,再從數(shù)字1到4中隨機抽取一個數(shù)s作

為起始數(shù)，然后順次抽取第s+A,s+2A,,s+(〃-1火個數(shù)，這樣就得到容量為〃的樣

本.如果總體容量不能被樣本容量整除，可隨機地從總體中剔除余數(shù)，然后再按系統(tǒng)抽樣

方法進行抽樣.

系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查，由于抽樣間隔相等，又被稱為等距抽樣.

⑶分層抽樣：當(dāng)總體有明顯差別的幾部分組成時，要反映總體情況，常采用分層抽樣，使

總體中各個個體按某種特征分成若干個互不重疊的幾部分，每一部分叫做層，在各層中按

層在總體中所占比例進行簡單隨機抽樣，這種抽樣方法叫做分層抽樣.

分層抽樣的樣本具有較強的代表性，而且各層抽樣時，可靈活選用不同的抽樣方法，

應(yīng)用廣泛.

2.簡單隨機抽樣必須具備下列特點：

⑴簡單隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的.

⑵簡單隨機樣本數(shù)〃小于等于樣本總體的個數(shù)N.

⑶簡單隨機樣本是從總體中逐個抽取的.

⑷簡單隨機抽樣是一種不放回的抽樣.

⑸簡單隨機抽樣的每個個體入樣的可能性均為金.

3.系統(tǒng)抽樣時，當(dāng)總體個數(shù)N恰好是樣本容量”的整數(shù)倍時，取k=電；

若四不是整數(shù)時，先從總體中隨機地剔除凡個個體，使得總體中剩余的個體數(shù)能被樣本容

量〃整除.因為每個個體被剔除的機會相等，因而整個抽樣過程中每個個體被抽取的機會仍

然相等，為上.

—.頻率直方圖

列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟：

①計算極差：找出數(shù)據(jù)的最大值與最小值，計算它們的差；

②決定組距與組數(shù)：取組距，用黑決定組數(shù)；

組距

③決定分點：決定起點，進行分組；

④列頻率分布直方圖：對落入各小組的數(shù)據(jù)累計，算出各小數(shù)的頻數(shù)，除以樣本容量，得

到各小組的頻率.

頻率

⑤繪制頻率分布直方圖：以數(shù)據(jù)的值為橫坐標(biāo)，以的值為縱坐標(biāo)繪制直方圖,

知小長方形的面積=組距x槃=頻率.

組距

頻率分布折線圖：將頻率分布直方圖各個長方形上邊的中點用線段連接起來，就得到頻率分

布折線圖，一般把折線圖畫成與橫軸相連，所以橫軸左右兩端點沒有實際意義.

總體密度曲線：樣本容量不斷增大時，所分組數(shù)不斷增加，分組的組距不斷縮小，頻率分布

直方圖可以用一條光滑曲線y=/(x)來描繪，這條光滑曲線就叫做總體密度曲線.總體密度

曲線精確地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律.

三.莖葉圖

制作莖葉圖的步驟：

①將數(shù)據(jù)分為“莖”、“葉”兩部分；

。將最大莖與最小莖之間的數(shù)字按大小順序排成一列，并畫上豎線作為分隔線;

國將各個數(shù)據(jù)的“葉”在分界線的一側(cè)對應(yīng)莖處同行列出.

四.統(tǒng)計數(shù)據(jù)的數(shù)字特征

用樣本平均數(shù)估計總體平均數(shù)；用樣本標(biāo)準(zhǔn)差估計總體標(biāo)準(zhǔn)差.

數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.

極差又叫全距，是一組數(shù)據(jù)的最大值和最小值之差，反映一組數(shù)據(jù)的變動幅度；

樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小，樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.

一般地，設(shè)樣本的元素為不，%,，毛樣本的平均數(shù)為元，

定義樣本方差為$2=(*—-+(*一下)、+(玉一,：,

樣本標(biāo)準(zhǔn)差S=仍一寸+小一無K++&"亙

簡化公式：s=—[(X,2+x^++x^)-rix].

五.獨立性檢驗

1.兩個變量之間的關(guān)系；

常見的有兩類：一類是確定性的函數(shù)關(guān)系；另一類是變量間存在關(guān)系，但又不具備函數(shù)關(guān)系

所要求的確定性，它們的關(guān)系是帶有一定隨機性的.當(dāng)一個變量取值一定時，另一個變量的

取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.

2.散點圖：將樣本中的〃個數(shù)據(jù)點(x,,y,)(i=l,2,,〃)描在平面直角坐標(biāo)系中，就得到

了散點圖.

散點窗形象地反映了各個數(shù)據(jù)的密切程度，根據(jù)散點圖的分布趨勢可以直觀地判斷分析兩個

變量的關(guān)系.

3.如果￡二個變量的值變大時，另一個變量的值也在變大，則這種相關(guān)稱為正相關(guān)；此時，

散點圖中的點在從左下角到右上角的區(qū)域.

反之，一個變量的值變大時，另一個變量的值由大變小，這種相關(guān)稱為負相關(guān).此時，散點

圖中的點在從左上角到右下角的區(qū)域.

散點圖可以判斷兩個變量之間有沒有相關(guān)關(guān)系.

4.統(tǒng)計假設(shè)：如果事件A與8獨立，這時應(yīng)該有P(A8)=P(A)P(8),用字母兒表示此式,

即40:尸(A3)=尸(A)尸(B),稱之為統(tǒng)計假設(shè).

5.讀作“卡方”)統(tǒng)計量：

統(tǒng)計學(xué)中有一個非常有用的統(tǒng)計量，它的表達式為個=，用它的大小可以

〃|+%+W+2

用來決定是否拒絕原來的統(tǒng)計假設(shè)如果力2的值較大，就拒絕“。，即認為A與B是有

關(guān)的.

力2統(tǒng)計量的兩個臨界值：3.841、6.635；當(dāng)％?>3.841時，有95%的把握說事件A與8有

關(guān)；當(dāng)/>6.635時，有99%的把握說事件A與8有關(guān)；當(dāng)/W3.841時，認為事件A與8

是無關(guān)的.

獨立性檢驗的基本思想與反證法類似，由結(jié)論不成立時推出有利于結(jié)論成立的小概率事件發(fā)

生，而小概率事件在一次試驗中通常是不會發(fā)生的，所以認為結(jié)論在很大程度上是成立的.

1.獨立性檢驗的步驟：統(tǒng)計假設(shè)：Hn；列出2x2聯(lián)表；計算/統(tǒng)計量；查對臨界值表，

作出判斷.

2.幾個臨界值：P（x222.706）=0.10,P（%2>3.841）?0.05,P（*與6.635）=0.01.

2x2聯(lián)表的獨立性檢驗：

如果對于某個群體有兩種狀態(tài)，對于每種狀態(tài)又有兩個情況，這樣排成一張2x2的表，如

下：

狀態(tài)3狀態(tài)看合計

狀態(tài)A%

狀態(tài)入n2\〃224+

%〃+2n

如果有調(diào)查得來的四個數(shù)據(jù)孫，與，嗎?,n22.并希望根據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種

狀態(tài)A與8是否有關(guān)，就稱之為2x2聯(lián)表屆獨立性檢驗.

六.回歸分析

1.回歸分析：對于具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析，即回歸分

析就是尋找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.

回歸直線：如果散點圖中的各點都大致分布在一條直線附近，就稱這兩個變量之間具有線性

相關(guān)關(guān)系，這條直線叫做回歸直線.

2.最小二乘法：

記回歸直線方程為：y=a+bx,稱為變量丫對變量x的回歸直線方程，其中。"叫做回歸

系數(shù).

?是為了區(qū)分丫的實際值y,當(dāng)x取值片時，變量丫的相應(yīng)觀察值為y,而直線上對應(yīng)于x,

的縱坐標(biāo)是y；=a+bx；.

設(shè)的一組觀察值為（乙，%），i=l,2,,n,且回歸直線方程為》=。+法，

當(dāng)x取值.時，丫的相應(yīng)觀察值為%,差%-洶=1,2,,〃）刻畫了實際觀察值y與回歸

直線上相應(yīng)點的縱坐標(biāo)之間的偏離程度，稱這些值為離差.

我們希望這"個離差構(gòu)成的總離差越小越好，這樣才能使所找的直線很貼近已知點.

記Q=f（%-〃一次,）2，回歸直線就是所有直線中。取最小值的那條.

i=\

這種使“離差平方和為最小”的方法，叫做最小二乘法.

用最小二乘法求回歸系數(shù)4,6有如下的公式：

刃=嚀---------a=y-bx,其中a"上方加“人”，表示是由觀察值按最小二乘法求得的

f*：一戒2

1=1

回歸系數(shù).

3.線性回歸模型：將用于估計y值的線性函數(shù)a+反作為確定性函數(shù)；y的實際值與估計

值之間的誤差記為￡,稱之為隨機誤差；將y=a+反+￡稱為線性回歸模型.

產(chǎn)生隨機誤差的主要原因有：

①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差；

②忽略了某些因素的影響，通常這些影響都比較??；

③由于測量工具等原因，存在觀測誤差.

4.線性回歸系數(shù)的最佳估計值：

利用最小二乘法可以得到33的計算公式為

=-^—；,------------------=-r---------------a=y-bx,其中》=一之七，＞=一￡%

i=lj=l

由此得到的直線3=G+6x就稱為回歸直線，此直線方程即為線性回歸方程.其中6,b6

別為a,b的估計值，&稱為回歸截距，6稱為回歸系數(shù)，》稱為回歸值.

5.相關(guān)系數(shù)：

E（七-x）（%-y）zX*-nxy

,=2=/I

J.、一，J（—x：一心）2）（汽才一"（yf）

Vi=lJ=IV/=1i=l

6.相關(guān)系數(shù)「的性質(zhì)：

⑴|r|Wl；

⑵|川越接近于1,x,y的線性相關(guān)程度越強；

⑶|川越接近于0,x,y的線性相關(guān)程度越弱.

可見，一條回歸直線有多大的預(yù)測功能，和變量間的相關(guān)系數(shù)密切相關(guān).

7.轉(zhuǎn)化思想：

根據(jù)專業(yè)知識或散點圖，對某些特殊的非線性關(guān)系，選擇適當(dāng)?shù)淖兞看鷵Q，把非線性方程轉(zhuǎn)

化為線性回歸方程，從而確定未知參數(shù).

8.一些備案

①回歸（regression）一詞的來歷：“回歸”這個詞英國統(tǒng)計學(xué)家FrancilsGalton提出來的.1889

年，他在研究祖先與后代的身高之間的關(guān)系時發(fā)現(xiàn)，身材較高的父母，他們的孩子也較高，

但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,

但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近

的趨勢稱為“回歸現(xiàn)象”.后來，人們把由一個變量的變化去推測另一個變量的變化的方法稱

為回歸分析.

②回歸系數(shù)的推導(dǎo)過程：

Q=ZKy--如］2=Zy；-2azy.+〃“2-2/?ZX/+匕+/Zx；

=na2+2asz苦-ZX）+〃Z考一2Z,E+EE,

把上式看成a的二次函數(shù)，/的系數(shù)〃＞0,

因此當(dāng)a=-2（/￡-￡上）=EX-￡時取最小值.

2nn

同理，把。的展開式按6的降基排列，看成6的二次函數(shù)，當(dāng)匕=時取最小值.

Z（%-君（％一歹）

解得：6=勺-------a=y-bx，

2%_君2

汽X”版2

1=1

其中歹=1〉;%,元，是樣本平均數(shù).

9.對相關(guān)系數(shù)r進行相關(guān)性檢驗的步驟：

①提出統(tǒng)計假設(shè)”。：變量x,y不具有線性相關(guān)關(guān)系；

②如果以95%的把握作出推斷，那么可以根據(jù)1-0.95=0.05與〃-2（“是樣本容量）在相

關(guān)性檢驗的臨界值表中查出一個r的臨界值4.05（其中「0.95=0.05稱為檢驗水平）；

③計算樣本相關(guān)系數(shù).

④作出統(tǒng)計推斷：若1川＞%。5,則否定表明有95%的把握認為變量y與x之間具有線

性相關(guān)關(guān)系；若IrlW^os，則沒有理由拒絕“。，即就目前數(shù)據(jù)而言，沒有充分理由認為變

量y與X之間具有線性相關(guān)關(guān)系.

說明：

⑴對相關(guān)系數(shù)r進行顯著性檢驗，一般取檢驗水平a=0.05,即可靠程度為95%.

⑵這里的，?指的是線性相關(guān)系數(shù)，;■的絕對值很小，只是說明線性相關(guān)程度低，不一定不相

關(guān)，可能是非線性相關(guān)的某種關(guān)系.

⑶這里的r是對抽樣數(shù)據(jù)而言的.有時即使|川=1，兩者也不一定是線性相關(guān)的.故在統(tǒng)計

分析時，不能就數(shù)據(jù)論數(shù)據(jù)，要結(jié)合實際情況進行合理解釋.

且tM唯典例分析

板塊一隨機抽樣

【例1】為了了解參加運動會的2000名運動員的年齡情況，從中抽取100名運動員；就

這個問題，下列說法中正確的有()個

①2000名運動員是總體；

②每個運動員是個體；

③所抽取的100名運動員是一個樣本；

④樣本容量為100;

⑤這個抽樣方法可采用按年齡進行分層抽樣；

⑥每個運動員被抽到的概率相等

A.1B.2C.3D.4

【難度】(4)

【解析】B:

2000名運動員的年齡是總體，抽取的100名運動員的年齡是一個樣本，只有④⑥

正確.

【例2】(1)某社區(qū)有400戶家庭，其中高收入家庭25戶，中收入家庭280戶，低收入

家庭95戶，為了了解社會購買力的某項指標(biāo)，要從中抽取一個容量為100的樣

本；

⑵從10名職工中抽取3名參加座談會；

⑶一個年級有10個班，每個班有50名同學(xué)，隨機編為1至50號，為了了解他

們的學(xué)習(xí)情況，要求每個班的30號同學(xué)留下來進行問卷調(diào)查.

以上問題各對應(yīng)哪種隨機抽樣方法？

【難度】(4)

【解析】⑴分層抽樣；⑵簡單隨機抽樣；⑶系統(tǒng)抽樣.

【例3】采用系統(tǒng)抽樣法，從121人中抽取一個容量為12人的樣本，寫出抽樣的步驟，

并求每人被抽取的機率.

【難度】(4)

【解析】抽樣步驟：

因12不能整除121,故先隨機剔除一個人，將余下的人從1~120進行編號，在

1~10中用抽簽法抽出k號(1WZW10),然后依次順序抽取

\0+k,20+k,,110+左，得到一個12人的樣本.

被抽取的機率：系統(tǒng)抽樣無論有無剔除都是等機率抽樣，因為被剔除的機率也

是相同的，故被抽取的機率為12*.

121

【例4】用系統(tǒng)抽樣法要從160名學(xué)生中抽取容量為20的樣本，將160名學(xué)生隨機地

從1?160編號，按編號順序平均分成20組（1~8號,9~16號，…，153-160

號），若第16組抽出的號碼為126,則第1組中用抽簽的方法確定的號碼是

【難度】（2）

【解析】不妨設(shè)在第1組中隨機抽到的號碼為x,則在第16組中應(yīng)抽出的號碼為120+x.

設(shè)第1組抽出的號碼為x,則第16組應(yīng)抽出的號碼是8xl5+x=126,二x=6.

【例5】某單位有工程師6人，技術(shù)員12人，技工18人，要從這些人中抽取一個容量為

〃的樣本；如果采用系統(tǒng)抽樣和分層抽樣方法抽取，不用剔除個體；如果樣本

容量增加1個，則在采用系統(tǒng)抽樣時，需要在總體中先剔除1個個體，則樣本容

量為.

【難度】（6）

【解析】6;

總體容量N=36（人），

當(dāng)樣本容量為〃時，系統(tǒng)抽樣間隔為死eN*.

分層抽樣的抽樣比為二，求得工程師、技術(shù)員、技工的樣本人數(shù)分別為2,烏，4,

36632

所以〃應(yīng)是6的倍數(shù)，36的約數(shù)，即〃=6,12,18.

當(dāng)樣本容量為〃+1時，總體中先剔除1人，還有35人，系統(tǒng)抽樣間隔為3-EN*,

n+l

所以〃只能是6.

【例6】一個總體中有100個個體，隨機編號0,1,2,99,依編號順序平均分成

10個小組，組號依次為1,2,3,10.現(xiàn)用系統(tǒng)抽樣方法抽取一個容量

為10的樣本，規(guī)定如果在第1組隨機抽取的號碼為機，那么在第％組中抽取的

號碼個位數(shù)字與m+左的個位數(shù)字相同，若機=6,則在第7組中抽取的號碼

是.

【難度】（4）

【解析】63;第/組的號碼為（無-1）*10,依-1）*10+1,…,（4-1）*10+9,當(dāng)機=6時，

第k組抽取的號的個位數(shù)字為加+女的個位數(shù)字，所以第7組中抽取的號碼的個

位數(shù)字為3,所以抽取號碼為63.

【例7】（北京市西城區(qū)2009年4月高三一模抽樣測試）

某單位有27名老年人，54名中年人，81名青年人.為了調(diào)查他們的身體情況，

用分層抽樣的方法從他們中抽取了"個人進行體檢，其中有6名老年人，那么

n=.

【難度】（2）

【解析】由比例可得抽取的中年職工共有12人，青年職工共有18人，于是

/?=6+12+18=36o

【例8】（2009湖南）

一個總體分為A,8兩層，其個體數(shù)之比為4:1,用分層抽樣方法從總體中抽取

一個容量為10的樣本，已知8層中甲、乙都被抽到的概率為-L,則總體中的

個體數(shù)為.

【難度】（4）

【解析】由條件易知B層中抽取的樣本數(shù)是2,設(shè)8層總體數(shù)是〃，則又由B層中甲、

乙都被抽到的概率是與=,可解得〃=8,所以總體中的個體數(shù)是

C28

4x8+8=40.

【例9】（05年湖南）某工廠生產(chǎn)了某種產(chǎn)品16800件，它們來自甲、乙、丙三條生產(chǎn)

線.為檢查產(chǎn)品的質(zhì)量，決定采用分層抽樣法進行抽樣.已知甲、乙、丙三條

生產(chǎn)線抽取的個數(shù)成等差數(shù)列，則乙生產(chǎn)了件產(chǎn)品.

【難度】（4）

【解析】根據(jù)分層抽樣的抽樣比相等知：甲、乙、丙三條生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量比等于

抽取的樣品容量比.

又這三條生產(chǎn)線抽取的產(chǎn)品個數(shù)成等差數(shù)列，根據(jù)等差數(shù)列的性質(zhì)知，它們生產(chǎn)的

產(chǎn)品也成等差數(shù)列.

又乙生產(chǎn)線生產(chǎn)的產(chǎn)品數(shù)量為甲、丙的等差中項，且和為16800,

故乙生產(chǎn)的產(chǎn)品數(shù)量為：度也=5600件.

【例10】某單位有工程師6人，技術(shù)員12人，技工18人，要從這些人中抽取一個容量為

〃的樣本；如果采用系統(tǒng)抽樣和分層抽樣方法抽取，不用剔除個體；如果樣本

容量增加1個，則在采用系統(tǒng)抽樣時，需要在總體中先剔除1個個體，則樣本容

量為.

【難度】（4）

【解析】總體容量N=36（人），

當(dāng)樣本容量為〃時，系統(tǒng)抽樣間隔為地eN*.

分層抽樣的抽樣比為2,求得工程師、技術(shù)員、技工的樣本人數(shù)分別為4,3巳，

36632

所以〃應(yīng)是6的倍數(shù)，36的約數(shù)，即〃=6,12,18.

當(dāng)樣本容量為〃+1時，總體中先剔除1人，還有35人，系統(tǒng)抽樣間隔為3-￡N*,

n+\

所以〃只能是6.

【例11】（2008廣東19）

某初級中學(xué)共有學(xué)生2000名，各年級男、女生人數(shù)如下表:

初一年級初二年級初三年級

女生373Xy

男生377370Z

已知在全校學(xué)生中隨機抽取1名，抽到初二年級女生的概率是0.19.

⑴求x的值；

⑵現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生，問應(yīng)在初三年級抽取多少名？

（3）已知y，245,z2245,求初三年級中女生比男生多的概率.

【難度】（8）

【解析】=0.19,Ax=380;

2000

⑵初三年級人數(shù)為y+z=2000-（373+377+380+370）=500,

現(xiàn)用分層抽樣的方法在全校抽取48名學(xué)生，

應(yīng)在初三年級抽取的人數(shù)為：--x500=12名.

2000

（3）設(shè)初三年級女生比男生多的事件為A,初三年級女生男生數(shù)記為（y,z）;

由⑵知y+z=500,且y,zeN,基本事件空間包含的基本事件有：（245,255）、

（246,254）、（247,253）、.…（255,245）共11個.

事件A包含的基本事件有：

（251,249）、（252,248）、（253,247）、（254,246）、（255,245）,共5個.

P（A）=—.

板塊二頻率直方圖“莖葉圖

【例1】（2009湖北15）

下圖是樣本容量為200的頻率分布直方圖.

根據(jù)樣本的頻率分布直方圖估計，樣本數(shù)據(jù)落在[6,10）內(nèi)的頻數(shù)為,數(shù)據(jù)

落在[2,10）內(nèi)的概率約為.

【難度】（2）

【解析】64,0.4;

觀察直方圖易得頻數(shù)為200*0.08x4=64,頻率為（0.02+0.08）x4=0.4.

【例2】為了調(diào)查某廠工人生產(chǎn)某種產(chǎn)品的能力，隨機抽查了20位工人某天生產(chǎn)該產(chǎn)品的

數(shù)量.產(chǎn)品數(shù)量的分組區(qū)間為[45,55）,[55,65）,[65,75）,[75,85）,[85,95）

由此得到頻率分布直方圖如圖3,則這20名工人中一天生產(chǎn)該產(chǎn)品數(shù)量在[55,75）

的人數(shù)是

頻率，組距

0.040「I-----------1

0.035卜

0.030卜

0.025卜---

0.020[-----------

0.015卜

0.010[----------

°-°°1IIIII~~I一

°455565758595產(chǎn)品數(shù)量

【難度】

【解析】13；

20x(0.065x10)=13,故答案為13.

【例3】如圖為某樣本數(shù)據(jù)的頻率分布直方圖，則下列說法不正確的是（）

A.[6,10）的頻率為0.32

B.若樣本容量為100,貝I][10,14）的頻數(shù)為40

C.若樣本容量為100,則（3,10]的頻數(shù)為40

D.由頻率分布布直方圖可得出結(jié)論：估計總體大約有10%分布在[10,14）

【難度】（4）

【解析】D;

口0,14）的頻率為0.1x4=0.4,因此估計總體大約有40%分布在[10,14）.

【例4】為了讓學(xué)生了解環(huán)保知識，增強環(huán)保意識，某中學(xué)舉行了一次"環(huán)保知識競賽"，共

有900名學(xué)生參加了這次競賽.為了解本次競賽成績情況，從中抽取了部分學(xué)生

的成績（得分均為整數(shù)，滿分為100分）進行統(tǒng)計.請你根據(jù)尚未完成并有局部

污損的頻率分布表和頻數(shù)分布直方圖，解答下列問題：

（1）填充頻率分布表的空格（將答案直接填在表格內(nèi)）；

⑵補全頻數(shù)條形圖；

（3）若成績在75.5-85.5分的學(xué)生為二等獎，問獲得二等獎的學(xué)生約為多少人？

【難度】（6）

【解析】⑴

分組頻數(shù)頻率

50.5~60.540.08

60.5?70.580.16

70.5?80.5100.20

80.5?90.5160.32

90.5?100.5120.24

合計501.00

（3）成績在75.5?80.5分的學(xué)生占70.5?80.5分的學(xué)生的因為成績在

70.5?80.5分的學(xué)生頻率為0.2,所以成績在76.5?80.5分的學(xué)生頻率為0.1,成績

在80.5?85.5分的學(xué)生占80.5?90.5分的學(xué)生的上，因為成績在80.5?90.5分的學(xué)

生頻率為0.30所以成績在80.5?85.5分的學(xué)生頻率為0.16,所以成績在

76.5?85.5分的學(xué)生頻率為0.26,由于有900名學(xué)生參加了這次競賽，所以該校獲

得二等獎的學(xué)生約為0.26x900=234（人）

【例5】右圖是某賽季甲、乙兩名籃球運動員每場比賽得分的莖葉圖,

甲乙

5315

368245

47932678

1457

則甲、乙兩人這幾場比賽得分的中位數(shù)之和是（）

A.62B.63C.64D.65

【難度】（4）

【解析】C;28+36=64.

【例6】（2009年福建12）

某校開展"愛我海西、愛我家鄉(xiāng)”攝影比賽，9位

評委為參賽作品A給出的分?jǐn)?shù)如莖葉圖所示，記

分員在去掉一個最高分和一個最低分后，算得平:；714

均分為91,復(fù)核員在復(fù)核時，發(fā)現(xiàn)有一個數(shù)字（莖

葉圖中的x）無法看清.若記分員計算無誤，則數(shù)字x應(yīng)該是.

【難度】（6）

【解析】1:

由莖葉圖可知所有評分為：88,89,89,92,93,9%,92,91,94,若x>4,去掉9x,

易知剩下的數(shù)的平均數(shù)大于91;故94為最高分，去掉88與94后，有

89+891-92-95?）+9=1>,解得x=l.

【例7】某班甲、乙兩學(xué)生的高考備考成績?nèi)缦拢?/p>

甲：512554528549536556534541522538

乙：515558521543532559536548527531

⑴用莖葉圖表示兩學(xué)生的成績；

⑵分別求兩學(xué)生成績的中位數(shù)和平均分.

【難度】（4）

【解析】⑴兩學(xué)生成績績的莖葉圖如右所示

甲乙

2515

285217

84653261

195438

645589

⑵將甲、乙兩學(xué)生的成績從小到大排列為：

甲：512522528534536538541549554556,

乙:515521527531532536543548558559.

從以上排列可知甲學(xué)生成績的中位數(shù)為空上空=537,

乙學(xué)生成績的中位數(shù)為衛(wèi)注=534.

甲學(xué)生成績的平均數(shù)為：

9、12+22+28+34+36+38+41+49+54+56

500+--------------------------------------=537,

乙學(xué)生成績的平均數(shù)為：

…15+21+27+31+32+36+43+48+58+59―

500+--------------------------------------=537.

【例8】某電腦雜志的一篇文章中，每個句子的字?jǐn)?shù)如下：

10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17

翥報紙的一篇文章中，每個句子所含的字?jǐn)?shù)如下：

27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22

⑴將兩組數(shù)據(jù)用莖葉圖表示；

⑵比較分析，能得到什么結(jié)論？

【難度】（4）

【解析】⑴莖葉圖如右.

電腦雜志報紙文章

9877554102389

8777654432022347778

612233569

116

⑵電腦雜志上每個句子的字?jǐn)?shù)集中在10~30之間，中位數(shù)為23;而報紙上每個句

子的字?jǐn)?shù)集中在20~40之間，中位數(shù)為28.電腦雜志上每個句子的平均字?jǐn)?shù)比報

紙上的平均字?jǐn)?shù)

要少.說明電腦雜志作為科普讀物需要簡明.

板塊三數(shù)字特征，獨立及回歸

【例1】已知一組數(shù)據(jù)孑，々，，指的方差是2,

且（占-3）2+（%-3）2++（/-3）2=380,則這組數(shù)據(jù)的平均數(shù)x=

【難度】（2）

【解析】9或-3;

依題設(shè)有（.一.）-+（吃X）-++（X|（）x）2=2展開變形得

（X：+A?2++x3）+1Ox~—2x（X]+/++芯0）=20........

同樣的，（%—3）2+（專一3）2++（4）-3）2=380,展開變形得

（x[+x；++X[：））+10x9—6?（X]+X,++XJQ）=380.......（2）

②一①并化簡得了2—6元-27=0.解得了=一3或元=9.

【例2】求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差（精確到0.1）,并分析由這些結(jié)果可得出什么更

一般的結(jié)論.

（1）123456789；

（2）111213141516171819；

（3）24681012141618

【難度】（4）

【解析】（1）工=」（1+2++9）=5,

22222

5（=^（1+2++9-9x5）=y?6.7,M=楞弓2.6;

(2)=-(11+12++19)=15

-9

I20

]_15)2+(I2-15)++(19-15)]=y-6.7,

52=-^y-2-6：

(3)^=-(2+4++18)=10

,1,,80

s；=-[(2-10)*+(4-10)92++(18-10)2]=丁26.7,

一組數(shù)都加上相同的數(shù)后，方差不變，都乘以相同的倍數(shù)〃后，標(biāo)準(zhǔn)差變?yōu)樵瓉淼?/p>

"倍，方差變?yōu)樵瓉淼摹?倍.即X,,々，，毛的方差為S，,則

%+a,/。，，X”+a的方差仍為/,

nxt,nx2,，町，的方差為ns.

【例3】（2009上海18）

在發(fā)生某公共衛(wèi)生事件期間，有專業(yè)機構(gòu)認為該事件在一段時間內(nèi)沒有發(fā)生大規(guī)模

群體感染的標(biāo)志為"連續(xù)10天，每天新增疑似病例不超過7人”.根據(jù)過去10天甲、

乙、丙、丁四地新增疑似病例數(shù)據(jù)，一定符合該標(biāo)志的是（）

A.甲地：總體均為3,中位數(shù)為4B.乙地：總體均值為1,總體方差大于0

C.丙地：中位數(shù)為2,眾數(shù)為3D.丁地：總體均值為2,總體方差為3

【難度】⑷

【解析】D;

根據(jù)信息可知，連續(xù)10天內(nèi)，每天的新增疑似病例不能有超過7的數(shù)，選項A中，

中位數(shù)為4,可能存在大于7的數(shù)；

同理，在選項C中也有可能；

選項B中，如果某天數(shù)據(jù)為10,其余9天為0,則不符合標(biāo)志：

選項D中，根據(jù)公式，若有大于7的數(shù)存在，則方差至少為:［（8-2『+］》3.6.

【例4】（2008上海9）

已知總體的各個體的值由小到大依次為2,3,3,7,4,6,12,13.7,18.3,20,且總

體的中位數(shù)為10.5,若要使該總體的方差最小，則〃、〃的取值分別是.

【難度】（6）

【解析】10.5,10.5:

絲2=10.5=a+/j=21,要使方差最小，只需（a—10.5）2+3—10.5）2最小，當(dāng)且

僅當(dāng)片+加最小，顯然當(dāng).=《=10.5時取到最小值.

【例5】對變量X與丫的卡方統(tǒng)計量/的值，說法正確的是（）

A./越大，"X與y有關(guān)系”可信程度越??；

B./越小，"X與y有關(guān)系，，可信程度越小；

C./越接近0,，，x與y無關(guān)"程度越小；

D./越大，，，x與y無關(guān)"程度越大.

【難度】⑵

【解析】B

【例6】某高校食堂隨機調(diào)查了一些學(xué)生是否因距離遠近而選擇食堂就餐的情況，經(jīng)計算得

至IJ/=4.932.所以判定距離遠近與選擇食堂有關(guān)系，那么這種判斷出錯的可能性

為多少？

【難度】（2）

【解析】因為力223.841,所以出錯的可能性為5%.

【例7】下表中給出了某周內(nèi)中學(xué)生是否喝過酒的隨機調(diào)查結(jié)果，若要使結(jié)論的可靠性不低

于95%,根據(jù)所調(diào)查的數(shù)據(jù)，能否作出該周內(nèi)中學(xué)生是否喝過酒與性別有關(guān)的結(jié)

論？

喝過酒沒喝過酒總計

生

男77404481

生

女

16122138

計

總

93526619

【難度】（4）

【解析】提出假設(shè)”。：該周內(nèi)中學(xué)生是否喝過酒與性別無關(guān).

由列聯(lián)表中的數(shù)據(jù)，算出力、1.6366,

當(dāng)b°成立時，/23.841的概率約為0.05,而這里/=1.6366<3.841,

所以，不能推斷出喝酒與性別有關(guān)的結(jié)論.

【例8】為研究不同的給藥方式（口服或注射）和藥的效果（有效與無效）是否有關(guān)，進行

了相應(yīng)的抽樣調(diào)查，調(diào)查結(jié)果如表所示.根據(jù)所選擇的193個病人的數(shù)據(jù)，能否

作出藥的效果與給藥方式有關(guān)的結(jié)論？

有效無效合計

口服584098

注射643195

合計12271193

【難度】（4）

5864

【解析】在口服的病人中，有一*59%的人有效；在注射的病人中，有上*67%的人有

9895

效.從直觀上來看，口服與注射的病人的用藥效果的有效率有一定的差異，能否認

為用藥效果與用藥方式一定有關(guān)呢？下面用獨立性檢臉的方法加以說明.

提出假設(shè)“0：藥的效果與給藥方式?jīng)]有關(guān)系.由列聯(lián)表中的數(shù)據(jù)，算出

2=193x（58x31-40*64）2。j38%查表有尸（222.072）=0.15.

122x71x98x95

當(dāng)兒成立時，/2I.3896的概率大于15%,這個概率比較大，所以根據(jù)目前的

調(diào)查數(shù)據(jù)，不能否定假設(shè)H。，即不能作出藥的效果與給藥方式有關(guān)的結(jié)論.

點評：如果觀測值/2W2.706,那么就認為沒有充分的證據(jù)顯示兩個分類變量有

關(guān)系，但也不能作出結(jié)論"兒成立"，即兩個變量沒有關(guān)系.

【例9】（2009遼寧20）

某企業(yè)有兩個分廠生產(chǎn)某種零件，按規(guī)定內(nèi)徑尺寸（單位：mm）的值落在

[29.9430.0*的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中個抽出500件，量其內(nèi)

徑尺寸，的結(jié)果如下表：

甲廠:

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)12638618292614

乙廠：

[29.86,[29.90,[29.94,[29.98,[30.02,[30.06,[30.10,

分組

29.90)29.94)29.98)30.02)30.06)30.10)30.14)

頻數(shù)297185159766218

⑴試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率；

⑵由于以上統(tǒng)計數(shù)據(jù)填下面2x2列聯(lián)表，并問是否有99%的把握認為"兩個分廠生

產(chǎn)的零件的質(zhì)量有差異”.

甲廠乙廠合計

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

高考數(shù)學(xué)講義統(tǒng)計參考教案

文檔簡介

溫馨提示

最新文檔

評論

高考數(shù)學(xué)講義統(tǒng)計參考教案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔