統(tǒng)計學(xué) 第六章統(tǒng)計量與抽樣分布(習(xí)題附參考答案)_第1頁
統(tǒng)計學(xué) 第六章統(tǒng)計量與抽樣分布(習(xí)題附參考答案)_第2頁
統(tǒng)計學(xué) 第六章統(tǒng)計量與抽樣分布(習(xí)題附參考答案)_第3頁
統(tǒng)計學(xué) 第六章統(tǒng)計量與抽樣分布(習(xí)題附參考答案)_第4頁
統(tǒng)計學(xué) 第六章統(tǒng)計量與抽樣分布(習(xí)題附參考答案)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第6章統(tǒng)計量與抽樣分布

【弓I例】1899年,戈塞特(18767937)進(jìn)入都柏林A.吉尼斯父子釀酒公

司擔(dān)仟釀酒化學(xué)技師,主要從事統(tǒng)計和實(shí)驗(yàn)工作。他在工作中發(fā)現(xiàn),供釀酒的

每批麥子質(zhì)量相差很大,而同一批麥子中能抽樣供試驗(yàn)的麥子又很少,每批樣

本在不同的溫度下做實(shí)驗(yàn),其結(jié)果相差很大。這就決定了不同批次和溫度的麥

子樣本是不相同的,不能進(jìn)行樣本合并。這樣一來,實(shí)際上取得的麥子樣本,

不可能是大樣本,只能是小樣本。他在工作中還發(fā)現(xiàn),利用小樣本得出的結(jié)果,

和正態(tài)分布有較大的差異,特別是兩端尾部的概率,比正態(tài)分布明顯高。因此

1907年戈塞特決心把小樣本和大樣本之間的差別搞清楚。為此,他試圖把一個

總體中的所有小樣本的平均數(shù)的分布刻畫出來。做法是;在一個大容器里放了

一批紙牌,把它們弄亂,隨機(jī)地抽若干張(小樣本),對這一樣本記錄觀察值,

然后再把紙牌弄亂,抽出幾張,對相應(yīng)的樣本再記錄觀察值。大量地記錄這種

隨機(jī)抽樣的小樣本觀察值,就可以獲得小樣本觀察值的分布。1908年,戈塞特

以“學(xué)生(Student)”為筆名在《生物計量學(xué)》雜志發(fā)表了論文《平均數(shù)的規(guī)

律誤差》。這篇論文開創(chuàng)了小樣本統(tǒng)計理論的先河,為研究樣本分布理論奠定了

重要基礎(chǔ)。被統(tǒng)計學(xué)家譽(yù)為統(tǒng)計推斷理論發(fā)展史上的里程碑。

那么總體和樣本是如何聯(lián)系的?大樣本和小樣本下究竟有什么差異?什么

是t分布?它和正態(tài)分布有什么不同?它有什么作用?統(tǒng)計推斷中常用的分布

還有哪些?這些問題都將在本章中找到答案。

統(tǒng)計研究的目的是為了探索現(xiàn)象內(nèi)在的數(shù)量規(guī)律性。為了解總體的數(shù)量特

征,可以直接對總體進(jìn)行全面調(diào)查,得到總體數(shù)據(jù),進(jìn)而歸納出數(shù)量特征;也

可以對總體進(jìn)行抽樣,利用樣本對總體進(jìn)行推斷,后一種方法稱為統(tǒng)計推斷。

抽樣分布是進(jìn)行統(tǒng)計推斷的理論基礎(chǔ)。本章將主要介紹統(tǒng)計推斷所涉及的總體、

樣本、統(tǒng)計量及抽樣分布等概念,以及在統(tǒng)計推斷中最常用的/分布,/分布

和產(chǎn)分布和抽樣分布定理。

§6.1總體與樣本的統(tǒng)計分布

總體與樣本是統(tǒng)計推斷中的兩個基本概念。統(tǒng)計推斷的目的是從樣本信息

出發(fā),運(yùn)用概率論的方法,推斷總體的特征;因此如何將統(tǒng)計學(xué)的總體、樣本

和概率論的基礎(chǔ)一一隨機(jī)變量與分布聯(lián)系起來,就成為統(tǒng)計推斷首先要解決的

問題。

§6.1.1統(tǒng)計推斷中的總體及總體分布

第一章中已經(jīng)明確統(tǒng)計所研究的是由同類事物構(gòu)成的總體的數(shù)量特征,總

體是根據(jù)一定的目的確定的所要研究的事物的全體,它是由客觀存在的、具有

某種共同性質(zhì)的眾多個體構(gòu)成的??傮w中的每個單位稱為個體。比如前面引例

中,每一批麥子的全體就是一個總體,而其中每單位的麥子就是個體。這是統(tǒng)

計學(xué)中關(guān)于總體的概念,我們可以稱其為實(shí)物總體。

在前面章節(jié)的學(xué)習(xí)中,我們已經(jīng)發(fā)現(xiàn):我們真正關(guān)心和收集研究的并不是

這些總體中的個體本身,而是這些個體的某些特征及其數(shù)值,在前面我們將這

些特征用變量來描述,對應(yīng)的數(shù)值稱為變量值。關(guān)心這批麥子,主要關(guān)心的是

其釀酒的效果出酒量。此時出酒量成為需要研究的變量,每單位麥子出酒量的

具體數(shù)值成為變量值。在研究這批麥子時,并不需要將全部這批麥子都收集過

來,只需要記錄這批麥子每單位出酒量的數(shù)值,再對這些數(shù)值進(jìn)行研究就可以

了。此時的總體實(shí)質(zhì)是這批麥子的出酒量對應(yīng)的若干個數(shù)值,總體已經(jīng)從實(shí)物

抽象到了數(shù)值,可以稱之為數(shù)值總體。這是對總體概念的第一次抽象。

如果實(shí)物總體中個體很多,則對應(yīng)的數(shù)值總體其規(guī)模將非常大,而且往往

其中重復(fù)的值會很多,即使沒有重復(fù)值(變量取值連續(xù)時),在不同值周圍的“密

集程度”也會不相同。逐一研究每個變量值將會非常繁瑣,當(dāng)總體規(guī)模趨于無

窮時,研究每個變量值更是變得不可能。若統(tǒng)計出變量的所有不同取值(或取

值區(qū)間)及其出現(xiàn)的頻率,編制變量的分布數(shù)列,則可以對變量的全部取值情

況一覽無遺。研究一個變量的全部數(shù)值,就轉(zhuǎn)化為研究該變量的分布了。用變

量及其分布來描述一個總體,可以稱之為分布總體。例如研究某批麥子的出酒

量X,這是個連續(xù)變量,可以統(tǒng)計出X在不同區(qū)間取值的頻率,得到X的分布。

對全部單位出酒量的數(shù)值的研究,就可轉(zhuǎn)化研究出酒量X的分布了。這是對總

體概念的第二次抽象。

對于隨機(jī)變量X,其取值是隨機(jī)的,關(guān)注該變量的全部取值,也就是要關(guān)

注其各個可能取值(或取值區(qū)間)及其相應(yīng)概率,即關(guān)注該隨機(jī)變量的概率分

布。在統(tǒng)計推斷中利用隨機(jī)變量X及其概率分布來描述一個總體,應(yīng)用起來非

常有優(yōu)勢,尤其是當(dāng)總體容量趨于無窮時,另外一個好處是可以利用概率論的

理論和方法來研究總體。例如麥子出酒量的總體分布如果是正態(tài)分布,就可以

利用正態(tài)分布的密度函數(shù)計算出酒量在各區(qū)間的概率。

經(jīng)過上述討論,完成了從“實(shí)物總體f數(shù)值總體f分布總體”的兩次抽象,

也完成了我們將統(tǒng)計學(xué)中“總體”與概率論中“分布”的銜接,這是統(tǒng)計推斷

對總體概念的延伸,也是概率論知識應(yīng)用于統(tǒng)計推斷的基礎(chǔ)。以后在本章及以

后統(tǒng)計推斷的相關(guān)章節(jié)中,如無特別說明,總體均表示分布總體,給定一個總

體,只需耍給出總體的分布即可。

§6.1.2統(tǒng)計推斷中的樣本及樣本性質(zhì)

統(tǒng)計推斷的重要任務(wù)是通過對總體中隨機(jī)抽取的部分個體的觀測結(jié)果來推

斷總體的特征。按照隨機(jī)原則,通過觀測或試驗(yàn)的方法所獲得的總體中一部分

個體的取值稱為樣本,每個個體的取值稱為樣本點(diǎn)或樣品。抽出樣本之前,由

于總體中各個體有同等被抽中的可能,抽中那個個體不能確定,因此樣本是一

組隨機(jī)變量,每個樣本點(diǎn)都可以取總體中任意一個值;但是當(dāng)樣本被抽取并觀

測記錄后,若干個體被抽出,各樣本點(diǎn)的取值確定,樣本成為是一組確定的數(shù)

值。統(tǒng)計推斷中為了區(qū)分此二重性,將抽取前具有隨機(jī)性的樣本稱為樣本,用

大寫字母表示;將抽取的一組確定的數(shù)值稱為樣本觀測值,用小寫字母表示。

如要推斷某種燈泡使用壽命總體X的特征,擬隨機(jī)抽取〃只燈泡進(jìn)行測試,其

使用壽命(X,X2,…,Xn)稱為燈泡使用壽命總體X的樣本,一次具體抽樣測試得

到n個燈泡使用壽命的數(shù)值(即,及,…用0,稱為總體X的樣本觀察值。

統(tǒng)計推斷中,把具有以下兩個重要性質(zhì)的樣本稱為簡單隨機(jī)樣本:

1.樣本點(diǎn)與總體同分布

這一點(diǎn)很容易從數(shù)值總體的角度加以理解:由于采取隨機(jī)原則抽取樣本點(diǎn),

每個個體被抽中的可能性相同。假設(shè)總體容量為M則每個個體被抽中的概率

為1/M假設(shè)對離散型總體取值等于x,或?qū)B續(xù)型總體取值在區(qū)間x+/x)中

的個體總數(shù)為M,那么抽出樣本點(diǎn)取值為X或在區(qū)間(.%工+〃幻中的概率就是

M小,恰好等于總體X取值為x或取值在區(qū)間(x,x+ZYx)中的頻率(或概率),從

而可以看出樣本點(diǎn)與總體分布相同。

2.樣本點(diǎn)之間相互獨(dú)立

從總體中抽取樣本的方法有重復(fù)抽樣和不重復(fù)抽樣兩種。采用重復(fù)抽樣時,

每次隨機(jī)抽取一個樣本點(diǎn)并記錄其特征以后,又將它放回總體中參加下一次抽

取,每次抽取樣本點(diǎn)都是在總體的N個單位中進(jìn)行的,前一次抽取的結(jié)果不會

影響后一次抽取的結(jié)果,因此樣本點(diǎn)之間相互獨(dú)立。采用不重復(fù)抽樣時,每次

隨機(jī)抽出一個樣本點(diǎn)后不再將它放回總體中,下一次只能在其余個體中抽取,

前面抽取的結(jié)果就會影響后面的抽取,因此樣本點(diǎn)之間不是相互獨(dú)立的。但通

常實(shí)際工作中總體容量非常大,采用不重復(fù)抽樣時也可以近似認(rèn)為樣本點(diǎn)之間

相互獨(dú)立。對于總體容量無限的情形,無論采取重復(fù)抽樣還是不重復(fù)抽樣,都

可以認(rèn)為樣本點(diǎn)是相互獨(dú)立的。

在本書后面的敘述中,常常將以上兩個性質(zhì)一同簡寫為“樣本點(diǎn)獨(dú)立同分

布(讓4”。沒有特別說明的情況下,我們討論的樣本均指的是簡單隨機(jī)樣本。

§6.2統(tǒng)計量

§6.2.1統(tǒng)計量的概念

在統(tǒng)計推斷中,總體信息是未知的,但從總體中抽取的樣本中含有總體的

信息、,統(tǒng)計推斷就是利用樣本的信息來推測總體的信息。然而樣本的信息是隱

蔽的、分散的,必須經(jīng)過必要的加工對樣本信息進(jìn)行集中和提煉才能用來推斷

總體信息,構(gòu)造樣本統(tǒng)計量是集中和提煉樣本信息來推斷總體信息的有效手段

之一。

設(shè)(X1….,X〃)是來自總體X的一個樣本,如果T=T(X1,X2,…,X“)是

樣本(X1,…,X")的函數(shù),7中不含任何未知參數(shù),則稱T(X1,X2,…,X“)為

一個統(tǒng)計量。如果(芭,…,x“)為樣本(X1,…,X〃)的觀測值,則

T=7(4工2,…,G為統(tǒng)計量7=nxPx2,…,X“)的觀測值。統(tǒng)計量的觀測

值是確定的,沒有隨機(jī)性。

統(tǒng)計量有以下兩個特征:統(tǒng)計量是樣本的函數(shù),統(tǒng)計量通常為隨機(jī)變量;

統(tǒng)計量不能含有未知的參數(shù)。例如,當(dāng)從正態(tài)總體中抽出樣本“時,

考查隨機(jī)變量£(Xj-4)2,當(dāng)總體均值〃為已知時,該變量是統(tǒng)計量;當(dāng)

/=|

總體均值未知時,該變量就不是統(tǒng)計量。

統(tǒng)計量既然是隨磯變量,那么它應(yīng)該有概承分布,統(tǒng)計量的分布稱為抽樣

分布。抽樣分布和統(tǒng)計推斷有著密切的聯(lián)系。統(tǒng)計量明確以后,必須要知道其

抽樣分布才能在統(tǒng)計推斷中使用,因?yàn)橹挥兄懒私y(tǒng)計量的分布,才能利用概

率論對總體的特征進(jìn)行推斷,并得到相應(yīng)的推斷置信度。所以在統(tǒng)計推斷中,

一項(xiàng)重要的工作就是尋找統(tǒng)計量和導(dǎo)出統(tǒng)計量的抽樣分布或漸近抽樣分布。

【例6-1】總體X股從兩點(diǎn)分布,概率分布律如下:

p(x=1)=p,P(X=O)=1—〃

從總體中抽取容量為〃的樣本,構(gòu)造統(tǒng)計量T=ZX,.,求此統(tǒng)計量的分布。

z=i

解:由于樣本是犯立的,X,服從兩點(diǎn)分布:統(tǒng)計量7為隨機(jī)變量,其取

值是。到〃之間的所有整數(shù),其分布恰好是二項(xiàng)分布:

P(T=k)=C:pA(1—p)"-k,A=0,1,2,〃

從上面的例子中,可以看出抽樣分布未必與總體的分布一致。

【例6-2】總體分布為X?N(l,l),抽取容量為〃的樣本,構(gòu)造如下三個統(tǒng)

計量:T=7;=X1+X2和7;=又求此三個統(tǒng)計量的抽樣分

n,=i

布。

解:由于樣本是獨(dú)立的,X,服從均值和方差都為1的正態(tài)分布,三個統(tǒng)計

量都是樣本的線性函數(shù),由正態(tài)分布的性質(zhì),三個統(tǒng)計量仍服從正態(tài)分布,下

面分別求解其均值和方差:

£(7;)=£(%,)=1,D(7;)=D(X)=1

E(T2)=E(X])+E(X2)=2,D(T2)=£>(.)+O(X2)=2

1n1n1

磯()=—ZE(X,)=I,o(t)==£Q(X,)=—

nz=iri=i〃

由上面計算可以得出,統(tǒng)計量7;服從均值和方差都為1的正態(tài)分布,這和

總體的分布相同;統(tǒng)計量7;服從均值和方差都為2的正態(tài)分布,而統(tǒng)計量7;服

從均值為1,方差為//力的正態(tài)分布。

§6.2.2常用統(tǒng)計

1.樣本均值和樣本方差

設(shè)X,X2,…,x”是總體x中抽出的簡單隨機(jī)樣本,則樣本均值為

x=-Yxif樣本方差為

2.樣本矩

稱&為樣本的原點(diǎn)矩,稱紇=-y(xz-xV為樣本的中心

〃,=1〃/=1

矩。特別當(dāng)%=2時,&Xj—又『稱為樣本的未修正方差,常記S;,

〃,=1

,常用統(tǒng)計量還包括樣本相關(guān)系數(shù),我們將在第9章介紹。

顯然有S;二(TDS2。

n

3.順序統(tǒng)計量

設(shè)X1,丫?.?,*“是總體乂中抽出的簡單隨機(jī)樣本,把樣本點(diǎn)排序?yàn)?/p>

X⑴<X(2)<???<X(“),則稱X⑴,X(2),?一X。為順序統(tǒng)計量,其中X⑵稱為

第i個順序統(tǒng)計量。基于順序統(tǒng)計量計算的常用統(tǒng)計量有:

最大順序統(tǒng)計量X(n)=max{X19X2,...,X3}和最小順序統(tǒng)計量

乂⑴=min{X],X2,...,X3};

樣本極差R=X(〃)—X⑴;

也)〃為奇數(shù)

樣本中位數(shù)也=X,、+x,、

上~劌〃為偶數(shù)

2

樣本的P分位數(shù)Mp=*必+(〃+l)(p_嚕)%則「*必)

其中[〃〃]為不超過秋的最大整數(shù):

1n-k

樣本的切尾均值Tnk=-------VX(>0<k<n9樣本的切尾均值是分別

〃-23士⑴

去掉k個最小的和k個最大的觀測值后得到的均值。

§6.3抽樣分布及抽樣分布定理

為了在正態(tài)分布假定下,得到樣本統(tǒng)計量的精確分布,本節(jié)需要討論幾個

十分重要的隨機(jī)變量函數(shù)的分布,它們是力2分布、,分布和尸分布。在此基礎(chǔ)

上討論抽樣分布的重要定理。

§6.3.1%?分布

分布是海爾墨特(Hermert)和卡.皮爾遜(K.Pearson)分別于1875年

和1890年提出的,是統(tǒng)計推斷中的重要分布。它主要應(yīng)用于對總體方差的估計

或檢驗(yàn)以及對總體概率密度函數(shù)的檢驗(yàn)等。

1./分布的定義及其密度函數(shù)

定義6-1若隨機(jī)變量X?..,X〃獨(dú)立且同標(biāo)準(zhǔn)正態(tài)分布N(O,1),則它們

的平方和

(6.1)

?=1

服從自由度為〃的/分布,記為?/(〃)。

/=i

根據(jù)服從卡方分布隨機(jī)變量的定義,我們可以根據(jù)求隨機(jī)變量函數(shù)的概率

分布的方法求出Z2分布的概率密度函數(shù)I。如果隨機(jī)變量X服從自由度為〃的

72分布,其概率密度為:

1J上

22

--n-----xex>0

22r(-)(6.2)

0x<0

其中「(〃)為gamma函數(shù)。

2.%?分布的性質(zhì)特征

(1)/分布的數(shù)學(xué)期望與方差

若X服從自由度為〃的了?分布,其數(shù)學(xué)期望和方差分別為

E(X)=n,Z)(X)=2/z(6.3)

可見隨著自由度的增大,/分布的期望和方差隨之增大,自由度決定了

力2分布的形狀。從密度函數(shù)定義可以看出,/分布是一種不對稱偏峰分布,

其取值區(qū)域?yàn)?0,+8);隨著自由度的逐漸增大,%?分布曲線的最高點(diǎn)逐漸下

降并向右移動,分布曲線趨于對稱,如圖6-1所示。

1推導(dǎo)過程略,有興趣的讀者可以參考陳希孺,《數(shù)理統(tǒng)計引論》,高教出版社

P{^2(n)>^(n)}=a

關(guān)于22分布上側(cè)。分位數(shù)/5)可以通過書后附表求得,附表給出了自

由度〃V45的分布上側(cè)a分位數(shù)。也可通過EXCEL的CH1NV函數(shù)求得。

例如/必(11)=2.603,若。(13)=27.688。

(2)分布的自由度

力2分布中〃稱為自由度。對于變量X-…,X〃,如果存在一組不全為零的

常數(shù)c“2…?,%,使得C1X+C2X2+…+c〃X”=0成立,則稱變量

之間存在一個線性約束條件。如果變量X,..,X〃中存在攵個獨(dú)立的線性約束

條件,則Xj(i=l,2,…,〃)中獨(dú)立變量的個數(shù)為(〃一2),稱它為自由度。自由

度也可粗略解釋為可以自由選擇數(shù)值的變量個數(shù)。

例如,fx;由〃個獨(dú)立的隨機(jī)變量X構(gòu)成,由于它們之間沒有線性約

;=1

束條件(即Z=0),所以它的自由度為〃?!辏╔j—廿2的自由度為(〃_]),

/=1

這是因?yàn)橛嬎恪辏▁廠區(qū))2時要用又,又滿足限制條件£?!竻^(qū))=0,即

<=1/=1

相對于反的〃個離差變量(X1-又),(X2-又),…,(X〃一刀),只有(〃一1)個可

以任意確定,第〃個失去了“自由”,所以能其自由度為(〃—1)。

(3)/分布的可加性

若x、y相互獨(dú)立,且分別服從自由度為陽、%的?2分布,則x+y服

從自由度為々+”的?2分布,即

x+y?/(4+〃2)

【例6-3]設(shè)X]….,乂6是獨(dú)立同服從N(0,2)分布的隨機(jī)變量,求a,b

22

和c使+b(X2+X3)+c(X4+X5+X6)服從/分布。

因?yàn)椤?,X6獨(dú)立同N(0,2)分布,所以

則至從而;

X~N(0,2),~N(O,1),

VV1

X2+X3-/V(o,4),則\3?Q(O,1),從而z(X?+X3)2?72(1)

X+X+X

X+X+X^7V(0,6),則^~~~N(O,1),從而

4S6瓜

22

1(X4+X5+X6)-Z(1)O

o

由于42分布的可加性,則

2222

-X,+-(X2+X3)+-(X4+X5+X6)^^(3),自由度為3。且

ci=-,b=一和。=—o

246

§6.3.2亡分布

,分布又稱為“學(xué)生分布”,是統(tǒng)計推斷中的重要分布。它在總體均值的估

計與檢驗(yàn)、相關(guān)與回歸分析等方面有著廣泛的應(yīng)用。

Lf分布的定義及其密度函數(shù)

定義6-2若隨機(jī)變量X~N(O,1),隨機(jī)變量Y?z2(n),且隨機(jī)變量X與

丫相互獨(dú)立,則隨機(jī)變量

X

(6.4)

F77

服從自由度為〃的,分布,記為,??〃)。

f分布的概率密度函數(shù)比較夏雜。如果隨機(jī)變量X服從自由度為〃的/分布,

則其概率密度函數(shù)為

I_?+1

/(X)=-------------(1+—)2-00<%<00(6.5)

觀察/分布的概率密度函數(shù),可以發(fā)現(xiàn)它是偶函數(shù),所以/分布是關(guān)于原點(diǎn)

對稱的,這一點(diǎn)和分布是不同的,卻和標(biāo)準(zhǔn)正態(tài)分布相似。圖6-2的三條曲

線分別是標(biāo)準(zhǔn)正態(tài)曲線以及自由度為19和5的/分布曲線。

通過比較可以發(fā)現(xiàn)/分布和標(biāo)準(zhǔn)正態(tài)分布類似,都是對稱分布,均在

-8<工<8上取值。但是/分布與標(biāo)準(zhǔn)正態(tài)分布也有區(qū)別,,分布尾部厚,即服

從t分布的隨機(jī)變量取到尾部值的概率比標(biāo)準(zhǔn)正態(tài)分布略大。而對于接近原點(diǎn)

的坐標(biāo)點(diǎn),f分布密度函數(shù)的值比標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)的值小。因而/分布曲

線尾部厚于標(biāo)準(zhǔn)正態(tài)分布,而峰低于標(biāo)準(zhǔn)正態(tài)分布。

滿足尸{,(〃)>ta(九)}=。的%⑺稱為自由度為n的f分布上側(cè)a分位數(shù)。

關(guān)于,分布上側(cè)a分位數(shù)%(〃)可以通過書后附表求得,附表給出了自由度

〃工45的1分布上側(cè)a分位數(shù)。例如a5(1°)=1?8125,由于,分布是定稱分

布,所以九95(1°)=一1?8125。

2.t分布的性質(zhì)特征

(1)/分布的數(shù)學(xué)期望與方差

[分布的數(shù)學(xué)期望與方差分別是

E(r)=O,。(/)=〃/(〃-2)n>2(6.6)

由于/分布是對稱分布,其數(shù)學(xué)期望當(dāng)然為0。雋要注意的是:只有當(dāng)自由

度大于1,其數(shù)學(xué)期望才為0,自由度為1時,數(shù)學(xué)期望不存在;同時注意到/分

布的方差與其自由度有關(guān),自由度小于等于2時,方差不存在,當(dāng)自由度

〃―8,方差極限為lo

(2)/分布的自由度

f分布的自由度是由生成/分布的分母即卡方分布隨機(jī)變量的自由度而來。

1分布的形狀和自由度〃有較大關(guān)系,自由度越小,f分布曲線與標(biāo)準(zhǔn)正態(tài)分布

曲線的區(qū)別越明顯,,分布“比較平”,而自由度增大,1分布曲線與標(biāo)準(zhǔn)正態(tài)分

布曲線的差異逐漸縮小。這一點(diǎn)也可以由f分布的方差來說明,當(dāng)自由度〃較小

時,/分布的方差較大,此時其分布就“比較平”;而當(dāng)自由度較大時,方差較

小,而月越來越接近1.此時/分布與標(biāo)準(zhǔn)正態(tài)分布逐漸接近C

【例6-4】設(shè)X”..,X6是獨(dú)立同服從N(0,2)分布的隨機(jī)變量,如果隨機(jī)

Y

變量c/力服從自由度為5的I分布,求c等于多少。

因?yàn)閄,.?,X6獨(dú)立同服從服(0,2)分布,所以

v

X「N(0,2),則2=方~陽0,1)。

Y2丫2Y2Y2丫2

又因?yàn)椋?=&_&+工+工+工?2(5)

22222

而Z與%?相互獨(dú)立,則由/分布的構(gòu)造,有

醫(yī)+9+星+應(yīng)+巡/5

V22222

J(X;+X;+X:+X;+X;)/5

所以

§6.3.3廠分布

產(chǎn)分布是統(tǒng)計學(xué)家費(fèi)雪(R.A.Fisher)于1924年提出的,尸分布在假設(shè)檢

驗(yàn)、總體方差的統(tǒng)計推斷、方差分析、回歸分析和多元統(tǒng)計分析等方面有著廣

泛的應(yīng)用。

1.尸分布的定義及其密度函數(shù)

定義6?3若隨機(jī)變量X、y分別服從自由度為〃1、%的卡方分布,且X、

y相互獨(dú)立,則隨機(jī)變量

F=*(6.7)

Y/n2

服從第一自由度為勺,第二自由度為%的尸分布,記為尸?尸(勺,4)。

從戶分布的定義可以看出,尸分布是兩個獨(dú)立的卡方分布隨機(jī)變量與其各

自自由度商的比值,因而產(chǎn)分布具有兩個自由度,作為分子的卡方分布隨機(jī)變

量的自由度稱為第一自由度,作為分母的卡方分布隨機(jī)變量的自由度稱為第二

自由度。

產(chǎn)分布的密度函數(shù)比較復(fù)雜,若隨機(jī)變量/服從笫一自由度為々,第二自

由度為々的“分布,那么其密度函數(shù)為:

「(工

〃產(chǎn)〃2

22x>0

/(0=,吟(6.8)

0x<0

如圖6-3所示,尸分布曲線有些類似于卡方分布,也是一種非對稱的正偏

分布。其值域?yàn)?0,+8),但它有兩個自由度修和〃2。尸分布的分布曲線隨著

兩個自由度的不同組合而不同。兩個自由度的不同組合形成廠分布曲線的不同

形態(tài),這在尸分布的圖形中可清楚看到。隨著第一自由度小的增大,分布曲線

逐漸趨向?qū)ΨQ,隨著兩個自由度的增大,分布曲線逐漸趨于正態(tài)分布。

0.8

滿足pS(〃],%)2乙(〃|,〃2))=二的心(〃|,〃2)稱為自由度為〃的F分布

上側(cè)。分位數(shù)。由于F分布有兩個自由度,所以附表僅僅給出了某些較小。值

對應(yīng)的外(勺〃2)值。例如a05(20,30)=1.93。對于任意的。和自由度,其分

位數(shù)都可通過EXCEL的FINV函數(shù)求得。

2.尸分布的性質(zhì)特征

(1)產(chǎn)分布的數(shù)學(xué)期望和方差

F分布的數(shù)學(xué)期望和方差分別為

E(F)(%>2)

(6.9)

2片(勺+&-2)

D(F)=(%>4)

452—2)2(〃2—4)

從方分布的均值和方差表達(dá)式可以看出,隨著第二自由度公增大,尸分布

的均值趨于1,而方差則取決于兩個自由度。

(2)尸分布的自由度

廠分布的自由度是由構(gòu)造F分布的分子和分母的兩個z2分布的自由度而

來,由于其分子和分母的分布可以交換,所以尸分布的兩個自由度有一個

重要性質(zhì),就是它們是可以互相轉(zhuǎn)化的。

若F?尸(公氏),則1/F?。這個重要性質(zhì)對于查尸分布求大。

的分位數(shù)提供了方便:

U,%)=工;----7(6.10)

工(乙,4)

【例6?5】給定顯著水平。=0.95,查尸(15,20)的a上側(cè)分位點(diǎn)。

因?yàn)橐话鉌分布表并未給出a=0.95的上側(cè)分位點(diǎn)。則要根據(jù)F分布的性

質(zhì),首先查乙05(20,15)=2.328,根據(jù)公式(6.9)可求得:

與95(15,20)=熹=0.4296

也可以通過EXCEL的統(tǒng)計函數(shù)功能中的函數(shù)FINV直接計算該分位數(shù)L

調(diào)出EXCEL的函數(shù)£,選中函數(shù)FINV,根據(jù)對話框輸入相關(guān)信息即可。FINV

的對話框如圖6-4所示。

圖6-4EXCEL的函數(shù)FINV的對話框

§6.3.4抽樣分布定理

下面討論總體為正態(tài)分布時樣本統(tǒng)計量的抽樣分布。這是因?yàn)樵趯?shí)際應(yīng)用

中許多總體分布或是正態(tài)分布,或是近似可以認(rèn)為是正態(tài)的。即使總體分布非

正態(tài),由中心極限定理可知,大樣本下,樣本均值的分布也可以近似認(rèn)為是正

態(tài)分布。

定理6-1若〃是從總體N(〃,b2)抽取的一個簡單隨機(jī)樣本,則

有:

-(y2

1.X?N(〃,一)(6.11)

n

1%?分布和,分布的百分位點(diǎn),也可分別通過EXCEL的統(tǒng)計函數(shù)CHINV和TINV得到。

(6.12)

期X,-方(〃.」或

?/(〃T)(6.13)

3.樣本均值X與樣本方差52相互獨(dú)立?o

其中又號,心上出廠對。

【例6-6]在正態(tài)總體NO/,。?)中抽出一個容量為25的樣本,

125_

S2=—£(Xj-刀產(chǎn)為樣本方差,這里〃和,均為未知。求

24/=|

(1)當(dāng)b=2.3時,求P(|又一〃區(qū)1);

c2

(2)P(0.577<—<1,5173);

CT~

(3)D(S2);

2

解:(1)因?yàn)榉?N(〃J),所以當(dāng)。=2.3,"二25時有:

n

P(|X-//|<1)

X—〃1

=P(\2.3/后區(qū)2.3/后)

=P(|Z|<2.174)=2P(Z<2.174)-1=2X0.985-1=0.97

(2)因?yàn)闃颖緛碜杂诳傮w樣本容量〃=25,所以

(n-l)52(25-1)52

z2?八24)

(72(J2

92

則^(0.577<^-<1.5173)

24s2

=P(0.577x24<<1.5173x24)

=P(0.577x244/(24)41.5173x24)

=尸(13.848</(24)<36.415)

=P(Z2(24)>13.848)-P(Z2(24)>36.415)

=0.95-0.05=0.90(查斤2分布表得出)

i定理證明略,讀者可以參看的詩松等著《概率論與數(shù)理統(tǒng)計》。

24s2

因?yàn)?,所以由式()可知:。(/())。

(3)/24)=96.324=48

而。&)=唱等)

444

__p(z2(24))=__x48=,

定理6?2若總體服從從中抽取容量為〃的樣本XI….,X?,則

t=(6.14)

S/y/n

證明:樣本XI,...,X“相互獨(dú)立,且都服從NT。?),由公式(6.12)和

(6.13)有:

Z=j一〃?N(0,1)

/no7n

(-1)S2

和~~2

而且隨機(jī)變量z與y相互獨(dú)立。結(jié)合?分布的定義有:

z又一〃V^Tcr_X-JLI

=川川(〃-西=^^()

即/(〃-1)

【例6-7]設(shè)總體X服從正態(tài)分布NT。?),X1,…,X〃,X?1是來自

2

總體的一個樣本,記》=一£Xi和s?=——y(xz.-x),試求

〃9〃-1言

Y_y

向“的分布。

S

由于X1,…,X”,X向來自總體N(〃Q2)的簡單隨機(jī)樣本,則分別有

2

?N(4,〃)和兄?N(〃,——),且X,和Xfl相互獨(dú)立,則

nJ+1

X,I+I-又"?N(0,四/),且z=X「%~N0』)。

n"十12

Vn

2

因?yàn)?2二%二比?,2(〃一]),而且根據(jù)定理6/的結(jié)論有Z和7?相互獨(dú)

立,所以

nX.-Xn

?r(n-l)o

〃+1S

定理6?3若總體X服從N(4,b:),總體y服從N(4,b;),且兩個總體

相互獨(dú)立。從兩總體中分別抽取容量為4和%的樣本X,.X/和幾...,小。

(2)當(dāng)b;=b;,貝IJ

f_又-丫-(內(nèi)-%)

I-1?/(4+H-,—2)(6.16)

11

S”,—+——

用%

(々-l)S;+(〃2-l)S;

其中S“工

nA+%—2

i.i.di.i.d

證明:(1)因?yàn)閄1,…,X,,~N(wd),幾…?N("?,6),并且

兩組樣本是相互獨(dú)立的。所以

1~N(內(nèi),6g,一~N(-2/%)

并且又和「相互獨(dú)立,從而

反一歹_(4_從)?N(0,互+貢)

勺%

則z=又一;一(從二?。?/p>

?N(0,l)。

?7

0-+%

V勺%

(2)因?yàn)橛桑?.12)式可以得到:

(H.-D5,2(叫一1局

~/(4-1),~/(%一1)

22

旦S:和S;相互獨(dú)立,從而

Z=,十一,一?=5]+%—2)

bb

并且(1)中的Z和上述/相互獨(dú)立。根據(jù)t分布定義并化簡可得

ZX—Y—(//1—//)

,=/,=---1:二0-?5+%一2)

Jr/(%+%-2)s,十_L

所以,上述變量服從自由度為“+%-2的,分布。

定理6-4若總體X?N(月,端),另一總體y?N("2,b;),從第一總體

中抽取容量為々的樣本,從第二個總體中抽取容量為小的樣本,兩個總體是獨(dú)

立的,則變量

(6.17)

證明:因?yàn)闃颖鞠嗷オ?dú)立且和總體具有相同的分布,所以

i.i.d

X],…,X%~N(〃0:)

i.i.d

加…,工?Ngj

由前面定理6-13,

7(〃1—1)S:2/八

石=I2H/T)

0

9(%—i)s;[、

2?萬(D

兩個總體相互獨(dú)立,所以隨機(jī)變量力:和%;相互獨(dú)立,從而

產(chǎn)二//―2/b:

?F(%

//(均一1)s;/8

所以該隨機(jī)變量服從第一自由度為第二自由度為&-1的〃分布。

本章小結(jié)

I.總體可抽象為所感興趣的變量及其取值的分布。通過觀測或試驗(yàn)的方法

獲得的總體中一部分個體稱為樣本,樣本中每個個體稱為樣本點(diǎn)。

2.統(tǒng)計量是樣本(X1,…,X〃)的函數(shù)且不含任何未知參數(shù)。在統(tǒng)計推斷問

題中,經(jīng)常需要利用取自總體的樣本構(gòu)造出合適的統(tǒng)計量,并使其服從或

漸進(jìn)地服從已知的分布。常用統(tǒng)計量有樣本均值和方差等。統(tǒng)計量的分布

為抽樣分布。

3.在正態(tài)分布假定下三種常用分布——7?分布、t分布和F分布。本章介

紹了三種分布的定義、構(gòu)造原理和重要性質(zhì),以及相應(yīng)分位數(shù)的含義和計算方

法。

4.本章介紹了抽樣分布理論中的幾個重要定理。它們是對正態(tài)總體的均

值、方差等參數(shù)進(jìn)行統(tǒng)計推斷的重要理論基礎(chǔ)。

基本知識梳理

基本知識點(diǎn)含義或公式

總體指所研究事物的全體(實(shí)物總體),或指所研究事物在某個特征上

的取值的全體(數(shù)值總體)。

樣本按照隨機(jī)原則從總體中抽出的n個個體。簡單隨機(jī)樣本的性質(zhì):

(1)樣本點(diǎn)和總體具有相同的分布

(2)樣本點(diǎn)之間是獨(dú)立的

統(tǒng)計量丁二/以不,….)是樣本的函數(shù),如果丁中不含任何未知

參數(shù),則稱7(%,兀,.../〃)為一個統(tǒng)計量。常用統(tǒng)計量有:樣本均值

和樣本方差、樣本矩統(tǒng)計量、樣本相關(guān)函數(shù)、樣本的順序統(tǒng)計量。

抽樣分布統(tǒng)計量的分布稱為抽樣分布,常用的抽樣分布有/分布、,分布、F

分布。

分布目互獨(dú)立的且服從標(biāo)準(zhǔn)正態(tài)分布,則它們的平方和服從自

由度為n的/分布,即為X;?#2(〃)。

z=l

/2分布的性自由度為n的/分布變量,均值和方差分別為n和2n;隨自由度的增加,

質(zhì)/分布趨近正態(tài)分布;獨(dú)”42分布變量具有可加性。

自由度自由度也可粗略解釋為可以自由選擇數(shù)值的變量個數(shù),即變量的總

個數(shù)減去線性約束的個數(shù)。

1分布x,y相互獨(dú)立;X~N(O,1),y~/(〃);X即服從自由度為〃

x/r/n

的,分布,即?/(〃)。

y/yTn

,分布的性質(zhì)均值E(f)=0,方差。⑺=〃/(〃—2);/分布的自由度和分母中y

的自由度相同;(分布曲線比標(biāo)準(zhǔn)正態(tài)曲線低峰厚尾,隨自由度的

增加,/分布趨近標(biāo)準(zhǔn)正態(tài)分布。

F分布X)相互獨(dú)立;X~/(4),y~/2(%);F=X'即服從第一自由

~Y/n2

度為勺,第二自由度為%的尸分布,即尸=泮?A%%)。

產(chǎn)分布的性質(zhì)產(chǎn)分布的均值隨著第一自由度&增大而趨于1,方差則取決于兩個

自由度;若尸?尸(勺,2),則//~F(%,〃i)。

在正態(tài)總體的假定條件下,有

抽樣分布重X—N入T/八(?-1)522/1、

要定理r-~N(0/),、~/51),

o/<nb

;x_y”i2)_(_2)

依正一

練習(xí)題

一、單項(xiàng)選擇題(在4個備選答案中選擇1個正確答案)

1.某產(chǎn)品出廠檢驗(yàn)規(guī)定:次品率〃不超過4%才能出廠,現(xiàn)從一1批產(chǎn)品中抽取

12件進(jìn)行檢查,假設(shè)取值為1代表次品,取值為0代表合格品,則數(shù)值總體是

()

A.OB.lC.0和1D.許多取值為0或1的數(shù)的全體

2.某廠生產(chǎn)的螺絲釘,其標(biāo)準(zhǔn)長度為6.8,而其真實(shí)的長度X?N(〃,0.36),

從上述敘述中,假設(shè)總體均值就是標(biāo)準(zhǔn)長度,從生產(chǎn)的螺絲釘中抽取了1個螺

絲釘作為樣本,其長度為6.7mm,則該樣本X1的分布是()

A.P(X\=6.7)=1B.N(6.8,0.36)C.N(6.7,0.36)D.U(6.7,6.8)

3.樣本和樣本觀測值的關(guān)系是()

A.兩者都是隨機(jī)變量,分布相同B.兩者都是隨機(jī)變量,但分布不同

C.樣本觀測值是樣本的一次實(shí)現(xiàn)D.樣本只能取樣本觀測值

4.設(shè)總體服從參數(shù)4的Poisson分布,從總體中抽取〃個樣本,樣本的聯(lián)合分

布為()

n

%心

A--"叱七=0』,...B./E(1-A)1=1

在中

;=1

C.—e,xi=0,1,...D.以上都不對

xi!

5.以下不是統(tǒng)計量是()

A.樣本均值B.樣本方差C.樣本極差D.樣本量

6.設(shè)總體X?N(0J),從總體中抽取〃個樣本,下列統(tǒng)計量中不服從療分布的

是()

A豈X;B.X;十X;C.(X]+X2)>+(乂3+乂力D.(X1+%2)

i=\2

7.設(shè)總體X服從自由度為3的/分布,從總體中抽取〃個樣本,下列統(tǒng)計量

服從自由度為9的卡方分布的是()

22

A.(X[+X2)+(X3+X4)B.X;+X;+X;

C.X]+X、+X3D.(X]+X、+X?)2

8.比較標(biāo)準(zhǔn)正態(tài)分布和自由度為5的/分布的0.05分位數(shù)Z0o5和foos(5),可

以得到()

A.Zo,05<,0.05(5)B.Zoo5>ho5⑸C.Z)05=,o.O5⑸D.不能比較

9.假設(shè)獨(dú)立總體X和y都服從標(biāo)準(zhǔn)正態(tài)分布,從兩個總體中分別抽取10個和

15個樣本,則下列說法中,正確的是()

10

A.Z(X4工.)2服從自由度為10的/分布

/=1

B.fx;服從自由度為14的/分布

1510

C-ZX/2/Z^2服從自由度為15和10的〃分布

/=1;=1

1510

D.2Z甲/?ZX;)服從自由度為15和10的r分布

/=i;=1

10.根據(jù)抽樣分布重要定理,以下結(jié)論錯誤的是()

A.X服從正態(tài)分布B.f(X,—X)2服從自由度為(n-1)的二分布

/=1

C.r=?,(〃一1)D.F=?0,巧-1)

二、多項(xiàng)選擇題(在5個備選答案中選擇2-5個正確答案)

1.設(shè)X,..,X〃表示從總體X中抽出的樣本,與表示樣本觀測值,總體

的均值〃和標(biāo)準(zhǔn)差。都是未知的,以下是統(tǒng)計量的有()

A.X,B.XC.£(Xj—“)2D.fx:+5E.x_

*=1i=l

2.設(shè)總體x是標(biāo)準(zhǔn)正態(tài)分布,X'…,X”表示從總體中抽出的樣本,以下統(tǒng)

計量中,服從自由度為1的/分布的有()

2

9(>X.))

2B(k+Xjc臺DrJX+X/f2

A?X1Jo?YJ?IJu*?/y\.?

'2n2白’

3.假設(shè)總體X是標(biāo)準(zhǔn)正態(tài)分布,用X1….,X〃+:表示從總體中抽出的樣本,以

下統(tǒng)計量中,服從自由度為1的,分布的有()

X,X1+X“X+X,+X?yiX)

得|夜xV3|X4|版氏/Jx:+x;

4.假設(shè)獨(dú)立總體X.Y是標(biāo)準(zhǔn)正態(tài)分布,用X”…,X“,X….,工表示從總體

中抽出的兩個樣本,以下統(tǒng)計量中,服從尸分布的有()

X:+片x;+y2(n-DXr

A.X;/『B.C.~D.E.

X:2X:*2fx;

i=2

5.正態(tài)總體的抽樣分布定理和統(tǒng)計量,以下說法正確的是()

A.樣本均值的分布是正態(tài)分布

B.當(dāng)總體方差未知時,不能用正態(tài)分布對總體均值進(jìn)行推斷

C.當(dāng)兩個獨(dú)立總體方差己知時,應(yīng)該用/分布對均值的差異進(jìn)行推斷

D.當(dāng)兩個獨(dú)立總體方差未知且相等時,可以用,分布對均值差異進(jìn)行推斷

E.可以用/分布統(tǒng)計量對兩個獨(dú)立總體的方差是否相等進(jìn)行推斷

三、判斷分析題

1.樣本點(diǎn)是相互獨(dú)立的,并且和總體具有同一分布。

2.因?yàn)?具有可加性,所以/分布也具有可加性。

3.,分布隨機(jī)變量的平方服從產(chǎn)分布。

四、簡答題

1.什么叫抽樣分布?為什么要研究抽樣分布?

2./(勺,乙)和廠(他,勺)的百分位點(diǎn)有什么關(guān)系?

3.統(tǒng)計量的定義是什么?樣本點(diǎn)是不是統(tǒng)計量?

4.為什么說標(biāo)準(zhǔn)正態(tài)分布是抽樣分布理論的重?;A(chǔ)?

五、計算題

1.假設(shè)(X「…,X?)是來自總體的一個樣本,當(dāng)總體服從以下分布時,求

出樣本均值》的抽樣分布:(1)X?P(㈤(2)X-r(m)

2

2.查表計算下列分位數(shù):(1)I。)。,為,/(5)0,05;(2)Z(10)(X975,/(⑼。.^,

(3)%75(12,10)

O

3,分別從方差為20和35的兩正態(tài)總體中抽取容量為8和9的兩個獨(dú)立樣

本,(%…(匕試計算P(S:>2S;)。

4.設(shè)(X,..,X〃,X用…是來自正態(tài)總體N(0,/)的樣本,試求

下列統(tǒng)計量的分布

而力X,

忐X;

(1)i=l

Y=——產(chǎn)n+m°

心x;

V/=/?+1/=/?+!

第6章抽樣分布參考答案

一、單選題

1~5:DBCAD;6~10:CCADBo

二、多選題

1.ABCDE;2.ABD;3.ABC;4.ACD;5.ADE;6.ADE。

三、判斷分析題

1.正確,在統(tǒng)計推斷口,假設(shè)總體是無限總體,因而無論采用何種抽樣方式,

樣本都是相互獨(dú)立的,樣本與總體的同分布性是由樣本抽樣時的隨機(jī)原則決定

的。

2.錯誤,,分布不具有可加性,假設(shè)有兩個獨(dú)立的,統(tǒng)計量,自由度分別為,〃

vV

和小則根據(jù)/分布的構(gòu)造,。=———小=——ro即使假定x,y,*S2

S、7mS2/\Jn

cy_i_cv

相互獨(dú)立,t.+t2=-=——7^=,通分計算后分子不再服從卡方分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論