統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布_第1頁
統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布_第2頁
統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布_第3頁
統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布_第4頁
統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布第6章統(tǒng)計量及其抽樣分布統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布學(xué)習(xí)目標(biāo)了解統(tǒng)計量及其分布的幾個概念了解由正態(tài)分布導(dǎo)出的幾個重要分布

理解樣本均值的分布與中心極限定理掌握單樣本比例和樣本方差的抽樣分布統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.1統(tǒng)計量統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.1.1參數(shù)和統(tǒng)計量1.參數(shù)參數(shù)是總體參數(shù)的簡稱,是反映總體數(shù)量特征的指標(biāo),其數(shù)值是唯一的、確定的,但往往是未知的。最常用的參數(shù)有總體均值(記為)、總體比率(記為)和總體方差(記為)。2.統(tǒng)計量統(tǒng)計量是樣本統(tǒng)計量的簡稱,是由樣本中單位的變量值計算得到的反映樣本數(shù)量特征的指標(biāo),其數(shù)值是不確定的,隨機(jī)的。最常用的統(tǒng)計量有樣本平均數(shù)(記為)、樣本比率(記為p)、樣本方差(記為)。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布統(tǒng)計量

(statistic)設(shè)X1,X2,…,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,…,Xn),不依賴于任何未知參數(shù),則稱函數(shù)T(X1,X2,…,Xn)是一個統(tǒng)計量樣本均值、樣本比例、樣本方差等都是統(tǒng)計量統(tǒng)計量是樣本的一個函數(shù)統(tǒng)計量是統(tǒng)計推斷的基礎(chǔ)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.2關(guān)于分布的幾個概念6.2.1抽樣方法6.2.2抽樣分布6.2.3抽樣分布的形態(tài)與中心極限定理統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布抽樣方法重復(fù)抽樣和不重復(fù)抽樣1.重復(fù)抽樣:是指從N個總體單位中,抽取一個單位進(jìn)行觀察、記錄后放回去,然后再抽取下一個單位,這樣連續(xù)抽取n個單位組成樣本的方法,也稱回置式抽樣。

M=N2.不重復(fù)抽樣:是指從N個總體單位中,抽取一個單位進(jìn)行觀察、記錄后,不再放回去,再抽取下一個單位,這樣連續(xù)抽取n個單位組成樣本的方法。n統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例如:從A、B、C、D四個單位中,抽出兩個單位構(gòu)成一個樣本,問可能組成的樣本數(shù)目是多少?重復(fù)抽樣AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42

=16(個樣本)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布

1.抽樣分布的概念某個統(tǒng)計量對應(yīng)的頻率分布或概率分布稱為該統(tǒng)計量的抽樣分布。常用的抽樣分布有樣本平均數(shù)的抽樣分布、樣本比率的抽樣分布、樣本方差的抽樣分布。6.2.2抽樣分布

(samplingdistribution)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布【例】假設(shè)一個總體包含6個單位,分別是。采取重復(fù)抽樣的方法,從中抽取2個單位組成樣本,試描述的抽樣分布。解:首先考慮總體的分布情況。顯然總體服從均勻分布:x123456P(x)1/61/61/61/61/61/61)樣本平均數(shù)的抽樣分布統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布總體均值為:總體方差為:統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布采取重復(fù)抽樣的方法從N=6個單位中抽取n=2個單位組成樣本,一共可以抽取個樣本,對應(yīng)的可以計算出36個。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布表所有容量為2的樣本及其平均數(shù)第二次抽取123456第一次抽取11,1(1.0)1,2(1.5)1,3(2.0)1,4(2.5)1,5(3.0)1,6(3.5)22,1(1.5)2,2(2.0)2,3(2.5)2,4(3.0)2,5(3.5)2,6(4.0)33,1(2.0)3,2(2.5)3,3(3.0)3,4(3.5)3,5(4.0)3,6(4.5)44,1(2.5)4,2(3.0)4,3(3.5)4,4(4.0)4,5(4.5)4,6(5.0)55,1(3.0)5,2(3.5)5,3(4.0)5,4(4.5)5,5(5.0)5,6(5.5)66,1(3.5)6,2(4.0)6,3(4.5)6,4(5.0)6,5(5.5)6,6(6.0)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布表8-2的抽樣分布頻數(shù)頻率p()

1.011/361.522/362.033/362.544/363.055/363.566/364.055/364.544/365.033/365.522/366.011/36統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布

我們分別繪制總體分布圖和抽樣分布圖:

P(x)xx的分布

P()的分布統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布從這兩個分布圖中我們可以看到,在本例中,雖然總體服從均勻分布,但經(jīng)過抽樣平均后,樣本平均數(shù)的抽樣分布是對稱的有了抽樣分布的基本印象后,我們還可以進(jìn)一步探索的數(shù)量特征、分布的形態(tài)以及抽樣平均誤差。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布1.的數(shù)學(xué)期望

統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布2.的方差統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布3.的抽樣平均誤差4.修正系數(shù)上述結(jié)論是在重復(fù)抽樣的條件下得到的,如果是有限總體且不重復(fù)抽樣,當(dāng)樣本容量超過總體容量的5%時,要對樣本方差進(jìn)行修正,修正系數(shù)為統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布這時樣本方差為:的抽樣平均誤差為:

統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布此公式說明,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,與樣本容量成反比。(當(dāng)總體標(biāo)準(zhǔn)差未知時,可用樣本標(biāo)準(zhǔn)差代替)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布

例:

某討論小組有A,B,C,D四名同學(xué),其統(tǒng)計學(xué)作業(yè)分?jǐn)?shù)分別為80,90,70,60分,現(xiàn)從中有放回地隨機(jī)抽取兩名同學(xué),試計算樣本平均分?jǐn)?shù)的抽樣平均誤差解:總體均值和總體方差分別為

因此,抽樣平均誤差為統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布不重復(fù)抽樣的平均誤差一定會小于重復(fù)抽樣的平均誤差(為什么?)采用不重復(fù)抽樣:公式表明:抽樣平均誤差不僅與總體變異程度、樣本容量有關(guān),而且與總體單位數(shù)的多少有關(guān)。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例題1:某廠生產(chǎn)一種新型燈泡共2000只,隨機(jī)抽出400只作耐用時間試驗(yàn),測試結(jié)果平均使用壽命為4800小時,樣本標(biāo)準(zhǔn)差為300小時,求抽樣平均誤差?統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布解:

計算結(jié)果表明:根據(jù)部分產(chǎn)品推斷全部產(chǎn)品的平均使用壽命時,采用不重復(fù)抽樣比重復(fù)抽樣的平均誤差要小。已知:則:N=2000n=400s=300x=4800統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.2.3

抽樣分布的形態(tài)與中心極限定理統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過程統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布由【例】我們自然會做出如下合理的推測:當(dāng)總體中包含的單位非常多,我們抽取的樣本容量足夠大時,的抽樣分布會越來越趨近于正態(tài)分布。大量的試驗(yàn)表明,無論總體服從什么分布,只要總體方差已知,樣本容量足夠大,樣本平均數(shù)近似服從正態(tài)分布,這個結(jié)論就是著名的中心極限定理。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布其中:—樣本平均數(shù)的數(shù)學(xué)期望,

—樣本平均數(shù)的方差,

數(shù)學(xué)表達(dá)式表示為理解中心極限定理時注意點(diǎn):1.已知—

正態(tài)分布;未知—t分布2.總體分布:總體服從正態(tài)分布-條件加強(qiáng)總體偏斜-樣本容量大3.樣本容量足夠大;大于30—大樣本;小于30—小樣本統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布標(biāo)準(zhǔn)化變換

大樣本,總體方差已知條件下標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)記為

它有三個重要的性質(zhì):

統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布某汽車電瓶商聲稱其生產(chǎn)的電瓶具有均值為60個月、標(biāo)準(zhǔn)差為6個月的壽命分布,現(xiàn)假設(shè)質(zhì)監(jiān)部門決定檢驗(yàn)該廠的說法是否正確,為此隨機(jī)抽取50個該廠生產(chǎn)的電瓶進(jìn)行壽命試驗(yàn)。則:(1)假定廠商聲稱是正確的,試描述50個電瓶的平均壽命的抽樣分布;(2)假定廠商聲稱是正確的,則50個樣品組成的樣本的平均壽命不超過57個月的概率是多少?例題:統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布解:則根據(jù)中心極限定理可以推出50個電瓶的平均壽命的分布服從正態(tài)分布,即:統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布(2)如果廠方聲稱是正確的,則觀察得到的50個電池的平均壽命不超過57個月的概率為:

統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布結(jié)論:即如果廠方的說法正確,則50個電瓶的平均壽命不超過57個月的概率為,這是一個不可能事件。根據(jù)小概率事件原理,觀察到50個電瓶的平均壽命小于或等于57個月的事件是不可能的;反之,如果真的觀察得到50個電瓶的平均壽命低于57個月,則有理由懷疑廠方說法的正確性,即可認(rèn)為廠方的說法是不正確的。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.3樣本比例的抽樣分布統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布

1、只表現(xiàn)為是與否、有或無的標(biāo)志,稱為是非標(biāo)志,也稱為交替標(biāo)志。成數(shù):總體中,交替標(biāo)志只有兩種表現(xiàn),我們把具有某種表現(xiàn)或不具有某種表現(xiàn)的單位數(shù)占全部總體單位數(shù)的比重稱為成數(shù)。N1表示具有某種標(biāo)志的單位數(shù);N0表示不具有某種標(biāo)志的單位數(shù)

P和q分別表示具有與不具有某種標(biāo)志的成數(shù)

P+q=1或q=1-p成數(shù)(是非標(biāo)志的方差與標(biāo)準(zhǔn)差)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布交替標(biāo)志的平均數(shù)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布XfXf1N1(P)P1-p(1-P)2P(1-P)20N2(1-p)0-pP2(1-P)P2合計1P--P(1-P)2+P2(1-P)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.3樣本比例的抽樣分布

總體(或樣本)中具有某種屬性的單位數(shù)與單位總數(shù)之比(1)總體比例:(2)樣本比例:

當(dāng)

較大時,樣本比例近似服從平均數(shù)為,方差為的正態(tài)分布.即近似有(6.12)(6.13)

一般情況下,如果X是一隨機(jī)變量,C為一常數(shù),則CX與X有相同的分布形狀。設(shè)則統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例

設(shè),試描述的分布.

解:由于,則于是統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例

設(shè)某統(tǒng)計人員在其填寫的報表中有2%至少會有一處錯誤,如果檢查了一個由600份報表組成的隨機(jī)樣本,其中至少有一處錯誤的報表所占的比例在之間的概率是多少?

解:由于,得根據(jù)中心極限定理則近似有,于是

即該統(tǒng)計人員所填寫的報表中至少有一處錯誤的報表所占的比例在~之間的概率為19.02%。統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.4兩個樣本平均數(shù)和比例之差的分布

前面討論一個樣本平均數(shù)和比例的分布,有時需要比較兩個總體的平均數(shù)和比例.例如,要比較人們的購買行為中喜歡產(chǎn)品甲的比例與喜歡產(chǎn)品乙的比例;比較兩種不同投資項目的預(yù)期回報等。從而需要討論兩個樣本平均數(shù)和比例之差的分布.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布兩個樣本平均數(shù)之差的分布

設(shè)兩個總體都服從正態(tài)分布,即并且兩個隨機(jī)樣本相互獨(dú)立,則從而(6.14)(6.15)

若兩個總體都非正態(tài)分布,當(dāng)和較大時近似服從正態(tài)分布.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例

設(shè)有甲、乙兩所著名高校在某年錄取新生時,甲校的平均數(shù)為655分,標(biāo)準(zhǔn)差為20分.而乙校的平均數(shù)為625分,標(biāo)準(zhǔn)差為25分,且都服從正態(tài)分布.

現(xiàn)從甲、乙兩校各隨機(jī)抽取8名新生計算其平均分?jǐn)?shù),出現(xiàn)甲校比乙校的平均分低的可能性有多大?統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布解:

已知則甲校樣本平均數(shù)低于乙校樣本平均數(shù)的概率為

因?yàn)閮蓚€總體均為正態(tài)分布,所以8個新生的平均成績也分別為正態(tài)分布,也為正態(tài)分布,且統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布兩個樣本比例之差的分布

設(shè)兩個總體都服從二項分布,則當(dāng)和很大時,近似有并且兩個隨機(jī)樣本相互獨(dú)立,則(6.16)(6.17)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布例

一項抽樣調(diào)查表明甲城市有15%消費(fèi)者用過“圣潔”牌礦泉水,乙城市有8%消費(fèi)者用過該品牌礦泉水.設(shè)甲城市隨機(jī)抽取120人,乙城市隨機(jī)抽取140人,兩個樣本相互獨(dú)立,求不低于的概率.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布解:

已知,的抽樣分布可認(rèn)為近似服從正態(tài)分布,即于是統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.5關(guān)于樣本方差的分布

只討論總體為正態(tài)總體時樣本方差的分布.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.5.1樣本方差的抽樣分布

設(shè)為來自正態(tài)總體的隨機(jī)樣本,則樣本方差的分布為:自由度為n-1的卡方分布。(6.18)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布6.5.2兩個樣本方差比的抽樣分布

設(shè)兩個總體都服從正態(tài)分布,即且兩個隨機(jī)樣本相互獨(dú)立則(6.19)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布由正態(tài)分布導(dǎo)出的幾個重要分布

總體為正態(tài)分布時的重要抽樣分布有分布,分布和分布等.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布χ2

分布

定義6.3設(shè)隨機(jī)變量相互獨(dú)立且服從標(biāo)準(zhǔn)正態(tài)分布.則它們的平方和服從服從自由度為的分布.統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布數(shù)學(xué)期望和方差

設(shè),則

分布具有可加性.即若則統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布t

分布

定義6.4設(shè),且隨機(jī)變量和相互獨(dú)立,則服從自由度為的分布,記為.(6.2)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布t-分布

(t-distribution)提出者是WilliamGosset,也被稱為學(xué)生分布(student’st)

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布數(shù)學(xué)期望和方差

設(shè),則統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布F

分布

定義6.5設(shè),且隨機(jī)變量和相互獨(dú)立,則服從第一自由度為,第二自由度為的F

分布,記為.(6.5)F分布是統(tǒng)計學(xué)家費(fèi)希爾首先提出的—方差分析、回歸方程的顯著性檢驗(yàn)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布數(shù)學(xué)期望和方差

設(shè),則(6.6)(6.7)統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布F分布與t分布的關(guān)系

設(shè),則統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布t-分布

(用Excel計算t分布的概率和臨界值)利用Excel中的【TDIST】統(tǒng)計函數(shù),可以計算給定值和自由度時分布的概率值語法:TDIST(x,degrees_freedom,tails)利用【TINV】函數(shù)則可以計算給定概率和自由度時的相應(yīng)語法:TINV(probability,degrees_freedom)計算t分布的臨界值Excel統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布不同自由度的c2-分布c2n=1n=4n=10n=20統(tǒng)計學(xué)中的統(tǒng)計量及其抽樣分布c2-分布

(用Excel計算c2分布的概率)利用Excel提供的【CHIDIST】統(tǒng)計函數(shù),計算c2分布右單尾的概率值語法:CHIDIST(x,degrees_freedom),其中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論