版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
STATISTICS統(tǒng)計學(xué)統(tǒng)計學(xué)原理統(tǒng)計學(xué)原理統(tǒng)計學(xué)原理第4章抽樣與參數(shù)估計4.1抽樣與抽樣分布4.2參數(shù)估計的基本方法4.3總體均值的區(qū)間估計4.4總體比例的的區(qū)間估計4.5樣本容量的確定學(xué)習(xí)目標(biāo)掌握常用的概率抽樣方法理解抽樣分布的含義理解估計量與估計值的概念理解點估計與區(qū)間估計的區(qū)別掌握總體均值的區(qū)間估計方法掌握總體比例的區(qū)間估計方法掌握樣本容量的確定方法統(tǒng)計應(yīng)用
一次失敗的民意調(diào)查在1936年的美國總統(tǒng)選舉前,一份名為LiteraryDigest
雜志進行了一次民意調(diào)查。調(diào)查的焦點是誰將成為下一屆總統(tǒng)—是挑戰(zhàn)者,堪薩斯州州長AlfLandon,還是現(xiàn)任總統(tǒng)FranklinDelanoRoosevelt為了解選民意向,民意調(diào)查專家們根據(jù)電話簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表(電話和汽車在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,AlfLandon非常受歡迎。于是該雜志預(yù)測Landon將贏得選舉。但事實上是FranklinRoosevelt贏得了這次選舉調(diào)查失敗的主要原因是抽樣框出現(xiàn)了問題。在經(jīng)濟大蕭條時期由于電話和汽車并不普及,只是富裕階層才會擁有,調(diào)查有電話和汽車的人們,并不能夠反映全體選民的觀點參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計為什么要進行抽樣?如何進行抽樣?(抽樣的方法)用樣本推斷總體的科學(xué)性是什么?4.1抽樣與抽樣分布4.1.1抽樣方法概述4.1.2概率抽樣方法4.1.3抽樣分布4.1抽樣與抽樣分布4.1.1抽樣方法概述概率抽樣非概率抽樣概率抽樣
(probabilitysampling)也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的當(dāng)用樣本對總體目標(biāo)量進行估計時,要考慮到每個樣本單位被抽中的概率概率抽樣
(probabilitysampling)常用的概率抽樣方法:簡單隨機抽樣分層抽樣系統(tǒng)抽樣整群抽樣非概率抽樣
(nonprobabilitysampling)1.非概率抽樣是指抽樣時不遵循隨機原則,而是從方便、快捷出發(fā)或根據(jù)調(diào)查者主觀判斷有目的地選取樣本。2.特點操作簡便、時效快、成本低。但是,理論上不具備由樣本對總體進行推斷的依據(jù)。非概率抽樣
(nonprobabilitysampling)非概率抽樣方法:便捷抽樣判斷抽樣配額抽樣滾雪球抽樣4.1.2概率抽樣方法簡單隨機抽樣分層抽樣系統(tǒng)抽樣整群抽樣簡單隨機抽樣
(simplerandomsampling)從總體N個元素中隨機地抽取n個元素作為樣本,總體中每個元素進入樣本的概率是相等的。是最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)。簡單隨機抽樣的具體方法有擲硬幣法、擲骰子法、抽簽法、隨機數(shù)表法、計算機抽取法等。簡單隨機抽樣
(simplerandomsampling)優(yōu)點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本由于抽取概率相同,計算抽樣誤差及對總體參數(shù)進行推斷時比較容易。局限性當(dāng)N很大時,不易構(gòu)造抽樣框;或者有的情況下就構(gòu)造不出來抽樣框。抽出的單位很分散,給實施調(diào)查增加了困難沒有利用其它輔助信息以提高估計的效率(樣本的代表性問題)分層抽樣
(stratifiedsampling)也稱分類抽樣。將抽樣單位按某種特征或某種規(guī)則劃分為不同的層(類),然后從不同的層中獨立、隨機地抽取一定數(shù)量的元素組成一個樣本。分層抽樣的具體方式一般有等比例抽樣與非等比例抽樣兩種。分層抽樣
(stratifiedsampling)
分層抽樣實質(zhì)上是把科學(xué)分組方法和抽樣原理結(jié)合起來。采用分層抽樣,可以把差異程度較大的總體各單位劃分為性質(zhì)、屬性相近的若干類(層),使類(層)內(nèi)的各單位差異程度小于類(層)之間的差異程度,即類(層)內(nèi)方差小于類(層)間方差。在不同類(層)型中分別抽樣,就能使樣本單位分布更接近總體分布,從而能提高代表性,減少抽樣誤差。分層抽樣
(stratifiedsampling)優(yōu)點第一,分層抽樣除了可以對總體進行估計外,還可以對各層的子總體進行估計;第二,分層抽樣可以按自然區(qū)域或行政區(qū)域進行分層,使抽樣的組織和實施都比較方便;第三,分層抽樣的樣本分布在各個層內(nèi),從而使樣本在總體中的分布比較均勻;第四,分層抽樣可以提高估計的精度。分層抽樣
(stratifiedsampling)局限性及注意事項按一定標(biāo)志進行分類(層)時,需要詳細(xì)具體的資料,這有一定的難度;類(層)的界限必須清楚,不能發(fā)生混淆;分類(層)不宜過多過細(xì),否則將失去分類(層)的特征,不便于在每類(層)中抽樣。系統(tǒng)抽樣
(systematicsampling)也稱等距抽樣或機械抽樣先將總體各元素按某種順序排列,并按某種規(guī)則確定一個隨機起點,然后,每隔一定的間隔抽取一個元素,直至抽取九個元素形成一個樣本。系統(tǒng)抽樣
(systematicsampling)系統(tǒng)抽樣
(systematicsampling)優(yōu)點:第一,簡便易行.當(dāng)抽樣樣本量很大時,有了總體元素的排序,只要確定出抽樣的起點和間隔后,樣本元素也就隨之確定,而且可以利用現(xiàn)有的排列。第二,系統(tǒng)抽樣的樣本在總體中的分布一般也比較均勻,由此抽樣誤差通常要小于簡單隨機抽樣.如果掌握了總體的有關(guān)信息,將總體各元素按有掣標(biāo)志排列,就可以提高估計的精度。系統(tǒng)抽樣
(systematicsampling)局限性:運用等距抽樣的前提是要有總體每個單位的有關(guān)材料,特別是按有關(guān)標(biāo)志排隊時,往往需要有較為詳細(xì)、具體的相關(guān)資料當(dāng)抽樣間隔和被調(diào)查對象本身的節(jié)奏性(或循環(huán)周期)重合時,就會影響調(diào)查的精度。等距抽樣的抽樣誤差計算較為復(fù)雜。
整群抽樣
(clustersampling)是先將總體按一定標(biāo)準(zhǔn)劃分成群,然后以群為單位按隨機原則從總體中抽取若干群,最后由被抽中各群中的每一個單位組成樣本。例如,在對居民收入情況進行調(diào)查時,若以居民小組為群,抽樣時可先抽取居民小組,再調(diào)查每個被抽到的居民小組中的每一居民戶。整群抽樣
(clustersampling)優(yōu)點抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便調(diào)查的實施局限性整群抽樣中樣本只能集中在若干群中,不能均勻地分布在總體的各個部分,用以推斷總體的準(zhǔn)確性較差。但當(dāng)群體內(nèi)各單位間的差異性大,而群與群之間差異性小時,采用此法可以提高樣本的代表性。本節(jié)小結(jié)對以上幾種概率抽樣方法的應(yīng)用和選擇,應(yīng)主要考慮這樣幾個因素:一是對抽樣誤差大小的要求;二是調(diào)查對象本身的特點;三是人力、物力、經(jīng)費和時間等各種調(diào)查條件的限制。4.1.2抽樣分布統(tǒng)計量是用來描述樣本特征的概括性度量,比如樣本均值、比例p、方差σ2等。統(tǒng)計量是樣本的函數(shù).統(tǒng)計量是一個隨機變量。(由于不同的樣本計算出來的統(tǒng)計量的值是不同的)抽樣分布就是在總體給定,樣本容量給定的情況下,一個樣本統(tǒng)計量所有可能取值形成的相對頻數(shù)分布。抽樣分布
(samplingdistribution)是一種理論分布。(實際中不可能將所有樣本都抽出來)提供了樣本統(tǒng)計量長遠而穩(wěn)定的信息,是進行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。種類:樣本均值的抽樣分布,樣本比例的抽樣分布,樣本方差的抽樣分布等。 抽樣分布
(samplingdistribution)容量相同的所有可能樣本的樣本均值的概率分布(相對頻數(shù)分布)。進行推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布
(例題分析)【例】假設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布
(例題分析)
現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布
(例題分析)計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布
(例題分析)
的個數(shù)取值的概率(相對頻數(shù)分布)1.011/161.522/162.033/162.544/163.033/163.522/164.011/16樣本均值的分布X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5分布形狀均值(數(shù)學(xué)期望)方差樣本均值的分布與總體分布的比較
(例題分析)=2.5σ2=1.25樣本均值分布總體分布14230.1.2.3X1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的抽樣分布
與中心極限定理=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為
2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X中心極限定理
(centrallimittheorem)x的分布趨于正態(tài)分布的過程抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為
樣本比例的抽樣分布
(比例—proportion)在重復(fù)選取樣本量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數(shù)分布。當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似。若np≥5和n(1-p)≥5,就可認(rèn)為樣本量足夠大。樣本比例的抽樣分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布
(數(shù)學(xué)期望與方差)統(tǒng)計量的標(biāo)準(zhǔn)誤樣本統(tǒng)計量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計量的標(biāo)準(zhǔn)誤,有時也稱為標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤衡量的是統(tǒng)計量的離散程度,它測度了用樣本統(tǒng)計量估計總體參數(shù)的精確程度。當(dāng)計算標(biāo)準(zhǔn)誤時涉及的總體參數(shù)未知時,用樣本統(tǒng)計量代替計算的標(biāo)準(zhǔn)誤,稱為估計的標(biāo)準(zhǔn)誤,也稱估計標(biāo)準(zhǔn)誤差。統(tǒng)計量的標(biāo)準(zhǔn)誤4.2.1估計量與估計值
4.2.2點估計與區(qū)間估計4.2參數(shù)估計的基本原理4.2.1估計量與估計值參數(shù)估計(parameterestimation)就是用樣本統(tǒng)計量去估計總體的參數(shù)估計量:用于估計總體參數(shù)的統(tǒng)計量的名稱如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值的一個估計量參數(shù)用表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值x=80,則80就是的估計值估計量與估計值
(estimator&estimatedvalue)4.2.2點估計與區(qū)間估計點估計
(pointestimate)用樣本的估計量的某個取值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計;用兩個樣本均值之差直接作為總體均值之差的估計無法給出估計值接近總體參數(shù)程度的信息由于樣本是隨機的,抽出一個具體的樣本得到的估計值很可能不同于總體真值一個點估計量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的,這表明一個具體的點估計值無法給出估計的可靠性的度量區(qū)間估計
(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個估計區(qū)間,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班級平均分?jǐn)?shù)在75~85之間,置信水平是95%
樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x區(qū)間估計的圖示Z01.96-1.96Tm+=sXZX95%2.5%2.5%區(qū)間估計的圖示(未知)x1.96x95%1.96xx2±x1±x3±1.96x1.96x1.96x估計誤差估計誤差區(qū)間估計
(intervalestimate)從同一總體按同一樣本容量可以抽取很多種樣本組合。由不同的樣本組合得到不同的樣本均值,每個樣本均值都可加減1.96x構(gòu)成一個區(qū)間。但這些區(qū)間并不是都能把總體均值包含在內(nèi)。只有在抽樣分布圖中處在陰影區(qū)域的任意一個樣本均值才能夠構(gòu)造一個包含總體均值在內(nèi)的區(qū)間。由于所有可能的樣本均值有95%處在陰影區(qū)域內(nèi),故樣本均值加減1.96x所形成的所有區(qū)間中也有95%的區(qū)間會包括總體均值在內(nèi)。一般地,如果將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,所有可能構(gòu)建的區(qū)間中能夠包含真實總體參數(shù)的區(qū)間個數(shù)占所有可能區(qū)間的比例稱為置信水平。也稱為置信度或置信系數(shù)。(前面的95%就是一個置信水平)一般來說,置信度可以用(1-α)×100%表示,其中α是區(qū)間估計的顯著性水平,是所有可能構(gòu)建的區(qū)間中不包含真實總體參數(shù)的區(qū)間個數(shù)占所有可能區(qū)間的比例。α的取值大小由實際問題確定。經(jīng)常取為0.01,0.05,0.10,相應(yīng)的常用置信水平為99%,95%,90%。置信水平
(confidencelevel)
由樣本估計量構(gòu)造出的總體參數(shù)在一定置信水平下的估計區(qū)間統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進行表述置信區(qū)間的表述
(confidenceinterval)總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實際估計時往往只抽取一個樣本,此時所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。這個區(qū)間是特定的,我們只能希望它是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間的表述
(confidenceinterval)置信區(qū)間的表述
(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個樣本構(gòu)造出的20個置信區(qū)間我沒有抓住參數(shù)!點估計值圖有問題,區(qū)間寬度不一致一個特定的區(qū)間總是“包含”或“絕對不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問題置信水平只是告訴我們在多次估計得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取的這個樣本所構(gòu)建的區(qū)間而言的置信區(qū)間的表述
(confidenceinterval)4.3.1正態(tài)總體、方差已知或非正態(tài)總體、大樣本
4.2.2正態(tài)總體、方差未知、小樣本4.3總體均值的區(qū)間估計4.3.1正態(tài)總體、方差已知
或非正態(tài)總體、大樣本總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)
已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n
30)樣本均值的抽樣分布服從正態(tài)分布,進行標(biāo)準(zhǔn)化使用正態(tài)分布統(tǒng)計量z總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)
給定置信度1-,可由標(biāo)準(zhǔn)正態(tài)分布表查得臨界值Z/2(怎么查?)
,即,因為,把其帶入上式,并作變換,因此,在置信度1-下,總體均值μ的置信區(qū)間就是,總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:。由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.3】一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間
36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:,
總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲總體均值的區(qū)間估計
(例題分析)【例】ABB公司是一家專營體育設(shè)備的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,ABB公司每月都要隨機的抽取一個顧客樣本進行調(diào)查以了解顧客的滿意度分?jǐn)?shù)(從0到100)。根據(jù)以往的調(diào)查,滿意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對100名顧客的抽樣顯示,滿意分?jǐn)?shù)的樣本均值為82分,試建立總體平均滿意分?jǐn)?shù)的區(qū)間。總體均值的區(qū)間估計
(例題分析)解:已知置信度為95%,得α=1-95%=0.05。查標(biāo)準(zhǔn)正態(tài)分布表,上側(cè)面積α/2=0.025對應(yīng)的Z值Z0.025=1.96。1-a=95%a/2=0.025a/2=0.0250+1.96-1.96總體均值的區(qū)間估計
(例題分析)題中,已知樣本均值x=82,總體標(biāo)準(zhǔn)差亦假定已知,σ=20,樣本容量n=100,于是使用前面的公式,得到:即,(78.08,85.92),總體平均滿意分?jǐn)?shù)95%的置信區(qū)間為78.08分~85.92分。常用的置信水平與臨界值的對應(yīng)除了95%的置信水平經(jīng)常使用外,也可以根據(jù)需要使用90%,99%等置信水平。我們可以把最經(jīng)常使用的一些置信水平所對應(yīng)的事先求出來,然后直接使用。(不用再查正態(tài)分布表,直接記住即可)常用的置信水平與臨界值的對應(yīng)置信水平αα/2Zα/290%95%99%0.100.050.010.050.0250.0051.6451.962.58樣本容量一定,置信水平與置信區(qū)間的關(guān)系
(區(qū)間估計的可靠度與精度的關(guān)系)樣本容量一定置信水平一定,樣本容量與置信區(qū)間的關(guān)系n=100樣本容量一定n=200200當(dāng)置信水平一定時,置信區(qū)間的寬度隨樣本量的增大而減小。置信水平為95%4.3.2正態(tài)總體、方差未知、小樣本總體均值的區(qū)間估計
(正態(tài)總體、方差未知、小樣本)1. 假定條件總體服從正態(tài)分布,但方差(2)
未知小樣本(n<30)樣本均值經(jīng)過標(biāo)準(zhǔn)化后的分布為t分布使用t
分布統(tǒng)計量t分布
t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z總體均值的區(qū)間估計
(正態(tài)總體、方差未知、小樣本)總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計
(正態(tài)總體、方差未知、小樣本)【例5.3】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計
(正態(tài)總體、方差未知、小樣本)解:已知X~N(,2),n=16,1-=95%,t/2=2.131
根據(jù)樣本數(shù)據(jù)計算得:,
總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2h總體均值的區(qū)間估計
(小結(jié))總體均值的區(qū)間估計
(小結(jié))樣本容量總體分布σ已知σ未知大樣本正態(tài)非正態(tài)小樣本正態(tài)非正態(tài)增大樣本容量至大樣本
4.4總體比例的區(qū)間估計總體比例的區(qū)間估計我們在實際工作中時常會碰到對總體比例的估計問題。例如:企業(yè)領(lǐng)導(dǎo)想知道本企業(yè)生產(chǎn)的產(chǎn)品中合格品率是多少?商店經(jīng)理想了解對他們服務(wù)滿意的顧客在全部顧客中所占的比率等等。想了解某人群中男女的比例是多少?想了解某產(chǎn)品的普及率是多少?民意調(diào)查中支持某候選人的比例是多少?總體比例的區(qū)間估計
(一個總體比例)1. 假定條件np(成功次數(shù))和n(1-p
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024屆高考語文一輪復(fù)習(xí)第2章小說閱讀3第二節(jié)分析情節(jié)結(jié)構(gòu)-精構(gòu)情節(jié)講好故事課件
- 預(yù)防青少年犯罪法制教育課
- 16.2《登泰山記》課件 2024-2025學(xué)年統(tǒng)編版高中語文必修上冊
- 遼寧省葫蘆島市八中2025屆高三(最后沖刺)語文試卷含解析
- 江蘇省無錫市惠山六校聯(lián)考2025屆高三第一次調(diào)研測試語文試卷含解析
- 湖北省荊州市重點中學(xué)2025屆高三適應(yīng)性調(diào)研考試英語試題含解析
- 湖北省仙桃市漢江高級中學(xué)2025屆高三六校第一次聯(lián)考語文試卷含解析
- 現(xiàn)代學(xué)徒制課題:中國特色學(xué)徒制建設(shè)標(biāo)準(zhǔn)體系研究(附:研究思路模板、可修改技術(shù)路線圖)
- 內(nèi)蒙古阿拉善2025屆高考仿真卷英語試卷含解析
- 貴州省鳳岡縣第二中學(xué)2025屆高考語文考前最后一卷預(yù)測卷含解析
- 隧道工程施工環(huán)境保護措施
- 網(wǎng)絡(luò)運行以及維護
- 土木工程材料-說課
- 人教版道德與法治小學(xué)四年級上冊知識點匯總
- 小學(xué)生保險知識講座
- 2024年中國龍江森林工業(yè)集團招聘筆試參考題庫含答案解析
- 2023-2024學(xué)年秋季小學(xué)三年級上冊語文部編版課后作業(yè)第22課《讀不完的大書》(含答案)
- 投資項目居間協(xié)議書
- 高中學(xué)學(xué)生社團章程
- 口腔門診驗收管理制度
- 滿堂腳手架安全技術(shù)交底
評論
0/150
提交評論