版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
抽樣與參數(shù)估計1第1頁,共71頁,2023年,2月20日,星期一
第6章抽樣(Sampling)
與參數(shù)估計(Estimate)
學(xué)習(xí)目的和要求學(xué)習(xí)重點學(xué)習(xí)難點
教學(xué)方法
授課時數(shù)
基本內(nèi)容
2第2頁,共71頁,2023年,2月20日,星期一學(xué)習(xí)目的與要求通過本章學(xué)習(xí)能理解參數(shù)估計的一般問題;掌握參數(shù)的區(qū)間估計并會對樣本容量的確定掌握。3第3頁,共71頁,2023年,2月20日,星期一學(xué)習(xí)重點均值的區(qū)間估計方法的應(yīng)用成數(shù)的區(qū)間估計方法的應(yīng)用
4第4頁,共71頁,2023年,2月20日,星期一學(xué)習(xí)難點在不同條件下的區(qū)間估計5第5頁,共71頁,2023年,2月20日,星期一教學(xué)方法
討論講授6第6頁,共71頁,2023年,2月20日,星期一基本內(nèi)容第1節(jié)抽樣與抽樣分布第2節(jié)參數(shù)估計的基本方法
第3節(jié)總體均值的區(qū)間估計第4節(jié)總體比例的區(qū)間估計第5節(jié)樣本容量的確定第6節(jié)其它抽樣方法及其抽樣分布特征7第7頁,共71頁,2023年,2月20日,星期一抽樣法的特點:隨機原則部分估計總體存在誤差并可以控制抽樣法的應(yīng)用:對某些不可能進(jìn)行全面調(diào)查而又需要了解其全面情況的社會經(jīng)濟現(xiàn)象,必須應(yīng)用抽樣法。(破壞性試驗、總體過大、單位過于分散,實際調(diào)查不可能的)8第8頁,共71頁,2023年,2月20日,星期一第1節(jié)抽樣與抽樣分布
一、有關(guān)抽樣的基本概念
總體(母體)(Population)樣本(子樣)(Sample)總體指標(biāo)(總體參數(shù))(Populationparameter)樣本指標(biāo)(樣本統(tǒng)計量)(Samplestatistic)9第9頁,共71頁,2023年,2月20日,星期一抽樣方法
重置抽樣(重復(fù)抽樣)(Samplingwithreplacement)
要從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,把順序號登記下來之后,重新放回參加下一次抽選,連續(xù)反復(fù)抽取n次組成所要求容量的樣本。不重置抽樣(不重復(fù)抽樣)(Samplingwithoutreplacement)
要從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,被抽中的單位不再放回參加下一次抽選,連續(xù)進(jìn)行次便組成樣本。不重復(fù)抽樣所得樣本對總體的代表性較大,抽樣誤差較小,所以實踐中通常采用不重復(fù)抽樣。
10第10頁,共71頁,2023年,2月20日,星期一
概率抽樣的組織方式簡單隨機抽樣:從總體中抽取樣本最常用的方法。從容量為N的總體中進(jìn)行抽樣,如果容量為n的每個可能樣本被抽到的可能性相等,則稱容量為n的樣本為簡單隨機樣本。分層抽樣:也稱分類抽樣或類型抽樣,它是按某個主要標(biāo)志對總體各單位進(jìn)行分類,然后從各層中按隨機原則分別抽取一定數(shù)目的單位構(gòu)成樣本。等距抽樣也稱機械抽樣或系統(tǒng)抽樣。它是先將總體單位按一定順序排隊,計算出抽樣間隔(或抽樣距離),然后按固定的順序和間隔抽取樣本單位。整群抽樣:也稱叢聚抽樣或集團抽樣。它是將總體分為若干部分(每一部分稱為一個群),然后按隨機原則從中一群一群地抽選,對抽中群內(nèi)的所有單位進(jìn)行全面調(diào)查。11第11頁,共71頁,2023年,2月20日,星期一總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布
(populationdistribution)總體12第12頁,共71頁,2023年,2月20日,星期一一個樣本中各觀察值的分布也稱經(jīng)驗分布當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布樣本分布
(sampledistribution)樣本13第13頁,共71頁,2023年,2月20日,星期一二、抽樣分布
(Samplingdistribution)
1、抽樣分布的意義
對統(tǒng)計量的所有可能取值及其對應(yīng)概率的描述,就是統(tǒng)計量的抽樣分布,即抽樣分布。抽樣分布反映樣本統(tǒng)計量的分布特征,根據(jù)抽樣分布的規(guī)律,可揭示樣本統(tǒng)計量與總體參數(shù)之間的關(guān)系,計算抽樣誤差,并說明抽樣推斷的可靠程度。
14第14頁,共71頁,2023年,2月20日,星期一抽樣分布
(samplingdistribution)總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本15第15頁,共71頁,2023年,2月20日,星期一例:樣本均值的抽樣分布
【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差16第16頁,共71頁,2023年,2月20日,星期一現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有4×4=16個樣本。所有樣本的結(jié)果為
3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)17第17頁,共71頁,2023年,2月20日,星期一計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布
3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.518第18頁,共71頁,2023年,2月20日,星期一樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X19第19頁,共71頁,2023年,2月20日,星期一2、樣本均值的抽樣分布
樣本平均數(shù)的標(biāo)準(zhǔn)差反映了樣本平均數(shù)與總體平均數(shù)的平均誤差,故稱之為抽樣平均誤差(或抽樣標(biāo)準(zhǔn)差)。計算公式:(重復(fù)抽樣)可見,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比變化,與樣本容量的平方根成反比變化。當(dāng)總體為正態(tài)分布時,對于任何樣本容量,樣本平均數(shù)的抽樣分布是正態(tài)分布。若總體方差σ2未知,則可用樣本方差s2取而代之。樣本容量很大,無論總體分布如何,樣本平均數(shù)近似服從正態(tài)分布。
20第20頁,共71頁,2023年,2月20日,星期一3、樣本比例的抽樣分布
當(dāng)從總體中抽出一個容量為n的樣本時,樣本比例服從二項分布。當(dāng)n→∞時,二項分布趨近于正態(tài)分布。所以,在大樣本下,若np≥5且n(1-p)≥5,樣本比例p近似服從正態(tài)分布。比例的抽樣平均誤差(重復(fù)抽樣)式中,P為總體比例,實際計算時通常采用以往經(jīng)驗數(shù)據(jù)或樣本比例。21第21頁,共71頁,2023年,2月20日,星期一例:燈泡廠從10000只燈泡中隨機抽取500只檢查其耐用時數(shù),結(jié)果如下表。該廠規(guī)定耐用時數(shù)在850以下為不合格。求平均耐用時數(shù)及不合格率的抽樣平均誤差。耐用時數(shù)燈泡數(shù)xxf800-850850-900900-950950-10001000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合計500——462500147500022第22頁,共71頁,2023年,2月20日,星期一解:重復(fù)抽樣條件下不重復(fù)抽樣條件下23第23頁,共71頁,2023年,2月20日,星期一練習(xí):1、從某大學(xué)學(xué)生中隨機抽選100名調(diào)查體重,結(jié)果平均體重為58千克。根據(jù)過去的資料知道該校學(xué)生體重標(biāo)準(zhǔn)差為10千克。求抽樣誤差。2、某工廠共生產(chǎn)新型聚光燈2000只,隨機抽選400只進(jìn)行耐用時間調(diào)查,結(jié)果平均壽命為4800小時,標(biāo)準(zhǔn)差為300小時。求抽樣誤差。3、從某校學(xué)生中隨機抽選400名,發(fā)現(xiàn)戴眼鏡的有80人。計算求抽樣誤差。4、一批食品罐頭60000桶,隨機抽查300桶,有6桶不合格。求合格率的抽樣誤差。5、假設(shè)4個人工資分別為:400、500、700、800元,現(xiàn)隨機抽選2人進(jìn)行調(diào)查。(1)驗證(2)計算重復(fù)抽樣及不重復(fù)抽樣的抽樣平均誤差。24第24頁,共71頁,2023年,2月20日,星期一第2節(jié)參數(shù)估計的基本方法
參數(shù)估計——以實際觀察的樣本數(shù)據(jù)所計算的統(tǒng)計量作為未知總體參數(shù)的估計值。一、點估計(Pointestimate)點估計也稱定值估計,就是直接以樣本統(tǒng)計量作為總體參數(shù)的估計值。點估計的優(yōu)點是它提供了總體參數(shù)的具體估計值,可作為決策的依據(jù),其缺點是不能提供有關(guān)抽樣誤差的信息。樣本均值是總體均值μ的點估計量,樣本方差s2是總體方差σ2的點估計量,樣本比例p是總體比例P的點估計量。優(yōu)良估計量的標(biāo)準(zhǔn):無偏性有效性一致性25第25頁,共71頁,2023年,2月20日,星期一二、區(qū)間估計(Intervalestimate)
抽樣誤差統(tǒng)計調(diào)查的誤差,是指調(diào)查所得結(jié)果與總體真值之間的差異。誤差的來源有登記性誤差和代表性誤差兩大類。代表性誤差分為系統(tǒng)性誤差和偶然性誤差。抽樣估計中所謂的抽樣誤差,就是指這種偶然性誤差或隨機誤差。(1)實際抽樣誤差。指某一特定樣本的樣本估計值與總體參數(shù)真值之間的離差。(2)抽樣平均誤差。統(tǒng)計學(xué)中常用標(biāo)準(zhǔn)差來衡量均值的代表性,所以抽樣平均誤差可以衡量樣本對總體的代表性大小。(3)抽樣極限誤差。指一定概率條件下抽樣誤差的可能范圍,也稱允許誤差。抽樣極限誤差的可能范圍與抽樣估計的可能性即概率緊密相聯(lián)。26第26頁,共71頁,2023年,2月20日,星期一樣本平均數(shù)的抽樣極限誤差樣本比例的抽樣極限誤差抽樣誤差與抽樣可靠性的關(guān)系27第27頁,共71頁,2023年,2月20日,星期一影響抽樣誤差的主要因素
1、抽樣單位數(shù)的多少。在其它條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差愈??;反之抽樣單位數(shù)愈少,抽樣誤差就愈大。
2、總體離散程度的高低。當(dāng)其它條件不變時,總體離散程度愈低,抽樣誤差愈小;反之總體離散程度愈高,抽樣誤差愈大。
3、抽樣方法
4、組織方式28第28頁,共71頁,2023年,2月20日,星期一
第3節(jié)總體均值的區(qū)間估計一、區(qū)間估計的基本原理1、大數(shù)定律大數(shù)定律主要是說明:當(dāng)n足夠大時,獨立同分布的隨機變量的算術(shù)平均數(shù)趨近于數(shù)學(xué)期望;事件發(fā)生的頻率接近于其發(fā)生的概率。即樣本統(tǒng)計量接近于總體參數(shù)。2、中心極限定理中心極限定理是說明:當(dāng)n充分大時,大量的起微小作用的相互獨立的隨機變量之和趨于正態(tài)分布。29第29頁,共71頁,2023年,2月20日,星期一大樣本(n≥30)下總體均值的區(qū)間估計
區(qū)間估計就是根據(jù)樣本求出總體未知參數(shù)的估計區(qū)間,并使其可靠程度達(dá)到預(yù)定要求。(1)
總體方差σ2已知時由于,所以對于給定的置信度1-α,有即可見,極限誤差的計算公式為則總體均值的置信區(qū)間為30第30頁,共71頁,2023年,2月20日,星期一例:從某大學(xué)學(xué)生中隨機抽取100名調(diào)查體重情況。經(jīng)稱量和計算,得到平均體重為58千克。根據(jù)過去的資料知道大學(xué)生體重的標(biāo)準(zhǔn)差是10千克。在95%的置信水平下,求該大學(xué)學(xué)生平均體重的置信區(qū)間。
解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)
=1.96×1=1.96(千克)
置信下限為58-1.96=57.04,置信上限為58+1.96=59.96故所求置信區(qū)間為(57.04,59.96)千克。31第31頁,共71頁,2023年,2月20日,星期一
(2)
總體方差σ2未知時
由于~t(n-1),對于給定的置信度1-α,有置信下限置信上限在大樣本下,總體均值的置信區(qū)間為32第32頁,共71頁,2023年,2月20日,星期一33第33頁,共71頁,2023年,2月20日,星期一例:某進(jìn)出口公司出口一種名茶,規(guī)定每包重量不低于150克。現(xiàn)不重復(fù)抽取1%檢驗,結(jié)果如下。以95.45%的概率估計這批茶葉平均每包重量范圍,以確定該批茶葉是否達(dá)到要求。每包重量(克)包數(shù)xxf148——149149——150150——151151——15210205020148.5149.5150.5151.5148529907525303032.412.8228.8合計100——150307634第34頁,共71頁,2023年,2月20日,星期一解:在95.45%的概率保證下,
=2×0.087=0.174(g)
則總體平均數(shù)置信區(qū)間為即(150.126,150.474)之間說明該批茶葉達(dá)到要求。35第35頁,共71頁,2023年,2月20日,星期一小樣本下(n<30)總體均值的區(qū)間估計在小樣本條件下,樣本平均數(shù)的分布依賴于總體的概率分布。若總體服從正態(tài)分布,無論樣本容量如何,樣本平均數(shù)都服從正態(tài)概率分布。若總體不服從正態(tài)分布,必須擴大樣本容量。(1)總體方差σ2已知時
總體均值的置信區(qū)間為(2)總體方差σ2未知時總體均值的置信區(qū)間為(,)36第36頁,共71頁,2023年,2月20日,星期一例:某保險公司投保人年齡設(shè)某保險公司投保人年齡呈正態(tài)分布,現(xiàn)從中抽取10人,其年齡分別為:32,50,40,24,33,44,45,48,44,47歲。試以95%的置信水平估計該保險公司投保人的平均年齡。
解:當(dāng)置信度為95%時,=2.26222.6544=6.00(歲)因為40.7-6.00=34.740.7+6.00=46.7所以該保險公司投保人的平均年齡的置信區(qū)間為(34.7,46.7)歲。
37第37頁,共71頁,2023年,2月20日,星期一第4節(jié)總體比例的區(qū)間估計在大樣本條件下,若np》5,n(1-p)》5,則樣本比例趨近于正態(tài)分布。對于給定置信度,有總體比例的置信區(qū)間為小樣本條件下,不作介紹。38第38頁,共71頁,2023年,2月20日,星期一例:總體比例的區(qū)間估計
【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
39第39頁,共71頁,2023年,2月20日,星期一例:某廠對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,隨機重復(fù)抽取樣品100只,樣本合格品率為95%,試計算把握程度為90%的合格品率置信區(qū)間。
解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.645
=0.0218
Δp=zα/2=1.645×0.0218=0.0359或3.59%
95%-3.59%=91.41%,95%+3.59%=98.59%
故該批產(chǎn)品合格率的置信區(qū)間為(91.41%,98.59%)40第40頁,共71頁,2023年,2月20日,星期一練習(xí)1、從一批產(chǎn)品中按不重復(fù)隨機方法抽選1/20,共200件,其中廢品8件。當(dāng)概率保證程度為95.45%時,可否認(rèn)為該批產(chǎn)品的廢品率不超過5%?2、一電視節(jié)目主持人想了解觀眾對電視節(jié)目的喜歡情況,他選取500名觀眾作樣本,結(jié)果說喜歡該節(jié)目的175人?,F(xiàn)以95%的概率估計觀眾喜歡這一節(jié)目的區(qū)間范圍。若該主持人希望估計極限誤差不超過5%,有多大把握?3、已知煉鋼廠的鐵水含碳量在正常情況下服從正態(tài)分布,其方差為0.108×0.108,現(xiàn)測定了9爐鋼水,平均含碳量4.484。按95%的可靠程度估計該廠鐵水含碳量。41第41頁,共71頁,2023年,2月20日,星期一4.某市抽查25戶家庭用戶電力消費量,結(jié)果如下。試以95%的概率保證,估計全市家庭用戶電力平均消費量的置信區(qū)間、總消費量的置信區(qū)間及用電量在85度以上的比例。用電量(度)戶數(shù)45——5555——6565——7575——8585——9525963合計2542第42頁,共71頁,2023年,2月20日,星期一第5節(jié)樣本容量的確定
在重置抽樣下,
所以,必要抽樣單位數(shù)在不重置抽樣下,必要抽樣單位數(shù)
43第43頁,共71頁,2023年,2月20日,星期一例:某市進(jìn)行職工家庭生活費抽樣調(diào)查,已知職工家庭平均每人每月生活費收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。
解:例:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過1%,把握程度為95%,問需要抽選多少件產(chǎn)品?解:例:要調(diào)查某校大學(xué)生英語四級考試成績,假設(shè)根據(jù)歷史資料該校學(xué)生平均成績的標(biāo)準(zhǔn)差為20分,及格率為65%。現(xiàn)用重復(fù)抽樣方法,要求在95%的置信度下,平均分?jǐn)?shù)的誤差不超過2分,及格率的誤差不超過4%,求必要抽樣數(shù)目。解:44第44頁,共71頁,2023年,2月20日,星期一【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?
解:45第45頁,共71頁,2023年,2月20日,星期一影響必要抽樣數(shù)目的因素(1)允許誤差范圍Δ。當(dāng)其它條件不變時,允許誤差愈小,必要的抽樣單位數(shù)就需要愈多;反之,允許誤差愈大,抽樣單位數(shù)就可以愈少。(2)總體方差σ2。其他條件不變的情況下,總體方差σ2愈大,總體單位的差異程度愈大,則樣本單位數(shù)應(yīng)愈多;反之,樣本單位數(shù)可愈少。(3)抽樣估計的可靠程度1-α。當(dāng)其他條件不變時,抽樣估計的可靠程度愈高,zα/2數(shù)值愈大,抽樣數(shù)目就必須愈多;反之,抽樣估計的可靠程度愈低,抽樣數(shù)目就可以愈少。(4)抽樣方法。相同條件下,由于采用重復(fù)抽樣比不重復(fù)抽樣的誤差大,所以,前者應(yīng)比后者多抽一些樣本單位。除上述因素之外,抽樣組織方式也是影響抽樣單位數(shù)的一個原因。46第46頁,共71頁,2023年,2月20日,星期一練習(xí):1、假定總體為5000單位,被研究的標(biāo)志方差不小于400,抽樣極限誤差不超過3。當(dāng)概率為99.73%時,需要有多少不重復(fù)抽樣單位?(371)2、對某型號電池進(jìn)行電流強度檢查,根據(jù)以往正常生產(chǎn)經(jīng)驗,電流強度的標(biāo)準(zhǔn)差為0。4安培,合格率為90%?,F(xiàn)用重復(fù)抽樣方式,要求在95.45%的置信度下,抽樣平均電流強度的誤差范圍不超過0.08安培,抽樣合格率的極限誤差不超過5%,問必要的抽樣單位數(shù)應(yīng)為多少?(144)3、對某型號電子元件10000只進(jìn)行耐用性能檢查。根據(jù)以往抽樣測定,求得耐用時數(shù)的均方差為51.91小時,合格率的均方差為28.62%,試計算:(1)概率保證為68.27%時,元件平均耐用時數(shù)的誤差范圍不超過9小時,在重復(fù)抽樣的條件下,要抽查多少元件?(34)(2)概率保證為99.73%時,元件合格率的極限誤差不超過5%,在重復(fù)抽樣的條件下,要抽查多少元件?(295)(3)在不重復(fù)抽樣的條件下,要同時滿足上述(1)、(2)條件,要抽查多少元件?47第47頁,共71頁,2023年,2月20日,星期一4、某藥廠為了檢查瓶裝藥片數(shù)量,從成品庫隨機抽檢100瓶,結(jié)果平均每瓶101.5片,標(biāo)準(zhǔn)差為3片。試以99.73%的概率推斷成品庫中該種藥平均每瓶數(shù)量的置信區(qū)間。如果允許誤差減少到原來的1/2,其它條件不變,問需要抽取多少瓶?5、在對一條廣告效應(yīng)進(jìn)行的電話追蹤調(diào)查中,30名被追蹤者中有20名會想起廣告用語。試求在看過該廣告的所有人中,會想起廣告語的人所占比重的置信區(qū)間。(α=5%)6、設(shè)成年男子身高呈正態(tài)分布。某地區(qū)成年男子平均身高170厘米,標(biāo)準(zhǔn)差為2厘米。(1)若抽查10人,問這10人的平均身高介于166.2——173.8厘米之間的可能性有多大?(2)如果進(jìn)行一次成年男子身高的抽樣調(diào)查,要求以95%的把握程度保證誤差不超過3厘米,問需抽查多少人?(3)如果以95%的把握保證誤差不超過1.5厘米,問需抽查多少人?這一結(jié)果與上一結(jié)果有何關(guān)系?(4)如果允許誤差仍為1.5厘米,但要求保證程度提高到99.73%,問需要抽查多少人?48第48頁,共71頁,2023年,2月20日,星期一7、某公司電話咨詢服務(wù)部門在每次通話結(jié)束時都要記下通話時間,從一個由16個記錄組成的隨機樣本得出平均一次通話時間為16分鐘。已知總體服從正態(tài)分布,其標(biāo)準(zhǔn)差為0.7分鐘。試以95.45%的概率推斷總體均值的置信區(qū)間。8、某公司推出一種營養(yǎng)型豆奶,為了做好促銷工作,隨機地選取顧客詢問喜歡此豆奶情況。若要使置信度為95%,抽樣誤差不超過0.05,在下列情況下,你建議樣本的容量為多大?(1)假如初步估計約有60%的顧客喜歡此豆奶;(2)假如無任何資料可用來估計喜歡此豆奶的比例。9、對某磚廠產(chǎn)品質(zhì)量進(jìn)行抽樣調(diào)查,要求抽樣誤差不超過0.01111,概率把握程度為0.9545。已知過去進(jìn)行的幾次同樣調(diào)查所得不合格產(chǎn)品比例為1.25%、1.23%、1.14%,試確定必要的抽樣數(shù)目。49第49頁,共71頁,2023年,2月20日,星期一10、根據(jù)高教廳統(tǒng)計,某地區(qū)有17%的大學(xué)生申請免息教育貸款。假定樣本容量為300。試求:(1)當(dāng)?shù)卮髮W(xué)生中申請免息教育貸款的總體比例的95.45%的置信區(qū)間。(2)當(dāng)?shù)卮髮W(xué)生中申請免息教育貸款的總體比例的99%的置信區(qū)間。(3)當(dāng)把握程度由95.45%提高到99%時,允許誤差如何變動?11、某職業(yè)研究所隨機抽取100名IT行業(yè)人員了解本地人員薪金,樣本均值為50124.58元,樣本標(biāo)準(zhǔn)差為1685元,試分別求IT行業(yè)人員年薪的總體均值的90%、95%和99%的置信區(qū)間。當(dāng)置信水平增大時,置信區(qū)間的寬度如何變化?50第50頁,共71頁,2023年,2月20日,星期一第6節(jié)其它抽樣方法及其抽樣分布特征
一、分層抽樣((Stratifiedsampling)
設(shè)總體容量為N,將總體劃分為k層(組或類),有N=N1+N2+…+Nk。從每層的Ni個單位中抽取ni個單位構(gòu)成容量為n的樣本,即n=n1+n2+…+nk。從每層中抽取樣本單位時,為了保持樣本結(jié)構(gòu)與總體結(jié)構(gòu)相同,通常采用按(等)比例取樣,即按各層單位數(shù)占總體單位數(shù)的比例從中抽取樣本,使各層樣本單位數(shù)與各層總體單位數(shù)之比等于樣本容量與總體容量之比。即
51第51頁,共71頁,2023年,2月20日,星期一分層抽樣的抽樣平均誤差重置抽樣下,不重置抽樣下,對于等比例分層抽樣,其分布特征如下:
樣本平均數(shù)總體層內(nèi)方差平均數(shù)抽樣平均誤差(重復(fù)抽樣)(不重復(fù)抽樣)52第52頁,共71頁,2023年,2月20日,星期一總體方差未知時樣本層內(nèi)方差平均數(shù)抽樣平均誤差計算公式為(重復(fù)抽樣)(不重復(fù)抽樣)對于分層抽樣,若總體各層為正態(tài)分布或為大樣本非正態(tài)分布,則各子樣本平均數(shù)、樣本平均數(shù)均服從或近似服從正態(tài)分布。對于給定的置信度1-α,總體均值的置信區(qū)間為:53第53頁,共71頁,2023年,2月20日,星期一比例的抽樣平均誤差
重置抽樣不重置抽樣總體比例未知時,其中,當(dāng)總體服從或近似服從正態(tài)分布時,對于給定的置信度1-α,總體比例的置信區(qū)間為:54第54頁,共71頁,2023年,2月20日,星期一例:某電視臺分別從三個縣按比例抽選600戶,調(diào)查晚間新聞的收視率和每周看電視時間(小時),結(jié)果如表所示。在95%的置信度下,求
(1)
三縣總體收視率的置信區(qū)間;
(2)
三縣住戶每周看電視的平均時間置信區(qū)間。
縣住戶抽選戶比例平均數(shù)層內(nèi)方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.0155第55頁,共71頁,2023年,2月20日,星期一樣本容量的確定
重復(fù)抽樣不重復(fù)抽樣分層抽樣有如下的特點:
1、由于總體方差等于組內(nèi)方差與組間方差之和,所以分層抽樣的誤差一般小于簡單隨機抽樣的誤差。2、由于總體方差是唯一確定的數(shù)值,因此分層抽樣時可以擴大層間方差,縮小層內(nèi)方差,使抽樣誤差減小。56第56頁,共71頁,2023年,2月20日,星期一練習(xí):
1、某鄉(xiāng)全部糧食耕地5000畝,按平原和山區(qū)面積比例抽取樣本,容量為630畝,計算各組平均畝產(chǎn)和標(biāo)準(zhǔn)差如下。以95%的概率保證對全鄉(xiāng)平均畝產(chǎn)作區(qū)間估計。全部面積抽樣面積平均畝產(chǎn)標(biāo)準(zhǔn)差平原山區(qū)40001000504126960750200400合計500063091825357第57頁,共71頁,2023年,2月20日,星期一2、對某公司職工的工資進(jìn)行抽樣調(diào)查,共抽取600名職工,其中400名工人,200名職員,結(jié)果如下。試分別計算類型抽樣和簡單隨機抽樣的誤差,并加以比較?,F(xiàn)若采用類型抽樣方式,試對該公司職工平均工資作區(qū)間估計。如果要求誤差不超過1元,應(yīng)至少抽選多少工人和職員?(置信度為95%)工人職員月工資人數(shù)月工資人數(shù)500——600600——700700——800100180120700——800800——900900——100070805058第58頁,共71頁,2023年,2月20日,星期一3、從三種不同規(guī)模的工廠中,分別隨機抽查1%機床,得到機床利用率如下,試以95.45%的概率確定全部機床利用率的置信區(qū)間。工廠類型金屬切削機床數(shù)機床利用率(%)全部抽樣小型中型大型800025000300008025030083655959第59頁,共71頁,2023年,2月20日,星期一4、假定類型抽樣的結(jié)果如下,試確定總體均值的95.45%的置信區(qū)間。區(qū)域抽取單位標(biāo)志平均數(shù)標(biāo)準(zhǔn)差甲乙6003003236203060第60頁,共71頁,2023年,2月20日,星期一二、等距抽樣(Systematicsampling)
如果對總體的差異程度不了解,可以按無關(guān)標(biāo)志排隊。這種抽樣結(jié)果接近于簡單隨機抽樣的效果,所以可采用簡單隨機抽樣的誤差計算方法,但要注意等距抽樣通常都是不重置抽樣。如果對總體的變異程度有所了解,可以按有關(guān)標(biāo)志排隊。按有關(guān)標(biāo)志排隊的等距抽樣實質(zhì)上運用了分層抽樣的一些特點,有利于提高樣本的代表性,與分層抽樣不同的,只是分類更細(xì)致,層數(shù)更多,在各層只抽取1個單位。因此,一般可以采用不重復(fù)分層抽樣的誤差公式來近似計算。61第61頁,共71頁,2023年,2月20日,星期一按有關(guān)標(biāo)志排隊并將總體單位n等分后,取樣方法有以下兩種:
1、半距中點取樣。即在每部分的中間(抽樣距離的一半)抽取一個單位組成樣本。如,第一部分取第k/2單位,第二部分取第3k/2單位,…,第n部分取第(2n-1)k/2單位。這種取樣方法,使所抽取的各單位最能代表每部分的一般水平,從而提高樣本的代表性,其不足之處是只能取一個樣本。2、對稱等距取樣。即第一部分隨機抽取一個單位,然后據(jù)此在各部分中抽取兩兩對稱的樣本單位組成樣本。如,第一部分取第i單位,第二部分取第2k-i單位,第三部分取第2k+i單位,第四部分取第4k-i單位,…,第(n-1)部分取第(n-2)k+i單位,第n部分取第nk-i單位。這種取樣方法,既遵循隨機原則,又能取到較有代表性的樣本,并且可以抽取k個樣本。樣本容量確定的方法與不重復(fù)分層抽樣相同。62第62頁,共71頁,2023年,2月20日,星期一練習(xí)1、假定對總體2000個單位進(jìn)行5%的機械抽樣。試確定:(1)將總體劃分為多少個同等部分?(2)抽選的間隔如何?(3)每部分的單位數(shù)是多少?(4)能否說出抽取單位的號碼和抽取單位的總數(shù)?2、某產(chǎn)品零件方差為另一同類零件方差(0.12)的3倍,若以95%的可靠性估計抽樣誤差不多于0.17厘米,現(xiàn)打算從4000件零件中做機械抽樣,必須抽出多少零件做檢驗?63第63頁,共71頁,2023年,2月20日,星期一三、整群抽樣(Clustersampling)
設(shè)總體N個單位劃分為R群,每群包含M個單位,即N=RM。現(xiàn)從總體R群中隨機抽取r群,并分別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度存量房屋翻新與改造工程承包合同4篇
- 2025年度大學(xué)校園網(wǎng)絡(luò)安全培訓(xùn)外協(xié)服務(wù)合同4篇
- 二零二五版公職人員廉政責(zé)任與獎懲措施協(xié)議3篇
- 二零二五年度體育賽事臨時裁判員用工協(xié)議4篇
- 二零二五年度婚慶車輛租賃服務(wù)協(xié)議范本4篇
- 二零二五年度城市綠化項目苗木采購與種植管理協(xié)議4篇
- 二零二五年度著作權(quán)轉(zhuǎn)讓退股協(xié)議3篇
- 2025年度快速卷簾門安裝與安全檢測合同范本4篇
- 二零二五年度文化教育項目合作合同4篇
- 2025年度文化產(chǎn)業(yè)發(fā)展代理人貸款合作協(xié)議4篇
- GB/T 14600-2009電子工業(yè)用氣體氧化亞氮
- 小學(xué)道德與法治學(xué)科高級(一級)教師職稱考試試題(有答案)
- 申請使用物業(yè)專項維修資金征求業(yè)主意見表
- 河北省承德市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細(xì)
- 實用性閱讀與交流任務(wù)群設(shè)計思路與教學(xué)建議
- 應(yīng)急柜檢查表
- 通風(fēng)設(shè)施標(biāo)準(zhǔn)
- 酒店市場營銷教案
- 房屋買賣合同簡單范本 房屋買賣合同簡易范本
- 無抽搐電休克治療規(guī)范
- 環(huán)保有限公司營銷策劃方案
評論
0/150
提交評論