統(tǒng)計(jì)學(xué)之抽樣與總體參數(shù)的估計(jì)課件_第1頁(yè)
統(tǒng)計(jì)學(xué)之抽樣與總體參數(shù)的估計(jì)課件_第2頁(yè)
統(tǒng)計(jì)學(xué)之抽樣與總體參數(shù)的估計(jì)課件_第3頁(yè)
統(tǒng)計(jì)學(xué)之抽樣與總體參數(shù)的估計(jì)課件_第4頁(yè)
統(tǒng)計(jì)學(xué)之抽樣與總體參數(shù)的估計(jì)課件_第5頁(yè)
已閱讀5頁(yè),還剩129頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章抽樣與總體參數(shù)的估計(jì)

統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容。抽樣是進(jìn)行統(tǒng)計(jì)統(tǒng)計(jì)推斷的基礎(chǔ)工作。參數(shù)估計(jì)是統(tǒng)計(jì)推斷的重要內(nèi)容之一。6.1抽樣與抽樣分布6.2參數(shù)的估計(jì)方法6.3總體均值和總體比例的區(qū)間估計(jì)6.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)6.5正態(tài)總體方差及兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)6.6相關(guān)系數(shù)的區(qū)間估計(jì)第六章抽樣與總體參數(shù)的估計(jì)

統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容16.1抽樣與抽樣分布6.1.1總體、個(gè)體和樣本總體(Population)--要研究的事物或現(xiàn)象的總體。個(gè)體(Itemunit)--組成總體的每個(gè)元素(成員)??傮w容量(Populationsize)--一個(gè)總體中所含個(gè)體的數(shù)量。樣本(Sample)--從總體中抽取的部分個(gè)體。樣本容量(Samplesize)--樣本中所含個(gè)體的數(shù)量。抽樣(Sampling)--為推斷總體的某些重要特征,需要從總體中按一定抽樣技術(shù)抽取若干個(gè)體的過(guò)程。統(tǒng)計(jì)量(Statistic)--由樣本構(gòu)造,用來(lái)估計(jì)總體參數(shù)的函數(shù)。統(tǒng)計(jì)量是樣本的函數(shù),只依賴(lài)于樣本;統(tǒng)計(jì)量不含任何參數(shù)。樣本均值、樣本方差等都是統(tǒng)計(jì)量。6.1抽樣與抽樣分布6.1.1總體、個(gè)體和樣本26.1.2抽樣方法抽樣設(shè)計(jì)與全面調(diào)查相比有如下特點(diǎn):(1)節(jié)省人力及費(fèi)用;(2)節(jié)省時(shí)間,提高調(diào)查研究的時(shí)效性;(3)保證研究結(jié)果的準(zhǔn)確性。抽樣方法分為兩類(lèi):概率抽樣和非概率抽樣1、概率抽樣根據(jù)已知的概率選取被調(diào)查者;最理想、最科學(xué)的抽樣方法;能保證樣本數(shù)據(jù)對(duì)總體的代表性;能有效控制抽樣誤差,將其限制在一定范圍內(nèi);缺點(diǎn)是:相對(duì)非概率抽樣,花費(fèi)較大。概率抽樣的幾種形式:6.1.2抽樣方法3(1)簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampling)完全隨機(jī)地選取樣本,要求有一個(gè)完美的抽樣框或有總體中每一個(gè)個(gè)體的詳盡名單??梢圆扇〕楹灮螂S機(jī)數(shù)字表的辦法實(shí)現(xiàn)。(2)分層抽樣(Reducedsampling)先將總體分成不同的“層”,然后,在每一“層”內(nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣??煞乐购?jiǎn)單隨機(jī)抽樣造成的樣本構(gòu)成與總體構(gòu)成不成比例的現(xiàn)象。(3)整群抽樣(ClusterSampling)在整群抽樣中,總體首先被分成稱(chēng)作群的獨(dú)立的元素組,總體中的每一元素屬于且僅屬于某一群。抽取一個(gè)以群為元素的簡(jiǎn)單隨機(jī)樣本,樣本中的所有元素組成樣本。在理想狀態(tài)下,每一群是整個(gè)總體小范圍內(nèi)的代表。(4)系統(tǒng)抽樣(Systematicsampling)

又稱(chēng)等距抽樣。從前k個(gè)元素中隨機(jī)選一個(gè),然后在樣本框中每隔一定距離抽取一個(gè)。(1)簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampli42、非概率抽樣不是完全按隨機(jī)原則選取樣本。(1)方便抽樣(Conveniencesampling)由調(diào)查人員自由、方便地選擇被調(diào)查者的非隨機(jī)選樣。(2)判斷抽樣(Judgementsampling)通過(guò)某些條件過(guò)濾選擇某些被調(diào)查者參與調(diào)查的判斷抽樣法。建議使用概率抽樣方法:簡(jiǎn)單隨機(jī)抽樣、分層抽樣、整群抽樣或系統(tǒng)抽樣。從所估總體特征與樣本結(jié)果的接近程度上講,公式可用于估計(jì)抽樣結(jié)果的“優(yōu)良性”。而用方便抽樣和判斷抽樣方法不能對(duì)該“優(yōu)良性”進(jìn)行估計(jì)。因而,當(dāng)解釋由非概率抽樣方法得到的結(jié)果時(shí),要特別小心。2、非概率抽樣建議使用概率抽樣方法:簡(jiǎn)單隨機(jī)抽樣、分層抽樣、56.1.3樣本均值的分布與中心極限定理1、樣本均值X分布的含義采用隨機(jī)抽樣的方法,從總體中抽取大小為n的一個(gè)樣本,計(jì)算出它的平均值X1,然后將這些個(gè)體放回總體去,再抽取n個(gè)個(gè)體,又可以計(jì)算出平均值X2,…再將n個(gè)個(gè)體放回去,再抽取n個(gè)個(gè)體,如此可以計(jì)算出無(wú)限個(gè)X,這些樣本均值X所有可能值的概率分布叫均值X的抽樣分布.設(shè)X1,X2,…,Xn為某總體中抽取的隨機(jī)樣本,X1,X2,…,Xn為相互獨(dú)立,且與總體有相同分布的隨機(jī)變量.(1)當(dāng)總體為正態(tài)分布N(,2)時(shí),X的抽樣分布仍為正態(tài)分布,當(dāng)n越來(lái)越大時(shí),X的離散程度越來(lái)越小,即用X估計(jì)越準(zhǔn)確。6.1.3樣本均值的分布與中心極限定理設(shè)X1,X2,…,X6(2)當(dāng)總體的分布不是正態(tài)分布時(shí),只要樣本容量n足夠大時(shí),樣本均值的分布總是近似正態(tài)分布,此時(shí)要求總體方差2有限。假定總體均值為,方差為2(2)當(dāng)總體的分布不是正態(tài)分布時(shí),只要樣本容量n足夠大時(shí),樣7中心極限定理(CentralLimittheorem):設(shè)從均值為,方差為2(有限)的任意一個(gè)總體中抽取大小為n的樣本,當(dāng)n充分大時(shí)(n30),樣本均值X的抽樣分布近似服從均值為,方差為2/n的正態(tài)分布。x中心極限定理(CentralLimittheorem):8什么叫n充分大呢?總體偏離正態(tài)越遠(yuǎn),則要求n就越大。在實(shí)際應(yīng)用中常要求n30。什么叫n充分大呢?9例6.1從一個(gè)均值=8,=0.6的總體中隨機(jī)選取容量為n=25的樣本。假定該總體不是很偏的,求:(1)樣本均值小于7.9的近似概率;(2)超過(guò)7.9的近似概率;(3)在總體均值=8附近0.1范圍內(nèi)的概率.例6.1從一個(gè)均值=8,=0.6的總體中隨機(jī)選取容量為10解:根據(jù)中心極限定理,在總體不很偏的情況下,(1)(2)(3)解:根據(jù)中心極限定理,在總體不很偏的情況下,(1)(2)(11例6.2某廠聲稱(chēng)生產(chǎn)的電池=54個(gè)月,=6個(gè)月的壽命分布。某消費(fèi)團(tuán)體為檢驗(yàn)該廠的說(shuō)法是否準(zhǔn)確,購(gòu)買(mǎi)了50個(gè)該廠生產(chǎn)的電池進(jìn)行試驗(yàn)。(1)若廠商聲稱(chēng)是正確的,描述50個(gè)電池壽命的抽樣分布;(2)若廠商聲稱(chēng)是正確的,則50個(gè)樣品組成的樣本的平均壽命不超過(guò)52個(gè)月的概率是多少?例6.2某廠聲稱(chēng)生產(chǎn)的電池=54個(gè)月,=6個(gè)月的壽命分12解:=54,=6,小概率事件如果真觀察到50個(gè)電池平均壽命低于52個(gè)月,則有理由懷疑廠方說(shuō)法的正確性。解:=54,=6,小概率事件如果真觀察到50個(gè)電池平均13例6.3某電梯承受的最大拉力為1000千克,可乘坐13人。已知人群的平均體重為60千克,標(biāo)準(zhǔn)差為14千克,且服從正態(tài)分布。問(wèn)電梯發(fā)生事故的概率是多少?例6.3某電梯承受的最大拉力為1000千克,可乘坐13人。14解:=60,=14,n=13則該電梯發(fā)生事故的概率為0.000007解:=60,=14,n=13則該電梯發(fā)生事故的概率為156.1.4樣本方差的分布樣本方差的分布較復(fù)雜,它與總體分布有關(guān)。在這里只研究當(dāng)總體為正態(tài)分布時(shí),樣本方差的分布。(1)樣本方差的分布設(shè)X1,X2,…,Xn為來(lái)自正態(tài)分布N(,2)的樣本,則從數(shù)學(xué)上可以推導(dǎo)出正態(tài)總體下樣本方差S2的分布為:(未分組數(shù)據(jù))(組距分組數(shù)據(jù))6.1.4樣本方差的分布(未分組數(shù)據(jù))(組距分組數(shù)據(jù))16(2)卡方分布設(shè)X1,X2,…,Xn為來(lái)自正態(tài)分布N(0,1)的一個(gè)樣本,為自由度為n的卡方分布,自由度n是相互獨(dú)立的正態(tài)變量的個(gè)數(shù).(2)卡方分布為自由度為n的卡方分布,自由度n是相互獨(dú)立的17卡方分布的特點(diǎn):1)卡方分布是一個(gè)正偏態(tài)分布。隨自由度n的不同,其分布曲線(xiàn)的形狀不同,n小,分布偏斜;n很大,接近于正態(tài)分布。當(dāng)自由度df=n+時(shí),卡方分布即為正態(tài)分布。2)值都是正值;3)k個(gè)分布的和也是分布,即是服從自由度df=df1+df2+…+dfk的分布。表明分布具有可加性。4)0卡方分布表給出了卡方變量在不同自由度下的臨界值.卡方分布的特點(diǎn):0卡方分布表給出了卡方變量在不同自由度下的臨18當(dāng)n很大時(shí),近似服從實(shí)用上,n>45時(shí),Up為正態(tài)分布的p分位數(shù)。當(dāng)n很大時(shí),近似服從實(shí)用上,n196.1.5兩個(gè)方差比的分布設(shè)來(lái)自正態(tài)總體的一個(gè)樣本;來(lái)自正態(tài)總體的一個(gè)樣本且Xi(i=1,2,…,n1)與Yi(i=1,2,…,n2)相互獨(dú)立,則F(n1-1,n2-1)為第一自由度(分子自由度)為n1-1,為第二自由度(分母自由度)為n2-1的F分布。6.1.5兩個(gè)方差比的分布且Xi(i=1,2,…,n1)與20F分布的定義F分布的定義21F分布的特點(diǎn):(1)F分布形態(tài)是正偏態(tài)分布,形式隨n1,n2不同而不同,隨df1,df2的增加而漸趨正態(tài)分布;(2)F為兩個(gè)方差比率,所以為正值;(3)當(dāng)df1=1,df2任意時(shí),F(xiàn)值與自由度為df2的t值的平方相等,即F(1,df2)=t2(df2)(4)F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)于1924年首先發(fā)現(xiàn)的。F分布在假設(shè)檢驗(yàn)、區(qū)間估計(jì)、方差分析、回歸分析及試驗(yàn)設(shè)計(jì)等數(shù)理統(tǒng)計(jì)領(lǐng)域有重要的作用。F分布的特點(diǎn):F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)226.1.6T統(tǒng)計(jì)量的分布設(shè)X1,X2,…,Xn是來(lái)自正態(tài)總體N(,2)的一個(gè)樣本,稱(chēng)為T(mén)統(tǒng)計(jì)量,它服從自由度為n-1的t分布,即T~t(n-1)意義:當(dāng)正態(tài)總體方差2已知時(shí),樣本平均數(shù)的分布為正態(tài)分布X~N(,2/n);當(dāng)總體方差2未知時(shí),用S2作為2的估計(jì)值,當(dāng)樣本容量小于30時(shí),分布不接近正態(tài)分布,而是自由度為n-1的t分布,n>30時(shí)接近正態(tài)分布,n趨向于無(wú)窮時(shí),它是正態(tài)分布。6.1.6T統(tǒng)計(jì)量的分布稱(chēng)為T(mén)統(tǒng)計(jì)量,它服從自由度為n-123t分布的特點(diǎn):(1)對(duì)稱(chēng)。左側(cè)為負(fù),右側(cè)為正,均值為0;(2)-<t<+;(3)n時(shí),t分布為正態(tài)分布,方差為1;

n-1>30時(shí),t分布為接近正態(tài)分布,方差>1,

n-1<30時(shí),t分布與正態(tài)分布相差較大,隨n-1減小方差越大n>45時(shí),t分布與正態(tài)分布沒(méi)有多大差異在小樣本n<30時(shí),t分布具有重要作用。t分布的特點(diǎn):246.2參數(shù)估計(jì)方法6.2.1點(diǎn)估計(jì)(Pointestimate)當(dāng)總體參數(shù)不清楚時(shí),用一個(gè)特定值,一般常用樣本統(tǒng)計(jì)量進(jìn)行估計(jì),叫點(diǎn)估計(jì)。設(shè)為總體X的待估計(jì)參數(shù),一般用樣本X1,X2,…,Xn構(gòu)造一個(gè)統(tǒng)計(jì)量來(lái)估計(jì),則稱(chēng)為的估計(jì)量,對(duì)于樣本的一組數(shù)據(jù)x1,x2,…,xn,估計(jì)量的值(x1,x2,…,xn)稱(chēng)為的估計(jì)值。如用樣本平均數(shù)估計(jì)總體參數(shù),用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差6.2參數(shù)估計(jì)方法25一個(gè)好的估計(jì)量應(yīng)具備下列特性:(1)一致性(Consistency)當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值越來(lái)越接近所估計(jì)的總體參數(shù).(2)無(wú)偏性(Unbiasedness)估計(jì)值的平均值與真值一致.(3)有效性(Effectiveness)當(dāng)總體參數(shù)的無(wú)偏估計(jì)不只一個(gè)統(tǒng)計(jì)量時(shí),無(wú)偏估計(jì)變異最小者有效性高,變異大者有效性低.(4)充分性指一個(gè)容量為n的樣本統(tǒng)計(jì)量,是否充分地反映了全部n個(gè)數(shù)據(jù)所反映總體的信息.一個(gè)好的估計(jì)量應(yīng)具備下列特性:266.2.2區(qū)間估計(jì)(Intervalestimate)點(diǎn)估計(jì)總是以誤差存在為前提,而不能提供正確估計(jì)的概率。沒(méi)有解決參數(shù)估計(jì)的精確度和可靠性問(wèn)題。而區(qū)間估計(jì)可以彌補(bǔ)這一不足之處。區(qū)間估計(jì)就是用一個(gè)區(qū)間去估計(jì)未知參數(shù),它不具體指出總體參數(shù)等于什么,但能指出總體的未知參數(shù)落入某一區(qū)間的概率有多大。設(shè)x1,x2,…,xn是來(lái)自密度f(wàn)(x,)的樣本,對(duì)于給定的,0<<1,如能找到兩個(gè)統(tǒng)計(jì)量1(x1,x2,…,xn)和2(x1,x2,…,xn),使得P{1(x1,x2,…,xn)<<2(x1,x2,…,xn)}=1-,稱(chēng)1-是置信度,(1(x1,x2,…,xn),2(x1,x2,…,xn))是置信度為1-的的置信區(qū)間(Confidenceinterval);稱(chēng)為顯著性水平(Significancelevel)6.2.2區(qū)間估計(jì)(Intervalestimate)設(shè)27置信區(qū)間表明了區(qū)間估計(jì)的精確性。區(qū)間越小越精確,區(qū)間越大越不精確;置信度表明了區(qū)間估計(jì)的可靠性(1-)。區(qū)間估計(jì)不可靠的概率為,如=0.05,表明下結(jié)論犯錯(cuò)誤的概率。進(jìn)行區(qū)間估計(jì)時(shí),總是事先確定號(hào)標(biāo)準(zhǔn)。通常有三個(gè)標(biāo)準(zhǔn):1-:0.95,0.99,0.999:0.05,0.01,0.001區(qū)間估計(jì)的原理是樣本分布理論:進(jìn)行區(qū)間估計(jì)值的計(jì)算及估計(jì)正確概率的解釋上是依據(jù)該樣本統(tǒng)計(jì)量的分布規(guī)律及樣本分布的標(biāo)準(zhǔn)誤。樣本分布提供概率解釋?zhuān)粯?biāo)準(zhǔn)誤的大小決定區(qū)間估計(jì)長(zhǎng)度。標(biāo)準(zhǔn)誤越小,置信區(qū)間的長(zhǎng)度越短,估計(jì)越精確,仍能保持較高的估計(jì)成功率。加大樣本容量就能使標(biāo)準(zhǔn)誤變小。置信區(qū)間表明了區(qū)間估計(jì)的精確性。區(qū)間越小越精確,區(qū)間越大越不286.3總體均值和總體比例的區(qū)間估計(jì)6.3.1總體均值的區(qū)間估計(jì)1、方差2已知(1)X服從正態(tài)分布,X~N(,2)給定顯著性水平,6.3總體均值和總體比例的區(qū)間估計(jì)給定顯著性水平,29給定顯著性水平,總體均值在1-的置信水平下的置信區(qū)間為:或(2)當(dāng)總體為非正態(tài)分布時(shí),樣本容量>30(大樣本)時(shí),樣本均值近似服從正態(tài)分布置信區(qū)間為:或給定顯著性水平,總體均值在1-的置信水平下的置信30例6.4母總體為正態(tài)分布,=7.07,抽取兩個(gè)樣本n1=10,X1=78,n2=36,X2=79求的0.95、0.99置信區(qū)間。例6.5已知某校的一次考試全體考生成績(jī)總方差為100,從中抽得5位考生的成績(jī)?yōu)?5,83,94,70,88,試求全體考生成績(jī)均值的95%和99%的置信區(qū)間。例6.4母總體為正態(tài)分布,=7.07,抽取兩個(gè)樣本n1312、方差2未知(1)總體服從正態(tài)分布,X~N(,2)用S2代替2,建立區(qū)間估計(jì)統(tǒng)計(jì)量置信區(qū)間為:n足夠大,大于等于30時(shí),也可用正態(tài)分布.2、方差2未知置信區(qū)間為:n足夠大,大于等于30時(shí),也可用32(2)總體非正態(tài),且方差未知n足夠大時(shí),估計(jì)統(tǒng)計(jì)量接近正態(tài)分布,置信區(qū)間為,總體均值、總體比例區(qū)間估計(jì)的一般規(guī)律:點(diǎn)估計(jì)值±臨界值×標(biāo)準(zhǔn)誤(2)總體非正態(tài),且方差未知總體均值、總體比例區(qū)間估計(jì)的一般33例6.6某校對(duì)高中一年級(jí)學(xué)生進(jìn)行英語(yǔ)水平測(cè)試,測(cè)試后從中抽取的9個(gè)考生的成績(jī)?yōu)?3,91,62,50,74,68,70,65,85,試對(duì)該年級(jí)考生的該次測(cè)試成績(jī)均值作區(qū)間估計(jì)(取=0.05)例6.7總體未知,S2=S2n-1=34,n=100人,樣本平均值為26分鐘,估計(jì)全校學(xué)生平均每天鍛煉時(shí)間。例6.8已知某一總體均值的95%置信區(qū)間為(122,130)。如果樣本均值為126,樣本標(biāo)準(zhǔn)差為16.07,則研究中應(yīng)選取多大的樣本容量?例6.6某校對(duì)高中一年級(jí)學(xué)生進(jìn)行英語(yǔ)水平測(cè)試,測(cè)試后從中抽346.3.2總體比例的區(qū)間估計(jì)某種特征占全部單位的比例p,樣本比例為p,在大樣本下(np>5,nq>5),可將二項(xiàng)分布變換為正態(tài)分布總體比例p的置信區(qū)間:6.3.2總體比例的區(qū)間估計(jì)總體比例p的置信區(qū)間:35例6.10在整個(gè)流動(dòng)原因的研究中,從某企業(yè)抽取200人流動(dòng)人員的樣本,有140人說(shuō)離開(kāi)的原因是不能與管理人員融洽相處,求由于該原因離開(kāi)的真正比例的95%的置信區(qū)間。例6.10在整個(gè)流動(dòng)原因的研究中,從某企業(yè)抽取200人流動(dòng)366.3.3樣本容量的確定確定n十分重要,n過(guò)大,增加費(fèi)用,n過(guò)小誤差增大。n的確定依賴(lài)于多大置信度(可靠性),什么樣的精度(多寬的區(qū)間)。1、估計(jì)時(shí)n的確定正態(tài)總體或非正態(tài)總體但大樣本時(shí),置信區(qū)間為(用樣本均值估計(jì)時(shí)允許的最大絕對(duì)誤差)6.3.3樣本容量的確定(用樣本均值估計(jì)時(shí)允許的最大絕37樣本容量n,總體方差2,允許誤差,可靠性系數(shù)Z/2的關(guān)系:(1)總體方差越大,需要的樣本容量越大;反之亦然;(2)允許誤差越大,需要的樣本容量越小,反之亦然;(3)可靠性系數(shù)越大,需要的樣本容量越大,反之亦然.例6.11要使95%置信區(qū)間的允許誤差為5,應(yīng)選取多大的樣本容量?假定總體的標(biāo)準(zhǔn)差為25.例6.12一家廣告公司想估計(jì)某類(lèi)商店去年所花的平均廣告費(fèi)有多少。經(jīng)驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?樣本容量n,總體方差2,允許誤差,可靠性系數(shù)Z/382、估計(jì)總體比例時(shí),樣本容量的確定估計(jì)總體比例時(shí),允許的最大絕對(duì)誤差為2、估計(jì)總體比例時(shí),樣本容量的確定39例6.13一家市場(chǎng)調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對(duì)p的估計(jì)誤差不超過(guò)0.05,要求的可靠程度為95%,應(yīng)取多大容量的樣本?例6.14一項(xiàng)調(diào)查中,總體比率的計(jì)劃值為0.35,則當(dāng)允許的最大絕對(duì)誤差為0.05時(shí),在求其95%置信區(qū)間時(shí)應(yīng)采用多大的樣本容量。例6.13一家市場(chǎng)調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所406.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)6.4.1兩個(gè)總體均值之差的估計(jì)1、兩總體方差已知條件:1)兩總體均服從正態(tài)分布或分布未知但為大樣本;2)兩個(gè)樣本獨(dú)立1-2在1-置信度水平下的置信區(qū)間為:6.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)1-2在141例6.15一個(gè)銀行負(fù)責(zé)人想知道儲(chǔ)戶(hù)存入兩家銀行的錢(qián)數(shù)。他從兩家銀行各抽取了一個(gè)25個(gè)儲(chǔ)戶(hù)組成的隨機(jī)樣本,樣本平均值如下:銀行A:4500元;銀行B:3250元。設(shè)已知兩個(gè)總體服從方差分別為2500和3600的正態(tài)分布。試求:A-B的區(qū)間估計(jì):(1)置信度95%;(2)置信度99%.例6.15一個(gè)銀行負(fù)責(zé)人想知道儲(chǔ)戶(hù)存入兩家銀行的錢(qián)數(shù)。他從422、兩總體方差未知(1)兩個(gè)總體為正態(tài)分布,且12=22=2將兩個(gè)樣本聯(lián)合起來(lái)估計(jì)2,聯(lián)合統(tǒng)計(jì)量為估計(jì)量的標(biāo)準(zhǔn)誤為:置信區(qū)間為:2、兩總體方差未知估計(jì)量的標(biāo)準(zhǔn)誤為43例6.16為了比較兩位銀行職員為新顧客辦理個(gè)人結(jié)算帳目的平均時(shí)間長(zhǎng)度,分別給兩位職員隨機(jī)安排了10位顧客,并記錄了為每位顧客辦理帳單所需的時(shí)間(單位:分鐘),相應(yīng)的樣本均值和方差為:假定每位職員辦理帳單所需時(shí)間均服從正態(tài)分布,且方差相等,試求兩位職員辦理帳單的服務(wù)時(shí)間之差的95%的區(qū)間估計(jì)。例6.16為了比較兩位銀行職員為新顧客辦理個(gè)人結(jié)算帳目的平44解:根據(jù)題意,兩總體服從正態(tài)分布且方差相等,未知。1-2的置信區(qū)間為:所求區(qū)間估計(jì)為:解:根據(jù)題意,兩總體服從正態(tài)分布且方差相等,未知。所求區(qū)間估45(2)兩個(gè)總體均服從正態(tài)分布且用S12估計(jì)12,用S22估計(jì)22,的估計(jì)為這時(shí)不服從t(n1+n2-2)而服從t(f)若f不是整數(shù),則取與f最接近的整數(shù)作為自由度的取值。1-2的置信度為(1-)的近似區(qū)間估計(jì)為:(2)兩個(gè)總體均服從正態(tài)分布且46例6.17上例中若假定兩個(gè)總體的方差不等。求兩個(gè)均值之差的區(qū)間估計(jì)。解:則t0.05/2(18)=2.1009,從而所求兩均值之差的95%的近似區(qū)間估計(jì)為:即例6.17上例中若假定兩個(gè)總體的方差不等。求兩個(gè)均值之差的47(3)如果兩個(gè)總體不服從正態(tài)分布,且方差不等,當(dāng)n1、n2很大時(shí),,將S1和S2作為1和2的估計(jì)值,置信區(qū)間為:(3)如果兩個(gè)總體不服從正態(tài)分布,且方差不等,當(dāng)n1、n2很486.4.2兩個(gè)總體比例之差的區(qū)間估計(jì)設(shè)兩個(gè)總體的比例分別為p1和p2,為了估計(jì)p1-p2,分別從兩個(gè)總體中各隨機(jī)抽取容量為n1和n2的兩個(gè)隨機(jī)樣本。并計(jì)算兩個(gè)樣本中的比例當(dāng)n1和n2兩者都很大時(shí),而且總體比例不太接近0或1時(shí),的抽樣分布服從正態(tài)分布,從而p1-p2的置信區(qū)間為:用代替p1和p26.4.2兩個(gè)總體比例之差的區(qū)間估計(jì)從而p1-p2的置信區(qū)49例6.18某飲料公司對(duì)其所做的報(bào)紙廣告在兩個(gè)城市的效果進(jìn)行了比較,它們從兩個(gè)城市中分別隨機(jī)地調(diào)查了1000個(gè)成年人,其中看過(guò)該廣告的比例分別為0.18和0.14,試求兩城市成年人中看過(guò)該廣告的比例之差的95%的置信區(qū)間。例6.18某飲料公司對(duì)其所做的報(bào)紙廣告在兩個(gè)城市的效果進(jìn)行50解:由于樣本容量都為1000,屬于大樣本容量,置信區(qū)間為:即故以95%的把握估計(jì)兩城市成年人中看過(guò)該廣告的比例差在0.79%~7.21%之間。解:由于樣本容量都為1000,屬于大樣本容量,置信區(qū)間為:即516.5正態(tài)總體方差及兩正態(tài)總體方差之比的區(qū)間估計(jì)6.5.1正態(tài)總體方差的區(qū)間估計(jì)X1,X2,..,Xn來(lái)自均值,2均未知,則2的點(diǎn)估計(jì)量為S2,且2的置信區(qū)間為:的置信區(qū)間為:6.5正態(tài)總體方差及兩正態(tài)總體方差之比的區(qū)間估計(jì)2的置信52當(dāng)n>30時(shí),S近似服從N(,2/(2(n-1)),的近似估計(jì)區(qū)間為:例6.19對(duì)某種金屬的10個(gè)樣品所組成的一個(gè)隨機(jī)樣本作抗拉強(qiáng)度試驗(yàn)。從試驗(yàn)數(shù)據(jù)算出的方差為4,試求2的95%置信區(qū)間,構(gòu)造這一區(qū)間時(shí)用了什么假定?的置信區(qū)間又如何?當(dāng)n>30時(shí),S近似服從N(,2/(2(n-1)),53解:設(shè)該金屬的抗拉強(qiáng)度服從正態(tài)分布,在2的95%的置信區(qū)間為:式中,n=10,1-=0.95,/2=0.025,S2=4,從而該區(qū)間為:[(10-1)×4/19.0,(10-1)×4/2.7],即[1.89,13.33],的95%的置信區(qū)間為[1.891/2,13.331/2],即[1.38,3.65]解:設(shè)該金屬的抗拉強(qiáng)度服從正態(tài)分布,在2的95%的置信區(qū)間546.5.2兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)當(dāng)兩個(gè)總體為正態(tài)分布時(shí),當(dāng)時(shí)6.5.2兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)當(dāng)55例6.20某一特定工序生產(chǎn)的一批化工產(chǎn)品中的雜質(zhì)含量的變異依賴(lài)于操作過(guò)程處理的時(shí)間長(zhǎng)度。某生產(chǎn)商擁有兩條生產(chǎn)線(xiàn),為了在降低產(chǎn)品中雜質(zhì)平均數(shù)量的同時(shí)降低雜質(zhì)的變異,對(duì)第二條生產(chǎn)線(xiàn)進(jìn)行了很小的調(diào)整,研究這種調(diào)整是否確能達(dá)到目的。為此從兩條生產(chǎn)線(xiàn)生產(chǎn)的兩批產(chǎn)品中各隨機(jī)抽取了25個(gè)樣品,它們的均值和方差為:根據(jù)所給信息確定兩總體方差比12/22的90%的置信區(qū)間。例6.20某一特定工序生產(chǎn)的一批化工產(chǎn)品中的雜質(zhì)含量的變異56解:假定兩條生產(chǎn)線(xiàn)上生產(chǎn)的產(chǎn)品中的雜質(zhì)數(shù)量服從正態(tài)分布,則置信度為90%的12/22的置信區(qū)間為:所求區(qū)間為:即:解:假定兩條生產(chǎn)線(xiàn)上生產(chǎn)的產(chǎn)品中的雜質(zhì)數(shù)量服從正態(tài)分布,則置576.6相關(guān)系數(shù)的區(qū)間估計(jì)6.6.1積差相關(guān)系數(shù)的區(qū)間估計(jì)1、積差相關(guān)系數(shù)的抽樣分布-101=0=0.5=0.7當(dāng)<0時(shí),n一定時(shí),r的分布呈不同程度的負(fù)偏態(tài);>0時(shí),r的分布呈不同程度的正偏態(tài);0時(shí),只有n500時(shí)漸近正態(tài)分布,標(biāo)準(zhǔn)誤為:當(dāng)=0時(shí)r的分布服從自由度為n-2的t分布,標(biāo)準(zhǔn)誤為:6.6相關(guān)系數(shù)的區(qū)間估計(jì)-101=0=0.5=0.758費(fèi)舍(Fisher)的Z分布:0時(shí),只有n500時(shí)漸近正態(tài)分布,條件非常嚴(yán)格,應(yīng)用受到很大限制。在一般情況下,將r值轉(zhuǎn)換為Z值(n不受條件限制),這些Z值漸近服從正態(tài)分布,標(biāo)準(zhǔn)誤為:2、積差相關(guān)系數(shù)的區(qū)間估計(jì)(1)當(dāng)總體相關(guān)系數(shù)為0時(shí),樣本相關(guān)系數(shù)的分布為自由度是n-2的t分布,置信區(qū)間為:費(fèi)舍(Fisher)的Z分布:2、積差相關(guān)系數(shù)的區(qū)間估計(jì)59(2)當(dāng)總體相關(guān)系數(shù)不為0時(shí),1)如果n>500,可用下式計(jì)算置信區(qū)間:2)利用費(fèi)舍Z函數(shù)分布無(wú)論樣本容量大小,還是總體相關(guān)是否為0,Z函數(shù)的分布近似正態(tài)分布,具體步驟如下:a.用公式計(jì)算:Zr=ln((1+r)/(1-r))/2;或查r-Zr轉(zhuǎn)換表;b.計(jì)算Zr的置信區(qū)間Zr±Z/2SEz,SEz=1/(n-3)1/2;c.將Zr的置信區(qū)間轉(zhuǎn)換成相關(guān)系數(shù):查r-Zr轉(zhuǎn)換表,或用公式計(jì)算r值。(2)當(dāng)總體相關(guān)系數(shù)不為0時(shí),2)利用費(fèi)舍Z函數(shù)分布60例6.21某小學(xué)120名學(xué)生通過(guò)甲乙二測(cè)驗(yàn),計(jì)算相關(guān)系數(shù)為0.24,問(wèn)該二測(cè)驗(yàn)總體相關(guān)系數(shù)的.95的置信區(qū)間。例6.21某小學(xué)120名學(xué)生通過(guò)甲乙二測(cè)驗(yàn),計(jì)算相關(guān)系數(shù)為61解:假設(shè)總體相關(guān)系數(shù)=0,.95的置信區(qū)間為:該置信區(qū)間不包含0,說(shuō)明該樣本的總體相關(guān)系數(shù)不為0,所以用上述方法求置信區(qū)間是不合適的.正確的方法應(yīng)該用Z函數(shù)方法.故總體相關(guān)系數(shù)的置信區(qū)間為0.064~0.040之間.作此結(jié)論犯錯(cuò)誤的概率為0.05,正確的概率為0.95。解:假設(shè)總體相關(guān)系數(shù)=0,.95的置信區(qū)間為:該置信區(qū)間626.6.2等級(jí)相關(guān)系數(shù)的區(qū)間估計(jì)斯皮爾曼等級(jí)相關(guān)系數(shù),它在9n20時(shí),rR的分布近似為6.6.2等級(jí)相關(guān)系數(shù)的區(qū)間估計(jì)63例6.22n=15,rR=0.41,問(wèn)其總體相關(guān)系數(shù)的0.95的置信區(qū)間。例6.22n=15,rR=0.41,問(wèn)其總體相關(guān)系數(shù)的064課堂練習(xí)1、已知某測(cè)驗(yàn)成績(jī)的分布為正態(tài)分布,標(biāo)準(zhǔn)差為=5。從該總體中隨機(jī)抽取n=16的樣本,算得其平均值為81,標(biāo)準(zhǔn)差S=6,問(wèn)該測(cè)驗(yàn)的真實(shí)分?jǐn)?shù)是多少?2、已知某校學(xué)生的身高服從正態(tài)分布,現(xiàn)從該校隨機(jī)抽取20名學(xué)生測(cè)量身高,其平均值為171cm,標(biāo)準(zhǔn)差為6cm。試估計(jì)該校學(xué)生身高的真實(shí)情況。課堂練習(xí)653、從某正態(tài)總體中隨機(jī)抽取樣本容量為25的樣本,該樣本的分散程度S=10,問(wèn)該總體的分散程度如何?4、從兩個(gè)正態(tài)總體中各隨機(jī)抽取一個(gè)樣本,n1=10,S1=3,n2=11,S2=4,求二總體方差比的95%的置信區(qū)間。5、已知樣本相關(guān)系數(shù)r=0.60,n=37,問(wèn)總體相關(guān)系數(shù)是多少?6、某縣教育局隨機(jī)抽查了360名初中學(xué)生的視力情況,發(fā)現(xiàn)有125名學(xué)生患有不同程度的近視,問(wèn)該縣初中學(xué)生患近視的真實(shí)比例是多少?3、從某正態(tài)總體中隨機(jī)抽取樣本容量為25的樣本,該樣本的分散66本章結(jié)束本章結(jié)束67第六章抽樣與總體參數(shù)的估計(jì)

統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容。抽樣是進(jìn)行統(tǒng)計(jì)統(tǒng)計(jì)推斷的基礎(chǔ)工作。參數(shù)估計(jì)是統(tǒng)計(jì)推斷的重要內(nèi)容之一。6.1抽樣與抽樣分布6.2參數(shù)的估計(jì)方法6.3總體均值和總體比例的區(qū)間估計(jì)6.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)6.5正態(tài)總體方差及兩個(gè)正態(tài)總體方差比的區(qū)間估計(jì)6.6相關(guān)系數(shù)的區(qū)間估計(jì)第六章抽樣與總體參數(shù)的估計(jì)

統(tǒng)計(jì)推斷是統(tǒng)計(jì)學(xué)研究的重要內(nèi)容686.1抽樣與抽樣分布6.1.1總體、個(gè)體和樣本總體(Population)--要研究的事物或現(xiàn)象的總體。個(gè)體(Itemunit)--組成總體的每個(gè)元素(成員)??傮w容量(Populationsize)--一個(gè)總體中所含個(gè)體的數(shù)量。樣本(Sample)--從總體中抽取的部分個(gè)體。樣本容量(Samplesize)--樣本中所含個(gè)體的數(shù)量。抽樣(Sampling)--為推斷總體的某些重要特征,需要從總體中按一定抽樣技術(shù)抽取若干個(gè)體的過(guò)程。統(tǒng)計(jì)量(Statistic)--由樣本構(gòu)造,用來(lái)估計(jì)總體參數(shù)的函數(shù)。統(tǒng)計(jì)量是樣本的函數(shù),只依賴(lài)于樣本;統(tǒng)計(jì)量不含任何參數(shù)。樣本均值、樣本方差等都是統(tǒng)計(jì)量。6.1抽樣與抽樣分布6.1.1總體、個(gè)體和樣本696.1.2抽樣方法抽樣設(shè)計(jì)與全面調(diào)查相比有如下特點(diǎn):(1)節(jié)省人力及費(fèi)用;(2)節(jié)省時(shí)間,提高調(diào)查研究的時(shí)效性;(3)保證研究結(jié)果的準(zhǔn)確性。抽樣方法分為兩類(lèi):概率抽樣和非概率抽樣1、概率抽樣根據(jù)已知的概率選取被調(diào)查者;最理想、最科學(xué)的抽樣方法;能保證樣本數(shù)據(jù)對(duì)總體的代表性;能有效控制抽樣誤差,將其限制在一定范圍內(nèi);缺點(diǎn)是:相對(duì)非概率抽樣,花費(fèi)較大。概率抽樣的幾種形式:6.1.2抽樣方法70(1)簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampling)完全隨機(jī)地選取樣本,要求有一個(gè)完美的抽樣框或有總體中每一個(gè)個(gè)體的詳盡名單??梢圆扇〕楹灮螂S機(jī)數(shù)字表的辦法實(shí)現(xiàn)。(2)分層抽樣(Reducedsampling)先將總體分成不同的“層”,然后,在每一“層”內(nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣??煞乐购?jiǎn)單隨機(jī)抽樣造成的樣本構(gòu)成與總體構(gòu)成不成比例的現(xiàn)象。(3)整群抽樣(ClusterSampling)在整群抽樣中,總體首先被分成稱(chēng)作群的獨(dú)立的元素組,總體中的每一元素屬于且僅屬于某一群。抽取一個(gè)以群為元素的簡(jiǎn)單隨機(jī)樣本,樣本中的所有元素組成樣本。在理想狀態(tài)下,每一群是整個(gè)總體小范圍內(nèi)的代表。(4)系統(tǒng)抽樣(Systematicsampling)

又稱(chēng)等距抽樣。從前k個(gè)元素中隨機(jī)選一個(gè),然后在樣本框中每隔一定距離抽取一個(gè)。(1)簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampli712、非概率抽樣不是完全按隨機(jī)原則選取樣本。(1)方便抽樣(Conveniencesampling)由調(diào)查人員自由、方便地選擇被調(diào)查者的非隨機(jī)選樣。(2)判斷抽樣(Judgementsampling)通過(guò)某些條件過(guò)濾選擇某些被調(diào)查者參與調(diào)查的判斷抽樣法。建議使用概率抽樣方法:簡(jiǎn)單隨機(jī)抽樣、分層抽樣、整群抽樣或系統(tǒng)抽樣。從所估總體特征與樣本結(jié)果的接近程度上講,公式可用于估計(jì)抽樣結(jié)果的“優(yōu)良性”。而用方便抽樣和判斷抽樣方法不能對(duì)該“優(yōu)良性”進(jìn)行估計(jì)。因而,當(dāng)解釋由非概率抽樣方法得到的結(jié)果時(shí),要特別小心。2、非概率抽樣建議使用概率抽樣方法:簡(jiǎn)單隨機(jī)抽樣、分層抽樣、726.1.3樣本均值的分布與中心極限定理1、樣本均值X分布的含義采用隨機(jī)抽樣的方法,從總體中抽取大小為n的一個(gè)樣本,計(jì)算出它的平均值X1,然后將這些個(gè)體放回總體去,再抽取n個(gè)個(gè)體,又可以計(jì)算出平均值X2,…再將n個(gè)個(gè)體放回去,再抽取n個(gè)個(gè)體,如此可以計(jì)算出無(wú)限個(gè)X,這些樣本均值X所有可能值的概率分布叫均值X的抽樣分布.設(shè)X1,X2,…,Xn為某總體中抽取的隨機(jī)樣本,X1,X2,…,Xn為相互獨(dú)立,且與總體有相同分布的隨機(jī)變量.(1)當(dāng)總體為正態(tài)分布N(,2)時(shí),X的抽樣分布仍為正態(tài)分布,當(dāng)n越來(lái)越大時(shí),X的離散程度越來(lái)越小,即用X估計(jì)越準(zhǔn)確。6.1.3樣本均值的分布與中心極限定理設(shè)X1,X2,…,X73(2)當(dāng)總體的分布不是正態(tài)分布時(shí),只要樣本容量n足夠大時(shí),樣本均值的分布總是近似正態(tài)分布,此時(shí)要求總體方差2有限。假定總體均值為,方差為2(2)當(dāng)總體的分布不是正態(tài)分布時(shí),只要樣本容量n足夠大時(shí),樣74中心極限定理(CentralLimittheorem):設(shè)從均值為,方差為2(有限)的任意一個(gè)總體中抽取大小為n的樣本,當(dāng)n充分大時(shí)(n30),樣本均值X的抽樣分布近似服從均值為,方差為2/n的正態(tài)分布。x中心極限定理(CentralLimittheorem):75什么叫n充分大呢?總體偏離正態(tài)越遠(yuǎn),則要求n就越大。在實(shí)際應(yīng)用中常要求n30。什么叫n充分大呢?76例6.1從一個(gè)均值=8,=0.6的總體中隨機(jī)選取容量為n=25的樣本。假定該總體不是很偏的,求:(1)樣本均值小于7.9的近似概率;(2)超過(guò)7.9的近似概率;(3)在總體均值=8附近0.1范圍內(nèi)的概率.例6.1從一個(gè)均值=8,=0.6的總體中隨機(jī)選取容量為77解:根據(jù)中心極限定理,在總體不很偏的情況下,(1)(2)(3)解:根據(jù)中心極限定理,在總體不很偏的情況下,(1)(2)(78例6.2某廠聲稱(chēng)生產(chǎn)的電池=54個(gè)月,=6個(gè)月的壽命分布。某消費(fèi)團(tuán)體為檢驗(yàn)該廠的說(shuō)法是否準(zhǔn)確,購(gòu)買(mǎi)了50個(gè)該廠生產(chǎn)的電池進(jìn)行試驗(yàn)。(1)若廠商聲稱(chēng)是正確的,描述50個(gè)電池壽命的抽樣分布;(2)若廠商聲稱(chēng)是正確的,則50個(gè)樣品組成的樣本的平均壽命不超過(guò)52個(gè)月的概率是多少?例6.2某廠聲稱(chēng)生產(chǎn)的電池=54個(gè)月,=6個(gè)月的壽命分79解:=54,=6,小概率事件如果真觀察到50個(gè)電池平均壽命低于52個(gè)月,則有理由懷疑廠方說(shuō)法的正確性。解:=54,=6,小概率事件如果真觀察到50個(gè)電池平均80例6.3某電梯承受的最大拉力為1000千克,可乘坐13人。已知人群的平均體重為60千克,標(biāo)準(zhǔn)差為14千克,且服從正態(tài)分布。問(wèn)電梯發(fā)生事故的概率是多少?例6.3某電梯承受的最大拉力為1000千克,可乘坐13人。81解:=60,=14,n=13則該電梯發(fā)生事故的概率為0.000007解:=60,=14,n=13則該電梯發(fā)生事故的概率為826.1.4樣本方差的分布樣本方差的分布較復(fù)雜,它與總體分布有關(guān)。在這里只研究當(dāng)總體為正態(tài)分布時(shí),樣本方差的分布。(1)樣本方差的分布設(shè)X1,X2,…,Xn為來(lái)自正態(tài)分布N(,2)的樣本,則從數(shù)學(xué)上可以推導(dǎo)出正態(tài)總體下樣本方差S2的分布為:(未分組數(shù)據(jù))(組距分組數(shù)據(jù))6.1.4樣本方差的分布(未分組數(shù)據(jù))(組距分組數(shù)據(jù))83(2)卡方分布設(shè)X1,X2,…,Xn為來(lái)自正態(tài)分布N(0,1)的一個(gè)樣本,為自由度為n的卡方分布,自由度n是相互獨(dú)立的正態(tài)變量的個(gè)數(shù).(2)卡方分布為自由度為n的卡方分布,自由度n是相互獨(dú)立的84卡方分布的特點(diǎn):1)卡方分布是一個(gè)正偏態(tài)分布。隨自由度n的不同,其分布曲線(xiàn)的形狀不同,n小,分布偏斜;n很大,接近于正態(tài)分布。當(dāng)自由度df=n+時(shí),卡方分布即為正態(tài)分布。2)值都是正值;3)k個(gè)分布的和也是分布,即是服從自由度df=df1+df2+…+dfk的分布。表明分布具有可加性。4)0卡方分布表給出了卡方變量在不同自由度下的臨界值.卡方分布的特點(diǎn):0卡方分布表給出了卡方變量在不同自由度下的臨85當(dāng)n很大時(shí),近似服從實(shí)用上,n>45時(shí),Up為正態(tài)分布的p分位數(shù)。當(dāng)n很大時(shí),近似服從實(shí)用上,n866.1.5兩個(gè)方差比的分布設(shè)來(lái)自正態(tài)總體的一個(gè)樣本;來(lái)自正態(tài)總體的一個(gè)樣本且Xi(i=1,2,…,n1)與Yi(i=1,2,…,n2)相互獨(dú)立,則F(n1-1,n2-1)為第一自由度(分子自由度)為n1-1,為第二自由度(分母自由度)為n2-1的F分布。6.1.5兩個(gè)方差比的分布且Xi(i=1,2,…,n1)與87F分布的定義F分布的定義88F分布的特點(diǎn):(1)F分布形態(tài)是正偏態(tài)分布,形式隨n1,n2不同而不同,隨df1,df2的增加而漸趨正態(tài)分布;(2)F為兩個(gè)方差比率,所以為正值;(3)當(dāng)df1=1,df2任意時(shí),F(xiàn)值與自由度為df2的t值的平方相等,即F(1,df2)=t2(df2)(4)F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)于1924年首先發(fā)現(xiàn)的。F分布在假設(shè)檢驗(yàn)、區(qū)間估計(jì)、方差分析、回歸分析及試驗(yàn)設(shè)計(jì)等數(shù)理統(tǒng)計(jì)領(lǐng)域有重要的作用。F分布的特點(diǎn):F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)896.1.6T統(tǒng)計(jì)量的分布設(shè)X1,X2,…,Xn是來(lái)自正態(tài)總體N(,2)的一個(gè)樣本,稱(chēng)為T(mén)統(tǒng)計(jì)量,它服從自由度為n-1的t分布,即T~t(n-1)意義:當(dāng)正態(tài)總體方差2已知時(shí),樣本平均數(shù)的分布為正態(tài)分布X~N(,2/n);當(dāng)總體方差2未知時(shí),用S2作為2的估計(jì)值,當(dāng)樣本容量小于30時(shí),分布不接近正態(tài)分布,而是自由度為n-1的t分布,n>30時(shí)接近正態(tài)分布,n趨向于無(wú)窮時(shí),它是正態(tài)分布。6.1.6T統(tǒng)計(jì)量的分布稱(chēng)為T(mén)統(tǒng)計(jì)量,它服從自由度為n-190t分布的特點(diǎn):(1)對(duì)稱(chēng)。左側(cè)為負(fù),右側(cè)為正,均值為0;(2)-<t<+;(3)n時(shí),t分布為正態(tài)分布,方差為1;

n-1>30時(shí),t分布為接近正態(tài)分布,方差>1,

n-1<30時(shí),t分布與正態(tài)分布相差較大,隨n-1減小方差越大n>45時(shí),t分布與正態(tài)分布沒(méi)有多大差異在小樣本n<30時(shí),t分布具有重要作用。t分布的特點(diǎn):916.2參數(shù)估計(jì)方法6.2.1點(diǎn)估計(jì)(Pointestimate)當(dāng)總體參數(shù)不清楚時(shí),用一個(gè)特定值,一般常用樣本統(tǒng)計(jì)量進(jìn)行估計(jì),叫點(diǎn)估計(jì)。設(shè)為總體X的待估計(jì)參數(shù),一般用樣本X1,X2,…,Xn構(gòu)造一個(gè)統(tǒng)計(jì)量來(lái)估計(jì),則稱(chēng)為的估計(jì)量,對(duì)于樣本的一組數(shù)據(jù)x1,x2,…,xn,估計(jì)量的值(x1,x2,…,xn)稱(chēng)為的估計(jì)值。如用樣本平均數(shù)估計(jì)總體參數(shù),用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差6.2參數(shù)估計(jì)方法92一個(gè)好的估計(jì)量應(yīng)具備下列特性:(1)一致性(Consistency)當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值越來(lái)越接近所估計(jì)的總體參數(shù).(2)無(wú)偏性(Unbiasedness)估計(jì)值的平均值與真值一致.(3)有效性(Effectiveness)當(dāng)總體參數(shù)的無(wú)偏估計(jì)不只一個(gè)統(tǒng)計(jì)量時(shí),無(wú)偏估計(jì)變異最小者有效性高,變異大者有效性低.(4)充分性指一個(gè)容量為n的樣本統(tǒng)計(jì)量,是否充分地反映了全部n個(gè)數(shù)據(jù)所反映總體的信息.一個(gè)好的估計(jì)量應(yīng)具備下列特性:936.2.2區(qū)間估計(jì)(Intervalestimate)點(diǎn)估計(jì)總是以誤差存在為前提,而不能提供正確估計(jì)的概率。沒(méi)有解決參數(shù)估計(jì)的精確度和可靠性問(wèn)題。而區(qū)間估計(jì)可以彌補(bǔ)這一不足之處。區(qū)間估計(jì)就是用一個(gè)區(qū)間去估計(jì)未知參數(shù),它不具體指出總體參數(shù)等于什么,但能指出總體的未知參數(shù)落入某一區(qū)間的概率有多大。設(shè)x1,x2,…,xn是來(lái)自密度f(wàn)(x,)的樣本,對(duì)于給定的,0<<1,如能找到兩個(gè)統(tǒng)計(jì)量1(x1,x2,…,xn)和2(x1,x2,…,xn),使得P{1(x1,x2,…,xn)<<2(x1,x2,…,xn)}=1-,稱(chēng)1-是置信度,(1(x1,x2,…,xn),2(x1,x2,…,xn))是置信度為1-的的置信區(qū)間(Confidenceinterval);稱(chēng)為顯著性水平(Significancelevel)6.2.2區(qū)間估計(jì)(Intervalestimate)設(shè)94置信區(qū)間表明了區(qū)間估計(jì)的精確性。區(qū)間越小越精確,區(qū)間越大越不精確;置信度表明了區(qū)間估計(jì)的可靠性(1-)。區(qū)間估計(jì)不可靠的概率為,如=0.05,表明下結(jié)論犯錯(cuò)誤的概率。進(jìn)行區(qū)間估計(jì)時(shí),總是事先確定號(hào)標(biāo)準(zhǔn)。通常有三個(gè)標(biāo)準(zhǔn):1-:0.95,0.99,0.999:0.05,0.01,0.001區(qū)間估計(jì)的原理是樣本分布理論:進(jìn)行區(qū)間估計(jì)值的計(jì)算及估計(jì)正確概率的解釋上是依據(jù)該樣本統(tǒng)計(jì)量的分布規(guī)律及樣本分布的標(biāo)準(zhǔn)誤。樣本分布提供概率解釋?zhuān)粯?biāo)準(zhǔn)誤的大小決定區(qū)間估計(jì)長(zhǎng)度。標(biāo)準(zhǔn)誤越小,置信區(qū)間的長(zhǎng)度越短,估計(jì)越精確,仍能保持較高的估計(jì)成功率。加大樣本容量就能使標(biāo)準(zhǔn)誤變小。置信區(qū)間表明了區(qū)間估計(jì)的精確性。區(qū)間越小越精確,區(qū)間越大越不956.3總體均值和總體比例的區(qū)間估計(jì)6.3.1總體均值的區(qū)間估計(jì)1、方差2已知(1)X服從正態(tài)分布,X~N(,2)給定顯著性水平,6.3總體均值和總體比例的區(qū)間估計(jì)給定顯著性水平,96給定顯著性水平,總體均值在1-的置信水平下的置信區(qū)間為:或(2)當(dāng)總體為非正態(tài)分布時(shí),樣本容量>30(大樣本)時(shí),樣本均值近似服從正態(tài)分布置信區(qū)間為:或給定顯著性水平,總體均值在1-的置信水平下的置信97例6.4母總體為正態(tài)分布,=7.07,抽取兩個(gè)樣本n1=10,X1=78,n2=36,X2=79求的0.95、0.99置信區(qū)間。例6.5已知某校的一次考試全體考生成績(jī)總方差為100,從中抽得5位考生的成績(jī)?yōu)?5,83,94,70,88,試求全體考生成績(jī)均值的95%和99%的置信區(qū)間。例6.4母總體為正態(tài)分布,=7.07,抽取兩個(gè)樣本n1982、方差2未知(1)總體服從正態(tài)分布,X~N(,2)用S2代替2,建立區(qū)間估計(jì)統(tǒng)計(jì)量置信區(qū)間為:n足夠大,大于等于30時(shí),也可用正態(tài)分布.2、方差2未知置信區(qū)間為:n足夠大,大于等于30時(shí),也可用99(2)總體非正態(tài),且方差未知n足夠大時(shí),估計(jì)統(tǒng)計(jì)量接近正態(tài)分布,置信區(qū)間為,總體均值、總體比例區(qū)間估計(jì)的一般規(guī)律:點(diǎn)估計(jì)值±臨界值×標(biāo)準(zhǔn)誤(2)總體非正態(tài),且方差未知總體均值、總體比例區(qū)間估計(jì)的一般100例6.6某校對(duì)高中一年級(jí)學(xué)生進(jìn)行英語(yǔ)水平測(cè)試,測(cè)試后從中抽取的9個(gè)考生的成績(jī)?yōu)?3,91,62,50,74,68,70,65,85,試對(duì)該年級(jí)考生的該次測(cè)試成績(jī)均值作區(qū)間估計(jì)(取=0.05)例6.7總體未知,S2=S2n-1=34,n=100人,樣本平均值為26分鐘,估計(jì)全校學(xué)生平均每天鍛煉時(shí)間。例6.8已知某一總體均值的95%置信區(qū)間為(122,130)。如果樣本均值為126,樣本標(biāo)準(zhǔn)差為16.07,則研究中應(yīng)選取多大的樣本容量?例6.6某校對(duì)高中一年級(jí)學(xué)生進(jìn)行英語(yǔ)水平測(cè)試,測(cè)試后從中抽1016.3.2總體比例的區(qū)間估計(jì)某種特征占全部單位的比例p,樣本比例為p,在大樣本下(np>5,nq>5),可將二項(xiàng)分布變換為正態(tài)分布總體比例p的置信區(qū)間:6.3.2總體比例的區(qū)間估計(jì)總體比例p的置信區(qū)間:102例6.10在整個(gè)流動(dòng)原因的研究中,從某企業(yè)抽取200人流動(dòng)人員的樣本,有140人說(shuō)離開(kāi)的原因是不能與管理人員融洽相處,求由于該原因離開(kāi)的真正比例的95%的置信區(qū)間。例6.10在整個(gè)流動(dòng)原因的研究中,從某企業(yè)抽取200人流動(dòng)1036.3.3樣本容量的確定確定n十分重要,n過(guò)大,增加費(fèi)用,n過(guò)小誤差增大。n的確定依賴(lài)于多大置信度(可靠性),什么樣的精度(多寬的區(qū)間)。1、估計(jì)時(shí)n的確定正態(tài)總體或非正態(tài)總體但大樣本時(shí),置信區(qū)間為(用樣本均值估計(jì)時(shí)允許的最大絕對(duì)誤差)6.3.3樣本容量的確定(用樣本均值估計(jì)時(shí)允許的最大絕104樣本容量n,總體方差2,允許誤差,可靠性系數(shù)Z/2的關(guān)系:(1)總體方差越大,需要的樣本容量越大;反之亦然;(2)允許誤差越大,需要的樣本容量越小,反之亦然;(3)可靠性系數(shù)越大,需要的樣本容量越大,反之亦然.例6.11要使95%置信區(qū)間的允許誤差為5,應(yīng)選取多大的樣本容量?假定總體的標(biāo)準(zhǔn)差為25.例6.12一家廣告公司想估計(jì)某類(lèi)商店去年所花的平均廣告費(fèi)有多少。經(jīng)驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?樣本容量n,總體方差2,允許誤差,可靠性系數(shù)Z/1052、估計(jì)總體比例時(shí),樣本容量的確定估計(jì)總體比例時(shí),允許的最大絕對(duì)誤差為2、估計(jì)總體比例時(shí),樣本容量的確定106例6.13一家市場(chǎng)調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對(duì)p的估計(jì)誤差不超過(guò)0.05,要求的可靠程度為95%,應(yīng)取多大容量的樣本?例6.14一項(xiàng)調(diào)查中,總體比率的計(jì)劃值為0.35,則當(dāng)允許的最大絕對(duì)誤差為0.05時(shí),在求其95%置信區(qū)間時(shí)應(yīng)采用多大的樣本容量。例6.13一家市場(chǎng)調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所1076.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)6.4.1兩個(gè)總體均值之差的估計(jì)1、兩總體方差已知條件:1)兩總體均服從正態(tài)分布或分布未知但為大樣本;2)兩個(gè)樣本獨(dú)立1-2在1-置信度水平下的置信區(qū)間為:6.4兩個(gè)總體均值及兩個(gè)總體比例之差的估計(jì)1-2在1108例6.15一個(gè)銀行負(fù)責(zé)人想知道儲(chǔ)戶(hù)存入兩家銀行的錢(qián)數(shù)。他從兩家銀行各抽取了一個(gè)25個(gè)儲(chǔ)戶(hù)組成的隨機(jī)樣本,樣本平均值如下:銀行A:4500元;銀行B:3250元。設(shè)已知兩個(gè)總體服從方差分別為2500和3600的正態(tài)分布。試求:A-B的區(qū)間估計(jì):(1)置信度95%;(2)置信度99%.例6.15一個(gè)銀行負(fù)責(zé)人想知道儲(chǔ)戶(hù)存入兩家銀行的錢(qián)數(shù)。他從1092、兩總體方差未知(1)兩個(gè)總體為正態(tài)分布,且12=22=2將兩個(gè)樣本聯(lián)合起來(lái)估計(jì)2,聯(lián)合統(tǒng)計(jì)量為估計(jì)量的標(biāo)準(zhǔn)誤為:置信區(qū)間為:2、兩總體方差未知估計(jì)量的標(biāo)準(zhǔn)誤為110例6.16為了比較兩位銀行職員為新顧客辦理個(gè)人結(jié)算帳目的平均時(shí)間長(zhǎng)度,分別給兩位職員隨機(jī)安排了10位顧客,并記錄了為每位顧客辦理帳單所需的時(shí)間(單位:分鐘),相應(yīng)的樣本均值和方差為:假定每位職員辦理帳單所需時(shí)間均服從正態(tài)分布,且方差相等,試求兩位職員辦理帳單的服務(wù)時(shí)間之差的95%的區(qū)間估計(jì)。例6.16為了比較兩位銀行職員為新顧客辦理個(gè)人結(jié)算帳目的平111解:根據(jù)題意,兩總體服從正態(tài)分布且方差相等,未知。1-2的置信區(qū)間為:所求區(qū)間估計(jì)為:解:根據(jù)題意,兩總體服從正態(tài)分布且方差相等,未知。所求區(qū)間估112(2)兩個(gè)總體均服從正態(tài)分布且用S12估計(jì)12,用S22估計(jì)22,的估計(jì)為這時(shí)不服從t(n1+n2-2)而服從t(f)若f不是整數(shù),則取與f最接近的整數(shù)作為自由度的取值。1-2的置信度為(1-)的近似區(qū)間估計(jì)為:(2)兩個(gè)總體均服從正態(tài)分布且113例6.17上例中若假定兩個(gè)總體的方差不等。求兩個(gè)均值之差的區(qū)間估計(jì)。解:則t0.05/2(18)=2.1009,從而所求兩均值之差的95%的近似區(qū)間估計(jì)為:即例6.17上例中若假定兩個(gè)總體的方差不等。求兩個(gè)均值之差的114(3)如果兩個(gè)總體不服從正態(tài)分布,且方差不等,當(dāng)n1、n2很大時(shí),,將S1和S2作為1和2的估計(jì)值,置信區(qū)間為:(3)如果兩個(gè)總體不服從正態(tài)分布,且方差不等,當(dāng)n1、n2很1156.4.2兩個(gè)總體比例之差的區(qū)間估計(jì)設(shè)兩個(gè)總體的比例分別為p1和p2,為了估計(jì)p1-p2,分別從兩個(gè)總體中各隨機(jī)抽取容量為n1和n2的兩個(gè)隨機(jī)樣本。并計(jì)算兩個(gè)樣本中的比例當(dāng)n1和n2兩者都很大時(shí),而且總體比例不太接近0或1時(shí),的抽樣分布服從正態(tài)分布,從而p1-p2的置信區(qū)間為:用代替p1和p26.4.2兩個(gè)總體比例之差的區(qū)間估計(jì)從而p1-p2的置信區(qū)116例6.18某飲料公司對(duì)其所做的報(bào)紙廣告在兩個(gè)城市的效果進(jìn)行了比較,它們從兩個(gè)城市中分別隨機(jī)地調(diào)查了1000個(gè)成年人,其中看過(guò)該廣告的比例分別為0.18和0.14,試求兩城市成年人中看過(guò)該廣告的比例之差的95%的置信區(qū)間。例6.18某飲料公司對(duì)其所做的報(bào)紙廣告在兩個(gè)城市的效果進(jìn)行117解:由于樣本容量都為1000,屬于大樣本容量,置信區(qū)間為:即故以95%的把握估計(jì)兩城市成年人中看過(guò)該廣告的比例差在0.79%~7.21%之間。解:由于樣本容量都為1000,屬于大樣本容量,置信區(qū)間為:即1186.5正態(tài)總體方差及兩正態(tài)總體方差之比的區(qū)間估計(jì)6.5.1正態(tài)總體方差的區(qū)間估計(jì)X1,X2,..,Xn來(lái)自均值,2均未知,則2的點(diǎn)估計(jì)量為S2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論