區(qū)間估計及運算_第1頁
區(qū)間估計及運算_第2頁
區(qū)間估計及運算_第3頁
區(qū)間估計及運算_第4頁
區(qū)間估計及運算_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

節(jié)區(qū)間估計的計算與原理2021/6/271一、兩種主要的估計方法點估計是指根據(jù)抽取到的具體樣本數(shù)據(jù),代入估計量得到的一個估計值。區(qū)間估計是在點估計的基礎(chǔ)上估計出總體參數(shù)一個可能的范圍,同時還給出總體參數(shù)以多大的概率落在這個范圍之內(nèi)。2021/6/272二、為什么要區(qū)間估計呢?在上述警察逮捕人數(shù)的例子中,你計算得出均值為15.6人,你的上司可能會問,這一均值的確是15.6嗎?你的回答將是不知道。但是,你的計算告訴你,這一均值的最優(yōu)估計值是15.6。你的上司可能又會問了,15.6這一估計值到底有多好?也就是說,這一均值估計量包含多大的誤差?2021/6/273回答上述問題的一個辦法是抽取很多的樣本,計算每一個樣本的均值,然后向上司展示均值估計量的變化范圍。不過,這種辦法顯得有些笨。如果你想把這一問題處理得更加高明些,你就應(yīng)該計算所有樣本均值的平均誤差。均值的標(biāo)準(zhǔn)差有一個專門的名稱:均值標(biāo)準(zhǔn)誤差。2021/6/274關(guān)于區(qū)間估計設(shè)為總體x的未知參數(shù),為來自總體的容量為n的簡單隨機樣本,對于預(yù)先給定的一個充分小的正數(shù),我們構(gòu)造兩個統(tǒng)計量:2021/6/275使得則稱區(qū)間為總體參數(shù)的區(qū)間估計或置信區(qū)間。稱為置信區(qū)間的置信度,也稱置信概率、置信系數(shù)或置信水平,稱為置信下限,稱為置信上限。2021/6/276三、置信區(qū)間的含義若獨立地反復(fù)多次抽取容量相同的簡單隨機樣本,每一個樣本都確定一個隨機區(qū)間,在這些區(qū)間中,包含總體參數(shù)真值的約占,或者說有的隨機區(qū)間會包含總體參數(shù)的真值。例如,若,獨立地反復(fù)抽取容量相同的簡單隨機樣本1000次,在得到的1000個隨機區(qū)間中,不包含總體參數(shù)真值的大約有50個。2021/6/277

四、簡單隨機抽樣和等距抽樣的參數(shù)估計(一)總體均值的置信區(qū)間和參數(shù)估計總體均值的區(qū)間估計根據(jù)已知條件不同,有不同的計算方法。1.從正態(tài)總體中抽取樣本,且總體方差已知,均值μ的區(qū)間估計2021/6/2781.從正態(tài)總體中抽取樣本,且總體方差已知,均值μ的區(qū)間估計(1)重復(fù)抽樣的條件下設(shè),已知,為來自總體的容量為n的簡單隨機樣本,則的抽樣分布為2021/6/279在重復(fù)抽樣的方式下,總體均值μ的置信度為1-α的置信區(qū)間為其中,是標(biāo)準(zhǔn)正態(tài)分布α水平的雙側(cè)分位數(shù)。2021/6/27102021/6/2711例一:假設(shè)參加某種壽險投保人的年齡服從正態(tài)分布,標(biāo)準(zhǔn)差為σ=7.77歲。從中抽取36人組成一個簡單隨機樣本(重復(fù)抽樣),其平均年齡為39.5歲,試建立投保人平均年齡μ的90%的置信區(qū)間。2021/6/2712解假設(shè)用隨機變量X表示某種壽險投保人的年齡,則由已知條件有,,n=36。與置信度90%相對應(yīng)的α=0.10,查表,得到2021/6/2713由公式,得,總體均值μ的置信度為90%的置信區(qū)間為于是可以說,我們有90%的把握確信,壽險投保人總體的平均年齡介于37.37到41.63歲之間。2021/6/27141.從正態(tài)總體中抽取樣本,且總體方差已知,均值μ的區(qū)間估計(2)在不重復(fù)抽樣的條件下,置信區(qū)間為2021/6/2715例2一家食品公司,每天大約生產(chǎn)袋裝食品若干,總體方差為100。為對產(chǎn)品質(zhì)量進(jìn)行檢測,該企業(yè)質(zhì)檢部門采用抽樣技術(shù),每天抽取一定數(shù)量的食品,以分析每袋重量是否符合質(zhì)量要求?,F(xiàn)從某一天生產(chǎn)的一批食品8000袋中隨機抽取了25袋(不重復(fù)抽樣),測得它們的重量如下表所示:2021/6/2716已知產(chǎn)品重量服從正態(tài)分布,且總體方差為100。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%。2021/6/2717解已知σ=10;n=25;1-α=59%;=1.96根據(jù)樣本資料,計算的樣本均值為:根據(jù)公式得=105.36±1.96××2021/6/2718即105.36±3.914115=(101.4459,109.2741),該批產(chǎn)品平均重量在95%置信水平下的置信區(qū)間為:101.4459~109.2741。2021/6/27192.正態(tài)總體,大樣本,若總體方差未知,可用樣本標(biāo)準(zhǔn)差S代替。能夠把公式寫出來嗎?重復(fù)抽樣:???不重復(fù)抽樣:???2021/6/2720例三:假設(shè)參加某種壽險投保人的年齡服從正態(tài)分布。從中抽取36人組成一個簡單隨機樣本(重復(fù)抽樣,年齡數(shù)據(jù)見下頁表),試建立投保人平均年齡μ的90%的置信區(qū)間。2021/6/27212021/6/2722解:已知n=36,

1-α=90%;=1.645,由于總體方差未知,但為大樣本,故可用樣本方差代替。根據(jù)樣本資料計算的樣本均值和樣本標(biāo)準(zhǔn)差為:2021/6/2723則置信區(qū)間為:即39.5±2.13=(37.37,41.63),投保人平均年齡在90%的置信水平下的置信區(qū)間為37.37歲~41.63歲。2021/6/27243.正態(tài)總體、小樣本情況下,總體方差未知,總體均值的估計(重復(fù)抽樣條件下)(不重復(fù)抽樣條件下)2021/6/2725

如果總體服從正態(tài)分布,只要總體方差已知,即使在小樣本情況下,也可以計算總體均值的置信區(qū)間。如果總體方差未知,需用樣本方差代替,在小樣本情況下,應(yīng)用t分布來建立總體均值的置信區(qū)間。

t分布是類似正態(tài)分布的一種對稱分布,通常要比正態(tài)分布平坦和分散。隨著自由度的增大,t分布逐漸趨于正態(tài)分布。2021/6/27264.非正態(tài)總體且大樣本時,均值μ的區(qū)間估計首先,當(dāng)總體為非正態(tài)分布時,只要樣本容量充分大(一般習(xí)慣上要求n>=30),的抽樣分布近似服從正態(tài)分布。當(dāng)已知時,仍可用上述公式,根據(jù)重復(fù)抽樣與否,近似求出總體均值μ的置信區(qū)間;2021/6/2727其次,當(dāng)σ未知時,只要將上述公式中的總體標(biāo)準(zhǔn)差σ用樣本標(biāo)準(zhǔn)差S代替,就可近似得到總體均值μ的置信區(qū)間:(重復(fù)抽樣條件下)(不重復(fù)抽樣條件下)2021/6/2728例為了解居民用于服裝消費的支出情況(非正態(tài)分布),隨機抽取90戶居民組成一個簡單隨機樣本(重復(fù)抽樣),計算得樣本均值為810元,樣本標(biāo)準(zhǔn)差為85元,試建立該地區(qū)每戶居民平均用于服裝消費支出的95%的置信區(qū)間。2021/6/2729

解假設(shè)用隨機變量X表示居民的服裝消費支出,本題雖然總體分布未知,但由于n=90,是大樣本且σ未知,所以可利用公式近似得到總體均值μ的置信區(qū)間。根據(jù)題意,元,元,n=90,與置信度95%相對應(yīng)的α=0.05,查表得到:2021/6/2730

將這些數(shù)據(jù)代入公式,便可得到總體均值μ的置信度為95%的置信區(qū)間為于是,我們有95%的把握認(rèn)為,該地區(qū)每戶居民平均用于服裝消費的支出大約介于792.44元到827.56元之間。2021/6/2731總體分布樣本容量σ已知重復(fù)抽樣σ已知不重復(fù)抽樣正態(tài)分布小樣本(<30)大樣本(>=30)非正態(tài)分布小樣本(<30)————大樣本(>=30)

總體均值μ的區(qū)間估計(置信度為1-α)[簡單隨機抽樣和等距抽樣]2021/6/2732

總體均值μ的區(qū)間估計(置信度為1-α)[簡單隨機抽樣和等距抽樣]總體分布樣本容量σ未知重復(fù)抽樣σ未知不重復(fù)抽樣正態(tài)分布小樣本(<30)大樣本(>=30)非正態(tài)分布小樣本(<30)————大樣本(>=30)2021/6/2733四、簡單隨機抽樣和等距抽樣的參數(shù)估計(二)兩個總體均值之差的區(qū)間估計間1.兩正態(tài)總體方差已知時,且大樣本,的區(qū)間估計因此,兩個總體均值差的置信度為1-α的置信區(qū)間為:2021/6/2734

如果兩個總體方差,未知,則可利用,代替兩個總體方差即可。下述公式可近似求出兩個總體均值差的置信度為1-α的置信區(qū)間。2021/6/2735

四、簡單隨機抽樣和等距抽樣的參數(shù)估計(二)兩個總體均值之差的區(qū)間估計間2.兩正態(tài)總體方差未知但相等時,的區(qū)間估計(小樣本)2021/6/2736當(dāng)兩個正態(tài)總體方差未知但相等,即,且未知時,這時兩個樣本均值之差()的抽樣分布為2021/6/2737所以因為未知,則用共同方差的合并估計量2021/6/2738兩個總體均值差的置信度為1-α的置信區(qū)間為其中,是α水平的自由度為的t分布雙側(cè)分位數(shù)。2021/6/2739例題:某公司為了解男女推銷員的推銷能力是否有差別,隨機抽取16名男推銷員和25名女推銷員進(jìn)行測試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。

2021/6/2740

解假設(shè)用隨機變量,分別表示男女推銷員的銷售額,則由已知條件有元,元,元,元,,。又因兩總體方差相等,可以估計出它們的共同方差:2021/6/2741與置信度95%相對應(yīng)的α=0.05,查t分布表,得到,由公式得男女推銷員銷售額之差的置信度為95%的置信區(qū)間為2021/6/2742

于是,我們有95%的把握認(rèn)為:男推銷員的銷售額既有可能比女推銷員多6568元,也有可能比女推銷員少13568元,所以男女推銷員的推銷能力沒有顯著差別。2021/6/2743四、簡單隨機抽樣和等距抽樣的參數(shù)估計(二)兩個總體均值之差的區(qū)間估計間3.兩正態(tài)總體方差未知但不等時,的區(qū)間估計(小樣本)2021/6/2744

當(dāng)兩正態(tài)總體方差未知但不等時,即,未知,且兩者不相等時,統(tǒng)計量近似服從于自由度為v的t分布,其中v的計算公式如下2021/6/27452021/6/2746于是,兩個總體均值差的置信度為1-α的置信區(qū)間為2021/6/2747例題:某公司為了解男女推銷員的推銷能力是否有差別,隨機抽取16名男推銷員和25名女推銷員進(jìn)行測試。男推銷員的平均銷售額為30250元,標(biāo)準(zhǔn)差為18400元,女推銷員的平均銷售額為33750元,標(biāo)準(zhǔn)差為13500元。假設(shè)男女推銷員的銷售額服從正態(tài)分布,且方差不相等。試建立男女推銷員銷售額之差的95%的置信區(qū)間。

2021/6/2748解首先根據(jù)公式計算自由度v,

2021/6/2749查t分布表,得到,由公式得男女推銷員銷售額之差的置信度為95%的置信區(qū)間為2021/6/2750于是,我們有95%的把握認(rèn)為:男推銷員的銷售額既有可能比女推銷員多7434元,也有可能比女推銷員少14434元,所以男女推銷員的推銷能力沒有顯著差別。

2021/6/2751

四、簡單隨機抽樣和等距抽樣的參數(shù)估計(二)兩個總體均值之差的區(qū)間估計間4.兩非正態(tài)總體且大樣本時,的區(qū)間估計2021/6/2752

如果兩個總體方差,已知,則可利用公式下述公式近似求出兩個總體均值差的置信度為1-α的置信區(qū)間。2021/6/2753

如果兩個總體方差,未知,則可利用,代替兩個總體方差即可。下述公式可近似求出兩個總體均值差的置信度為1-α的置信區(qū)間。2021/6/2754

四、簡單隨機抽樣和等距抽樣的參數(shù)估計(三)一個總體比例的區(qū)間估計2021/6/2755在許多實際應(yīng)用中,經(jīng)常會遇到總體比例的估計問題。例如:企業(yè)的管理人員想了解一批產(chǎn)品中次品的比例;職工收入中工資外收入所占的比例;某高校學(xué)生參加英語四級考試的通過率;某地區(qū)綠化荒山新栽樹木的成活率等。2021/6/2756在總體中具有某種特征的單位數(shù)占總體全部單位的比例稱為總體比例,記為p;在樣本中具有某種特征的單位數(shù)占樣本全部單位的比例稱為樣本比例,記為。在大樣本條件下,樣本比例的抽樣分布近似服從正態(tài)分布,其數(shù)學(xué)期望為2021/6/2757方差為

即2021/6/27581.在大樣本情況下,且總體比例已知,重復(fù)抽樣。則總體比例P的置信度為1-α的置信區(qū)間為2021/6/2759

需要說明:在實際應(yīng)用中,除了要求N>=30以外,還要求和,且,這時近似效果較好。2021/6/27602.在大樣本情況下,且總體比例未知,重復(fù)抽樣。則總體比例P的置信度為1-α的置信區(qū)間為2021/6/2761例題:在對某地區(qū)1000名下崗工人的調(diào)查中發(fā)現(xiàn),女工所占的比例為65%。試建立在下崗工人中,女工所占比例的95%的置信區(qū)間。能否作出下崗工人中女性所占比例超過男性的結(jié)論?2021/6/2762

解假設(shè)用p表示下崗工人中女工所占的比例,則由已知條件可知,樣本比例。因為,,,所以的抽樣分布近似服從正態(tài)分布。2021/6/2763對于α=0.05,查表得。應(yīng)用公式得到在下崗工人中,女工所占比例的置信度為95%的置信區(qū)間為2021/6/2764

于是,我們有95%的把握認(rèn)為,下崗工人中女工所占比例大約在0.62到0.68之間,超過了0.5,所以可以得出女性所占比例超過男性的結(jié)論。2021/6/27653.如果總體為有限總體,采用不重復(fù)抽樣,且抽樣比時,的抽樣分布的方差要用修正系數(shù)

加以修正,這時總體比例p(未知時)的置信度為1-α的置信區(qū)間為2021/6/2766例某地區(qū)有20所高等院校,有副教授以上職稱的教師7800名。高校的管理部門想了解具有高級職稱的教師中有基礎(chǔ)研究課題的教師占多大的比例,于是抽取400人組成一個隨機樣本(不重復(fù)抽樣)。經(jīng)調(diào)查,其中80人有基礎(chǔ)研究課題。試建立在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占比例的95%的置信區(qū)間。

2021/6/2767解假設(shè)用p表示在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占的比例,則由已知條件可知N=7800,n=400,樣本比例=80/400=0.2,α=0.05,。因為

,所以的抽樣分布近似服從正態(tài)分布。2021/6/2768所以的抽樣分布近似服從正態(tài)分布。又因為抽樣比大于5%,所以要對的抽樣分布的方差加以修正。應(yīng)用公式得到在具有副教授以上職稱的教師中,有基礎(chǔ)研究課題的教師所占比例的95%的置信區(qū)間為

2021/6/2769于是我們有95%的把握認(rèn)為,該地區(qū)20所高校具有副教授以上職稱的教師中,有()到()的教師有基礎(chǔ)研究課題。2021/6/2770

四、簡單隨機抽樣和等距抽樣的參數(shù)估計(四)一個正態(tài)總體方差的區(qū)間估計為來自總體的容量為n的簡單隨機樣本,σ未知,s為樣本標(biāo)準(zhǔn)差。

2021/6/2771

總體標(biāo)準(zhǔn)差σ的置信度為1-α的置信區(qū)間為2021/6/2772因此,總體方差的置信度為1-α的置信區(qū)間為2021/6/2773例假設(shè)公司預(yù)計的每股收益率服從正態(tài)分布,現(xiàn)有8個公司組成一個簡單隨機樣本,樣本方差為2.619,試建立總體方差、總體標(biāo)準(zhǔn)差的95%的置信區(qū)間。2021/6/27742021/6/27752021/6/2776

五、分層抽樣和整群抽樣的參數(shù)估計

嚴(yán)格地講,分層抽樣與整群抽樣的參數(shù)估計與簡單隨機抽樣沒有本質(zhì)區(qū)別。只不過在計算方差時存在著不同。

2021/6/2777第五節(jié)樣本容量的確定

我們應(yīng)該一直有這樣的疑問:我們學(xué)習(xí)了問卷的設(shè)計、調(diào)查方法的選擇、數(shù)據(jù)的描述、數(shù)據(jù)的整理以及參數(shù)估計的有關(guān)問題。但是,如何進(jìn)行調(diào)查呢?或者說選擇多少樣本呢?或者說需要選擇多少個被調(diào)查者呢?2021/6/2778第五節(jié)樣本容量的確定這就涉及到我們今天要學(xué)的內(nèi)容:樣本容量的確定。2021/6/2779第五節(jié)樣本容量的確定這就涉及到我們今天要學(xué)的內(nèi)容:樣本容量的確定。2021/6/2780一、影響樣本容量的因素(一)置信度,也即總體參數(shù)真值落在置信區(qū)間內(nèi)的可靠程度。要求較高的置信度,就需要較大的樣本容量,置信度越高,樣本容量就越大。2021/6/2781一、影響樣本容量的因素(二)估計的精度,也即置信區(qū)間的寬度。要求較高的置信度,就會擴大置信區(qū)間的寬度,也就是說降低了估計的精度。因此,要想既提高估計的精度,又不降低估計的可靠性程度,必須增加樣本容量。2021/6/2782一、影響樣本容量的因素(三)建立置信區(qū)間的費用。雖然增加樣本容量可以提高置信區(qū)間的可靠性程度和估計的精度,但也不是樣本容量愈大愈好。因為增加樣本容量,就會延長調(diào)查時間,增大工作量和成本費用,同時還可能增大調(diào)查誤差。2021/6/2783二、估計總體均值時,樣本容量的確定對于正態(tài)總體,在重復(fù)抽樣或抽樣比n/N<5%時,總體均值μ的置信度為1-α的置信區(qū)間為2021/6/2784二、估計總體均值時,樣本容量的確定記,稱為允許誤差,它表示總體均值μ與樣本均值的絕對誤差不超過Δ。于是,可以推出樣本容量的計算公式為2021/6/27851.樣本容量n與置信度所對應(yīng)的標(biāo)準(zhǔn)正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論