




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計學之參數(shù)估計概述第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 一點估計和區(qū)間估計 點估計和區(qū)間估計是參數(shù)估計常用的兩種方法 首先明確兩個概念 估計量:用來對總體參數(shù)進行估計的相應(yīng)的樣本統(tǒng)計量。樣本統(tǒng) 計量在對總體參數(shù)進行估計時有了一個新的名稱。常見的估計量 樣本平均數(shù) 樣本比率 或 樣本標準差 樣本方差 以上的幾個的樣本統(tǒng)計量通??梢猿蔀橄鄳?yīng)總體參數(shù)的估計量。 估計值:估計值是樣本統(tǒng)計量的具體觀察值,是統(tǒng)計量中的一個具體數(shù)值。 xnnxx1nnp1nap 12nxxs122nxxs第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 點估計就是根據(jù)樣本資料計算的一個估計值,也就是用樣本資料計算的某個統(tǒng)計量的具體點
2、值作為總體參數(shù)的估計值。例如要估計一批產(chǎn)品的平均使用壽命,其方法是:先從總體中隨機抽取一個樣本,計算樣本統(tǒng)計量,樣本平均數(shù)1000小時那么可以說總體平均數(shù)的估計值為1000小時??梢苑謩e用樣本方差的一個具體的點值、樣本比率的一個點值去作為總體相應(yīng)參數(shù)的估計值。特點是:方法簡單,又能準確估計出總體參數(shù)。無法計算估計誤差。不可能知道估計的可靠程度。 點估計法盡管方法簡單,但因為無法計算估計誤差,不可能知道估計的可靠程度,因此在實際工作中很少使用。但是只要堅持了估計量的優(yōu)良標準,這種方法還是完全可行的。 參數(shù)估計使用較多的還是區(qū)間估計第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 區(qū)間估計:區(qū)間估計:根據(jù)樣本
3、統(tǒng)計量估計總體參數(shù)所處的具有一定可靠程度的區(qū)間,就稱為區(qū)間估計。區(qū)間估計就是要找出總體參數(shù)的上限和下限,并且給出總體參數(shù)落入該區(qū)間的可靠程度。也就是找出我們此前介紹過的總體參數(shù)的置信區(qū)間。特點是 1、可以計算估計誤差,明確估計的精確度。 2、明確估計的可靠程度。 3、使用廣泛。 上節(jié)內(nèi)容回憶1、統(tǒng)計推斷、參數(shù)估計、假設(shè)檢驗、2、估計量、估計值3、點估計概念、特點4、區(qū)間估計的概念、特點第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 二估計量的優(yōu)良標準 用樣本統(tǒng)計量對總體參數(shù)進行估計時,并非所有的估計量都是優(yōu)良的,而對于區(qū)間估計,無論如何,可計算出估計的可靠程度,也能根據(jù)置信區(qū)間了解估計的精確度。但對于點
4、估計來講,樣本統(tǒng)計量是否可以作為總體參數(shù)的估計量,要看其是否符合估計量的優(yōu)良標準。一個好的估計量有如下三個標準:第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 一無偏性 如果樣本統(tǒng)計量的數(shù)學期望值等于該統(tǒng)計量所估計的總體參數(shù),那么這個總體的估計量叫做無偏估計量。這是一個好的估計量的一個首要條件。 根據(jù)樣本平均數(shù)的抽樣分布我們知道,對于正態(tài)總體,樣本平均數(shù)的分布服從正態(tài)分布,而且樣本平均數(shù)的平均數(shù)就等于原總體平均數(shù),對于非正態(tài)總體,只要樣本容量足夠大,樣本平均數(shù)的分布也服從正態(tài)分布,而且樣本平均數(shù)的平均數(shù)也等于原總體平均數(shù)。第七章作過證明,并且用數(shù)學期望的方法也可以證明:樣本平均數(shù)的數(shù)學期望等于總體平均數(shù)
5、。對正態(tài)總體或樣本容量足夠的非正態(tài)總體而言,用樣本平均數(shù)作為總體平均數(shù)的點估計時,就符合這一要求 無偏性實際是指在估計時沒有系統(tǒng)的偏差,并不是說每次抽樣,樣本平均數(shù)就等于總體平均數(shù),而是從平均意義上講的,即如果這種估計方法重復進行,那么從估計量所獲得的平均數(shù)等于總體參數(shù)。 數(shù)學期望可以理解為:大量結(jié)果的平均數(shù)。顯然,如果說一個估計量是無偏的,并不是保證用于單獨一次估計中沒有隨機性誤差,只是沒有系統(tǒng)性的偏差而已。同樣可以證明,樣本方差的數(shù)學期望等于總體方差。如果用數(shù)學公式表示 E-數(shù)學期望 xE 22sE第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 二一致性 當樣本容量n增大時,如果估計量越來越接近總體
6、參數(shù)的真值時就稱這個估計量為總體參數(shù)的一致估計量。通過抽樣分布的討論我們知道,樣本平均數(shù)、樣本方差和標準差、樣本比率,樣本容量越大,其數(shù)值就越接近總體相應(yīng)參數(shù),可見它們具有一致性的性質(zhì)。如果一個估計量是一致估計量,那么,在進行估計時是,樣本容量越大,估計的可靠程度就越高。盡管我們不知道具體的可靠程度。當然,在樣本容量n增大時,估計量的一致性雖會增強,但調(diào)查研究所需的人、財、物力也相應(yīng)增加。第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 三有效性 有效性實際是指估計量的離散程度大小。對同一個總體參數(shù)來講,如果兩個估計量都是無偏的,其中方差較小的對給定的樣本容量而言就可認為相對來說是更有效的。 例如:從一個
7、總體中隨機抽取一個容量為n的樣本,可以計算它的樣本平均數(shù)和樣本中位數(shù),樣本平均數(shù)和樣本中位數(shù)都是平均指標,可以證明,兩種平均指標都可以作為總體平均數(shù)的無偏、一致估計量,但是誰更有效呢?從第七章分析中可以知道, ,對于同一個樣本容量,樣本中位數(shù)md的方差 可以證明,省略,因此,在滿足了無偏性和一致性要求的同時,樣本平均數(shù)比樣本中位數(shù)作為總體平均數(shù)的估計量更有效。nx22ndm2257. 1如果一個估計量同時滿足這三個標準,那么就可以說這一個估計量是一個好的估計量。樣本平均數(shù)和樣本方差標準差、樣本比率都是符合無偏性、一致性、有效性的總體參數(shù)估計量。 第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 三參數(shù)估計
8、的一般程序 1提出估計的根本要求 對于區(qū)間估計,參數(shù)估計必須給出兩個根本要求中的一個。一是估計的允許誤差,一個便是估計的可靠程度。抽樣允許誤差要求越小越好,越小精確度越高,太大失去了估計的意義。但是允許誤差越小,那么估計的可靠程度越低。估計的可靠程度越高,那么允許誤差越大。 2確定最低的樣本容量 將在此后內(nèi)容中詳細介紹第八章 參數(shù)估計第一節(jié) 參數(shù)估計概述 3編制抽樣框 抽樣框是組織抽樣的根底。抽樣框是包含全部總體單位及其主要標志特征的框,從中可以抽出樣本單位及其根底資料。抽樣框常見的有兩種總體單位清單 可以是總體單位的名單框架、盛有總體單位名單的籃子,也可以是按照適當標志排隊的總體單位順序表。
9、地段抽樣框 地段單位是明確地劃定了地理邊界的單位。要根據(jù)地圖來進行確定。 4抽取樣本 5樣本準確性和代表性檢查 6實地調(diào)查 7估計第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計 從第七章了解到,總體是否正態(tài)分布,總體方差是否,大樣本還是小樣本,甚至重復抽樣還是不重復抽樣,樣本統(tǒng)計量的分布都有所不同,樣本平均數(shù)的分布固然也不相同,以下幾種情況是我們要掌握的: 1、正態(tài)總體,方差 2、非正態(tài)總體,方差 3、總體方差未知,小樣本 4、總體方差未知,大樣本 一、正態(tài)總體、方差 1根本原理 如果抽樣總體服從正態(tài)分布,而且方差,設(shè):總體平均數(shù)為 ,標準差為 ,那么樣本平均數(shù)的分布服從正態(tài)分布,且樣本平均數(shù)的
10、平均數(shù) ,樣本平均數(shù)的標準差 。既然 服從正態(tài)分布,那么, 依然服從正態(tài)分布,因為 是一個常數(shù),因此, 依然服從正態(tài)分布,對于新的變量 ,因為 ,因此其平均數(shù)等于0;因為原變量在減去 同時縮小了 倍,那么其標準差應(yīng)縮小 倍,所以其標準差就為1。因此由 轉(zhuǎn)化而來的新變量 就服從標準正態(tài)分布。我們知道在標準正態(tài)分布中,任意一個變量出現(xiàn)的概率可以查表得到,而且我們還記住了常見的幾個區(qū)間概率。例:在標準正態(tài)分布中,落在-2 , 2區(qū)間的概率是95.45%。用公式表示為:xnxxxnnxnx0 xnnxnx 或 換成中文就是 的概率保證是95.45% 移項整理 的概率保證是95.45% 到此我們已經(jīng)明白
11、,如果給定了估計的可靠程度95.45%,我們又通過抽樣,計算出了樣本平均數(shù)為 ,那么我們就知道9545. 022nxP9545. 022nxnPnxn22nxnx22xnxnx22第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計 從第七章我們也曾討論過,變量落入置信區(qū)間以外的概率叫做顯著水平,那么,給定顯著水平,也就是給定了置信概率。置信概率等于1。我們可以查一定顯著水下的正態(tài)分布變量值,來確定總體平均數(shù)的置信區(qū)間了。第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計 2方法步驟1抽取樣本,計算樣本平均數(shù)2計算樣本平均數(shù)標準差均數(shù)標準差 如果明確是不重復抽樣,注意需要用 進行修正。3確定置信水平置信概率
12、、保證概率、保證水平,根據(jù)置信水平確定顯著水平xnxxnx1NnN第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計4查標準正態(tài)分布表中顯著水平為時的變量值Z Z0.1 、 Z0.05、 Z0.04555構(gòu)造總體平均數(shù)的置信區(qū)間xxZxZxnZxnZx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計例8-1某制造廠質(zhì)量管理部門的負責人希望估計移交給接收部門的5500包原材料的平均重量。一個250包原材料組成的隨機樣本所給出的平均值 =65千克??傮w標準差 =15千克。試構(gòu)造總體未知的平均值的置信區(qū)間,假定95%的置信區(qū)間已能令人滿意,并假定總體為正態(tài)分布。解:此題中,總體服從正態(tài)分布,所以樣本平均數(shù)也服
13、從正態(tài)分布。并N5500,n250, =65克, =15克,置信水平95%xx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計1抽取樣本,計算樣本平均數(shù) 對此題,樣本已抽出,樣本平均數(shù) =65克2計算樣本平均數(shù)標準差均數(shù)標準差如果不明確是不重復抽樣,均可以看作是重復抽樣對此題, 3確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平95,顯著水平0.05xnxxxnx25015nx4查標準正態(tài)分布表中顯著水平為=0.05時的變量值Z0.05對此題,Z0.05=1.965構(gòu)造總體平均數(shù)的置信區(qū)間 結(jié)論:根據(jù)抽樣研究,5500包原材料所組成的總體總體平均數(shù), ,估計的可靠程度為95。xxZxZxnZ
14、xnZx2501596. 1652501596. 16586. 16586. 16586.6614.6386.6614.63第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計二非正態(tài)總體,方差如果抽樣總體不服從正態(tài)分布,那么抽取的樣本平均數(shù)也不服從正態(tài)分布,但是隨著樣本容量的增大,樣本平均數(shù)的分布越來越接近于正態(tài)分布,如果樣本容量足夠大,樣本平均數(shù)的分布可近似看作正態(tài)分布。而且樣本平均數(shù)的平均數(shù) ,樣本平均數(shù)的標準差 ,我們自然可以利用正態(tài)分布來解決總體平均數(shù)的區(qū)間估計問題了。xnx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計例8-2 某職業(yè)介紹所的職員從申請某一職業(yè)的1000名申請者中采用不重復抽
15、樣方法隨機抽取了200名申請者,借此來估計1000名申請者考試的平均成績。由200名申請者構(gòu)成的樣本平均數(shù) =78分,由已往經(jīng)驗總體方差為 90,但該職員不知總體服從何種分布,試求90%的置信區(qū)間。解:根據(jù)中心極限定理,由于這個問題的樣本容量為200,遠大于30或50,足夠大,因此,樣本平均數(shù)的分布可看作近似服從正態(tài)分布。又因為是有限總體的不重復抽樣,所以在計算均數(shù)標準差時需乘以有限總體修正系數(shù)即可。x2第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計方法步驟:1抽取樣本,計算樣本平均數(shù)對此題,樣本已抽出,樣本平均數(shù) =78分2計算樣本平均數(shù)標準差均數(shù)標準差明確是不重復抽樣,需要校正。 對此題,
16、3確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平90,顯著水平0.1xnxxx60. 0110002001000200901NnNnx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計4查標準正態(tài)分布表中顯著水平為=0.1時的變量值Z0.1對此題,Z0.1=1.6455構(gòu)造總體平均數(shù)的置信區(qū)間 結(jié)論:根據(jù)抽樣研究,1000申請者組成的總體總體平均數(shù)在7779,估計的可靠程度為90。xxZxZxnZxnZx60. 0645. 17860. 0645. 1787977第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計三總體方差未知,小樣本 從一個正態(tài)總體中抽取樣本,樣本平均數(shù)的分布服從正態(tài)分布,而且樣
17、本平均數(shù)分布的平均數(shù)等于原總體平均數(shù),樣本平均數(shù)的標準差 ,變量 此時服從標準正態(tài)分布。 如果總體方差未知,那么變量 服從t分布。如果樣本容量足夠大,t分布近似服從標準正態(tài)分布。如果樣本容量小于30或50,那么只能服從t分布。由此可見,正態(tài)總體方差未知,小樣本時,只能用t分布來解決總體平均數(shù)區(qū)間估計問題。nxnxnsx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計 如果總體是非正態(tài)總體,盡管方差,樣本平均數(shù)的分布也不服從正態(tài)分布。但如果樣本容量足夠大,樣本平均數(shù)的分布近似服從正態(tài)分布。也可以用正態(tài)分布來解決總體平均數(shù)區(qū)間估計問題。例題8-2。 但非正態(tài)總體,且方差未知,那么只要樣本容量足夠大,即
18、使用樣本方差代替總體方差,樣本平均數(shù)轉(zhuǎn)換變量 的分布仍然近似服從t分布。因為樣本容量足夠大樣本平均數(shù)的分布也近似服從正態(tài)分布,變量 也近似服從標準正態(tài)分布??梢杂胻分布也可以用正態(tài)分布來解決總體平均數(shù)區(qū)間估計問題。nsxnsx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計如果總體是非正態(tài)總體,方差未知,且樣本容量小于30或50,樣本平均數(shù)的分布難以確定是何種分布,用樣本方差代替總體方差,變量 既不服從t分布,也很難確定其屬于何種分布。非正態(tài)總體總體方差未知且小樣本,如何進行總體參數(shù)的區(qū)間估計呢?規(guī)定兩個條件:1抽樣總體近似服從正態(tài)分布。2總體中的變量相互獨立。即抽取一個變量對剩余的變量數(shù)值無影響
19、。在總體變量不相互獨立時,必須保證總體容量N很大,而樣本容量n又很小,抽取n個單位對獨立性影響不大。此時, 近似服從t分布??梢园凑誸分布解決區(qū)間估計問題。nsxnsx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計 例8-3 為了估計1分鐘1次廣告的平均費用,抽出了15個電視臺的隨機樣本。樣本的平均值=2000元,其標準差s=1000元。假定所有被抽樣的這類電視臺近似服從正態(tài)分布,試構(gòu)造總體平均值為95%的置信區(qū)間。 解:總體近似服從正態(tài)分布,但方差末知,n=15, =2000,S=1000,置信水平95%,=0.05x 方法步驟: 1抽取樣本,計算樣本平均數(shù) 對此題,樣本已抽出,樣本平均數(shù)=2
20、000元 2根據(jù)樣本資料計算樣本標準差 對本例 s1000 3計算樣本平均數(shù)標準差均數(shù)標準差 雖未明確是抽樣方法,但總體容量很大,不需再作校正。 對此題,xnxx12nxxs20.258151000nsnx4確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平95,顯著水平0.055查自由度為n-1=15-1=14時的t分布表中顯著水平為=0.05時的變量值t0.052.145雙尾6構(gòu)造總體平均數(shù)的置信區(qū)間 結(jié)論:根據(jù)抽樣研究,總體平均數(shù) ,估計的可靠程度為95。nstxnstx20.258145. 22000020.258145. 220008 .25532 .14468 .25532 .
21、1446第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計四總體方差未知,大樣本不管原總體服從何種分布,只要樣本容量足夠大,那么樣本平均數(shù)的分布近似服從正態(tài)分布,且 , , 變量 近似服從標準正態(tài)分布。但當總體方差未知時,只有用樣本方差代替總體方差,那么此時變量 就近似服從t分布。當樣本容量遠大于30或50時,也可以認為變量 就近似服從正態(tài)分布。下面用兩種方法同時計算一個例題,看兩種方法的區(qū)別。xnxnxnsxnsx第八章 參數(shù)估計第二節(jié) 總體平均數(shù)的區(qū)間估計例84 某百貨店通過100位顧客的隨機樣本研究購置額,均值和標準差分別為24.75元和5.5元,試構(gòu)造總體均值的90的置信區(qū)間。解:不知總體屬
22、于何種分布,但樣本是大樣本,且樣本容量遠大于30和50,總體方差未知,需用樣本方差 來代替。代替后的變量 近似服從t分布,甚 至近似服從標準正態(tài)分布。nsx方法步驟:1抽取樣本,計算樣本平均數(shù) 對此題,樣本已抽出,樣本平均數(shù)=24.75元2根據(jù)樣本資料計算樣本標準差 對本例 s5.53計算樣本平均數(shù)標準差均數(shù)標準差 對此題,xnxx12nxxs55. 01005 . 5nsnx4確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平90,顯著水平0.15查自由度為n-1=100-1=99時的t分布表中顯著水平為=0.1時的變量值t0.11.661雙尾。單尾檢驗時查t0.05?;蛘卟闃藴收龖B(tài)分布
23、Z0.11.6456構(gòu)造總體平均數(shù)的置信區(qū)間 或者估計的可靠程度為90。nstxnstx55. 0661. 175.2455. 0661. 175.2466.2584.23nsZxnsZx55. 0645. 175.2455. 0645. 175.2466.2585.23nxnZxnZxnxnZxnZxnsxnstxnstxnsxnstxnstxnsZxnsZx條 件均數(shù)標準差總體平均數(shù)置信區(qū)間正態(tài)總體,方差已知非正態(tài),方差已知,大樣本(近似正態(tài)),方差未知,小樣本,方差未知,大樣本或者以上總結(jié)請注意:每種方法適用條件,每種方法最根本的理論依據(jù),主要就是樣本平均數(shù)的抽樣分布,根本的方法步驟都是
24、一樣的。1. 2. S 3. 4. 置信概率 即 5. Z 或t 6. 置信區(qū)間。xx第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計 兩個總體平均數(shù)之差的區(qū)間估計,最關(guān)鍵的還是以樣本平均數(shù)差數(shù)分布為理論依據(jù)。樣本平均數(shù)差數(shù)的分布因為兩個抽樣總體分布不同,方差或未知,大樣本還是小樣本都有所不同,具體情況只能采取具體的方法步驟。 第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計一. 兩個正態(tài)總體,方差 從第七章我們知道,如果兩個總體服從正態(tài)分布,樣本平均數(shù)差數(shù) 的分布服從正態(tài)分布,樣本平均數(shù)差數(shù)分布的平均數(shù)等于兩個總體平均數(shù)之差 ,樣本平均 數(shù)差數(shù)分布的標準差 。既然兩個樣本平均數(shù)差數(shù)的
25、分布服從正態(tài)分布。 作為一個變量減去其總體平均數(shù)也就是 依然服從正態(tài)分布,該變量 再除以樣本平均數(shù)差數(shù)分布的標準差即 自然就服從標準正態(tài)分布。21xx 2122212121nnxx21xx 21xx 21212121xxxx第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計 例8-5某銀行負責人想知道存戶存入2家銀行的錢數(shù),他從每一家銀行各抽選了1個由25個存戶組成的隨機樣本。樣本平均值如下:銀行A: =450元;銀行B =325元。2個總體均服從方差分別為 =750和 =850的正態(tài)分布。試構(gòu)造 的95%的置信區(qū)間。 解:由于2個總體均服從正態(tài)分布,因此 也服從正態(tài)分布,因此可以通過變量轉(zhuǎn)
26、換采用標準正態(tài)分布來估計總體平均數(shù)差數(shù)的置信區(qū)間。并且 =450元, =325元; =750, =850;置信概率95%,即顯著水平為=0.05AxBx2A2BBABAxx AxBx2A2B方法步驟:1從兩個總體各抽一個樣本,計算 , 和 -對本例 =450元, =325元, - =450-325=125元2計算樣本平均數(shù)差數(shù)標準差 3 確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平95,顯著水平0.05AxAxBxBxAxBxBxAx21xx 258502575022BBAAxxnnBA4查標準正態(tài)分布表中顯著水平為=0.05時的變量值Z0.05對此題,Z0.05=1.96(雙尾概率
27、為5,如果查單尾概率表,那么要查 ,即 )5構(gòu)造總體平均數(shù)差數(shù)的置信區(qū)間對本例估計的可靠程度為95%。2Z025. 0ZBABAxxBABAxxBAZxxZxx258502575096. 1125258502575096. 1125BA68.14032.109BA第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計二. 兩個正態(tài)總體,方差未知但相等從第七章我們知道,如果兩個總體服從正態(tài)分布,樣本平均數(shù)差數(shù) 的分布服從正態(tài)分布,樣本平均數(shù)差數(shù)分布的平均數(shù)等于兩個總體平均數(shù)之差 ,樣本平均數(shù)差數(shù)分布的標準差 。變量 服從標準正態(tài)分布。當總體方差未知時,只能用樣本方差去代替總體方差,如果兩個總體方差
28、相等,但因為存在兩個樣本,究竟該用誰去代替總體呢?不能用其中任何一個樣本方差去估計總體方差,而是用兩個樣本的混合方差去估計總體方差。21xx 2122212121nnxx212121xxxx混合方差 混合方差顯然是兩個樣本方差的加權(quán)平均數(shù),權(quán)數(shù)即是兩個樣本各自自由度。既然用混合方差 來代替總體方差,而混合方差其實還是樣本方差,平均數(shù)差數(shù)標準差可以用 計算,但是變量 卻不服從標準正態(tài)分布而是服從自由度為n1+n2-2的t分布。證明從略因此,總體平均數(shù)的置信區(qū)間為: ) 1() 1() 1() 1(212222112nnSnSnSP) 1() 1() 1() 1(212222112nnSnSnSP
29、221221nSnSppxx212121xxxx21)()(2121xxuuxxt22122121)()(nSnStxxpp)2(21nndf第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計例8-6 某工廠中有2臺生產(chǎn)金屬棒的機器。一個隨機樣本由機器A生產(chǎn)的11根金屬棒組成,另一個隨機樣本由機器B生產(chǎn)的21根金屬棒組成。2個樣本分別給出2臺機器所生產(chǎn)金屬棒的長度數(shù)據(jù)如下 =6.10英寸。 =5.95英寸;SA=0.018,SB=0.020。假定2個總體近似服從正態(tài)分布,且總體方差相等,試構(gòu)造A-B 的95%的置信區(qū)間。解:兩個總體方差相等但未知,可以用混合方差來作為總體方差的估計值,計算樣
30、本平均數(shù)差數(shù)標準差,用t分布估計總體平均數(shù)差數(shù)所處的置信區(qū)間。并且題目 =6.10英寸, =5.95英寸;S2A=0.018,S2B=0.020;置信概率95%。AxBxAxBx 方法步驟1從兩個總體各抽一個樣本,計算 , 和 -對本例 =6.10英寸, =5.95英寸, - =6.10 5.950.15英寸2計算兩個樣本的混合方差3計算樣本平均數(shù)差數(shù)標準差 AxBxAxBxAxBxBxAx) 1() 1() 1() 1(212222112nnSnSnSP019. 0) 121() 111(020. 0) 121(018. 0) 111(2PS21xx 21019. 011019. 022Bp
31、ApxxnsnsBA4 確定置信水平,根據(jù)置信水平確定顯著水平對此題,置信水平95,顯著水平0.055查自由度為n1+n2211121130時的t分布表中顯著水平為=0.05時的變量值t0.05對此題,t0.05=2.042(雙尾概率為5,如果查單尾概率,那么要查,即t0.025)6構(gòu)造總體平均數(shù)差數(shù)的置信區(qū)間對本例 總體平均數(shù)差數(shù)即兩臺機器生產(chǎn)的金屬棒平均長度差異在0.050.25英寸之間,估計的可靠程度為95%。BABAxxBABAxxBAtxxtxx21019. 011019. 0042. 215. 021019. 011019. 0042. 215. 0BA25. 005. 0BA第八
32、章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計三. 兩個總體均服從正態(tài)分布,方差未知且不等既然兩個總體方差未知,我們只有用 然后去計算平均數(shù)差數(shù)標準差 但是 此時服從 正態(tài)分布,但 卻不服從自由度 的t分 布。這種情況其實總體平均數(shù)差數(shù)區(qū)間估計沒有了方法。但經(jīng)過研究發(fā)現(xiàn), 服從一種用兩個樣本方差和樣本容量去修正 了的自由度的t分布。修正自由度 ,因此,我們 可以按t分布去解決差數(shù)分布及總體平均數(shù)差數(shù)區(qū)間估計了。2121S2222S22212121nSnSxx)()(2121 xx2221212121)()(nSnSxxt) 1() 1(21nn2221212121)()(nSnSxxt222
33、22121212222121)()()(nnSnnSnSnSf d例8-7 為了說明問題,現(xiàn)假定例8-6中的2個總體方差不等,試構(gòu)造的95%的置信區(qū)間。解:既然兩個總體方差不等,只好用各自樣本方差估計各自總體方差,計算平均數(shù)差數(shù)標準差,然后修正自由度,其修正自由度為: 由這個公式算出來的自由度往往不是整數(shù),可以用四舍五人后的整數(shù)查表求得置信區(qū)間。22222121212222121)()()(nnSnnSnSnSf d方法步驟如下:1. 從兩個總體各抽一個樣本,計算 、 、2. 計算兩個樣本方差 計算公式略3. 計算平均數(shù)差數(shù)標準差 注意: 卻不服從自由度 的t分布,但是他服從另外一個自由度的t
34、分布1x2x21xx 22s21s22212121nsnsxx2221212121)()(nSnSxxt) 1() 1(21nn 4. 計算自由度修正值 (計算時四舍五入取整數(shù)) 5. 確定置信水平或顯著水平 6. 查自由度為 時 7. 構(gòu)建置信區(qū)間 或5分鐘按以上步驟整理例題8722222121212222121)()()(nnSnnSnSnSf daf d t2221212121)()(nSnStxx2121)()(212121xxxxtxxtxx第八章 參數(shù)估計第三節(jié) 兩個總體平均數(shù)之差的區(qū)間估計四. 兩個總體均不服從正態(tài)分布,且方差未知兩個總體變量分布不詳或明確均不服從正態(tài)分布,要想清
35、楚地知道樣本平均數(shù)或樣本平均數(shù)差數(shù)的分布,只有按中心極限定理采用大樣本,此時樣本平均數(shù)的差數(shù)分布近似服從正態(tài)分布。即使用 計算 那么變量 也近似服從 正態(tài)分布,按正態(tài)分布解決問題即可。22S22212121nsnsxx2221212121)()(nSnSuuxx例8-8 A,B兩所大學某學期期末英語考試采用同一試題。A校認為該校學生英語考試成績能比B校高出10分。為了證實這一說法。主管部門從2校各抽取一個隨機樣本并得到如下數(shù)據(jù): nA=75人,nB=80人, =78.6分, =73.8分,sA=8.2分,sB=7.4分。試在95%的置信程度下確定2校平均分數(shù)之差的置信區(qū)間。方法步驟如下:AxB
36、x1. 從兩個總體各抽一個樣本,計算 、 、2. 計算兩個樣本方差 計算公式略 3. 計算平均差數(shù)標準差 均大于等于30或504. 確定置信水平 或顯著水平1x2x21xx 21s22s22212121nsnsxx21nna5. 查標準正態(tài)分布 6. 置信區(qū)間 該題目的結(jié)論是:我們有95%的把握說A、B 2校英語成績之差在2.3-7.3分之間。這個結(jié)果說明A校的平均成績確實高于B校,但并末高出10分。 58. 296. 1645. 101. 005. 01 . 0ZZZ2221212121)()(nSnSZxx22212121nnxx2121212121xxxxZxxZxx) 1() 1()
37、1() 1(212222112nnSnSnSP221221nSnSppxx21212121xxBAxxtxxtxx22212121nsnsxx2221212121)()(nSnStxx22222121212222121)()()(nnSnnSnSnSf d22212121nsnsxx2221212121)()(nSnSZxx條 件平 均 數(shù) 差 數(shù) 標準差總體平均數(shù)置信區(qū)間兩個正態(tài)總體,方差已知兩個正態(tài)總體,方差未知但相等 自由度dfn1+n22兩個正態(tài)總體,方差未知且不等自由度兩個非正態(tài)總體,方差未知(大樣本)內(nèi)容回憶1、統(tǒng)計推斷、參數(shù)估計、假設(shè)檢驗、估計量、估計值2、點估計概念、特點3、區(qū)
38、間估計的概念、特點4、估計量的優(yōu)良標準,無偏性、一致性、有效性。數(shù)學期望5、區(qū)間估計的一般程序,參數(shù)估計的兩個根本條件6、總體平均數(shù)的區(qū)間估計7、兩個總體平均數(shù)之差的區(qū)間估計第八章 參數(shù)估計第四節(jié) 總體比率的區(qū)間估計當 或 大于5, 或 不接近0或1的時候,抽樣分布接近正態(tài)分布。樣本比率成數(shù)的抽樣分布近似服從平均數(shù)為總體比率,標準差為 的正態(tài)分布,此時我們按正態(tài)分布來解決總體比率區(qū)間估計問題即可。但是總體比率我們又常常是不知道的,這本來就是要我們?nèi)ス烙嫷囊粋€數(shù)值那我們只有用樣本比率去代替總體比率從而計算 即: 。此時, 近似服從 , ,的正態(tài)分布。但畢竟我們?nèi)阅苡谜龖B(tài)分布來解決的區(qū)間估計。np
39、)1 (pnpp1nppp)1 ( pnppSpp)1 (ppnpp)1 (第八章 參數(shù)估計第四節(jié) 總體比率的區(qū)間估計方法步驟如下: 1. 抽取樣本,計算樣本比率 2討論樣本比率是否近似服從正態(tài)分布。 3. 用樣本比率 代替 計算 4. 確定置信水平,根據(jù)置信水平確定顯著水平 5. 查標準正態(tài)分布 6. 構(gòu)建置信區(qū)間 7. 有限總體不重復抽樣要用 修正 0.05時需修正 條件: 樣本容量足夠大,保證 分布能服從正態(tài)分布 5, 或 不接近0或1nnp1ppnppnppp)1 ()1 (aZ645. 158. 296. 11 . 001. 005. 0ZZZnppZpp)1 (1NnNNnpnpp
40、)1 (p第八章 參數(shù)估計第四節(jié) 總體比率的區(qū)間估計例8-9某企業(yè)在一項關(guān)于尋找職工流動原因的研究中,研究者從該企業(yè)前職工的總體中隨機抽取了200人組成一個樣本。在對他們進行訪問時,有140人說他們離開該企業(yè)的原因是因為他們得到的收入太低。試對由于這種原因而離開該企業(yè)的人員的真正比率構(gòu)造95%的置信區(qū)間。解 企業(yè)職工流動情況,可看作是無限總體, =200 =140置信概率95% 不接近1 n1n7 . 0200140p57 . 0200pn5)1 ( pn方法步驟:1. 抽取樣本,計算樣本比率 2討論樣本比率是否近似服從正態(tài)分布。3用樣本比率 代替 計算樣本比率標準差4. 置信水平,根據(jù)置信水
41、平確定顯著水平 置信水平要求95,顯著水平 0.05pnnp17 . 0200140pppnppnppp)1 ()1 (03240. 02003 . 07 . 0)1 ()1 (nppnpppaa5. 查標準正態(tài)分布 6. 構(gòu)建置信區(qū)間 結(jié)論:對總體來講,因收入低而離開企業(yè)職工比重在0.6365到0.7635之間,估計的可靠程度為95。Z96. 105. 0ZppZppZp03240. 096. 17 . 003240. 096. 17 . 0p7635. 06365. 0 p例8-10某一大公司的人事處長希望知道本公司內(nèi)專業(yè)不對口的職員究竟占多大比率。于是他從2000名具有大專以上學歷的職員
42、中隨機抽取了一個由150人組成的樣本進行研究,結(jié)果說明,其中有45人說他們從事的工作與所學專業(yè)不對口。試在95.45%的置信程度下構(gòu)造出不對口人員所占真正比率的置信區(qū)間。解:由于樣本容量很大,n=150,n1=45, =45/150=0.3,n 和n(1- )都大于5,故可用正態(tài)分布逼近??傮w為有限總體,而且n/N 150/20000.0750.05,故需用有限總體修正系數(shù)修正 。pppp方法步驟: 1. 抽取樣本,計算樣本比率 2討論樣本比率是否近似服從正態(tài)分布。 和 都大于5,故可用正態(tài)分布逼近 3以樣本比率 代替 計算 4確定置信水平,根據(jù)置信水平確定顯著水平 置信水平95.45,顯著水
43、平0.0455pnnp13 . 0150451nnppn)1 (pnpp1)1 (1)1 (NnNnppNnNnppp036. 01200015020001503 . 013 . 01)1 (NnNnpppa5. 查標準正態(tài)分布 此題很清楚 26. 構(gòu)建置信區(qū)間 計算結(jié)果說明,我們有95.45%的把握說,該公司具有大專以上學歷的人員中,有22.8%-37.2%的人專業(yè)不對口。 ZZppZppZp036. 023 . 0036. 023 . 0p372. 0228. 0 p第八章 參數(shù)估計第五節(jié) 樣本容量確實定 在此前關(guān)于樣本容量我們屢次提到大樣本,小樣本,足夠大等有關(guān)概念,這是討論抽樣分布時必
44、須考慮的,但是小到多少,大到多少適宜呢?我們必須要考慮一個必要的樣本容量。 必要樣本容量是:既滿足抽樣允許誤差的大小,又能滿足一定概率保證程度的最小樣本容量。 抽樣允許誤差就是:根據(jù)研究目的和任務(wù)確定的樣本指標與總體參數(shù)之間的最大誤差。表現(xiàn)形式為絕對值形式,實際是總體參數(shù)左右最大的差距。例如:估計允許誤差為1,樣本平均數(shù)為5,總體平均數(shù)的估計區(qū)間即為46。第八章 參數(shù)估計第五節(jié) 樣本容量確實定一. 影響必要樣本容量的因素 1. 總體變異程度 越大要求的樣本容量應(yīng)越大,反之越小。 2. 參數(shù)估計的可靠程度 相同精確程度情況下,保證程度越高,那么要求樣本容量越大;保證程度越低,那么要求樣本容量越小
45、。 3. 抽樣允許誤差 抽樣允許誤差越小,樣本容量也越大,反之樣本容量越小。 4. 抽樣方法 重復抽樣,抽樣誤差要大于不重復抽樣,因此,重復抽樣要有較大的樣本容量。2第八章 參數(shù)估計第五節(jié) 樣本容量確實定 二. 必要樣本容量的計算 (一)估計總體平均數(shù)時的樣本容量 1. 重復抽樣 重復抽樣時,我們知道在總體方差時,總體平均數(shù)所處區(qū)間 那么可見抽樣允許誤差即為 計作: 兩邊平方 nZxZxxnZxnZnZx222xZn222第八章 參數(shù)估計第五節(jié) 樣本容量確實定 2. 不重復抽樣樣本平均數(shù)標準差 抽樣允許誤差 兩邊平方 )1(2NnNnx12NnNnZx1222NnNnZx22222) 1(ZN
46、NZnx 大家知道以上公式獲得很是簡單,公式里的幾個參數(shù)如 人為設(shè)定,置信概率人為設(shè)定, 可容易找出,對有限總體只要確定了范圍N也為,但總體方差或標準差何在,如果知道,抽樣估計豈不毫無意義,應(yīng)該怎么辦呢?1 根據(jù)此前掌握的相同甚至類似的資料來估計2 組織一次小規(guī)模試驗性抽樣,用 ,再計算樣本容量,如果計算的必要樣本容量 試驗性樣本的樣本容量,那么將試驗性樣本作為正式研究的樣本即可。如果大于試驗性樣本容量,再補充局部樣本單位組成樣本去進行研究。3 根據(jù)資料的極差去估計標準差 正態(tài)分布 99.73 可認為全距為6個標準差,因此=全距/6即可。xZs3x第八章 參數(shù)估計第五節(jié) 樣本容量確實定二 估計
47、總體比率時樣本容量確定 1 重復抽樣 抽樣允許誤差 兩邊平方 nppZp)1 ( pZnppZp)1 (2222)1 (pppZn 2不重復抽樣 抽樣允許誤差 兩邊平方 1)1 (NnNnppZp1)1 (22NnNnppZp)1 () 1()1 (222ppZNppNZnp同樣的問題是該公式中 從何而知二項分布只要知道一個 哪還了得解決的方法:1用以往資料估計2試驗性抽樣同總體平均數(shù)區(qū)間估計樣本容量確定3專業(yè)工作者或研究者以經(jīng)驗判斷,如生男生4以0.5直接作為 來計算必要樣本容量, 以0.5 0.5最大,因此必要樣本容量也最大,區(qū)間估計具有最高精確度和保證程度,稍許增加工作量,恰好是非調(diào)查難
48、度不大,算是補償吧。 ppp)1 (pp第八章 參數(shù)估計第六節(jié) 正態(tài)總體方差和兩個正態(tài)總體方差比的區(qū)間估計 一正態(tài)總體方差的區(qū)間估計 在生產(chǎn)實踐中我們可能碰見這種問題,例如一批產(chǎn)品的質(zhì)量問題,像電池,我們可以通過抽樣估計、了解平均使用壽命總體平均數(shù)來判斷其是否合格,但是否總體平均水平就是合格的唯一標準呢?如果平均使用壽命不低,但產(chǎn)品之間相差很大,即變異程度很大,是否就是合格呢?這時我們就需要對總體方差或標準差進行估計。 一根本原理從一個正態(tài)總體 中隨機抽取一個樣本 我們可計算出樣本 。所以 。我們又知道 該變量服從 分布,如果用樣本平均數(shù)代替總體平均數(shù),那么可以證明 服從 分布,也就是 近似服
49、從 分布。 分布中某 值出現(xiàn)的概率是可以計算的,因此我們就可以通過樣本方差對總體方差利用 分布進行區(qū)間估計了。 出現(xiàn)的概率可以計算 所處區(qū)間的保證程度也就可以計算了。如果以保證程度為95%,那么 必須介于 之間。意即 的置信區(qū)間在 的區(qū)間就在2n1)(22nxxs22) 1(xxsn22)(x222) 1(sn 22)( xx222222) 1(sn 222) 1(sn 2025. 02975. 022) 1(sn 221222)211() 1(sn22)211 (222212) 1() 1(snsn2方法步驟:1抽出樣本容量為n的樣本,計算2確定置信水平 即顯著水平3查自由度 時的 和 4寫出的置信區(qū)間 1)(22nxxs) 1( n2212)211 (2)211(222212) 1(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)浴潔具合同范本
- 中國坎地沙坦酯片行業(yè)投資分析及發(fā)展戰(zhàn)略咨詢報告
- 2025年中國皮革染料行業(yè)市場前景預(yù)測及投資戰(zhàn)略研究報告
- 2025年中國汽車售后服務(wù)市場前景預(yù)測及投資規(guī)劃研究報告
- 吃漢堡的老奶奶
- 【英語】特殊句式知識點總結(jié)和題型總結(jié)
- 90后劉雯雯:穿禮服奏“土味”嗩吶
- 2025年合金鋁6061模具項目投資可行性研究分析報告
- 2024-2030年中國衛(wèi)星直播系統(tǒng)綜合接收解碼器行業(yè)市場全景監(jiān)測及投資戰(zhàn)略咨詢報告
- 2020-2025年中國代步平衡車行業(yè)市場調(diào)研分析及投資前景預(yù)測報告
- 成人高考課件
- 村委會會議簽到表
- 哲學與人生全套課件146P
- 中考物理復習交流
- 敬老院設(shè)備采購投標方案(技術(shù)方案)
- 充電樁采購安裝售后服務(wù)方案
- 《旅行社條例》和《旅行社管理條例》對比解讀
- 柳宗元抑郁而堅貞的一生
- 鄉(xiāng)鎮(zhèn)人大代表選舉結(jié)果情況報告單
- BOPP雙向拉伸薄膜及膠帶生產(chǎn)項目環(huán)境影響報告
- 頻譜儀N9020A常用功能使用指南
評論
0/150
提交評論