抽樣推斷培訓(xùn)_第1頁(yè)
抽樣推斷培訓(xùn)_第2頁(yè)
抽樣推斷培訓(xùn)_第3頁(yè)
抽樣推斷培訓(xùn)_第4頁(yè)
抽樣推斷培訓(xùn)_第5頁(yè)
已閱讀5頁(yè),還剩122頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第六章第六章 抽樣推斷抽樣推斷 一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,每天的產(chǎn)量約為80008000袋左右。袋左右。按規(guī)定每袋的重量應(yīng)不低于按規(guī)定每袋的重量應(yīng)不低于100100克,否則即為不合格。為對(duì)產(chǎn)量質(zhì)量進(jìn)行檢克,否則即為不合格。為對(duì)產(chǎn)量質(zhì)量進(jìn)行檢測(cè),企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)測(cè),企業(yè)設(shè)有質(zhì)量檢查科專門負(fù)責(zé)質(zhì)量檢驗(yàn),并經(jīng)常向企業(yè)高層領(lǐng)導(dǎo)提交質(zhì)檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。檢報(bào)告。質(zhì)檢的內(nèi)容之一就是每袋重量是否符合要求。 由于產(chǎn)品的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,由于產(chǎn)品

2、的數(shù)量大,進(jìn)行全面的檢驗(yàn)是不可能的,可行的辦法是抽樣,然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)然后用樣本數(shù)據(jù)估計(jì)平均每袋的重量。質(zhì)檢科從某天生產(chǎn)的一批食品中隨機(jī)抽取了抽取了2525袋,下表是對(duì)每袋食品重量的檢驗(yàn)結(jié)果。(假定該種袋裝食品重量袋,下表是對(duì)每袋食品重量的檢驗(yàn)結(jié)果。(假定該種袋裝食品重量服從正態(tài)分布。)服從正態(tài)分布。)案例導(dǎo)入案例導(dǎo)入 根據(jù)以上數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均根據(jù)以上數(shù)據(jù),質(zhì)檢科估計(jì)出該天生產(chǎn)的食品每袋的平均重量在重量在101.57101.57109.14109.14克之間,其中,估計(jì)的可信程度為克之間,其中,估計(jì)的可信程度為95%9

3、5%,估計(jì)誤差不超過(guò)估計(jì)誤差不超過(guò)4 4克。產(chǎn)品的合格率在克。產(chǎn)品的合格率在95.68%95.68%64.32%64.32%之間,其之間,其中,估計(jì)的可信程度為中,估計(jì)的可信程度為95%95%,估計(jì)誤差不超過(guò),估計(jì)誤差不超過(guò)15.68%15.68%。112.5112.5102.6102.6100.0100.0116.6116.6136.8136.8101.0101.0107.5107.5123.5123.595.495.4102.8102.8103.0103.095.095.0102.0102.097.897.8101.5101.5102.0102.0108.8108.8101.6101.61

4、08.4108.498.498.4100.5100.5115.6115.6102.2102.2105.0105.093.393.3 質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見(jiàn):質(zhì)檢報(bào)告提交后,企業(yè)高層領(lǐng)導(dǎo)人提出幾點(diǎn)意見(jiàn):一是抽取的樣本大小是否合適?能不能用一個(gè)更大的一是抽取的樣本大小是否合適?能不能用一個(gè)更大的樣本進(jìn)行估計(jì)?二是能否將估計(jì)的誤差在縮小一點(diǎn)?樣本進(jìn)行估計(jì)?二是能否將估計(jì)的誤差在縮小一點(diǎn)?比如,估計(jì)平均重量時(shí)估計(jì)誤差不超過(guò)比如,估計(jì)平均重量時(shí)估計(jì)誤差不超過(guò)3 3克,估計(jì)合格克,估計(jì)合格率時(shí)誤差不超過(guò)率時(shí)誤差不超過(guò)10%10%。三是總體平均重量的方差是多少?。三是總體平均重量的方差是

5、多少?因?yàn)榉讲畹拇笮≌f(shuō)明了生產(chǎn)過(guò)程的穩(wěn)定性,過(guò)大或過(guò)因?yàn)榉讲畹拇笮≌f(shuō)明了生產(chǎn)過(guò)程的穩(wěn)定性,過(guò)大或過(guò)小的方差都意味著應(yīng)對(duì)生產(chǎn)過(guò)程進(jìn)行調(diào)整。小的方差都意味著應(yīng)對(duì)生產(chǎn)過(guò)程進(jìn)行調(diào)整。參數(shù)估計(jì)、假設(shè)檢驗(yàn)參數(shù)估計(jì)、假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法統(tǒng)計(jì)方法描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)推斷的過(guò)程統(tǒng)計(jì)推斷的過(guò)程樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量例如:樣本均例如:樣本均值、成數(shù)、方值、成數(shù)、方差差參數(shù)參數(shù)例如例如: :總體總體均值、成數(shù)均值、成數(shù)、方差、方差第一節(jié) 抽樣調(diào)查 一、抽樣調(diào)查的概念與作用 1抽樣調(diào)查的概念 抽樣調(diào)查是一種科學(xué)的非全面調(diào)查,是按照隨機(jī)原則從總

6、體中抽取一部分單位組成樣本進(jìn)行調(diào)查,根據(jù)調(diào)查的樣本數(shù)據(jù)推斷總體的某一數(shù)量特征的統(tǒng)計(jì)方法。2 2抽樣調(diào)查的特點(diǎn)抽樣調(diào)查的特點(diǎn) 抽樣調(diào)查具有以下特點(diǎn):抽樣調(diào)查具有以下特點(diǎn): (1 1)遵循)遵循隨機(jī)原則隨機(jī)原則選擇調(diào)查單位選擇調(diào)查單位 (2 2)抽樣調(diào)查)抽樣調(diào)查節(jié)省人力、費(fèi)用和時(shí)間節(jié)省人力、費(fèi)用和時(shí)間,比,比較靈活較靈活 (3 3)抽樣誤差)抽樣誤差可以計(jì)算并且可以加以控制可以計(jì)算并且可以加以控制3 3抽樣調(diào)查的適用范圍抽樣調(diào)查的適用范圍 (1 1)某些)某些不可能不可能進(jìn)行全面調(diào)查又需要了解其進(jìn)行全面調(diào)查又需要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象 (2 2)某些)某些不必要不必要

7、進(jìn)行全面調(diào)查又需要了解其進(jìn)行全面調(diào)查又需要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象 (3 3)抽樣調(diào)查可以用來(lái))抽樣調(diào)查可以用來(lái)檢驗(yàn)和修正全面調(diào)查檢驗(yàn)和修正全面調(diào)查資料資料 (4 4)抽樣調(diào)查可以用于工業(yè)生產(chǎn)過(guò)程中的)抽樣調(diào)查可以用于工業(yè)生產(chǎn)過(guò)程中的質(zhì)質(zhì)量控制量控制 (5 5)利用抽樣調(diào)查,可以對(duì)于)利用抽樣調(diào)查,可以對(duì)于假設(shè)進(jìn)行檢驗(yàn)假設(shè)進(jìn)行檢驗(yàn) 二、抽樣調(diào)查中的幾個(gè)基本概念二、抽樣調(diào)查中的幾個(gè)基本概念 1 1全及總體和抽樣總體全及總體和抽樣總體 (1 1)全及總體)全及總體 簡(jiǎn)稱總體,是指所要認(rèn)識(shí)對(duì)象的全體,全及總簡(jiǎn)稱總體,是指所要認(rèn)識(shí)對(duì)象的全體,全及總體的單位數(shù)通常用大寫的英文字

8、母體的單位數(shù)通常用大寫的英文字母“N N”來(lái)表來(lái)表示。示。 (2 2)抽樣總體)抽樣總體 也稱樣本,是指從全及總體中隨機(jī)抽取出來(lái),也稱樣本,是指從全及總體中隨機(jī)抽取出來(lái),代表全及總體部分單位的集合體,抽樣總體的代表全及總體部分單位的集合體,抽樣總體的單位數(shù)通常用小寫英文字母單位數(shù)通常用小寫英文字母“n n”表示。一般表示。一般說(shuō)來(lái),說(shuō)來(lái), n 30n 30稱為大樣本,稱為大樣本, n 30n 30稱為小樣稱為小樣本,本,n/Nn/N稱為抽樣比例,社會(huì)經(jīng)濟(jì)現(xiàn)象的抽樣稱為抽樣比例,社會(huì)經(jīng)濟(jì)現(xiàn)象的抽樣調(diào)查多取大樣本。調(diào)查多取大樣本。 全及總體是全及總體是惟一惟一確定的,抽樣總體則是確定的,抽樣總體則

9、是隨機(jī)隨機(jī)的的 一個(gè)全及總體可能抽取很多個(gè)樣本,全一個(gè)全及總體可能抽取很多個(gè)樣本,全部樣本的可能數(shù)目和每一樣本的容量有部樣本的可能數(shù)目和每一樣本的容量有關(guān),也和隨機(jī)抽樣的方法有關(guān),不同的關(guān),也和隨機(jī)抽樣的方法有關(guān),不同的樣本容量和取樣方法,樣本的可能數(shù)目樣本容量和取樣方法,樣本的可能數(shù)目也有很大的差別。也有很大的差別。可能樣本數(shù)目的計(jì)算公式可能樣本數(shù)目的計(jì)算公式!()!nNNANnnnNBN!()!nNNCn Nn(1)!(1)!nnNNN nDDn N 2 2全及指標(biāo)和抽樣指標(biāo)全及指標(biāo)和抽樣指標(biāo) (1 1)全及指標(biāo))全及指標(biāo) 反映總體數(shù)量特征的綜合指標(biāo),稱為全及指標(biāo)、反映總體數(shù)量特征的綜合指

10、標(biāo),稱為全及指標(biāo)、參數(shù)。參數(shù)。 由于全及總體是惟一確定的,所以由于全及總體是惟一確定的,所以全及指標(biāo)也全及指標(biāo)也是惟一確定的是惟一確定的。 對(duì)于對(duì)于變量總體變量總體,由于各單位的標(biāo)志可以用數(shù)值,由于各單位的標(biāo)志可以用數(shù)值來(lái)表示,所以可以計(jì)算總體平均數(shù),用來(lái)表示,所以可以計(jì)算總體平均數(shù),用 表表示;示; 對(duì)于對(duì)于屬性總體屬性總體,可以計(jì)算總體成數(shù),用大寫英,可以計(jì)算總體成數(shù),用大寫英文字母文字母 表示,表示,變量總體也可以計(jì)算成數(shù)變量總體也可以計(jì)算成數(shù)。 全及指標(biāo)還有總體方差全及指標(biāo)還有總體方差 和總體標(biāo)準(zhǔn)差和總體標(biāo)準(zhǔn)差 。 XP2 參數(shù)參數(shù)研究總體中研究總體中的數(shù)量標(biāo)志的數(shù)量標(biāo)志總體平均數(shù)總體

11、平均數(shù)總體方差總體方差X X=X X N NX X=XFXF F F(X-XX-X) N N2=2(X-XX-X) F F F F2=2研究總體中研究總體中的品質(zhì)標(biāo)志的品質(zhì)標(biāo)志總體成數(shù)總體成數(shù)成數(shù)方差成數(shù)方差2= = P(1-P)P(1-P)P =P = N N1 1N N(只有兩種表現(xiàn))(只有兩種表現(xiàn)) (2)抽樣指標(biāo) 由抽樣總體各個(gè)標(biāo)志值或標(biāo)志特征計(jì)算的綜合指標(biāo)稱為抽樣指標(biāo)、統(tǒng)計(jì)量。 變量樣本的抽樣指標(biāo)有抽樣平均數(shù) 、樣本平均數(shù)方差 和樣本平均數(shù)標(biāo)準(zhǔn)差 ; 屬性樣本的抽樣指標(biāo)有抽樣成數(shù) 、樣本成數(shù)方差 和樣本成數(shù)標(biāo)準(zhǔn)差 。 抽樣指標(biāo)的數(shù)值不是惟一確定的,是隨機(jī)變量。x2xsxsp2psps

12、統(tǒng)計(jì)量統(tǒng)計(jì)量研究數(shù)量研究數(shù)量標(biāo)志標(biāo)志 樣本平均數(shù)樣本平均數(shù) x=xnx=xff樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差nxx212ffxxSx研究品質(zhì)研究品質(zhì)標(biāo)志標(biāo)志樣本成數(shù)樣本成數(shù) 成數(shù)標(biāo)準(zhǔn)差成數(shù)標(biāo)準(zhǔn)差 np=nppSp112nxxSx3 3重復(fù)抽樣與不重復(fù)抽樣重復(fù)抽樣與不重復(fù)抽樣 (1 1)重復(fù)抽樣)重復(fù)抽樣 重復(fù)抽樣,又稱重復(fù)抽樣,又稱有放回抽樣有放回抽樣,是指從全及總體,是指從全及總體N N個(gè)單位個(gè)單位中中隨機(jī)隨機(jī)抽取一個(gè)容量為抽取一個(gè)容量為n n的樣本,每次抽中的單位經(jīng)登的樣本,每次抽中的單位經(jīng)登錄其有關(guān)標(biāo)志表現(xiàn)后又錄其有關(guān)標(biāo)志表現(xiàn)后又放回放回總體中總體中重新重新參加參加下一次下一次的的抽選。每次抽取均

13、是在抽選。每次抽取均是在相同的條件相同的條件下完全按照隨機(jī)原下完全按照隨機(jī)原則進(jìn)行的。則進(jìn)行的。 (2 2)不重復(fù)抽樣)不重復(fù)抽樣 不重復(fù)抽樣又稱不重復(fù)抽樣又稱無(wú)放回抽樣無(wú)放回抽樣,是指從全及總體,是指從全及總體N N個(gè)單位個(gè)單位中隨機(jī)抽取一個(gè)容量為中隨機(jī)抽取一個(gè)容量為n n的樣本,每次抽中的單位登錄的樣本,每次抽中的單位登錄其有關(guān)標(biāo)志表現(xiàn)后其有關(guān)標(biāo)志表現(xiàn)后不再放回不再放回總體中參加下一次的抽選,總體中參加下一次的抽選,上一次的抽取結(jié)果會(huì)上一次的抽取結(jié)果會(huì)直接影響直接影響到下一次抽選。到下一次抽選。4 4抽樣框抽樣框 全及總體也叫目標(biāo)總體。目標(biāo)總體規(guī)定了全及總體也叫目標(biāo)總體。目標(biāo)總體規(guī)定了理理

14、論上的抽樣范圍論上的抽樣范圍。但。但實(shí)際實(shí)際進(jìn)行抽樣的總體范進(jìn)行抽樣的總體范圍與目標(biāo)總體有時(shí)是不一致的。因而,在抽圍與目標(biāo)總體有時(shí)是不一致的。因而,在抽樣前還必須樣前還必須明確實(shí)際進(jìn)行抽樣的總體范圍和明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位抽樣單位。 抽樣框又稱抽樣框又稱“抽樣框架抽樣框架”、“抽樣結(jié)構(gòu)抽樣結(jié)構(gòu)”,是指對(duì)是指對(duì)可以選擇可以選擇作為樣本的總體單位列出名作為樣本的總體單位列出名冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用抽簽抽簽的方的方式或按照式或按照隨機(jī)數(shù)表隨機(jī)數(shù)表來(lái)抽選必要的單位數(shù)。來(lái)抽選必

15、要的單位數(shù)。 好的抽樣框的標(biāo)準(zhǔn)是:好的抽樣框的標(biāo)準(zhǔn)是:完整而不重復(fù)完整而不重復(fù)。 常見(jiàn)的抽樣框如大學(xué)學(xué)生花名冊(cè)、工商企常見(jiàn)的抽樣框如大學(xué)學(xué)生花名冊(cè)、工商企業(yè)名錄、街道派出所里居民戶籍冊(cè)、意向業(yè)名錄、街道派出所里居民戶籍冊(cè)、意向購(gòu)房人信息冊(cè)等。購(gòu)房人信息冊(cè)等。 在沒(méi)有現(xiàn)成的名單的情況下,可由調(diào)查人在沒(méi)有現(xiàn)成的名單的情況下,可由調(diào)查人員自己編制。員自己編制。 在利用現(xiàn)有的名單作為抽樣框時(shí),要先對(duì)在利用現(xiàn)有的名單作為抽樣框時(shí),要先對(duì)該名錄進(jìn)行該名錄進(jìn)行檢查檢查,避免有重復(fù)、遺漏的情,避免有重復(fù)、遺漏的情況發(fā)生。以提高樣本對(duì)總體的代表性。況發(fā)生。以提高樣本對(duì)總體的代表性。 例如:要從例如:要從1000

16、010000名職工中抽出名職工中抽出200200名組成名組成一個(gè)樣本,則一個(gè)樣本,則1000010000名職工的名冊(cè),就是名職工的名冊(cè),就是抽樣框。抽樣框。 抽樣框也可能存在一些誤差,主要有:抽樣框也可能存在一些誤差,主要有: (1 1)丟失目標(biāo)總體單位,也被稱為)丟失目標(biāo)總體單位,也被稱為“涵蓋不足涵蓋不足”,或丟失目標(biāo)單位?;騺G失目標(biāo)單位。 對(duì)丟失的總體單位不能發(fā)現(xiàn)并糾正會(huì)造成調(diào)查中對(duì)丟失的總體單位不能發(fā)現(xiàn)并糾正會(huì)造成調(diào)查中對(duì)總量的對(duì)總量的估計(jì)偏低估計(jì)偏低。 (2 2)包含非目標(biāo)單位,也被稱為)包含非目標(biāo)單位,也被稱為“過(guò)涵蓋過(guò)涵蓋”,是,是指抽樣框中包含了一些指抽樣框中包含了一些不屬于不

17、屬于研究對(duì)象的非目標(biāo)研究對(duì)象的非目標(biāo)總體單位??傮w單位。 由于抽樣框中存在非目標(biāo)總體單位,容易造成估由于抽樣框中存在非目標(biāo)總體單位,容易造成估計(jì)量的計(jì)量的高估高估。 (3 3)丟失目標(biāo)單位和包含非目)丟失目標(biāo)單位和包含非目標(biāo)單位標(biāo)單位共存共存,是指在抽樣框中既,是指在抽樣框中既有丟失目標(biāo)單位,也有包含非目有丟失目標(biāo)單位,也有包含非目標(biāo)單位。標(biāo)單位。 在實(shí)際調(diào)查中,在實(shí)際調(diào)查中,丟失丟失目標(biāo)單位目標(biāo)單位不不易被查覺(jué)和發(fā)現(xiàn)易被查覺(jué)和發(fā)現(xiàn),具有較大的,具有較大的隱隱蔽性蔽性,相比之下,包含非目標(biāo)單,相比之下,包含非目標(biāo)單位的抽樣框誤差的威脅性要小些。位的抽樣框誤差的威脅性要小些。因?yàn)樵谡{(diào)查過(guò)程中,非

18、目標(biāo)單位因?yàn)樵谡{(diào)查過(guò)程中,非目標(biāo)單位容易被發(fā)現(xiàn),并予以剔除。容易被發(fā)現(xiàn),并予以剔除。 (4 4)復(fù)合連接,是指抽樣框單元與目標(biāo))復(fù)合連接,是指抽樣框單元與目標(biāo)總體單元不完全一一對(duì)應(yīng),而是存在總體單元不完全一一對(duì)應(yīng),而是存在一一對(duì)多、多對(duì)一或是多對(duì)多對(duì)多、多對(duì)一或是多對(duì)多模式的現(xiàn)象。模式的現(xiàn)象。 例如:若某銀行想了解其客戶的情況進(jìn)例如:若某銀行想了解其客戶的情況進(jìn)行一次抽樣調(diào)查,則該行所有客戶構(gòu)成行一次抽樣調(diào)查,則該行所有客戶構(gòu)成目的總體。目的總體。 選擇的抽樣框是銀行的來(lái)往帳目,這就選擇的抽樣框是銀行的來(lái)往帳目,這就構(gòu)成了多對(duì)一模式。若在這個(gè)框中進(jìn)行構(gòu)成了多對(duì)一模式。若在這個(gè)框中進(jìn)行抽樣,則來(lái)

19、往帳目多的客戶被抽中的可抽樣,則來(lái)往帳目多的客戶被抽中的可能性則較大,反之來(lái)往帳目少的客戶被能性則較大,反之來(lái)往帳目少的客戶被抽中的可能性很小,而兩種客戶通常會(huì)抽中的可能性很小,而兩種客戶通常會(huì)有較大差異,從而造成樣本的偏斜,使有較大差異,從而造成樣本的偏斜,使估計(jì)量產(chǎn)生偏差。估計(jì)量產(chǎn)生偏差。 (5)抽樣框老化,是指隨著時(shí)間的推移,抽樣總體與目標(biāo)總體產(chǎn)生極大的偏差,即原來(lái)的抽樣框不符合實(shí)際情況,必須進(jìn)行更新。 最典型的例子,就是隨著城市建設(shè)的大規(guī)模展開(kāi),許多地區(qū)已被改造,地址發(fā)生了變化,如果仍按以前的抽樣框去抽樣,那么精度就會(huì)難以控制。三、抽樣調(diào)查的基本原理 1大數(shù)定律 大數(shù)定律,又稱為大數(shù)法

20、則,是指在隨機(jī)試驗(yàn)中,每次出現(xiàn)的結(jié)果可能不同,但是大量重復(fù)試驗(yàn)出現(xiàn)的結(jié)果的平均值卻幾乎總是接近于某個(gè)確定的值。 在大量的觀察試驗(yàn)中,個(gè)別的、偶然的因素影響而產(chǎn)生的差異將會(huì)相互抵消,從而使現(xiàn)象的必然規(guī)律性顯示出來(lái)。 例如,觀察個(gè)別或少數(shù)家庭的嬰兒出生情況,發(fā)現(xiàn)有的生男,有的生女,沒(méi)有一定的規(guī)律性,但是通過(guò)大量的觀察就會(huì)發(fā)現(xiàn),男嬰和女嬰的比例會(huì)趨于107:100。切貝雪夫大數(shù)定理 設(shè) 是一列兩兩相互獨(dú)立的隨機(jī)變量,服從同一分布,且具有相同的數(shù)學(xué)期望 和方差 ,則對(duì)任意小的正數(shù),有:1)1(lim1niinxnP2,21xx 當(dāng)n很大時(shí),服從同一分布的隨機(jī)變 量 的算術(shù)平均數(shù) 將依概率接近于這些隨機(jī)

21、變量的數(shù)學(xué)期望。 隨著樣本容量n的增加,樣本平均數(shù)將接近于總體平均數(shù),從而為統(tǒng)計(jì)推斷中依據(jù)樣本平均數(shù)估計(jì)總體平均數(shù)提供了理論依據(jù)。,21xxx (1)現(xiàn)象的某種總體規(guī)律性,只有當(dāng)具有這種現(xiàn)象的足夠多的單位綜合匯總在一起的時(shí)候,才能顯現(xiàn)出來(lái); (2)現(xiàn)象的總體性規(guī)律或傾向通常以平均數(shù)(或比率)的形式表現(xiàn)出來(lái); (3)當(dāng)所研究的現(xiàn)象總體包含的單位越多,平均數(shù)(或比率)也就越能正確反映出這些現(xiàn)象的規(guī)律性; (4)各單位的共同傾向決定著平均數(shù)(或比率)的水平,而各單位對(duì)平均數(shù)(或比率)的離差則會(huì)由于足夠多數(shù)單位的綜合匯總的結(jié)果,而相互抵消,趨于消失。 根據(jù)大數(shù)定律的內(nèi)容特點(diǎn)運(yùn)用抽樣調(diào)查時(shí),必須注意以下

22、兩個(gè)問(wèn)題: (1)抽樣必須遵循隨機(jī)原則,這樣樣本指標(biāo)才能成為隨機(jī)變量,大數(shù)定律才能應(yīng)用; (2)抽樣必須遵循大量原則,只有觀察到足夠多的單位,才能在綜合后使個(gè)別單位表現(xiàn)出來(lái)的偶然性得以消除。2中心極限定理 在一定條件下,大量獨(dú)立隨機(jī)變量的平均數(shù)以正態(tài)分布為極限。設(shè)隨機(jī)變量 相互獨(dú)立;其數(shù)學(xué)期望值為 ;其標(biāo)準(zhǔn)差為 ; , , 滿足下述條件: 對(duì)任一實(shí)數(shù) ,有,21xx,21xExE,21niixE1)(nii1220lim133niiinxExEtdttniinetnxP21221limt即:只要在樣本容量充分大的條件下,不論全及總體的變量分布是否屬于正態(tài)分布,其抽樣平均數(shù)也服從或近似服從正態(tài)分

23、布,這就為抽樣調(diào)查進(jìn)行估計(jì)提供了重要的理論根據(jù)。 (1)如果總體服從正態(tài)分布,樣本平均數(shù)也服從正態(tài)分布; (2)如果總體很大,但不服從正態(tài)分布,只要樣本足夠大,樣本的平均數(shù)也趨近于正態(tài)分布; (3)樣本平均數(shù)的數(shù)學(xué)期望等于總體均值。 意義:當(dāng)我們的認(rèn)識(shí)對(duì)象分布未知時(shí),只要堅(jiān)持隨機(jī)抽取足夠多的樣本單位,就可以使樣本統(tǒng)計(jì)量服從(或近似服從)正態(tài)分布,繼而便可運(yùn)用正態(tài)分布理論,根據(jù)樣本信息來(lái)推斷認(rèn)識(shí)對(duì)象總體的數(shù)量特征。第二節(jié) 抽樣誤差 一、抽樣誤差 1抽樣誤差的概念 抽樣指標(biāo)與所要估計(jì)的全及指標(biāo)之間的差值稱為抽樣誤差。 抽樣誤差既是一種隨機(jī)性誤差,也是一種代表性誤差。抽樣誤差中的代表性誤差是抽樣調(diào)查

24、本身所固有的、無(wú)法避免的誤差,但隨機(jī)性誤差則可利用大數(shù)定律精確地計(jì)算并能夠通過(guò)抽樣設(shè)計(jì)程序加以控制。2影響抽樣誤差的因素 (1)樣本容量 (2)總體各單位標(biāo)志值的差異程度 (3)抽樣方法 (4)抽樣的組織形式二、抽樣平均誤差 1樣本平均數(shù)的抽樣平均誤差 (1)當(dāng)抽樣方法為重復(fù)抽樣時(shí),樣本標(biāo)志值 是相互獨(dú)立的,樣本變量 與總體變量 同分布。其計(jì)算公式如下: 它說(shuō)明在重復(fù)抽樣的條件下,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,與樣本容量的平方根成反比。 在計(jì)算抽樣平均數(shù)的抽樣平均誤差時(shí),通常并不知道總體方差的數(shù)值,可用樣本方差來(lái)代替總體方差。,21xxxXnnx2 (2)不重復(fù)抽樣: 當(dāng)總體單位數(shù)很大時(shí),這

25、個(gè)計(jì)算公式可近似表示如下: )(12NnNnx)(Nnnx12 總是小于1,所以不重復(fù)抽樣的抽樣平均誤差總是小于重復(fù)抽樣的抽樣平均誤差。 當(dāng)抽樣比例很小時(shí),即使是采用不重復(fù)抽樣的方法來(lái)抽取調(diào)查單位,也可使用重復(fù)抽樣的誤差公式來(lái)計(jì)算抽樣平均誤差。)(Nn12抽樣成數(shù)的平均誤差 總體成數(shù)可表現(xiàn)為總體是非標(biāo)志的平均數(shù),它的標(biāo)準(zhǔn)差為 。 (1)在重復(fù)抽樣下,其計(jì)算公式如下: )(PP1nPPP)( 1 當(dāng)總體單位數(shù)很大時(shí),這個(gè)公式可近似表示如下:當(dāng)總體單位數(shù)很大時(shí),這個(gè)公式可近似表示如下: 在計(jì)算抽樣成數(shù)平均誤差時(shí),通常得不到總體方差的在計(jì)算抽樣成數(shù)平均誤差時(shí),通常得不到總體方差的數(shù)值,一般可以用樣本

26、方差來(lái)代替總體方差。數(shù)值,一般可以用樣本方差來(lái)代替總體方差。)1 ()1 (NnnPPP(2 2)在不重復(fù)抽樣下,其計(jì)算公式如下:)在不重復(fù)抽樣下,其計(jì)算公式如下: )1(1NnNnPPP)(三、抽樣極限誤差 允許的誤差范圍,即抽樣極限誤差。 抽樣極限誤差是指在一定的置信度下抽樣指標(biāo)與總體指標(biāo)之間的抽樣誤差不超過(guò)某一給定的最大可能范圍,記作。 由上述兩個(gè)絕對(duì)值不等式可得: xXxxPpxxXxXppPpP xxxXxpppPp四、抽樣估計(jì)的概率度、置信度四、抽樣估計(jì)的概率度、置信度1 1抽樣估計(jì)的概率度抽樣估計(jì)的概率度抽樣極限誤差與抽樣平均誤差相比,從而使由單一樣本抽樣極限誤差與抽樣平均誤差相

27、比,從而使由單一樣本值得到的抽樣極限誤差標(biāo)準(zhǔn)化,稱為概率度或相對(duì)誤差值得到的抽樣極限誤差標(biāo)準(zhǔn)化,稱為概率度或相對(duì)誤差范圍。在正態(tài)分布下,概率度用范圍。在正態(tài)分布下,概率度用 表示,其計(jì)算公式表示,其計(jì)算公式如下:如下:2zxxz2ppz2 抽樣極限誤差取決于兩個(gè)因素: 一是抽樣平均誤差,在其他條件既定時(shí),抽樣平均誤差越小,抽樣極限誤差也越??; 二是抽樣估計(jì)的概率度,在其他條件既定時(shí),抽樣估計(jì)的概率度越小,抽樣極限誤差也越小。2抽樣估計(jì)的置信度 置信度就是總體指標(biāo)落在某個(gè)區(qū)間(稱為置信區(qū)間)的概率把握程度,又稱抽樣估計(jì)可靠程度、概率保證程度。 置信區(qū)間是以一定的概率把握程度確定總體指標(biāo)所在的區(qū)間

28、。 為置信度,表示區(qū)間估計(jì)的可靠程度。例如 =0.95,說(shuō)明有95%的可能總體參數(shù)包括在估計(jì)區(qū)間內(nèi),而不包括在這個(gè)區(qū)間的概率為=5%, 叫顯著性水平。應(yīng)用標(biāo)準(zhǔn)正態(tài)分布概率表,可以得抽樣指標(biāo)落在置信區(qū)間內(nèi)的置信度。 抽樣估計(jì)的精確度與置信度是一對(duì)反方向運(yùn)動(dòng)的矛盾,實(shí)際調(diào)查中應(yīng)注意協(xié)調(diào)它們的矛盾。11第三節(jié)第三節(jié) 參數(shù)估計(jì)參數(shù)估計(jì) 包括對(duì)總體平均數(shù)和總體成數(shù)進(jìn)行估計(jì),有點(diǎn)估計(jì)和包括對(duì)總體平均數(shù)和總體成數(shù)進(jìn)行估計(jì),有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種方法。區(qū)間估計(jì)兩種方法。 一、參數(shù)估計(jì)的基本要求一、參數(shù)估計(jì)的基本要求 1 1無(wú)偏性無(wú)偏性 估計(jì)中,要求各個(gè)抽樣指標(biāo)的平均數(shù)應(yīng)該等于全及指估計(jì)中,要求各個(gè)抽樣指標(biāo)的平

29、均數(shù)應(yīng)該等于全及指標(biāo),即從平均數(shù)意義上,抽樣指標(biāo)的估計(jì)是沒(méi)有偏誤標(biāo),即從平均數(shù)意義上,抽樣指標(biāo)的估計(jì)是沒(méi)有偏誤的,這一要求稱為無(wú)偏性。的,這一要求稱為無(wú)偏性。 如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望值等于所估計(jì)的總體參數(shù)如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望值等于所估計(jì)的總體參數(shù)的值,該樣本統(tǒng)計(jì)量稱作總體參數(shù)的無(wú)偏估計(jì)量。樣的值,該樣本統(tǒng)計(jì)量稱作總體參數(shù)的無(wú)偏估計(jì)量。樣本無(wú)偏統(tǒng)計(jì)量的所有可能值的期望值或均值等于被估本無(wú)偏統(tǒng)計(jì)量的所有可能值的期望值或均值等于被估計(jì)的總體參數(shù)。計(jì)的總體參數(shù)。 XxE)(PpE)(2 2一致性一致性 當(dāng)樣本的單位數(shù)無(wú)限增大時(shí),抽樣指標(biāo)當(dāng)樣本的單位數(shù)無(wú)限增大時(shí),抽樣指標(biāo)就充分靠近全及指標(biāo),抽樣指

30、標(biāo)和未知就充分靠近全及指標(biāo),抽樣指標(biāo)和未知的全及總體指標(biāo)之間的絕對(duì)離差為任意的全及總體指標(biāo)之間的絕對(duì)離差為任意小的可能性也趨于必然。小的可能性也趨于必然。 符合這一要求的估計(jì)量就是一致性估計(jì)符合這一要求的估計(jì)量就是一致性估計(jì)量。例如,樣本均值、樣本成數(shù)、樣本量。例如,樣本均值、樣本成數(shù)、樣本方差分別是總體均值、總體成數(shù)、總體方差分別是總體均值、總體成數(shù)、總體方差的一致性估計(jì)量。方差的一致性估計(jì)量。1limXxPnlim1nPpP3 3有效性有效性 以樣本估計(jì)總體,要求優(yōu)良估計(jì)量的抽以樣本估計(jì)總體,要求優(yōu)良估計(jì)量的抽樣分布方差小于其他估計(jì)量的抽樣分布樣分布方差小于其他估計(jì)量的抽樣分布方差,即從平

31、均的角度來(lái)看,優(yōu)良估計(jì)方差,即從平均的角度來(lái)看,優(yōu)良估計(jì)量的估計(jì)誤差應(yīng)小于其他估計(jì)量的估計(jì)量的估計(jì)誤差應(yīng)小于其他估計(jì)量的估計(jì)誤差。誤差。 例如,對(duì)于正態(tài)分布總體來(lái)說(shuō),樣本均例如,對(duì)于正態(tài)分布總體來(lái)說(shuō),樣本均值和樣本中位數(shù)都是總體均值的無(wú)偏估值和樣本中位數(shù)都是總體均值的無(wú)偏估計(jì)量,但兩者的方差不同,樣本中位數(shù)計(jì)量,但兩者的方差不同,樣本中位數(shù)的方差比樣本均值的方差大,因此,樣的方差比樣本均值的方差大,因此,樣本均值比樣本中位數(shù)更有效。同樣樣本本均值比樣本中位數(shù)更有效。同樣樣本成數(shù)、樣本方差分別是總體成數(shù)、總體成數(shù)、樣本方差分別是總體成數(shù)、總體方差的有效性估計(jì)量。方差的有效性估計(jì)量。 不是所有估計(jì)

32、量都符合以上標(biāo)準(zhǔn),可以說(shuō)完全不是所有估計(jì)量都符合以上標(biāo)準(zhǔn),可以說(shuō)完全符合以上標(biāo)準(zhǔn)的估計(jì)量要比不符合或不完全符符合以上標(biāo)準(zhǔn)的估計(jì)量要比不符合或不完全符合以上標(biāo)準(zhǔn)的估計(jì)量更為優(yōu)良。例如在正態(tài)分合以上標(biāo)準(zhǔn)的估計(jì)量更為優(yōu)良。例如在正態(tài)分布的情況下,總體平均數(shù)和中位數(shù)是重合在一布的情況下,總體平均數(shù)和中位數(shù)是重合在一起的,樣本平均數(shù)是總體中位數(shù)的無(wú)偏估計(jì)量起的,樣本平均數(shù)是總體中位數(shù)的無(wú)偏估計(jì)量和一致估計(jì)量,而且樣本平均數(shù)比樣本中位數(shù)和一致估計(jì)量,而且樣本平均數(shù)比樣本中位數(shù)作為總體中位數(shù)的估計(jì)量也是更有效的,因?yàn)樽鳛榭傮w中位數(shù)的估計(jì)量也是更有效的,因?yàn)闃颖酒骄鶖?shù)的方差比樣本中位數(shù)的方差更小。樣本平均數(shù)的

33、方差比樣本中位數(shù)的方差更小。當(dāng)估計(jì)量的選擇在無(wú)偏性和有效性之間產(chǎn)生矛當(dāng)估計(jì)量的選擇在無(wú)偏性和有效性之間產(chǎn)生矛盾時(shí),這時(shí)的基本原則是如果有偏估計(jì)量的偏盾時(shí),這時(shí)的基本原則是如果有偏估計(jì)量的偏差不是很大,應(yīng)該優(yōu)先選擇有偏但更有效地估差不是很大,應(yīng)該優(yōu)先選擇有偏但更有效地估計(jì)量。計(jì)量。二、點(diǎn)估計(jì)二、點(diǎn)估計(jì) 點(diǎn)估計(jì)又稱定值估計(jì),它是以抽樣指標(biāo)點(diǎn)估計(jì)又稱定值估計(jì),它是以抽樣指標(biāo)作為總體指標(biāo)的估計(jì)量,并以抽樣指標(biāo)作為總體指標(biāo)的估計(jì)量,并以抽樣指標(biāo)的實(shí)際觀測(cè)值直接作為總體未知參數(shù)估的實(shí)際觀測(cè)值直接作為總體未知參數(shù)估計(jì)值的一種推斷方法。例如以某一樣本計(jì)值的一種推斷方法。例如以某一樣本的均值來(lái)估計(jì)總體的均值,以

34、某一樣本的均值來(lái)估計(jì)總體的均值,以某一樣本的成數(shù)來(lái)估計(jì)總體的成數(shù)等。的成數(shù)來(lái)估計(jì)總體的成數(shù)等。 點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大自然法、最小二乘法等。法、最大自然法、最小二乘法等。xX pP22s 矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家KPearsonKPearson提出的。提出的。其基本思想是:由于樣本來(lái)源于總體,樣本矩其基本思想是:由于樣本來(lái)源于總體,樣本矩在一定程度上反映了總體矩,而且由大數(shù)定律在一定程度上反映了總體矩,而且由大數(shù)定律可知,樣本矩依概率收斂于總體矩。因此,只可知,樣本矩依概率收斂于總體矩。因此,只要總體的要總體的k k階原

35、點(diǎn)矩存在,就可以用樣本矩作階原點(diǎn)矩存在,就可以用樣本矩作為相應(yīng)總體矩的估計(jì)量,用樣本矩的函數(shù)作為為相應(yīng)總體矩的估計(jì)量,用樣本矩的函數(shù)作為總體矩的函數(shù)的估計(jì)量。例如,用樣本均值來(lái)總體矩的函數(shù)的估計(jì)量。例如,用樣本均值來(lái)估計(jì)總體均值,用樣本方差來(lái)估計(jì)總體方差。估計(jì)總體均值,用樣本方差來(lái)估計(jì)總體方差。矩估計(jì)法簡(jiǎn)單、直觀,而且不必知道總體的分矩估計(jì)法簡(jiǎn)單、直觀,而且不必知道總體的分布類型,所以矩估計(jì)法得到了廣泛應(yīng)用。但矩布類型,所以矩估計(jì)法得到了廣泛應(yīng)用。但矩估計(jì)法也有局限性,它要求總體以估計(jì)法也有局限性,它要求總體以k k階原點(diǎn)矩階原點(diǎn)矩存在,否則無(wú)法估計(jì),它不考慮總體分布類型,存在,否則無(wú)法估計(jì),

36、它不考慮總體分布類型,因此也就沒(méi)有充分利用總體分布函數(shù)提供的信因此也就沒(méi)有充分利用總體分布函數(shù)提供的信息。息。 極大似然估計(jì)法是由極大似然估計(jì)法是由FisherFisher,提出的一,提出的一種參數(shù)估計(jì)方法。其基本思想是:設(shè)總種參數(shù)估計(jì)方法。其基本思想是:設(shè)總體分布的函數(shù)形式已知,但有未知參數(shù),體分布的函數(shù)形式已知,但有未知參數(shù),可以取很多值,在的一切可能取值中選可以取很多值,在的一切可能取值中選一個(gè)使樣本觀察值出現(xiàn)的概率為最大的一個(gè)使樣本觀察值出現(xiàn)的概率為最大的值作為的估計(jì)值,記作,稱為的極大似值作為的估計(jì)值,記作,稱為的極大似然估計(jì)值,這種求估計(jì)量的方法稱為極然估計(jì)值,這種求估計(jì)量的方法稱

37、為極大似然估計(jì)法。大似然估計(jì)法。 確定一個(gè)好的點(diǎn)估計(jì)是很重要的。點(diǎn)估確定一個(gè)好的點(diǎn)估計(jì)是很重要的。點(diǎn)估計(jì)的優(yōu)點(diǎn)是能給出一個(gè)明確的值,缺點(diǎn)計(jì)的優(yōu)點(diǎn)是能給出一個(gè)明確的值,缺點(diǎn)是沒(méi)有指出這種估計(jì)的允許波動(dòng)范圍和是沒(méi)有指出這種估計(jì)的允許波動(dòng)范圍和把握程度有多大。因此,在實(shí)際中,點(diǎn)把握程度有多大。因此,在實(shí)際中,點(diǎn)估計(jì)往往是與區(qū)間估計(jì)同時(shí)進(jìn)行的。估計(jì)往往是與區(qū)間估計(jì)同時(shí)進(jìn)行的。三、區(qū)間估計(jì)三、區(qū)間估計(jì) 區(qū)間估計(jì)就是以一個(gè)具有一定可靠程度的區(qū)間區(qū)間估計(jì)就是以一個(gè)具有一定可靠程度的區(qū)間范圍來(lái)估計(jì)總體參數(shù),即根據(jù)抽樣指標(biāo)和抽樣范圍來(lái)估計(jì)總體參數(shù),即根據(jù)抽樣指標(biāo)和抽樣平均誤差推斷全及指標(biāo)的可能范圍。用抽樣指平均

38、誤差推斷全及指標(biāo)的可能范圍。用抽樣指標(biāo)來(lái)估計(jì)全及指標(biāo),要標(biāo)來(lái)估計(jì)全及指標(biāo),要達(dá)到達(dá)到100%100%的準(zhǔn)確幾乎是的準(zhǔn)確幾乎是不可能的不可能的,所以在估計(jì)全及指標(biāo)時(shí)就必須同時(shí),所以在估計(jì)全及指標(biāo)時(shí)就必須同時(shí)考慮估計(jì)誤差的大小。考慮估計(jì)誤差的大小。 科學(xué)地確定允許的誤差范圍:科學(xué)地確定允許的誤差范圍: 一是這一可能范圍的大小,即一是這一可能范圍的大小,即置信區(qū)間置信區(qū)間; 二是總體指標(biāo)落在這個(gè)可能范圍內(nèi)的概率,即二是總體指標(biāo)落在這個(gè)可能范圍內(nèi)的概率,即置信度置信度。 區(qū)間估計(jì)必須同時(shí)具備三個(gè)要素,即具備估計(jì)值、抽樣極限誤差和置信度三個(gè)基本要素。 抽樣極限誤差決定抽樣估計(jì)的精確度,置信度決定抽樣估計(jì)

39、的可靠性,兩者密切聯(lián)系,但同時(shí)又是一對(duì)矛盾,所以對(duì)估計(jì)的精確度和可靠性的要求應(yīng)慎重考慮。 和 稱為置信區(qū)間。xxxXxpppPp,xxxx,pppp 科學(xué)的區(qū)間估計(jì)要具備三個(gè)基本要素:科學(xué)的區(qū)間估計(jì)要具備三個(gè)基本要素: 第一,要有合適的統(tǒng)計(jì)量作為估計(jì)量;第一,要有合適的統(tǒng)計(jì)量作為估計(jì)量; 第二,要有合理的允許誤差范圍;第二,要有合理的允許誤差范圍; 第三,要有可靠的概率保證程度。第三,要有可靠的概率保證程度。 由于參數(shù)的允許范圍涉及估計(jì)的準(zhǔn)確性問(wèn)題,由于參數(shù)的允許范圍涉及估計(jì)的準(zhǔn)確性問(wèn)題,而相應(yīng)的置信度涉及估計(jì)的可靠性問(wèn)題。出于而相應(yīng)的置信度涉及估計(jì)的可靠性問(wèn)題。出于本能,在做估計(jì)時(shí)常常希望準(zhǔn)

40、確性盡可能提高,本能,在做估計(jì)時(shí)常常希望準(zhǔn)確性盡可能提高,而且可靠性也不能小,但是這兩個(gè)要求是矛盾而且可靠性也不能小,但是這兩個(gè)要求是矛盾的。在樣本單位數(shù)不變的條件下,要想縮小估的。在樣本單位數(shù)不變的條件下,要想縮小估計(jì)區(qū)間,提高估計(jì)的準(zhǔn)確性,勢(shì)必要減小置信計(jì)區(qū)間,提高估計(jì)的準(zhǔn)確性,勢(shì)必要減小置信度,降低估計(jì)的可靠性。同樣,提高了估計(jì)的度,降低估計(jì)的可靠性。同樣,提高了估計(jì)的可靠性,也必然要降低估計(jì)的準(zhǔn)確性??煽啃?,也必然要降低估計(jì)的準(zhǔn)確性。 因此,在抽樣估計(jì)的時(shí)候,只能對(duì)其中的一個(gè)要素提因此,在抽樣估計(jì)的時(shí)候,只能對(duì)其中的一個(gè)要素提出要求,而推斷另一個(gè)要素的變動(dòng)情況。如對(duì)估計(jì)的出要求,而推斷

41、另一個(gè)要素的變動(dòng)情況。如對(duì)估計(jì)的準(zhǔn)確性提出要求,即要求誤差范圍不超過(guò)給定的標(biāo)準(zhǔn),準(zhǔn)確性提出要求,即要求誤差范圍不超過(guò)給定的標(biāo)準(zhǔn),來(lái)推算估計(jì)的可靠性,即置信度;或?qū)烙?jì)的可靠性來(lái)推算估計(jì)的可靠性,即置信度;或?qū)烙?jì)的可靠性提出要求,即要求給定的置信度,來(lái)推算抽樣的誤差提出要求,即要求給定的置信度,來(lái)推算抽樣的誤差范圍。若所推算的另一要素(抽樣誤差范圍或概率保范圍。若所推算的另一要素(抽樣誤差范圍或概率保證程度)不能滿足實(shí)際工作的需要,就應(yīng)該增加樣本證程度)不能滿足實(shí)際工作的需要,就應(yīng)該增加樣本單位改善抽樣組織方式,重新進(jìn)行抽樣,直到符合要單位改善抽樣組織方式,重新進(jìn)行抽樣,直到符合要求為止。求為

42、止。 根據(jù)置信度的要求,估計(jì)總體指標(biāo)出現(xiàn)的可能范圍的根據(jù)置信度的要求,估計(jì)總體指標(biāo)出現(xiàn)的可能范圍的具體步驟是:具體步驟是: (1 1)抽取樣本,計(jì)算樣本指標(biāo),如計(jì)算樣本平均數(shù)或)抽取樣本,計(jì)算樣本指標(biāo),如計(jì)算樣本平均數(shù)或樣本成數(shù),作為總體指標(biāo)的相應(yīng)估計(jì)值。并計(jì)算樣本樣本成數(shù),作為總體指標(biāo)的相應(yīng)估計(jì)值。并計(jì)算樣本標(biāo)準(zhǔn)差用以推算抽樣平均誤差。標(biāo)準(zhǔn)差用以推算抽樣平均誤差。 (2 2)根據(jù)給定的置信度的要求,查)根據(jù)給定的置信度的要求,查正態(tài)分布概率正態(tài)分布概率表表,求得概率度值。,求得概率度值。 (3 3)根據(jù)概率度和抽樣平均誤差來(lái)推算抽樣極限誤差)根據(jù)概率度和抽樣平均誤差來(lái)推算抽樣極限誤差的可能范

43、圍,并據(jù)以計(jì)算被估計(jì)總體指標(biāo)的上下限,的可能范圍,并據(jù)以計(jì)算被估計(jì)總體指標(biāo)的上下限,對(duì)總體參數(shù)作區(qū)間估計(jì)。對(duì)總體參數(shù)作區(qū)間估計(jì)。1 1總體平均數(shù)的估計(jì)總體平均數(shù)的估計(jì) 某外貿(mào)公司出口一種茶葉,規(guī)定每包規(guī)格不低于150克,現(xiàn)在用不重復(fù)抽樣的方法抽取其中1%進(jìn)行檢驗(yàn)。測(cè)得結(jié)果如表所示,要求以95.45%的概率估計(jì)這批茶葉平均每包的重量范圍,以便確定平均重量是否達(dá)到規(guī)格要求。每包重量(克)每包重量(克)組中值組中值包包 數(shù)數(shù)148-149148-149148.5148.51010149-150149-150149.5149.52020150-151150-151150.5150.55050151-1

44、52151-152151.5151.52020合合 計(jì)計(jì)100100第一步,根據(jù)樣本資料計(jì)算樣本平均數(shù)和標(biāo)準(zhǔn)差,并推算抽樣平均誤差。153030150.3100 xfxf克2760.87100 xxfsf克克0867. 0%1110087. 0122Nnnsx第二步,根據(jù)給定的置信度95.45%,查表得概率度 =2。2z 第三步,根據(jù)概率度和抽樣平均誤差計(jì)算抽樣極限誤差,并估計(jì)總體平均數(shù)的上下限,判斷其是否達(dá)到規(guī)格要求。 22 0.0867 0.17xxz 克 :150.3 0.17 150.13xx 下限克:150.3 0.17150.47xx 上限克可以用95.45%的概率保證該批茶葉平均

45、每包重量在150.13-150.47克之間,表明這批茶葉平均每包重量達(dá)到了規(guī)格要求。 對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查對(duì)某型號(hào)的電子元件進(jìn)行耐用性能檢查,抽查的資料分組列表如下,要求耐用時(shí)數(shù)的允許誤的資料分組列表如下,要求耐用時(shí)數(shù)的允許誤差范圍差范圍 =10.5 =10.5小時(shí),試估計(jì)該批電子元件的小時(shí),試估計(jì)該批電子元件的平均耐用時(shí)數(shù)。平均耐用時(shí)數(shù)。練習(xí)練習(xí)x1 1、計(jì)算抽樣平均數(shù)和標(biāo)準(zhǔn)差、計(jì)算抽樣平均數(shù)和標(biāo)準(zhǔn)差2 2、根據(jù)給定的、根據(jù)給定的=10.5=10.5小時(shí),計(jì)算總體平均數(shù)的上小時(shí),計(jì)算總體平均數(shù)的上下限,下限,下限下限= = 上限上限= =3 3、根據(jù)、根據(jù) =10.5/

46、5.191=2 =10.5/ 5.191=2,查概率表得置信度查概率表得置信度 1- =0.95451- =0.9545我們可以作如下估計(jì),即可以概率我們可以作如下估計(jì),即可以概率95.45%95.45%的保證程的保證程度,估計(jì)該批電子元件的耐用時(shí)數(shù)在度,估計(jì)該批電子元件的耐用時(shí)數(shù)在1045-10661045-1066小小時(shí)之間。時(shí)之間。1055.5xfxf2()51.91xxfSf51.915.191100 xn1055.5 10.51045xx 1055.5 10.51066xx xuxxx2z2 2總體成數(shù)的估計(jì)總體成數(shù)的估計(jì) 仍用前例資料,要求用同樣的概率保證這批茶葉包裝仍用前例資料,

47、要求用同樣的概率保證這批茶葉包裝合格率范圍。合格率范圍。 第一步,根據(jù)樣本資料計(jì)算樣本合格率和標(biāo)準(zhǔn)差,并第一步,根據(jù)樣本資料計(jì)算樣本合格率和標(biāo)準(zhǔn)差,并推算抽樣平均誤差。推算抽樣平均誤差。 第二步,根據(jù)給定的置信度第二步,根據(jù)給定的置信度95.45%95.45%,查表得概率度,查表得概率度 =2 =2。17070%100npn170% 30% 45.8%pspp2145.8%11 1%4.56%100pppnnN2z 第三步,根據(jù)概率度和抽樣平均誤差計(jì)算抽樣極限誤差,并估計(jì)總體合格率的上下限。 可以用95.45%的概率,保證該批茶葉包裝的合格率在60.88%-79.12%之間。22 4.56%9

48、.12%ppz :70% 9.12%60.88%pp 下限:70% 9.12%79.12%pp 上限練習(xí):某紗廠某時(shí)期內(nèi)生產(chǎn)了練習(xí):某紗廠某時(shí)期內(nèi)生產(chǎn)了1010萬(wàn)個(gè)單位的紗,按純隨萬(wàn)個(gè)單位的紗,按純隨機(jī)抽樣方式抽取機(jī)抽樣方式抽取20002000個(gè)單位檢驗(yàn),檢驗(yàn)結(jié)果合格率為個(gè)單位檢驗(yàn),檢驗(yàn)結(jié)果合格率為95%95%,廢品率為,廢品率為5%5%,試以,試以95%95%的把握程度,估計(jì)全部的把握程度,估計(jì)全部紗合格品率的區(qū)間范圍及合格品數(shù)量的區(qū)間范圍?紗合格品率的區(qū)間范圍及合格品數(shù)量的區(qū)間范圍?100000N2000n%95p%51 p95.0196.12zNnnppp11%48.0100000200

49、01200005.095.0%94.0%48.096.12ppz區(qū)間下限:區(qū)間下限:%06.940094.095.0pp區(qū)間上限:區(qū)間上限:%94.950094.095.0pp第四節(jié)第四節(jié) 抽樣組織形式抽樣組織形式 不同的抽樣組織形式,會(huì)有不同的抽樣誤差,因而抽樣的效果也是不同的。一種科學(xué)的組織形式往往有可能以較少的樣本單位數(shù)取得更好的抽樣效果。因此抽樣調(diào)查必須選擇合適的組織形式,并對(duì)所用方法的抽樣做出正確的估計(jì),進(jìn)一步和其他組織形式的抽樣誤差進(jìn)行對(duì)比分析。 例如糧食產(chǎn)量按地理?xiàng)l件分類,分類取樣;或按歷史單產(chǎn)資料、當(dāng)年估產(chǎn)資料,將各單位順序排隊(duì),并等距取樣等等。 即使是同一種抽樣組織形式,由于

50、采用的分類標(biāo)準(zhǔn)不同,群體的劃分不同等等原因,仍然會(huì)產(chǎn)生不同的效果。 進(jìn)行對(duì)比分析,從中選擇有效和切實(shí)可行的抽樣方案。 常用的抽樣組織方式有簡(jiǎn)單隨機(jī)抽樣、類型抽樣、等距抽樣、整群抽樣、多階段抽樣等等。一、簡(jiǎn)單隨機(jī)抽樣一、簡(jiǎn)單隨機(jī)抽樣 簡(jiǎn)單隨機(jī)抽樣,是按照簡(jiǎn)單隨機(jī)抽樣,是按照隨機(jī)隨機(jī)原則直接從個(gè)總體原則直接從個(gè)總體單位中抽取個(gè)單位作為樣本。單位中抽取個(gè)單位作為樣本。 不論是不論是重復(fù)還是不重復(fù)抽樣重復(fù)還是不重復(fù)抽樣,都要保證每個(gè)單,都要保證每個(gè)單位在抽選中都有位在抽選中都有相等的中選機(jī)會(huì)相等的中選機(jī)會(huì)。 優(yōu)點(diǎn):簡(jiǎn)單易行優(yōu)點(diǎn):簡(jiǎn)單易行 適用:總體單位數(shù)不是太多的均勻總體。適用:總體單位數(shù)不是太多的均

51、勻總體。 采用簡(jiǎn)單隨機(jī)抽樣,在進(jìn)行抽樣調(diào)查之前應(yīng)該采用簡(jiǎn)單隨機(jī)抽樣,在進(jìn)行抽樣調(diào)查之前應(yīng)該先確定總體范圍,并對(duì)總體進(jìn)行編號(hào),然后隨先確定總體范圍,并對(duì)總體進(jìn)行編號(hào),然后隨機(jī)抽選必要的單位數(shù),簡(jiǎn)單隨機(jī)抽樣最符合隨機(jī)抽選必要的單位數(shù),簡(jiǎn)單隨機(jī)抽樣最符合隨機(jī)原則。機(jī)原則。抽選樣本單位的具體做法抽選樣本單位的具體做法 (1 1)抽簽法:做標(biāo)簽,充分地拌勻后逐)抽簽法:做標(biāo)簽,充分地拌勻后逐個(gè)地抽出個(gè)標(biāo)簽,根據(jù)抽樣框找到相應(yīng)個(gè)地抽出個(gè)標(biāo)簽,根據(jù)抽樣框找到相應(yīng)的抽樣單位進(jìn)行現(xiàn)場(chǎng)調(diào)查,從而得到一的抽樣單位進(jìn)行現(xiàn)場(chǎng)調(diào)查,從而得到一個(gè)簡(jiǎn)單隨機(jī)樣本。如果總體比較大,抽個(gè)簡(jiǎn)單隨機(jī)樣本。如果總體比較大,抽簽法就顯得比

52、較笨重,實(shí)施起來(lái)不太方簽法就顯得比較笨重,實(shí)施起來(lái)不太方便,甚至于根本無(wú)法實(shí)施,此時(shí)可利用便,甚至于根本無(wú)法實(shí)施,此時(shí)可利用隨機(jī)數(shù)字表法。隨機(jī)數(shù)字表法。 (2 2)隨機(jī)數(shù)字表法:隨機(jī)數(shù)字表,是供)隨機(jī)數(shù)字表法:隨機(jī)數(shù)字表,是供抽樣使用的,由抽樣使用的,由0 0到到9 9這十個(gè)數(shù)碼隨機(jī)排這十個(gè)數(shù)碼隨機(jī)排列組成的多位數(shù)字表。在使用前,先將列組成的多位數(shù)字表。在使用前,先將總體的全部單位編號(hào),并根據(jù)編號(hào)的位總體的全部單位編號(hào),并根據(jù)編號(hào)的位數(shù)確定使用表中數(shù)字的列數(shù);然后,從數(shù)確定使用表中數(shù)字的列數(shù);然后,從任意一行、任意一列、任意方向開(kāi)始數(shù)任意一行、任意一列、任意方向開(kāi)始數(shù),遇到編號(hào)范圍內(nèi)的數(shù)字就作

53、為樣本單,遇到編號(hào)范圍內(nèi)的數(shù)字就作為樣本單位,超過(guò)編號(hào)范圍內(nèi)的數(shù)字就跳過(guò)去,位,超過(guò)編號(hào)范圍內(nèi)的數(shù)字就跳過(guò)去,直到抽夠樣本單位數(shù)目為止。直到抽夠樣本單位數(shù)目為止。 (3 3)利用計(jì)算機(jī)軟件中的隨機(jī)函數(shù)產(chǎn)生)利用計(jì)算機(jī)軟件中的隨機(jī)函數(shù)產(chǎn)生隨機(jī)數(shù)的功能隨機(jī)抽選樣本單位數(shù)。隨機(jī)數(shù)的功能隨機(jī)抽選樣本單位數(shù)。 組織抽樣調(diào)查的一項(xiàng)重要工作就是確定組織抽樣調(diào)查的一項(xiàng)重要工作就是確定合適的合適的樣本容量樣本容量。 因?yàn)闃颖救萘吭酱?,抽樣誤差可能越小,因?yàn)闃颖救萘吭酱?,抽樣誤差可能越小,但花費(fèi)的時(shí)間和費(fèi)用也越高,也就失去但花費(fèi)的時(shí)間和費(fèi)用也越高,也就失去了抽樣調(diào)查的意義;反之,樣本容量越了抽樣調(diào)查的意義;反之,

54、樣本容量越小,花費(fèi)的時(shí)間和費(fèi)用也越少,但在估小,花費(fèi)的時(shí)間和費(fèi)用也越少,但在估計(jì)的精確度上常不能滿足要求。計(jì)的精確度上常不能滿足要求。 所以在設(shè)計(jì)的時(shí)候,通常是先根據(jù)研究所以在設(shè)計(jì)的時(shí)候,通常是先根據(jù)研究問(wèn)題的性質(zhì)確定允許的誤差范圍和必要問(wèn)題的性質(zhì)確定允許的誤差范圍和必要的概率保證程度或概率度,并根據(jù)總體的概率保證程度或概率度,并根據(jù)總體的標(biāo)準(zhǔn)差通過(guò)抽樣平均誤差的公式來(lái)確的標(biāo)準(zhǔn)差通過(guò)抽樣平均誤差的公式來(lái)確定必要的樣本單位數(shù)。定必要的樣本單位數(shù)。 根據(jù)各種條件下的抽樣平均誤差以及極根據(jù)各種條件下的抽樣平均誤差以及極限誤差很容易推算出必要的抽樣數(shù)目。限誤差很容易推算出必要的抽樣數(shù)目。在重復(fù)抽樣下,

55、樣本平均數(shù)的極限抽樣誤差公式為:xxz2nz2則必要的樣本單位數(shù)為:xzn2222在不重復(fù)抽樣下, 則必要的樣本單位數(shù)為:2222222zNNznx同樣,重復(fù)抽樣和不重復(fù)抽樣的成數(shù)樣本必要單位數(shù)分同樣,重復(fù)抽樣和不重復(fù)抽樣的成數(shù)樣本必要單位數(shù)分別為:別為:pPPzn222)1 ()1 ()1 (22222PPzNPPNznp確定抽樣單位數(shù)時(shí)的注意事項(xiàng):確定抽樣單位數(shù)時(shí)的注意事項(xiàng): 1 1樣本容量受允許誤差范圍大小的影響。誤樣本容量受允許誤差范圍大小的影響。誤差范圍要求越小則樣本單位數(shù)就需要越愈多,差范圍要求越小則樣本單位數(shù)就需要越愈多,所以在抽樣設(shè)計(jì)中確定抽樣誤差可允許范圍要所以在抽樣設(shè)計(jì)中確

56、定抽樣誤差可允許范圍要十分慎重考慮。十分慎重考慮。 2 2樣本容量受總體標(biāo)準(zhǔn)差大小的影響。在確樣本容量受總體標(biāo)準(zhǔn)差大小的影響。在確定一個(gè)樣本進(jìn)行多指標(biāo)的調(diào)查中,為保證所有定一個(gè)樣本進(jìn)行多指標(biāo)的調(diào)查中,為保證所有的抽樣誤差都控制在允許的范圍內(nèi),應(yīng)選擇樣的抽樣誤差都控制在允許的范圍內(nèi),應(yīng)選擇樣本容量大的。本容量大的。 3 3當(dāng)總體單位數(shù)較大時(shí),不重復(fù)抽樣的樣本當(dāng)總體單位數(shù)較大時(shí),不重復(fù)抽樣的樣本容量的確定,也可以用重復(fù)抽樣情況下必要單容量的確定,也可以用重復(fù)抽樣情況下必要單位的計(jì)算公式。位的計(jì)算公式。 某市進(jìn)行居民家計(jì)調(diào)查,根據(jù)歷史資料該市居民家庭平均每人年收入的標(biāo)準(zhǔn)差為3000元,而家庭消費(fèi)的恩

57、格爾系數(shù)為43%?,F(xiàn)在用重復(fù)抽樣的方法,要求在95%的概率保證下,平均收入的極限誤差不超過(guò)250元,恩格爾系數(shù)的極限誤差不超過(guò)4%。問(wèn)必要的抽樣單位數(shù)應(yīng)該為多少? 根據(jù)重復(fù)抽樣條件下必要樣本單位數(shù)的公式計(jì)算為: 樣本平均數(shù)的必要單位數(shù) = =554(人) 樣本成數(shù)的必要單位數(shù) = =589(人) 兩個(gè)抽樣指標(biāo)所要求的必要抽樣數(shù)目不同,應(yīng)該取其中較大的單位數(shù),即抽取589人作為樣本,以滿足共同的要求。xzn2222222250300096. 1pPPzn222)1 (22%4%)431 (%4396. 1 簡(jiǎn)單隨機(jī)抽樣在實(shí)踐上受到許多限制。例如當(dāng)總體很大時(shí),要首先對(duì)每一個(gè)單位加以編號(hào)就有很大困難

58、,對(duì)于無(wú)限總體,對(duì)其進(jìn)行編號(hào)甚至是不可能的。但這種抽樣方式從理論上說(shuō)最符合隨機(jī)原則,它的抽樣誤差容易得到理論上的論證。因此可以作為發(fā)展其他更復(fù)雜的抽樣設(shè)計(jì)的基礎(chǔ),同時(shí)也是衡量其他抽樣方式抽樣效果的比較標(biāo)準(zhǔn)。 1:某市進(jìn)行職工家庭生活費(fèi)抽樣調(diào)查,已知職工家庭平均每人每月生活費(fèi)收入的標(biāo)準(zhǔn)差為110元,允許誤差范圍10元,概率把握程度95%,試確定應(yīng)抽選的戶數(shù)。 解: 2:某企業(yè)要調(diào)查產(chǎn)品合格率,已知以往的合格率曾有90%、98%、99%?,F(xiàn)要求誤差不超過(guò)1%,把握程度為95%,問(wèn)需要抽選多少件產(chǎn)品? 解: (戶)4651011096.1222222xzn(件)13801.01 .09 .096.1

59、)1 (22222pPPzn 3 3:要調(diào)查某校大學(xué)生英語(yǔ)四級(jí)考試成績(jī),:要調(diào)查某校大學(xué)生英語(yǔ)四級(jí)考試成績(jī),假設(shè)根據(jù)歷史資料該校學(xué)生平均成績(jī)的標(biāo)準(zhǔn)假設(shè)根據(jù)歷史資料該校學(xué)生平均成績(jī)的標(biāo)準(zhǔn)差為差為2020分,及格率為分,及格率為65%65%。現(xiàn)用重復(fù)抽樣方?,F(xiàn)用重復(fù)抽樣方法,要求在法,要求在95%95%的置信度下,平均分?jǐn)?shù)的誤的置信度下,平均分?jǐn)?shù)的誤差不超過(guò)差不超過(guò)2 2分,及格率的誤差不超過(guò)分,及格率的誤差不超過(guò)4%4%,求,求必要抽樣數(shù)目。必要抽樣數(shù)目。(人)54704. 035. 065. 096. 1)1 (22222pPPzn(人)38522096. 12222222xzn二、類型抽樣二

60、、類型抽樣 類型抽樣又稱分層抽樣、分類抽樣,它是先對(duì)總體各類型抽樣又稱分層抽樣、分類抽樣,它是先對(duì)總體各單位按某一主要標(biāo)志進(jìn)行分組,然后再?gòu)母鹘M中按隨單位按某一主要標(biāo)志進(jìn)行分組,然后再?gòu)母鹘M中按隨機(jī)的原則抽選一定單位構(gòu)成樣本。機(jī)的原則抽選一定單位構(gòu)成樣本。 類型抽樣是將統(tǒng)計(jì)分組和簡(jiǎn)單隨機(jī)抽樣相結(jié)合的一種類型抽樣是將統(tǒng)計(jì)分組和簡(jiǎn)單隨機(jī)抽樣相結(jié)合的一種抽樣方式。通過(guò)分組,可以把總體分成幾個(gè)在組內(nèi)性抽樣方式。通過(guò)分組,可以把總體分成幾個(gè)在組內(nèi)性質(zhì)比較接近的類型,使得各組內(nèi)標(biāo)志差異縮小,各組質(zhì)比較接近的類型,使得各組內(nèi)標(biāo)志差異縮小,各組間有較大差異,保證了樣本單位能夠均勻地分布在總間有較大差異,保證了

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論