




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《統(tǒng)計(jì)學(xué)》鹽城師范學(xué)院商學(xué)院第五章抽樣調(diào)查12/12/20221《統(tǒng)計(jì)學(xué)》鹽城師范學(xué)院商學(xué)院第五章抽樣調(diào)查12/10/本章內(nèi)容第一節(jié)抽樣調(diào)查概述第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)第三節(jié)抽樣誤差與抽樣估計(jì)第四節(jié)抽樣調(diào)查的組織方式12/12/20222本章內(nèi)容第一節(jié)抽樣調(diào)查概述12/10/20222第一節(jié)抽樣調(diào)查概述一、抽樣調(diào)查的概念、特點(diǎn)及作用二、抽樣調(diào)查中的基本概念三、抽樣方法四、抽樣調(diào)查的設(shè)計(jì)12/12/20223第一節(jié)抽樣調(diào)查概述一、抽樣調(diào)查的概念、特點(diǎn)及作用12/1一、抽樣調(diào)查的概念、特點(diǎn)及作用(一)抽樣調(diào)查的概念抽樣調(diào)查是按照隨機(jī)原則從總體中抽取樣本進(jìn)行調(diào)查,得到樣本資料,并根據(jù)樣本資料對(duì)總體數(shù)量特征作出具有一定可靠程度的估計(jì)和推斷,以達(dá)到認(rèn)識(shí)總體的一種統(tǒng)計(jì)方法。也稱為抽樣推斷、抽樣估計(jì)或統(tǒng)計(jì)推斷。
例:某地進(jìn)行水質(zhì)監(jiān)測(cè),考察河水中某種污染物質(zhì)是否超標(biāo)。從河水中按照一定地點(diǎn)定時(shí)取樣檢驗(yàn),根據(jù)檢驗(yàn)結(jié)果推斷河水中污染物是否超標(biāo)。
12/12/20224一、抽樣調(diào)查的概念、特點(diǎn)及作用(一)抽樣調(diào)查的概念例:某地進(jìn)推斷總體指標(biāo)(參數(shù))樣本指標(biāo)(統(tǒng)計(jì)量)(紅色表示樣本)12/12/20225推斷總體指標(biāo)(參數(shù))樣本指標(biāo)(統(tǒng)計(jì)量)(紅色表示樣本)12/(二)抽樣調(diào)查的特點(diǎn)1、與其它調(diào)查方法相比,省時(shí)、省力、快捷;2、根據(jù)樣本資料對(duì)總體的數(shù)量特征作出具有一定可靠性的估計(jì)和推斷;3、按照隨機(jī)性(同等可能性)原則從總體中抽取樣本單位;4、可以根據(jù)資料在調(diào)查之前計(jì)算和控制抽樣誤差。12/12/20226(二)抽樣調(diào)查的特點(diǎn)12/10/20226(三)抽樣調(diào)查的作用1、某些現(xiàn)象不可能進(jìn)行全面調(diào)查,但又需要了解全面資料時(shí),就采用抽樣調(diào)查方法。2、某些理論上可以進(jìn)行全面調(diào)查,但實(shí)際上難以達(dá)到的現(xiàn)象,可以采用抽樣調(diào)查。3、可以對(duì)全面調(diào)查的結(jié)果進(jìn)行評(píng)價(jià)和修正。4、抽樣調(diào)查可用于工業(yè)生產(chǎn)過(guò)程中的質(zhì)量控制。5、可以對(duì)某些總體的假設(shè)進(jìn)行檢驗(yàn),來(lái)判斷假設(shè)的真?zhèn)?,為決策提供依據(jù)。12/12/20227(三)抽樣調(diào)查的作用12/10/20227(四)抽樣調(diào)查的兩種類型一類是參數(shù)估計(jì):它是根據(jù)對(duì)樣本進(jìn)行觀測(cè)取得的數(shù)據(jù),然后對(duì)研究對(duì)象整體的數(shù)量特征取值給出估計(jì)方法。另一類是假設(shè)檢驗(yàn):它是根據(jù)對(duì)樣本進(jìn)行觀測(cè)取得的數(shù)據(jù),然后對(duì)研究對(duì)象的數(shù)量規(guī)律性是否具有某種指定特征進(jìn)行檢驗(yàn)。
12/12/20228(四)抽樣調(diào)查的兩種類型12/10/20228例:2005年中國(guó)消費(fèi)者協(xié)會(huì)的主題是“健康·維權(quán)”。假定我們是消費(fèi)者協(xié)會(huì)的檢查人員,治理缺斤少兩的不法行為。對(duì)可口可樂公司的產(chǎn)品進(jìn)行檢查,他們生產(chǎn)的一種瓶裝雪碧,包裝上標(biāo)明其凈含量是500ml,在市場(chǎng)上隨機(jī)抽取了50瓶,測(cè)得到其平均含量為499.5ml,標(biāo)準(zhǔn)差為2.63ml。取得這些數(shù)據(jù)我們可以:一是做一個(gè)估計(jì):該種包裝的雪碧平均含量在498.77-500.23ml之間,然后向消協(xié)寫份報(bào)告;(參數(shù)估計(jì))二是一個(gè)裁決:說(shuō)“可口可樂公司有欺騙消費(fèi)者的行為”的證據(jù)不足。(假設(shè)檢驗(yàn))12/12/20229例:2005年中國(guó)消費(fèi)者協(xié)會(huì)的主題是“健康·維權(quán)”。假定我們(一)全及總體和個(gè)體1、全及總體(總體,母體):它是由具有同一性質(zhì)的許多單位組成的集合體,是指所要認(rèn)識(shí)的對(duì)象。2、個(gè)體(總體單位),組成總體的各個(gè)單位稱為個(gè)體。(二)抽樣總體(樣本,子體)從總體中按照一定的原則和方法抽取出來(lái)的部分個(gè)體組成的結(jié)合體。樣本容量:一個(gè)樣本中包含的個(gè)體(總體單位)數(shù)。n≥30大樣本n<30小樣本二、抽樣調(diào)查中幾個(gè)基本概念12/12/202210(一)全及總體和個(gè)體二、抽樣調(diào)查中幾個(gè)基本概念12/10/2(三)總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)(全及指標(biāo)、參數(shù)):它是根據(jù)總體所有單位的標(biāo)志值或標(biāo)志特征計(jì)算的、反映總體某種屬性的綜合指標(biāo)??傮w指標(biāo)是一個(gè)確定的值。2、樣本指標(biāo)(抽樣指標(biāo)、統(tǒng)計(jì)量):它由樣本各個(gè)單位標(biāo)志值或標(biāo)志特征計(jì)算的綜合指標(biāo)。樣本指標(biāo)是一個(gè)隨機(jī)變量。3、抽樣調(diào)查中常用的指標(biāo)平均數(shù)(均值)、方差或標(biāo)準(zhǔn)差、比例(是非標(biāo)志比重)12/12/202211(三)總體指標(biāo)和樣本指標(biāo)12/10/202211總體和樣本指標(biāo)及符號(hào)對(duì)照表指標(biāo)名稱總體樣本單位數(shù)Nn平均數(shù)或標(biāo)準(zhǔn)差s方差是非標(biāo)志比例(成數(shù))或P、Qp、q12/12/202212總體和樣本指標(biāo)及符號(hào)對(duì)照表指標(biāo)名稱總體樣本單位數(shù)Nn平均數(shù)是非標(biāo)志(交替標(biāo)志)的比重(成數(shù)):是非標(biāo)志的標(biāo)志表現(xiàn)只有“是”與“非”兩種結(jié)果,將其數(shù)量化,通常以1代表具有所研究特征的變量值,以0代表不具有所研究特征的變量值。當(dāng)總體單位數(shù)為N時(shí),假定具有所研究特征變量值的單位數(shù)為,不具有所研究特征變量值的單位數(shù)為,且總體樣本12/12/202213是非標(biāo)志(交替標(biāo)志)的比重(成數(shù)):總體樣本12/10/2是非標(biāo)志的平均數(shù)與標(biāo)準(zhǔn)差計(jì)算是非標(biāo)志X10PQP01-P0-PQ2PP2Q合計(jì)1P—Q2P+P2Q是非標(biāo)志的算術(shù)平均數(shù)為:=p是非標(biāo)志的標(biāo)準(zhǔn)差為:
==12/12/202214是非標(biāo)志的平均數(shù)與標(biāo)準(zhǔn)差計(jì)算是非標(biāo)志1PP1-PQ2P合計(jì)三、抽樣方法1、重復(fù)抽樣(重置抽樣,有放回的抽樣):是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位經(jīng)登錄其有關(guān)標(biāo)志表現(xiàn)后又放回總體中重新參加下一次的抽選。
2、不重復(fù)抽樣(不重置抽樣,無(wú)放回的抽樣):是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位登錄其有關(guān)標(biāo)志表現(xiàn)后不再放回總體中參加下一次的抽選。
例例12/12/202215三、抽樣方法1、重復(fù)抽樣(重置抽樣,有放回的抽樣):是指從全3、抽樣框與樣本的可能數(shù)目抽樣框:是指對(duì)可以選擇作為樣本的總體單位列出名冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。它是進(jìn)行概率抽樣的必要條件。樣本的可能數(shù)目:它是指從總體N個(gè)單位中隨機(jī)抽選n個(gè)單位構(gòu)成樣本,結(jié)果有排列組合,一種排列組合便構(gòu)成一個(gè)可能的樣本,排列組合的總數(shù)稱為樣本的可能數(shù)目。如下表:12/12/2022163、抽樣框與樣本的可能數(shù)目12/10/202216抽樣方法重置抽樣不重置抽樣考慮順序不考慮順序12/12/202217抽樣方法重置抽樣不重置抽樣考慮順序不考慮順序12/10/20四、抽樣調(diào)查的設(shè)計(jì)1、界定調(diào)查總體2、選擇收集資料的方式3、選擇抽樣框4、設(shè)計(jì)抽樣技術(shù)5、設(shè)計(jì)樣本和抽取樣本6、評(píng)估樣本12/12/202218四、抽樣調(diào)查的設(shè)計(jì)1、界定調(diào)查總體12/10/202218第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)一、隨機(jī)變量的概率分布二、隨機(jī)變量的數(shù)字特征三、常用的隨機(jī)變量的分布四、大數(shù)定律與中心極限定理五、抽樣分布(本節(jié)內(nèi)容見教材,只需了解結(jié)論)12/12/202219第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)一、隨機(jī)變量的概率分布12/10/第三節(jié)抽樣誤差與抽樣估計(jì)一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差五、抽樣估計(jì)的可靠程度六、抽樣估計(jì)方法七、樣本容量的確定12/12/202220第三節(jié)抽樣誤差與抽樣估計(jì)一、抽樣誤差的概念12/10/20一、抽樣誤差的概念1、統(tǒng)計(jì)誤差:調(diào)查得到數(shù)據(jù)資料與實(shí)際情況的差別稱為統(tǒng)計(jì)誤差。統(tǒng)計(jì)誤差=樣本指標(biāo)-總體指標(biāo)2、統(tǒng)計(jì)誤差的種類:12/12/202221一、抽樣誤差的概念1、統(tǒng)計(jì)誤差:調(diào)查得到數(shù)據(jù)資料與實(shí)際情況的3、抽樣誤差:它是指在抽樣調(diào)查過(guò)程中,在遵守隨機(jī)原則抽樣的條件下,仍然會(huì)產(chǎn)生的樣本指標(biāo)與總體指標(biāo)之間的差別。抽樣誤差既是一種隨機(jī)性誤差,也是一種代表性誤差,它是無(wú)法避免的,但它是可以利用大數(shù)定律計(jì)算出來(lái)的并能夠通過(guò)設(shè)計(jì)抽樣程序控制其大小。12/12/2022223、抽樣誤差:它是指在抽樣調(diào)查過(guò)程中,在遵守隨機(jī)原則抽樣的條二、影響抽樣誤差的因素1、樣本容量的大小;2、總體被研究標(biāo)志的變異程度;3、抽樣方法的選擇;4、抽樣的組織形式。12/12/202223二、影響抽樣誤差的因素1、樣本容量的大??;12/10/202三、抽樣平均誤差(一)抽樣平均誤差的概念抽樣平均誤差是抽樣平均數(shù)或成數(shù)的標(biāo)準(zhǔn)差。抽樣平均誤差就是說(shuō)明各個(gè)抽樣平均數(shù)或抽樣成數(shù)與總體平均數(shù)或總體成數(shù)之間的平均誤差。抽樣平均誤差是我們用樣本指標(biāo)來(lái)估計(jì)或推斷總體指標(biāo)時(shí),計(jì)算誤差范圍的基礎(chǔ)。12/12/202224三、抽樣平均誤差(一)抽樣平均誤差的概念12/10/2022抽樣平均誤差的理論計(jì)算公式:式中以分別代表抽樣平均數(shù)或抽樣成數(shù)的平均差,M表示樣本的可能數(shù)目。舉例上述平均誤差公式只能用來(lái)解釋平均誤差的概念,在實(shí)際問(wèn)題中無(wú)法應(yīng)用。因?yàn)椋菏紫?,總體的平均數(shù)或成數(shù)通常未知;其次,也很難給出全部樣本的平均數(shù)或成數(shù)。12/12/202225抽樣平均誤差的理論計(jì)算公式:式中以抽樣平均誤差的實(shí)際計(jì)算公式1、抽樣平均數(shù)的抽樣平均誤差當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是相互獨(dú)立的,樣本變量x與總體變量X同分布。用數(shù)理統(tǒng)計(jì)知識(shí)證明,得:重復(fù)抽樣抽樣平均誤差公式12/12/202226抽樣平均誤差的實(shí)際計(jì)算公式重復(fù)抽樣抽樣平均誤差公式12/10當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是不相互獨(dú)立的。用數(shù)理統(tǒng)計(jì)知識(shí)證明,得:不重復(fù)抽樣抽樣平均誤差公式12/12/202227當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是不相互不重復(fù)抽樣誤差的近似公式與重復(fù)抽樣誤差公式的區(qū)別是公式中多了一個(gè)。這是一個(gè)修正系數(shù),也稱為校正因子。當(dāng)N很大時(shí),分母上可以不減去1。可以近似的表示為:12/12/202228不重復(fù)抽樣誤差的近似公式與重復(fù)抽樣誤差公式的區(qū)別是公式中多了解:在重復(fù)抽樣條件下為:在不重復(fù)抽樣條件下為:【例】從某校8000名學(xué)生中隨機(jī)抽取400人,稱得其平均體重為58公斤,標(biāo)準(zhǔn)差為10公斤,計(jì)算抽樣平均誤差。12/12/202229解:在重復(fù)抽樣條件下為:【例】從某校8000名學(xué)生中隨機(jī)抽2、抽樣成數(shù)的抽樣平均誤差抽樣成數(shù)的抽樣平均誤差表明各樣本成數(shù)的絕對(duì)離差的平均水平。用于將屬性總體變化為變量總體。
(1)重復(fù)抽樣抽樣平均誤差公式為:或總體資料樣本資料12/12/2022302、抽樣成數(shù)的抽樣平均誤差(1)重復(fù)抽樣抽樣平均誤差公式為:(2)不重復(fù)抽樣抽樣平均誤差公式為:總體資料樣本資料或或一般總體的成數(shù)是未知的,通常是用樣本的成數(shù)p來(lái)代替公式中的總體成數(shù)。12/12/202231(2)不重復(fù)抽樣抽樣平均誤差公式為:總體資料樣本資料或或一般【例】有一批食品罐頭共60000瓶,從中隨機(jī)抽取300瓶,發(fā)現(xiàn)有6瓶不合格,求合格率的抽樣平均誤差。解:合格率:
在重復(fù)抽樣條件下為:在不重復(fù)抽樣條件下為:12/12/202232【例】有一批食品罐頭共60000瓶,從中隨機(jī)抽取300瓶,四、抽樣極限誤差抽樣平均誤差只是衡量誤差可能范圍的一種尺度。它并不等同于抽樣指標(biāo)與總體指標(biāo)之間的真實(shí)誤差。由于總體參數(shù)是一個(gè)確定的常數(shù),而樣本估計(jì)量會(huì)隨抽取的樣本不同而圍繞總體參數(shù)上下隨機(jī)取值。因此,樣本統(tǒng)計(jì)量與總體參數(shù)之間存在一個(gè)誤差范圍。所謂抽樣誤差范圍就是指變動(dòng)的樣本統(tǒng)計(jì)量與確定的總體參數(shù)之間離差的可能范圍,它用樣本估計(jì)值與總體參數(shù)的最大絕對(duì)誤差范圍來(lái)表達(dá)。統(tǒng)計(jì)上稱這一誤差范圍抽樣極限誤差或抽樣允許誤差。12/12/202233四、抽樣極限誤差抽樣平均誤差只是衡量誤差可能范圍的一種尺度。設(shè)和分別表示樣本平均數(shù)和樣本成數(shù)的抽樣極限誤差,則有:上式表明,抽樣平均數(shù)或抽樣成數(shù)在或之間變動(dòng)。將上面絕對(duì)值不等式展開可得:不等式表明,樣本平均數(shù)是以總體平均數(shù)μ為中心,在之間變動(dòng)的;樣本成數(shù)是以總體成數(shù)為中心,在之間變動(dòng)的。12/12/202234設(shè)和分別表示樣本平均數(shù)和樣本成數(shù)抽樣誤差范圍是以或?yàn)橹行牡膬蓚€(gè)的距離。這是抽樣極限誤差的原意。但由于總體參數(shù)是未知的常數(shù),而樣本估計(jì)值是可以通過(guò)調(diào)查求得的,因此,可以把上面的兩個(gè)不等式改寫成等價(jià)的另一種形式,即:可見,抽樣極限誤差的實(shí)際意義就是希望總體平均數(shù)落在抽樣平均數(shù)的范圍之內(nèi);總體成數(shù)落在抽樣成數(shù)的范圍之內(nèi),這個(gè)范圍也稱為置信區(qū)間。12/12/202235抽樣誤差范圍是以或?yàn)橹行牡膬蓚€(gè)的距離。對(duì)于一個(gè)總體來(lái)說(shuō),當(dāng)抽樣方式以及樣本的單位數(shù)確定后,抽樣誤差就是個(gè)確定的值,而抽樣極限誤差則是根據(jù)不同情況和精確程度,由人們來(lái)確定其大小的。因此,抽樣極限誤差常常以抽樣平均誤差(或)為單位來(lái)衡量,并且把抽樣極限誤差(或)除以抽樣平均誤差(或)所得的數(shù)值叫做概率度。若以z表示概率度,則有:若事先確定概率度z的大小,則可以得到抽樣極限誤差為:12/12/202236對(duì)于一個(gè)總體來(lái)說(shuō),當(dāng)抽樣方式以及樣本的單位數(shù)確定后,抽樣誤差五、抽樣估計(jì)的可靠程度(置信度)由于抽樣平均數(shù)是一個(gè)隨機(jī)變量,由中心極限定理可知:n當(dāng)充分大時(shí),就服從正態(tài)分布,從而服從標(biāo)準(zhǔn)正態(tài)分布。這樣我們就可以在確定的誤差范圍下,求出相應(yīng)的概率大小,而抽樣極限誤差的大小又可確定相應(yīng)概率度的大小,這樣如先確定概率度為z,則可求得相應(yīng)的概率(置信度)為:12/12/202237五、抽樣估計(jì)的可靠程度(置信度)由于抽樣平均數(shù)是一個(gè)隨機(jī)變量上式就是抽樣平均數(shù)落在之間的概率,如總體平均數(shù)未知,則上式也可以看作是落在之間的概率。上述的積分值要查正態(tài)分布概率表求得?,F(xiàn)將常用的概率度z與相應(yīng)的概率的幾個(gè)數(shù)值對(duì)應(yīng)列表如下:概率度z11.651.9622.583概率F(z)0.68270.90000.95000.95450.990.9973可以看出:當(dāng)確定的抽樣極限誤差愈大,則概率度z也就愈大,相應(yīng)的概率也愈大,即樣本指標(biāo)落在指定范圍的可能性也愈大;反之,則相應(yīng)的概率就減少。12/12/202238上式就是抽樣平均數(shù)落在之間的概率,如總說(shuō)明:對(duì)總體指標(biāo)估計(jì)的范圍(置信區(qū)間)的測(cè)定總是在一定的概率保證程度下進(jìn)行的,因?yàn)榧热怀闃诱`差是一個(gè)隨機(jī)變量,就不能指望抽樣指標(biāo)落在置信區(qū)間內(nèi)成為必然事件,只能視為一個(gè)可能事件,就要用一定的概率來(lái)給予保證。抽樣誤差的可能范圍是估計(jì)的準(zhǔn)確性問(wèn)題,所以抽樣估計(jì)可靠程度又稱置信度(概率)。置信度是總體指標(biāo)落在某個(gè)區(qū)間的概率把握程度。12/12/202239說(shuō)明:對(duì)總體指標(biāo)估計(jì)的范圍(置信區(qū)間)的測(cè)定總是在一定的概率六、抽樣估計(jì)方法(總體參數(shù)估計(jì))(一)點(diǎn)估計(jì)1、點(diǎn)估計(jì),也稱定值估計(jì),就是以樣本估計(jì)量直接代替總體參數(shù)的一種推斷方法。當(dāng)已知一個(gè)樣本的觀察值時(shí),便可得到總體參數(shù)的一個(gè)估計(jì)值。如在某校學(xué)生體重的調(diào)查中,獲知抽取的400名學(xué)生的平均體重為58公斤,則我們說(shuō)該校8000名學(xué)生的平均體重也是58公斤。這種推斷就是對(duì)總體平均數(shù)作了點(diǎn)估計(jì)。12/12/202240六、抽樣估計(jì)方法(總體參數(shù)估計(jì))(一)點(diǎn)估計(jì)12/10/20點(diǎn)估計(jì)的優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,可以作為行動(dòng)決策的數(shù)量依據(jù)。2、點(diǎn)估計(jì)常用的方法有兩種:矩估計(jì)法和極大似然估計(jì)法。矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家K·Pearson提出的。其基本思想是:由于樣本來(lái)源于總體,樣本矩在一定程度上反映了總體矩,而且由大數(shù)定律可知,樣本矩依概率收斂于總體矩。矩估計(jì)法簡(jiǎn)單、直觀,而且不必知道總體的分布類型,所以矩估計(jì)法得到了廣泛應(yīng)用。12/12/202241點(diǎn)估計(jì)的優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,可以作為行動(dòng)決策極大似然估計(jì)法是由Fisher,提出參數(shù)估計(jì)方法。其基本思想是:設(shè)總體分布的函數(shù)形式已知,但有未知參數(shù),可以取很多值,在的一切可能取值中選一個(gè)使樣本觀察值出現(xiàn)的概率為最大的值作為的估計(jì)值,記作,稱為的極大似然估計(jì)值,這種求估計(jì)量方法稱為極大似然估計(jì)法。3、點(diǎn)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)(1)無(wú)偏性如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)的值,該樣本統(tǒng)計(jì)量稱作總體參數(shù)的無(wú)偏估計(jì)量。也就是說(shuō):12/12/202242極大似然估計(jì)法是由Fisher,提出參數(shù)估計(jì)方法。12/10(2)一致性:一致性要求用樣本估計(jì)量估計(jì)和推斷總體參數(shù)時(shí)要達(dá)到:樣本容量n充分大時(shí),樣本估計(jì)量充分靠近總體參數(shù),即隨著n的無(wú)限增大,樣本估計(jì)量與未知的總體參數(shù)之間的絕對(duì)離差小于任意給定的正數(shù)的可能性趨近于1的概率,即幾乎是一定發(fā)生的。根據(jù)概率論中的大數(shù)定律可知:對(duì)于任意給定的正數(shù)有:12/12/202243(2)一致性:12/10/202243(3)有效性有效性要求樣本估計(jì)量估計(jì)和推斷總體參數(shù)時(shí),作為估計(jì)量的標(biāo)準(zhǔn)差比其它估計(jì)量的標(biāo)準(zhǔn)差小。即:設(shè)是參數(shù)的兩個(gè)無(wú)偏估計(jì)量,若的方差比的方差小,則稱比有效。12/12/202244(3)有效性設(shè)是參數(shù)4.幾種總體參數(shù)的點(diǎn)估計(jì)量(1)總體平均數(shù)的點(diǎn)估計(jì)量
(2)總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)量(3)總體成數(shù)和點(diǎn)估計(jì)量12/12/2022454.幾種總體參數(shù)的點(diǎn)估計(jì)量12/10/202245(二)區(qū)間估計(jì)總體參數(shù)的區(qū)間估計(jì)就是依照一定的概率保證程度,用樣本估計(jì)值估計(jì)總體參數(shù)取值范圍的方法。設(shè)總體參數(shù)為,、是由樣本確定的兩個(gè)統(tǒng)計(jì)量,對(duì)于給定的(),有:=1-則稱(、)為參數(shù)的置信度為1-的置信區(qū)間。該區(qū)間的兩個(gè)端點(diǎn)、分別稱為置信下限和置信上限。置信區(qū)間的直觀意義:若作為多次同樣的抽樣,將得到多個(gè)置信區(qū)間,其中有的區(qū)間包含了總體參數(shù)的真值,有的區(qū)間沒有包含總體參數(shù)的真值。12/12/202246(二)區(qū)間估計(jì)總體參數(shù)的區(qū)間估計(jì)就是依照一定的概率保證程度,1-為置信度,亦稱為置信水平或置信概率,置信度表達(dá)了參數(shù)區(qū)間估計(jì)的可靠性。置信區(qū)間越小,說(shuō)明估計(jì)的精確性越高;置信度越大,估計(jì)可靠性就越大。一般說(shuō)來(lái),在樣本容量一定的前提下,精確度與置信度往往是相互矛盾的:若置信度增加,則區(qū)間必然增大,降低了精確度;若精確度提高,則區(qū)間縮小,置信度必然減小。要同時(shí)提高估計(jì)的置信度和精確度,就要增加樣本容量。區(qū)間估計(jì)必須同時(shí)具備三個(gè)要素,即具備估計(jì)值、抽樣極限誤差和概率保證程度三個(gè)基本要素。12/12/2022471-為置信度,亦稱為置信水平或置信概率,置信度表達(dá)了參【例】某公司有職工3000人,從中隨機(jī)抽取60人調(diào)查其工資收入情況。調(diào)查結(jié)果表明,職工的月平均工資為2350元,標(biāo)準(zhǔn)差為193元,月收入在2000元及以上職工40人。試以95.45%的置信水平推斷:(1)該公司職工月平均工資所在的范圍;(2)月收入在2000元及以上職工在全部職工中所占的比重。12/12/202248【例】某公司有職工3000人,從中隨機(jī)抽取60人調(diào)查其工資收解(1)依題意計(jì)算如下:
∵F(z)=95.45%,∴查表得z=2計(jì)算結(jié)果表明,有95.45%的把握說(shuō)該公司職工月平均工資在2300.66到2399.34元之間。12/12/202249解(1)依題意計(jì)算如下:∵F(z)=95.45%,∴查表得(2)月收入在2000元及以上職工在全部職工中所占的比重為:
計(jì)算結(jié)果表明,有95.45%的把握說(shuō)該公司月收入在2000元及以上職工占全部職工的比重在54.63%到78.71%之間。12/12/202250(2)月收入在2000元及以上職工在全部職工中所占的比重為:區(qū)間估計(jì)的基本步驟:第一步:根據(jù)樣本資料,計(jì)算出樣本平均數(shù)或樣本成數(shù)、標(biāo)準(zhǔn)差等;第二步:計(jì)算抽樣平均誤差;第三步:根據(jù)給定的概率(置信度)要求,查正態(tài)分布概率表得到相應(yīng)的臨界值;第四步:計(jì)算抽樣限誤差;第五步:給出估計(jì)區(qū)間(置信區(qū)間)。12/12/202251區(qū)間估計(jì)的基本步驟:12/10/202251七、樣本容量的確定(一)影響必要樣本容量的因素1.總體各單位標(biāo)志變異程度的大小??傮w標(biāo)志變異程度越大,要求樣本容量要大些;反之則相反。2.抽樣極限誤差的大小。抽樣極限誤差越大,要求樣本容量越小;反之則相反。3.抽樣方法。在其他條件相同時(shí),重復(fù)抽樣比不重復(fù)抽樣要求樣本容量大些。4.抽樣的組織方式。5.抽樣推斷的概率保證程度的大小。概率越大,要求樣本容量越大;反之則相反。12/12/202252七、樣本容量的確定(一)影響必要樣本容量的因素12/10/2(二)平均數(shù)的必要樣本容量1.重復(fù)抽樣由公式可得:
2.不重復(fù)抽樣由公式可得:12/12/202253(二)平均數(shù)的必要樣本容量由公式可得:2.不重復(fù)抽樣由【例】某批發(fā)站欲估算零售商販的平均每次進(jìn)貨額,根據(jù)歷史資料進(jìn)貨額的標(biāo)準(zhǔn)差為1000元,假定到批發(fā)站進(jìn)貨的商販有2000人,若要求置信水平為99.73%,抽樣極限誤差不超過(guò)250元,應(yīng)該抽取多大的樣本?解:這里沒有說(shuō)明采用的抽樣方法,可按上述兩個(gè)公式分別計(jì)算其必要樣本容量,∵F(z)=99.73.%,∴z=3重復(fù)抽樣條件下的必要樣本容量:不重復(fù)抽樣條件下的必要樣本容量:12/12/202254【例】某批發(fā)站欲估算零售商販的平均每次進(jìn)貨額,根據(jù)歷史資料進(jìn)(三)成數(shù)的必要樣本容量1.重復(fù)抽樣由公式可得:2.不重復(fù)抽樣由公式可得:12/12/202255(三)成數(shù)的必要樣本容量由公式可得:2.不重復(fù)抽樣由公【例】某社區(qū)想通過(guò)抽樣調(diào)查了解居民參加體育活動(dòng)的比率,如果把誤差范圍設(shè)定在5%,問(wèn)如果以95%的置信度進(jìn)行參數(shù)估計(jì),需要多大的樣本?解:∵F(z)=95%,∴z=1.96根據(jù)公式得:=384.16≈385(人)注意:題目中為什么用0.5來(lái)替代p?p(1-p)在p=0.5時(shí)取得極大值,證明很容易,當(dāng)p未知時(shí),就可以用0.5來(lái)替代。12/12/202256【例】某社區(qū)想通過(guò)抽樣調(diào)查了解居民參加體育活動(dòng)的比率,如果把第四節(jié)抽樣調(diào)查的組織方式一、簡(jiǎn)單隨機(jī)抽樣二、分層抽樣三、等距抽樣四、整群抽樣五、多階段抽樣六、非概率抽樣12/12/202257第四節(jié)抽樣調(diào)查的組織方式一、簡(jiǎn)單隨機(jī)抽樣12/10/202一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又叫純隨機(jī)抽樣,是最簡(jiǎn)單、最普遍的抽樣組織方法。它是按照隨機(jī)性原則直接從總體的全部單位中,抽取若干個(gè)單位作為樣本單位,保證總體中每個(gè)單位在抽選中都有同等被抽中的機(jī)會(huì)。簡(jiǎn)單隨機(jī)抽樣在理論上是最符合隨機(jī)抽樣原則的。前面我們所討論的有關(guān)抽樣誤差的計(jì)算公式都是在簡(jiǎn)單隨機(jī)抽樣條件下得到的。隨機(jī)抽選樣本單位的具體做法有如下三種:12/12/202258一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又叫純隨機(jī)抽樣,是最簡(jiǎn)單、最普遍1.抽簽法2.隨機(jī)數(shù)字表法隨機(jī)數(shù)字表,是由0到9這十個(gè)數(shù)碼隨機(jī)排列組成的多位數(shù)字表。在使用前,先將總體的全部單位編號(hào),并根據(jù)編號(hào)的位數(shù)確定使用表中數(shù)字的列數(shù);然后,從任意一行、任意一列、任意方向開始數(shù),遇到編號(hào)范圍內(nèi)的數(shù)字就作為樣本單位,超過(guò)編號(hào)范圍內(nèi)的數(shù)字就跳過(guò)去,直到抽夠樣本單位數(shù)目為止。3.計(jì)算機(jī)軟件中的隨機(jī)函數(shù)產(chǎn)生隨機(jī)數(shù)的功能12/12/2022591.抽簽法12/10/202259二、分層抽樣1、概念:分層抽樣也稱為分層隨機(jī)抽樣,或類型抽樣。它是把調(diào)查總體按其屬性不同分為若干層次(或類型),然后在各層(或類型)中隨機(jī)抽取樣本。2、樣本單位的抽取先分層(分類),確定每一層中抽取的單位數(shù);然后在每一層中按隨機(jī)原則抽取樣本單位。例:12/12/202260二、分層抽樣1、概念:分層抽樣也稱為分層隨機(jī)抽樣,或類型抽樣[例]某在有居民20,000戶,從中抽選200戶家庭進(jìn)行購(gòu)買力調(diào)查。其中高收入戶居民家庭為4000戶,中收入戶家庭為12000戶,低收入戶家庭4000戶。試用分層比例抽樣法確定各層的樣本數(shù)目。各層應(yīng)抽取的樣本數(shù)目是:12/12/202261[例]某在有居民20,000戶,從中抽選200戶家庭進(jìn)行購(gòu)確定了高、中、低收入戶各層樣本數(shù)目后,再按單純隨機(jī)抽樣從各層中分別抽取40戶、120戶、40戶家庭進(jìn)行購(gòu)買力調(diào)查,最后匯總推斷出總體的購(gòu)買力的數(shù)值。3、抽樣平均誤差的計(jì)算重復(fù)抽樣誤差公式為:不重復(fù)抽樣誤差公式為:其中:(各層方差的平均數(shù))12/12/202262確定了高、中、低收入戶各層樣本數(shù)目后,再按單純隨機(jī)抽樣從各【例】某地有10000名勞動(dòng)力,其中:從事農(nóng)業(yè)勞動(dòng)的有7000人,從事工業(yè)勞動(dòng)的有3000人,現(xiàn)按兩類人數(shù)的比例抽取100人,計(jì)算各相關(guān)指標(biāo)如表6.2,請(qǐng)以95%的置信水平推斷該地人均收入的區(qū)間。各組平均收入與標(biāo)準(zhǔn)差全部人數(shù)抽樣人數(shù)樣本平均數(shù)樣本標(biāo)準(zhǔn)差類型從事農(nóng)業(yè)70007075025從事工業(yè)300030100030解:由于該例題中抽樣總體僅占全及總體的1%,故可采用重復(fù)抽樣公式來(lái)計(jì)算。具體計(jì)算如下:12/12/202263【例】某地有10000名勞動(dòng)力,其中:從事農(nóng)業(yè)勞動(dòng)的有700∵F(z)=95%,∴z=1.96故有95%的把握說(shuō),該地人均收入在819.81元到830.19元之間。12/12/202264∵F(z)=95%,∴z=1.96故有95%的把握說(shuō),三、等距抽樣等距抽樣也稱為等距離隨機(jī)抽樣或系統(tǒng)抽樣,它是先將總體中各單位按一定標(biāo)志順序排列,并根據(jù)總體單位數(shù)和樣本單位數(shù)計(jì)算出抽樣距離,然后按相同的距離或間隔抽選樣本單位。排列順序可用與調(diào)查項(xiàng)目有關(guān)的標(biāo)志為依據(jù),如在購(gòu)買力調(diào)查中,按收入多少由低至高排列,也可用與調(diào)查項(xiàng)目無(wú)關(guān)的標(biāo)志為依據(jù),如按戶口冊(cè)、姓名筆劃等排列。12/12/202265三、等距抽樣等距抽樣也稱為等距離隨機(jī)抽樣或系統(tǒng)抽樣,它是先將抽樣間隔計(jì)算公式為:例:某市有零售商店420戶,現(xiàn)要從中抽取10戶商店調(diào)查今年洗衣粉需求量。用等距離抽樣法產(chǎn)生樣本單位數(shù)。其具體步驟如下:①將調(diào)查總體420戶零售商店進(jìn)行編號(hào),從1號(hào)編到420號(hào)。②計(jì)算抽樣間隔。12/12/202266抽樣間隔計(jì)算公式為:例:某市有零售商店420戶,現(xiàn)要從中抽取③在第一個(gè)抽樣間隔內(nèi),隨機(jī)產(chǎn)生第一個(gè)樣本的號(hào)碼,即在1~42間,隨機(jī)選一個(gè)數(shù)字,假如20,它就是第一個(gè)樣本單位的號(hào)碼。④按抽樣間隔,抽取所有的樣本單位,即每隔42產(chǎn)生一個(gè)樣本單位,它們依次為:20,62,104,146,188,230,272,314,356,398。上述編號(hào)的零售商店,就是抽樣調(diào)查的樣本單位。采取等距離抽樣法抽出的樣本,能夠使樣本均衡地分散在總體的各單位中,不會(huì)過(guò)分集中于某些單位,從而有利于增強(qiáng)樣本的代表性,并且抽樣的方法簡(jiǎn)例易行。12/12/202267③在第一個(gè)抽樣間隔內(nèi),隨機(jī)產(chǎn)生第一個(gè)樣本的號(hào)碼,即在1~42四、整群抽樣整群抽樣也稱為整群隨機(jī)抽樣,它是將調(diào)查總體中的所有單位劃分為若干群體,然后用簡(jiǎn)單隨機(jī)抽樣方式選出若干群體作為樣本,對(duì)抽中的群內(nèi)所有單位都進(jìn)行調(diào)查。整群抽樣與前面三種抽樣組織方法相比,是抽樣單位擴(kuò)大了,即抽取的基本單位不再是總體單位而是群(組)。把整群抽樣與簡(jiǎn)單隨機(jī)抽樣相比較,把群看作總體單位,則整群抽樣就成了簡(jiǎn)單隨機(jī)抽樣,故整群抽樣的誤差公式可以通過(guò)簡(jiǎn)單隨機(jī)抽樣的誤差公式導(dǎo)出。12/12/202268四、整群抽樣整群抽樣也稱為整群隨機(jī)抽樣,它是將調(diào)查總體中的所把一個(gè)總體分成個(gè)群,然后在個(gè)群中隨機(jī)抽取個(gè)群,設(shè)群間方差為,由于整群抽樣都是采用不重復(fù)抽樣的方法,故抽樣平均誤差公式為:整群抽樣的最大優(yōu)點(diǎn)是實(shí)施方便,從而節(jié)省了大量調(diào)查費(fèi)用。但整群抽樣的單位比較集中,影響了抽樣單位在全及總體中分布的均勻性,因而抽樣誤差比簡(jiǎn)單隨機(jī)抽樣來(lái)得大。
12/12/202269把一個(gè)總體分成個(gè)群,然后在個(gè)群中隨機(jī)抽取個(gè)群,設(shè)群間方差為,【例】某連續(xù)生產(chǎn)企業(yè)為掌握某月份某種產(chǎn)品的一等品率,確定抽出5%的產(chǎn)品,即在全月連續(xù)生產(chǎn)的720小時(shí)中,每隔20小時(shí)抽取1小時(shí)的全部產(chǎn)品進(jìn)行調(diào)查。調(diào)查結(jié)果一等品率為80%,群間方差為7%,請(qǐng)以95.45%的置信度對(duì)一等品率進(jìn)行區(qū)間推斷。解:∵F(z)=95.45%,∴z=212/12/202270【例】某連續(xù)生產(chǎn)企業(yè)為掌握某月份某種產(chǎn)品的一等品率,確定抽出五、分階段抽樣當(dāng)總體很大時(shí),抽樣調(diào)查直接抽取總體單位,在技術(shù)上有很大困難,則將總體分成若干階段,在每一階段中實(shí)行隨機(jī)抽樣則會(huì)簡(jiǎn)單得多。多階段抽樣就是在抽樣調(diào)查抽選樣本時(shí)并不是一次直接從總體中抽取,而是分兩個(gè)或兩個(gè)以上的階段來(lái)進(jìn)行。12/12/202271五、分階段抽樣當(dāng)總體很大時(shí),抽樣調(diào)查直接抽取總體單位,在技術(shù)例:調(diào)查某省糧食產(chǎn)量時(shí),可以按行政區(qū)域劃分層次,以省為總體。步驟為:①?gòu)娜∷锌h級(jí)單位中,抽取部分縣作為第一階段抽取的樣本;②從被抽中縣的所有鄉(xiāng)或村中,抽取部分鄉(xiāng)或村作為第二階段抽取的樣本;③從被抽中鄉(xiāng)或村的所有農(nóng)戶中,抽取部分農(nóng)戶作為第三階段抽取的樣本;④從被抽中農(nóng)戶的所有播種面積中抽取部分地塊,進(jìn)行實(shí)割實(shí)測(cè)的調(diào)查,作為最基層階段的樣本,計(jì)算其樣本平均畝產(chǎn)量,并推算總產(chǎn)量。12/12/202272例:調(diào)查某省糧食產(chǎn)量時(shí),可以按行政區(qū)域劃分層次,以省為總體。多階段抽樣所劃分的抽樣階段數(shù)不宜過(guò)多,一般以劃分兩、三個(gè)階段,至多四個(gè)階段為宜。多階段抽樣實(shí)施條件:1、當(dāng)抽樣調(diào)查的面很廣,沒有一個(gè)包括所有總體單位的抽樣框,或者總體范圍太大無(wú)法直接抽取樣本時(shí),需要采用多階段抽樣。2、可以相對(duì)地節(jié)約人力和物力。3、可以利用現(xiàn)成的行政區(qū)劃、組織系統(tǒng)作為劃分各階段的依據(jù),為抽樣調(diào)查提供方便。12/12/202273多階段抽樣所劃分的抽樣階段數(shù)不宜過(guò)多,一般以劃分兩、三個(gè)階段六、非概率抽樣上述隨機(jī)抽樣方式的優(yōu)點(diǎn):第一,樣本具有客觀性;第二,能夠測(cè)定抽樣誤差指標(biāo)并能對(duì)其大小加以控制。缺點(diǎn):第一,沒有抽樣框就無(wú)法進(jìn)行抽樣;第二,實(shí)施隨機(jī)原則,對(duì)操作過(guò)程要求嚴(yán)格,費(fèi)時(shí)費(fèi)力。在實(shí)際工作中,有時(shí)采用非概率抽樣方式進(jìn)行抽樣。12/12/202274六、非概率抽樣上述隨機(jī)抽樣方式的優(yōu)點(diǎn):12/10/20227非概率抽樣方式的優(yōu)點(diǎn):操作方便,省時(shí)省力,若使用得當(dāng),抽樣調(diào)查同樣能獲得成功。缺點(diǎn):非隨機(jī)抽樣無(wú)法判斷其誤差,檢查調(diào)查結(jié)果的準(zhǔn)確性。非概率抽樣方式的主要形式有四種:非概率抽樣是指不按隨機(jī)原則,而是根據(jù)調(diào)查人員主觀判斷抽取樣本的抽樣方式。12/12/202275非概率抽樣方式的優(yōu)點(diǎn):操作方便,省時(shí)省力,若使用得當(dāng),抽樣調(diào)(一)方便抽樣方便抽樣也稱為任意抽樣或便利抽樣,是指調(diào)查人員根據(jù)自己的方便去選擇樣本的抽樣方式。理論依據(jù)是,認(rèn)為被調(diào)查總體的每個(gè)單位都是相同的,因此把誰(shuí)選為樣本進(jìn)行調(diào)查,其調(diào)查結(jié)果都是一樣的。只有在調(diào)查總體中各個(gè)單位大致相同的情況下,才適宜應(yīng)用任意抽樣法。任意抽樣法多用于市場(chǎng)初步調(diào)查或?qū)φ{(diào)查情況不甚明了時(shí)采用。12/12/202276(一)方便抽樣方便抽樣也稱為任意抽樣或便利抽樣,是指調(diào)查人員(二)判斷抽樣判斷抽樣是指根據(jù)調(diào)查人員的主觀經(jīng)驗(yàn)來(lái)選定樣本的抽樣方式。判斷抽樣法具有簡(jiǎn)便易行,符合調(diào)查目的和特殊需要,可以充分利用調(diào)查樣本的已知資料,被調(diào)查者配合較好,資料回收率高等優(yōu)點(diǎn)。但是,易發(fā)生主觀判斷失誤而產(chǎn)生的抽樣偏差。要發(fā)揮判斷抽樣法的積極作用,對(duì)總體的基本特征必須相當(dāng)清楚,才可能使所選定的樣本具有代表性、典型性。12/12/202277(二)判斷抽樣判斷抽樣是指根據(jù)調(diào)查人員的主觀經(jīng)驗(yàn)來(lái)選定樣本的(三)配額抽樣配額抽樣,也叫定額抽樣。它是指調(diào)查人員將調(diào)查總體按一定標(biāo)志分類或分層,確定各類(層)單位的樣本數(shù)額,在配額內(nèi)任意抽選樣本的抽樣方式。配額抽樣和分層隨機(jī)抽樣相似之處,都是事先對(duì)總體中所有單位按其屬性、特征分類。它與分層抽樣區(qū)別是,分層抽樣是按隨機(jī)原則在層內(nèi)抽選樣本,而配額抽樣則是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。12/12/202278(三)配額抽樣配額抽樣,也叫定額抽樣。它是指調(diào)查人員將調(diào)查總(四)推薦抽樣也稱為滾雪球抽樣,主要用于對(duì)某些特殊群體的調(diào)查。調(diào)查人員對(duì)這些群體的成員不全部了解或熟悉,難以實(shí)施抽樣。這時(shí)可以先找到其中的部分人員,再請(qǐng)這些人員進(jìn)行推薦,找到另外的符合條件的被調(diào)查者。這樣通過(guò)不斷的推薦,就能得到符合調(diào)查目的需要的調(diào)查單位數(shù)目。類似于滾雪球,越滾越大。12/12/202279(四)推薦抽樣也稱為滾雪球抽樣,主要用于對(duì)某些特殊群體的調(diào)查本章小結(jié):一、抽樣調(diào)查概述二抽樣調(diào)查的數(shù)理基礎(chǔ)三抽樣誤差與抽樣估計(jì)四抽樣調(diào)查的組織方式12/12/202280本章小結(jié):一、抽樣調(diào)查概述12/10/202280謝謝12月-2214:13:2114:1314:1312月-2212月-2214:1314:1314:13:2112月-2212月-2214:13:212022/12/1214:13:21謝謝12月-2202:08:4002:0802:0812《統(tǒng)計(jì)學(xué)》鹽城師范學(xué)院商學(xué)院第五章抽樣調(diào)查12/12/202282《統(tǒng)計(jì)學(xué)》鹽城師范學(xué)院商學(xué)院第五章抽樣調(diào)查12/10/本章內(nèi)容第一節(jié)抽樣調(diào)查概述第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)第三節(jié)抽樣誤差與抽樣估計(jì)第四節(jié)抽樣調(diào)查的組織方式12/12/202283本章內(nèi)容第一節(jié)抽樣調(diào)查概述12/10/20222第一節(jié)抽樣調(diào)查概述一、抽樣調(diào)查的概念、特點(diǎn)及作用二、抽樣調(diào)查中的基本概念三、抽樣方法四、抽樣調(diào)查的設(shè)計(jì)12/12/202284第一節(jié)抽樣調(diào)查概述一、抽樣調(diào)查的概念、特點(diǎn)及作用12/1一、抽樣調(diào)查的概念、特點(diǎn)及作用(一)抽樣調(diào)查的概念抽樣調(diào)查是按照隨機(jī)原則從總體中抽取樣本進(jìn)行調(diào)查,得到樣本資料,并根據(jù)樣本資料對(duì)總體數(shù)量特征作出具有一定可靠程度的估計(jì)和推斷,以達(dá)到認(rèn)識(shí)總體的一種統(tǒng)計(jì)方法。也稱為抽樣推斷、抽樣估計(jì)或統(tǒng)計(jì)推斷。
例:某地進(jìn)行水質(zhì)監(jiān)測(cè),考察河水中某種污染物質(zhì)是否超標(biāo)。從河水中按照一定地點(diǎn)定時(shí)取樣檢驗(yàn),根據(jù)檢驗(yàn)結(jié)果推斷河水中污染物是否超標(biāo)。
12/12/202285一、抽樣調(diào)查的概念、特點(diǎn)及作用(一)抽樣調(diào)查的概念例:某地進(jìn)推斷總體指標(biāo)(參數(shù))樣本指標(biāo)(統(tǒng)計(jì)量)(紅色表示樣本)12/12/202286推斷總體指標(biāo)(參數(shù))樣本指標(biāo)(統(tǒng)計(jì)量)(紅色表示樣本)12/(二)抽樣調(diào)查的特點(diǎn)1、與其它調(diào)查方法相比,省時(shí)、省力、快捷;2、根據(jù)樣本資料對(duì)總體的數(shù)量特征作出具有一定可靠性的估計(jì)和推斷;3、按照隨機(jī)性(同等可能性)原則從總體中抽取樣本單位;4、可以根據(jù)資料在調(diào)查之前計(jì)算和控制抽樣誤差。12/12/202287(二)抽樣調(diào)查的特點(diǎn)12/10/20226(三)抽樣調(diào)查的作用1、某些現(xiàn)象不可能進(jìn)行全面調(diào)查,但又需要了解全面資料時(shí),就采用抽樣調(diào)查方法。2、某些理論上可以進(jìn)行全面調(diào)查,但實(shí)際上難以達(dá)到的現(xiàn)象,可以采用抽樣調(diào)查。3、可以對(duì)全面調(diào)查的結(jié)果進(jìn)行評(píng)價(jià)和修正。4、抽樣調(diào)查可用于工業(yè)生產(chǎn)過(guò)程中的質(zhì)量控制。5、可以對(duì)某些總體的假設(shè)進(jìn)行檢驗(yàn),來(lái)判斷假設(shè)的真?zhèn)?,為決策提供依據(jù)。12/12/202288(三)抽樣調(diào)查的作用12/10/20227(四)抽樣調(diào)查的兩種類型一類是參數(shù)估計(jì):它是根據(jù)對(duì)樣本進(jìn)行觀測(cè)取得的數(shù)據(jù),然后對(duì)研究對(duì)象整體的數(shù)量特征取值給出估計(jì)方法。另一類是假設(shè)檢驗(yàn):它是根據(jù)對(duì)樣本進(jìn)行觀測(cè)取得的數(shù)據(jù),然后對(duì)研究對(duì)象的數(shù)量規(guī)律性是否具有某種指定特征進(jìn)行檢驗(yàn)。
12/12/202289(四)抽樣調(diào)查的兩種類型12/10/20228例:2005年中國(guó)消費(fèi)者協(xié)會(huì)的主題是“健康·維權(quán)”。假定我們是消費(fèi)者協(xié)會(huì)的檢查人員,治理缺斤少兩的不法行為。對(duì)可口可樂公司的產(chǎn)品進(jìn)行檢查,他們生產(chǎn)的一種瓶裝雪碧,包裝上標(biāo)明其凈含量是500ml,在市場(chǎng)上隨機(jī)抽取了50瓶,測(cè)得到其平均含量為499.5ml,標(biāo)準(zhǔn)差為2.63ml。取得這些數(shù)據(jù)我們可以:一是做一個(gè)估計(jì):該種包裝的雪碧平均含量在498.77-500.23ml之間,然后向消協(xié)寫份報(bào)告;(參數(shù)估計(jì))二是一個(gè)裁決:說(shuō)“可口可樂公司有欺騙消費(fèi)者的行為”的證據(jù)不足。(假設(shè)檢驗(yàn))12/12/202290例:2005年中國(guó)消費(fèi)者協(xié)會(huì)的主題是“健康·維權(quán)”。假定我們(一)全及總體和個(gè)體1、全及總體(總體,母體):它是由具有同一性質(zhì)的許多單位組成的集合體,是指所要認(rèn)識(shí)的對(duì)象。2、個(gè)體(總體單位),組成總體的各個(gè)單位稱為個(gè)體。(二)抽樣總體(樣本,子體)從總體中按照一定的原則和方法抽取出來(lái)的部分個(gè)體組成的結(jié)合體。樣本容量:一個(gè)樣本中包含的個(gè)體(總體單位)數(shù)。n≥30大樣本n<30小樣本二、抽樣調(diào)查中幾個(gè)基本概念12/12/202291(一)全及總體和個(gè)體二、抽樣調(diào)查中幾個(gè)基本概念12/10/2(三)總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)(全及指標(biāo)、參數(shù)):它是根據(jù)總體所有單位的標(biāo)志值或標(biāo)志特征計(jì)算的、反映總體某種屬性的綜合指標(biāo)??傮w指標(biāo)是一個(gè)確定的值。2、樣本指標(biāo)(抽樣指標(biāo)、統(tǒng)計(jì)量):它由樣本各個(gè)單位標(biāo)志值或標(biāo)志特征計(jì)算的綜合指標(biāo)。樣本指標(biāo)是一個(gè)隨機(jī)變量。3、抽樣調(diào)查中常用的指標(biāo)平均數(shù)(均值)、方差或標(biāo)準(zhǔn)差、比例(是非標(biāo)志比重)12/12/202292(三)總體指標(biāo)和樣本指標(biāo)12/10/202211總體和樣本指標(biāo)及符號(hào)對(duì)照表指標(biāo)名稱總體樣本單位數(shù)Nn平均數(shù)或標(biāo)準(zhǔn)差s方差是非標(biāo)志比例(成數(shù))或P、Qp、q12/12/202293總體和樣本指標(biāo)及符號(hào)對(duì)照表指標(biāo)名稱總體樣本單位數(shù)Nn平均數(shù)是非標(biāo)志(交替標(biāo)志)的比重(成數(shù)):是非標(biāo)志的標(biāo)志表現(xiàn)只有“是”與“非”兩種結(jié)果,將其數(shù)量化,通常以1代表具有所研究特征的變量值,以0代表不具有所研究特征的變量值。當(dāng)總體單位數(shù)為N時(shí),假定具有所研究特征變量值的單位數(shù)為,不具有所研究特征變量值的單位數(shù)為,且總體樣本12/12/202294是非標(biāo)志(交替標(biāo)志)的比重(成數(shù)):總體樣本12/10/2是非標(biāo)志的平均數(shù)與標(biāo)準(zhǔn)差計(jì)算是非標(biāo)志X10PQP01-P0-PQ2PP2Q合計(jì)1P—Q2P+P2Q是非標(biāo)志的算術(shù)平均數(shù)為:=p是非標(biāo)志的標(biāo)準(zhǔn)差為:
==12/12/202295是非標(biāo)志的平均數(shù)與標(biāo)準(zhǔn)差計(jì)算是非標(biāo)志1PP1-PQ2P合計(jì)三、抽樣方法1、重復(fù)抽樣(重置抽樣,有放回的抽樣):是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位經(jīng)登錄其有關(guān)標(biāo)志表現(xiàn)后又放回總體中重新參加下一次的抽選。
2、不重復(fù)抽樣(不重置抽樣,無(wú)放回的抽樣):是指從全及總體N個(gè)單位中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的單位登錄其有關(guān)標(biāo)志表現(xiàn)后不再放回總體中參加下一次的抽選。
例例12/12/202296三、抽樣方法1、重復(fù)抽樣(重置抽樣,有放回的抽樣):是指從全3、抽樣框與樣本的可能數(shù)目抽樣框:是指對(duì)可以選擇作為樣本的總體單位列出名冊(cè)或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。它是進(jìn)行概率抽樣的必要條件。樣本的可能數(shù)目:它是指從總體N個(gè)單位中隨機(jī)抽選n個(gè)單位構(gòu)成樣本,結(jié)果有排列組合,一種排列組合便構(gòu)成一個(gè)可能的樣本,排列組合的總數(shù)稱為樣本的可能數(shù)目。如下表:12/12/2022973、抽樣框與樣本的可能數(shù)目12/10/202216抽樣方法重置抽樣不重置抽樣考慮順序不考慮順序12/12/202298抽樣方法重置抽樣不重置抽樣考慮順序不考慮順序12/10/20四、抽樣調(diào)查的設(shè)計(jì)1、界定調(diào)查總體2、選擇收集資料的方式3、選擇抽樣框4、設(shè)計(jì)抽樣技術(shù)5、設(shè)計(jì)樣本和抽取樣本6、評(píng)估樣本12/12/202299四、抽樣調(diào)查的設(shè)計(jì)1、界定調(diào)查總體12/10/202218第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)一、隨機(jī)變量的概率分布二、隨機(jī)變量的數(shù)字特征三、常用的隨機(jī)變量的分布四、大數(shù)定律與中心極限定理五、抽樣分布(本節(jié)內(nèi)容見教材,只需了解結(jié)論)12/12/2022100第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)一、隨機(jī)變量的概率分布12/10/第三節(jié)抽樣誤差與抽樣估計(jì)一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差五、抽樣估計(jì)的可靠程度六、抽樣估計(jì)方法七、樣本容量的確定12/12/2022101第三節(jié)抽樣誤差與抽樣估計(jì)一、抽樣誤差的概念12/10/20一、抽樣誤差的概念1、統(tǒng)計(jì)誤差:調(diào)查得到數(shù)據(jù)資料與實(shí)際情況的差別稱為統(tǒng)計(jì)誤差。統(tǒng)計(jì)誤差=樣本指標(biāo)-總體指標(biāo)2、統(tǒng)計(jì)誤差的種類:12/12/2022102一、抽樣誤差的概念1、統(tǒng)計(jì)誤差:調(diào)查得到數(shù)據(jù)資料與實(shí)際情況的3、抽樣誤差:它是指在抽樣調(diào)查過(guò)程中,在遵守隨機(jī)原則抽樣的條件下,仍然會(huì)產(chǎn)生的樣本指標(biāo)與總體指標(biāo)之間的差別。抽樣誤差既是一種隨機(jī)性誤差,也是一種代表性誤差,它是無(wú)法避免的,但它是可以利用大數(shù)定律計(jì)算出來(lái)的并能夠通過(guò)設(shè)計(jì)抽樣程序控制其大小。12/12/20221033、抽樣誤差:它是指在抽樣調(diào)查過(guò)程中,在遵守隨機(jī)原則抽樣的條二、影響抽樣誤差的因素1、樣本容量的大小;2、總體被研究標(biāo)志的變異程度;3、抽樣方法的選擇;4、抽樣的組織形式。12/12/2022104二、影響抽樣誤差的因素1、樣本容量的大??;12/10/202三、抽樣平均誤差(一)抽樣平均誤差的概念抽樣平均誤差是抽樣平均數(shù)或成數(shù)的標(biāo)準(zhǔn)差。抽樣平均誤差就是說(shuō)明各個(gè)抽樣平均數(shù)或抽樣成數(shù)與總體平均數(shù)或總體成數(shù)之間的平均誤差。抽樣平均誤差是我們用樣本指標(biāo)來(lái)估計(jì)或推斷總體指標(biāo)時(shí),計(jì)算誤差范圍的基礎(chǔ)。12/12/2022105三、抽樣平均誤差(一)抽樣平均誤差的概念12/10/2022抽樣平均誤差的理論計(jì)算公式:式中以分別代表抽樣平均數(shù)或抽樣成數(shù)的平均差,M表示樣本的可能數(shù)目。舉例上述平均誤差公式只能用來(lái)解釋平均誤差的概念,在實(shí)際問(wèn)題中無(wú)法應(yīng)用。因?yàn)椋菏紫?,總體的平均數(shù)或成數(shù)通常未知;其次,也很難給出全部樣本的平均數(shù)或成數(shù)。12/12/2022106抽樣平均誤差的理論計(jì)算公式:式中以抽樣平均誤差的實(shí)際計(jì)算公式1、抽樣平均數(shù)的抽樣平均誤差當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是相互獨(dú)立的,樣本變量x與總體變量X同分布。用數(shù)理統(tǒng)計(jì)知識(shí)證明,得:重復(fù)抽樣抽樣平均誤差公式12/12/2022107抽樣平均誤差的實(shí)際計(jì)算公式重復(fù)抽樣抽樣平均誤差公式12/10當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是不相互獨(dú)立的。用數(shù)理統(tǒng)計(jì)知識(shí)證明,得:不重復(fù)抽樣抽樣平均誤差公式12/12/2022108當(dāng)抽樣方式為重復(fù)抽樣時(shí),樣本標(biāo)志值x1,x2,…xn是不相互不重復(fù)抽樣誤差的近似公式與重復(fù)抽樣誤差公式的區(qū)別是公式中多了一個(gè)。這是一個(gè)修正系數(shù),也稱為校正因子。當(dāng)N很大時(shí),分母上可以不減去1??梢越频谋硎緸椋?2/12/2022109不重復(fù)抽樣誤差的近似公式與重復(fù)抽樣誤差公式的區(qū)別是公式中多了解:在重復(fù)抽樣條件下為:在不重復(fù)抽樣條件下為:【例】從某校8000名學(xué)生中隨機(jī)抽取400人,稱得其平均體重為58公斤,標(biāo)準(zhǔn)差為10公斤,計(jì)算抽樣平均誤差。12/12/2022110解:在重復(fù)抽樣條件下為:【例】從某校8000名學(xué)生中隨機(jī)抽2、抽樣成數(shù)的抽樣平均誤差抽樣成數(shù)的抽樣平均誤差表明各樣本成數(shù)的絕對(duì)離差的平均水平。用于將屬性總體變化為變量總體。
(1)重復(fù)抽樣抽樣平均誤差公式為:或總體資料樣本資料12/12/20221112、抽樣成數(shù)的抽樣平均誤差(1)重復(fù)抽樣抽樣平均誤差公式為:(2)不重復(fù)抽樣抽樣平均誤差公式為:總體資料樣本資料或或一般總體的成數(shù)是未知的,通常是用樣本的成數(shù)p來(lái)代替公式中的總體成數(shù)。12/12/2022112(2)不重復(fù)抽樣抽樣平均誤差公式為:總體資料樣本資料或或一般【例】有一批食品罐頭共60000瓶,從中隨機(jī)抽取300瓶,發(fā)現(xiàn)有6瓶不合格,求合格率的抽樣平均誤差。解:合格率:
在重復(fù)抽樣條件下為:在不重復(fù)抽樣條件下為:12/12/2022113【例】有一批食品罐頭共60000瓶,從中隨機(jī)抽取300瓶,四、抽樣極限誤差抽樣平均誤差只是衡量誤差可能范圍的一種尺度。它并不等同于抽樣指標(biāo)與總體指標(biāo)之間的真實(shí)誤差。由于總體參數(shù)是一個(gè)確定的常數(shù),而樣本估計(jì)量會(huì)隨抽取的樣本不同而圍繞總體參數(shù)上下隨機(jī)取值。因此,樣本統(tǒng)計(jì)量與總體參數(shù)之間存在一個(gè)誤差范圍。所謂抽樣誤差范圍就是指變動(dòng)的樣本統(tǒng)計(jì)量與確定的總體參數(shù)之間離差的可能范圍,它用樣本估計(jì)值與總體參數(shù)的最大絕對(duì)誤差范圍來(lái)表達(dá)。統(tǒng)計(jì)上稱這一誤差范圍抽樣極限誤差或抽樣允許誤差。12/12/2022114四、抽樣極限誤差抽樣平均誤差只是衡量誤差可能范圍的一種尺度。設(shè)和分別表示樣本平均數(shù)和樣本成數(shù)的抽樣極限誤差,則有:上式表明,抽樣平均數(shù)或抽樣成數(shù)在或之間變動(dòng)。將上面絕對(duì)值不等式展開可得:不等式表明,樣本平均數(shù)是以總體平均數(shù)μ為中心,在之間變動(dòng)的;樣本成數(shù)是以總體成數(shù)為中心,在之間變動(dòng)的。12/12/2022115設(shè)和分別表示樣本平均數(shù)和樣本成數(shù)抽樣誤差范圍是以或?yàn)橹行牡膬蓚€(gè)的距離。這是抽樣極限誤差的原意。但由于總體參數(shù)是未知的常數(shù),而樣本估計(jì)值是可以通過(guò)調(diào)查求得的,因此,可以把上面的兩個(gè)不等式改寫成等價(jià)的另一種形式,即:可見,抽樣極限誤差的實(shí)際意義就是希望總體平均數(shù)落在抽樣平均數(shù)的范圍之內(nèi);總體成數(shù)落在抽樣成數(shù)的范圍之內(nèi),這個(gè)范圍也稱為置信區(qū)間。12/12/2022116抽樣誤差范圍是以或?yàn)橹行牡膬蓚€(gè)的距離。對(duì)于一個(gè)總體來(lái)說(shuō),當(dāng)抽樣方式以及樣本的單位數(shù)確定后,抽樣誤差就是個(gè)確定的值,而抽樣極限誤差則是根據(jù)不同情況和精確程度,由人們來(lái)確定其大小的。因此,抽樣極限誤差常常以抽樣平均誤差(或)為單位來(lái)衡量,并且把抽樣極限誤差(或)除以抽樣平均誤差(或)所得的數(shù)值叫做概率度。若以z表示概率度,則有:若事先確定概率度z的大小,則可以得到抽樣極限誤差為:12/12/2022117對(duì)于一個(gè)總體來(lái)說(shuō),當(dāng)抽樣方式以及樣本的單位數(shù)確定后,抽樣誤差五、抽樣估計(jì)的可靠程度(置信度)由于抽樣平均數(shù)是一個(gè)隨機(jī)變量,由中心極限定理可知:n當(dāng)充分大時(shí),就服從正態(tài)分布,從而服從標(biāo)準(zhǔn)正態(tài)分布。這樣我們就可以在確定的誤差范圍下,求出相應(yīng)的概率大小,而抽樣極限誤差的大小又可確定相應(yīng)概率度的大小,這樣如先確定概率度為z,則可求得相應(yīng)的概率(置信度)為:12/12/2022118五、抽樣估計(jì)的可靠程度(置信度)由于抽樣平均數(shù)是一個(gè)隨機(jī)變量上式就是抽樣平均數(shù)落在之間的概率,如總體平均數(shù)未知,則上式也可以看作是落在之間的概率。上述的積分值要查正態(tài)分布概率表求得。現(xiàn)將常用的概率度z與相應(yīng)的概率的幾個(gè)數(shù)值對(duì)應(yīng)列表如下:概率度z11.651.9622.583概率F(z)0.68270.90000.95000.95450.990.9973可以看出:當(dāng)確定的抽樣極限誤差愈大,則概率度z也就愈大,相應(yīng)的概率也愈大,即樣本指標(biāo)落在指定范圍的可能性也愈大;反之,則相應(yīng)的概率就減少。12/12/2022119上式就是抽樣平均數(shù)落在之間的概率,如總說(shuō)明:對(duì)總體指標(biāo)估計(jì)的范圍(置信區(qū)間)的測(cè)定總是在一定的概率保證程度下進(jìn)行的,因?yàn)榧热怀闃诱`差是一個(gè)隨機(jī)變量,就不能指望抽樣指標(biāo)落在置信區(qū)間內(nèi)成為必然事件,只能視為一個(gè)可能事件,就要用一定的概率來(lái)給予保證。抽樣誤差的可能范圍是估計(jì)的準(zhǔn)確性問(wèn)題,所以抽樣估計(jì)可靠程度又稱置信度(概率)。置信度是總體指標(biāo)落在某個(gè)區(qū)間的概率把握程度。12/12/2022120說(shuō)明:對(duì)總體指標(biāo)估計(jì)的范圍(置信區(qū)間)的測(cè)定總是在一定的概率六、抽樣估計(jì)方法(總體參數(shù)估計(jì))(一)點(diǎn)估計(jì)1、點(diǎn)估計(jì),也稱定值估計(jì),就是以樣本估計(jì)量直接代替總體參數(shù)的一種推斷方法。當(dāng)已知一個(gè)樣本的觀察值時(shí),便可得到總體參數(shù)的一個(gè)估計(jì)值。如在某校學(xué)生體重的調(diào)查中,獲知抽取的400名學(xué)生的平均體重為58公斤,則我們說(shuō)該校8000名學(xué)生的平均體重也是58公斤。這種推斷就是對(duì)總體平均數(shù)作了點(diǎn)估計(jì)。12/12/2022121六、抽樣估計(jì)方法(總體參數(shù)估計(jì))(一)點(diǎn)估計(jì)12/10/20點(diǎn)估計(jì)的優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,可以作為行動(dòng)決策的數(shù)量依據(jù)。2、點(diǎn)估計(jì)常用的方法有兩種:矩估計(jì)法和極大似然估計(jì)法。矩估計(jì)法是英國(guó)統(tǒng)計(jì)學(xué)家K·Pearson提出的。其基本思想是:由于樣本來(lái)源于總體,樣本矩在一定程度上反映了總體矩,而且由大數(shù)定律可知,樣本矩依概率收斂于總體矩。矩估計(jì)法簡(jiǎn)單、直觀,而且不必知道總體的分布類型,所以矩估計(jì)法得到了廣泛應(yīng)用。12/12/2022122點(diǎn)估計(jì)的優(yōu)點(diǎn):能夠提供總體參數(shù)的具體估計(jì)值,可以作為行動(dòng)決策極大似然估計(jì)法是由Fisher,提出參數(shù)估計(jì)方法。其基本思想是:設(shè)總體分布的函數(shù)形式已知,但有未知參數(shù),可以取很多值,在的一切可能取值中選一個(gè)使樣本觀察值出現(xiàn)的概率為最大的值作為的估計(jì)值,記作,稱為的極大似然估計(jì)值,這種求估計(jì)量方法稱為極大似然估計(jì)法。3、點(diǎn)估計(jì)量的優(yōu)良標(biāo)準(zhǔn)(1)無(wú)偏性如果樣本統(tǒng)計(jì)量的數(shù)學(xué)期望等于所估計(jì)的總體參數(shù)的值,該樣本統(tǒng)計(jì)量稱作總體參數(shù)的無(wú)偏估計(jì)量。也就是說(shuō):12/12/2022123極大似然估計(jì)法是由Fisher,提出參數(shù)估計(jì)方法。12/10(2)一致性:一致性要求用樣本估計(jì)量估計(jì)和推斷總體參數(shù)時(shí)要達(dá)到:樣本容量n充分大時(shí),樣本估計(jì)量充分靠近總體參數(shù),即隨著n的無(wú)限增大,樣本估計(jì)量與未知的總體參數(shù)之間的絕對(duì)離差小于任意給定的正數(shù)的可能性趨近于1的概率,即幾乎是一定發(fā)生的。根據(jù)概率論中的大數(shù)定律可知:對(duì)于任意給定的正數(shù)有:12/12/2022124(2)一致性:12/10/202243(3)有效性有效性要求樣本估計(jì)量估計(jì)和推斷總體參數(shù)時(shí),作為估計(jì)量的標(biāo)準(zhǔn)差比其它估計(jì)量的標(biāo)準(zhǔn)差小。即:設(shè)是參數(shù)的兩個(gè)無(wú)偏估計(jì)量,若的方差比的方差小,則稱比有效。12/12/2022125(3)有效性設(shè)是參數(shù)4.幾種總體參數(shù)的點(diǎn)估計(jì)量(1)總體平均數(shù)的點(diǎn)估計(jì)量
(2)總體標(biāo)準(zhǔn)差的點(diǎn)估計(jì)量(3)總體成數(shù)和點(diǎn)估計(jì)量12/12/20221264.幾種總體參數(shù)的點(diǎn)估計(jì)量12/10/202245(二)區(qū)間估計(jì)總體參數(shù)的區(qū)間估計(jì)就是依照一定的概率保證程度,用樣本估計(jì)值估計(jì)總體參數(shù)取值范圍的方法。設(shè)總體參數(shù)為,、是由樣本確定的兩個(gè)統(tǒng)計(jì)量,對(duì)于給定的(),有:=1-則稱(、)為參數(shù)的置信度為1-的置信區(qū)間。該區(qū)間的兩個(gè)端點(diǎn)、分別稱為置信下限和置信上限。置信區(qū)間的直觀意義:若作為多次同樣的抽樣,將得到多個(gè)置信區(qū)間,其中有的區(qū)間包含了總體參數(shù)的真值,有的區(qū)間沒有包含總體參數(shù)的真值。12/12/2022127(二)區(qū)間估計(jì)總體參數(shù)的區(qū)間估計(jì)就是依照一定的概率保證程度,1-為置信度,亦稱為置信水平或置信概率,置信度表達(dá)了參數(shù)區(qū)間估計(jì)的可靠性。置信區(qū)間越小,說(shuō)明估計(jì)的精確性越高;置信度越大,估計(jì)可靠性就越大。一般說(shuō)來(lái),在樣本容量一定的前提下,精確度與置信度往往是相互矛盾的:若置信度增加,則區(qū)間必然增大,降低了精確度;若精確度提高,則區(qū)間縮小,置信度必然減小。要同時(shí)提高估計(jì)的置信度和精確度,就要增加樣本容量。區(qū)間估計(jì)必須同時(shí)具備三個(gè)要素,即具備估計(jì)值、抽樣極限誤差和概率保證程度三個(gè)基本要素。12/12/20221281-為置信度,亦稱為置信水平或置信概率,置信度表達(dá)了參【例】某公司有職工3000人,從中隨機(jī)抽取60人調(diào)查其工資收入情況。調(diào)查結(jié)果表明,職工的月平均工資為2350元,標(biāo)準(zhǔn)差為193元,月收入在2000元及以上職工40人。試以95.45%的置信水平推斷:(1)該公司職工月平均工資所在的范圍;(2)月收入在2000元及以上職工在全部職工中所占的比重。12/12/2022129【例】某公司有職工3000人,從中隨機(jī)抽取60人調(diào)查其工資收解(1)依題意計(jì)算如下:
∵F(z)=95.45%,∴查表得z=2計(jì)算結(jié)果表明,有95.45%的把握說(shuō)該公司職工月平均工資在2300.66到2399.34元之間。12/12/2022130解(1)依題意計(jì)算如下:∵F(z)=95.45%,∴查表得(2)月收入在2000元及以上職工在全部職工中所占的比重為:
計(jì)算結(jié)果表明,有95.45%的把握說(shuō)該公司月收入在2000元及以上職工占全部職工的比重在54.63%到78.71%之間。12/12/2022131(2)月收入在2000元及以上職工在全部職工中所占的比重為:區(qū)間估計(jì)的基本步驟:第一步:根據(jù)樣本資料,計(jì)算出樣本平均數(shù)或樣本成數(shù)、標(biāo)準(zhǔn)差等;第二步:計(jì)算抽樣平均誤差;第三步:根據(jù)給定的概率(置信度)要求,查正態(tài)分布概率表得到相應(yīng)的臨界值;第四步:計(jì)算抽樣限誤差;第五步:給出估計(jì)區(qū)間(置信區(qū)間)。12/12/2022132區(qū)間估計(jì)的基本步驟:12/10/202251七、樣本容量的確定(一)影響必要樣本容量的因素1.總體各單位標(biāo)志變異程度的大小??傮w標(biāo)志變異程度越大,要求樣本容量要大些;反之則相反。2.抽樣極限誤差的大小。抽樣極限誤差越大,要求樣本容量越??;反之則相反。3.抽樣方法。在其他條件相同時(shí),重復(fù)抽樣比不重復(fù)抽樣要求樣本容量大些。4.抽樣的組織方式。5.抽樣推斷的概率保證程度的大小。概率越大,要求樣本容量越大;反之則相反。12/12/2022133七、樣本容量的確定(一)影響必要樣本容量的因素12/10/2(二)平均數(shù)的必要樣本容量1.重復(fù)抽樣由公式可得:
2.不重復(fù)抽樣由公式可得:12/12/2022134(二)平均數(shù)的必要樣本容量由公式可得:2.不重復(fù)抽樣由【例】某批發(fā)站欲估算零售商販的平均每次進(jìn)貨額,根據(jù)歷史資料進(jìn)貨額的標(biāo)準(zhǔn)差為1000元,假定到批發(fā)站進(jìn)貨的商販有2000人,若要求置信水平為99.73%,抽樣極限誤差不超過(guò)250元,應(yīng)該抽取多大的樣本?解:這里沒有說(shuō)明采用的抽樣方法,可按上述兩個(gè)公式分別計(jì)算其必要樣本容量,∵F(z)=99.73.%,∴z=3重復(fù)抽樣條件下的必要樣本容量:不重復(fù)抽樣條件下的必要樣本容量:12/12/2022135【例】某批發(fā)站欲估算零售商販的平均每次進(jìn)貨額,根據(jù)歷史資料進(jìn)(三)成數(shù)的必要樣本容量1.重復(fù)抽樣由公式可得:2.不重復(fù)抽樣由公式可得:12/12/2022136(三)成數(shù)的必要樣本容量由公式可得:2.不重復(fù)抽樣由公【例】某社區(qū)想通過(guò)抽樣調(diào)查了解居民參加體育活動(dòng)的比率,如果把誤差范圍設(shè)定在5%,問(wèn)如果以95%的置信度進(jìn)行參數(shù)估計(jì),需要多大的樣本?解:∵F(z)=95%,∴z=1.96根據(jù)公式得:=384.16≈385(人)注意:題目中為什么用0.5來(lái)替代p?p(1-p)在p=0.5時(shí)取得極大值,證明很容易,當(dāng)p未知時(shí),就可以用0.5來(lái)替代。12/12/2022137【例】某社區(qū)想通過(guò)抽樣調(diào)查了解居民參加體育活動(dòng)的比率,如果把第四節(jié)抽樣調(diào)查的組織方式一、簡(jiǎn)單隨機(jī)抽樣二、分層抽樣三、等距抽樣四、整群抽樣五、多階段抽樣六、非概率抽樣12/12/2022138第四節(jié)抽樣調(diào)查的組織方式一、簡(jiǎn)單隨機(jī)抽樣12/10/202一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又叫純隨機(jī)抽樣,是最簡(jiǎn)單、最普遍的抽樣組織方法。它是按照隨機(jī)性原則直接從總體的全部單位中,抽取若干個(gè)單位作為樣本單位,保證總體中每個(gè)單位在抽選中都有同等被抽中的機(jī)會(huì)。簡(jiǎn)單隨機(jī)抽樣在理論上是最符合隨機(jī)抽樣原則的。前面我們所討論的有關(guān)抽樣誤差的計(jì)算公式都是在簡(jiǎn)單隨機(jī)抽樣條件下得到的。隨機(jī)抽選樣本單位的具體做法有如下三種:12/12/2022139一、簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又叫純隨機(jī)抽樣,是最簡(jiǎn)單、最普遍1.抽簽法2.隨機(jī)數(shù)字表法隨機(jī)數(shù)字表,是由0到9這十個(gè)數(shù)碼隨機(jī)排列組成的多位數(shù)字表。在使用前,先將總體的全部單位編號(hào),并根據(jù)編號(hào)的位數(shù)確定使用表中數(shù)字的列數(shù);然后,從任意一行、任意一列、任意方向開始數(shù),遇到編號(hào)范圍內(nèi)的數(shù)字就作為樣本單位,超過(guò)編號(hào)范圍內(nèi)的數(shù)字就跳過(guò)去,直到抽夠樣本單位數(shù)目為止。3.計(jì)算機(jī)軟件中的隨機(jī)函數(shù)產(chǎn)生隨機(jī)數(shù)的功能12/12/20221401.抽簽法12/10/202259二、分層抽樣1、概念:分層抽樣也稱為分層隨機(jī)抽樣,或類型抽樣。它是把調(diào)查總體按其屬性不同分為若干層次(或類型),然后在各層(或類型)中隨機(jī)抽取樣本。2、樣本單位的抽取先分層(分類),確定每一層中抽取的單位數(shù);然后在每一層中按隨機(jī)原則抽取樣本單位。例:12/12/2022141二、分層抽樣1、概念:分層抽樣也稱為分層隨機(jī)抽樣,或類型抽樣[例]某在有居民20,000戶,從中抽選200戶家庭進(jìn)行購(gòu)買力調(diào)查。其中高收入戶居民家庭為4000戶,中收入戶家庭為12000戶,低收入戶家庭4000戶。試用分層比例抽樣法確定各層的樣本數(shù)目。各層應(yīng)抽取的樣本數(shù)目是:12/12/2022142[例]某在有居民20,000戶,從中抽選200戶家庭進(jìn)行購(gòu)確定了高、中、低收入戶各層樣本數(shù)目后,再按單純隨機(jī)抽樣從各層中分別抽取40戶、120戶、40戶家庭進(jìn)行購(gòu)買力調(diào)查,最后匯總推斷出總體的購(gòu)買力的數(shù)值。3、抽樣平均誤差的計(jì)算重復(fù)抽樣誤差公式為:不重復(fù)抽樣誤差公式為:其中:(各層方差的平均數(shù))12/12/2022143確定了高、中、低收入戶各層樣本數(shù)目后,再按單純隨機(jī)抽樣從各【例】某地有10000名勞動(dòng)力,其中:從事農(nóng)業(yè)勞動(dòng)的有7000人,從事工業(yè)勞動(dòng)的有3000人,現(xiàn)按兩類人數(shù)的比例抽取100人,計(jì)算各相關(guān)指標(biāo)如表6.2,請(qǐng)以95%的置信水平推斷該地人均收入的區(qū)間。各組平均收入與標(biāo)準(zhǔn)差全部人數(shù)抽樣人數(shù)樣本平均數(shù)樣本標(biāo)準(zhǔn)差類型從事農(nóng)業(yè)70007075025從事工業(yè)300030100030解:由于該例題中抽樣總體僅占全及總體的1%,故可采用重復(fù)抽樣公式來(lái)計(jì)算。具體計(jì)算如下:12/12/2022144【例】某地有10000名勞動(dòng)力,其中:從事農(nóng)業(yè)勞動(dòng)的有700∵F(z)=95%,∴z=1.96故有95%的把握說(shuō),該地人均收入在819.81元到830.19元之間。12/12/2022145∵F(z)=95%,∴z=1.96故有95%的把握說(shuō),三、等距抽樣等距抽樣也稱為等距離隨機(jī)抽樣或系統(tǒng)抽樣,它是先將總體中各單位按一定標(biāo)志順序排列,并根據(jù)總體單位數(shù)和樣本單位數(shù)計(jì)算出抽樣距離,然后按相同的距離或間隔抽選樣本單位。排列順序可用與調(diào)查項(xiàng)目有關(guān)的標(biāo)志為依據(jù),如在購(gòu)買力調(diào)查中,按收入多少由低至高排列,也可用與調(diào)查項(xiàng)目無(wú)關(guān)的標(biāo)志為依據(jù),如按戶口冊(cè)、姓名筆劃等排列。12/12/2022146三、等距抽樣等距抽樣也稱為等距離隨機(jī)抽樣或系統(tǒng)抽樣,它是先將抽樣間隔計(jì)算公式為:例:某市有零售商店420戶,現(xiàn)要從中抽取10戶商店調(diào)查今年洗衣粉需求量。用等距離抽樣法產(chǎn)生樣本單位數(shù)。其具體步驟如下:①將調(diào)查總體420戶零售商店進(jìn)行編號(hào),從1號(hào)編到420號(hào)。②計(jì)算抽樣間隔。12/12/2022147抽樣間隔計(jì)算公式為:例:某市有零售商店420戶,現(xiàn)要從中抽取③在第一個(gè)抽樣間隔內(nèi),隨機(jī)產(chǎn)生第
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年真空絕熱板芯材項(xiàng)目建議書
- 廚師專業(yè)知識(shí)培訓(xùn)課件
- 安全法制演講稿小學(xué)生
- 個(gè)人防護(hù)知識(shí)培訓(xùn)課件
- 高中語(yǔ)文老師新學(xué)期工作計(jì)劃(5篇)
- 2014年大連市高三雙基測(cè)試化學(xué)試卷參考答案
- DB31∕T 343-2019 汽車快修企業(yè)技術(shù)條件
- 2025年實(shí)驗(yàn)室安全管理課件:實(shí)現(xiàn)安全與效率的雙贏
- 八省聯(lián)考試卷分析(英語(yǔ)西安外國(guó)語(yǔ)附中)
- 女性健康知識(shí)講座超美的課件
- 天津2025年天津市機(jī)關(guān)后勤事務(wù)服務(wù)中心招聘6人筆試歷年參考題庫(kù)附帶答案詳解
- 2025年天津三源電力集團(tuán)限公司社會(huì)招聘33人高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 西安2025年陜西西安音樂學(xué)院專任教師招聘20人筆試歷年參考題庫(kù)附帶答案詳解
- 國(guó)家安全與生態(tài)安全
- 2024-2025學(xué)年第二學(xué)期學(xué)校團(tuán)委工作計(jì)劃(附2月-6月安排表)
- 培養(yǎng)自律能力主題班會(huì)
- 中職高教版(2023)語(yǔ)文職業(yè)模塊-第一單元1.2寧夏閩寧鎮(zhèn):昔日干沙灘今日金沙灘【課件】
- 巴厘島旅游流程介紹
- 【物理】牛頓第一定律 2024-2025學(xué)年人教版物理八年級(jí)下冊(cè)
- 嬰幼兒電擊傷實(shí)踐操作張春芳講解
- 2025網(wǎng)格員考試題庫(kù)及參考答案
評(píng)論
0/150
提交評(píng)論