版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章簡(jiǎn)單隨機(jī)抽樣第二章簡(jiǎn)單隨機(jī)抽樣1第二章簡(jiǎn)單隨機(jī)抽樣2.1概述2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.3比率估計(jì)量及其性質(zhì)2.4回歸估計(jì)量及其性質(zhì)2.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施第二章簡(jiǎn)單隨機(jī)抽樣2.1概述2概述一、簡(jiǎn)單隨機(jī)抽樣(或單純隨機(jī)抽樣)本書一般局限于不放回隨機(jī)抽樣二、實(shí)施方法三、地位、作用是其他抽樣方法基礎(chǔ)概述一、簡(jiǎn)單隨機(jī)抽樣(或單純隨機(jī)抽樣)3案例在1936年美國(guó)總統(tǒng)選舉前,一份頗有名氣的雜志進(jìn)行了民意測(cè)驗(yàn),調(diào)查蘭登與羅斯福誰(shuí)將當(dāng)選下屆總統(tǒng)。為了了解公眾意向,調(diào)查者通過(guò)電話簿和汽車登記簿給大批人發(fā)了調(diào)查表,通過(guò)分析回收的調(diào)查表,顯示蘭登非常受歡迎。因此該雜志預(yù)測(cè)蘭登將獲勝。實(shí)際選舉結(jié)果正好相反,最后羅斯福在選舉中獲勝。其數(shù)據(jù)如下:候選人預(yù)測(cè)結(jié)果(%)選舉結(jié)果(%)Landon5738Roosevelt4362案例候選人預(yù)測(cè)結(jié)果(%)選舉結(jié)果(%)4問(wèn)題一:對(duì)于一個(gè)確定的總體其樣本唯一嗎?問(wèn)題二:如何科學(xué)地抽取樣本?怎樣使抽取的樣本充分地反映總體的情況?
思考合理、公平問(wèn)題一:對(duì)于一個(gè)確定的總體其樣本唯一嗎?思考合理、公平52.1定義與符號(hào)定義2.1從總體的N個(gè)單元中,一次整批抽取n個(gè)單元,使任何一個(gè)單元被抽中的概率都相等,任何n個(gè)不同單元組成的組合被抽中的概率也都相等,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣.定義2.2從總體的N個(gè)單元中,逐個(gè)不放回抽取單元,每次抽取到尚未入樣的任何一個(gè)單元的概率都相等,直到抽足n個(gè)單元為止,這樣所得的n個(gè)單元組成一個(gè)簡(jiǎn)單隨機(jī)樣本.2.1定義與符號(hào)定義2.1從總體的N個(gè)單元中,一次整批抽取6定義2.3按照從總體的N個(gè)單元中抽取n個(gè)單元的所有可能不同組合構(gòu)造所有可能的個(gè)樣本,從中隨機(jī)抽取一個(gè)樣本,使每個(gè)樣本被抽到的概率都等于1/,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣。注意:定義2.1與定義2.3是等價(jià)的。三個(gè)定義之間的聯(lián)系定義2.3按照從總體的N個(gè)單元中抽取n個(gè)單元的所有可能不同7證明不放回?zé)o序:按定義1,每個(gè)樣本被抽中的概率相同,即為。證明:設(shè)被抽中的單元號(hào)碼:1,2,3…n對(duì)應(yīng)的觀察值為:在有序逐個(gè)抽取時(shí),樣本的概率為:在無(wú)序情況下,一個(gè)包含n個(gè)指定單元的樣本,其單元抽取的順序共有種不同的形式,因此抽取到包含這n個(gè)樣本的總概率:證明不放回?zé)o序:按定義1,每個(gè)樣本被抽中的概率相同,即為8抽取原則:A.隨機(jī)原則B.每個(gè)抽樣單元被抽中的概率已知或事先確定C.每個(gè)抽樣單元被抽中的概率相等抽取原則:9注意:(1)它要求被抽取的樣本是有限總體、具體總體、與抽樣框一致的總體;(2)它是從總體中逐個(gè)抽??;(3)它是一種不放回的抽樣;(4)它是一種等概率的抽樣。注意:10
(二)類型:
放回簡(jiǎn)單隨機(jī)抽樣:有序、無(wú)序
不放回簡(jiǎn)單隨機(jī)抽樣:有序、無(wú)序
11放回簡(jiǎn)單隨機(jī)抽樣【例】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本個(gè)數(shù)為:
放回簡(jiǎn)單隨機(jī)抽樣【例】設(shè)總體有5個(gè)單元(1,2,3,4,5)121,12,13,14,15,11,22,23,24,25,21,32,33,35,35,31,42,43,44,45,41,52,53,54,55,5放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本:重復(fù)順序放回有序SRSWR(考慮樣本單元的順序):如1,2和2,1作為不同的樣本。所有可能的樣本個(gè)數(shù):每個(gè)樣本被抽中的概率為。1,12,13,14,15,11,22,23,24,25,213放回?zé)o序(不考慮樣本單元的順序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5放回?zé)o序(不考慮樣本單元的順序):1,12,13,14,1514特點(diǎn):
每次抽樣時(shí),總體的結(jié)構(gòu)不變,抽樣是相互獨(dú)立進(jìn)行的;總體單元有可能多次被抽中的機(jī)會(huì)。
特點(diǎn):15不放回簡(jiǎn)單隨機(jī)抽樣
不放回有序(考慮樣本單元的順序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5不放回簡(jiǎn)單隨機(jī)抽樣
1,12,13,14,15,11,22,16不放回?zé)o序SRSWOR(不考慮樣本單元的順序):每個(gè)樣本被抽中的概率相同,即為1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5不放回?zé)o序SRSWOR(不考慮樣本單元的順序):1,12,117特點(diǎn):總體單元最多只有一次被抽中的機(jī)會(huì),且被抽中的機(jī)會(huì)隨抽選的次數(shù)增多而增多。特點(diǎn):總體單元最多只有一次被抽中的機(jī)會(huì),且被抽中的機(jī)會(huì)隨抽選18放回或不放回簡(jiǎn)單隨機(jī)抽樣的比較由于放回簡(jiǎn)單隨機(jī)抽樣的特點(diǎn),在實(shí)際操作中,人們不太可能心甘情愿地用兩倍以上的費(fèi)用去訪問(wèn)同一個(gè)單元。因此,不放回簡(jiǎn)單隨機(jī)抽樣通常比放回簡(jiǎn)單隨機(jī)抽樣“有效”些,但由于總體單元數(shù)多,而抽中的單元數(shù)相對(duì)較少,有許多事件的概率習(xí)性對(duì)于放回或不放回兩種情況幾乎差不多,因而有時(shí)候我們常從隨機(jī)放回這一最簡(jiǎn)單的形式入手討論問(wèn)題,而將有關(guān)結(jié)果近似地套到隨機(jī)不放回的情況。本書中簡(jiǎn)單隨機(jī)抽樣若不特指,一般都是指不放回抽樣(無(wú)序)。放回或不放回簡(jiǎn)單隨機(jī)抽樣的比較由于放回簡(jiǎn)單隨機(jī)抽樣的特點(diǎn),在19
思考:1.下列抽樣方式是否屬于簡(jiǎn)單隨機(jī)抽樣方式?為什么?(1)從無(wú)限多個(gè)個(gè)體中抽出500個(gè)個(gè)體作為樣本。(2)箱子里共有100個(gè)零件,從中選出10個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)。在抽樣操作中,從中任意取一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后,再把它放回箱子。
202.在簡(jiǎn)單隨機(jī)抽樣中,某一個(gè)個(gè)體被抽中的可能性是()。A.與第n次抽樣無(wú)關(guān),第一次抽中的可能性大些;B.與第n次抽樣無(wú)關(guān),每次抽中的可能性都相等;C.與第n次抽樣無(wú)關(guān),最后一次抽中的可能性大些;D.與第n次抽樣無(wú)關(guān),每次都是等可能抽樣,但每次抽中的可能性不一樣;
答:B2.在簡(jiǎn)單隨機(jī)抽樣中,某一個(gè)個(gè)體被抽中的可能性是()21簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法常用的有抽簽法和隨機(jī)數(shù)法兩種。(一)抽簽法抽簽法是先對(duì)總體N個(gè)抽樣單元分別編上1到N的號(hào)碼,再制作與之相對(duì)應(yīng)的N個(gè)號(hào)簽并充分搖勻后,從中隨機(jī)地抽取n個(gè)號(hào)簽(可以是一次抽取n個(gè)號(hào)簽,也可以一次抽一個(gè)號(hào)簽,連續(xù)抽n次),與抽中號(hào)簽號(hào)碼相同的n個(gè)單元即為抽中的單元,由其組成簡(jiǎn)單隨機(jī)樣本。抽簽法在技術(shù)上十分簡(jiǎn)單,但在實(shí)際應(yīng)用中,對(duì)總體各單元編號(hào)并制作號(hào)簽的工作量可能會(huì)很繁重,尤其是當(dāng)總體容量比較大時(shí),抽簽法并不是很方便,而且也往往難以保證做到等概率。因此,實(shí)際工作中常常使用隨機(jī)數(shù)法。簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法常用的有抽簽法和隨機(jī)數(shù)法兩種。22(二)隨機(jī)數(shù)法隨機(jī)數(shù)法就是利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣。由于計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)實(shí)際上是偽隨機(jī)數(shù),不是真正的隨機(jī)數(shù),特別是直接采用一般現(xiàn)成程序時(shí),產(chǎn)生的隨機(jī)數(shù)往往不能保證其隨機(jī)性。因此,一般使用隨機(jī)數(shù)表,或用隨機(jī)數(shù)骰子產(chǎn)生的隨機(jī)數(shù),特別在n比較大時(shí)。(二)隨機(jī)數(shù)法231、隨機(jī)數(shù)表及其使用方法隨機(jī)數(shù)表是由0到9的10個(gè)阿拉伯?dāng)?shù)字進(jìn)行隨機(jī)排列組成的表。所謂隨機(jī)排列,即每個(gè)數(shù)字都是按等概和重復(fù)獨(dú)立抽取的方式排定的。在編制時(shí),使用一種特制的電器或用計(jì)算機(jī),將0至9的10個(gè)數(shù)字隨機(jī)地自動(dòng)搖出,每個(gè)搖出的數(shù)字就是一個(gè)隨機(jī)數(shù)字。為使用方便,可依其出現(xiàn)的次序,按行或按列分成幾位一組進(jìn)行排列。根據(jù)不同的需要,它們所含數(shù)字的多少以及分位和排列的方式盡可以不同。1、隨機(jī)數(shù)表及其使用方法24目前,世界上已編有許多種隨機(jī)數(shù)表。其中較大的有蘭德公司編制,1955年出版的100萬(wàn)數(shù)字隨機(jī)數(shù)表,它按五位一組排列,共有20萬(wàn)組;肯德爾和史密斯編制,1938年出版的10萬(wàn)數(shù)字隨機(jī)數(shù)表,它也按五位一組排列,共有25000組。我國(guó)常用的是中國(guó)科學(xué)院數(shù)學(xué)研究所概率統(tǒng)計(jì)室編印的《常用數(shù)理統(tǒng)計(jì)表》中的隨機(jī)數(shù)表。目前,世界上已編有許多種隨機(jī)數(shù)表。其中較大的有蘭德公司編制,25簡(jiǎn)單隨機(jī)抽樣屬等概率抽樣,在使用隨機(jī)數(shù)表時(shí),要注意以下幾點(diǎn):①每次使用時(shí),確定使用哪頁(yè)及哪行哪列的數(shù)字為起點(diǎn),必須是隨機(jī)的。②設(shè)總體容量為N,若N的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至N的數(shù)可直接使用;遇到其它的數(shù)不能直接使用。簡(jiǎn)單隨機(jī)抽樣屬等概率抽樣,在使用隨機(jī)數(shù)表時(shí),要注意以下幾點(diǎn):26③當(dāng)r≥2時(shí),可從含有起點(diǎn)數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始??蓮钠瘘c(diǎn)開始向下抽取,也可向右抽取。但一經(jīng)確定使用哪一種方式,就必須用一種方式抽取全部單元號(hào),中途不能變更。④在重復(fù)抽樣時(shí),遇到重復(fù)的數(shù)字應(yīng)重復(fù)使用;在不重復(fù)抽樣時(shí),遇到重復(fù)的數(shù)字應(yīng)舍去不用。③當(dāng)r≥2時(shí),可從含有起點(diǎn)數(shù)字左邊的r位數(shù)開始,也可從右邊的27隨機(jī)數(shù)表法一般分下述幾步:第一步:確定起點(diǎn)頁(yè)碼,如用筆尖在隨機(jī)數(shù)表上隨機(jī)指定一點(diǎn),若落點(diǎn)數(shù)字(或距落點(diǎn)最近的數(shù)字)為奇數(shù),則確定起點(diǎn)在第1頁(yè);否則,起點(diǎn)在第二頁(yè)。第二步:確定起點(diǎn)的行數(shù)與列數(shù),先在表上隨機(jī)指定一點(diǎn),由落點(diǎn)處的兩位數(shù)確定起點(diǎn)的行數(shù)。由于每頁(yè)只有50行,所以當(dāng)落點(diǎn)處的兩位數(shù)大于50時(shí),則取其減去50的差數(shù)為行數(shù)。為保證等概性,當(dāng)落點(diǎn)處的數(shù)為“00”時(shí),則行數(shù)應(yīng)取作50。然后依同樣的方法再確定起點(diǎn)的列數(shù)。隨機(jī)數(shù)表法一般分下述幾步:第一步:確定起點(diǎn)頁(yè)碼,如用筆尖在隨28第三步:確定所抽樣本單元的號(hào)碼。從上述確定的起點(diǎn)開始向下(或向右),每次取一個(gè)r位數(shù)。通常,若所需抽的數(shù)是一位數(shù)或兩位數(shù)(即r=1或2),則由起點(diǎn)開始,依次向右抽取較方便,達(dá)到該行右端時(shí),從下一行左端開始繼續(xù)向右抽??;若所需抽的數(shù)是三位及以上(即r≥3)則由起點(diǎn)開始依次向下抽取較方便,達(dá)到最后一行時(shí),向右移10位(或r位),再?gòu)牡谝恍虚_始向下繼續(xù)抽取,直到取足所需的n個(gè)r位數(shù)為止,以這n個(gè)r位數(shù)所對(duì)應(yīng)的總體單元組成樣本。第三步:確定所抽樣本單元的號(hào)碼。從上述確定的起點(diǎn)開始向下(或292、隨機(jī)數(shù)骰子及其使用方法隨機(jī)數(shù)骰子是由均勻材料制成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有0-9的數(shù)字各2個(gè)。每盒骰子由盒體、盒蓋、泡沫塑料墊及若干個(gè)(通常是3-6個(gè))不同顏色的骰子組成。使用隨機(jī)數(shù)骰子時(shí)可以像普通骰子那樣用投擲的方法。但正規(guī)的方法是將一個(gè)或n個(gè)骰子放在盒中,拿去泡沫塑料墊,水平地?fù)u動(dòng)盒子,使骰子充分旋轉(zhuǎn),最后打開盒子,讀出骰子表示的數(shù)字。一個(gè)骰子一次產(chǎn)生一個(gè)0-9的隨機(jī)數(shù)。要產(chǎn)生一個(gè)m位數(shù)字的隨機(jī)數(shù),就需要同時(shí)使用m個(gè)骰子(事先規(guī)定好每種顏色所代表的位數(shù),例如紅色表示百位數(shù),藍(lán)色表示十位數(shù),黃色表示個(gè)位數(shù)等),或?qū)⒁粋€(gè)骰子使用m次(規(guī)定第一次產(chǎn)生的數(shù)字為最高位數(shù),最后一次產(chǎn)生的數(shù)字為最末位即個(gè)位數(shù)字等)。特別規(guī)定m個(gè)骰子的數(shù)字(或一個(gè)骰子m次產(chǎn)生的數(shù)字)都為0時(shí),表示10m。2、隨機(jī)數(shù)骰子及其使用方法隨機(jī)數(shù)骰子是由均勻材料制成的正二十30也許有人會(huì)認(rèn)為,在抽樣時(shí)不用隨機(jī)數(shù)表,而采取隨意抽選的辦法也可以達(dá)到預(yù)期的抽樣效果。表面上看,這種想法似乎有一定道理,但實(shí)際試驗(yàn)的結(jié)果證明隨意抽樣不等于隨機(jī)抽樣。也許有人會(huì)認(rèn)為,在抽樣時(shí)不用隨機(jī)數(shù)表,而采取隨意抽選的辦法也31簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡(jiǎn)單、最單純的抽樣技術(shù),它具有計(jì)算簡(jiǎn)便的優(yōu)點(diǎn),是研究其它復(fù)雜抽樣技術(shù)的基礎(chǔ),也是比較各種抽樣技術(shù)之間估計(jì)效率的標(biāo)準(zhǔn),同時(shí),從理論上講簡(jiǎn)單隨機(jī)抽樣在各種抽樣技術(shù)中是貫徹隨機(jī)原則最好的一種,并且數(shù)學(xué)性質(zhì)很簡(jiǎn)單,是等概率抽樣的特殊類型。簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概32另一方面,因?yàn)槭堑雀怕食槿颖荆砸罂傮w在所研究的主要標(biāo)志上同質(zhì)性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對(duì)總體具有充分的代表性。但是,在社會(huì)經(jīng)濟(jì)現(xiàn)象中,這種均勻總體是很少見的。因此,實(shí)際工作中很少單純使用簡(jiǎn)單隨機(jī)抽樣方法。另一方面,因?yàn)槭堑雀怕食槿颖荆砸罂傮w在所研究的主要標(biāo)33再者,因?yàn)橹苯訌目傮w中抽取樣本,未能充分利用關(guān)于總體的各種其它已知信息,以有效地提高樣本的代表性,并進(jìn)而提高抽樣的估計(jì)效率。再者,因?yàn)橹苯訌目傮w中抽取樣本,未能充分利用關(guān)于總體的各種其34此外,簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,并對(duì)每一個(gè)總體抽樣單元進(jìn)行編號(hào),而且當(dāng)總體抽樣單元的分布比較分散時(shí),樣本也可能會(huì)比較分散,這些都會(huì)給簡(jiǎn)單隨機(jī)抽樣方法的運(yùn)用造成許多的不便,甚至在某些情況下干脆無(wú)法使用。因此,在此基礎(chǔ)上研究其它抽樣技術(shù)顯得更加重要。此外,簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,并對(duì)每一個(gè)總體抽35符號(hào)的表示總體均值總體總值(總體總量)總體比例總體比率(總體比值)符號(hào)的表示總體均值36
指標(biāo)名稱總體樣本總量均值比例(成數(shù))比率方差指標(biāo)名稱總體樣本總量均值比例(成數(shù))比率方差37抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件382.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.2.1簡(jiǎn)單估計(jì)量的性質(zhì)引理2.1從大小為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元入樣的概率為,兩個(gè)特定單元都入樣的概率為。2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.2.1簡(jiǎn)單估計(jì)量的性質(zhì)39抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件40一、總體均值的估計(jì)1.簡(jiǎn)單估計(jì)及其無(wú)偏性:一、總體均值的估計(jì)41定理2.1對(duì)于簡(jiǎn)單隨機(jī)抽樣,作為的簡(jiǎn)單估計(jì)是無(wú)偏的。注意定理可以表示成更簡(jiǎn)潔的形式:定理2.1對(duì)于簡(jiǎn)單隨機(jī)抽樣,作為的簡(jiǎn)單估計(jì)42證明1:(定義法)根據(jù)前面對(duì)簡(jiǎn)單隨機(jī)抽樣的定義和說(shuō)明,我們知道對(duì)于規(guī)模為N的有限總體簡(jiǎn)單隨機(jī)抽樣,樣本量為n的所有可能樣本總共有個(gè),對(duì)應(yīng)的樣本均值總共也有個(gè),其中任意特定的一個(gè)樣本及其樣本均值出現(xiàn)的概率都是,于是對(duì)于所有可能樣本整體而言,樣本均值就是一個(gè)隨機(jī)變量,按按照數(shù)理統(tǒng)計(jì)中數(shù)學(xué)期望的含義,有
證明1:(定義法)43抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件44證明2:從總體規(guī)模為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨機(jī)樣本。若對(duì)中體中的每個(gè)單元如引理2.2引進(jìn)隨機(jī)變量如下:則可表示為,式中都是常數(shù),故證明2:從總體規(guī)模為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨45抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件46估計(jì)量的方差在抽樣推斷中,有時(shí)往往只計(jì)算出估計(jì)量的值,而不大注意估計(jì)量的誤差(方差或標(biāo)準(zhǔn)差)。但是,總體均值的估計(jì)量通常與總體均值的真值間不完全一致,即存在誤差,而且所有可能的樣本均值相對(duì)于總體均值的誤差大小也是不一致的。聯(lián)合國(guó)統(tǒng)計(jì)局編的《抽樣調(diào)查理論基礎(chǔ)》一書指出:“從研究大多數(shù)國(guó)家的抽樣實(shí)踐中,可以看出:雖然計(jì)算估計(jì)量的標(biāo)準(zhǔn)差,至少對(duì)關(guān)鍵性的幾個(gè)估計(jì)量計(jì)算其標(biāo)準(zhǔn)差來(lái)說(shuō),僅需增加很少的額外開支或負(fù)擔(dān),但是他們并不意識(shí)到確定估計(jì)量的標(biāo)準(zhǔn)差的重要意義。這是否因?yàn)榻y(tǒng)計(jì)人員無(wú)意識(shí)地忽視了估計(jì)量的不精確性所產(chǎn)生的嚴(yán)峻的現(xiàn)實(shí)呢?計(jì)算標(biāo)準(zhǔn)差,并且把他們與估計(jì)量一起列出來(lái),應(yīng)該成為實(shí)際工作的一個(gè)常規(guī)。”估計(jì)量的方差在抽樣推斷中,有時(shí)往往只計(jì)算出估計(jì)量的值,而不472.2.2簡(jiǎn)單估計(jì)量方差與協(xié)方差1.簡(jiǎn)單估計(jì)量的方差按照數(shù)理統(tǒng)計(jì)中的定義,有限總體的方差通常定義為:但在抽樣理論中,慣用的是另一種形式:2.2.2簡(jiǎn)單估計(jì)量方差與協(xié)方差1.簡(jiǎn)單估計(jì)量481、簡(jiǎn)單估計(jì)量的方差1、簡(jiǎn)單估計(jì)量的方差49證明:仿照前面定理2.1之證明3引進(jìn)隨機(jī)變量,且運(yùn)用引理2.2的結(jié)論就可完成證明。參見31-32頁(yè)。證明:仿照前面定理2.1之證明3引進(jìn)隨機(jī)變量,且運(yùn)用引理250抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件51推論2.4對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:推論2.4對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:52
53抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件542、兩個(gè)估計(jì)量的協(xié)方差2、兩個(gè)估計(jì)量的協(xié)方差55抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件56抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件572.2.3方差與協(xié)方差的估計(jì)2.2.3方差與協(xié)方差的估計(jì)58證明:只需證由定義由對(duì)稱論證法抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件59抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件60抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件61區(qū)間估計(jì)區(qū)間估計(jì)62在獲得各種總體特征的簡(jiǎn)單估計(jì)量的方差估計(jì)后,由于這些簡(jiǎn)單估計(jì)量均以樣本均值為核心構(gòu)建,根據(jù)中心極限定理它們都接近正態(tài)分布核心估計(jì)量樣本均值分布近似服從正態(tài)分布。于是,可按照數(shù)理統(tǒng)計(jì)中有關(guān)正態(tài)分布總體特征的區(qū)間估計(jì)步驟進(jìn)行估計(jì),首先根據(jù)樣本調(diào)查值計(jì)算出和,然后用作為的近似在獲得各種總體特征的簡(jiǎn)單估計(jì)量的方差估計(jì)后,由于這些簡(jiǎn)單估計(jì)63抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件64例子1`1例子1`165抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件66例:在某地區(qū)10000戶家庭中,按簡(jiǎn)單隨機(jī)抽樣抽取400戶,調(diào)查一個(gè)月的伙食費(fèi)(單位:元)。經(jīng)計(jì)算:(1)試估計(jì)該地區(qū)平均每戶每月的伙食費(fèi),并估計(jì)其標(biāo)準(zhǔn)差。(忽略f)(2)給出置信度為95%時(shí)該地區(qū)平均每戶每月伙食費(fèi)的近似置信區(qū)間。例:在某地區(qū)10000戶家庭中,按簡(jiǎn)單隨機(jī)抽樣抽取400戶,67解:
(1)
(2)解:68例:某地區(qū)專業(yè)雜志目前擁有8000家訂戶,從中按簡(jiǎn)單隨機(jī)抽樣抽取了484戶,這484戶的年均收入為30500元,標(biāo)準(zhǔn)差為7040元。試求該雜志訂戶的年均收入的置信度為95%的近似置信區(qū)間。解:例:某地區(qū)專業(yè)雜志目前擁有8000家訂戶,從中按簡(jiǎn)單隨機(jī)692.3比率估計(jì)量及其性質(zhì)2.3比率估計(jì)量及其性質(zhì)70一、使用比估計(jì)的兩種情況1.比值(或比率)一、使用比估計(jì)的兩種情況1.比值(或比率)71
例:例:72
例:“篩選性”問(wèn)題例:“篩選性”問(wèn)題73
例:1802年,法國(guó)的Laplace受政府委托進(jìn)行法國(guó)人口的估計(jì)與推算。推算方法如下:
2.利用輔助變量的信息改進(jìn)估計(jì)的精度例:1802年,法國(guó)的Laplace受政府委托進(jìn)行法國(guó)人口74利用輔助變量的信息改進(jìn)估計(jì)的精度利用輔助變量的信息改進(jìn)估計(jì)的精度75二、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì)1.比的簡(jiǎn)單估計(jì)量:二、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì)762.性質(zhì):
對(duì)于簡(jiǎn)單隨機(jī)抽樣2.性質(zhì):77證明:證明:78抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件79抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件80抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件81(3)比率估計(jì)量的方差估計(jì)(3)比率估計(jì)量的方差估計(jì)82抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件83比率估計(jì)量的方差估計(jì)值
比率估計(jì)量的方差估計(jì)值84例:某小區(qū)有1920戶,從中隨機(jī)抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭人口,得數(shù)據(jù):
試對(duì)人均住房面積作點(diǎn)估計(jì)和置信度為95%的區(qū)間估計(jì)。例:某小區(qū)有1920戶,從中隨機(jī)抽取了70戶,調(diào)查各戶的住房85
解:解:863.比率估計(jì)量與簡(jiǎn)單估計(jì)量的比較3.比率估計(jì)量與簡(jiǎn)單估計(jì)量的比較87回歸估計(jì)
Linearregression
回歸估計(jì)
Linearregression881.簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總體總值的回歸估計(jì)量分別為:1.簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:89抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件90抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件91抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件92證明:證明:93抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件94例:總體由75308個(gè)農(nóng)場(chǎng)組成,設(shè)yi為第i個(gè)農(nóng)場(chǎng)養(yǎng)牛的頭數(shù),xi為第i個(gè)農(nóng)場(chǎng)的面積。已知農(nóng)場(chǎng)平均面積為31.25英畝,選取一個(gè)樣本容量為2055的簡(jiǎn)單隨機(jī)樣本。經(jīng)計(jì)算得:
試估計(jì)每個(gè)農(nóng)場(chǎng)平均養(yǎng)牛頭數(shù)及標(biāo)準(zhǔn)差。例:總體由75308個(gè)農(nóng)場(chǎng)組成,設(shè)yi為第i個(gè)農(nóng)場(chǎng)養(yǎng)牛的頭數(shù)95解:解:962.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本容量的確定的原則與主要因素
(一)費(fèi)用函數(shù)在簡(jiǎn)單隨機(jī)抽樣情況下,設(shè)調(diào)查函數(shù)為:
c:總費(fèi)用:
固定費(fèi)用:可變費(fèi)用
設(shè)計(jì)費(fèi)分析費(fèi)辦公費(fèi)管理費(fèi)場(chǎng)租費(fèi)等訪問(wèn)員費(fèi)交通費(fèi)禮品費(fèi)電話費(fèi)等2.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本容量的確定的原則與主要因97費(fèi)用與精度有關(guān)(二)誤差限誤差限是指在一定的概率保證下,參數(shù)及它的估計(jì)值的最大的絕對(duì)或相對(duì)誤差。種類:絕對(duì)誤差與相對(duì)誤差
絕對(duì)誤差:(1)(r=d)
相對(duì)誤差:費(fèi)用與精度有關(guān)981-aa/2a/2
當(dāng)樣本量足夠大時(shí),可以用正態(tài)分布近似:區(qū)間與置信水平
均值的抽樣分布(1-)%區(qū)間包含了%的區(qū)間未包含1-aa/2a/2
當(dāng)樣本量足夠大時(shí),可以用正態(tài)分布近似99即由于可用估計(jì)量必定是近似無(wú)偏的,因此當(dāng)n充分大時(shí),根據(jù)正態(tài)分布的性質(zhì):(2)即100由(1)式與(2)得:絕對(duì)誤差:相對(duì)誤差:為的變異系數(shù),上式中可以用替代。由(1)式與(2)得:絕對(duì)誤差:101(三)其他考慮因素1、問(wèn)題的重要性2、所研究問(wèn)題目標(biāo)量的個(gè)數(shù)3、參照同類調(diào)查4、調(diào)查表的回收率
n=初始樣本量/預(yù)計(jì)有效回答率5、有效樣本6、資源限制等其他因素(三)其他考慮因素1、問(wèn)題的重要性102(二)總體參數(shù)為Y或的情形
將代入d
或(二)總體參數(shù)為Y或的情形103得到:或在實(shí)際工作中,通常先計(jì)算
或得到:104其中:C=為總體變異系數(shù)。如果
﹤0.05,則就
取,否則對(duì)進(jìn)行修正:
n=
(三)總體參數(shù)為P的情形
V(P)=其中:C=為總體變異系數(shù)。如果﹤0.0105抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件106在實(shí)際工作中,通常先計(jì)算:
或如果﹤0.05,就取,否則對(duì)進(jìn)行修正:
或:或:107
注:的保守估計(jì);
當(dāng)時(shí),PQ很接近P=0.5時(shí)的最大值0.25,常常以P=0.5代入計(jì)算;
當(dāng)P<0.1(或P>0.9)時(shí),若用p=0.5來(lái)計(jì)算,則y樣本量過(guò)大。
pq=0.5*0.5=0.25注:的保守估計(jì);pq=0.5*0.5=0.108
【例2.7】某銷售公司希望了解全部3000家客戶對(duì)該公司的綜合滿意程度,決定用電話調(diào)查一個(gè)簡(jiǎn)單隨機(jī)樣本。這時(shí),銷售公司希望以95%的把握保證客戶滿意的總體比例P在樣本比例的范圍內(nèi),但對(duì)總體比例P無(wú)法給出一個(gè)大致的范圍.這時(shí),應(yīng)調(diào)查多少個(gè)客戶,才能保證對(duì)總體比例估計(jì)的要求?
解:N=3000d=10%=0.1Z=1.96
109修正樣本量n:
兩個(gè)樣本量計(jì)算的結(jié)果很接近,說(shuō)明抽樣比小于5%時(shí),可以不計(jì)算修正樣本量。【例】在人口變動(dòng)情況調(diào)查中,出生率是一個(gè)十分重要的指標(biāo).根據(jù)以前調(diào)查的數(shù)據(jù),出生率的估計(jì)可取為18‰,問(wèn)在置信度95%下,實(shí)際調(diào)查估計(jì)P的絕對(duì)誤差限為0.5‰和相對(duì)誤差限為5%各需要多大的樣本量?修正樣本量n:110解:Z=1.96p=0.018q=0.982d=0.0005r=0.05將d=r()代入上式得:將d=r()代入上111(四)影響樣本容量的因素
由方差公式
則可知影響n的因素有三個(gè):總體規(guī)模N、抽樣誤差V、總體方差S2。但S2未知,而是用置信度1-和絕對(duì)誤差限d代替V,所以并不能用上式確定樣本容量。(四)影響樣本容量的因素
由方差公式112由推出另一方面,根據(jù)雙側(cè)百分點(diǎn)的定義,有比較兩式,即有注意,于是可知由推113影響樣本容量的因素有四個(gè):總體規(guī)模N,置信度1-,絕對(duì)誤差限d和總體方差。置信度1-要求越高,所需的樣本容量n越大;絕對(duì)誤差限d要求越小,所需的樣本容量n越大;當(dāng)總體方差S2最增大時(shí),為達(dá)到規(guī)定的精度,往往要增加樣本容量;總體規(guī)模N,對(duì)小規(guī)模的總體,其作用明顯,對(duì)中等規(guī)模的總體,作用中等,對(duì)大規(guī)模的總體,作用很小。影響樣本容量的因素有四個(gè):總體規(guī)模N,置信度1-,絕114樣本量設(shè)計(jì)中的誤區(qū):1.估計(jì)精度越高越好嗎?簡(jiǎn)單隨機(jī)抽樣估計(jì)比例P的樣本量與誤差(當(dāng)p=0.5時(shí))樣本量
誤差500.14100
0.10500
0.045
1000
0.03210000
0.0098
對(duì)精度要求的判斷十分重要。為得到最小誤差而選擇最大樣本量不是最好的選擇。樣本量設(shè)計(jì)中的誤區(qū):1152.樣本量與總體規(guī)模N有關(guān)嗎?按照總體比例確定樣本量合適嗎?例:簡(jiǎn)單隨機(jī)抽樣估計(jì)P,置信度95%,允許誤差d=5%,在P=0.5的情況下總體規(guī)模(N)所需樣本量(n)50(小)
4410079500
21710002785000357
10000370
100000(中)383
1000000384
10000000(大)
3842.樣本量與總體規(guī)模N有關(guān)嗎?按照總體比例確定樣本量合適嗎?116由此可知,在精度要求相同的情況下,在北京進(jìn)行一項(xiàng)調(diào)查和在全國(guó)進(jìn)行一項(xiàng)調(diào)查,樣本量差別不大??傮w規(guī)模越大,進(jìn)行抽樣調(diào)查的效率越高。由此可知,在精度要求相同的情況下,在北京進(jìn)行一項(xiàng)調(diào)查和117六、確定樣本量的步驟1、確定估計(jì)精度水平。包括誤差限和置信度2、對(duì)總體方差的預(yù)估計(jì)。利用以前的調(diào)查結(jié)果與經(jīng)驗(yàn)利用預(yù)調(diào)查或試調(diào)查的結(jié)果利用同類或相似或有關(guān)的二手?jǐn)?shù)據(jù)的結(jié)果利用某些理論上的結(jié)論利用有經(jīng)驗(yàn)的專家判斷3、在簡(jiǎn)單隨機(jī)抽樣方式和回答率為100%的前提下,
計(jì)算初始樣本量。六、確定樣本量的步驟1184、確定抽樣方式,利用設(shè)計(jì)效應(yīng)調(diào)整樣本量。簡(jiǎn)單隨機(jī)抽樣的deff=1分層隨機(jī)抽樣的deff<1整群隨機(jī)抽樣的deff>1系統(tǒng)隨機(jī)抽樣的deff15、判斷有效回答率r,調(diào)整樣本量。6、根據(jù)分組數(shù)據(jù)精度的要求,確定各組的樣本量。7、考慮費(fèi)用、時(shí)間、所擁有的資源,最終確定樣本量。抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件119精度常見的表示方法:精度常見的表示方法:120二、估計(jì)總體均值或總量時(shí)樣本量的確定方法先對(duì)總體均值的情形討論。1.精度要求:置信度1-α的絕對(duì)誤差限為d,即
二、估計(jì)總體均值或總量時(shí)樣本量的確定方法121則估計(jì)總體均值時(shí)樣本量這樣確定:則估計(jì)總體均值時(shí)樣本量這樣確定:1222.精度要求:置信度1-α的相對(duì)誤差限為r,即
則估計(jì)總體均值時(shí)樣本量這樣確定:
2.精度要求:置信度1-α的相對(duì)誤差限為r,即123抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件124
精度要求樣本量的確定精度要求125例1:若要求估計(jì)職工的平均收入的絕對(duì)誤差在20元之內(nèi),置信度為95%,N=4328,,則樣本量應(yīng)該是多少?解:例1:若要求估計(jì)職工的平均收入的絕對(duì)誤差在20元之內(nèi),置信度126例2:在某地區(qū)10000戶家庭中,按單純隨機(jī)抽樣抽取400戶,調(diào)查一個(gè)月的伙食費(fèi)(單位:元)。經(jīng)計(jì)算:利用這次抽樣結(jié)果,現(xiàn)在若要再進(jìn)行一次簡(jiǎn)單隨機(jī)抽樣,分別要求如下時(shí),樣本量各為多少?(1)要求d=50(置信度為0.95);(2)要求r=0.05(置信度為0.95)。例2:在某地區(qū)10000戶家庭中,按單純隨機(jī)抽樣抽取400戶127解:解:1282.設(shè)計(jì)效應(yīng)(designeffect):2.設(shè)計(jì)效應(yīng)(designeffect):129第二章簡(jiǎn)單隨機(jī)抽樣第二章簡(jiǎn)單隨機(jī)抽樣130第二章簡(jiǎn)單隨機(jī)抽樣2.1概述2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.3比率估計(jì)量及其性質(zhì)2.4回歸估計(jì)量及其性質(zhì)2.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施第二章簡(jiǎn)單隨機(jī)抽樣2.1概述131概述一、簡(jiǎn)單隨機(jī)抽樣(或單純隨機(jī)抽樣)本書一般局限于不放回隨機(jī)抽樣二、實(shí)施方法三、地位、作用是其他抽樣方法基礎(chǔ)概述一、簡(jiǎn)單隨機(jī)抽樣(或單純隨機(jī)抽樣)132案例在1936年美國(guó)總統(tǒng)選舉前,一份頗有名氣的雜志進(jìn)行了民意測(cè)驗(yàn),調(diào)查蘭登與羅斯福誰(shuí)將當(dāng)選下屆總統(tǒng)。為了了解公眾意向,調(diào)查者通過(guò)電話簿和汽車登記簿給大批人發(fā)了調(diào)查表,通過(guò)分析回收的調(diào)查表,顯示蘭登非常受歡迎。因此該雜志預(yù)測(cè)蘭登將獲勝。實(shí)際選舉結(jié)果正好相反,最后羅斯福在選舉中獲勝。其數(shù)據(jù)如下:候選人預(yù)測(cè)結(jié)果(%)選舉結(jié)果(%)Landon5738Roosevelt4362案例候選人預(yù)測(cè)結(jié)果(%)選舉結(jié)果(%)133問(wèn)題一:對(duì)于一個(gè)確定的總體其樣本唯一嗎?問(wèn)題二:如何科學(xué)地抽取樣本?怎樣使抽取的樣本充分地反映總體的情況?
思考合理、公平問(wèn)題一:對(duì)于一個(gè)確定的總體其樣本唯一嗎?思考合理、公平1342.1定義與符號(hào)定義2.1從總體的N個(gè)單元中,一次整批抽取n個(gè)單元,使任何一個(gè)單元被抽中的概率都相等,任何n個(gè)不同單元組成的組合被抽中的概率也都相等,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣.定義2.2從總體的N個(gè)單元中,逐個(gè)不放回抽取單元,每次抽取到尚未入樣的任何一個(gè)單元的概率都相等,直到抽足n個(gè)單元為止,這樣所得的n個(gè)單元組成一個(gè)簡(jiǎn)單隨機(jī)樣本.2.1定義與符號(hào)定義2.1從總體的N個(gè)單元中,一次整批抽取135定義2.3按照從總體的N個(gè)單元中抽取n個(gè)單元的所有可能不同組合構(gòu)造所有可能的個(gè)樣本,從中隨機(jī)抽取一個(gè)樣本,使每個(gè)樣本被抽到的概率都等于1/,這種抽樣稱為簡(jiǎn)單隨機(jī)抽樣。注意:定義2.1與定義2.3是等價(jià)的。三個(gè)定義之間的聯(lián)系定義2.3按照從總體的N個(gè)單元中抽取n個(gè)單元的所有可能不同136證明不放回?zé)o序:按定義1,每個(gè)樣本被抽中的概率相同,即為。證明:設(shè)被抽中的單元號(hào)碼:1,2,3…n對(duì)應(yīng)的觀察值為:在有序逐個(gè)抽取時(shí),樣本的概率為:在無(wú)序情況下,一個(gè)包含n個(gè)指定單元的樣本,其單元抽取的順序共有種不同的形式,因此抽取到包含這n個(gè)樣本的總概率:證明不放回?zé)o序:按定義1,每個(gè)樣本被抽中的概率相同,即為137抽取原則:A.隨機(jī)原則B.每個(gè)抽樣單元被抽中的概率已知或事先確定C.每個(gè)抽樣單元被抽中的概率相等抽取原則:138注意:(1)它要求被抽取的樣本是有限總體、具體總體、與抽樣框一致的總體;(2)它是從總體中逐個(gè)抽取;(3)它是一種不放回的抽樣;(4)它是一種等概率的抽樣。注意:139
(二)類型:
放回簡(jiǎn)單隨機(jī)抽樣:有序、無(wú)序
不放回簡(jiǎn)單隨機(jī)抽樣:有序、無(wú)序
140放回簡(jiǎn)單隨機(jī)抽樣【例】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本個(gè)數(shù)為:
放回簡(jiǎn)單隨機(jī)抽樣【例】設(shè)總體有5個(gè)單元(1,2,3,4,5)1411,12,13,14,15,11,22,23,24,25,21,32,33,35,35,31,42,43,44,45,41,52,53,54,55,5放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本:重復(fù)順序放回有序SRSWR(考慮樣本單元的順序):如1,2和2,1作為不同的樣本。所有可能的樣本個(gè)數(shù):每個(gè)樣本被抽中的概率為。1,12,13,14,15,11,22,23,24,25,2142放回?zé)o序(不考慮樣本單元的順序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5放回?zé)o序(不考慮樣本單元的順序):1,12,13,14,15143特點(diǎn):
每次抽樣時(shí),總體的結(jié)構(gòu)不變,抽樣是相互獨(dú)立進(jìn)行的;總體單元有可能多次被抽中的機(jī)會(huì)。
特點(diǎn):144不放回簡(jiǎn)單隨機(jī)抽樣
不放回有序(考慮樣本單元的順序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5不放回簡(jiǎn)單隨機(jī)抽樣
1,12,13,14,15,11,22,145不放回?zé)o序SRSWOR(不考慮樣本單元的順序):每個(gè)樣本被抽中的概率相同,即為1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5不放回?zé)o序SRSWOR(不考慮樣本單元的順序):1,12,1146特點(diǎn):總體單元最多只有一次被抽中的機(jī)會(huì),且被抽中的機(jī)會(huì)隨抽選的次數(shù)增多而增多。特點(diǎn):總體單元最多只有一次被抽中的機(jī)會(huì),且被抽中的機(jī)會(huì)隨抽選147放回或不放回簡(jiǎn)單隨機(jī)抽樣的比較由于放回簡(jiǎn)單隨機(jī)抽樣的特點(diǎn),在實(shí)際操作中,人們不太可能心甘情愿地用兩倍以上的費(fèi)用去訪問(wèn)同一個(gè)單元。因此,不放回簡(jiǎn)單隨機(jī)抽樣通常比放回簡(jiǎn)單隨機(jī)抽樣“有效”些,但由于總體單元數(shù)多,而抽中的單元數(shù)相對(duì)較少,有許多事件的概率習(xí)性對(duì)于放回或不放回兩種情況幾乎差不多,因而有時(shí)候我們常從隨機(jī)放回這一最簡(jiǎn)單的形式入手討論問(wèn)題,而將有關(guān)結(jié)果近似地套到隨機(jī)不放回的情況。本書中簡(jiǎn)單隨機(jī)抽樣若不特指,一般都是指不放回抽樣(無(wú)序)。放回或不放回簡(jiǎn)單隨機(jī)抽樣的比較由于放回簡(jiǎn)單隨機(jī)抽樣的特點(diǎn),在148
思考:1.下列抽樣方式是否屬于簡(jiǎn)單隨機(jī)抽樣方式?為什么?(1)從無(wú)限多個(gè)個(gè)體中抽出500個(gè)個(gè)體作為樣本。(2)箱子里共有100個(gè)零件,從中選出10個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)。在抽樣操作中,從中任意取一個(gè)零件進(jìn)行質(zhì)量檢驗(yàn)后,再把它放回箱子。
1492.在簡(jiǎn)單隨機(jī)抽樣中,某一個(gè)個(gè)體被抽中的可能性是()。A.與第n次抽樣無(wú)關(guān),第一次抽中的可能性大些;B.與第n次抽樣無(wú)關(guān),每次抽中的可能性都相等;C.與第n次抽樣無(wú)關(guān),最后一次抽中的可能性大些;D.與第n次抽樣無(wú)關(guān),每次都是等可能抽樣,但每次抽中的可能性不一樣;
答:B2.在簡(jiǎn)單隨機(jī)抽樣中,某一個(gè)個(gè)體被抽中的可能性是()150簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法常用的有抽簽法和隨機(jī)數(shù)法兩種。(一)抽簽法抽簽法是先對(duì)總體N個(gè)抽樣單元分別編上1到N的號(hào)碼,再制作與之相對(duì)應(yīng)的N個(gè)號(hào)簽并充分搖勻后,從中隨機(jī)地抽取n個(gè)號(hào)簽(可以是一次抽取n個(gè)號(hào)簽,也可以一次抽一個(gè)號(hào)簽,連續(xù)抽n次),與抽中號(hào)簽號(hào)碼相同的n個(gè)單元即為抽中的單元,由其組成簡(jiǎn)單隨機(jī)樣本。抽簽法在技術(shù)上十分簡(jiǎn)單,但在實(shí)際應(yīng)用中,對(duì)總體各單元編號(hào)并制作號(hào)簽的工作量可能會(huì)很繁重,尤其是當(dāng)總體容量比較大時(shí),抽簽法并不是很方便,而且也往往難以保證做到等概率。因此,實(shí)際工作中常常使用隨機(jī)數(shù)法。簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法常用的有抽簽法和隨機(jī)數(shù)法兩種。151(二)隨機(jī)數(shù)法隨機(jī)數(shù)法就是利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣。由于計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)實(shí)際上是偽隨機(jī)數(shù),不是真正的隨機(jī)數(shù),特別是直接采用一般現(xiàn)成程序時(shí),產(chǎn)生的隨機(jī)數(shù)往往不能保證其隨機(jī)性。因此,一般使用隨機(jī)數(shù)表,或用隨機(jī)數(shù)骰子產(chǎn)生的隨機(jī)數(shù),特別在n比較大時(shí)。(二)隨機(jī)數(shù)法1521、隨機(jī)數(shù)表及其使用方法隨機(jī)數(shù)表是由0到9的10個(gè)阿拉伯?dāng)?shù)字進(jìn)行隨機(jī)排列組成的表。所謂隨機(jī)排列,即每個(gè)數(shù)字都是按等概和重復(fù)獨(dú)立抽取的方式排定的。在編制時(shí),使用一種特制的電器或用計(jì)算機(jī),將0至9的10個(gè)數(shù)字隨機(jī)地自動(dòng)搖出,每個(gè)搖出的數(shù)字就是一個(gè)隨機(jī)數(shù)字。為使用方便,可依其出現(xiàn)的次序,按行或按列分成幾位一組進(jìn)行排列。根據(jù)不同的需要,它們所含數(shù)字的多少以及分位和排列的方式盡可以不同。1、隨機(jī)數(shù)表及其使用方法153目前,世界上已編有許多種隨機(jī)數(shù)表。其中較大的有蘭德公司編制,1955年出版的100萬(wàn)數(shù)字隨機(jī)數(shù)表,它按五位一組排列,共有20萬(wàn)組;肯德爾和史密斯編制,1938年出版的10萬(wàn)數(shù)字隨機(jī)數(shù)表,它也按五位一組排列,共有25000組。我國(guó)常用的是中國(guó)科學(xué)院數(shù)學(xué)研究所概率統(tǒng)計(jì)室編印的《常用數(shù)理統(tǒng)計(jì)表》中的隨機(jī)數(shù)表。目前,世界上已編有許多種隨機(jī)數(shù)表。其中較大的有蘭德公司編制,154簡(jiǎn)單隨機(jī)抽樣屬等概率抽樣,在使用隨機(jī)數(shù)表時(shí),要注意以下幾點(diǎn):①每次使用時(shí),確定使用哪頁(yè)及哪行哪列的數(shù)字為起點(diǎn),必須是隨機(jī)的。②設(shè)總體容量為N,若N的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至N的數(shù)可直接使用;遇到其它的數(shù)不能直接使用。簡(jiǎn)單隨機(jī)抽樣屬等概率抽樣,在使用隨機(jī)數(shù)表時(shí),要注意以下幾點(diǎn):155③當(dāng)r≥2時(shí),可從含有起點(diǎn)數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始??蓮钠瘘c(diǎn)開始向下抽取,也可向右抽取。但一經(jīng)確定使用哪一種方式,就必須用一種方式抽取全部單元號(hào),中途不能變更。④在重復(fù)抽樣時(shí),遇到重復(fù)的數(shù)字應(yīng)重復(fù)使用;在不重復(fù)抽樣時(shí),遇到重復(fù)的數(shù)字應(yīng)舍去不用。③當(dāng)r≥2時(shí),可從含有起點(diǎn)數(shù)字左邊的r位數(shù)開始,也可從右邊的156隨機(jī)數(shù)表法一般分下述幾步:第一步:確定起點(diǎn)頁(yè)碼,如用筆尖在隨機(jī)數(shù)表上隨機(jī)指定一點(diǎn),若落點(diǎn)數(shù)字(或距落點(diǎn)最近的數(shù)字)為奇數(shù),則確定起點(diǎn)在第1頁(yè);否則,起點(diǎn)在第二頁(yè)。第二步:確定起點(diǎn)的行數(shù)與列數(shù),先在表上隨機(jī)指定一點(diǎn),由落點(diǎn)處的兩位數(shù)確定起點(diǎn)的行數(shù)。由于每頁(yè)只有50行,所以當(dāng)落點(diǎn)處的兩位數(shù)大于50時(shí),則取其減去50的差數(shù)為行數(shù)。為保證等概性,當(dāng)落點(diǎn)處的數(shù)為“00”時(shí),則行數(shù)應(yīng)取作50。然后依同樣的方法再確定起點(diǎn)的列數(shù)。隨機(jī)數(shù)表法一般分下述幾步:第一步:確定起點(diǎn)頁(yè)碼,如用筆尖在隨157第三步:確定所抽樣本單元的號(hào)碼。從上述確定的起點(diǎn)開始向下(或向右),每次取一個(gè)r位數(shù)。通常,若所需抽的數(shù)是一位數(shù)或兩位數(shù)(即r=1或2),則由起點(diǎn)開始,依次向右抽取較方便,達(dá)到該行右端時(shí),從下一行左端開始繼續(xù)向右抽取;若所需抽的數(shù)是三位及以上(即r≥3)則由起點(diǎn)開始依次向下抽取較方便,達(dá)到最后一行時(shí),向右移10位(或r位),再?gòu)牡谝恍虚_始向下繼續(xù)抽取,直到取足所需的n個(gè)r位數(shù)為止,以這n個(gè)r位數(shù)所對(duì)應(yīng)的總體單元組成樣本。第三步:確定所抽樣本單元的號(hào)碼。從上述確定的起點(diǎn)開始向下(或1582、隨機(jī)數(shù)骰子及其使用方法隨機(jī)數(shù)骰子是由均勻材料制成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有0-9的數(shù)字各2個(gè)。每盒骰子由盒體、盒蓋、泡沫塑料墊及若干個(gè)(通常是3-6個(gè))不同顏色的骰子組成。使用隨機(jī)數(shù)骰子時(shí)可以像普通骰子那樣用投擲的方法。但正規(guī)的方法是將一個(gè)或n個(gè)骰子放在盒中,拿去泡沫塑料墊,水平地?fù)u動(dòng)盒子,使骰子充分旋轉(zhuǎn),最后打開盒子,讀出骰子表示的數(shù)字。一個(gè)骰子一次產(chǎn)生一個(gè)0-9的隨機(jī)數(shù)。要產(chǎn)生一個(gè)m位數(shù)字的隨機(jī)數(shù),就需要同時(shí)使用m個(gè)骰子(事先規(guī)定好每種顏色所代表的位數(shù),例如紅色表示百位數(shù),藍(lán)色表示十位數(shù),黃色表示個(gè)位數(shù)等),或?qū)⒁粋€(gè)骰子使用m次(規(guī)定第一次產(chǎn)生的數(shù)字為最高位數(shù),最后一次產(chǎn)生的數(shù)字為最末位即個(gè)位數(shù)字等)。特別規(guī)定m個(gè)骰子的數(shù)字(或一個(gè)骰子m次產(chǎn)生的數(shù)字)都為0時(shí),表示10m。2、隨機(jī)數(shù)骰子及其使用方法隨機(jī)數(shù)骰子是由均勻材料制成的正二十159也許有人會(huì)認(rèn)為,在抽樣時(shí)不用隨機(jī)數(shù)表,而采取隨意抽選的辦法也可以達(dá)到預(yù)期的抽樣效果。表面上看,這種想法似乎有一定道理,但實(shí)際試驗(yàn)的結(jié)果證明隨意抽樣不等于隨機(jī)抽樣。也許有人會(huì)認(rèn)為,在抽樣時(shí)不用隨機(jī)數(shù)表,而采取隨意抽選的辦法也160簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡(jiǎn)單、最單純的抽樣技術(shù),它具有計(jì)算簡(jiǎn)便的優(yōu)點(diǎn),是研究其它復(fù)雜抽樣技術(shù)的基礎(chǔ),也是比較各種抽樣技術(shù)之間估計(jì)效率的標(biāo)準(zhǔn),同時(shí),從理論上講簡(jiǎn)單隨機(jī)抽樣在各種抽樣技術(shù)中是貫徹隨機(jī)原則最好的一種,并且數(shù)學(xué)性質(zhì)很簡(jiǎn)單,是等概率抽樣的特殊類型。簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概161另一方面,因?yàn)槭堑雀怕食槿颖?,所以要求總體在所研究的主要標(biāo)志上同質(zhì)性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對(duì)總體具有充分的代表性。但是,在社會(huì)經(jīng)濟(jì)現(xiàn)象中,這種均勻總體是很少見的。因此,實(shí)際工作中很少單純使用簡(jiǎn)單隨機(jī)抽樣方法。另一方面,因?yàn)槭堑雀怕食槿颖?,所以要求總體在所研究的主要標(biāo)162再者,因?yàn)橹苯訌目傮w中抽取樣本,未能充分利用關(guān)于總體的各種其它已知信息,以有效地提高樣本的代表性,并進(jìn)而提高抽樣的估計(jì)效率。再者,因?yàn)橹苯訌目傮w中抽取樣本,未能充分利用關(guān)于總體的各種其163此外,簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,并對(duì)每一個(gè)總體抽樣單元進(jìn)行編號(hào),而且當(dāng)總體抽樣單元的分布比較分散時(shí),樣本也可能會(huì)比較分散,這些都會(huì)給簡(jiǎn)單隨機(jī)抽樣方法的運(yùn)用造成許多的不便,甚至在某些情況下干脆無(wú)法使用。因此,在此基礎(chǔ)上研究其它抽樣技術(shù)顯得更加重要。此外,簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,并對(duì)每一個(gè)總體抽164符號(hào)的表示總體均值總體總值(總體總量)總體比例總體比率(總體比值)符號(hào)的表示總體均值165
指標(biāo)名稱總體樣本總量均值比例(成數(shù))比率方差指標(biāo)名稱總體樣本總量均值比例(成數(shù))比率方差166抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件1672.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.2.1簡(jiǎn)單估計(jì)量的性質(zhì)引理2.1從大小為N的總體中抽取一個(gè)樣本量為n的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元入樣的概率為,兩個(gè)特定單元都入樣的概率為。2.2簡(jiǎn)單估計(jì)量及其性質(zhì)2.2.1簡(jiǎn)單估計(jì)量的性質(zhì)168抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件169一、總體均值的估計(jì)1.簡(jiǎn)單估計(jì)及其無(wú)偏性:一、總體均值的估計(jì)170定理2.1對(duì)于簡(jiǎn)單隨機(jī)抽樣,作為的簡(jiǎn)單估計(jì)是無(wú)偏的。注意定理可以表示成更簡(jiǎn)潔的形式:定理2.1對(duì)于簡(jiǎn)單隨機(jī)抽樣,作為的簡(jiǎn)單估計(jì)171證明1:(定義法)根據(jù)前面對(duì)簡(jiǎn)單隨機(jī)抽樣的定義和說(shuō)明,我們知道對(duì)于規(guī)模為N的有限總體簡(jiǎn)單隨機(jī)抽樣,樣本量為n的所有可能樣本總共有個(gè),對(duì)應(yīng)的樣本均值總共也有個(gè),其中任意特定的一個(gè)樣本及其樣本均值出現(xiàn)的概率都是,于是對(duì)于所有可能樣本整體而言,樣本均值就是一個(gè)隨機(jī)變量,按按照數(shù)理統(tǒng)計(jì)中數(shù)學(xué)期望的含義,有
證明1:(定義法)172抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件173證明2:從總體規(guī)模為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨機(jī)樣本。若對(duì)中體中的每個(gè)單元如引理2.2引進(jìn)隨機(jī)變量如下:則可表示為,式中都是常數(shù),故證明2:從總體規(guī)模為N的總體中抽取一個(gè)樣本容量為n的簡(jiǎn)單隨174抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件175估計(jì)量的方差在抽樣推斷中,有時(shí)往往只計(jì)算出估計(jì)量的值,而不大注意估計(jì)量的誤差(方差或標(biāo)準(zhǔn)差)。但是,總體均值的估計(jì)量通常與總體均值的真值間不完全一致,即存在誤差,而且所有可能的樣本均值相對(duì)于總體均值的誤差大小也是不一致的。聯(lián)合國(guó)統(tǒng)計(jì)局編的《抽樣調(diào)查理論基礎(chǔ)》一書指出:“從研究大多數(shù)國(guó)家的抽樣實(shí)踐中,可以看出:雖然計(jì)算估計(jì)量的標(biāo)準(zhǔn)差,至少對(duì)關(guān)鍵性的幾個(gè)估計(jì)量計(jì)算其標(biāo)準(zhǔn)差來(lái)說(shuō),僅需增加很少的額外開支或負(fù)擔(dān),但是他們并不意識(shí)到確定估計(jì)量的標(biāo)準(zhǔn)差的重要意義。這是否因?yàn)榻y(tǒng)計(jì)人員無(wú)意識(shí)地忽視了估計(jì)量的不精確性所產(chǎn)生的嚴(yán)峻的現(xiàn)實(shí)呢?計(jì)算標(biāo)準(zhǔn)差,并且把他們與估計(jì)量一起列出來(lái),應(yīng)該成為實(shí)際工作的一個(gè)常規(guī)。”估計(jì)量的方差在抽樣推斷中,有時(shí)往往只計(jì)算出估計(jì)量的值,而不1762.2.2簡(jiǎn)單估計(jì)量方差與協(xié)方差1.簡(jiǎn)單估計(jì)量的方差按照數(shù)理統(tǒng)計(jì)中的定義,有限總體的方差通常定義為:但在抽樣理論中,慣用的是另一種形式:2.2.2簡(jiǎn)單估計(jì)量方差與協(xié)方差1.簡(jiǎn)單估計(jì)量1771、簡(jiǎn)單估計(jì)量的方差1、簡(jiǎn)單估計(jì)量的方差178證明:仿照前面定理2.1之證明3引進(jìn)隨機(jī)變量,且運(yùn)用引理2.2的結(jié)論就可完成證明。參見31-32頁(yè)。證明:仿照前面定理2.1之證明3引進(jìn)隨機(jī)變量,且運(yùn)用引理2179抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件180推論2.4對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:推論2.4對(duì)于簡(jiǎn)單隨機(jī)抽樣,的方差為:181
182抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件1832、兩個(gè)估計(jì)量的協(xié)方差2、兩個(gè)估計(jì)量的協(xié)方差184抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件185抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件1862.2.3方差與協(xié)方差的估計(jì)2.2.3方差與協(xié)方差的估計(jì)187證明:只需證由定義由對(duì)稱論證法抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件188抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件189抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件190區(qū)間估計(jì)區(qū)間估計(jì)191在獲得各種總體特征的簡(jiǎn)單估計(jì)量的方差估計(jì)后,由于這些簡(jiǎn)單估計(jì)量均以樣本均值為核心構(gòu)建,根據(jù)中心極限定理它們都接近正態(tài)分布核心估計(jì)量樣本均值分布近似服從正態(tài)分布。于是,可按照數(shù)理統(tǒng)計(jì)中有關(guān)正態(tài)分布總體特征的區(qū)間估計(jì)步驟進(jìn)行估計(jì),首先根據(jù)樣本調(diào)查值計(jì)算出和,然后用作為的近似在獲得各種總體特征的簡(jiǎn)單估計(jì)量的方差估計(jì)后,由于這些簡(jiǎn)單估計(jì)192抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件193例子1`1例子1`1194抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件195例:在某地區(qū)10000戶家庭中,按簡(jiǎn)單隨機(jī)抽樣抽取400戶,調(diào)查一個(gè)月的伙食費(fèi)(單位:元)。經(jīng)計(jì)算:(1)試估計(jì)該地區(qū)平均每戶每月的伙食費(fèi),并估計(jì)其標(biāo)準(zhǔn)差。(忽略f)(2)給出置信度為95%時(shí)該地區(qū)平均每戶每月伙食費(fèi)的近似置信區(qū)間。例:在某地區(qū)10000戶家庭中,按簡(jiǎn)單隨機(jī)抽樣抽取400戶,196解:
(1)
(2)解:197例:某地區(qū)專業(yè)雜志目前擁有8000家訂戶,從中按簡(jiǎn)單隨機(jī)抽樣抽取了484戶,這484戶的年均收入為30500元,標(biāo)準(zhǔn)差為7040元。試求該雜志訂戶的年均收入的置信度為95%的近似置信區(qū)間。解:例:某地區(qū)專業(yè)雜志目前擁有8000家訂戶,從中按簡(jiǎn)單隨機(jī)1982.3比率估計(jì)量及其性質(zhì)2.3比率估計(jì)量及其性質(zhì)199一、使用比估計(jì)的兩種情況1.比值(或比率)一、使用比估計(jì)的兩種情況1.比值(或比率)200
例:例:201
例:“篩選性”問(wèn)題例:“篩選性”問(wèn)題202
例:1802年,法國(guó)的Laplace受政府委托進(jìn)行法國(guó)人口的估計(jì)與推算。推算方法如下:
2.利用輔助變量的信息改進(jìn)估計(jì)的精度例:1802年,法國(guó)的Laplace受政府委托進(jìn)行法國(guó)人口203利用輔助變量的信息改進(jìn)估計(jì)的精度利用輔助變量的信息改進(jìn)估計(jì)的精度204二、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì)1.比的簡(jiǎn)單估計(jì)量:二、簡(jiǎn)單隨機(jī)抽樣下的比估計(jì)2052.性質(zhì):
對(duì)于簡(jiǎn)單隨機(jī)抽樣2.性質(zhì):206證明:證明:207抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件208抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件209抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件210(3)比率估計(jì)量的方差估計(jì)(3)比率估計(jì)量的方差估計(jì)211抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件212比率估計(jì)量的方差估計(jì)值
比率估計(jì)量的方差估計(jì)值213例:某小區(qū)有1920戶,從中隨機(jī)抽取了70戶,調(diào)查各戶的住房面積(單位:平方米)和家庭人口,得數(shù)據(jù):
試對(duì)人均住房面積作點(diǎn)估計(jì)和置信度為95%的區(qū)間估計(jì)。例:某小區(qū)有1920戶,從中隨機(jī)抽取了70戶,調(diào)查各戶的住房214
解:解:2153.比率估計(jì)量與簡(jiǎn)單估計(jì)量的比較3.比率估計(jì)量與簡(jiǎn)單估計(jì)量的比較216回歸估計(jì)
Linearregression
回歸估計(jì)
Linearregression2171.簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總體總值的回歸估計(jì)量分別為:1.簡(jiǎn)單隨機(jī)抽樣中的回歸估計(jì)量:218抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件219抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件220抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件221證明:證明:222抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件223例:總體由75308個(gè)農(nóng)場(chǎng)組成,設(shè)yi為第i個(gè)農(nóng)場(chǎng)養(yǎng)牛的頭數(shù),xi為第i個(gè)農(nóng)場(chǎng)的面積。已知農(nóng)場(chǎng)平均面積為31.25英畝,選取一個(gè)樣本容量為2055的簡(jiǎn)單隨機(jī)樣本。經(jīng)計(jì)算得:
試估計(jì)每個(gè)農(nóng)場(chǎng)平均養(yǎng)牛頭數(shù)及標(biāo)準(zhǔn)差。例:總體由75308個(gè)農(nóng)場(chǎng)組成,設(shè)yi為第i個(gè)農(nóng)場(chǎng)養(yǎng)牛的頭數(shù)224解:解:2252.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本容量的確定的原則與主要因素
(一)費(fèi)用函數(shù)在簡(jiǎn)單隨機(jī)抽樣情況下,設(shè)調(diào)查函數(shù)為:
c:總費(fèi)用:
固定費(fèi)用:可變費(fèi)用
設(shè)計(jì)費(fèi)分析費(fèi)辦公費(fèi)管理費(fèi)場(chǎng)租費(fèi)等訪問(wèn)員費(fèi)交通費(fèi)禮品費(fèi)電話費(fèi)等2.5簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本容量的確定的原則與主要因226費(fèi)用與精度有關(guān)(二)誤差限誤差限是指在一定的概率保證下,參數(shù)及它的估計(jì)值的最大的絕對(duì)或相對(duì)誤差。種類:絕對(duì)誤差與相對(duì)誤差
絕對(duì)誤差:(1)(r=d)
相對(duì)誤差:費(fèi)用與精度有關(guān)2271-aa/2a/2
當(dāng)樣本量足夠大時(shí),可以用正態(tài)分布近似:區(qū)間與置信水平
均值的抽樣分布(1-)%區(qū)間包含了%的區(qū)間未包含1-aa/2a/2
當(dāng)樣本量足夠大時(shí),可以用正態(tài)分布近似228即由于可用估計(jì)量必定是近似無(wú)偏的,因此當(dāng)n充分大時(shí),根據(jù)正態(tài)分布的性質(zhì):(2)即229由(1)式與(2)得:絕對(duì)誤差:相對(duì)誤差:為的變異系數(shù),上式中可以用替代。由(1)式與(2)得:絕對(duì)誤差:230(三)其他考慮因素1、問(wèn)題的重要性2、所研究問(wèn)題目標(biāo)量的個(gè)數(shù)3、參照同類調(diào)查4、調(diào)查表的回收率
n=初始樣本量/預(yù)計(jì)有效回答率5、有效樣本6、資源限制等其他因素(三)其他考慮因素1、問(wèn)題的重要性231(二)總體參數(shù)為Y或的情形
將代入d
或(二)總體參數(shù)為Y或的情形232得到:或在實(shí)際工作中,通常先計(jì)算
或得到:233其中:C=為總體變異系數(shù)。如果
﹤0.05,則就
取,否則對(duì)進(jìn)行修正:
n=
(三)總體參數(shù)為P的情形
V(P)=其中:C=為總體變異系數(shù)。如果﹤0.0234抽樣技術(shù)第二章_簡(jiǎn)單隨機(jī)抽樣xx課件235在實(shí)際工作中,通常先計(jì)算:
或如果﹤0.05,就取,否則對(duì)進(jìn)行修正:
或:或:236
注:的保守估計(jì);
當(dāng)時(shí),PQ很接近P=0.5時(shí)的最大值0.25,常常以P=0.5代入計(jì)算;
當(dāng)P<0.1(或P>0.9)時(shí),若用p=0.5來(lái)計(jì)算,則y樣本量過(guò)大。
pq=0.5*0.5=0.25注:的保守估計(jì);pq=0.5*0.5=0.237
【例2.7】某銷售公司希望了解全部3000家客戶對(duì)該公司的綜合滿意程度,決定用電話調(diào)查一個(gè)簡(jiǎn)單隨機(jī)樣本。這時(shí),銷售公司希望以95%的把握保證客戶滿意的總體比例P在樣本比例的范圍內(nèi),但對(duì)總體比例P無(wú)法給出一個(gè)大致的范圍.這時(shí),應(yīng)調(diào)查多少個(gè)客戶,才能保證對(duì)總體比例估計(jì)的要求?
解:N=3000d=10%=0.1Z=1.96
238修正樣本量n:
兩個(gè)樣本量計(jì)算的結(jié)果很接近,說(shuō)明抽樣比小于5%時(shí),可以不計(jì)算修正樣本量?!纠吭谌丝谧儎?dòng)情況調(diào)查中,出生率是一個(gè)十分重要的指標(biāo).根據(jù)以前調(diào)查的數(shù)據(jù),出生率的估計(jì)可取為18‰,問(wèn)在置信度95%下,實(shí)際調(diào)查估計(jì)P的絕
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學(xué)真題練習(xí)試卷B卷附答案
- 2024年交通運(yùn)輸設(shè)備項(xiàng)目資金需求報(bào)告代可行性研究報(bào)告
- 一年級(jí)數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)1000題匯編
- 2024年個(gè)人房產(chǎn)抵押貸款協(xié)議范本
- 文書模板-《勞務(wù)用工合同》
- 2024年度安置性質(zhì)房產(chǎn)購(gòu)買協(xié)議典范
- 2024老年專家返聘協(xié)議詳細(xì)條款
- 2024屆安徽省皖南八校聯(lián)盟高三4月(二診)調(diào)研測(cè)試卷(康德版)數(shù)學(xué)試題
- 2024年度建筑資產(chǎn)轉(zhuǎn)讓協(xié)議樣例
- 2024精簡(jiǎn)型牛肉購(gòu)銷協(xié)議文本
- 20以內(nèi)進(jìn)位加法100題(精心整理6套-可打印A4)
- 陜西師范大學(xué)學(xué)位英語(yǔ)試題
- 中小學(xué)反恐風(fēng)險(xiǎn)評(píng)估報(bào)告
- 品牌營(yíng)銷策略和品牌策略
- 視力矯正商業(yè)計(jì)劃書
- 醫(yī)學(xué)課件:臨床決策分析
- 幼兒園優(yōu)質(zhì)公開課:中班音樂(lè)韻律《打噴嚏的小老鼠》課件
- 質(zhì)量管理體系品質(zhì)保證體系圖
- 人教版(新插圖)三年級(jí)上冊(cè)數(shù)學(xué) 第9課時(shí) 用乘除兩步計(jì)算 解決-歸總問(wèn)題 教學(xué)課件
- 《現(xiàn)代漢語(yǔ)》考試復(fù)習(xí)題庫(kù)及答案
- 13J104《蒸壓加氣混凝土砌塊、板材構(gòu)造》
評(píng)論
0/150
提交評(píng)論