版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、樣本量的確定方法 (2008-10-14 09:12:34)一、樣本單位數(shù)量的確定原則一般情況下,確定樣本量需要考慮調(diào)查的目的、性質(zhì)和精度要求。以及實 際操作的可行性、經(jīng)費承受能力等。根據(jù)調(diào)查經(jīng)驗,市場潛力和推斷等涉及量 比較嚴(yán)格的調(diào)查需要的樣本量比較大,而一般廣告效果等人們差異不是很大或 對樣本量要求不是很嚴(yán)格的調(diào)查,樣本量相對可以少一些。實際上確定樣本量 大小是比較復(fù)雜的問題,即要有定性的考慮,也要有定量的考慮;從定性的方 面考慮,決策的重要性、調(diào)研的性質(zhì)、數(shù)據(jù)分析的性質(zhì)、資源、抽樣方法等都 決定樣本量的大小。但是這只能原則上確定樣本量大小。具體確定樣本量還需 要從定量的角度考慮。從定量的
2、方面考慮 , 有具體的統(tǒng)計學(xué)公式 , 不同的抽樣方法有不同的公式。歸納 起來,樣本量的大小主要取決于:(1) 研究對象的變化程度,即變異程度;(2) 要求和允許的誤差大小,即精度要求;(3) 要求推斷的置信度,一般情況下,置信度取為 95%;(4) 總體的大小;(5) 抽樣的方法。也就是說,研究的問題越復(fù)雜 ,差異越大時 ,樣本量要求越大;要求的精度越高, 可推斷性要求越高時 , 樣本量也越大;同時 , 總體越大 , 樣本量也相對要大 , 但 是, 增大呈現(xiàn)出一定對數(shù)特征 , 而不是線形關(guān)系;而抽樣方法問題 , 決定設(shè)計效應(yīng) 的值, 如果我們設(shè)定簡單隨機抽樣設(shè)計效應(yīng)的值是 1;分層抽樣由于抽樣
3、效率高 于簡單隨機抽樣,其設(shè)計效應(yīng)的值小于 1, 合適恰當(dāng)?shù)姆謱?,將使層?nèi)樣本差異 變小,層內(nèi)差異越小,設(shè)計效應(yīng)小于 1 的幅度越大;多階抽樣由于效率低于簡 單隨機抽樣,設(shè)計效應(yīng)的值大于 1, 所以抽樣調(diào)查方法的復(fù)雜程度決定其樣本量 大小。對于不同城市 , 如果總體不知道或很大 , 需要進(jìn)行推斷時 , 大城市多抽 , 小 城市少抽 ,這種說法原則上是不對的。實際上 , 在大城市抽樣太大是浪費 ,在小城 市抽樣太少沒有推斷價值。二、樣本量的確定方法如何確定樣本量 ,基本方法很多 , 但是公式檢驗表明 ,當(dāng)誤差和置信區(qū)間一 定時,不同的樣本量計算公式計算出來的樣本量是十分相近的, 所以,我們完全可
4、以使用簡單隨機抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量 , 這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個子域中去。所 以,區(qū)域二相抽樣不能計算樣本量的說法是不科學(xué)的。1簡單隨機抽樣確定樣本量主要有兩種類型 :1)對于平均數(shù)類型的變量對于已知數(shù)據(jù)為絕對數(shù) , 我們一般根據(jù)下列步驟來計算所需要的樣本量。已 知期望調(diào)查結(jié)果的精度 (E), 期望調(diào)查結(jié)果的置信度 (L), 以及總體的標(biāo)準(zhǔn)差估計值c的具體數(shù)據(jù),總體單位數(shù)No計算公式為:n= c 2/(e 7z2+/N)特殊情況下 ,如果是很大總體 , 計算公式變?yōu)?:n= Z 2c 2/e 2例如希望平均收入的誤差在正負(fù)人民幣 3
5、0元之間 ,調(diào)查結(jié)果在 95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96。根據(jù)估計總體的標(biāo)準(zhǔn)差為150元,總體單位數(shù)為 1000o樣本量 :n=150*150/(30*30/(1.96*1.96)+150*150/1000)=88(2) 于百分比類型的變量對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計算樣本量。已知調(diào)查結(jié)果的精度值百分比 (E), 以及置信度 (L), 比例估計 (P) 的精度 , 即樣本變異程度,總體數(shù)為No則計算公式為 :n=P(1-P)/(e2/Z2+ P(1-P)/N)同樣, 特殊情況下如果不考慮總體 , 公式為 :n= Z P(1-P)/e一般情況下,我們不知
6、道P的取值,取其樣本變異程度最大時的值為0.5 o例如: 希望平均收入的誤差在正負(fù) 0.05 之間,調(diào)查結(jié)果在 95%的置信范圍以內(nèi)其 95%的置信度要求 Z 的統(tǒng)計量為 1.96 ,估計 P 為 0.5, 總體單位數(shù)為 1000。樣 本量為 :n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=2782. 樣本量分配方法以上分析我們獲得了采用簡單隨機抽樣公式計算得到的樣本量,總的樣本 量需要在此基礎(chǔ)上乘以設(shè)計效應(yīng)的值得到。由于樣本總量已經(jīng)確定, 我們采用總樣本量固定方法分配樣本 , 這種方法包括按照比例分配和不按照比例分配兩類。 實際工作中首先計算取
7、得區(qū)縣總的樣本量 , 然后逐級將其分配到各階分層中 ,如 果不清楚各階分層的規(guī)模和方差等 , 一般采取比例分配或者比例平方根分配法。 如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量。3. 樣本量和總體大小的關(guān)系 :在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總 體的大小而變化。但是,總體越大,其變化越不明顯;總體較小時,變化明顯。 其變化趨勢如下:二者之間的變化并非是線性關(guān)系。所以,樣本量并不是越大越好,應(yīng)該綜 合考慮,實際工作中只要達(dá)到要求就可以了。三、抽樣調(diào)查方案樣本量的確定我們決定首先采取簡單隨機抽樣的方法計算區(qū)縣的樣本量,之所以首先對 區(qū)縣計算樣本量 ,
8、 主要是考慮,雖然我們方案中沒有要求對區(qū)縣的估計量,但是 區(qū)縣一級是我們做計劃和決策的基礎(chǔ),具有承上啟下的作用,如果區(qū)縣級獲得 的估計量精度比較高,就可以保證上一級的估計量具有更高的精度,而且各個 區(qū)縣的樣本量可以認(rèn)為是相同的,這主要是因為各個區(qū)縣的總體數(shù)都比較多, 而且我們也不清楚;同時也不可能事先進(jìn)行區(qū)縣方差估計。沒有首先計算區(qū)縣 以下各階分層的樣本量 , 主要是考慮 :(1)如果計算區(qū)縣以下某階分層的樣本量 , 然后再將計算的樣本量合并 ,將 顯著增加樣本量,增加基層的負(fù)擔(dān)。(2)事實上 ,對于計算階可以比較好的得到它的估計量 , 但我們現(xiàn)在不需要 得到區(qū)縣以下各階分層的估計量 , 我們
9、僅僅需要區(qū)縣的估計量 , 沒有必要計算區(qū) 縣以下階樣本量。( 3)我們直接對整個區(qū)縣以簡單隨機抽樣進(jìn)行抽取, 然后將其樣本量合理分配到各階分層中 , 這樣可以使用較少樣本量得到區(qū)縣較好的估計量。以下我們以試點地區(qū)批零業(yè)為對象進(jìn)行研究。由于沒有誤差限以及置信度 和抽樣比率的值。我們可以采用常用參數(shù) : 設(shè)定區(qū)縣總體為很大 ,置信度是 95%, 抽樣比率保守估計是 0.5, 抽樣誤差不能大于 15%,根據(jù)公式計算得到樣本量為 43 個。由于采取多階分層抽樣 , 我們?nèi)绾卧O(shè)定抽樣設(shè)計效應(yīng)呢 ?區(qū)縣及以下是三階 分層抽樣 ,只要在各階進(jìn)行合適的分層,其設(shè)計效應(yīng)應(yīng)該在 2-3 之間, 我們在這 里取保守
10、值 3,那么得到本區(qū)縣樣本量是 129個, 這個樣本量就可以根據(jù)新方案得 到區(qū)縣要求誤差內(nèi)的估計值。1. 確定辦事處、居委會、村委會樣本量根據(jù)方案,每個居委會抽取樣本 5-10 個,那么這個樣本量是否可行呢 ?這里 涉及如何將區(qū)縣樣本分配到街道和居委會中去,根據(jù)方案要求,街道抽取采取 先分層,后對層內(nèi)進(jìn)行 PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要 看輔助變量與樣本量之間的關(guān)聯(lián)程度,方案中提供了兩個輔助變量:人口數(shù)和 個體數(shù),對于輔助變量是個體數(shù)的完全可以使用規(guī)模分配方法分配樣本量,個 體數(shù)多的分配較多的樣本量;對于輔助變量是人口數(shù)的如果采取規(guī)模分配方法, 由于人口數(shù)與一個地區(qū)的個體單
11、位數(shù)沒有必然的聯(lián)系,可能導(dǎo)致某些居委會的 個體數(shù)比較多,卻分配了較少的樣本量,使得居委會分層變的困難,同時使居 委會方差顯著增大。而獲得較多樣本量的居委會,分層的效果和方差提高幅度 有限,故采用比例分配的方法可能更加合適一些。對于居委會村委會的抽取, 由于本階可能存在市場內(nèi)的抽樣,分配復(fù)雜一些;如果本階有市場內(nèi)抽樣,可 以適當(dāng)減少居委會村委會的樣本量, 但應(yīng)該大于本階樣本量的 80%,由于市場內(nèi) 抽樣的特殊性,建議將本階樣本量全部分配給居委會村委會,我們所進(jìn)行的試 點就是將樣本全部分配給居委會;至于市場內(nèi)抽樣的具體實施,可以根據(jù)方案 操作完成。對居委會村委會層內(nèi),由于使用簡單隨機抽樣完成,采用
12、比例分配 平均分配就可。在實際工作時 , 由于一個區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個;根據(jù)方案, 區(qū)縣抽取辦事處的數(shù)量應(yīng)該介于 12-4 個之間, 對應(yīng)于抽中鄉(xiāng)、鎮(zhèn)、街道的全部 或其中一個,那么其每一個鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應(yīng)該是 11-32 個之間;所抽中的居委會、村委會數(shù)量應(yīng)該介于 16-48 個之間 , 如果個別 鄉(xiāng)鎮(zhèn)街道抽中的居委會是 2 個,則其居委會總數(shù)相應(yīng)減少一些;最后 , 每個居委 會、村委會的樣本量應(yīng)該介于 3-16 個之間 , 大部分介于 5-10 之間。以上的討論 沒有考慮總體的大小 ,如果考慮到居委會、村委會的總體有限 , 則每個居委會村 委會的樣本量可以減
13、少一些 , 具體可以采用以下公式得到具體樣本量的調(diào)整數(shù) :樣本量n=n 1*N/(N+n1)。N是本地區(qū)總體,n1是給本地區(qū)分配樣本量居委會樣本量的調(diào)整數(shù),應(yīng)該作為本居委會樣本量的底限。確定辦事處、居委會村委會的樣本量 , 與以下幾點有關(guān) :a) 估計量的誤差、置信度,可以決定簡單隨機抽樣的樣本量b) 與采用的抽樣方法有關(guān)系,它決定了設(shè)計效應(yīng)的大小。例如:分層抽樣的 設(shè)計效應(yīng)值小于 1, 多階抽樣的設(shè)計效應(yīng)值大于 1??梢詻Q定整個抽樣的樣本量。c) 與每一階的分層的數(shù)目有關(guān)系 , 所以, 應(yīng)該重點考慮分層的問題 , 分層太 多, 沒有必要;分層太少 , 導(dǎo)致層內(nèi)的方差增大 , 可能影響估計值的
14、精度以及設(shè)計 效應(yīng)的值 , 所以,在每階分層時 , 應(yīng)該合理考慮 , 使得樣本的變異程度在層內(nèi)達(dá)到 一個合理水平。根據(jù)以上原則,我們在包頭的抽樣試點共抽取 4個辦事處 , 包括 14 個居委 會;一個鄉(xiāng) , 包括 4個村委會 , 經(jīng)過清查共有批零業(yè) 1042個, 單位 70個;餐飲業(yè) 250個, 單位 3 個。由于我們使用人口數(shù)作為輔助變量,應(yīng)該采用比例分配方法 平均分配樣本量,這樣每個街道辦事處得到 26個樣本 , 對于抽取 4個居委會的辦事處, 每個居委會分配得到 7個樣本;對于抽取 2個居委會的辦事處 , 每個居 委會分配到 13 個樣本。然后根據(jù)居委會總體對樣本量做出調(diào)整,得到居委會實
15、 際樣本量。2. 確定居委會村委會內(nèi)分層樣本量以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會村委會樣本量 , 現(xiàn)在分析給居委會村 委會以下各層分配樣本量 ,這一步 ,清查的工作就顯得非常重要了 ,重點應(yīng)該清 查規(guī)模、類別,首先是規(guī)模, 規(guī)模的大小不應(yīng)該根據(jù)工商注冊為單位或個體決定, 應(yīng)該根據(jù)實際情況,即使是個體,如果規(guī)模較大,也應(yīng)該歸入大規(guī)模分層中, 這樣就可以使得每層的樣本變異程度顯著降低,從而提高精確度。根據(jù)實際情 況可以包括兩種:(1)如果全部是規(guī)模比較小的單位個體戶,我們可以根據(jù)類別進(jìn)行適當(dāng)?shù)?分組,將某一類單位比較多的單獨分層;將另外類別比較少的,可以幾類合并 進(jìn)行抽取具體樣本,分層不要多于 4 層,并保證每層的樣本量不小于 2 個。由 于居委會樣本量數(shù)目已經(jīng)確定,我們可以直接采取比例分配方法,確定各層樣 本量。(2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨分層, 不用考慮其中的類別;將規(guī)模較小的主要是個體戶可以根據(jù)類別進(jìn)行分層;其 中的難題是如何將樣本量在規(guī)模大的和規(guī)模小的之間分配,因為大規(guī)模層內(nèi)樣 本變異程度有可能很大,應(yīng)該抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度水利工程項目投標(biāo)擔(dān)保委托保證合同3篇
- 二零二五版葫蘆島市房屋繼承合同范本3篇
- 基于二零二五年業(yè)績目標(biāo)的小型餐飲店面館飯店加盟合同3篇
- 二零二五年湖南機關(guān)事業(yè)單位合同制工人醫(yī)療保險聘用合同3篇
- 二零二五版電梯門套工程安全風(fēng)險評估與應(yīng)急預(yù)案合同3篇
- 二零二五年電子商務(wù)糾紛解決機制合同2篇
- 二零二五年度辣椒種植與農(nóng)業(yè)科技創(chuàng)新合作合同3篇
- 二零二五年度物流配送中心場地租賃合同BF06023篇
- 二零二五年度服裝調(diào)換貨及退貨處理合同范本3篇
- 二零二五年度酒店住宿代理服務(wù)合同示范文本2篇
- 新版DFMEA基礎(chǔ)知識解析與運用-培訓(xùn)教材
- 制氮機操作安全規(guī)程
- 衡水市出租車駕駛員從業(yè)資格區(qū)域科目考試題庫(全真題庫)
- 護(hù)理安全用氧培訓(xùn)課件
- 《三國演義》中人物性格探析研究性課題報告
- 注冊電氣工程師公共基礎(chǔ)高數(shù)輔導(dǎo)課件
- 土方勞務(wù)分包合同中鐵十一局
- 乳腺導(dǎo)管原位癌
- 冷庫管道應(yīng)急預(yù)案
- 司法考試必背大全(涵蓋所有法律考點)
- 公共部分裝修工程 施工組織設(shè)計
評論
0/150
提交評論