抽樣調(diào)查基本原理課件

上傳人：言*** IP屬地：未知上傳時(shí)間：2024-11-23 格式：PPT 頁(yè)數(shù)：28 大?。?74KB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩23頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣調(diào)查基本原理第一節(jié)有關(guān)基本概念

一、總體總體也叫母體，它是所要認(rèn)識(shí)對(duì)象的全體，是具有同一性質(zhì)的許多單位的集合。組成總體的每個(gè)個(gè)體叫做單位。在抽樣以前，必須根據(jù)實(shí)際情況把總體劃分成若干個(gè)互不重疊并且能組合成總體的部分，每個(gè)部分稱為一個(gè)抽樣單元，不論總體是否有限，總體中的抽樣單元數(shù)一定是有限的，而且是已知的，因此說(shuō)抽樣調(diào)查的總體總是有限的?？傮w應(yīng)具備同質(zhì)性、大量性和差異性的特征。在抽樣調(diào)查中，通常將反映總體數(shù)量特征的綜合指標(biāo)稱為總體參數(shù)。常見(jiàn)的總體參數(shù)主要有：總體總和Y總體均值總體比率R總體比例P

二、樣本樣本是由從總體中所抽選出來(lái)的若干個(gè)抽樣單元組成的集合體。抽樣前，樣本是一個(gè)n維隨機(jī)變量，屬樣本空間；抽樣后，樣本是一個(gè)n元數(shù)組，是樣本空間的一個(gè)點(diǎn)。影響樣本代表性的因素有以下幾個(gè)方面：(1)總體標(biāo)志值分布的離散程度。

(2)抽樣單元數(shù)的多少(或稱樣本容量的大小)。(3)抽樣方法。一般將反映樣本數(shù)量特征的綜合指標(biāo)稱之為統(tǒng)計(jì)量。統(tǒng)計(jì)量是n元樣本的一個(gè)實(shí)值函數(shù)，是一個(gè)隨機(jī)變量，統(tǒng)計(jì)量的一個(gè)具體取值即為統(tǒng)計(jì)值。主要的樣本統(tǒng)計(jì)量有：樣本總和y樣本均值樣本比率r樣本比例p

三、必要樣本容量和樣本可能數(shù)目樣本中包含的抽樣單元個(gè)數(shù)稱為樣本容量，又稱樣本含量或樣本大小。樣本可能數(shù)目則是在容量為N的總體中抽取容量為n的樣本時(shí)，所有可能被抽中的不同樣本的個(gè)數(shù)。用A表示。當(dāng)N和n一定時(shí)，A的多少與抽樣方法有關(guān)，其計(jì)算方法列表如下：抽樣方法放回抽樣不放回抽樣考慮順序不考慮順序四、抽樣框抽樣框是在抽樣前，為便于抽樣工作的組織，在可能條件下編制的用來(lái)進(jìn)行抽樣的、記錄或表明總體所有抽樣單元的框架，在抽樣框中，每個(gè)抽樣單元都被編上號(hào)碼。編制抽樣框是一個(gè)實(shí)際的、重要的問(wèn)題，因此必須要認(rèn)真對(duì)待。抽樣框可以是一份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)。常見(jiàn)的抽樣框問(wèn)題可以概括為四種基本類型：(1)缺失一些元素，即抽樣框涵蓋不完全；(2)多個(gè)元素對(duì)應(yīng)一個(gè)號(hào)碼；(3)空白(一些號(hào)碼沒(méi)有與之對(duì)應(yīng)的元素)或存在異類元素；(4)重復(fù)號(hào)碼，即一個(gè)元素對(duì)應(yīng)多個(gè)號(hào)碼。返回第二節(jié)樣本統(tǒng)計(jì)量的抽樣分布一、正態(tài)分布如果總體各個(gè)體的標(biāo)志值以總體平均數(shù)為中心，形成鐘型對(duì)稱分布，其分布曲線向兩側(cè)擴(kuò)展，逐漸向橫軸逼近，無(wú)限延伸出去，但不接觸橫軸，則這種分布就叫做正態(tài)分布，或高斯分布、常態(tài)分布。服從正態(tài)分布的總體稱為正態(tài)總體。如果一個(gè)隨機(jī)變量X服從正態(tài)分布，則其分布的密度函數(shù)(分布曲線方程)為：

當(dāng)μ=0,σ2=1時(shí)，稱該分布為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為，

任何正態(tài)分布，它的樣本落在任意區(qū)間(a,b)內(nèi)的概率等于直線x=a，x=b，橫坐標(biāo)和曲線f(x)所夾的面積(可由正態(tài)分布概率積分表查得)。經(jīng)計(jì)算,正態(tài)總體的樣本落在：

(-σ,+σ)概率是68.27％；

(-2σ,+2σ)概率是95.45％；

(-3σ,+3σ)概率是99.73％；

(-1.96σ,+1.96σ)概率是95％；二、抽樣分布抽樣分布是根據(jù)所有可能樣本計(jì)算出來(lái)的某一統(tǒng)計(jì)量的數(shù)值分布。抽樣分布有極限分布和精確分布兩類。極限分布也叫做大樣本分布，它只有正態(tài)分布一種形式；精確分布又叫做小樣本分布，其前提是總體服從正態(tài)分布，它是正態(tài)分布的導(dǎo)出分布，包括有t分布、F分布和分布等形式。χ2

一般地，可以證明如果總體服從正態(tài)分布，且總體均值和方差均為已知，即

Y～N(μ，σ2)則不論樣本量大小如何，樣本均值均圍繞總體均值而服從正態(tài)分布，并且其抽樣分布的方差等于總體方差的n分之一，即～N(μ，σ2/n)

而對(duì)于非正態(tài)總體，若均值μ和σ2有限，則根據(jù)中心極限定理，當(dāng)樣本量n充分大時(shí)，樣本均值仍然圍繞著總體均值而近似地服從正態(tài)分布，即～N(μ，σ2/n)

(一)樣本統(tǒng)計(jì)量的極限分布

例：總體N=5,Y=｛40，50，60，70，80｝，則其次數(shù)分布圖為若取n=2，用放回抽樣，

可抽25個(gè)簡(jiǎn)單隨機(jī)樣本，整理后，即可得出關(guān)于樣本均值的次數(shù)分布情況為：

404550556065707580f123454321用圖形表示，則為：如果總體容量較大，則當(dāng)樣本容量逐步擴(kuò)大時(shí)，樣本平均數(shù)的分布趨于正態(tài)分布的趨勢(shì)更加明顯。(二)樣本統(tǒng)計(jì)量的精確分布1、χ2分布設(shè)隨機(jī)變量Yi～N(0,1)(i=1,2,…，n),且相互獨(dú)立，則Y=∑Y2i服從自由度為n的χ2分布，記作Y～χ2(n)。χ2分布的概率密度函數(shù)為主要性質(zhì)有：①f(y)恒為正；②χ2分布呈右偏形態(tài)；③χ2分布隨n的不斷增大而逐漸趨于正態(tài)分布。

χ2分布χ2(n)的數(shù)學(xué)期望和方差分別為EY=n,DY=2n.2、t分布若X～N(0，1)，Y～χ2(n)，且X與Y相互獨(dú)立，則稱隨機(jī)變量服從自由度為n的t分布，記作：T～t(n)。

推論：若X～N(μ，σ2)，σ2未知，則

服從自由度為n-1的t分布，記作：T～t(n-1)

t分布t(n)的概率密度函數(shù)為

t分布具有如下性質(zhì)：①t分布對(duì)稱于縱軸，與N(0，1)相似；②在n＜30(小樣本)時(shí)，t分布的方差大于N(0，1)的方差；③在n≥30(大樣本)時(shí)，t分布隨n的增大而趨于N(0，1)。

t分布t(n)的數(shù)學(xué)期望與方差分別為ET=0，DT=n/(n-2).(n＞2)

若X～χ2(n1)，Y～χ2(n2)，且X與Y相互獨(dú)立，則稱隨機(jī)變量

3、F分布服從第一自由度為n1，第二自由度為n2的F分布，記作：F～F(n1,n2)。其概率密度函數(shù)為F分布的主要性質(zhì)有：①F分布呈右偏態(tài)；②f(x)恒為正；③在

④隨n1,n2的不斷增大，F(xiàn)分布的右偏程度逐漸減弱，但不會(huì)趨向正態(tài)；⑤具有倒數(shù)性質(zhì)，即若X～F(n1,n2)，則1/X～F(n1,n2)；⑥若t～t(n),則t2(n)～F(1,n)。

處取最大值(n1＞2，f0＜1)；其數(shù)學(xué)期望和方差分別為返回第三節(jié)抽樣誤差一、抽樣調(diào)查中的誤差來(lái)源誤差就是調(diào)查結(jié)果與現(xiàn)象的實(shí)際結(jié)果之間的偏差，它幾乎在所有的統(tǒng)計(jì)調(diào)查中都或大或小的存在著。在抽樣調(diào)查中，按照形成原因的不同，一般可將誤差分成抽樣誤差和非抽樣誤差兩大類。抽樣誤差是用樣本統(tǒng)計(jì)量推斷總體參數(shù)時(shí)的誤差，它屬于一種代表性誤差。

在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是，抽樣誤差可以計(jì)算，并且可以被控制在任意小的范圍內(nèi)。

影響抽樣誤差的因素

1.抽樣誤差通常會(huì)隨樣本量的大小而增減。

2.所研究現(xiàn)象總體變異程度的大小。

3.抽樣的方式方法。

非抽樣誤差不是由于抽樣引起的。它又包括：調(diào)查誤差；無(wú)回答誤差；抽樣框誤差；登記性誤差。同抽樣誤差相反，非抽樣誤差是隨著樣本量的增加而增大的。由于抽樣調(diào)查的訪問(wèn)和資料整理都比普查更便于進(jìn)行，因此非抽樣誤差也遠(yuǎn)遠(yuǎn)小于普查。有時(shí)，普查中的非抽樣誤差甚至大于抽樣調(diào)查中抽樣誤差與非抽樣誤差的總和。二、抽樣誤差的計(jì)算抽樣誤差的計(jì)算，是建立在誤差分布理論基礎(chǔ)上，從統(tǒng)計(jì)平均意義角度來(lái)考慮的。

抽樣誤差用所有可能的實(shí)際誤差的均方誤差表示

MSE()=E(-θ)2=E［

-E(

)］2+［E()-θ］2

式中第一項(xiàng)是估計(jì)量的方差，記作V()。

式中第二項(xiàng)是估計(jì)量的偏倚B()的平方。

無(wú)偏估計(jì)時(shí)，的方差就等于它的均方誤差。

說(shuō)明：①上面所給出的估計(jì)量方差公式實(shí)際中當(dāng)σ2未知時(shí)，一般用樣本方差s2代替以對(duì)②有偏的估計(jì)并非都是不可用的，有時(shí)有偏估計(jì)量在某些方面反而比無(wú)偏估計(jì)量更好。有研究認(rèn)為，在實(shí)踐中當(dāng)偏倚小于標(biāo)準(zhǔn)誤的十分之一時(shí)，偏倚對(duì)估計(jì)量準(zhǔn)確度的影響可以忽略不計(jì)。仍然屬于一個(gè)理論公式，是依據(jù)調(diào)查變量的總體方差σ2進(jìn)行計(jì)算的，估計(jì)量的方差做出估計(jì)。返回第四節(jié)抽樣估計(jì)一、抽樣估計(jì)的特點(diǎn)第一,抽樣估計(jì)在邏輯上運(yùn)用的是歸納推理而不是演繹推理。第二,抽樣估計(jì)在方法上運(yùn)用不確定的概率估計(jì)法而不是運(yùn)用確定的數(shù)學(xué)分析法。第三,抽樣估計(jì)的結(jié)論存在著一定程度的抽樣誤差。二、抽樣估計(jì)的方法抽樣估計(jì)的方法多種多樣。如果以估計(jì)中所依據(jù)的資料不同來(lái)區(qū)分，一般可以有簡(jiǎn)單估計(jì)、比估計(jì)和回歸估計(jì)等三種方法。簡(jiǎn)單估計(jì)是單純依靠樣本調(diào)查變量的資料估計(jì)總體參數(shù)，其估計(jì)結(jié)果稱為簡(jiǎn)單估計(jì)量；比估計(jì)和回歸估計(jì)是同時(shí)依據(jù)樣本調(diào)查變量以及已知的有關(guān)輔助變量的資料來(lái)對(duì)總體參數(shù)做出估計(jì)，其結(jié)果分別稱為比估計(jì)量和回歸估計(jì)量。如果以估計(jì)結(jié)果的表示方式來(lái)區(qū)分，則抽樣估計(jì)可以有兩種形式，即定值估計(jì)和區(qū)間估計(jì)。三、置信區(qū)間一般地說(shuō)，若估計(jì)量是無(wú)偏的，且呈正態(tài)分布，則參數(shù)θ的置信度當(dāng)調(diào)查變量的總

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣調(diào)查基本原理課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣調(diào)查基本原理課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔