抽樣調(diào)查基本原理課件_第1頁(yè)
抽樣調(diào)查基本原理課件_第2頁(yè)
抽樣調(diào)查基本原理課件_第3頁(yè)
抽樣調(diào)查基本原理課件_第4頁(yè)
抽樣調(diào)查基本原理課件_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣調(diào)查基本原理第一節(jié)有關(guān)基本概念

一、總體總體也叫母體,它是所要認(rèn)識(shí)對(duì)象的全體,是具有同一性質(zhì)的許多單位的集合。組成總體的每個(gè)個(gè)體叫做單位。在抽樣以前,必須根據(jù)實(shí)際情況把總體劃分成若干個(gè)互不重疊并且能組合成總體的部分,每個(gè)部分稱為一個(gè)抽樣單元,不論總體是否有限,總體中的抽樣單元數(shù)一定是有限的,而且是已知的,因此說(shuō)抽樣調(diào)查的總體總是有限的??傮w應(yīng)具備同質(zhì)性、大量性和差異性的特征。在抽樣調(diào)查中,通常將反映總體數(shù)量特征的綜合指標(biāo)稱為總體參數(shù)。常見(jiàn)的總體參數(shù)主要有:總體總和Y總體均值總體比率R總體比例P

二、樣本樣本是由從總體中所抽選出來(lái)的若干個(gè)抽樣單元組成的集合體。抽樣前,樣本是一個(gè)n維隨機(jī)變量,屬樣本空間;抽樣后,樣本是一個(gè)n元數(shù)組,是樣本空間的一個(gè)點(diǎn)。影響樣本代表性的因素有以下幾個(gè)方面:(1)總體標(biāo)志值分布的離散程度。

(2)抽樣單元數(shù)的多少(或稱樣本容量的大小)。(3)抽樣方法。一般將反映樣本數(shù)量特征的綜合指標(biāo)稱之為統(tǒng)計(jì)量。統(tǒng)計(jì)量是n元樣本的一個(gè)實(shí)值函數(shù),是一個(gè)隨機(jī)變量,統(tǒng)計(jì)量的一個(gè)具體取值即為統(tǒng)計(jì)值。主要的樣本統(tǒng)計(jì)量有:樣本總和y樣本均值樣本比率r樣本比例p

三、必要樣本容量和樣本可能數(shù)目樣本中包含的抽樣單元個(gè)數(shù)稱為樣本容量,又稱樣本含量或樣本大小。樣本可能數(shù)目則是在容量為N的總體中抽取容量為n的樣本時(shí),所有可能被抽中的不同樣本的個(gè)數(shù)。用A表示。當(dāng)N和n一定時(shí),A的多少與抽樣方法有關(guān),其計(jì)算方法列表如下:抽樣方法放回抽樣不放回抽樣考慮順序不考慮順序四、抽樣框抽樣框是在抽樣前,為便于抽樣工作的組織,在可能條件下編制的用來(lái)進(jìn)行抽樣的、記錄或表明總體所有抽樣單元的框架,在抽樣框中,每個(gè)抽樣單元都被編上號(hào)碼。編制抽樣框是一個(gè)實(shí)際的、重要的問(wèn)題,因此必須要認(rèn)真對(duì)待。抽樣框可以是一份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)。常見(jiàn)的抽樣框問(wèn)題可以概括為四種基本類型:(1)缺失一些元素,即抽樣框涵蓋不完全;(2)多個(gè)元素對(duì)應(yīng)一個(gè)號(hào)碼;(3)空白(一些號(hào)碼沒(méi)有與之對(duì)應(yīng)的元素)或存在異類元素;(4)重復(fù)號(hào)碼,即一個(gè)元素對(duì)應(yīng)多個(gè)號(hào)碼。返回第二節(jié)樣本統(tǒng)計(jì)量的抽樣分布一、正態(tài)分布如果總體各個(gè)體的標(biāo)志值以總體平均數(shù)為中心,形成鐘型對(duì)稱分布,其分布曲線向兩側(cè)擴(kuò)展,逐漸向橫軸逼近,無(wú)限延伸出去,但不接觸橫軸,則這種分布就叫做正態(tài)分布,或高斯分布、常態(tài)分布。服從正態(tài)分布的總體稱為正態(tài)總體。如果一個(gè)隨機(jī)變量X服從正態(tài)分布,則其分布的密度函數(shù)(分布曲線方程)為:

當(dāng)μ=0,σ2=1時(shí),稱該分布為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為,

任何正態(tài)分布,它的樣本落在任意區(qū)間(a,b)內(nèi)的概率等于直線x=a,x=b,橫坐標(biāo)和曲線f(x)所夾的面積(可由正態(tài)分布概率積分表查得)。經(jīng)計(jì)算,正態(tài)總體的樣本落在:

(-σ,+σ)概率是68.27%;

(-2σ,+2σ)概率是95.45%;

(-3σ,+3σ)概率是99.73%;

(-1.96σ,+1.96σ)概率是95%;二、抽樣分布抽樣分布是根據(jù)所有可能樣本計(jì)算出來(lái)的某一統(tǒng)計(jì)量的數(shù)值分布。抽樣分布有極限分布和精確分布兩類。極限分布也叫做大樣本分布,它只有正態(tài)分布一種形式;精確分布又叫做小樣本分布,其前提是總體服從正態(tài)分布,它是正態(tài)分布的導(dǎo)出分布,包括有t分布、F分布和分布等形式。χ2

一般地,可以證明如果總體服從正態(tài)分布,且總體均值和方差均為已知,即

Y~N(μ,σ2)則不論樣本量大小如何,樣本均值均圍繞總體均值而服從正態(tài)分布,并且其抽樣分布的方差等于總體方差的n分之一,即~N(μ,σ2/n)

而對(duì)于非正態(tài)總體,若均值μ和σ2有限,則根據(jù)中心極限定理,當(dāng)樣本量n充分大時(shí),樣本均值仍然圍繞著總體均值而近似地服從正態(tài)分布,即~N(μ,σ2/n)

(一)樣本統(tǒng)計(jì)量的極限分布

例:總體N=5,Y={40,50,60,70,80},則其次數(shù)分布圖為若取n=2,用放回抽樣,

可抽25個(gè)簡(jiǎn)單隨機(jī)樣本,整理后,即可得出關(guān)于樣本均值的次數(shù)分布情況為:

404550556065707580f123454321用圖形表示,則為:如果總體容量較大,則當(dāng)樣本容量逐步擴(kuò)大時(shí),樣本平均數(shù)的分布趨于正態(tài)分布的趨勢(shì)更加明顯。(二)樣本統(tǒng)計(jì)量的精確分布1、χ2分布設(shè)隨機(jī)變量Yi~N(0,1)(i=1,2,…,n),且相互獨(dú)立,則Y=∑Y2i服從自由度為n的χ2分布,記作Y~χ2(n)。χ2分布的概率密度函數(shù)為主要性質(zhì)有:①f(y)恒為正;②χ2分布呈右偏形態(tài);③χ2分布隨n的不斷增大而逐漸趨于正態(tài)分布。

χ2分布χ2(n)的數(shù)學(xué)期望和方差分別為EY=n,DY=2n.2、t分布若X~N(0,1),Y~χ2(n),且X與Y相互獨(dú)立,則稱隨機(jī)變量服從自由度為n的t分布,記作:T~t(n)。

推論:若X~N(μ,σ2),σ2未知,則

服從自由度為n-1的t分布,記作:T~t(n-1)

t分布t(n)的概率密度函數(shù)為

t分布具有如下性質(zhì):①t分布對(duì)稱于縱軸,與N(0,1)相似;②在n<30(小樣本)時(shí),t分布的方差大于N(0,1)的方差;③在n≥30(大樣本)時(shí),t分布隨n的增大而趨于N(0,1)。

t分布t(n)的數(shù)學(xué)期望與方差分別為ET=0,DT=n/(n-2).(n>2)

若X~χ2(n1),Y~χ2(n2),且X與Y相互獨(dú)立,則稱隨機(jī)變量

3、F分布服從第一自由度為n1,第二自由度為n2的F分布,記作:F~F(n1,n2)。其概率密度函數(shù)為F分布的主要性質(zhì)有:①F分布呈右偏態(tài);②f(x)恒為正;③在

④隨n1,n2的不斷增大,F(xiàn)分布的右偏程度逐漸減弱,但不會(huì)趨向正態(tài);⑤具有倒數(shù)性質(zhì),即若X~F(n1,n2),則1/X~F(n1,n2);⑥若t~t(n),則t2(n)~F(1,n)。

處取最大值(n1>2,f0<1);其數(shù)學(xué)期望和方差分別為返回第三節(jié)抽樣誤差一、抽樣調(diào)查中的誤差來(lái)源誤差就是調(diào)查結(jié)果與現(xiàn)象的實(shí)際結(jié)果之間的偏差,它幾乎在所有的統(tǒng)計(jì)調(diào)查中都或大或小的存在著。在抽樣調(diào)查中,按照形成原因的不同,一般可將誤差分成抽樣誤差和非抽樣誤差兩大類。抽樣誤差是用樣本統(tǒng)計(jì)量推斷總體參數(shù)時(shí)的誤差,它屬于一種代表性誤差。

在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是,抽樣誤差可以計(jì)算,并且可以被控制在任意小的范圍內(nèi)。

影響抽樣誤差的因素

1.抽樣誤差通常會(huì)隨樣本量的大小而增減。

2.所研究現(xiàn)象總體變異程度的大小。

3.抽樣的方式方法。

非抽樣誤差不是由于抽樣引起的。它又包括:調(diào)查誤差;無(wú)回答誤差;抽樣框誤差;登記性誤差。同抽樣誤差相反,非抽樣誤差是隨著樣本量的增加而增大的。由于抽樣調(diào)查的訪問(wèn)和資料整理都比普查更便于進(jìn)行,因此非抽樣誤差也遠(yuǎn)遠(yuǎn)小于普查。有時(shí),普查中的非抽樣誤差甚至大于抽樣調(diào)查中抽樣誤差與非抽樣誤差的總和。二、抽樣誤差的計(jì)算抽樣誤差的計(jì)算,是建立在誤差分布理論基礎(chǔ)上,從統(tǒng)計(jì)平均意義角度來(lái)考慮的。

抽樣誤差用所有可能的實(shí)際誤差的均方誤差表示

MSE()=E(-θ)2=E[

-E(

)]2+[E()-θ]2

式中第一項(xiàng)是估計(jì)量的方差,記作V()。

式中第二項(xiàng)是估計(jì)量的偏倚B()的平方。

無(wú)偏估計(jì)時(shí),的方差就等于它的均方誤差。

說(shuō)明:①上面所給出的估計(jì)量方差公式實(shí)際中當(dāng)σ2未知時(shí),一般用樣本方差s2代替以對(duì)②有偏的估計(jì)并非都是不可用的,有時(shí)有偏估計(jì)量在某些方面反而比無(wú)偏估計(jì)量更好。有研究認(rèn)為,在實(shí)踐中當(dāng)偏倚小于標(biāo)準(zhǔn)誤的十分之一時(shí),偏倚對(duì)估計(jì)量準(zhǔn)確度的影響可以忽略不計(jì)。仍然屬于一個(gè)理論公式,是依據(jù)調(diào)查變量的總體方差σ2進(jìn)行計(jì)算的,估計(jì)量的方差做出估計(jì)。返回第四節(jié)抽樣估計(jì)一、抽樣估計(jì)的特點(diǎn)第一,抽樣估計(jì)在邏輯上運(yùn)用的是歸納推理而不是演繹推理。第二,抽樣估計(jì)在方法上運(yùn)用不確定的概率估計(jì)法而不是運(yùn)用確定的數(shù)學(xué)分析法。第三,抽樣估計(jì)的結(jié)論存在著一定程度的抽樣誤差。二、抽樣估計(jì)的方法抽樣估計(jì)的方法多種多樣。如果以估計(jì)中所依據(jù)的資料不同來(lái)區(qū)分,一般可以有簡(jiǎn)單估計(jì)、比估計(jì)和回歸估計(jì)等三種方法。簡(jiǎn)單估計(jì)是單純依靠樣本調(diào)查變量的資料估計(jì)總體參數(shù),其估計(jì)結(jié)果稱為簡(jiǎn)單估計(jì)量;比估計(jì)和回歸估計(jì)是同時(shí)依據(jù)樣本調(diào)查變量以及已知的有關(guān)輔助變量的資料來(lái)對(duì)總體參數(shù)做出估計(jì),其結(jié)果分別稱為比估計(jì)量和回歸估計(jì)量。如果以估計(jì)結(jié)果的表示方式來(lái)區(qū)分,則抽樣估計(jì)可以有兩種形式,即定值估計(jì)和區(qū)間估計(jì)。三、置信區(qū)間一般地說(shuō),若估計(jì)量是無(wú)偏的,且呈正態(tài)分布,則參數(shù)θ的置信度當(dāng)調(diào)查變量的總

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論