第六章抽樣調(diào)查_(kāi)第1頁(yè)
第六章抽樣調(diào)查_(kāi)第2頁(yè)
第六章抽樣調(diào)查_(kāi)第3頁(yè)
第六章抽樣調(diào)查_(kāi)第4頁(yè)
第六章抽樣調(diào)查_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章抽樣調(diào)查第一節(jié)抽樣調(diào)查的意義第二節(jié)抽樣調(diào)查的基本概念第三節(jié)抽樣平均誤差第四節(jié)全及指標(biāo)的推斷第五節(jié)抽樣方案設(shè)計(jì)第六節(jié)必要抽樣單位數(shù)的確定第七節(jié)假設(shè)檢驗(yàn)第一節(jié)抽樣調(diào)查的意義一、抽樣調(diào)查的概念

抽樣調(diào)查是按隨機(jī)原則,從全部研究對(duì)象中抽取一部分單位進(jìn)行觀察,并根據(jù)樣本的實(shí)際數(shù)據(jù),對(duì)總體的數(shù)量特征做出具有一定可靠程度的估計(jì)和判斷其中心問(wèn)題是如何根據(jù)已知的部分資料來(lái)推斷未知的總體情況。二、抽樣調(diào)查的特點(diǎn)1.抽樣調(diào)查是非全面調(diào)查。2.抽樣調(diào)查是用樣本的指標(biāo)數(shù)值去推算總體的指標(biāo)數(shù)值。3.抽樣調(diào)查是按隨機(jī)原則抽選調(diào)查單位。4.抽樣調(diào)查中產(chǎn)生的抽樣誤差,可以事先計(jì)算并加以控制。

第二節(jié)抽樣調(diào)查的基本概念

一、全及總體和抽樣總體二、抽樣方法1.重復(fù)抽樣分布2.不重復(fù)抽樣分布三、大數(shù)定理與中心極限定理一、全及總體和抽樣總體全及總體:即總體,所要調(diào)查觀察的全部事物。總體單位數(shù)用N表示。抽樣總體:即樣本,抽取出來(lái)調(diào)查觀察的單位。抽樣總體的單位數(shù)用n表示。

n≥30大樣本

n<30小樣本總體是唯一的、確定的,而樣本是不確定的、可變的、隨機(jī)的注全及指標(biāo)和抽樣指標(biāo)全及指標(biāo):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的。抽樣指標(biāo):根據(jù)樣本分布計(jì)算的指標(biāo)。是隨機(jī)變量。全及指標(biāo)和抽樣指標(biāo)平均數(shù)標(biāo)準(zhǔn)差、方差成數(shù)全及指標(biāo)、2P抽樣指標(biāo)S、S2p總體樣本

變量總體和屬性總體變量總體各單位標(biāo)志值可用數(shù)量表示總體成數(shù)P是指具有某種特征的單位在總體中的比重。成數(shù)是一種結(jié)構(gòu)相對(duì)數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)x是0、1變量,則有:樣本成數(shù)現(xiàn)從總體中抽出n個(gè)單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是:P也是一個(gè)隨機(jī)變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:樣本容量與樣本個(gè)數(shù)樣本容量:一個(gè)樣本中所包含的單位數(shù),用n表示。樣本個(gè)數(shù):又稱樣本可能數(shù)目,指從一個(gè)總體中所可能抽取的樣本的個(gè)數(shù)。對(duì)于有限總體,樣本個(gè)數(shù)可以計(jì)算出來(lái)。樣本個(gè)數(shù)的多少與抽樣方法有關(guān)。重復(fù)抽樣:又稱有放回抽樣。不重復(fù)抽樣:又稱不放回抽樣。例例二、抽樣方法重復(fù)抽樣例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2考慮順序時(shí):樣本個(gè)數(shù)=Nn=52=25不考慮順序時(shí):樣本個(gè)數(shù)=例如從A、B、C、D、E五個(gè)字母中隨機(jī)抽取兩個(gè)作為樣本。N=5,n=2考慮順序時(shí):樣本個(gè)數(shù)不考慮順序時(shí):樣本個(gè)數(shù)不重復(fù)抽樣三、大數(shù)定理當(dāng)樣本容量n

充分大時(shí),可以用樣本平均估計(jì)總體平均。當(dāng)試驗(yàn)次數(shù)n充分大時(shí),可以用頻率代替概率。大數(shù)定理的意義:個(gè)別現(xiàn)象受偶然因素影響,但是,對(duì)總體的大量觀察后進(jìn)行平均,就能使偶然因素的影響相互抵消,從而使總體平均數(shù)穩(wěn)定下來(lái),反映出事物變化的一般規(guī)律。

中心極限定理

中心極限定理:1.獨(dú)立同分布中心極限定理:2.德莫福-拉普拉斯中心極限定理:大樣本的平均數(shù)近似服從正態(tài)分布。第三節(jié)抽樣平均誤差

在統(tǒng)計(jì)調(diào)查中,調(diào)查資料與實(shí)際情況不一致,兩者的偏離稱為統(tǒng)計(jì)誤差。一、抽樣誤差的概念及其影響程度

抽樣誤差即指隨機(jī)誤差,這種誤差是抽樣調(diào)查固有的誤差,是無(wú)法避免的。二、抽樣平均誤差

抽樣平均誤差實(shí)際上是樣本指標(biāo)的標(biāo)準(zhǔn)差。通常用μ表示。在N中抽出n樣本,從排列組合中可以有各種各樣的樣本組。

抽樣誤差是由于抽樣的隨機(jī)性而產(chǎn)生的樣本指標(biāo)與總體指標(biāo)之間的平均離差。

注按照定義:重復(fù)抽樣分布--樣本平均數(shù)的分布某班組5個(gè)工人的日工資為34、38、42、46、50元。=422=32現(xiàn)用重復(fù)抽樣的方法從5人中隨機(jī)抽2個(gè)構(gòu)成樣本。共有52=25個(gè)樣本。如右圖。驗(yàn)證了以下兩個(gè)結(jié)論:抽樣平均數(shù)的標(biāo)準(zhǔn)差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。重置抽樣分布--樣本平均數(shù)的分布取得σ的途徑有:

1.用過(guò)去全面調(diào)查或抽樣調(diào)查的資料,若同時(shí)有n個(gè)σ的資料,應(yīng)選用數(shù)值較大的那個(gè);2.用樣本標(biāo)準(zhǔn)差S代替全及標(biāo)準(zhǔn)差σ;3.在大規(guī)模調(diào)查前,先搞個(gè)小規(guī)模的試驗(yàn)性的調(diào)查來(lái)確定S,代替σ;4.用估計(jì)的方法。抽樣平均誤差的影響因素:

1.全及總體標(biāo)志變異程度。2.抽樣單位數(shù)目的多少。3.不同的抽樣方式。4.不同的抽樣組織形式?!汝P(guān)系——反比關(guān)系隨機(jī)抽樣的抽樣平均誤差

(一)平均數(shù)的抽樣平均誤差重復(fù)抽樣

某燈泡廠從一天所生產(chǎn)的產(chǎn)品10,000個(gè)中抽取100個(gè)檢查其壽命,得平均壽命為2000小時(shí)(假設(shè)為重復(fù)抽樣),根據(jù)以往資料:σ=20小時(shí),根據(jù)以往資料,產(chǎn)品質(zhì)量不太穩(wěn)定,若σ=200小時(shí),例2.不重復(fù)抽樣:(二)成數(shù)的抽樣平均誤差

已知:成數(shù)的方差為p(1-p)

某玻璃器皿廠某日生產(chǎn)15000只印花玻璃杯,現(xiàn)按重復(fù)抽樣方式從中抽取150只進(jìn)行質(zhì)量檢驗(yàn),結(jié)果有147只合格,其余3只為不合格品,試求這批印花玻璃杯合格率(成數(shù))的抽樣平均誤差。例抽樣誤差的作用1.

在于說(shuō)明樣本指標(biāo)的代表性大小。 誤差大,則樣本指標(biāo)代表性低; 誤差小,則樣本指標(biāo)代表性高; 誤差等于0,則樣本指標(biāo)和總體指標(biāo)一樣大。2.說(shuō)明樣本指標(biāo)和總體指標(biāo)相差的一般范圍。第四節(jié)全及指標(biāo)的推斷

一、優(yōu)良估計(jì)無(wú)偏性一致性有效性二、點(diǎn)估計(jì)點(diǎn)估計(jì)的含義:直接以樣本指標(biāo)作為相應(yīng)全及指標(biāo)的估計(jì)量。例三、全及指標(biāo)估計(jì)概述設(shè)待估計(jì)的全及指標(biāo)是,用以估計(jì)該參數(shù)的統(tǒng)計(jì)量是,抽樣估計(jì)的極限誤差是

,即:抽樣極限誤差是根據(jù)研究對(duì)象的變異程度和分析任務(wù)的性質(zhì)來(lái)確定的在一定概率下的允許誤差范圍。四、區(qū)間估計(jì)區(qū)間估計(jì)的含義:根據(jù)樣本指標(biāo)和抽樣誤差去推斷全及指標(biāo)的可能范圍,它能說(shuō)清楚估計(jì)的準(zhǔn)確程度和把握程度。其中:1-α(0<α<1)稱為置信度;α是區(qū)間估計(jì)的顯著性水平,其取值大小由實(shí)際問(wèn)題確定,經(jīng)常取1%、5%和10%。參數(shù)估計(jì)的兩個(gè)要求:精度:估計(jì)誤差的最大范圍,通過(guò)極限誤差來(lái)反映。顯然,Δ越小,估計(jì)的精度要求越高,Δ越大,估計(jì)的精度要求越低。極限誤差的確定要以實(shí)際需要為基本標(biāo)準(zhǔn)??煽啃裕汗烙?jì)正確性的一個(gè)概率保證,通常稱為估計(jì)的置信度。

根據(jù)中心極限定理,得知當(dāng)n足夠大時(shí),抽樣總體為正態(tài)分布,根據(jù)正態(tài)分布規(guī)律可知,樣本指標(biāo)是以一定的概率落在某一特定的區(qū)間內(nèi),統(tǒng)計(jì)上把這個(gè)給定的區(qū)間叫抽樣極限誤差,也稱置信區(qū)間,即在概率F(t)的保證下:

抽樣極限誤差△=tμ,(t為概率度)68.27%的樣本當(dāng)F(t)=68.27%時(shí),抽樣極限誤差等于抽樣平均誤差的1倍(t=1);當(dāng)F(t)=95.45%時(shí),抽樣極限誤差等于抽樣平均誤差的2倍(t=2);當(dāng)F(t)=99.73%時(shí),抽樣極限誤差等于抽樣平均誤差的3倍(t=3);可見(jiàn),抽樣極限誤差,即擴(kuò)大或縮小了以后的抽樣誤差范圍。四、全及平均數(shù)和全及成數(shù)的推斷

某農(nóng)場(chǎng)進(jìn)行小麥產(chǎn)量的抽樣調(diào)查,該農(nóng)場(chǎng)小麥播種面積為10000畝,采用不重復(fù)的簡(jiǎn)單隨機(jī)抽樣從中選100畝作為樣本,進(jìn)行實(shí)割實(shí)測(cè),得到樣本的平均畝產(chǎn)量為400千克,樣本標(biāo)準(zhǔn)差為12千克。(1)求抽樣平均誤差;(2)以95.45%的概率保證,該農(nóng)場(chǎng)平均畝產(chǎn)量的范圍;(3)以99.73%的概率保證,該農(nóng)場(chǎng)平均畝產(chǎn)量的范圍。例1~

解:

某機(jī)械廠日產(chǎn)某種產(chǎn)品8000件,現(xiàn)采用純隨機(jī)重復(fù)抽樣方式,從中抽取400件進(jìn)行觀察,其中有380件為一級(jí)品,試以概率95.45%的可靠程度推斷全部產(chǎn)品的一級(jí)品率的范圍。例2抽樣一級(jí)品率:~

解:第五節(jié)

抽樣方案設(shè)計(jì)

一、簡(jiǎn)單隨機(jī)抽樣1.簡(jiǎn)單隨機(jī)抽樣的含義簡(jiǎn)單隨機(jī)抽樣又稱為純隨機(jī)抽樣,必須滿足下列兩條要求:①代表性,即要求樣本分布與總體分布相同;②獨(dú)立性,即要求樣本各個(gè)單位相互獨(dú)立。

簡(jiǎn)單隨機(jī)的抽樣方法

(1)抽簽法。適合用于總體單位數(shù)較少的總體。

(2)隨機(jī)數(shù)表法。適合用于大規(guī)模的社會(huì)經(jīng)濟(jì)調(diào)查。

(3)簡(jiǎn)單隨機(jī)抽樣的平均誤差二、類型抽樣(分類抽樣)

先對(duì)總體各單位按一定標(biāo)志加以分類(層),然后再?gòu)母黝?層)中按隨機(jī)原則抽取樣本,組成一個(gè)總的樣本。

類型的劃分:必須有清楚的劃類界限;必須知道各類中的單位數(shù)目和比例;分類型的數(shù)目不宜太多。類型抽樣的好處是:

樣本代表性高、抽樣誤差小、抽樣調(diào)查成本較低。如果抽樣誤差的要求相同的話則抽樣數(shù)目可以減少。三、機(jī)械抽樣(等距抽樣)

先將全及總體的所有單位按某一標(biāo)志順序排隊(duì),然后按相等的距離抽取樣本單位。排列次序用的標(biāo)志有兩種:1.選擇標(biāo)志與抽樣調(diào)查所研究?jī)?nèi)容無(wú)關(guān),稱無(wú)關(guān)標(biāo)志排隊(duì)。2.選擇標(biāo)志與抽樣調(diào)查所研究的內(nèi)容有關(guān),稱有關(guān)標(biāo)志排隊(duì)。研究工人的平均收入水平時(shí),按工號(hào)排隊(duì)。例研究工人的生活水平,按工人月工資額高低排隊(duì)。例機(jī)械抽樣按樣本單位抽選的方法不同,可分為三種:1.隨機(jī)起點(diǎn)等距抽樣kkkk+a2k+a(n-1)k+aak(k為抽取間隔)2.半距起點(diǎn)等距抽樣kkkk(k為抽取間隔)3.對(duì)稱等距抽樣kkk2k-a2k+a4k-a4k+aak(k為抽取間隔)機(jī)械抽樣的好處:

1.可以使抽樣過(guò)程大大簡(jiǎn)化,減輕抽樣的工作量;2.如果用有關(guān)標(biāo)志排隊(duì),還可以縮小抽樣誤差,提高抽樣推斷效果。四、整群抽樣

整群抽樣即從全及總體中成群地抽取樣本單位,對(duì)抽中的群內(nèi)的所有單位都進(jìn)行觀察。

整群抽樣的好處:組織工作比較簡(jiǎn)單方便,適用于一些特殊的研究對(duì)象。其不足之處是,一般比其它抽樣方式的抽樣誤差大。第六節(jié)

必要抽樣單位數(shù)的確定一、影響必要抽樣數(shù)目的因素(一)簡(jiǎn)單隨機(jī)抽樣二、必要抽樣數(shù)目的計(jì)算公式

一家公司為估計(jì)壞帳而抽出了100個(gè)壞帳,這些壞帳的標(biāo)準(zhǔn)差為285.3。如今公司希望壞帳極限誤差不超過(guò)35元,置信度99.73%,則應(yīng)抽取多少份壞帳?例

建筑工地打土方工人4000人,需測(cè)定平均每人工作量,要求誤差范圍不超過(guò)0.2M3,并需有99.73%保證程度。根據(jù)過(guò)去資料σ=1.5,求樣本數(shù)應(yīng)是多少?例第7節(jié)假設(shè)檢驗(yàn)小概率原理:即指概率很小的事件在一次試驗(yàn)中實(shí)際上不可能出現(xiàn)。這種事件稱為“實(shí)際不可能事件”。例1:消費(fèi)者協(xié)會(huì)接到消費(fèi)者投訴,指控品牌紙包裝飲料存在容量不足,有欺騙消費(fèi)者之嫌。包裝上標(biāo)明的容量為250毫升。消費(fèi)者協(xié)會(huì)從市場(chǎng)上隨機(jī)抽取50盒該品牌紙包裝飲品,測(cè)試發(fā)現(xiàn)平均含量為248毫升,小于250毫升。這是生產(chǎn)中正常的波動(dòng),還是廠商的有意行為?消費(fèi)者協(xié)會(huì)能否根據(jù)該樣本數(shù)據(jù),判定飲料廠商欺騙了消費(fèi)者呢?消費(fèi)者協(xié)會(huì)實(shí)際要進(jìn)行的是一項(xiàng)統(tǒng)計(jì)檢驗(yàn)工作。檢驗(yàn)總體平均=250是否成立。這就是一個(gè)原假設(shè)(nullhypothesis),通常用表示,即::=250與原假設(shè)對(duì)立的是備選假設(shè)(alternativehypothesis),備選假設(shè)是在原假設(shè)被否定時(shí)另一種可能成立的結(jié)論。備選假設(shè)比原假設(shè)還重要,這要由實(shí)際問(wèn)題來(lái)確定,一般把期望出現(xiàn)的結(jié)論作為備選假設(shè)。二、假設(shè)檢驗(yàn)的步驟在例1中,按歷史資料,總體的標(biāo)準(zhǔn)差是4毫升。我們通過(guò)檢驗(yàn)總體均值是否等于250毫升,來(lái)判斷飲料廠商是否欺騙了消費(fèi)者。程序如下:第一步:確定原假設(shè)與備選假設(shè)。:=250;:<250以上的備選假設(shè)是總體均值小于250毫升,因?yàn)橄M(fèi)者協(xié)會(huì)希望通過(guò)樣本數(shù)據(jù)推斷出廠商的欺騙行為(大于250毫升

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論