第5章 抽樣推斷_第1頁(yè)
第5章 抽樣推斷_第2頁(yè)
第5章 抽樣推斷_第3頁(yè)
第5章 抽樣推斷_第4頁(yè)
第5章 抽樣推斷_第5頁(yè)
已閱讀5頁(yè),還剩143頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章統(tǒng)計(jì)抽樣與參數(shù)估計(jì)★第一節(jié)

抽樣推斷第二節(jié)

抽樣誤差第三節(jié)

參數(shù)估計(jì)的基本方法第四節(jié)抽樣組織的設(shè)計(jì)第一節(jié)

抽樣推斷一、抽樣推斷的意義和一般步驟二、總體參數(shù)與樣本統(tǒng)計(jì)量三、抽樣框與樣本數(shù)四、概率抽樣與非概率抽樣★一、抽樣推斷的意義和一般步驟㈠抽樣推斷的定義㈡抽樣推斷的特點(diǎn)㈢抽樣推斷的運(yùn)用㈣抽樣推斷的一般步驟抽樣調(diào)查研究

SamplingStudy為什么要抽樣?

1.

涉及破壞受試對(duì)象質(zhì)量控制2.取得精確可靠的結(jié)果3.實(shí)際情況的約束時(shí)間,成本等(化驗(yàn))指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個(gè)總體單位都有均等的被抽中機(jī)會(huì)抽樣推斷按照隨機(jī)原則

從調(diào)查對(duì)象中抽取一部分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對(duì)總體數(shù)量特征作出具有一定可靠程度的估計(jì)與推斷,從而認(rèn)識(shí)總體的一種統(tǒng)計(jì)方法你不必吃完整一頭牛,才知道它的肉是咬不動(dòng)的。

SamelJohnson統(tǒng)計(jì)推斷涉及總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):統(tǒng)計(jì)量(已知量)抽樣推斷并非所有的抽樣估計(jì)都按隨機(jī)原則抽取樣本,也有非隨機(jī)抽樣總體隨機(jī)樣本非隨機(jī)樣本與總體分布特征相同與總體分布特征不同按隨機(jī)原則抽取樣本單位目的是推斷總體的數(shù)量特征抽樣推斷的結(jié)果具有一定的可靠程度,抽樣誤差可以事先計(jì)算并控制抽樣推斷的特點(diǎn)不可能進(jìn)行全面調(diào)查時(shí)不必要進(jìn)行全面調(diào)查時(shí)來(lái)不及進(jìn)行全面調(diào)查時(shí)對(duì)全面調(diào)查資料進(jìn)行補(bǔ)充修正時(shí)抽樣推斷的應(yīng)用設(shè)計(jì)抽樣方案抽取樣本單位收集樣本數(shù)據(jù)計(jì)算樣本統(tǒng)計(jì)量推斷總體參數(shù)抽樣推斷的一般步驟第一節(jié)

抽樣推斷一、抽樣推斷的意義和一般步驟二、總體參數(shù)與樣本統(tǒng)計(jì)量三、抽樣框與樣本數(shù)四、概率抽樣與非概率抽樣★★二、總體參數(shù)和樣本估計(jì)量㈠總體和樣本㈡總體參數(shù)和樣本統(tǒng)計(jì)量

總體(population)全及總體簡(jiǎn)稱(chēng)總體,是指所要認(rèn)識(shí)對(duì)象的全體。全及總體的單位數(shù)用N表示,即使是有限總體,N一般也都是很大的。樣本(sample)樣本總體簡(jiǎn)稱(chēng)樣本。是從全及總體中隨機(jī)抽取出來(lái),代表全及總體的部分單位的集合體。樣本總體的單位數(shù)通常用n表示,對(duì)于N來(lái)說(shuō),n是很小的。

一般來(lái)說(shuō),樣本單位數(shù)達(dá)到或超過(guò)30個(gè)稱(chēng)為大樣本,30個(gè)以下稱(chēng)為小樣本。社會(huì)經(jīng)濟(jì)調(diào)查一般為大樣本。以很小的樣本來(lái)推斷很大的總體,這是抽樣推斷的特點(diǎn)之一。

把n/N叫做抽樣比例。

全及總體是唯一確定的。而一個(gè)總體中可能抽取很多個(gè)抽樣的樣本。樣本概念的二重性:一般的討論樣本時(shí),樣本應(yīng)理解為n維隨機(jī)變量;在一次具體容量為n的抽樣中,則樣本是n維隨機(jī)變量的一個(gè)觀察值。某個(gè)樣本容量的抽樣分布更大樣本容量的抽樣分布設(shè)總體中個(gè)總體單位某項(xiàng)標(biāo)志的標(biāo)志值分別為,其中具有某種屬性的有個(gè)單位,不具有某種屬性的有個(gè)單位,則⒈總體平均數(shù)(又叫總體均值):指被估計(jì)的總體指標(biāo),又被稱(chēng)為全及指標(biāo)總體參數(shù)⒉總體單位標(biāo)志值的標(biāo)準(zhǔn)差:⒊總體單位標(biāo)志值的方差:⒋總體成數(shù):⒌總體是非標(biāo)志的標(biāo)準(zhǔn)差:⒍總體是非標(biāo)志的方差:設(shè)樣本中個(gè)樣本單位某項(xiàng)標(biāo)志的標(biāo)志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個(gè),則⒈樣本平均數(shù)(又叫樣本均值):指根據(jù)樣本單位的標(biāo)志值計(jì)算的用以估計(jì)和推斷相應(yīng)總體指標(biāo)的綜合指標(biāo),又被稱(chēng)為估計(jì)量或統(tǒng)計(jì)量樣本估計(jì)量⒉樣本單位標(biāo)志值的標(biāo)準(zhǔn)差:⒊樣本單位標(biāo)志值的方差:為自由度為的無(wú)偏估計(jì)為的無(wú)偏估計(jì)⒋樣本成數(shù):⒌樣本單位是非標(biāo)志的標(biāo)準(zhǔn)差:⒍樣本單位是非標(biāo)志的方差:為的無(wú)偏估計(jì)為的無(wú)偏估計(jì)

總體參數(shù)

樣本統(tǒng)計(jì)量名稱(chēng)符號(hào)名稱(chēng)符號(hào)總體容量樣本容量總體平均數(shù)樣本平均數(shù)總體方差樣本方差總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差總體比例樣本比例第一節(jié)

抽樣推斷一、抽樣推斷的意義和一般步驟二、總體參數(shù)與樣本統(tǒng)計(jì)量三、抽樣框與樣本數(shù)四、概率抽樣與非概率抽樣★★★㈠抽樣框㈡抽樣方法㈢抽樣組織方式㈣樣本數(shù)和樣本容量三、抽樣框與樣本數(shù)㈠隨機(jī)原則——抽取樣本單位時(shí),應(yīng)確保每個(gè)總體單位都有被抽取的可能;在對(duì)樣本單位的資料進(jìn)行搜集和整理時(shí),不能隨意遺漏或更換樣本單位㈡抽樣誤差最小——在其他條件相同的情況下,選抽樣誤差最小的方案㈢費(fèi)用最少——在其他條件相同的情況下,選費(fèi)用最少的方案設(shè)計(jì)抽樣方案時(shí),通常是在誤差達(dá)到一定要求的條件下,選擇費(fèi)用最少的方案抽樣方案設(shè)計(jì)的基本準(zhǔn)則抽樣框指包括全部抽樣單位的名單框架,僅對(duì)有限總體而言主要形式名單抽樣框區(qū)域抽樣框時(shí)間表抽樣框編制抽樣框列出全部總體單位名錄的一覽表。如職工或企業(yè)名單等。可采用抽簽方式或隨機(jī)數(shù)字表進(jìn)行抽選樣本的單位。名單抽樣框序號(hào)學(xué)號(hào)姓名10711210101張曉20711210102李敏30711210103童星40711210104?;?0711210105陳楊60711210107宋安70711210108楚生80711210109孔凱………區(qū)域抽樣框在商場(chǎng)的大門(mén)口在微波爐柜臺(tái)前在市區(qū)街道旁邊在某個(gè)住宅小區(qū)和平區(qū)、河西區(qū)…

南開(kāi)區(qū)

八里臺(tái)街、新興路街…

學(xué)府街

平湖里、風(fēng)湖里…

照湖里居民一組居民二組…某外國(guó)公司在天津進(jìn)行微波爐市場(chǎng)調(diào)查:時(shí)間表抽樣框連續(xù)出產(chǎn)的產(chǎn)品總體可以編制抽樣框:均勻的出產(chǎn)時(shí)間、可以預(yù)見(jiàn)到的產(chǎn)品總量。連續(xù)到加油站加油的汽車(chē)總體無(wú)法編制抽樣框:時(shí)間不定、總量也無(wú)法確定。抽樣方法重復(fù)抽樣又被稱(chēng)作重置抽樣、有放回抽樣抽出個(gè)體登記特征放回總體繼續(xù)抽取特點(diǎn)同一總體單位有可能被重復(fù)抽中,而且每次抽取都是獨(dú)立進(jìn)行不重復(fù)抽樣又被稱(chēng)作不重置抽樣、不放回抽樣抽出個(gè)體登記特征繼續(xù)抽取特點(diǎn)同一總體中每個(gè)單位被抽中的機(jī)會(huì)并不均等,在連續(xù)抽取時(shí),每次抽取都不是獨(dú)立進(jìn)行

是最為常用的抽樣方法,用于無(wú)限總體和許多有限總體樣本單位的抽樣。樣本數(shù)樣本數(shù)又稱(chēng)樣本的可能數(shù)目,在考慮順序的抽樣條件下,從總體N中隨機(jī)抽取n個(gè)樣本單位共有多少種可能的抽選結(jié)果。例如:從A、B、C、D四個(gè)單位中,抽出兩個(gè)單位構(gòu)成一個(gè)樣本,則可供選擇的樣本可以簡(jiǎn)單列舉如下:

AAABACADBABBBCBDCACBCCCDDADBDCDD⒈重復(fù)抽樣的可能樣本數(shù)目:⒉不重復(fù)抽樣的可能樣本數(shù)目:共n個(gè)第一節(jié)

抽樣推斷一、抽樣推斷的意義和一般步驟二、總體參數(shù)與樣本統(tǒng)計(jì)量三、抽樣框與樣本數(shù)四、概率抽樣與非概率抽樣★★★★概率抽樣按照概率的隨機(jī)原則抽取樣本,稱(chēng)為概率抽樣,得到的樣本稱(chēng)為隨機(jī)樣本?;镜母怕食闃臃绞接校汉?jiǎn)單隨機(jī)抽樣、分層抽樣、等距抽樣和整群抽樣。從理論上說(shuō),概率抽樣是最理想最科學(xué)的抽樣方法,能保證樣本數(shù)據(jù)對(duì)總體參數(shù)的代表性,而且能夠?qū)⒊闃诱`差限制在一定范圍之內(nèi)。相對(duì)來(lái)說(shuō),也是花費(fèi)較大的抽樣方式。簡(jiǎn)單隨機(jī)抽樣

(simplerandomsampling)從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其他輔助信息以提高估計(jì)的效率分層抽樣

(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難整群抽樣

(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差多階段抽樣

(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱(chēng)為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開(kāi)在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法

非概率抽樣也叫做非隨機(jī)抽樣。是根據(jù)調(diào)查者的經(jīng)驗(yàn)或判斷,從總體中有意識(shí)的抽取若干單位構(gòu)成樣本。重點(diǎn)調(diào)查、典型調(diào)查、配額調(diào)查、方便調(diào)查等都屬于非隨機(jī)抽樣。

大多數(shù)種類(lèi)的研究,如產(chǎn)品測(cè)試、街頭訪問(wèn)、電話調(diào)查、座談會(huì)等,只要不是屬于要進(jìn)行總體數(shù)量推論的項(xiàng)目都可以使用。容易產(chǎn)生傾向性誤差,且不能計(jì)算和控制抽樣誤差,無(wú)法說(shuō)明調(diào)查結(jié)果的可靠程度。第5章統(tǒng)計(jì)抽樣與參數(shù)估計(jì)★第一節(jié)

抽樣推斷第二節(jié)

抽樣誤差第三節(jié)

參數(shù)估計(jì)的基本方法第四節(jié)抽樣組織的設(shè)計(jì)★第二節(jié)

抽樣誤差★一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差、抽樣估計(jì)的概率度、精度和可靠程度統(tǒng)計(jì)誤差統(tǒng)計(jì)調(diào)查中的兩類(lèi)誤差:一類(lèi)是調(diào)查誤差——各種調(diào)查方式中都可能出現(xiàn)。指在調(diào)查過(guò)程中由于觀察、測(cè)量、登記、計(jì)算上的差錯(cuò)而引起的誤差。又稱(chēng)為登記性誤差。一類(lèi)是代表性誤差——指在抽樣調(diào)查過(guò)程中用樣本推斷總體指標(biāo)時(shí)可能產(chǎn)生的誤差,是樣本對(duì)于總體代表性引起的誤差。代表性誤差的兩種情況:系統(tǒng)性偏誤——由于違反隨機(jī)原則而產(chǎn)生的系統(tǒng)性誤差。隨機(jī)性誤差——按隨機(jī)原則抽樣時(shí),不同抽樣所得到的不同抽樣指標(biāo)值與總體參數(shù)之間的差異,具有隨機(jī)性和偶然性,是抽樣調(diào)查本身不可避免的誤差。但這種隨機(jī)性誤差可利用大數(shù)定律精確的計(jì)算并通過(guò)抽樣設(shè)計(jì)加以控制。說(shuō)明對(duì)于任何一個(gè)樣本,其抽樣誤差都不可能測(cè)量出來(lái)抽樣誤差的大小可以依據(jù)概率分布理論加以說(shuō)明指樣本估計(jì)量與總體參數(shù)之間數(shù)量上的差異,僅指由于按照隨機(jī)原則抽取樣本而產(chǎn)生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差抽樣誤差常見(jiàn)的抽樣誤差抽樣平均數(shù)與總體平均數(shù)之差抽樣成數(shù)與總體成數(shù)之差第二節(jié)

抽樣誤差★一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差、抽樣估計(jì)的概率度、精度和可靠程度★影響抽樣誤差的因素1、總體各單位標(biāo)志值的差異程度2、樣本單位數(shù)的多少

3、抽樣方法4、抽樣組織方式越大,抽樣誤差越大;n越大,抽樣誤差越??;

不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??;簡(jiǎn)單隨機(jī)抽樣的誤差比較大。所有樣本指標(biāo)(如均值、比例、方差等)所形成的分布稱(chēng)為抽樣分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量——樣本均值,樣本比例等結(jié)果來(lái)自容量相同的所有可能樣本 抽樣分布

(概念要點(diǎn))樣本統(tǒng)計(jì)量總體未知參數(shù)樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量抽樣分布樣本統(tǒng)計(jì)量所有可能值的概率分布主要樣本統(tǒng)計(jì)量平均數(shù)比率(成數(shù))方差樣本均值的抽樣分布

(一個(gè)例子)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230樣本均值的抽樣分布

(一個(gè)例子)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(一個(gè)例子)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值的均值和方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n=+++==?=5=u.2160.45.10.11LMxnii樣本均值的分布與總體分布的比較抽樣分布=2.5σ2=1.25總體分布P(x)1.00.1.2.31.53.04.03.52.02.5x=2.514230樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理

(圖示)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:從非正態(tài)總體中抽取的樣本平均數(shù)當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差的比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:從非正態(tài)總體中抽取的樣本比率,當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差的樣本抽樣分布原總體分布估計(jì)量的優(yōu)良性準(zhǔn)則

(無(wú)偏性)P(X)XCA無(wú)偏有偏指樣本指標(biāo)的均值應(yīng)等于被估計(jì)的總體指標(biāo)?;蛘f(shuō),估計(jì)量的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。無(wú)偏性估計(jì)量的優(yōu)良性準(zhǔn)則

(有效性)AB中位數(shù)的抽樣分布均值的抽樣分布XP(X)作為優(yōu)良的估計(jì)量,除了滿足無(wú)偏性的要求外,其方差應(yīng)比較小?;蛘f(shuō),一個(gè)方差較小的無(wú)偏估計(jì)量稱(chēng)為一個(gè)更有效的估計(jì)量。有效性估計(jì)量的優(yōu)良性準(zhǔn)則

(一致性)AB較小的樣本容量較大的樣本容量P(X)X指隨著樣本單位數(shù)的增大,樣本估計(jì)量將在概率意義下越來(lái)越接近于總體真實(shí)值一致性

對(duì)于任意ε>0,有

為的無(wú)偏、有效、一致估計(jì)量;為的無(wú)偏、有效、一致估計(jì)量;為的無(wú)偏、有效、一致估計(jì)量。數(shù)理統(tǒng)計(jì)證明:抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)第二節(jié)

抽樣誤差★一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差、抽樣估計(jì)的概率度、精度和可靠程度★★抽樣平均誤差指每一個(gè)可能樣本的估計(jì)值與總體指標(biāo)值之間離差的平均數(shù),即樣本估計(jì)量的標(biāo)準(zhǔn)差式中:為樣本平均數(shù)的抽樣平均誤差;為可能的樣本數(shù)目;為第個(gè)可能樣本的平均數(shù);為總體平均數(shù)注意:不要混淆抽樣標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)差!

抽樣平均誤差的計(jì)算理論公式實(shí)際上,利用這個(gè)公式是計(jì)算不出抽樣平均誤差的?。?!抽樣平均誤差的實(shí)際應(yīng)用計(jì)算公式純隨機(jī)抽樣條件下⒈樣本平均數(shù)的抽樣平均誤差當(dāng)N≥500時(shí),有重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):⒉樣本成數(shù)的抽樣平均誤差重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):當(dāng)N≥500時(shí),有抽樣平均誤差的實(shí)際應(yīng)用計(jì)算公式純隨機(jī)抽樣條件下關(guān)于總體方差的估計(jì)方法用過(guò)去同類(lèi)問(wèn)題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)數(shù)據(jù)代替;用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,用代替。抽樣平均誤差的實(shí)際應(yīng)用計(jì)算公式抽樣平均數(shù)平均誤差的實(shí)際計(jì)算公式解讀采用重復(fù)抽樣:此公式說(shuō)明,抽樣平均誤差與總體標(biāo)準(zhǔn)差成正比,與樣本容量平方根成反比。(當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差代替)(教材P279例題)通過(guò)例題可說(shuō)明以下幾點(diǎn):①樣本平均數(shù)的平均數(shù)等于總體平均數(shù)。②抽樣平均數(shù)的標(biāo)準(zhǔn)差僅為總體標(biāo)準(zhǔn)差的③可通過(guò)調(diào)整樣本單位數(shù)來(lái)控制抽樣平均誤差。例題:假定抽樣單位數(shù)增加2倍、0.5

倍時(shí),抽樣平均誤差怎樣變化?解:抽樣單位數(shù)增加2倍,即為原來(lái)的3倍則:抽樣單位數(shù)增加0.5倍,即為原來(lái)的1.5倍則:即:當(dāng)樣本單位數(shù)增加2倍時(shí),抽樣平均誤差為原來(lái)的0.577倍。即:當(dāng)樣本單位數(shù)增加0.5倍時(shí),抽樣平均誤差為原來(lái)的0.8165倍。采用不重復(fù)抽樣:公式表明:抽樣平均誤差不僅與總體變異程度、樣本容量有關(guān),而且與總體單位數(shù)的多少有關(guān)。與重復(fù)抽樣相比,不重復(fù)抽樣平均誤差是在重復(fù)抽樣平均誤差的基礎(chǔ)上,再乘以,而

總是小于1,所以不重復(fù)抽樣的平均誤差也總是小于重復(fù)抽樣的平均誤差。

例題一:例題二:某廠生產(chǎn)一種新型燈泡共2000只,隨機(jī)抽出400只作耐用時(shí)間試驗(yàn),測(cè)試結(jié)果平均使用壽命為4800小時(shí),樣本標(biāo)準(zhǔn)差為300小時(shí),求抽樣推斷的平均誤差?

隨機(jī)抽選某校學(xué)生100人,調(diào)查他們的體重。得到他們的平均體重為58公斤,標(biāo)準(zhǔn)差為10公斤。問(wèn)抽樣推斷的平均誤差是多少?例題一解:即:當(dāng)根據(jù)樣本學(xué)生的平均體重估計(jì)全部學(xué)生的平均體重時(shí),抽樣平均誤差為1公斤。例題二解:計(jì)算結(jié)果表明:根據(jù)部分產(chǎn)品推斷全部產(chǎn)品的平均使用壽命時(shí),采用不重復(fù)抽樣比重復(fù)抽樣的平均誤差要小。已知:則:已知:則:n=100s=10x=58N=2000n=400s=300x=4800習(xí)題:有5個(gè)工人的日產(chǎn)量分別為(單位:件):6,8,10,12,14,用重復(fù)抽樣的方法,從中隨機(jī)抽取2個(gè)工人的日產(chǎn)量,用以代表這5個(gè)工人的總體水平。則抽樣平均誤差為多少?若改用不重復(fù)抽樣方法,則抽樣平均誤差為多少?

解:根據(jù)題意可得:

不重復(fù)抽樣條件下抽樣平均誤差重復(fù)抽樣條件下抽樣成數(shù)平均誤差實(shí)際計(jì)算方法解讀采用重復(fù)抽樣:采用不重復(fù)抽樣:例題三:

某校隨機(jī)抽選400名學(xué)生,發(fā)現(xiàn)戴眼鏡的學(xué)生有80人。根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占比重時(shí),抽樣誤差為多大?例題四:一批食品罐頭共60000桶,隨機(jī)抽查300桶,發(fā)現(xiàn)有6桶不合格,求合格品率的抽樣平均誤差?例題三解:已知:則:樣本成數(shù)即:根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占的比重時(shí),推斷的平均誤差為2%。例題四解:已知:則:樣本合格率計(jì)算結(jié)果表明:不重復(fù)抽樣的平均誤差小于重復(fù)抽樣,但是“N”的數(shù)值越大,則兩種方法計(jì)算的抽樣平均誤差就越接近。抽樣平均數(shù)的抽樣平均誤差抽樣成數(shù)的抽樣平均誤差重復(fù)抽樣不重復(fù)抽樣第二節(jié)

抽樣誤差★一、抽樣誤差的概念二、影響抽樣誤差的因素三、抽樣平均誤差四、抽樣極限誤差、抽樣估計(jì)的概率度、精度和可靠程度★★★抽樣極限誤差

指在一定的概率保證程度下,抽樣誤差不允許超過(guò)的某一給定的最大可能范圍,將這種以絕對(duì)值形式表示的抽樣誤差可能范圍也稱(chēng)作允許誤差、誤差范圍等。記作△抽樣平均數(shù)的抽樣極限誤差表示為抽樣成數(shù)的抽樣極限誤差表示為

由于總體指標(biāo)是一個(gè)確定的數(shù),而樣本指標(biāo)則是圍繞總體指標(biāo)上下波動(dòng)的,它與總體指標(biāo)之間既有正離差,也有負(fù)離差,樣本指標(biāo)變動(dòng)的上限或下限與總體指標(biāo)之差的絕對(duì)值就可以表示抽樣誤差的可能范圍。抽樣極限誤差含義:抽樣極限誤差指在進(jìn)行抽樣估計(jì)時(shí),根據(jù)研究對(duì)象的變異程度和分析任務(wù)的要求所確定的樣本指標(biāo)與總體指標(biāo)之間可允許的最大誤差范圍。計(jì)算方法:設(shè)Δx與Δp分別表示樣本平均數(shù)與樣本成數(shù)的抽樣極限誤差,則有:|x-X|≤Δx,|p-P|≤Δp

上述不等式也可表示成:抽樣平均數(shù)極限誤差:抽樣成數(shù)極限誤差:x-Δx≤X≤x+Δxp-Δp≤P≤p+Δp抽樣極限誤差抽樣估計(jì)的概率度z的解讀

含義抽樣估計(jì)的概率度是測(cè)量抽樣估計(jì)可靠程度的一個(gè)參數(shù)。用符號(hào)“z”或“t”表示。公式表示:z=

Δμ

Δ=zμ(z是極限誤差與抽樣平均誤差的比值)(極限誤差是z倍的抽樣平均誤差)上式可變形為:注意到:

極限誤差與概率有關(guān),與抽樣誤差有關(guān)

提高把握程度,會(huì)增大允許誤差,使估計(jì)精度降低;縮小允許誤差,提高估計(jì)的精度,又會(huì)降低估計(jì)的把握程度。所以在實(shí)際中應(yīng)根據(jù)具體情況,先確定一個(gè)合理的把握程度,再求相應(yīng)的允許誤差或先確定一個(gè)允許誤差范圍再求相應(yīng)的把握程度。第5章統(tǒng)計(jì)抽樣與參數(shù)估計(jì)★第一節(jié)

抽樣推斷第二節(jié)

抽樣誤差第三節(jié)

參數(shù)估計(jì)的基本方法第四節(jié)抽樣組織的設(shè)計(jì)★★一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本容量的確定第三節(jié)

參數(shù)估計(jì)的基本方法★點(diǎn)估計(jì)指直接以樣本指標(biāo)來(lái)估計(jì)總體指標(biāo),也叫定值估計(jì)簡(jiǎn)單,具體明確優(yōu)點(diǎn)缺點(diǎn)無(wú)法控制誤差,僅適用于對(duì)推斷的準(zhǔn)確程度與可靠程度要求不高的情況一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本容量的確定第三節(jié)

參數(shù)估計(jì)的基本方法★★二、區(qū)間估計(jì)㈠區(qū)間估計(jì)的定義和原理㈡總體平均數(shù)的區(qū)間估計(jì)㈢總體成數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)指根據(jù)樣本指標(biāo)和抽樣極限誤差以一定的可靠程度推斷總體指標(biāo)的可能范圍;推斷的總體指標(biāo)的下限與上限所包括的區(qū)間——稱(chēng)為置信區(qū)間,估計(jì)的可靠程度——稱(chēng)為置信度。(這里只討論常用的大樣本的情況)估計(jì)正確性的一個(gè)概率保證,通常稱(chēng)為估計(jì)的置信度,用P(z)表示。估計(jì)誤差的最大范圍,通過(guò)極限誤差Δ來(lái)反映。顯然,Δ越小,估計(jì)的精度要求越高,Δ越大,估計(jì)的精度要求越低。極限誤差的確定要以實(shí)際需要為基本標(biāo)準(zhǔn)。參數(shù)估計(jì)的兩個(gè)要求:精度:可靠度:區(qū)間估計(jì)原理0.6827

落在范圍內(nèi)的概率為68.27%樣本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理0.9545

落在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理0.9973

落在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線總體平均數(shù)的區(qū)間估計(jì)表達(dá)式步驟⒈計(jì)算樣本平均數(shù);⒉搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù);或計(jì)算樣本標(biāo)準(zhǔn)差,即總體平均數(shù)的區(qū)間估計(jì)步驟⒊計(jì)算抽樣平均誤差:重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):總體平均數(shù)的區(qū)間估計(jì)步驟⒋計(jì)算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計(jì)【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,要求在95﹪的概率保證程度下,估計(jì)該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量。總體平均數(shù)的區(qū)間估計(jì)按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計(jì)—100126004144100名工人的日產(chǎn)量分組資料解:則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的置信區(qū)間為:即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計(jì)的可靠程度為95﹪??傮w成數(shù)的區(qū)間估計(jì)表達(dá)式其中,為極限誤差步驟⒈計(jì)算樣本成數(shù);⒉搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù);⒊計(jì)算抽樣平均誤差:重復(fù)抽樣條件下不重復(fù)抽樣條件下總體成數(shù)的區(qū)間估計(jì)步驟⒋計(jì)算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計(jì)【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95﹪的概率保證程度下,估計(jì)該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)??傮w成數(shù)的區(qū)間估計(jì)按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計(jì)—100100名工人的日產(chǎn)量分組資料完成定額的人數(shù)解:則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數(shù)的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計(jì)的可靠程度為95﹪。一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本容量的確定第三節(jié)

參數(shù)估計(jì)的基本方法★★★三、樣本容量的確定㈠確定樣本容量的意義㈡推斷總體平均數(shù)所需的樣本容量㈢推斷總體成數(shù)所需的樣本容量㈣必要樣本容量的影響因素樣本容量調(diào)查誤差調(diào)查費(fèi)用小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大大樣本容量調(diào)查精度高但費(fèi)用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量確定樣本容量的意義找出在限定費(fèi)用范圍內(nèi)的最大樣本容量大確定方法推斷總體平均數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計(jì)值:①過(guò)去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的S。計(jì)算結(jié)果通常向上進(jìn)位⑵不重復(fù)抽樣條件下:確定方法推斷總體平均數(shù)所需的樣本容量【例A】某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過(guò)5克,應(yīng)抽查多少袋產(chǎn)品?解:確定方法推斷總體成數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計(jì)算結(jié)果通常向上進(jìn)位

通常未知。一般按以下方法確定其估計(jì)值:①過(guò)去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的;③取方差的最大值0.25。⑵不重復(fù)抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量【例B】某企業(yè)對(duì)一批總數(shù)為5000件的產(chǎn)品進(jìn)行質(zhì)量檢查,過(guò)去幾次同類(lèi)調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過(guò)3﹪,在99.73﹪的概率保證程度下,應(yīng)抽查多少件產(chǎn)品?【分析】因?yàn)楣灿腥齻€(gè)過(guò)去的合格率的資料,為保證推斷的把握程度,應(yīng)選其中方差最大者,即P=93﹪。解:必要樣本容量的影響因素總體方差的大小;允許誤差范圍的大小;概率保證程度;抽樣方法;抽樣的組織方式。重復(fù)抽樣條件下:不重復(fù)抽樣條件下:△越大,n需小越大,n需越大Z越大,n需越大重復(fù)抽,n需大簡(jiǎn)單隨機(jī)抽,n需較大抽樣復(fù)查的方法其全面調(diào)查時(shí)的登記結(jié)果為2.2861億元其抽樣復(fù)查的結(jié)果為2.1734億元隨機(jī)抽取五個(gè)下屬單位修正系數(shù)為則:該企業(yè)集團(tuán)所擁有的固定資產(chǎn)原值應(yīng)為16.851×0.9507=16.020(億元)所擁有固定資產(chǎn)原值的普查結(jié)果為16.851億元某企業(yè)集團(tuán)總體(一)根據(jù)給定的概率F(Z),推算抽樣極限誤差的可能范圍及區(qū)間估計(jì)分析步驟:1、抽取樣本,計(jì)算樣本指標(biāo)。2、根據(jù)給定的F(Z)查表求得概率度Z。3、根據(jù)概率度和抽樣平均誤差計(jì)算極限誤差。4、計(jì)算被估計(jì)值的上、下限,對(duì)總體參數(shù)作出區(qū)間估計(jì)??傮w參數(shù)區(qū)間估計(jì)的習(xí)題

某農(nóng)場(chǎng)進(jìn)行小麥產(chǎn)量抽樣調(diào)查,小麥播種總面積為1萬(wàn)畝,采用不重復(fù)簡(jiǎn)單隨機(jī)抽樣,從中抽選了100畝作為樣本進(jìn)行實(shí)割實(shí)測(cè),測(cè)得樣本平均畝產(chǎn)400斤,方差144斤。

(1)以95.45%的可靠性推斷該農(nóng)場(chǎng)小麥平均畝產(chǎn)可能在多少斤之間?例題一:z=2樣本指標(biāo),有時(shí)需要計(jì)算問(wèn)題一解題過(guò)程:已知:問(wèn)題一解:1、計(jì)算抽樣平均誤差2、計(jì)算抽樣極限誤差3、計(jì)算總體平均數(shù)的置信區(qū)間上限:下限:即:以95.45%的可靠性估計(jì)該農(nóng)場(chǎng)小麥平均畝產(chǎn)量在

397.62斤至402.38斤之間.不重復(fù)抽樣x-Δx≤X≤x+Δx(2)若概率保證程度不變,要求抽樣允許誤差不超過(guò)1斤,問(wèn)至少應(yīng)抽多少畝作為樣本?問(wèn)題二解:已知:則樣本單位數(shù):即:當(dāng)至少應(yīng)抽544.6畝作為樣本。例題二:某紗廠某時(shí)期內(nèi)生產(chǎn)了10萬(wàn)個(gè)單位的紗,按不重復(fù)隨機(jī)抽樣方式抽取2000個(gè)單位檢驗(yàn),檢驗(yàn)結(jié)果合格率為95%,廢品率為5%,試以95%的把握程度,估計(jì)全部紗合格品率的區(qū)間范圍及合格品數(shù)量的區(qū)間范圍?已知:區(qū)間下限:區(qū)間上限:例題三:為調(diào)查農(nóng)民生活狀況,在某地區(qū)5000戶農(nóng)民中,按不重復(fù)簡(jiǎn)單隨機(jī)抽樣法,抽取400戶進(jìn)行調(diào)查,得知這400戶中擁有彩色電視機(jī)的農(nóng)戶為87戶。要求計(jì)算:1.以顯著性水平α=0.05的條件下估計(jì)該地區(qū)全部農(nóng)戶中擁有彩色電視機(jī)的農(nóng)戶在多大比例之間?2.若要求抽樣允許誤差不超過(guò)0.02,其它條件不變,問(wèn)應(yīng)抽多少戶作為樣本?例題三的問(wèn)題一解:已知:N=5000n=4001、計(jì)算樣本成數(shù):2、計(jì)算抽樣平均誤差:3、計(jì)算抽樣極限誤差:4、計(jì)算總體P的置信區(qū)間:下限:上限:即:以95%的把握程度估計(jì)該地區(qū)農(nóng)戶中擁有彩電的農(nóng)戶在

17.87%至25.63%之間。例題三的問(wèn)題二解:當(dāng)其他條件不變時(shí):=1635(戶)(二)根據(jù)給定的抽樣誤差范圍,作出一定概率保證程度下的區(qū)間估計(jì)分析步驟:1、抽取樣本,計(jì)算抽樣指標(biāo)。2、根據(jù)給定的極限誤差范圍估計(jì)總體參數(shù)的上限和下限。3、計(jì)算概率度。4、查表求出概率F(z),并對(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論