版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)分析
(方法與案例)
作者賈俊平版權(quán)所有違者必究統(tǒng)計(jì)學(xué)基礎(chǔ)(第6版)FundamentalStatistics第4章抽樣與參數(shù)估計(jì)4.1
抽樣與抽樣分布4.2參數(shù)估計(jì)的基本方法4.3總體均值的區(qū)間估計(jì)4.4總體比例的的區(qū)間估計(jì)4.5樣本容量的確定parameterestimation學(xué)習(xí)目標(biāo)抽樣方法與抽樣分布估計(jì)量與估計(jì)值的概念點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別總體均值的區(qū)間估計(jì)方法總體比例的區(qū)間估計(jì)方法樣本容量的確定方法4.1抽樣與抽樣分布
4.1.1概率抽樣方法
4.1.2抽樣分布第4章抽樣與參數(shù)估計(jì)4.1.1概率抽樣方法4.1抽樣與抽樣分布概率抽樣
(probabilitysampling)也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率簡(jiǎn)單隨機(jī)抽樣
(simplerandomsampling)從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,每個(gè)單位入抽樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其它輔助信息以提高估計(jì)的效率分層抽樣
(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)系統(tǒng)抽樣
(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難整群抽樣
(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差4.1.2抽樣分布4.1抽樣與抽樣分布在重復(fù)選取容量為n的樣本時(shí),由每一個(gè)樣本算出的該統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布或概率分布是一種理論分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)我們穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布
(samplingdistribution)容量相同的所有可能樣本的樣本均值的概率分布一種理論概率分布進(jìn)行推斷總體總體均值
的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布
(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)
,即總體單位數(shù)N=4。4
個(gè)個(gè)體分別為x1=1、x2=2、x3=3
、x4=4
??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布
(例題分析)
現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布
(例題分析)
計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的分布與總體分布的比較
(例題分析)
=2.5σ2=1.25總體分布樣本均值分布樣本均值的抽樣分布
與中心極限定理
=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值
X也服從正態(tài)分布,
X
的數(shù)學(xué)期望為μ,方差為σ2/n。即
X~N(μ,σ2/n)中心極限定理
(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為
,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X抽樣分布與總體分布的關(guān)系中心極限定理
(centrallimittheorem)
x的分布趨于正態(tài)分布的過(guò)程樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布
(數(shù)學(xué)期望與方差)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為
樣本比例的抽樣分布
(比例—proportion)容量相同的所有可能樣本的樣本比例的概率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似一種理論概率分布推斷總體總體比例
的理論基礎(chǔ) 樣本比例的抽樣分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布
(數(shù)學(xué)期望與方差)4.2參數(shù)估計(jì)的基本原理
4.2.1估計(jì)量與估計(jì)值
4.2.2點(diǎn)估計(jì)與區(qū)間估計(jì)第4章抽樣與參數(shù)估計(jì)4.2.1估計(jì)量與估計(jì)值4.2參數(shù)估計(jì)的基本原理參數(shù)估計(jì)(parameterestimation)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值
的一個(gè)估計(jì)量參數(shù)用
表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來(lái)的統(tǒng)計(jì)量的具體值如果樣本均值
x=80,則80就是
的估計(jì)值估計(jì)量與估計(jì)值
(estimator&estimatedvalue)4.2.2點(diǎn)估計(jì)與區(qū)間估計(jì)4.2參數(shù)估計(jì)的基本原理點(diǎn)估計(jì)
(pointestimate)用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)無(wú)法給出估計(jì)值接近總體參數(shù)程度的信息由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同于總體真值一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來(lái)衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無(wú)法給出估計(jì)的可靠性的度量區(qū)間估計(jì)
(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)估計(jì)區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%
樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)的圖示將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例,也稱置信度表示為(1-
為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平
(confidencelevel)
常用的置信水平
(confidencelevel)
置信水平90%0.100.051.64595%0.050.0251.9699%0.010.0052.58由樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類似的方式進(jìn)行表述置信區(qū)間的表述
(confidenceinterval)總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實(shí)際估計(jì)時(shí)往往只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間的表述
(confidenceinterval)當(dāng)抽取了一個(gè)具體的樣本,用該樣本所構(gòu)造的區(qū)間是一個(gè)特定的常數(shù)區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,因?yàn)樗赡苁前傮w均值的區(qū)間中的一個(gè),也可能是未包含總體均值的那一個(gè)一個(gè)特定的區(qū)間總是“包含”或“絕對(duì)不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題置信水平只是告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)所抽取的這個(gè)樣本所構(gòu)建的區(qū)間而言的置信區(qū)間的表述
(confidenceinterval)置信區(qū)間的表述
(95%的置信區(qū)間)使用一個(gè)較大的置信水平會(huì)得到一個(gè)比較寬的置信區(qū)間,而使用一個(gè)較大的樣本則會(huì)得到一個(gè)較準(zhǔn)確(較窄)的區(qū)間。直觀地說(shuō),較寬的區(qū)間會(huì)有更大的可能性包含參數(shù)但實(shí)際應(yīng)用中,過(guò)寬的區(qū)間往往沒(méi)有實(shí)際意義比如,天氣預(yù)報(bào)說(shuō)“在一年內(nèi)會(huì)下一場(chǎng)雨”,雖然這很有把握,但有什么意義呢?另一方面,要求過(guò)于準(zhǔn)確(過(guò)窄)的區(qū)間同樣不一定有意義,因?yàn)檫^(guò)窄的區(qū)間雖然看上去很準(zhǔn)確,但把握性就會(huì)降低,除非無(wú)限制增加樣本量,而現(xiàn)實(shí)中樣本量總是有限的區(qū)間估計(jì)總是要給結(jié)論留點(diǎn)兒余地置信區(qū)間的表述
(confidenceinterval)4.3總體均值的區(qū)間估計(jì)
4.3.1正態(tài)總體、方差已知或非正態(tài)總體、大樣本
4.2.2正態(tài)總體、方差未知、小樣本第4章抽樣與參數(shù)估計(jì)4.3.1正態(tài)總體、方差已知
或非正態(tài)總體、大樣本4.3總體均值的區(qū)間估計(jì)總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)1. 假定條件總體服從正態(tài)分布,且方差(
2)
已知如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似(n
30)使用正態(tài)分布統(tǒng)計(jì)量z總體均值
在1-
置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4-2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知X~N(
,102),n=25,1-
=95%,z
/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:。由于是正態(tài)總體,且方差已知??傮w均值
在1-
置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體均值的區(qū)間估計(jì)
(Excel應(yīng)用)
總體均值的區(qū)間估計(jì)
(Excel應(yīng)用)
總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4-3】一家保險(xiǎn)公司收集到由36個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間
36個(gè)投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知n=36,1-
=90%,z
/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,
總體均值
在1-
置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲4.3.2正態(tài)總體、方差未知、小樣本4.3總體均值的區(qū)間估計(jì)總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差未知、小樣本)1. 假定條件總體服從正態(tài)分布,但方差(
2)
未知小樣本(n<30)使用t
分布統(tǒng)計(jì)量總體均值
在1-
置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差未知、小樣本)【例4-4】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(jì)
(正態(tài)總體、方差未知、小樣本)解:已知X~N(
,2),n=16,1-
=95%,t
/2=2.131
根據(jù)樣本數(shù)據(jù)計(jì)算得:,
總體均值
在1-
置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2h總體均值的區(qū)間估計(jì)
(Excel應(yīng)用)
總體均值的區(qū)間估計(jì)
(Excel應(yīng)用)
總體均值的區(qū)間估計(jì)
(小結(jié))4.4總體比例的區(qū)間估計(jì)
第4章抽樣與參數(shù)估計(jì)總體比例的區(qū)間估計(jì)
(一個(gè)總體比例)1. 假定條件總體服從二項(xiàng)分布可以由正態(tài)分布來(lái)近似np(成功次數(shù))和n(1-p)(失敗次數(shù))均應(yīng)該大于10使用正態(tài)分布統(tǒng)計(jì)量z3.總體比例
在1-
置信水平下的置信區(qū)間為總體比例的區(qū)間估計(jì)
(例題分析)【例4-5】某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
總體參數(shù)的區(qū)間估計(jì)
(小結(jié))4.5樣本量的確定
4.5.1估計(jì)總體均值時(shí)樣本量的確定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆南昌市第二十八中學(xué)物理高三上期末經(jīng)典試題含解析
- 2025屆江蘇省江陰市普通高中物理高一第一學(xué)期期末調(diào)研試題含解析
- 2025屆陜西省西安工業(yè)大學(xué)附屬補(bǔ)習(xí)學(xué)校物理高三第一學(xué)期期末綜合測(cè)試模擬試題含解析
- 2025屆山東省菏澤市23校聯(lián)考高三物理第一學(xué)期期末學(xué)業(yè)水平測(cè)試試題含解析
- 遼寧省朝陽(yáng)市(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)統(tǒng)編版能力評(píng)測(cè)(下學(xué)期)試卷及答案
- 安徽省蚌埠市(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版隨堂測(cè)試(上學(xué)期)試卷及答案
- 《低壓電器培訓(xùn)》課件2
- 2024合同續(xù)簽通知范本
- 急救擔(dān)架的使用課件
- 一年級(jí)小學(xué)生課前三分鐘小故事(20篇)
- 食品安全管理員任命書范文
- 完整版中華醫(yī)學(xué)會(huì)瘧疾診療規(guī)范
- 北師大版七年級(jí)生物上冊(cè)教案(全冊(cè)完整版)
- 防腐油漆施工工藝
- 南方S82T操作手冊(cè)
- 設(shè)備采購(gòu)安裝工程結(jié)算書
- [精品]臺(tái)灣地區(qū)零售藥店的現(xiàn)狀與發(fā)展趨勢(shì)
- 焙燒爐煙氣換熱器的設(shè)計(jì)方案
- 血漿置換及臨床的應(yīng)用業(yè)內(nèi)特制
- 雨蝶(李翊君)原版正譜鋼琴譜五線譜樂(lè)譜.docx
- 綜合實(shí)踐活動(dòng)五年級(jí)下冊(cè)課件-制作木蜻蜓14張ppt課件
評(píng)論
0/150
提交評(píng)論