管理統(tǒng)計(jì)學(xué) 焦建玲 第04章 抽樣和抽樣分布_第1頁
管理統(tǒng)計(jì)學(xué) 焦建玲 第04章 抽樣和抽樣分布_第2頁
管理統(tǒng)計(jì)學(xué) 焦建玲 第04章 抽樣和抽樣分布_第3頁
管理統(tǒng)計(jì)學(xué) 焦建玲 第04章 抽樣和抽樣分布_第4頁
管理統(tǒng)計(jì)學(xué) 焦建玲 第04章 抽樣和抽樣分布_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章抽樣和抽樣分布

第一節(jié)ABC公司的抽樣問題ABC公司的人事主管正在制定公司2500名管理人員的簡報(bào)。其中包括管理人員的平均年薪和已經(jīng)完成公司管理培訓(xùn)項(xiàng)目的管理人員所占比率。2500名管理人員構(gòu)成了此項(xiàng)研究的總體。我們可以參照公司的職員記錄總體中每個(gè)人的年薪和是否完成管理培訓(xùn)項(xiàng)目。假定我們已經(jīng)獲取了總體2500名管理人員的信息。根據(jù)前面所學(xué)知識,可以計(jì)算總體年薪的均值和標(biāo)準(zhǔn)差。第一節(jié)ABC公司的抽樣問題

假定結(jié)果為:總體均值:美元總體標(biāo)準(zhǔn)差:美元進(jìn)一步假設(shè)已有1500名管理人員完成了管理培訓(xùn)項(xiàng)目,將總體中已經(jīng)完成培訓(xùn)項(xiàng)目的職員比率定為p,則p=1500/2500=0.6。第一節(jié)ABC公司的抽樣問題

如何通過抽樣的方法對總體的參數(shù)進(jìn)行估計(jì)呢?(統(tǒng)計(jì)推斷)第二節(jié)簡單隨機(jī)抽樣一、有限總體(finitepopulation)的抽樣簡單隨機(jī)樣本(simplerandomsample):如果隨機(jī)樣本中每個(gè)個(gè)體以相等的概率被抽出,則稱為簡單隨機(jī)樣本。無返回抽樣,返回抽樣思考:為什么都屬于簡單隨機(jī)抽樣?第二節(jié)簡單隨機(jī)抽樣

二、簡單隨機(jī)抽樣的實(shí)現(xiàn)方法1.直接抽選法2.隨機(jī)數(shù)表法3.抽簽法第三節(jié)點(diǎn)估計(jì)一、點(diǎn)估計(jì)過程例4-1ABC公司的人事主管正在制定公司2500名管理人員的簡報(bào)。其中包括管理人員的平均年薪和已經(jīng)完成公司管理培訓(xùn)項(xiàng)目的管理人員所占比率2500名管理人員構(gòu)成了此項(xiàng)研究的總體。我們可以參照公司的職員記錄總體中每個(gè)人的年薪和是否完成管理培訓(xùn)項(xiàng)目。假定我們通過簡單隨機(jī)抽樣已獲取30名管理人員的信息如下表所示。

第三節(jié)點(diǎn)估計(jì)

表4-230名管理人員組成的簡單隨機(jī)樣本的年薪以及培訓(xùn)年薪/美元是否參加管理培訓(xùn)年薪/美元是否參加管理培訓(xùn)x1=49094是x16=51766是x2=53263是x17=52541否x3=49643是x18=44980是x4=49643是x19=51932是x5=47621否x20=52973是x6=55924是x21=45120是x7=49092是x22=51753是x8=51404是x23=54391否x9=50957是x24=50164否x10=55109是x25=52973否x11=45927是x26=50241否x12=57268否x27=52793否x13=55688是x28=50979是x14=51564否x29=55860是x15=56188否x30=57309否第三節(jié)點(diǎn)估計(jì)問題:總體年薪的均值是多少?年薪的方差(標(biāo)準(zhǔn)差)是多少?總體中回答:是的比例是多少?如果以樣本均值作為總體參數(shù)的估計(jì),即認(rèn)為2500名管理人員年薪的均值大概是51805.3美元,這種估計(jì)方法稱之為點(diǎn)估計(jì)。其中稱為估計(jì)量(estimator),為總體未知參數(shù)。注意估計(jì)量與估計(jì)值概念的區(qū)別。第三節(jié)點(diǎn)估計(jì)

被估計(jì)的總體參數(shù)EstimatePopulationParameter…用以估計(jì)的樣本統(tǒng)計(jì)量withSampleStatistic均值Meanx成數(shù)Proportionπp方差Variance2s

2差異Differences1

-

2x1-x2估計(jì)未知總體參數(shù)的常見的點(diǎn)估計(jì)量第三節(jié)點(diǎn)估計(jì)二、點(diǎn)估計(jì)的優(yōu)良標(biāo)準(zhǔn)總體未知參數(shù)θ的點(diǎn)估計(jì)量不唯一,什么估計(jì)量是好的呢?一般來說,一個(gè)好的估計(jì)量應(yīng)具備三個(gè)標(biāo)準(zhǔn):1.無偏性2.有效性3.一致性第三節(jié)點(diǎn)估計(jì)

1.無偏性若,則稱為的無偏估計(jì)量CAθ無偏Unbiased有偏Biased第三節(jié)點(diǎn)估計(jì)2.有效性,若則稱比更有效,思考:更有效的估計(jì)量意味著什么?AB樣本中位數(shù)的分布樣本均值的分布fx樣本均值比中位數(shù)作為總體均值的估計(jì)更有效,更好第三節(jié)點(diǎn)估計(jì)

3.一致性以樣本統(tǒng)計(jì)量估計(jì)總體參數(shù),要求當(dāng)樣本容量充分大時(shí),樣本統(tǒng)計(jì)量也充分靠近總體參數(shù)。一般來說,如果樣本容量增大,估計(jì)量更趨近,就稱為的一致估計(jì)量。這就是說隨著樣本容量的無限增加,樣本統(tǒng)計(jì)量和被估計(jì)的總體參數(shù)之差絕對值小于任意小正數(shù),它的可能性也趨于必然性,即第四節(jié)抽樣分布一、幾個(gè)重要的分布(卡方分布、t分布,F(xiàn)分布)第四節(jié)抽樣分布

2.與區(qū)間估計(jì)相關(guān)的常見的幾種分布介紹

2.1卡方分布設(shè)隨機(jī)變量皆服從,且相互獨(dú)立,則隨機(jī)變量所服從的分布稱為卡方分布,記著

其中參數(shù)n稱為自由度,表示平方和中獨(dú)立隨機(jī)變量的個(gè)數(shù)。第四節(jié)抽樣分布

不同自由度的卡方分布密度曲線對比第四節(jié)抽樣分布例:如果一隨機(jī)變量X服從自由度為10的卡方分布,求P(X<16)x=16第四節(jié)抽樣分布

方法一:用excel函數(shù)chidist.chidist(x,deg-freedom)返回P(X>x)。本例中,P(X<16)=1-CHIDIST(16,10)=0.900368第四節(jié)抽樣分布

方法二:查表(參見教材附表3卡方分布上分位數(shù)表)表示卡方變量大于給定值的概率為αP(X<16)≈P(X<15.987)=1-P(X<15.987)=1-0.1=0.9第四節(jié)抽樣分布

已知概率求隨機(jī)變量的問題例如:當(dāng)自由度為10時(shí),上0.025分位數(shù)即P(X>x)=0.025,所對應(yīng)的值為20.483.下0.025分位數(shù)也就是P(X>3.247)=1-0.025第四節(jié)抽樣分布

2.2t分布設(shè)隨機(jī)變量相互獨(dú)立,則隨機(jī)變量的分布稱為t分布,記著,其中參數(shù)n稱為自由度。隨著自由度n趨于無窮,t分布以標(biāo)準(zhǔn)正態(tài)分布為極限。當(dāng)時(shí),一般無法在t分布表中查出分位點(diǎn),此時(shí)可以用標(biāo)準(zhǔn)正態(tài)分布替代t分布。其密度表達(dá)式為可以證明上式在n→∞,密度函數(shù)趨于標(biāo)準(zhǔn)正態(tài)密度函數(shù)第四節(jié)抽樣分布

不同自由度的t分布密度曲線對比特點(diǎn)1:外形左右關(guān)于y軸對稱特點(diǎn)2:隨著自由度增加,尾巴越來越細(xì)特點(diǎn)3:當(dāng)n超過30時(shí),其密度曲線近乎與標(biāo)準(zhǔn)正態(tài)曲線重合第四節(jié)抽樣分布

例:若一隨機(jī)變量X~t(10),求P(X<-1)第四節(jié)抽樣分布方法:通過excel函數(shù)TDIST(x,degrees_freedom,tails)X是需要計(jì)算分布的數(shù)值。Degrees_freedom

是一個(gè)表示自由度的整數(shù)。Tails

指定返回的分布函數(shù)是單尾分布還是雙尾分布。如果

tails

=

1,則

TDIST

返回單尾分布。如果

tails

=

2,則

TDIST

返回雙尾分布。如果

tails

=

1,TDIST

的計(jì)算公式

TDIST

=

P(

X>x

),其中

X

為服從

t

分布的隨機(jī)變量。如果

tails

=

2,TDIST

的計(jì)算公式為

TDIST

=

P(|X|

>

x)

=

P(X

>

x

or

X

<

-x)。第四節(jié)抽樣分布本例中,P(X<-1)=P(X>1)=TDIST(1,10,1)=0.170447第四節(jié)抽樣分布已知概率(分位數(shù))求隨機(jī)變量的問題一般要查表(附表2t分布上分位數(shù)表)例如:當(dāng)自由度為10時(shí),上0.025分位數(shù)即P(X>x)=0.025,所對應(yīng)的值為2.228.也就是P(X>2.228)=0.025第四節(jié)抽樣分布4.F分布設(shè)隨機(jī)變量且互相獨(dú)立,則隨機(jī)變量的分布稱為自由度為n與m的F分布記著。第四節(jié)抽樣分布如何查F分布上分位數(shù)表。比如要查上0.1分位數(shù),第一自由度是8,第二自由度位5的分位數(shù)3.34P(X>3.34)=0.1P(X>x)=α,x=Fα(m,n)第四節(jié)抽樣分布

如何查F分布下分位數(shù),比如查下側(cè)0.1分位數(shù),第一自由度為5,第二自由度為8.P(X<x)=0.1x下0.1分位數(shù)P(X>x)=0.9轉(zhuǎn)化為0.9分位數(shù),但沒辦法查到0.9的F分布分位數(shù)表第四節(jié)抽樣分布

上式說明下0.1分位數(shù),可以轉(zhuǎn)化為上0.1分位數(shù)第四節(jié)抽樣分布

P(X<x)=0.1x下0.1分位數(shù)P(X>x)=0.9第四節(jié)抽樣分布

二、抽樣分布的概念估計(jì)量是樣本的函數(shù),因而它是隨機(jī)的,必將服從某個(gè)分布。為了找到它的分布,我們假設(shè)可以大量重復(fù)(甚至是無限次的)簡單隨機(jī)抽樣實(shí)驗(yàn)。這里假設(shè)重復(fù)做抽樣實(shí)驗(yàn)500次,每一次抽取樣本容量為30,得到如下表所示的數(shù)據(jù)(例4-1)。

第四節(jié)抽樣分布表4-4由30名管理人員組成的500個(gè)簡單隨機(jī)樣本年薪均值/美元頻數(shù)頻率49500~5000020.40%50000~50500163.20%50500~510005210.40%51000~5150010120.20%51500~5200013326.60%52000~5250011022.00%52500~530005410.80%53000~53500265.20%53500~5400061.20%合計(jì)5001第四節(jié)抽樣分布

從上圖可以看出,樣本均值作為統(tǒng)計(jì)量服從一定的分布,我們把它叫做樣本均值的抽樣分布。同理還可以得到樣本方差,樣本比例等統(tǒng)計(jì)量的抽樣分布。本章需要掌握樣本均值、樣本比例的抽樣分布。第四節(jié)抽樣分布

三、樣本均值的抽樣分布與中心極限定理(一)樣本均值的抽樣分布的性質(zhì)(1)的數(shù)學(xué)期望為總體均值:(2)的標(biāo)準(zhǔn)差:(有限總體)

(無限總體)有限總體修正系數(shù),在N很大且n占到N比例很小時(shí),可以忽略。第四節(jié)抽樣分布

(二)中心極限定理-抽樣分布定理命題1:正態(tài)分布再生定理:當(dāng)總體為正態(tài)分布,對任何容量樣本,樣本均值的抽樣分布服從以總體均值為均值,以總體方差除以樣本容量為方差的的正態(tài)分布。第四節(jié)抽樣分布

命題2:當(dāng)樣本容量n足夠大(n≥30),無論總體是什么分布,樣本均值

的抽樣分布將趨于正態(tài)分布。(又稱為大樣本定理)若無限總體均值為,標(biāo)準(zhǔn)差為,那么對于大樣本(樣本容量不小于30)的樣本均值來說,它將近似服從的正態(tài)分布。若有限總體均值為,標(biāo)準(zhǔn)差為,那么對于樣本容量為n的大樣本(n>=30)的樣本均值來說,它將近似服從的正態(tài)分布。第四節(jié)抽樣分布P(x)總體IP(x)總體IIP(x)總體III樣本均值的抽樣分布(n=2)樣本均值的抽樣分布(n=30)樣本均值的抽樣分布(n=5)第四節(jié)抽樣分布【例4-2】在一所大學(xué),四年級7300個(gè)學(xué)生的總平均成績的均值為μ=3.19和σ=0.24,如果無放回抽取一個(gè)包含36個(gè)學(xué)生的隨機(jī)樣本,問樣本均值與相差0.4以內(nèi)的概率為多少?分析(1)總體不知道什么分布;(2)大樣本;(3)n<=0.05N,不需要有限總體修正系數(shù);(4)樣本均值服從正態(tài)分布第四節(jié)抽樣分布解:根據(jù)中心極限定理,樣本均值近似服從均值為μ=3.19,方差為0.242/36的正態(tài)分布。第四節(jié)抽樣分布

四、樣本比例的抽樣分布第六節(jié)其他抽樣方法一、分層抽樣又稱為分類抽樣、或類型抽樣,它首先是將總體的N個(gè)單位分成互不交叉、互不重復(fù)的k個(gè)部分,我們稱之為層。然后從每一層中隨機(jī)抽取部分單位。第六節(jié)其他抽樣方法

好處:降低抽樣誤差。如何分層?總的原則是:層內(nèi)樣本的差異要小,而層與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論