第三章抽樣分布_第1頁
第三章抽樣分布_第2頁
第三章抽樣分布_第3頁
第三章抽樣分布_第4頁
第三章抽樣分布_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章抽樣分布1實(shí)物總體數(shù)字總體組成元素具體對象組成元素變量的具體取值研究的標(biāo)志例:1000個(gè)零件的直徑1000個(gè)零件的集合組成元素:每個(gè)零件零件直徑的集合組成元素:直徑觀測值統(tǒng)計(jì)推斷中的總體及總體分布第一節(jié)隨機(jī)樣本2

對一個(gè)總體而言,個(gè)體的取值是按一定規(guī)律分布的。任取一個(gè)零件,其直徑取值是按一定概率分布的。

對某個(gè)總體而言,總對應(yīng)著一個(gè)隨機(jī)變量X,總體分布就是指隨機(jī)變量的概率分布。

數(shù)理統(tǒng)計(jì)學(xué)中“總體”這個(gè)基本概念從本質(zhì)上講:總體就是一個(gè)隨機(jī)變量X。對總體的研究,就是對相應(yīng)的隨機(jī)變量X的研究。3例:質(zhì)量檢查,0表示正品,1表示次品,出現(xiàn)次品的概率為p,則總體由0,1構(gòu)成,這一總體對應(yīng)一個(gè)參數(shù)為p的(0-1)分布的隨機(jī)變量,即4總體:研究對象的某項(xiàng)數(shù)量指標(biāo)值的全體。個(gè)體:組成總體的每一個(gè)基本元素。例如:①

某工廠生產(chǎn)的燈泡的使用壽命的全體是一個(gè)總體。每一個(gè)燈泡的使用壽命是一個(gè)個(gè)體。每個(gè)男生的身高是一個(gè)個(gè)體。②我校男生的身高的全體是一個(gè)總體。總體所含個(gè)體的數(shù)目稱為總體容量.總體5樣本:通過隨機(jī)觀測或試驗(yàn)的方法,獲得的總體中一部分個(gè)體,稱為樣本,每個(gè)個(gè)體稱為樣本單位。抽樣:就是從總體中抽取有限個(gè)個(gè)體對總體進(jìn)行觀測的過程。樣本的二重性。抽樣之前,由于總體中各個(gè)體有同等被抽中的可能,抽中哪個(gè)個(gè)體不能確定,因此樣本是一組隨機(jī)變量;但當(dāng)樣本被抽取并測試完成后,各個(gè)樣本點(diǎn)都是一個(gè)確定的數(shù)值,樣本成為是一組確定的數(shù)值。樣本6

在相同的條件下對總體X進(jìn)行n次重復(fù)獨(dú)立的觀察。將n次觀察結(jié)果按試驗(yàn)的次序記為X1,

X2,…,

Xn。由于X1,

X2,…,

Xn

是對隨機(jī)變量X觀察的結(jié)果,且各次觀察是在相同的條件下獨(dú)立進(jìn)行的,所以有理由認(rèn)為X1,

X2,…,

Xn是相互獨(dú)立的,且都是與總體X具有相同分布的隨機(jī)變量。這樣得到的X1,

X2,…,

Xn稱為來自總體X的一個(gè)簡單隨機(jī)樣本,n為這個(gè)樣本的容量。7

第一、樣本點(diǎn)與總體同分布(“樣本與總體同分布”)第二、樣本點(diǎn)之間相互獨(dú)立(簡稱“樣本獨(dú)立”)兩個(gè)性質(zhì)常常合稱為“樣本獨(dú)立同分布”。滿足上述性質(zhì)的樣本為簡單隨機(jī)樣本。樣本的兩個(gè)重要性質(zhì)8

n次觀察一經(jīng)完成,我們就得到一組實(shí)數(shù)x1,

x2,…,

xn

,它們依次是隨機(jī)變量X1,

X2,…,

Xn的觀察值,稱為樣本觀測值。

9簡單隨機(jī)抽樣和簡單隨機(jī)樣本的性質(zhì)無限總體有限總體不放回放回樣本樣本放回不放回樣本樣本獨(dú)立性和同一性不獨(dú)立當(dāng)n/N≤5%時(shí),有限總體不放回抽樣等同于放回抽樣無限總體抽樣方式10第二節(jié)常用的抽樣分布

樣本包含了總體的各種特征信息,是進(jìn)行統(tǒng)計(jì)推斷的依據(jù)。這些信息是“散布”在樣本之中的。在實(shí)際應(yīng)用時(shí),要從中得到所需要的統(tǒng)計(jì)信息,往往不是直接使用樣本本身,而是對樣本進(jìn)行“處理”,將所需信息濃縮集中起來針對不同的問題,構(gòu)造樣本的適當(dāng)函數(shù)——統(tǒng)計(jì)量進(jìn)行統(tǒng)計(jì)推斷。11

如果樣本X1,…,Xn的函數(shù)g=g(X1,…,Xn)不含未知參數(shù),則稱g(X1,…,Xn)是一個(gè)統(tǒng)計(jì)量。

是g(X1,…,Xn)的觀測值

如果x1,…,xn是對應(yīng)于樣本X1,…,Xn的樣本值,則稱:

一、統(tǒng)計(jì)量12總體參數(shù)未知總體其他信息未知總體分布未知抽樣得到隨機(jī)樣本利用統(tǒng)計(jì)量推斷總體信息樣本統(tǒng)計(jì)量g=g(X1,X2,…Xn)兩個(gè)要點(diǎn):1、是樣本的函數(shù)2、不含未知的參數(shù).樣本X1,X2,…Xn在統(tǒng)計(jì)推斷中,一項(xiàng)重要的工作就是尋找統(tǒng)計(jì)量和導(dǎo)出統(tǒng)計(jì)量的分布。133.樣本k階矩常用統(tǒng)計(jì)量14總體X的K階原點(diǎn)矩和K階中心矩分別為E(Xk)(k=1,2,…)和E((X-E(Xk))k)(k=2,3,…)總體的一階原點(diǎn)矩即為總體的均值,總體的二階中心矩即為總體的方差。15

例設(shè)一個(gè)總體含有4個(gè)個(gè)體,即總體單位數(shù)N=4,其取值分別為X1=22、X2=24、X3=26、X4=28。

總體的均值、方差:二、幾種常用的抽樣分布樣本統(tǒng)計(jì)量的分布稱為抽樣分布,即由樣本統(tǒng)計(jì)量的全部可能取值和與之相應(yīng)的概率(頻率)組成的分配數(shù)列。16

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,重復(fù)抽樣條件下,共有42=16個(gè)可能樣本。所有可能樣本的結(jié)果列表如下,試分析樣本均值的分布。DD(28)DC(27)DB(26)DA(25)D(28)CD(27)CC(26)CB(25)CA(24)C(26)BD(26)BC(25)BB(24)BA(23)B(24)AD(25)AC(24)AB(23)AA(22)A(22)D(28)C(26)B(24)A(22)第二個(gè)樣本單位第一個(gè)樣本單位所有可能樣本及其樣本均值(n=2)17

將表中樣本的均值的各種可能取值及其可能性(概率)加以整理,繪制成分布表和分布圖如下:樣本均值的抽樣分布1合計(jì)1/16282/16273/16264/16253/16242/16231/1622概率均值

樣本均值的抽樣分布圖220.30.20.10P

(x)232628272425x18所有可能樣本均值的均值和方差

樣本均值的均值(數(shù)學(xué)期望)等于總體均值;樣本均值的方差等于總體方差的1/n。19事實(shí)上,對于來自均值和方差分別為

的總體的一個(gè)簡單隨機(jī)樣本X1,

X2,…,

Xn

,其樣本均值的數(shù)字期望和方差分別為和。一般稱為樣本均值的抽樣誤差。20

的抽樣分布與總體分布和樣本量n有關(guān):

總體是正態(tài)分布,樣本均值總是正態(tài)分布總體非正態(tài)分布,隨著n的增大,樣本均值趨于正態(tài)分布21當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理

(centrallimittheorem)中心極限定理:設(shè)從均值為

,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X≥22中心極限定理

(centrallimittheorem)的分布趨于正態(tài)分布的過程23式中為實(shí)數(shù),

>0.則稱X服從參數(shù)為,2的正態(tài)分布,亦稱高斯分布.記為N(,2).可表為X~N(,2).

圖象見右上角若隨機(jī)變量X的密度函數(shù)為一般正態(tài)分布

1.定義24

(1)單峰對稱

密度曲線關(guān)于直線x=

對稱f()=maxf(x)=正態(tài)分布有兩個(gè)特性:(2)

的大小直接影響概率的分布越大,曲線越平坦;越小,曲線越陡峻.25標(biāo)準(zhǔn)正態(tài)分布

參數(shù)=0,2=1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記作Z~N(0,1)。其密度函數(shù)為分布函數(shù)為密度函數(shù)的積分26分布函數(shù)為(1)(0)=0.5(2)(+∞)=1;(3)(x)=1-(-x).x一般的概率統(tǒng)計(jì)教科書均附有標(biāo)準(zhǔn)正態(tài)分布表供讀者查閱

(x)的值.(附表1)如,若X~N(0,1),(0.5)=0.6915,P{1.32<X<2.43}=(2.43)-(1.32)=0.9925-0.9066例題:課本74頁27

2—分布

t—分布F—分布在參數(shù)估計(jì)和假設(shè)檢驗(yàn)等統(tǒng)計(jì)推斷問題中這三個(gè)分布有廣泛的應(yīng)用。統(tǒng)計(jì)推斷中三個(gè)重要分布28定義

設(shè)X為一個(gè)連續(xù)型隨機(jī)變量,f(x)為其密度函數(shù),對于給定的正數(shù)

稱滿足條件的點(diǎn)xα

為X的上

α

分位數(shù)

(簡稱為上分位點(diǎn)).黃色陰影部分概率為α上側(cè)分位數(shù)隨機(jī)變量X的分位數(shù)也叫分位點(diǎn),是表示隨機(jī)變量X的位置特征的數(shù)字.29(一)

2分布1.

2分布的定義和密度函數(shù)設(shè)X1,…,Xn是相互獨(dú)立,服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)變量,則稱隨機(jī)變量:所服從的分布為自由度是n的分布,即記為30獨(dú)立同分布的隨機(jī)變量序列隨機(jī)變量服從標(biāo)準(zhǔn)正態(tài)分布新構(gòu)造的隨機(jī)變量為原隨機(jī)變量平方和新隨機(jī)變量服從自由度為n的卡方分布分布的三個(gè)要點(diǎn):31

2(n)分布是參數(shù)為n/2,1/2的Γ分布,即

2(n)的密度函數(shù)為32

2分布隨著自由度n增加,分布漸近于正態(tài)。圖

2的概率密度曲線33證:所以:(1)2.2分布的性質(zhì)34(2)分布可加性且獨(dú)立,則:35

(3)上側(cè)分位數(shù)所謂一個(gè)分布的

上側(cè)分位數(shù)就是指這樣一個(gè)數(shù),它使相應(yīng)分布的隨機(jī)變量不小于(大于等于)該數(shù)的概率為,比如,若記

2變量的

上側(cè)分位數(shù)為,則滿足查表313頁附表3

20.995(11)=2.603

20.01(13)=27.688d36附表3中給出了自由度n≤45的

2分布的上α

分位數(shù)值.如對于查附表3得

方便通過EXCEL查分位點(diǎn),函數(shù)為CHIINV。fx常用函數(shù)CHIINVα=0.05n=5573.31α=0.02n=5578.62371.t分布的定義和密度函數(shù)t(n)稱為自由度為n的t分布,記為T~t(n)。(二)

t

分布t(n)分布的概率密度為定義:若X~N(0,1),Y~

2(n),X與Y獨(dú)立,則38

t分布和標(biāo)準(zhǔn)正態(tài)分布類似,他們都是對稱分布。區(qū)別:t分布尾部厚,即服從t分布的隨機(jī)變量取到尾部值的概率比標(biāo)準(zhǔn)正態(tài)分布略大。而對于接近原點(diǎn)的坐標(biāo)點(diǎn),t分布的值比標(biāo)準(zhǔn)正態(tài)分布的值小。因而t分布曲線尾部厚于標(biāo)準(zhǔn)正態(tài)分布,而峰低于標(biāo)準(zhǔn)正態(tài)分布。

t分布的密度函數(shù)曲線39

(1)f(t)關(guān)于t=0(縱軸)對稱。

(2)f(t)的極限為N(0,1)的密度函數(shù),即

,40分子是標(biāo)準(zhǔn)正態(tài)隨機(jī)變量分母是自由度為n的卡方隨機(jī)變量分子分母相互獨(dú)立,且滿足構(gòu)造公式新隨機(jī)變量服從自由度為n的t分布t分布的三個(gè)要點(diǎn):分子:標(biāo)準(zhǔn)正態(tài)分布變量分母:卡方變量除以自由度再開方412.42附表2中給出了自由度n≤45時(shí),當(dāng)α≤0.5的t

分布的上α

分位數(shù)值;如對于α=0.05,n=20查附表2得可以通過EXCEL查分位點(diǎn),函數(shù)為TINV。(注意:α雙側(cè),2×0.05=0.1)T0.05(20)=1.724743(三)

F—分布定義:若U

~2(n1),V~2(n2),U和V獨(dú)立,則

稱為第一自由度為n1

,第二自由度為n2的F分布,其概率密度函數(shù)為1.F分布的定義和密度函數(shù)44分子是自由度為n1的卡方隨機(jī)變量分母是自由度為n2的卡方隨機(jī)變量分子分母相互獨(dú)立,且滿足構(gòu)造公式新隨機(jī)變量服從第一自由度為n1第二自由度為n2的F分布F分布的三個(gè)要點(diǎn):

兩個(gè)卡分變量除以自由度之比45F分布密度函數(shù)圖糾錯(cuò):462.F分布的上側(cè)臨界值47

對某些較小的α,附表4中給出了自由度為(n1,n2

)的F分布的上α

分位數(shù)值。如對于查附表5得方便通過EXCEL查分位點(diǎn),函數(shù)為FINV。48

由于F分布表的局限性,我們不能用直接查表得到此題的下側(cè)分位點(diǎn)。怎么辦呢?給定顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論