第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第1頁(yè)
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第2頁(yè)
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第3頁(yè)
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第4頁(yè)
第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一節(jié) 事件與概率(一)概率的定義 研究隨機(jī)試驗(yàn),需了解各種隨機(jī)事件發(fā)生的可能性大小,以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性。 能夠刻畫(huà)事件發(fā)生可能性大小的數(shù)量指標(biāo)稱(chēng)之為概率(probability)。事件A的概率記為P(A)。1概率的古典定義 (先驗(yàn)概率) 隨機(jī)試驗(yàn)具有以下特征,稱(chēng)為古典概型。1.試驗(yàn)的所有可能結(jié)果只有有限個(gè),即樣本空間中的基本事件只有有限個(gè);2.各試驗(yàn)的結(jié)果出現(xiàn)的可能性相等,即所有基本事件的發(fā)生是等可能的;3.試驗(yàn)的所有可能結(jié)果兩兩互不相容。對(duì)于古典概型,概率的定義:設(shè)樣本空間由 n 個(gè)等可能的基本事件所構(gòu)成,其中事件A包含有m個(gè)基本事件,則事件A的概率為m/n,即P(A)=m/

2、n這樣定義的概率稱(chēng)為古典概率2概率的統(tǒng)計(jì)定義(經(jīng)驗(yàn)概率) 在相同條件下進(jìn)行n次重復(fù)試驗(yàn),如果隨機(jī)事件A發(fā)生的次數(shù)為m,那么m/n稱(chēng)為隨機(jī)事件A的頻率;當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí),隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值p,那么就把 p稱(chēng)為隨機(jī)事件A的概率(probability)。2概率的運(yùn)算法則 加法法則:互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。即P(A+B)=P(A)+P(B)。 加法定理對(duì)于多個(gè)兩兩互斥的事件也成立。P(A+B+N)=P(A)+P(B)+P(N) P(A+B)=P(A)+P(B)-P(AB)乘法法則: 如果A事件和 B事件為獨(dú)立事件,則事件A與B事件同時(shí)發(fā)

3、生的概率等于兩獨(dú)立事件概率的乘積,即:P(AB)=P(A) P(B) 乘法定理對(duì)于n個(gè)相互獨(dú)立的事件也成立,即P(A1A2 An)=P(A1) P(A2) P (An)書(shū)上例題第二節(jié) 常用離散變量的理論分布一、二項(xiàng)分布(一)貝努里試驗(yàn)及其概率函數(shù):指只有兩種可能結(jié)果的隨機(jī)試驗(yàn),我們將其中比較關(guān)注的結(jié)果稱(chēng)為“成功”,另一個(gè)結(jié)果稱(chēng)為“失敗”。將某隨機(jī)試驗(yàn)重復(fù)進(jìn)行n次,若各次試驗(yàn)結(jié)果互不影響,即每次試驗(yàn)結(jié)果出現(xiàn)的概率都不依賴(lài)于其它各次試驗(yàn)的結(jié)果,則稱(chēng)n次試驗(yàn)是獨(dú)立的對(duì)于n次獨(dú)立的試驗(yàn)如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與 之一, 在每次試驗(yàn)中出現(xiàn)A的概率是常數(shù)p(0<p<1), 因而出

4、現(xiàn)對(duì)立事件 的概率是1-p=q,則稱(chēng)這一串重復(fù)的獨(dú)立試驗(yàn)為n重貝努里試驗(yàn),簡(jiǎn)稱(chēng)貝努里試驗(yàn)在n重貝努里試驗(yàn)中,事件 A 可能發(fā)生0,1,2,n次,來(lái)求事件 A 恰好發(fā)生k(0kn)次的概率Pn(k)。例:拋擲4次硬幣,正面朝上(A)出現(xiàn)2次的概率。先取n=4,k=2。在4次試驗(yàn)中,事件A發(fā)生2次的方式有以下C42種:一般,在n重貝努里試驗(yàn)中,事件A恰好發(fā)生k(0kn)次的概率為kn-k C nk p k=0,1,2,n P (k) =qn(二)二項(xiàng)分布的定義及性質(zhì)1、二項(xiàng)分布的定義:設(shè)隨機(jī)變量 x 所有可能取的值為零和正整數(shù):0,1,2,,n,且有:P n ( k ) = C nk p k q

5、n - k k=0,1,2,n其中p0,q0,p+q=1,則稱(chēng)隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布 ,記為:B(x;n,p)。二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)n稱(chēng)為正整數(shù)離散參數(shù);p 是連續(xù)參數(shù),它能取0與1之間的任何數(shù)值(q=1p)。2、二項(xiàng)分布的性質(zhì):容易驗(yàn)證,二項(xiàng)分布具有概率分布的一切性質(zhì),即:(1)P(x=k)= Pn(k) (k=0,1,,n)(2)二項(xiàng)分布的概率之和等于1,即(3)(4)nCnpk=0kkqn-k=(q+p)n=1kmP(xm)=Pn(km)=nCnk=0knpqkn-kP(xm)=Pn(km)=Ck=mpqm2kn-k(5) P(m1xm2)=pn(m

6、1km2)=(m1<m2)3、二項(xiàng)分布的圖形特征:二項(xiàng)分布的圖形由n和p兩個(gè)參數(shù)決定: Cnpk=m1kkqn-k(1)當(dāng)p值較小且n不大時(shí),分布是偏斜的。但隨著n增大 ,分布逐漸趨于對(duì)稱(chēng);(2)當(dāng)p值趨于0.5時(shí),分布趨于對(duì)稱(chēng);(3)對(duì)于固定n及p,當(dāng)k增加時(shí) ,概率P(X=k) 先是隨之增加直至 達(dá)到最大值, 隨后單調(diào)減少。此外,在n較大,np、nq較接近時(shí) ,二項(xiàng)分布接近于正態(tài)分布;當(dāng)n時(shí),二項(xiàng)分布的極限分布是正態(tài)分布。(n30,np5,nq5時(shí),近似正態(tài)分布。)(三)二項(xiàng)分布概率計(jì)算及應(yīng)用條件二項(xiàng)分布的應(yīng)用條件有三:1.各觀(guān)察單位只具有互相對(duì)立 的一種結(jié)果,屬于二項(xiàng)分類(lèi)資料;2.

7、已知發(fā)生某一結(jié)果的概率為p,其對(duì)立結(jié)果的概率則為1p=q ,要求p是從大量觀(guān)察中獲得的穩(wěn)定數(shù)值;3.n個(gè)觀(guān)察單位的觀(guān)察結(jié)果互相獨(dú)立,即每個(gè)觀(guān)察單位的結(jié)果不會(huì)影響到其它觀(guān)察單位的觀(guān)察結(jié)果(四)二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)證明,服從二項(xiàng)分布B(n,p)的隨機(jī)變量之平均數(shù)、標(biāo)準(zhǔn)差與參數(shù)n、p有如下關(guān)系:當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí)= np=三.幾何分布(Geometry distribution)在貝努里試驗(yàn)中,每次試驗(yàn)成功的概率為p,失敗的概率為q=1-p,設(shè)試驗(yàn)進(jìn)行到第 次才出現(xiàn)成功。 (xi)的分布列為P ( k -1 k=1.2 = k ) = pq-1 (k=1.2)是幾何級(jí)數(shù)的

8、pq k 一般項(xiàng)。因此稱(chēng)它為幾何分布記為 g(k;p)。四、超幾何分布 npq對(duì)于抽樣調(diào)查,只有在大群體(即總體比樣本相對(duì)大很多)的情況下,二項(xiàng)分布的獨(dú)立試驗(yàn)要求才能夠近似得到滿(mǎn)足(重復(fù)抽樣)。但如果研究對(duì)象是小群體,這時(shí)總體單位不多,一般只有幾十個(gè)。假定總體只有兩類(lèi),其中K個(gè)成功類(lèi),(N-K)個(gè)為失敗類(lèi),這時(shí)如果從總體中抽取一容量為n的樣本,那么成功的概率將不再恒定,也就是二相分布所要求的獨(dú)立試驗(yàn)的條件不再被滿(mǎn)足,而超幾何分布將適合于這種小群體的研究。形式:P(X=k)=K=0,1,超幾何概型,例:產(chǎn)品檢驗(yàn)。有N個(gè)產(chǎn)品(其中有K個(gè)合格品)從N個(gè)產(chǎn)品中取n個(gè)檢驗(yàn),求n中有X個(gè)合格品的概率。(即

9、X合格品個(gè)數(shù)) 不回置抽樣!期望:E(X)=nK/N=np方差:D(X)=npq(N-n)/(N-1)當(dāng)研究對(duì)象是小群體,并且采用不回置抽樣時(shí),成功的概率將不再恒定,也就是二項(xiàng)分布所要求的獨(dú)立試驗(yàn)的條件不再被滿(mǎn)足,而超幾何分布將適合于這種情況的研究。當(dāng)群體規(guī)模逐漸增大,以致不回置抽樣可以作為回置抽樣來(lái)處理,可用二項(xiàng)分布來(lái)近似超幾何分布。一般當(dāng)n/N0.1時(shí),這種近似就是可以采用的。五、泊松分布泊松分布是一種描述和分析稀有事件的概率分布。要觀(guān)察到這類(lèi)事件,樣本含量 n必須很大 。例:盒子中裝有999個(gè)黑棋子,一個(gè)白棋子,在一次抽樣中,抽中白棋子的概率1/1000(一)泊松分布的定義與特征1、定義

10、:若隨機(jī)變量x(x=k)只取零和正整數(shù)值0,1,2,且其概率分布為x!x=0,1,(稀有事件出現(xiàn)的次數(shù))其中0;e 是自然對(duì)數(shù)的底數(shù)(e=2.71828) ,則稱(chēng) x 服從參數(shù)為的泊松分布P(x=k)=xe-(Poissons distribution),記為P(x;)2、泊松分布重要的特征平均數(shù)和方差相等,都等于常數(shù),即=2=np3、泊松分布的圖形特征:是泊松分布所依賴(lài)的唯一參數(shù)。 值愈小分布愈偏倚,隨著的增大,分布趨于對(duì)稱(chēng)。 當(dāng)= 20時(shí)分布接近于正態(tài)分布;當(dāng)=50時(shí),可以認(rèn)為波松分布呈正態(tài)分布。 在實(shí)際工作中,當(dāng)20時(shí)就可以用正態(tài)分布來(lái)近似地處理泊松分布的問(wèn)題(二)泊松分布的概率計(jì)算泊松

11、分布的概率計(jì)算依賴(lài)于參數(shù),只要參數(shù)確定了,把k=0,1,2,代入公式即可求得各項(xiàng)的概率。但是在大多數(shù)服從泊松分布的實(shí)例中,分布參數(shù)往往是未知的,只能從所觀(guān)察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為的估計(jì)值,將其代替公式中的,計(jì)算出k = 0,1,2,時(shí)的各項(xiàng)概率。例:一個(gè)合訂本共100頁(yè),假定每頁(yè)上印刷錯(cuò)誤的,數(shù)目X服從泊松分布(=1),計(jì)算該合訂本中各頁(yè)的印刷錯(cuò)誤都不超過(guò)4個(gè)的概率。解:由題目P(x;1).P(X4)=P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4).查表求值 =?+?+?+?+?所求概率為 (?)100=0.0045?!纠繛楸O(jiān)測(cè)飲用水的污染情況,

12、現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù),共得400個(gè)記錄如下經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù) =0.500,方差S2=0.496。兩者很接近, 故可認(rèn)為細(xì)菌數(shù)/ml(水) 服從泊松分布。以 =0.500代替公式中的,得k (k=0,1,2) 0.5-0.5P(x=k)=e k!計(jì)算結(jié)果如下表。細(xì)菌數(shù)的泊松分布可見(jiàn)細(xì)菌數(shù)的頻率分布與=0.5的波松分布是相當(dāng)吻合的,進(jìn)一步說(shuō)明用波松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。注意:泊松分布的應(yīng)用條件與二項(xiàng)分布相似(三)泊松分布與二項(xiàng)分布泊松定理:設(shè)隨機(jī)變量B(x;n,p)。當(dāng) n很大時(shí),p 很小。有以下近似式:其中=np 實(shí)際計(jì)算中,n10,p0.1,

13、近似效果就較好,而n 100, np 10 時(shí)近似效果就很好。由泊松定理,n重貝努里試驗(yàn)中稀有事件出現(xiàn)的次數(shù)近似地服從泊松分布。例見(jiàn):P133,例8.2.3(四)泊松分布與正態(tài)分布的關(guān)系當(dāng)較小時(shí), Piosson分布呈偏態(tài)分布,隨著增大,迅速接近正態(tài)分布,當(dāng) 20時(shí),可以認(rèn)為近似正態(tài)分布。第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布一、正態(tài)分布正態(tài)分布是最重要的概率分布。因?yàn)?第一,許多自然現(xiàn)象與社會(huì)現(xiàn)象,都可用正態(tài)分布加以敘述;第二,許多概率分布以正態(tài)分布為其極限;第三,許多統(tǒng)計(jì)量的抽樣分布呈現(xiàn)正態(tài)分布。因此,許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的(一)正態(tài)分布的概率函數(shù)若連續(xù)型隨機(jī)變量x的概率分布

14、密度函數(shù)為f(x)=1-(x-)2222e其中為平均數(shù),2為方差,則稱(chēng)隨機(jī)變量x服從正態(tài)分布(normal distribztion),記為xN(,2)。相應(yīng)的概率分布函數(shù)為 1F(x)= 2標(biāo)準(zhǔn)正態(tài)分布的三個(gè)常用概率 x-(x-)222-edx(二) 正態(tài)分布的特征1. 正態(tài)分布密度曲線(xiàn)是單峰、對(duì)稱(chēng)的懸鐘形曲線(xiàn),對(duì)稱(chēng)軸為x =;2. f(x) 在x=處達(dá)到極大,極大值 ;3. f(x)是非負(fù)函數(shù),以x軸為漸近線(xiàn),分布從-至+; 4. 曲線(xiàn)在x=±處各有一個(gè)拐點(diǎn),即曲線(xiàn)在(-,-)和(+,+) 區(qū)間上是下凸的,在-,+區(qū)間內(nèi)是上凸的;5. 正態(tài)分布有平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)參數(shù)。是位置參數(shù)

15、,是變異度參數(shù)。6. 分布密度曲線(xiàn)與橫軸所夾面積為1,即:2(x-)-+ 12P(-<x<+)=(三)標(biāo)準(zhǔn)正態(tài)分布 -22dx=1正態(tài)分布是依賴(lài)于參數(shù)和的一簇分布。將一般的N(,2)轉(zhuǎn)換為= 0,2=1的正態(tài)分布,應(yīng)用就方便了。稱(chēng)=0,2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作(z)和(z),得: ( z ) =e 2 - 2 2 ( z ) =2 -ez2 - z 2dz隨機(jī)變量z服從標(biāo)準(zhǔn)正態(tài)分布,記作zN(0,1)。對(duì)于任何一個(gè)服從正態(tài)分布N(,2)的隨機(jī)變量x,都可以通過(guò)標(biāo)準(zhǔn)化變換: z=(x-)將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量z。z稱(chēng)為標(biāo)

16、準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差 (四)正態(tài)分布的概率計(jì)算 標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算設(shè)z服從標(biāo)準(zhǔn)正態(tài)分布,則z在z1,z2 )何內(nèi)取值的概率為:(z2)(z1)而(z1)與(z2)可由附表查得 【例】 已知z-N(0,1),試求: (1) P(z-1.64)? (2) P (z2.58)=?(3) P (z2.56)=? (4) P(0.34z1.53) =?關(guān)于標(biāo)準(zhǔn)正態(tài)分布,以下幾種概率應(yīng)當(dāng)熟記: P(-1z1)=0.6826 P(-2z2)=0.9546 P(-3z3)=0.9974 P(-1.96z1.96)=0.95P (-2.58z2.58)=0.99 z在上述區(qū)間以外取值的概率分別為:P(z

17、1)=2(-1)=1- P(-1z1) =1-0.6826=0.3174 P(z2)=2(-2)=1- P(-2z2)=1-0.9545=0.0455 P(z3)=1-0.9973=0.0027 P(z1.96)=1-0.95=0.05 P(z2.58)=1-0.99=0.01 一般正態(tài)分布的概率計(jì)算正態(tài)分布密度曲線(xiàn)和橫軸圍成的區(qū)域,其面積為1,是一個(gè)必然事件。若隨機(jī)變量x服從正態(tài)分布N(,2),則x的取值落在任意區(qū)間x1, x2)的概率,記作P(x1 xx2),等于這部分曲邊梯形面積。即:(x-)222P(x1x<x2)=12xx21-edx對(duì)上式作變換z=(x-),得dx=dz,故有

18、P(x1x<x2)=12x2-(x-)222x1edu=12(x2-)/(x1-)/e12-2du= 1 2 z 2 z1 e 1 2 z - 2 d= ( z 2) ( z 1) -其中,z1=(x1-),z2=(x2-))這表明服從正態(tài)分布N(,2)的隨機(jī)變量x在x1,x2)內(nèi)取值的概率,等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量z在(x1-), (x2-))內(nèi)取值的概率。因此,計(jì)算一般正態(tài)分布的概率時(shí),只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化),就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。【例】設(shè)x服從=30.26,2=5.102的正態(tài)分布,試求P(21.64x32.98)。令則z服從標(biāo)準(zhǔn)正態(tài)分

19、布,故=P(-1.69z0.53)=(0.53)-(-1.69)=0.7019-0.04551=0.6564關(guān)于一般正態(tài)分布,以下幾個(gè)概率是經(jīng)常用到的。P(-x+)=0.6826P(-2x+2) =0.9546P (-3x+3) =0.9974P (-1.96x+1.96)=0.95P (-2.58x+2.58)=0.993、正態(tài)分布分位點(diǎn)計(jì)算正態(tài)分布的分位點(diǎn)的定義標(biāo)準(zhǔn)正態(tài)分布 密度函數(shù)圖形為圖中的點(diǎn) x 稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布的 ( 1 )% 的分位點(diǎn),相當(dāng)于已知 - (x)=p(Xx)=1- 求其中的 x4、單側(cè)概率與雙側(cè)概率統(tǒng)計(jì)學(xué)中,把隨機(jī)變量 x 落在區(qū)間(-k,+k)之外的概率稱(chēng)為雙側(cè)(兩

20、尾)概率,記作。對(duì)應(yīng)于雙側(cè)概率可以求得隨機(jī)變量x小于k或大于+k的概率,稱(chēng)為單側(cè)概率,記作2。如,x落在(-1.96,+1.96)之外的雙側(cè)概率為0.05,而單側(cè)概率為0.025。即 P(x-1.96)=P(x+1.96)=0.025x落在(-2.58,+2.58)之外的雙側(cè)概率為0.01,而單側(cè)概率P(x-2.58)=P(x +2.58)=0.005(五)二項(xiàng)分布及泊松分布與正態(tài)分布的關(guān)系對(duì)于二項(xiàng)分布,在n,p0,且np=(較小常數(shù))情況下,二項(xiàng)分布趨于泊松分布。在這種場(chǎng)合,泊松分布中的參數(shù) 用二項(xiàng)分布的np代之;在n,p0.5時(shí),二項(xiàng)分布趨于正態(tài)分布。在這種場(chǎng)合,正態(tài)分布中的 、2用二項(xiàng)分

21、布的np、npq代之。在實(shí)際計(jì)算中,當(dāng)p0.1且n很大時(shí) , 二項(xiàng)分布可由泊松分布近似;當(dāng)p0.1且n很大時(shí) ,二項(xiàng)分布可由正態(tài)分布近似。對(duì)于泊松分布,當(dāng)時(shí),泊松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中,當(dāng)20時(shí),用泊松分布中的代替正態(tài)分布中的及2,即可由后者對(duì)前者進(jìn)行近似計(jì)算。二、抽樣分布與中心極限定理研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對(duì)這種關(guān)系的研究可從兩方面著手:一是從總體到樣本,這就是研究抽樣分布(sampling distribution)的問(wèn)題;二是從樣本到總體,這就是統(tǒng)計(jì)推斷(statistical inference)問(wèn)題(一)抽樣分布的含義與無(wú)偏估計(jì)量1、抽樣分

22、布的含義:統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。由總體中隨機(jī)地抽取若干個(gè)體組成樣本,即使每次抽取的樣本含量相等,其統(tǒng)計(jì)量也將隨樣本的不同而有所不同。因而樣本統(tǒng)計(jì)量也是隨機(jī)變量,也有其概率分布,我們把統(tǒng)計(jì)量的概率分布稱(chēng)為抽樣分布。2、無(wú)偏估計(jì)在統(tǒng)計(jì)學(xué)上,如果所有可能樣本的某一統(tǒng)計(jì)數(shù)的平均數(shù)等于總體的相應(yīng)參數(shù),則稱(chēng)該統(tǒng)計(jì)數(shù)為總體相應(yīng)參數(shù)的無(wú)偏估計(jì)值。設(shè)有一N=3的總體,具有變量3,4,5;求得=4,2=0.6667, =0.8165現(xiàn)以n=2作獨(dú)立的回置抽樣,總共得Nn=32=9個(gè)樣本。抽樣結(jié)果列入下表:N=3 n=2時(shí)抽樣的平均數(shù) 方差 標(biāo)準(zhǔn)差:樣本平均數(shù)的平均數(shù)x=4樣本方差的

23、平均數(shù)S2=0.6667=2樣本標(biāo)準(zhǔn)差的平均數(shù)S=0.62850.8165= 所以,惟有樣本標(biāo)準(zhǔn)差s的平均數(shù)不是總體標(biāo)準(zhǔn)差的無(wú)偏差估計(jì)值。其余兩個(gè)參數(shù)為無(wú)偏差估計(jì)值。(二)樣本平均數(shù)的抽樣分布1、樣本平均數(shù)抽樣分布的含義及其參數(shù) 設(shè)有一個(gè)總體 ,總體平均數(shù)為,方差為2,總體中各變數(shù)為xi,將 此總體稱(chēng)為原總體?,F(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本,樣本平均數(shù)記為 ??梢栽O(shè)想,從原總體中可抽出很多甚至無(wú)窮多個(gè)含量為n的樣本。如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到 個(gè)樣本(所有可能的樣本個(gè)數(shù))。抽樣所得到的每一個(gè)樣本可以計(jì)算一個(gè)平均數(shù),全部可能的樣本都被抽取后可以

24、得到許多平均數(shù)。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來(lái)便構(gòu)成一個(gè)新的總體,平均數(shù)就成為這個(gè)新總體的變量。由平均數(shù)構(gòu)成的新總體的分布,稱(chēng)為平均數(shù)的抽樣分布。隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量,這種變量的分布稱(chēng)為統(tǒng)計(jì)數(shù)的抽樣分布。由這些樣本算得的平均數(shù)與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機(jī)抽樣造成的,稱(chēng)為抽樣誤差(sampling error)。由樣本平均數(shù)構(gòu)成的總體稱(chēng)為樣本平均數(shù)的抽樣總體,其平均數(shù)和標(biāo)準(zhǔn)差分別記為 和 。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差,簡(jiǎn)稱(chēng)標(biāo)準(zhǔn)誤(standard error),它表示平均數(shù)抽樣誤差的大小。統(tǒng)計(jì)學(xué)上已證明總體的兩個(gè)參數(shù)與x 總體

25、的兩個(gè)參數(shù)有如下關(guān)系:=n2、中心極限定理設(shè)有一個(gè)N=4的有限總體,變數(shù)為2,3,3,4。根據(jù)=xN和2=(x-)2N求得該總體的、2、為: =3,2=12,=1/21/2=0.707從有限總體作回置隨機(jī)抽樣,所有可能的樣本數(shù)為Nn其中n為樣本含量 。以上述總體而論,如果從中抽取n=2的樣本,共可得 42=16 個(gè)樣本;如果樣本含量n為4,則一共可抽得44=256個(gè)樣本。分別求這些樣本的平均數(shù) ,其次數(shù)分布如下表所示。在n=2的試驗(yàn)中,樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為=2f/Nn=48.0/16=3=2=f(-)N2n=f-(f)/NNn22n148-48/16 =16=4/16

26、=1/4=(1/2)/2= 2/n2=/4=2/2=n表 N=4, n=2和n=4時(shí)的次數(shù)分布同理,可得n=4時(shí):=768/256=3=32/256=1/8=(1/2)/4=22驗(yàn)證了 = , = / n 的正確性。 /n也可以將表中兩個(gè)樣本平均數(shù)的抽樣總體作次數(shù)分布圖。由以上模擬抽樣試驗(yàn)可以看出,雖然原總體并非正態(tài)分布,但從中隨機(jī)抽取樣本,即使樣本含量很小,樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量 n 的增大,樣本平均數(shù)的分布愈來(lái)愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。當(dāng)n30時(shí), 的分布就近似正態(tài)分布了。X變量與 變量概率分布間的關(guān)系可由下列兩個(gè)定理說(shuō)明:(1) 若隨機(jī)變量x服從正態(tài)分布

27、N(,2);x1、x2、xn,是由x 總體得來(lái)的隨機(jī)樣本,則統(tǒng)計(jì)量 =xn的概率分布也是正態(tài)分布,且有 ,即服從正態(tài)分布N(,2n)。(2) 若隨機(jī)變量x服從平均數(shù)是,方差是2的分布(不是正態(tài)分布); x1、x2、xn,是由此總體得來(lái)的隨機(jī)樣本,則統(tǒng)計(jì)量 =xn的概率分布,當(dāng)n相當(dāng)大時(shí)逼近正態(tài)分布N(,2n)。這就是中心極限定理。 中心極限定理告訴我們:不論x變量是連續(xù)型還是離散型,也無(wú)論x服從何種分布,一般只要n30,就可認(rèn)為 的分布是正態(tài)分布。若x的分布不很偏斜,在n20時(shí) , 的分布就近似于正態(tài)分布了由中心極限定理知,只要樣本容量適當(dāng)大,不論總體分布形狀如何,其 的分布都可看 和方差 2

28、 。在實(shí)際應(yīng)用上,如n>30就可以應(yīng)用這作為正態(tài)分布,且具平均數(shù)一定理。平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù) x轉(zhuǎn)換為z變數(shù)。n( x - ) ( x - ) = z = n x、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小,即精確性的高低。標(biāo)準(zhǔn)誤大,說(shuō)明各樣本平均數(shù) 間差異程度大,樣本平均數(shù)的精確性低。反之, 小,樣本平均數(shù)的精確性高。 的大小與原總體的標(biāo)準(zhǔn)差成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因?yàn)槭且怀?shù),所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。在實(shí)際工作中,總體標(biāo)準(zhǔn)差往往是未知的,因而無(wú)法求得 。此時(shí),可用樣本標(biāo)準(zhǔn)差S估計(jì)

29、。于是,以 估計(jì) 。記 為 , 稱(chēng)作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤 是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀(guān)測(cè)值為 x1、x2、xn,則= S=n(n-1)n(n-1)n注意:樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量。二者的區(qū)別是樣本標(biāo)準(zhǔn)差S是反映樣本中各觀(guān)測(cè)值的變異程度,它的大小說(shuō)明了 對(duì)該樣本代表性的強(qiáng)弱。樣本標(biāo)準(zhǔn)誤是樣本平均數(shù) 的標(biāo)準(zhǔn)差,它是抽樣誤差的估計(jì)值,其大小說(shuō)明了樣本間變異程度的大小及精確性的高低。(二) 兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布假定有兩個(gè)正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為 1, 1 和 2 , 2,從第一個(gè)總體隨機(jī)抽取n1個(gè)觀(guān)察值,同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取

30、n2個(gè)觀(guān)察值。這樣計(jì)算出樣本平均數(shù)和標(biāo)準(zhǔn)差 ,s1和 ,s2。 12 S(x-)2x2-(x)/n2從統(tǒng)計(jì)理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)( )的抽樣分布,具有以下特性12(1) 如果兩個(gè)總體各作正態(tài)分布,則其樣本平均數(shù)差數(shù)( 1 - 2 )準(zhǔn)確地遵循正態(tài)分布律,無(wú)論樣本容量大或小,都有N( 2 )。 , - 1-21-21-2=1-2(2) 兩個(gè)樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個(gè)總體平均數(shù)的差數(shù),即(3) 兩個(gè)獨(dú)立的樣本平均數(shù)差數(shù)分布的方差等于兩個(gè)總體的樣本平均數(shù)的方差總和,即 2 21-2=其差數(shù)標(biāo)準(zhǔn)差為:-= 12221+2222=1n1+2n212+n1n2這個(gè)分布也可標(biāo)準(zhǔn)化,獲得z

31、值z(mì) = ( y 1 - y 2 ) - ( - ) 1 22 2 1 2n1態(tài)分布具:+ n 2 =1+1 小結(jié): 若兩個(gè)樣本抽自于同一正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正1-2=0,11-2nn2 若兩個(gè)樣本抽自于同一總體,但并非正態(tài)總體,則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當(dāng)大時(shí)(大于30)才逐漸接近于正態(tài)分布。 2 若兩個(gè)樣本抽自于兩個(gè)非正態(tài)總體,當(dāng)n1和n2相當(dāng)大、而 1 2與 2 相差不太遠(yuǎn)時(shí),也可近似地應(yīng)用正態(tài)接近方法估計(jì)平均數(shù)差數(shù)出現(xiàn)的概率,當(dāng)然這種估計(jì)的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。(三)二項(xiàng)總體的抽樣分布、 二項(xiàng)總體的分布參

32、數(shù)(成數(shù)) = p 平均數(shù):方差: 2 = p (1 - p pq ) =標(biāo)準(zhǔn)差: = p(1-p) = pq、 樣本平均數(shù)(成數(shù))的抽樣分布從二項(xiàng)總體進(jìn)行抽樣得到樣本,樣本平均數(shù)(成數(shù))抽樣分布的參數(shù)為:平均數(shù): = p2=pqn方差:標(biāo)準(zhǔn)誤: = pq = p ( 1 - p ) nn(四)不重復(fù)抽樣的修正系數(shù) 前所講的抽樣分布和抽樣平均誤差的計(jì)算公式,都是就重復(fù)抽樣而言的??梢宰C明,采用不重復(fù)抽樣時(shí),平均數(shù)和比例的抽樣平均誤差應(yīng)為:( )=N-n2n(N-nN-1)n2(1 -nN)nN(P)=P(1-P)N-n()nN-1p(1-p)n(1-)可見(jiàn),不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽

33、樣的相應(yīng)公式多一個(gè)系數(shù)N-1NN-1 n這個(gè)系數(shù)稱(chēng)為不重復(fù)抽樣修正系數(shù)。當(dāng)N很大時(shí), N - n - (其中:n/N為抽樣比例)。 實(shí)際中,當(dāng)抽樣比例很小時(shí),(一般認(rèn)為小于5%),不重復(fù)抽樣的抽樣誤差常采用重復(fù)抽樣的公式計(jì)算。三、t 分布1、t 分布的定義:若xN(, 2), 則 N(, 2/n)。 將隨機(jī)變量 標(biāo)準(zhǔn)化得: ,則zN(0,1)。 當(dāng)總體標(biāo)準(zhǔn)差未知時(shí), 以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)量 記為t。在計(jì)算 時(shí),由于采用S來(lái)代替,使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布,而是服從t分布(tdistribztion)。它的概率分布密度函數(shù)如下:f(t)=1(df+1)/2(1+t2(df/2)d

34、f式中,t的取值范圍是(-,+);df=n-1為自由度。- 函 數(shù) +df)-df+12-函數(shù)的定義:(r)= -函數(shù)的定義域:(-,+)自由度df(degree of freedom )的含義 xr-1edx-xdf=k=n-1T 分布密度曲線(xiàn)2、t 分布的圖形特征t分布是類(lèi)似正態(tài)分布的一種對(duì)稱(chēng)分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴(lài)于稱(chēng)之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布。(1)t 分布受自由度的制約,每一個(gè)自由度都有一條t分布密度曲線(xiàn)。(2)t分布密度曲線(xiàn)以縱軸為對(duì)稱(chēng)軸,左右對(duì)稱(chēng),且在t0時(shí),分布密度函數(shù)取得最大值。(3)與標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)相比,t分布曲線(xiàn)頂部略低,兩尾部稍高而平。df越小這種趨勢(shì)越明顯。df越大,t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。3、 t ( n ) 分布分位點(diǎn)計(jì)算n ) 分布求它的分位點(diǎn)而不是求其概率。其分位點(diǎn)的定義 在統(tǒng)計(jì)中經(jīng)常對(duì)給定的 t (與標(biāo)準(zhǔn)正態(tài)分布相同。pt

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論