第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-01-27 格式：DOC 頁(yè)數(shù)：19 大小：248.50KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一節(jié) 事件與概率（一）概率的定義研究隨機(jī)試驗(yàn)，需了解各種隨機(jī)事件發(fā)生的可能性大小，以揭示這些事件的內(nèi)在的統(tǒng)計(jì)規(guī)律性。能夠刻畫(huà)事件發(fā)生可能性大小的數(shù)量指標(biāo)稱(chēng)之為概率(probability)。事件A的概率記為P（A）。1概率的古典定義（先驗(yàn)概率）隨機(jī)試驗(yàn)具有以下特征，稱(chēng)為古典概型。1.試驗(yàn)的所有可能結(jié)果只有有限個(gè)，即樣本空間中的基本事件只有有限個(gè)；2.各試驗(yàn)的結(jié)果出現(xiàn)的可能性相等，即所有基本事件的發(fā)生是等可能的；3.試驗(yàn)的所有可能結(jié)果兩兩互不相容。對(duì)于古典概型，概率的定義：設(shè)樣本空間由 n 個(gè)等可能的基本事件所構(gòu)成，其中事件A包含有m個(gè)基本事件，則事件A的概率為m/n，即P（A）=m/

2、n這樣定義的概率稱(chēng)為古典概率2概率的統(tǒng)計(jì)定義（經(jīng)驗(yàn)概率）在相同條件下進(jìn)行n次重復(fù)試驗(yàn)，如果隨機(jī)事件A發(fā)生的次數(shù)為m，那么m/n稱(chēng)為隨機(jī)事件A的頻率；當(dāng)試驗(yàn)重復(fù)數(shù)n逐漸增大時(shí)，隨機(jī)事件A的頻率越來(lái)越穩(wěn)定地接近某一數(shù)值p，那么就把 p稱(chēng)為隨機(jī)事件A的概率(probability)。2概率的運(yùn)算法則加法法則：互斥事件A和B的和事件的概率等于事件A和事件B的概率之和。即P(A+B)=P(A)+P(B)。加法定理對(duì)于多個(gè)兩兩互斥的事件也成立。P(A+B+N)=P(A)+P(B)+P(N) P（A+B）=P（A）+P（B）-P（AB）乘法法則：如果A事件和 B事件為獨(dú)立事件，則事件A與B事件同時(shí)發(fā)

3、生的概率等于兩獨(dú)立事件概率的乘積，即：P(AB)=P(A) P(B) 乘法定理對(duì)于n個(gè)相互獨(dú)立的事件也成立，即P(A1A2 An)=P(A1) P(A2) P (An)書(shū)上例題第二節(jié) 常用離散變量的理論分布一、二項(xiàng)分布（一）貝努里試驗(yàn)及其概率函數(shù)：指只有兩種可能結(jié)果的隨機(jī)試驗(yàn)，我們將其中比較關(guān)注的結(jié)果稱(chēng)為“成功”，另一個(gè)結(jié)果稱(chēng)為“失敗”。將某隨機(jī)試驗(yàn)重復(fù)進(jìn)行n次，若各次試驗(yàn)結(jié)果互不影響，即每次試驗(yàn)結(jié)果出現(xiàn)的概率都不依賴(lài)于其它各次試驗(yàn)的結(jié)果，則稱(chēng)n次試驗(yàn)是獨(dú)立的對(duì)于n次獨(dú)立的試驗(yàn)如果每次試驗(yàn)結(jié)果出現(xiàn)且只出現(xiàn)對(duì)立事件A與之一，在每次試驗(yàn)中出現(xiàn)A的概率是常數(shù)p(0<p<1), 因而出

4、現(xiàn)對(duì)立事件的概率是1-p=q，則稱(chēng)這一串重復(fù)的獨(dú)立試驗(yàn)為n重貝努里試驗(yàn)，簡(jiǎn)稱(chēng)貝努里試驗(yàn)在n重貝努里試驗(yàn)中，事件 A 可能發(fā)生0，1，2，n次，來(lái)求事件 A 恰好發(fā)生k(0kn)次的概率Pn(k)。例：拋擲4次硬幣，正面朝上（A）出現(xiàn)2次的概率。先取n=4，k=2。在4次試驗(yàn)中，事件A發(fā)生2次的方式有以下C42種：一般，在n重貝努里試驗(yàn)中，事件A恰好發(fā)生k(0kn)次的概率為kn-k C nk p k=0,1,2,n P (k) =qn（二）二項(xiàng)分布的定義及性質(zhì)1、二項(xiàng)分布的定義：設(shè)隨機(jī)變量 x 所有可能取的值為零和正整數(shù)：0,1,2,，n，且有：P n ( k ) = C nk p k q

5、n - k k=0,1,2,n其中p0，q0，p+q=1，則稱(chēng)隨機(jī)變量x服從參數(shù)為n和p的二項(xiàng)分布，記為：B(x;n,p)。二項(xiàng)分布是一種離散型隨機(jī)變量的概率分布。參數(shù)n稱(chēng)為正整數(shù)離散參數(shù)；p 是連續(xù)參數(shù)，它能取0與1之間的任何數(shù)值(q=1p)。2、二項(xiàng)分布的性質(zhì)：容易驗(yàn)證，二項(xiàng)分布具有概率分布的一切性質(zhì)，即：（1）P(x=k)= Pn(k) (k=0,1,，n)（2）二項(xiàng)分布的概率之和等于1，即(3)(4)nCnpk=0kkqn-k=(q+p)n=1kmP(xm)=Pn(km)=nCnk=0knpqkn-kP(xm)=Pn(km)=Ck=mpqm2kn-k(5) P(m1xm2)=pn(m

6、1km2)=（m1<m2）3、二項(xiàng)分布的圖形特征：二項(xiàng)分布的圖形由n和p兩個(gè)參數(shù)決定： Cnpk=m1kkqn-k（1）當(dāng)p值較小且n不大時(shí)，分布是偏斜的。但隨著n增大，分布逐漸趨于對(duì)稱(chēng)；（2）當(dāng)p值趨于0.5時(shí)，分布趨于對(duì)稱(chēng)；（3）對(duì)于固定n及p，當(dāng)k增加時(shí) ,概率P(X=k) 先是隨之增加直至達(dá)到最大值, 隨后單調(diào)減少。此外，在n較大，np、nq較接近時(shí) ，二項(xiàng)分布接近于正態(tài)分布；當(dāng)n時(shí)，二項(xiàng)分布的極限分布是正態(tài)分布。(n30,np5,nq5時(shí)，近似正態(tài)分布。)(三）二項(xiàng)分布概率計(jì)算及應(yīng)用條件二項(xiàng)分布的應(yīng)用條件有三：1.各觀(guān)察單位只具有互相對(duì)立的一種結(jié)果，屬于二項(xiàng)分類(lèi)資料；2.

7、已知發(fā)生某一結(jié)果的概率為p，其對(duì)立結(jié)果的概率則為1p=q ，要求p是從大量觀(guān)察中獲得的穩(wěn)定數(shù)值；3.n個(gè)觀(guān)察單位的觀(guān)察結(jié)果互相獨(dú)立，即每個(gè)觀(guān)察單位的結(jié)果不會(huì)影響到其它觀(guān)察單位的觀(guān)察結(jié)果（四）二項(xiàng)分布的平均數(shù)與標(biāo)準(zhǔn)差統(tǒng)計(jì)學(xué)證明，服從二項(xiàng)分布B(n，p)的隨機(jī)變量之平均數(shù)、標(biāo)準(zhǔn)差與參數(shù)n、p有如下關(guān)系：當(dāng)試驗(yàn)結(jié)果以事件A發(fā)生次數(shù)k表示時(shí)= np=三.幾何分布(Geometry distribution)在貝努里試驗(yàn)中，每次試驗(yàn)成功的概率為p，失敗的概率為q=1-p，設(shè)試驗(yàn)進(jìn)行到第次才出現(xiàn)成功。 (xi)的分布列為P ( k -1 k=1.2 = k ) = pq-1 （k=1.2）是幾何級(jí)數(shù)的

8、pq k 一般項(xiàng)。因此稱(chēng)它為幾何分布記為 g(k；p)。四、超幾何分布 npq對(duì)于抽樣調(diào)查，只有在大群體（即總體比樣本相對(duì)大很多）的情況下，二項(xiàng)分布的獨(dú)立試驗(yàn)要求才能夠近似得到滿(mǎn)足（重復(fù)抽樣）。但如果研究對(duì)象是小群體，這時(shí)總體單位不多，一般只有幾十個(gè)。假定總體只有兩類(lèi)，其中K個(gè)成功類(lèi)，（N-K）個(gè)為失敗類(lèi)，這時(shí)如果從總體中抽取一容量為n的樣本，那么成功的概率將不再恒定，也就是二相分布所要求的獨(dú)立試驗(yàn)的條件不再被滿(mǎn)足，而超幾何分布將適合于這種小群體的研究。形式:P(X=k)=K=0,1,超幾何概型,例:產(chǎn)品檢驗(yàn)。有N個(gè)產(chǎn)品（其中有K個(gè)合格品）從N個(gè)產(chǎn)品中取n個(gè)檢驗(yàn)，求n中有X個(gè)合格品的概率。（即

9、X合格品個(gè)數(shù)）不回置抽樣！期望：E（X）=nK/N=np方差：D(X)=npq(N-n)/(N-1)當(dāng)研究對(duì)象是小群體，并且采用不回置抽樣時(shí)，成功的概率將不再恒定，也就是二項(xiàng)分布所要求的獨(dú)立試驗(yàn)的條件不再被滿(mǎn)足，而超幾何分布將適合于這種情況的研究。當(dāng)群體規(guī)模逐漸增大，以致不回置抽樣可以作為回置抽樣來(lái)處理，可用二項(xiàng)分布來(lái)近似超幾何分布。一般當(dāng)n/N0.1時(shí)，這種近似就是可以采用的。五、泊松分布泊松分布是一種描述和分析稀有事件的概率分布。要觀(guān)察到這類(lèi)事件，樣本含量 n必須很大。例：盒子中裝有999個(gè)黑棋子，一個(gè)白棋子，在一次抽樣中，抽中白棋子的概率1/1000（一）泊松分布的定義與特征1、定義

10、：若隨機(jī)變量x(x=k)只取零和正整數(shù)值0，1，2，且其概率分布為x!x=0，1，(稀有事件出現(xiàn)的次數(shù))其中0；e 是自然對(duì)數(shù)的底數(shù)(e=2.71828) ，則稱(chēng) x 服從參數(shù)為的泊松分布P(x=k)=xe-(Poissons distribution)，記為P(x;)2、泊松分布重要的特征平均數(shù)和方差相等，都等于常數(shù)，即=2=np3、泊松分布的圖形特征：是泊松分布所依賴(lài)的唯一參數(shù)。值愈小分布愈偏倚，隨著的增大，分布趨于對(duì)稱(chēng)。當(dāng)= 20時(shí)分布接近于正態(tài)分布；當(dāng)=50時(shí)，可以認(rèn)為波松分布呈正態(tài)分布。在實(shí)際工作中，當(dāng)20時(shí)就可以用正態(tài)分布來(lái)近似地處理泊松分布的問(wèn)題（二）泊松分布的概率計(jì)算泊松

11、分布的概率計(jì)算依賴(lài)于參數(shù)，只要參數(shù)確定了，把k=0,1,2,代入公式即可求得各項(xiàng)的概率。但是在大多數(shù)服從泊松分布的實(shí)例中，分布參數(shù)往往是未知的，只能從所觀(guān)察的隨機(jī)樣本中計(jì)算出相應(yīng)的樣本平均數(shù)作為的估計(jì)值，將其代替公式中的，計(jì)算出k = 0,1,2,時(shí)的各項(xiàng)概率。例:一個(gè)合訂本共100頁(yè),假定每頁(yè)上印刷錯(cuò)誤的,數(shù)目X服從泊松分布(=1),計(jì)算該合訂本中各頁(yè)的印刷錯(cuò)誤都不超過(guò)4個(gè)的概率。解:由題目P(x;1).P(X4)=P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)+ P(X=4).查表求值 =?+?+?+?+?所求概率為 (?)100=0.0045?！纠繛楸O(jiān)測(cè)飲用水的污染情況，

12、現(xiàn)檢驗(yàn)?zāi)成鐓^(qū)每毫升飲用水中細(xì)菌數(shù)，共得400個(gè)記錄如下經(jīng)計(jì)算得每毫升水中平均細(xì)菌數(shù) =0.500，方差S2=0.496。兩者很接近，故可認(rèn)為細(xì)菌數(shù)/ml(水) 服從泊松分布。以 =0.500代替公式中的，得k (k=0,1,2) 0.5-0.5P(x=k)=e k!計(jì)算結(jié)果如下表。細(xì)菌數(shù)的泊松分布可見(jiàn)細(xì)菌數(shù)的頻率分布與=0.5的波松分布是相當(dāng)吻合的，進(jìn)一步說(shuō)明用波松分布描述單位容積(或面積)中細(xì)菌數(shù)的分布是適宜的。注意：泊松分布的應(yīng)用條件與二項(xiàng)分布相似（三）泊松分布與二項(xiàng)分布泊松定理:設(shè)隨機(jī)變量B(x;n,p)。當(dāng) n很大時(shí)，p 很小。有以下近似式：其中=np 實(shí)際計(jì)算中，n10,p0.1,

13、近似效果就較好,而n 100, np 10 時(shí)近似效果就很好。由泊松定理，n重貝努里試驗(yàn)中稀有事件出現(xiàn)的次數(shù)近似地服從泊松分布。例見(jiàn)：P133，例8.2.3（四）泊松分布與正態(tài)分布的關(guān)系當(dāng)較小時(shí)， Piosson分布呈偏態(tài)分布，隨著增大，迅速接近正態(tài)分布，當(dāng) 20時(shí)，可以認(rèn)為近似正態(tài)分布。第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布一、正態(tài)分布正態(tài)分布是最重要的概率分布。因?yàn)?第一，許多自然現(xiàn)象與社會(huì)現(xiàn)象，都可用正態(tài)分布加以敘述；第二,許多概率分布以正態(tài)分布為其極限；第三，許多統(tǒng)計(jì)量的抽樣分布呈現(xiàn)正態(tài)分布。因此，許多統(tǒng)計(jì)分析方法都是以正態(tài)分布為基礎(chǔ)的（一）正態(tài)分布的概率函數(shù)若連續(xù)型隨機(jī)變量x的概率分布

14、密度函數(shù)為f(x)=1-(x-)2222e其中為平均數(shù)，2為方差，則稱(chēng)隨機(jī)變量x服從正態(tài)分布(normal distribztion)，記為xN(,2)。相應(yīng)的概率分布函數(shù)為 1F(x)= 2標(biāo)準(zhǔn)正態(tài)分布的三個(gè)常用概率 x-(x-)222-edx(二) 正態(tài)分布的特征1. 正態(tài)分布密度曲線(xiàn)是單峰、對(duì)稱(chēng)的懸鐘形曲線(xiàn)，對(duì)稱(chēng)軸為x =；2. f(x) 在x=處達(dá)到極大，極大值；3. f(x)是非負(fù)函數(shù)，以x軸為漸近線(xiàn)，分布從-至+； 4. 曲線(xiàn)在x=±處各有一個(gè)拐點(diǎn)，即曲線(xiàn)在(-,-)和(+,+) 區(qū)間上是下凸的，在-,+區(qū)間內(nèi)是上凸的；5. 正態(tài)分布有平均數(shù)和標(biāo)準(zhǔn)差兩個(gè)參數(shù)。是位置參數(shù)

15、，是變異度參數(shù)。6. 分布密度曲線(xiàn)與橫軸所夾面積為1，即：2(x-)-+ 12P(-<x<+)=（三）標(biāo)準(zhǔn)正態(tài)分布 -22dx=1正態(tài)分布是依賴(lài)于參數(shù)和的一簇分布。將一般的N(，2)轉(zhuǎn)換為= 0，2=1的正態(tài)分布，應(yīng)用就方便了。稱(chēng)=0,2=1的正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)及分布函數(shù)分別記作(z)和(z)，得： ( z ) =e 2 - 2 2 ( z ) =2 -ez2 - z 2dz隨機(jī)變量z服從標(biāo)準(zhǔn)正態(tài)分布，記作zN(0，1)。對(duì)于任何一個(gè)服從正態(tài)分布N(,2)的隨機(jī)變量x，都可以通過(guò)標(biāo)準(zhǔn)化變換： z=(x-)將其變換為服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量z。z稱(chēng)為標(biāo)

16、準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差（四）正態(tài)分布的概率計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率計(jì)算設(shè)z服從標(biāo)準(zhǔn)正態(tài)分布，則z在z1,z2 ）何內(nèi)取值的概率為：(z2)(z1)而(z1)與(z2)可由附表查得【例】已知z-N(0，1)，試求： (1) P(z-1.64)? (2) P (z2.58)=?(3) P (z2.56)=? (4) P(0.34z1.53) =?關(guān)于標(biāo)準(zhǔn)正態(tài)分布，以下幾種概率應(yīng)當(dāng)熟記： P（-1z1）=0.6826 P（-2z2）=0.9546 P（-3z3）=0.9974 P（-1.96z1.96）=0.95P (-2.58z2.58)=0.99 z在上述區(qū)間以外取值的概率分別為：P(z

17、1)=2(-1)=1- P(-1z1) =1-0.6826=0.3174 P(z2)=2(-2)=1- P（-2z2）=1-0.9545=0.0455 P(z3)=1-0.9973=0.0027 P(z1.96)=1-0.95=0.05 P(z2.58)=1-0.99=0.01 一般正態(tài)分布的概率計(jì)算正態(tài)分布密度曲線(xiàn)和橫軸圍成的區(qū)域，其面積為1，是一個(gè)必然事件。若隨機(jī)變量x服從正態(tài)分布N(,2)，則x的取值落在任意區(qū)間x1, x2）的概率，記作P(x1 xx2)，等于這部分曲邊梯形面積。即：(x-)222P(x1x<x2)=12xx21-edx對(duì)上式作變換z=(x-)，得dx=dz，故有

18、P(x1x<x2)=12x2-(x-)222x1edu=12(x2-)/(x1-)/e12-2du= 1 2 z 2 z1 e 1 2 z - 2 d= （ z 2）（ z 1） -其中，z1=(x1-)，z2=(x2-)）這表明服從正態(tài)分布N(,2)的隨機(jī)變量x在x1，x2）內(nèi)取值的概率，等于服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量z在(x1-), (x2-)）內(nèi)取值的概率。因此，計(jì)算一般正態(tài)分布的概率時(shí)，只要將區(qū)間的上下限作適當(dāng)變換(標(biāo)準(zhǔn)化)，就可用查標(biāo)準(zhǔn)正態(tài)分布的概率表的方法求得概率了。【例】設(shè)x服從=30.26，2=5.102的正態(tài)分布，試求P(21.64x32.98)。令則z服從標(biāo)準(zhǔn)正態(tài)分

19、布，故=P(-1.69z0.53)=(0.53)-(-1.69)=0.7019-0.04551=0.6564關(guān)于一般正態(tài)分布，以下幾個(gè)概率是經(jīng)常用到的。P(-x+)=0.6826P(-2x+2) =0.9546P (-3x+3) =0.9974P (-1.96x+1.96)=0.95P (-2.58x+2.58)=0.993、正態(tài)分布分位點(diǎn)計(jì)算正態(tài)分布的分位點(diǎn)的定義標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形為圖中的點(diǎn) x 稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布的 ( 1 )% 的分位點(diǎn)，相當(dāng)于已知 - (x)=p(Xx)=1- 求其中的 x4、單側(cè)概率與雙側(cè)概率統(tǒng)計(jì)學(xué)中，把隨機(jī)變量 x 落在區(qū)間(-k,+k)之外的概率稱(chēng)為雙側(cè)(兩

20、尾)概率，記作。對(duì)應(yīng)于雙側(cè)概率可以求得隨機(jī)變量x小于k或大于+k的概率，稱(chēng)為單側(cè)概率，記作2。如，x落在(-1.96,+1.96)之外的雙側(cè)概率為0.05，而單側(cè)概率為0.025。即 P(x-1.96)=P(x+1.96)=0.025x落在(-2.58,+2.58)之外的雙側(cè)概率為0.01，而單側(cè)概率P(x-2.58)=P(x +2.58)=0.005（五）二項(xiàng)分布及泊松分布與正態(tài)分布的關(guān)系對(duì)于二項(xiàng)分布，在n，p0，且np=(較小常數(shù))情況下，二項(xiàng)分布趨于泊松分布。在這種場(chǎng)合，泊松分布中的參數(shù) 用二項(xiàng)分布的np代之；在n，p0.5時(shí)，二項(xiàng)分布趨于正態(tài)分布。在這種場(chǎng)合，正態(tài)分布中的、2用二項(xiàng)分

21、布的np、npq代之。在實(shí)際計(jì)算中，當(dāng)p0.1且n很大時(shí) ，二項(xiàng)分布可由泊松分布近似；當(dāng)p0.1且n很大時(shí) ，二項(xiàng)分布可由正態(tài)分布近似。對(duì)于泊松分布，當(dāng)時(shí)，泊松分布以正態(tài)分布為極限。在實(shí)際計(jì)算中，當(dāng)20時(shí)，用泊松分布中的代替正態(tài)分布中的及2，即可由后者對(duì)前者進(jìn)行近似計(jì)算。二、抽樣分布與中心極限定理研究總體與從中抽取的樣本之間的關(guān)系是統(tǒng)計(jì)學(xué)的中心內(nèi)容。對(duì)這種關(guān)系的研究可從兩方面著手：一是從總體到樣本，這就是研究抽樣分布(sampling distribution)的問(wèn)題；二是從樣本到總體，這就是統(tǒng)計(jì)推斷(statistical inference)問(wèn)題(一)抽樣分布的含義與無(wú)偏估計(jì)量1、抽樣分

22、布的含義：統(tǒng)計(jì)推斷是以總體分布和樣本抽樣分布的理論關(guān)系為基礎(chǔ)的。由總體中隨機(jī)地抽取若干個(gè)體組成樣本，即使每次抽取的樣本含量相等，其統(tǒng)計(jì)量也將隨樣本的不同而有所不同。因而樣本統(tǒng)計(jì)量也是隨機(jī)變量，也有其概率分布，我們把統(tǒng)計(jì)量的概率分布稱(chēng)為抽樣分布。2、無(wú)偏估計(jì)在統(tǒng)計(jì)學(xué)上，如果所有可能樣本的某一統(tǒng)計(jì)數(shù)的平均數(shù)等于總體的相應(yīng)參數(shù)，則稱(chēng)該統(tǒng)計(jì)數(shù)為總體相應(yīng)參數(shù)的無(wú)偏估計(jì)值。設(shè)有一N=3的總體，具有變量3，4，5；求得=4，2=0.6667， =0.8165現(xiàn)以n=2作獨(dú)立的回置抽樣，總共得Nn=32=9個(gè)樣本。抽樣結(jié)果列入下表：N=3 n=2時(shí)抽樣的平均數(shù) 方差標(biāo)準(zhǔn)差:樣本平均數(shù)的平均數(shù)x=4樣本方差的

23、平均數(shù)S2=0.6667=2樣本標(biāo)準(zhǔn)差的平均數(shù)S=0.62850.8165= 所以，惟有樣本標(biāo)準(zhǔn)差s的平均數(shù)不是總體標(biāo)準(zhǔn)差的無(wú)偏差估計(jì)值。其余兩個(gè)參數(shù)為無(wú)偏差估計(jì)值。(二)樣本平均數(shù)的抽樣分布1、樣本平均數(shù)抽樣分布的含義及其參數(shù) 設(shè)有一個(gè)總體，總體平均數(shù)為,方差為2，總體中各變數(shù)為xi，將此總體稱(chēng)為原總體?，F(xiàn)從這個(gè)總體中隨機(jī)抽取含量為n的樣本，樣本平均數(shù)記為 ?？梢栽O(shè)想，從原總體中可抽出很多甚至無(wú)窮多個(gè)含量為n的樣本。如果從容量為N的有限總體抽樣，若每次抽取容量為n的樣本，那么一共可以得到個(gè)樣本(所有可能的樣本個(gè)數(shù))。抽樣所得到的每一個(gè)樣本可以計(jì)算一個(gè)平均數(shù)，全部可能的樣本都被抽取后可以

24、得到許多平均數(shù)。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來(lái)便構(gòu)成一個(gè)新的總體，平均數(shù)就成為這個(gè)新總體的變量。由平均數(shù)構(gòu)成的新總體的分布，稱(chēng)為平均數(shù)的抽樣分布。隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量，這種變量的分布稱(chēng)為統(tǒng)計(jì)數(shù)的抽樣分布。由這些樣本算得的平均數(shù)與原總體平均數(shù)相比往往表現(xiàn)出不同程度的差異。這種差異是由隨機(jī)抽樣造成的，稱(chēng)為抽樣誤差(sampling error)。由樣本平均數(shù)構(gòu)成的總體稱(chēng)為樣本平均數(shù)的抽樣總體，其平均數(shù)和標(biāo)準(zhǔn)差分別記為和。是樣本平均數(shù)抽樣總體的標(biāo)準(zhǔn)差，簡(jiǎn)稱(chēng)標(biāo)準(zhǔn)誤(standard error)，它表示平均數(shù)抽樣誤差的大小。統(tǒng)計(jì)學(xué)上已證明總體的兩個(gè)參數(shù)與x 總體

25、的兩個(gè)參數(shù)有如下關(guān)系：=n2、中心極限定理設(shè)有一個(gè)N=4的有限總體，變數(shù)為2，3，3，4。根據(jù)=xN和2=(x-)2N求得該總體的、2、為： =3，2=12，=1/21/2=0.707從有限總體作回置隨機(jī)抽樣，所有可能的樣本數(shù)為Nn其中n為樣本含量。以上述總體而論，如果從中抽取n=2的樣本，共可得 42=16 個(gè)樣本；如果樣本含量n為4，則一共可抽得44=256個(gè)樣本。分別求這些樣本的平均數(shù) ，其次數(shù)分布如下表所示。在n=2的試驗(yàn)中，樣本平均數(shù)抽樣總體的平均數(shù)、方差與標(biāo)準(zhǔn)差分別為=2f/Nn=48.0/16=3=2=f(-)N2n=f-(f)/NNn22n148-48/16 =16=4/16

26、=1/4=(1/2)/2= 2/n2=/4=2/2=n表 N=4, n=2和n=4時(shí)的次數(shù)分布同理，可得n=4時(shí)：=768/256=3=32/256=1/8=(1/2)/4=22驗(yàn)證了 = , = / n 的正確性。 /n也可以將表中兩個(gè)樣本平均數(shù)的抽樣總體作次數(shù)分布圖。由以上模擬抽樣試驗(yàn)可以看出，雖然原總體并非正態(tài)分布，但從中隨機(jī)抽取樣本，即使樣本含量很小，樣本平均數(shù)的分布卻趨向于正態(tài)分布形式。隨著樣本含量 n 的增大，樣本平均數(shù)的分布愈來(lái)愈從不連續(xù)趨向于連續(xù)的正態(tài)分布。當(dāng)n30時(shí)，的分布就近似正態(tài)分布了。X變量與變量概率分布間的關(guān)系可由下列兩個(gè)定理說(shuō)明：（1）若隨機(jī)變量x服從正態(tài)分布

27、N(,2)；x1、x2、xn，是由x 總體得來(lái)的隨機(jī)樣本，則統(tǒng)計(jì)量 =xn的概率分布也是正態(tài)分布，且有，即服從正態(tài)分布N(,2n)。（2）若隨機(jī)變量x服從平均數(shù)是，方差是2的分布(不是正態(tài)分布)； x1、x2、xn，是由此總體得來(lái)的隨機(jī)樣本，則統(tǒng)計(jì)量 =xn的概率分布，當(dāng)n相當(dāng)大時(shí)逼近正態(tài)分布N(,2n)。這就是中心極限定理。中心極限定理告訴我們：不論x變量是連續(xù)型還是離散型，也無(wú)論x服從何種分布，一般只要n30，就可認(rèn)為的分布是正態(tài)分布。若x的分布不很偏斜，在n20時(shí) ，的分布就近似于正態(tài)分布了由中心極限定理知，只要樣本容量適當(dāng)大，不論總體分布形狀如何，其的分布都可看和方差 2

28、。在實(shí)際應(yīng)用上，如n>30就可以應(yīng)用這作為正態(tài)分布，且具平均數(shù)一定理。平均數(shù)的標(biāo)準(zhǔn)化分布是將上述平均數(shù) x轉(zhuǎn)換為z變數(shù)。n( x - ) ( x - ) = z = n x、標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(平均數(shù)抽樣總體的標(biāo)準(zhǔn)差) 的大小反映樣本平均數(shù) 的抽樣誤差的大小，即精確性的高低。標(biāo)準(zhǔn)誤大，說(shuō)明各樣本平均數(shù) 間差異程度大，樣本平均數(shù)的精確性低。反之，小，樣本平均數(shù)的精確性高。的大小與原總體的標(biāo)準(zhǔn)差成正比，與樣本含量n的平方根成反比。從某特定總體抽樣，因?yàn)槭且怀?shù)，所以只有增大樣本含量才能降低樣本平均數(shù) 的抽樣誤差。在實(shí)際工作中，總體標(biāo)準(zhǔn)差往往是未知的，因而無(wú)法求得。此時(shí)，可用樣本標(biāo)準(zhǔn)差S估計(jì)

29、。于是，以估計(jì) 。記為，稱(chēng)作樣本標(biāo)準(zhǔn)誤或均數(shù)標(biāo)準(zhǔn)誤。樣本標(biāo)準(zhǔn)誤是平均數(shù)抽樣誤差的估計(jì)值。若樣本中各觀(guān)測(cè)值為 x1、x2、xn，則= S=n(n-1)n(n-1)n注意：樣本標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)誤是既有聯(lián)系又有區(qū)別的兩個(gè)統(tǒng)計(jì)量。二者的區(qū)別是樣本標(biāo)準(zhǔn)差S是反映樣本中各觀(guān)測(cè)值的變異程度，它的大小說(shuō)明了對(duì)該樣本代表性的強(qiáng)弱。樣本標(biāo)準(zhǔn)誤是樣本平均數(shù) 的標(biāo)準(zhǔn)差，它是抽樣誤差的估計(jì)值，其大小說(shuō)明了樣本間變異程度的大小及精確性的高低。(二) 兩個(gè)獨(dú)立樣本平均數(shù)差數(shù)的分布假定有兩個(gè)正態(tài)總體各具有平均數(shù)和標(biāo)準(zhǔn)差為 1， 1 和 2 ， 2，從第一個(gè)總體隨機(jī)抽取n1個(gè)觀(guān)察值，同時(shí)獨(dú)立地從第二個(gè)總體隨時(shí)機(jī)抽取

30、n2個(gè)觀(guān)察值。這樣計(jì)算出樣本平均數(shù)和標(biāo)準(zhǔn)差，s1和，s2。 12 S(x-)2x2-(x)/n2從統(tǒng)計(jì)理論可以推導(dǎo)出其樣本平均數(shù)的差數(shù)( )的抽樣分布，具有以下特性12(1) 如果兩個(gè)總體各作正態(tài)分布，則其樣本平均數(shù)差數(shù)( 1 - 2 )準(zhǔn)確地遵循正態(tài)分布律，無(wú)論樣本容量大或小，都有N( 2 )。， - 1-21-21-2=1-2(2) 兩個(gè)樣本平均數(shù)差數(shù)分布的平均數(shù)必等于兩個(gè)總體平均數(shù)的差數(shù)，即(3) 兩個(gè)獨(dú)立的樣本平均數(shù)差數(shù)分布的方差等于兩個(gè)總體的樣本平均數(shù)的方差總和，即 2 21-2=其差數(shù)標(biāo)準(zhǔn)差為：-= 12221+2222=1n1+2n212+n1n2這個(gè)分布也可標(biāo)準(zhǔn)化，獲得z

31、值z(mì) = ( y 1 - y 2 ) - ( - ) 1 22 2 1 2n1態(tài)分布具：+ n 2 =1+1 小結(jié)：若兩個(gè)樣本抽自于同一正態(tài)總體，則其平均數(shù)差數(shù)的抽樣分布不論容量大小亦作正1-2=0，11-2nn2 若兩個(gè)樣本抽自于同一總體，但并非正態(tài)總體，則其平均數(shù)差數(shù)的抽樣分布按中心極限定理在n1和n2相當(dāng)大時(shí)(大于30)才逐漸接近于正態(tài)分布。 2 若兩個(gè)樣本抽自于兩個(gè)非正態(tài)總體，當(dāng)n1和n2相當(dāng)大、而 1 2與 2 相差不太遠(yuǎn)時(shí)，也可近似地應(yīng)用正態(tài)接近方法估計(jì)平均數(shù)差數(shù)出現(xiàn)的概率，當(dāng)然這種估計(jì)的可靠性得依兩總體偏離正態(tài)的程度和相差大小而轉(zhuǎn)移。(三)二項(xiàng)總體的抽樣分布、二項(xiàng)總體的分布參

32、數(shù)（成數(shù)） = p 平均數(shù):方差: 2 = p (1 - p pq ) =標(biāo)準(zhǔn)差: = p(1-p) = pq、樣本平均數(shù)(成數(shù))的抽樣分布從二項(xiàng)總體進(jìn)行抽樣得到樣本，樣本平均數(shù)（成數(shù)）抽樣分布的參數(shù)為：平均數(shù): = p2=pqn方差:標(biāo)準(zhǔn)誤: = pq = p ( 1 - p ) nn(四)不重復(fù)抽樣的修正系數(shù) 前所講的抽樣分布和抽樣平均誤差的計(jì)算公式，都是就重復(fù)抽樣而言的?？梢宰C明，采用不重復(fù)抽樣時(shí)，平均數(shù)和比例的抽樣平均誤差應(yīng)為：( )=N-n2n(N-nN-1)n2(1 -nN)nN(P)=P(1-P)N-n()nN-1p(1-p)n(1-)可見(jiàn)，不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽

33、樣的相應(yīng)公式多一個(gè)系數(shù)N-1NN-1 n這個(gè)系數(shù)稱(chēng)為不重復(fù)抽樣修正系數(shù)。當(dāng)N很大時(shí)， N - n - （其中：n/N為抽樣比例）。實(shí)際中，當(dāng)抽樣比例很小時(shí)，（一般認(rèn)為小于5%），不重復(fù)抽樣的抽樣誤差常采用重復(fù)抽樣的公式計(jì)算。三、t 分布1、t 分布的定義：若xN(, 2)，則 N(, 2/n)。將隨機(jī)變量標(biāo)準(zhǔn)化得：，則zN(0,1)。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí)，以樣本標(biāo)準(zhǔn)差S代替所得到的統(tǒng)計(jì)量記為t。在計(jì)算時(shí)，由于采用S來(lái)代替，使得t 變量不再服從標(biāo)準(zhǔn)正態(tài)分布，而是服從t分布(tdistribztion)。它的概率分布密度函數(shù)如下：f(t)=1(df+1)/2(1+t2(df/2)d

34、f式中，t的取值范圍是（-，+）；df=n-1為自由度。- 函數(shù) +df)-df+12-函數(shù)的定義：(r)= -函數(shù)的定義域：(-，+)自由度df(degree of freedom )的含義 xr-1edx-xdf=k=n-1T 分布密度曲線(xiàn)2、t 分布的圖形特征t分布是類(lèi)似正態(tài)分布的一種對(duì)稱(chēng)分布，它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴(lài)于稱(chēng)之為自由度的參數(shù)。隨著自由度的增大，分布也逐漸趨于正態(tài)分布。（1）t 分布受自由度的制約，每一個(gè)自由度都有一條t分布密度曲線(xiàn)。（2）t分布密度曲線(xiàn)以縱軸為對(duì)稱(chēng)軸，左右對(duì)稱(chēng)，且在t0時(shí)，分布密度函數(shù)取得最大值。（3）與標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)相比，t分布曲線(xiàn)頂部略低，兩尾部稍高而平。df越小這種趨勢(shì)越明顯。df越大，t分布越趨近于標(biāo)準(zhǔn)正態(tài)分布。3、 t ( n ) 分布分位點(diǎn)計(jì)算n ) 分布求它的分位點(diǎn)而不是求其概率。其分位點(diǎn)的定義在統(tǒng)計(jì)中經(jīng)常對(duì)給定的 t (與標(biāo)準(zhǔn)正態(tài)分布相同。pt

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第三節(jié) 常用連續(xù)型隨機(jī)變量的理論分布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔