幾種常見的概率分布率 (1)_第1頁
幾種常見的概率分布率 (1)_第2頁
幾種常見的概率分布率 (1)_第3頁
幾種常見的概率分布率 (1)_第4頁
幾種常見的概率分布率 (1)_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、離散型概率分布 二項分布(binomial distribution) 泊松分布(poisson distribution) 超幾何分布(hypergeometric probability distritution) 負二項分布(Negative binomial distribution)u貝努利試驗(Bernoulli trial) : 我們把只有兩種可能觀測值(每次試驗只可能是兩個對立事件之一)的隨機試驗統(tǒng)稱為貝努利試驗。這種試驗在實際中廣泛存在,如觀察某一實驗動物的卵孵化與否、某一實驗動物是雌性還是雄性、實驗反應(yīng)是陰性還是陽性等。un次獨立地貝努利試驗稱為n重貝努利試驗,其試驗結(jié)果的

2、分布(一種結(jié)果出現(xiàn)x次的概率是多少的分布)即為二項分布。 u應(yīng)用二項分布的重要條件是:每一種試驗結(jié)果在每次試驗中都有恒定的概率,各試驗之間是重復獨立的。3.1 二項分布 B(nB(n, p), p) 例:例3.1注意:1)放回式抽樣適用于二項分布,非放回式抽樣適用于超幾何分布;2)通式為:n = 試驗次數(shù); x = 在n次試驗中事件A出現(xiàn)的次數(shù)p= 事件A發(fā)生的概率(每次試驗都是恒定的)1p= 事件 發(fā)生的概率P(x) = X 的概率函數(shù)為 P(X=x); F(x) = P( Xx )AxnxxnppcxP-=)1 ()(例3.1 從雌雄各半的100只動物中抽樣(放回式抽樣),抽樣共進行10次

3、,問其中包括3只雄性動物的概率是多少?包括3只及3只以下的概率是多少?即求P(X3)和P(X3) 此例中:n=10, x=3,p=0.5,求P(3) 和F(3)。則,將x0,1,2,3代入通式,可得到出現(xiàn)0,1,2,3只雄性動物的概率。 P(0) 0.0009766 P(1) 0.0097656 P(2) 0.0439453 P(3) 0.1171876所以,抽到3只和3只以下雄性動物的概率為: F(3)P(0)P(1)P(2)P(3)0.1718751 733105 . 015 . 03-= CP一、 服從二項分布的隨機變量的特征數(shù)平均數(shù)平均數(shù):np , p (用比率表示時) 方差方差: (

4、用比率表示時) 偏斜度:偏斜度:峭度:峭度:從以上公式可以看出二項分布決定于兩個參考數(shù):試驗次數(shù)n 和概率P,因此其圖形變化趨勢與這兩個參數(shù)有關(guān)。npppnp)1 ( ),1 (22-=-=)1 (211pnpp-=npnp6)1 (12-=n=10,p0.0100.20.40.60.810246810n=100,p0.0100.10.20.30.40.50255075100n=500,p0.0100.10.20.30.40.50100200300400500n=10,p0.1000.10.20.30.40.50246810n=100,p0.1000.050.10.150.2025507510

5、0n=500,p0.1000.020.040.060.080.10100200300400500n=10,p0.5000.10.20.30246810n=100,p0.5000.020.040.060.080.10255075100n=500,p0.5000.010.020.030.040.050100200300400500例3.2 用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔雜交,F(xiàn)1代為黑色正常毛長的家兔(BbRr), F1代自交,F(xiàn)2代表型比為:9/16B_R_ : 3/16B_rr : 3/16bbR_ : 1/16bbrr。問最少需要多少F2代家兔,才能以99的概率得到一

6、個棕色短毛兔(bbrr)? 解解: 設(shè)設(shè)p為非棕色短毛兔出現(xiàn)的概率,則為非棕色短毛兔出現(xiàn)的概率,則1p就為棕色短毛就為棕色短毛兔出現(xiàn)的概率。兔出現(xiàn)的概率。 在在p(1p)n的展開式中只有第一項的展開式中只有第一項pn無棕色短毛兔無棕色短毛兔出現(xiàn),因此出現(xiàn),因此n值可由值可由pn10.99求出。求出。 pn (15/16)n 0.01 n(lg15lg16) lg0.01 -0.02803n 2.00000 n 71.4二、 二項分布應(yīng)用實例二項分布的應(yīng)用條件有三: (1)各觀察單位只具有互相對立的一種結(jié)果,如陽性或陰性, 生存或死亡等, 屬于二項分類資料; (2)已知發(fā)生某一結(jié)果 (如死亡)

7、的概率為p,其對立結(jié)果的概率則為1-p=q,實際中要求 p 是從大量觀察中獲得的比較穩(wěn)定的數(shù)值; (3)n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的觀察結(jié)果。3. 2 泊松分布P() 在生物學研究中,有許多事件出現(xiàn)的概率很小,而樣本容量或試驗次數(shù)卻往往很大,即有很小的p值和很大的n值。這時二項分布就變成另外一種特殊的分布,即泊松分布。 如,顯微鏡視野內(nèi)染色體有變異的細胞計數(shù)、單位容積的水中細菌數(shù)目的分布、作物種子內(nèi)雜草的分布以及樣方內(nèi)少見植物的個體數(shù)等都屬于泊松分布。 其概率函數(shù)可由二項分布的概率函數(shù)推導。一、泊松分布概率函數(shù)的推導xnxxnxxnxxnpp

8、xxnnnnppxnxnppcxp-=-=-=)1 (!) 1()2)(1()1 ()!( !)1 ()((將系數(shù)的分子分母同乘以(將系數(shù)的分子分母同乘以nx)!)1 ()()11 ()11 ( 1xpnpnxnxnx-=xnxpx-=)1 (!)(1)1(!xnppxpx-=ep)(1lim ,z)(1lime p10pz10z=-=-=exx!平均數(shù):平均數(shù):=方差:方差: 2 = 偏斜度:偏斜度:峭度:峭度: 概率函數(shù)內(nèi)的概率函數(shù)內(nèi)的 ,不但是它的平均數(shù),而且是不但是它的平均數(shù),而且是它的方差。它的方差。 很大時,很大時, 1和和2則接近于則接近于0,這時的泊松分布近,這時的泊松分布近似

9、于正態(tài)分布。似于正態(tài)分布。 二、 服從泊松分布的隨機變量的特征數(shù) 1 1 = = 12= =三、 泊松分布應(yīng)用實例例3.5 在麥田中,平均每10m2有一株雜草,問每100m2麥田中,有0株、1株、2株、雜草的概率是多少? 解: 先求出每100m2麥田中,平均雜草數(shù) 100/10 10株 將代入泊松分布的概率密度函數(shù)中, p(x) = 10 x/(x!e10),( e=2.71828) 即可求出x 0,1,2, 時所相應(yīng)的概率。 例:為監(jiān)測飲用水的污染情況, 現(xiàn)檢驗?zāi)成鐓^(qū)每毫升飲用水中細菌數(shù) , 共得400個記錄如下: 試分析飲用水中細菌數(shù)的分布是否服從泊松分布,計算每毫升水中細菌數(shù)的概率及理論

10、次數(shù)并將頻率分布與泊松分布作直觀比較。 解:經(jīng)計算得每毫升水中平均細菌數(shù)為0.500 x 0.5,s20.496,兩者相接近,可認為服從泊松分布 代入泊松分布公式1ml水中細菌數(shù)0123合計次數(shù)f2431203164005.0!5.0)(-=ekkxPk 注意,二項分布的應(yīng)用條件也是泊松分布的應(yīng)用條件。比如二項分布要求n 次試驗是相互獨立的,這也是泊松分布的要求。然而一些具有傳染性的罕見疾病的發(fā)病數(shù),因為首例發(fā)生之后可成為傳染源,會影響到后續(xù)病例的發(fā)生,所以不符合泊松分布的應(yīng)用條件。1ml水中細菌數(shù)0123合計實際次數(shù)f243120316400頻率0.60750.30000.07750.015

11、01.00概率0.60650.30330.07580.01441.00理論頻數(shù)242.60121.3230.325.764003. 3 正態(tài)分布 在生物統(tǒng)計學中,正態(tài)分布占有極其重要的地位。許多生物學現(xiàn)象所產(chǎn)生的數(shù)據(jù),都服從正態(tài)分布。一、 正態(tài)分布(xN (,2))的密度函數(shù)與分布函數(shù)正態(tài)曲線正態(tài)分布的規(guī)律是數(shù)據(jù)分布集正態(tài)分布的規(guī)律是數(shù)據(jù)分布集中在平均數(shù)附近,并且在平均中在平均數(shù)附近,并且在平均數(shù)的兩側(cè)成對稱分布。正態(tài)分數(shù)的兩側(cè)成對稱分布。正態(tài)分布布密度函數(shù)密度函數(shù)的圖像,稱為正態(tài)的圖像,稱為正態(tài)曲線。曲線。密度函數(shù):密度函數(shù):分布(累積)函數(shù):分布(累積)函數(shù):0,21)(222)( -=

12、=- - - xexfxdueduufxXpxFxxu-=222)(21)()()(正態(tài)分布密度曲線特點: 密度曲線以x=直線為對稱; x=和x=-所確定的點為曲線的兩個“拐點”; 曲線向左、向右無限延伸,以x軸為漸近線; x= 時,f(x) 具有最大值,其值為 ; 的大小,決定曲線的“胖”、“瘦”程度(展開程度),越小,曲線越“瘦”,數(shù)據(jù)越集中,越大,曲線越“胖”,數(shù)據(jù)越分散。 固定時,值決定曲線的位置,當增大時曲線向右平移,當減少時曲線向左平移,但曲線形狀不變。 21二、 標準正態(tài)分布-=udeuUPuF2221)()(=0,=1時的正態(tài)分布稱為時的正態(tài)分布稱為標準正態(tài)分布標準正態(tài)分布。密

13、度函數(shù):密度函數(shù):分布函數(shù):分布函數(shù):-=-ueufu,21)(22-=xu標準正態(tài)分布有以下特性: =0時,概率密度值最大; 概率密度曲線向左、向右無限延伸,以x軸為漸近線;左右對稱 u =1和u =1是概率分布曲線的兩個拐點; 曲線與橫坐標軸所夾的圖形面積為1; 累積分布函數(shù)曲線從到0平穩(wěn)上升,圍繞點(0,0.5)對稱; 標準正態(tài)分布的偏斜度1和峭度2均為零。以下一些特征值很重要: P P(-1u-1u1 1)=0.6826=0.6826 P P(-2u-2u2 2)=0.9545=0.9545 P P(-3u-3u3 3)=0.9973=0.9973以下一些特征值很重要: P(-1.96

14、u1.96)=0.95P (-2.58u2.58) =0.99三、 正態(tài)分布表的查法 對于標準正態(tài)分布,其累積分布函數(shù)值F(u)可直接查表(書p315附表1)得到,其值等于標準正態(tài)曲線與橫坐標軸從到u所夾的面積,該曲線下的面積即表示隨機變量U 落入?yún)^(qū)間(,u)的概率; 標準正態(tài)分布查表常用的幾個關(guān)系式:P(0U u1)=F(u1)=1F(u1)P(Uu1)=2F(u1)P(Uu1)=1 2F(u1)P(u1U u2)=F(u2)F(u1) x=5= 109.2正態(tài)分布正態(tài)分布u=0 = 10.42標準正態(tài)分布標準正態(tài)分布v對于一般正態(tài)分布,要先進行標準化,再查表對于一般正態(tài)分布,要先進行標準化

15、,再查表; 標準化的公式為:標準化的公式為:-=xu例3.7 查標準正態(tài)分布u-0.82 及u1.15時的F(u)的值例3.8 隨機變量u服從正態(tài)分布N(0,1),問隨機變量u的值落在(0,1.21)區(qū)間的概率?例3.9 已知隨機變量u服從正態(tài)分布N(0,1),問隨機變量u的值落在(-1.96,1.96)區(qū)間的概率是多少?例3.10 已知某高粱品種的株高X服從正態(tài)分布N(156.2,4.822),求:00. 182. 42 .156161= =- -= =- - x62. 182. 42 .156164= =- -= =- - x20. 182. 42 .156162= =- -= =- -

16、x87. 082. 42 .156152- -= =- -= =- - x利用公式利用公式P(0Uu)=F(u)0.5利用公式利用公式 P( U u)=1 2F(u) 或或 P(u1Uua)=時的ua值;下側(cè)分位數(shù): P(uua/2 )=時的ua值(從附表2中以 /2查出的ua即可);大數(shù)定律與中心極限定理的應(yīng)用 樣本容量越大,樣本統(tǒng)計數(shù)與總體參數(shù)之差越小。 對于容量大于30的樣本,樣本均值的分布可以較好地用一個正態(tài)分布近似(其中均值為 ,即,樣本均值的平均值,標準差為 ,即,樣本均值的標準差)樣本容量越大,近似的效果越好。 如果原始總體就是正態(tài)分布,則對于任意樣本容量n,樣本均值都將是正態(tài)分

17、布的。n EXCEL在本章內(nèi)容的應(yīng)用在本章內(nèi)容的應(yīng)用EXCELEXCEL電子表格提供的粘帖函數(shù)電子表格提供的粘帖函數(shù)BINOMDIST 計算二項式分布的概率值NORMDIST 計算正態(tài)分布的累積函數(shù)NORMINV 計算正態(tài)分布累積函數(shù)的逆函數(shù)NORMSDIST 計算標準正態(tài)分布的累積函數(shù)NORMSINV計算標準正態(tài)分布累積函數(shù)的逆函數(shù)POISSON 計算泊松分布的概率AVERAGE計算算術(shù)平均值GEOMEAN 計算幾何平均數(shù)MAX 計算最大值MEDIAN計算一組給定數(shù)字的中位數(shù)STDEV計算樣本標準差STDEVP計算樣本總體的標準差VAR計算樣本的方差VARP計算樣本總體的方差各種分布函數(shù)計算

18、1、二項分布工具mnmmnqpCmP-=)()!( !mnmnCmn-=平均數(shù)、方差和標準差np=npq=2npq=二項分布的概率函數(shù)為二項分布函數(shù)的概率及累積概率的計算實例二項分布函數(shù)的概率及累積概率的計算實例 已知某種豬病的死亡率為30%,現(xiàn)有10頭病豬,如不給予治療,問死亡4頭及死亡4頭和4頭以下的概率為多少?解:死亡4頭的概率計算公式為:200. 07 . 03 . 0)4(64410= CP死亡4頭和4頭以下累積概率的計算公式為:85. 0)()4()4(40=xxPxPF用粘帖函數(shù) BINOMDIST 計算死亡4頭的概率計算本計算在編緝欄中為本計算在編緝欄中為BINOMDISTBI

19、NOMDIST(4 4,1010,0.300.30,F(xiàn)ALSEFALSE) 死亡4頭和4頭以下概率的計算本計算在編緝欄中為BINOMDIST(4,10,0.30,TRUE) 利用BINOMDIST函數(shù)和填充柄計算2 2、泊松分布工具、泊松分布工具 泊松分布的概率函數(shù) 為常數(shù),它等于平均數(shù)等于方差 -=ekkPk!)(=2 泊松分布概率的計算實例泊松分布概率的計算實例 已知某一地區(qū),出現(xiàn)怪胎的事件服從泊松分布P(2),請計算該地區(qū)出現(xiàn)3次怪胎的概率,及出現(xiàn)3次和3次以下怪胎的概率為多少? 出現(xiàn)3次怪胎概率的公式為:出現(xiàn)3次和3次以下怪胎的概率計算公式為:1804. 0! 32)3(23=-eP8

20、571. 0! 32! 22! 12! 02)() 3(2322212030=-=eeeekPkPk用用POISSONPOISSON粘帖函數(shù)計算粘帖函數(shù)計算出現(xiàn)3次怪胎概率的計算本計算在編緝欄中顯示POISSON(3,2,F(xiàn)ALSE) 出現(xiàn)3次和3次以下怪胎的概率計算本計算編緝欄中顯示POISSON(3,2,TRUE) 3 3、正態(tài)分布工具、正態(tài)分布工具 用符號N(,2) 表示(1)、正態(tài)分布的概率函數(shù)為:222)(21)(-=xexf0,-xNORMDIST粘帖函數(shù):計算累積函數(shù)粘帖函數(shù):計算累積函數(shù) NORMINV粘帖函數(shù):計算逆函數(shù)粘帖函數(shù):計算逆函數(shù) 已知某品種成年豬體重的總體平均數(shù)=100kg,總體標準差=20kg。試計算成年豬體重在70kg以下的概率。計算公式如下: -=70202)100(0668. 02201)70(22dxexPx用正態(tài)分布粘帖函數(shù)的計算用NORMDIST粘帖函數(shù)計算概率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論