




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
常用離散型變量概率分布
及應用二項分布和泊松分布張合喜公共衛(wèi)生學院
本文檔共60頁;當前第1頁;編輯于星期五\22點14分第一節(jié)二項分布和總體率的估計一、二項分布(一)二項分布的概念
在生命科學研究中,經(jīng)常會遇到一些事物,其結(jié)果可分為兩個彼此對立的類型,如一個病人的死亡與存活、動物的雌與雄、微生物培養(yǎng)的陽性與陰性等,這些都可以根據(jù)某種性狀的出現(xiàn)與否而分為非此即彼的對立事件。這種非此即彼事件構(gòu)成的總體,就稱為二項總體(binomialpopulation)。本文檔共60頁;當前第2頁;編輯于星期五\22點14分第一節(jié)二項分布和總體率的估計二項分布(binomialdistribution)就是對這種只具有兩種互斥結(jié)果的離散型隨機變量的規(guī)律性進行描述的一種概率分布。由于這一種分布規(guī)律是由瑞士學者貝努里(Bernoulli)首先發(fā)現(xiàn)的,又稱貝努里分布。
本文檔共60頁;當前第3頁;編輯于星期五\22點14分二項分布有兩個基本假設(shè):
1.各事件是相互獨立的,即任一事件的發(fā)生與否,不影響其它事件的發(fā)生概率;
2.各個隨機事件只能產(chǎn)生相互排斥的兩種結(jié)果。
本文檔共60頁;當前第4頁;編輯于星期五\22點14分定理:幾個相互獨立事件同時發(fā)生的概率等于各獨立事件的概率之積。定理:在幾個互不相容的事件中,任一事件發(fā)生的概率等于這幾個事件的概率之和。抓中兩黑一白的概率:P(2)=3×0.125=0.375抓中三個黑球的概率:P(3)=0.5×0.5×0.5=0.125本文檔共60頁;當前第5頁;編輯于星期五\22點14分本文檔共60頁;當前第6頁;編輯于星期五\22點14分本文檔共60頁;當前第7頁;編輯于星期五\22點14分
各種可能發(fā)生的結(jié)果對應的概率相當于展開后的各項數(shù)值,即:
前例:π=0.8,1-π=0.2,n=3本文檔共60頁;當前第8頁;編輯于星期五\22點14分二項分布的概率公式
如果一個事件A,在n次獨立試驗中,每次試驗都具有概率π
,那么,這一事件A將在n次試驗中出現(xiàn)x次的概率為:
式中:稱二項系數(shù)。本文檔共60頁;當前第9頁;編輯于星期五\22點14分(二)二項分布的應用條件
1.各觀察單位只能具有互相對立的一種結(jié)果,屬于二項分類資料;
2.已知發(fā)生某一結(jié)果的概率為π,其對立結(jié)果的概率則為1-π
。實際工作中要求π是從大量觀察中獲得的比較穩(wěn)定的數(shù)值;3.n個觀察單位的觀察結(jié)果互相獨立,即每個觀察單位的觀察結(jié)果不會影響到其它觀察單位的結(jié)果。
本文檔共60頁;當前第10頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)
1.二項分布的均數(shù)和標準差二項分布的平均數(shù):μ=nπ
上式的意義:做n次獨立試驗,某事件平均出現(xiàn)的次數(shù)為nπ次,這一結(jié)果較為符合人們的直觀想法。如果,生男孩這一事件的概率是1/2,則100個新生兒中可期望有nπ=100×1/2=50個是男孩。當用率表示時,μ=π
本文檔共60頁;當前第11頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)二項分布的標準差:標準差表示x取值的離散度或變異的大小。如n=5,π=5/6,1-π=1-5/6,則:本文檔共60頁;當前第12頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)二項分布的標準誤
若以比值或百分數(shù)表示,則標準誤為
:
σp被稱為率的標準誤(standarderrorofrate),用來反映隨機抽樣獲得的樣本率p與總體π之間的抽樣誤差大小。
本文檔共60頁;當前第13頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)二項分布的標準誤
若以比值或百分數(shù)表示,則標準誤為
:實際工作中常用p作為π
的估計值,得:本文檔共60頁;當前第14頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)
2.二項分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。從陽性率為π
的總體中隨機抽取n個個體,則(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)本文檔共60頁;當前第15頁;編輯于星期五\22點14分(三)二項分布的性質(zhì)
3.二項分布的圖形二項分布的圖形,取決于兩個方面,其一為事件發(fā)生的概率π
,其二為樣本含量n。當π
=1-π
=1/2時,二項分布的圖形是對稱的;當π
<1/2時,二項分布的圖形呈左偏態(tài);當π
>1/2時,二項分布的圖形呈右偏態(tài);當π與1-π不變時,即使π
≠1-π
,但隨著n的增大,二項分布的的偏態(tài)程度會逐漸降低而趨于對稱。
本文檔共60頁;當前第16頁;編輯于星期五\22點14分二項分布總體不同樣本例數(shù)時的抽樣分布
本文檔共60頁;當前第17頁;編輯于星期五\22點14分二、二項分布的應用
(一)、總體率的估計
有點值估計和區(qū)間估計。1查表法:當n較小,如n≤50時,特別是p很接近于0或1時,可由附表6百分率的置信區(qū)間表直接查出。P709orp817例:某地對13名輸卵管結(jié)扎的育齡婦女經(jīng)壺腹部吻合術(shù)后,觀察其受孕情況,發(fā)現(xiàn)有6人受孕,據(jù)此估計該吻合術(shù)婦女的受孕的95%可信區(qū)間此例:n=13,x=6
查表得95%CI為:19%~75%。本文檔共60頁;當前第18頁;編輯于星期五\22點14分二、二項分布的應用
(一)、總體率的估計
1查表法:附表6百分率的置信區(qū)間表直接列出了X≤n/2的部分。其余部分可以查n-x的陰性部分的QL~QU再相減得PLand
pUPL=1-QL1-QU例:某地調(diào)查50名兒童蛔蟲感染情況,發(fā)現(xiàn)有10人大便中有蛔蟲卵,問兒童蛔蟲感染率的95%置信區(qū)間是多少?此例:n=50,x=10
查表得95%CI為:10%~34%。本文檔共60頁;當前第19頁;編輯于星期五\22點14分二項分布的應用
2正態(tài)近似法:應用條件:np及n(1?p)均≥5p±uαsp
例:在某地隨機抽取329人,做HBsAg檢驗,得陽性率為8.81%,求陽性率95%置信區(qū)間。已知:p=8.81%,n=329,故:
95%CI:8.81±1.96×1.56;即5.75%~11.87%。本文檔共60頁;當前第20頁;編輯于星期五\22點14分二項分布下表是用P±Uasp時要求的P值與N的大小參考數(shù)字。PnnP0.530150.450200.380240.2200400.1600600.05140070本文檔共60頁;當前第21頁;編輯于星期五\22點14分二項分布的應用(二)差異的顯著性檢驗1直接法例某醫(yī)院用甲藥治療某病,其治愈率為70%,今用乙藥治療該病10人,治愈9人,問甲乙兩藥療效有無差別?已知:π=0.7,1-π=0.3,假設(shè)兩藥療效無差別,則治愈與非治愈的概率應符合二項分布,即:
本文檔共60頁;當前第22頁;編輯于星期五\22點14分如果甲乙兩藥療效無差別,按甲藥的治愈率(70%)用乙藥治療10人應治愈7人,實際治愈9人,相差2人。雙側(cè)檢驗,計算相差±2人及2人以上的總概率,即x≥9和x≤5的概率之和:ΣP=0.000006+0.000138+0.001447+0.009002+0.036757+0.102919+0.121061+0.028248=0.299577或:ΣP=1-(0.200121+0.266828+0.233474)=0.299577本文檔共60頁;當前第23頁;編輯于星期五\22點14分
P=0.299577>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。
本例如采用單側(cè)檢驗,即要求判斷乙藥療效優(yōu)于甲藥?此時只需計算相差2人及以上的總概率:ΣP=P(9)+P(10)=0.121061+0.028248=0.149309P>0.05,差異無統(tǒng)計學意義,尚不能認為乙藥療效優(yōu)于甲藥。本文檔共60頁;當前第24頁;編輯于星期五\22點14分3.研究疾病的家族聚集性
例某單位發(fā)生乙肝暴發(fā)流行,經(jīng)調(diào)查4口之家共288戶,其中無病例的167戶,發(fā)生1例的51戶,2例的50戶,3例的17戶,全家發(fā)病的3戶,問乙肝的發(fā)病是否具有家族集聚性?
π=214/1152=0.1858,1-π=0.8142
計算發(fā)病數(shù)x=0,1,2,3,4時的理論概率和理論戶數(shù)。列表,比較實際戶數(shù)與理論戶數(shù)差別有無顯著性意義。
本文檔共60頁;當前第25頁;編輯于星期五\22點14分二項分布展開計算表發(fā)病人數(shù)展開式概率理論戶數(shù)實際戶數(shù)xCxnπ
x(1-π)n-xPT=P×288A0C04
(0.1858)0(0.8142)40.4395126.571671C14
(0.1858)1(0.8142)30.4011115.52
512C24
(0.1858)2(0.8142)20.1373
39.54
503C34
(0.1858)3(0.8142)10.0209
6.02
174C44
(0.1858)4(0.8142)00.0012
0.35
3本文檔共60頁;當前第26頁;編輯于星期五\22點14分二項分布擬合優(yōu)度的χ2檢驗發(fā)病人數(shù)實際戶數(shù)理論戶數(shù)(A-T)2(A-T)2xATT0167126.571634.5812.911
51115.524162.8336.042
50
39.54
109.41
2.773
17
6.02
120.5620.034
3
0.35
7.0220.06χ2=91.81,按ν=組數(shù)-2=5-2=3查χ2界值表得:χ20.01(3)=11.345,故P<0.01,說明該疾病的家庭分布不符合二項分布,可以認為該病有家族集聚性。本文檔共60頁;當前第27頁;編輯于星期五\22點14分(五)群檢驗用于混合樣本分析:常見于陽性率很低或檢出率低的分析樣本根據(jù)二項分布的原理:1份混合樣本中含有k份陽性的概率為P(k)=本文檔共60頁;當前第28頁;編輯于星期五\22點14分當k=0時P(0)是說混合樣品中沒有1陽性樣品的原始概率,反映的是混合樣品陰性的概率本文檔共60頁;當前第29頁;編輯于星期五\22點14分(五)群檢驗當收集的樣本數(shù)量很大時,全部檢驗費時費力可以用群檢驗的方法進行解決,若每個標本的陽性概率為π,則其陰性概率為Q=1-πQm便是某個群m個標本均為陰性的概率,一個群為陰性的群的概率,而1-Qm就為一個群陽性的概率。假設(shè)受檢的n個群中有X個陽性群,用x/n作為陽性群概率的估計值本文檔共60頁;當前第30頁;編輯于星期五\22點14分(五)群檢驗
1-Qm=X/n從而Q=√P=1-Q本文檔共60頁;當前第31頁;編輯于星期五\22點14分第四節(jié)泊松分布(Poissondistribution)
一、Poisson分布
(一)泊松分布的概念泊松分布(舊譯普哇松分布)是離散型隨機變量的另一重要分布,最早由于1837年提出。
定義:若離散型隨機變量x的取值為非負整數(shù),且相應的概率函數(shù)為:
則稱隨機變量X服從泊松分布。本文檔共60頁;當前第32頁;編輯于星期五\22點14分泊松分布(Poissondistribution)
泊松分布的數(shù)學表達式:在n個取樣單位內(nèi),出現(xiàn)X=0,1,2,…,n個陽性事件的理論概率分別為下列公式的展開各項:
式中:P(X)為出現(xiàn)陽性事件例數(shù)為X的理論概率。實際應用時,可以用樣本均數(shù)作為總體均數(shù)μ的估計值。本文檔共60頁;當前第33頁;編輯于星期五\22點14分(二)Poisson分布的應用條件
在二項分布中,如果π很小,而試驗次數(shù)n很大,nπ趨向于一個常數(shù)μ時,則可以用參數(shù)為μ的泊松分布近似地表示。泊松分布還有其獨特的意義,它對于描述隨機現(xiàn)象在大面積(時間、空間)上的分布情況很有用。例如在單位面積的水中的細菌數(shù)的分布,計數(shù)室中細菌數(shù)的分布,放射性物質(zhì)在單位時間內(nèi)放射次數(shù)的分布等都屬于泊松分布。本文檔共60頁;當前第34頁;編輯于星期五\22點14分泊松分布(Poissondistribution)
服從泊松分布的條件與二項分布一樣,其中之一是各事件相互獨立。例如,某一昆蟲是否落入,某人是否患某病與他人是否患病無關(guān)等。如果不符合這一條件就不呈泊松分布。因此,也可以用泊松分布來研究某些疾病是否有家族聚集性、傳染性等。本文檔共60頁;當前第35頁;編輯于星期五\22點14分(三)Poisson分布的性質(zhì)
1.Poisson分布是一種單參數(shù)的離散型分布,其參數(shù)為μ,它表示單位時間或空間內(nèi)某事件平均發(fā)生的次數(shù),又稱強度參數(shù)。
本文檔共60頁;當前第36頁;編輯于星期五\22點14分(三)Poisson分布的性質(zhì)
2.Poisson分布的均數(shù)和方差相等對于符合泊松分布的資料,其n很大,而π很小,因此,泊松分布的平均數(shù)為:μ=nπ
當π→0,(1-π)→1時,泊松分布的標準差為:也就是說,泊松分布的平均數(shù)與它的方差相等:μ=σ2本文檔共60頁;當前第37頁;編輯于星期五\22點14分(三)分布的性質(zhì)
3.Poisson分布的累計概率常用的有左側(cè)累計和右側(cè)累計2種方法。累計概率為單位時間或空間內(nèi)某事件發(fā)生的次數(shù)。(1)最多有k例陽性的概率P(x≤k)=P(0)+P(1)+……+P(k)(2)最少有k例陽性的概率P(x≥k)=P(k)+P(k+1)+……+P(n)=1-P(x≤k-1)本文檔共60頁;當前第38頁;編輯于星期五\22點14分(三)分布的性質(zhì)
4.Poisson分布的圖形泊松分布的圖形是由平均數(shù)μ來確定的,當μ較小時,泊松分布不對稱的程度較為顯著,通常呈左偏分布;隨著μ值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而且,和二項分布一樣,也逐漸趨向正態(tài)分布。一般說來,當平均數(shù)μ>50時(有人認為當μ>20),泊松分布就近似于正態(tài)分布。本文檔共60頁;當前第39頁;編輯于星期五\22點14分Poisson分布總體均數(shù)不同時的抽樣分布
本文檔共60頁;當前第40頁;編輯于星期五\22點14分(三)Poisson分布的性質(zhì)當n很大,p很小,np=μ為一常數(shù)時,二項分布近似于泊松分布。p愈小,近似程度愈好。
例:據(jù)以往經(jīng)驗,新生兒染色體異常率為1%,試分別用二項分布和泊松分布原理,求100名新生兒中發(fā)生x例(x=1,2,3......)染色體異常的概率。
本文檔共60頁;當前第41頁;編輯于星期五\22點14分二項分布與泊松分布的比較
由上表可見,二者計算結(jié)果非常接近,當n愈大其接近程度愈好,但泊松分布的P(X)計算較為簡便。
XP(X)
二項分布
泊松分布
0123456780.33600.36970.18490.06100.01490.00290.00050.00010.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計1.0000
1.0000
本文檔共60頁;當前第42頁;編輯于星期五\22點14分
5.Poisson分布的可加性如果相互獨立的k個隨機變量都服從泊松分布,則它們之和仍服從泊松分布,且其均數(shù)為k個隨機變量的均數(shù)之和。此稱為泊松分布的可加性。本文檔共60頁;當前第43頁;編輯于星期五\22點14分
例:已知某放射性物質(zhì)每10分鐘放射脈沖數(shù)呈泊松分布,5次測量的結(jié)果分別為35、34、36、38、34次,那么,50分鐘總計的脈沖數(shù)177次,亦呈泊松分布。因此,泊松分布資料可利用可加性原理使μ>20,這樣就可以用正態(tài)近似法處理。
本文檔共60頁;當前第44頁;編輯于星期五\22點14分Poisson分布的應用
置信區(qū)間的估計對于小樣本資料的泊松分布置信區(qū)間估計,可以查附表7。p448
例由一份混合好的自來水中取1ml水樣,培養(yǎng)得細菌5個,請估計原水中每ml細菌數(shù)95%的置信區(qū)間。查附表7:樣本計數(shù)X=5,95%CI:1.6~11.7。本文檔共60頁;當前第45頁;編輯于星期五\22點14分Poisson分布的應用
置信區(qū)間的估計對于大樣本資料(X>50)的置信區(qū)間估計,可以近似地運用正態(tài)分布法進行,即:95%置信區(qū)間為:99%置信區(qū)間為:例同一份樣品分別用10個平皿進行培養(yǎng),共數(shù)得菌落數(shù)1460個,試估計該樣品菌落數(shù)95%置信區(qū)間。本例:X=1460/10=146(個)95%CI:,即122.32~169.68。
本文檔共60頁;當前第46頁;編輯于星期五\22點14分Poisson分布的應用泊松分布的配合
例:將培養(yǎng)皿中的細菌稀釋液置于血球計上,數(shù)出小方格中的細菌數(shù),共計128個方格,計數(shù)結(jié)果見下表。問此分布是否符合泊松分布?
表×
細菌在計數(shù)小方格中的分布
每小格細菌數(shù)(X)
觀察的方格數(shù)(f)
01234264038177本文檔共60頁;當前第47頁;編輯于星期五\22點14分Poisson分布的應用計算過程:求出樣本均數(shù)以代替μ,按照泊松分布的概率公式求出X=0,1,2,3,4時的概率P(X)。本例μ=1.5234,代入公式得:
P(0)=e-μμx/x!=e-1.5234(1.5234)0/0!=0.2180P(1)=e-1.5234(1.5234)1/1!=0.3321P(2)=e-1.5234(1.5234)2/2!=0.2529P(3)=e-1.5234(1.5234)3/3!=0.1284P(3)=e-1.5234(1.5234)4/4!=0.0489本文檔共60頁;當前第48頁;編輯于星期五\22點14分也可按下面的遞推公式計算:本文檔共60頁;當前第49頁;編輯于星期五\22點14分
驗算:P(0)+P(1)+P(2)+……+P(n)=1
本例:0.2180+0.3321+0.2529+0.1284+0.0489=0.9803
以各組的概率P(X)乘以n即為X=0,1,2,3,4按泊松分布的理論頻數(shù)。
將理論頻數(shù)與實際頻數(shù)比較(χ2-test),判斷此分布是否符合泊松分布。
本文檔共60頁;當前第50頁;編輯于星期五\22點14分Poisson分布擬合優(yōu)度檢驗計算表
χ2=Σ(A-T)2/T=1.3606
因擬合泊松分布時用了n和μ,故ν=組數(shù)-2=5-2=3。查χ2界值表得χ20.05(3)=7.81,故P>0.05
結(jié)論:實際分布與理論分布差別無統(tǒng)計學意義,可認為符合泊松分布。
xATA-T(A-T)2(A-T)2T0123426403817727.9042.5032.3716.446.26-1.90-2.505.630.560.743.61046.265131.64580.31380.54600.12940.14740.97750.01910.1872本文檔共60頁;當前第51頁;編輯于星期五\22點14分Poisson分布資料的差異顯著性檢驗例:某種生物制劑的異常反應發(fā)生率一般在1/萬左右,今試用該生物制劑新制品,在受試者100人中發(fā)現(xiàn)1人有異常反應,問該生物制劑的異常反應率是否高于一般?假設(shè)新制品反應率與一般反應率相同,則100人中反應的平均數(shù)為:H0:π=π0μ=100×1/10000=0.01本例π=0.0001,很小,n=100,很大,可用泊松分布作近似計算,100人中1例異常反應也不出現(xiàn)的概率為:
本文檔共60頁;當前第52頁;編輯于星期五\22點14分Poisson分布資料的差異顯著性檢驗100人中1例異常反應也不出現(xiàn)的概率為:
出現(xiàn)1例及1例以上的概率:P(x≥1)=1-P(0)=1-0.990050=0.009950
P<0.01,差異有高度顯著性意義,說明新制品的異常反應率高于一般。
本文檔共60頁;當前第53頁;編輯于星期五\22點14分Poisson分布資料的差異顯著性檢驗例:用甲乙兩種培養(yǎng)基對水樣進行細菌培養(yǎng),在相同的條件下,用甲培養(yǎng)基的菌落為100,用乙培養(yǎng)基的菌落為150,問兩培養(yǎng)基菌落數(shù)的差別有無顯著性?本例平均數(shù)μ>50,可用正態(tài)近似法進行泊松分布的檢驗。
H0:兩種培養(yǎng)基的菌落數(shù)相同,
H1:兩種培養(yǎng)基的菌落數(shù)不同。
α=0.05。
本文檔共60頁;當前第54頁;編輯于星期五\22點14分Poisson分布資料的差異顯著性檢驗在對泊松分布資料進行顯著性檢驗時,如
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工傷預防與安全教育
- 國家網(wǎng)絡安全教育宣傳
- 2024年9月裝修半包合同暗裝地插防水處理協(xié)議
- 班級文體活動總結(jié)
- 審計工作個人總結(jié)
- 房屋贈予合約合同
- 公司型基金合同標準文本
- 低價轉(zhuǎn)讓廠房合同標準文本
- 與搭建商合同標準文本
- 特殊教育需求學生支持方案計劃
- 閃耀明天 二聲部合唱簡譜
- 國開2023秋《人文英語4》期末復習寫作練習參考答案
- 急性髓系白血病臨床路徑(2016年版)
- 水表及閥門安裝施工方案
- 23S519 小型排水構(gòu)筑物(帶書簽)
- 招投標專員績效考核表
- 2023上海松江區(qū)初三二模數(shù)學試題及答案
- 克雅氏病課件
- 川崎機器人說明書cubic s設(shè)定手冊
- 2023學年完整公開課版ThelastdayofPompeii
- 壓力管道試驗方案、強度(含泄漏性)試驗記錄及報告典型示例
評論
0/150
提交評論