負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用_第1頁
負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用_第2頁
負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用_第3頁
負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用_第4頁
負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、負二項分布的性質(zhì)特征及在流行病學(xué)研究中的應(yīng)用         09-08-27 15:21:00     作者:韓新煥    編輯:studa20【摘要】  給出了負二項分布的分解定理,進一步研究了負二項分布的有關(guān)性質(zhì)及參數(shù) 的無偏一致估計,以及在流行病學(xué)該分布的生物學(xué)意義。 【關(guān)鍵詞】  負二項分布; 無偏一致估計; 應(yīng)用負二項分布是概率論中常用的重要的離散型隨機分布,它在醫(yī)學(xué)中主要用于聚集性疾病及生物、微生物、寄

2、生蟲分布模型等的研究。具體地說,當個體間發(fā)病概率不相等可以擬合負二項分布,如單位人數(shù)內(nèi)某傳染病的發(fā)病人數(shù),某地方病、遺傳病的發(fā)病人數(shù)等,這些均可通過負二項分布進行處理。本文從概率論的角度闡述負二項分布的性質(zhì)及參數(shù) 的最小方差無偏估計,并且以該分布在流行病學(xué)中應(yīng)用為例證討論了其生物學(xué)意義。    1  負二項分布的概率模型    負二項分布又稱帕斯卡分布(Pascal),它有兩種基本模型1:    模型:假定每次試驗可能的結(jié)果只有兩個:可歸結(jié)為成功或失敗,每次試驗之間是獨立,每次成功的概率均為 ,

3、直到恰好出現(xiàn)r(指定的一個自然數(shù))次成功所需試驗次數(shù)X,則X的概率分布為:    p(X=K)=Cr-1k-1k-1(1-)k-r=Cr-1k-1-(1-)k-r    k=r,r+1(1)    模型:假定每次試驗可能的結(jié)果只有兩個:可歸結(jié)為成功或失敗,每次試驗之間是獨立,每次成功的概率均為 ,試驗進行到r次成功為止,記X為試驗共進行的次數(shù),則X的概率分布為3:    p(X=k)=Cr-1k+r-1k(1-)k    k=0,1,2,(2)&

4、#160;   此分布的概率是r(1-(1-)-r  的冪級數(shù)展開式的項,負二項分布由此而得名    記作 Xf(k,r,) , 或 XNB(r,)    一個重要的特例是   r=1。   這時(2)成為    p(X=k)=(1-)k    k=0,1,2,(3)    稱為幾何分布。    2  性質(zhì)特征  &#

5、160; 為研究負二項分布的性質(zhì),我們先給出一個重要的結(jié)論:    引理: 設(shè)XNB(r,),則其特征函數(shù)為x(t)=r(1-(1-)eit)-r    證明: x(t)=E(eitx)=i=0Cr-1i+r-1r(1-)i eitr    =i=0Cr-1i+r-1r(1-) e)rti    =ri=0Cr-1i+r-1(1-) ert)i    =r(1-(1-)eit)-r    定理1  設(shè): X

6、1,X2,Xr(3)的iid樣本,如果    X=ri=1Xi, 則X=ri=1XiNB(r,)    證明:因為X1,X2,Xr獨立同分布,又有引理知 X=ri=1Xi的特征函數(shù)為:    (t)=r(1-(1-) eit)-r    =rk=0(-r)(-r01)(-r-k+1)k! (1-) eit)k(-1)keitr    =rk=0(r+k-1)!(r-1)!k! (1-)k eit(k+1)    =k

7、=0r(1-)k eit(k+r) Cr-1r+k-1    這正是 p(X=k)=Cr-1r+k-1(1-)k 的概率分布    則 X=ri=1XiNB(r,)    定理2     設(shè):X=X1,X2,Xn)是(1)的iid樣本,則T(X)=ni=0XiNB(nr,),則有    p(T=k)=Cnr-1k-1nr(1-)k-nr    k=nr,nr+1,(4)   

8、證明:   設(shè) 的特征函數(shù)為f(t) ,那么    f(t)=x=reitxCr-1N-1N(1-)N-r =eit1-(1-)eitr    因為x是 的iid樣本,所以Xi 的特征函數(shù)fi(t)=f(t),i=1,2,n    有特征函數(shù)的性質(zhì)得T的特征函數(shù)為:    ni=1fi(t)eit1-(1-)eitr    由于特征函數(shù)與概率分布唯一對應(yīng),所以Tf(k,nr,) ,其概率分布便是(4)。  

9、  定理3  設(shè):X=(X1,X2,Xn)是(1)的iid樣本,則    T(X)=nr-1ni=1Xi-1, 則它是 的最小方差無偏估計。    證明: 由定理2可知    E(T(X)=k=nrnr-1k-1Cnr-1k-1nr(1-)k-nr    =k-1=nr-1 C(nr-1)-1(K-1)-1 nr-1×(1-)(k-1)-(nr-1)    =    所以T(X)是 的無

10、偏估計。     09-08-27 15:21:00     作者:韓新煥    編輯:studa20    又由于E(T(X)= ,有切貝曉夫不等式,對>0, 有    p(|T(X)-|)V(T(X)2      而    V(T(X)=k=nrnr-1k-12Cnr-1k-1nr(1-)k-nr  

11、0; =2 k=nrnr-1k-1×k-2nr-2-1×C(nr-2)-1(k-2)-1nr-2(1-)k-nr    =2 k=nr1(k-1) (k-nr)(nr-2)×C(nr-2)-1(k-2)-1nr-2(1-)k-nr < 2nr-2  k=nr C(nr-2)-1(k-2)-1nr-2(1-)(k-2)-(nr-2)    =2nr-2    所以,對>0, 都有l(wèi)innp(|T(X)-|)=0 ,可見T(X)是 的一致估計。 &

12、#160;  又因為E(T(X)= ,根據(jù) Lehmannscheff定理, 的最小方差無偏估計必存在,而T(X)=nr-1 ni=1Xi-1,只依賴T(X)= ni=1Xi , 即 T(X)=nr-1 ni=1Xi-1 是 的一致最小方差無偏估計。    3  負二項分布的最可能數(shù)和概率的最大值    如果Xk=p(X=k)=Cr-1k-1rqk-r  k=r+1,r+2,其中q=1-,則  當r-q1-q不為整數(shù)時,k0=r-q1-q時為負二項分布的唯一最可能的數(shù),即 k=k0時,p(X=k

13、0)達到最大值。    證明:  pkpk-1=Cr-1k-1rqk-rCr-1k-2rqk-1-r=q(k-1)k-r    =>1時,kpk-1,隨k增大,概率增大    <1時,k>r-q1-q, pk<PK-1,隨K增大,概率減少< p>     =1時,k=r-q1-q, pk=pk-1      當r-q1-q不為整數(shù)時,則存在唯一k0=r-q1-q  滿足 

14、 r-q1-q-1< k0 <R-Q1-Q< p>     使  pk0-1< pk0>pk0+1,從而k0=r-q1-q是唯一最可能的數(shù),即 k=k0時,p(X=k0)達到最大值。    4  流行病中實例分析    假設(shè)血吸蟲成蟲隨機地分布于人群中,即所有的個體均有同等的機會獲得新感染,將致成蟲在人群中呈Poisson分布。然而,由于暴露的危險性不等、易感性不一致及可能存在的獲得性免疫等將導(dǎo)致感染的機會不等,而出現(xiàn)成蟲集中在某一部分的人群中。一些

15、可以直接通過驅(qū)蟲獲得人群蟲負荷分布的資料及某些尸檢資料均提示蠕蟲的成蟲(如蛔蟲、鉤蟲、曼氏血吸蟲、鞭蟲)在人群中的分布具有聚集塊。聚集塊內(nèi)病例個體的平均數(shù)又服從 分布。即:病例的數(shù)目H服從均數(shù)為 的poisson分布,由于 是變化的,假定其概率分布可用分布表示。于是對于給定的 ,條件概率為:    p(H=h|)=he-h!,   h=0,1,2,>0    此時 的概率密度函數(shù)為:    f()=() -1e-,>0,其中>0,>0 都是參數(shù)。當和 變化時,可

16、產(chǎn)生一族分布曲線??梢宰C明,Poisson 分布就是負二項分布。    因為  ,ex= k=0 xkk!    H是離散型隨機變量, 是連續(xù)型隨機變量,H的邊際概率函數(shù)是:    p(H=h)=JF(Z0e-hh! ()-1ed JF)    =h!() JF(Z0+h-1e(1+)d JF)    =h!(k-1)! (+h-1)!(+1)h+    =Chh+-1 (+1) (1-+1)h 

17、   =Chh+k-1 k (1-)h, (j=0,1,2)    其中,0<<+1<1, k=,   此即為負二項分布。    5  討論    負二項分布是當poisson中參數(shù)服從 分布時所得的復(fù)合分布,分布中的參數(shù) 是不定的變化的,且其變化是有規(guī)律的。呈現(xiàn)的特點是病例聚集群內(nèi)病例個體的密度服從 分布,病例個體間的流行病學(xué)聯(lián)系與 分布有關(guān),由于 分布的概率密度函數(shù)及圖形為:    f(x)=() x-1e-x,  x>0    0,        x0    因此,負二項分布來源于poisson分布,它改進了poisson的等概條

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論