參數(shù)估計(jì)方法_第1頁
參數(shù)估計(jì)方法_第2頁
參數(shù)估計(jì)方法_第3頁
參數(shù)估計(jì)方法_第4頁
參數(shù)估計(jì)方法_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第八章參數(shù)估計(jì)方法研究工作的目的在于了解總體特征的有關(guān)信息,因而用樣本統(tǒng)計(jì)數(shù)估計(jì)相應(yīng)總體參數(shù),并由之進(jìn)行統(tǒng)計(jì)推斷??傮w特征的各種參數(shù),在前幾章主要涉及平均數(shù)、標(biāo)準(zhǔn)差等,并只從直觀上介紹其定義和公式,未就其歷,即參數(shù)估計(jì)(parameterestimation)的方法作討論。本章將簡要介紹幾種常用參數(shù)估計(jì)方法,即矩法、最小二乘法、極大似然法。第五章述及參數(shù)的點(diǎn)估計(jì)(pointestimation)和區(qū)間估計(jì)(intervalestimation),本章討論點(diǎn)估計(jì)方法。區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上結(jié)合統(tǒng)計(jì)數(shù)的抽樣分布而進(jìn)一步作出的推論,有關(guān)內(nèi)容將散見在其它各章。第一節(jié)農(nóng)業(yè)科學(xué)中的主要參數(shù)及其估計(jì)量的評(píng)選標(biāo)準(zhǔn)一、農(nóng)業(yè)科學(xué)中的主要參數(shù)農(nóng)業(yè)科學(xué)研究中需要估計(jì)的參數(shù)是多種多樣的,主要包括總體數(shù)量特征值參數(shù),例如,用平均數(shù)來估計(jì)品種的產(chǎn)量,用平均數(shù)差數(shù)來估計(jì)施肥等處理的效應(yīng);用百分?jǐn)?shù)(或比例)來估計(jì)遺傳分離比例、群體基因或基因型頻率、2個(gè)連鎖主基因間的重組率;通過變異來源的剖分,用方差來估計(jì)環(huán)境方差、遺傳方差和表型方差,在此基礎(chǔ)上以估計(jì)性狀的遺傳力等遺傳參數(shù)用標(biāo)準(zhǔn)誤來估計(jì)有關(guān)統(tǒng)計(jì)數(shù)的抽樣誤差,如重組率的標(biāo)準(zhǔn)誤、遺傳抽樣誤差、遺傳多樣性誤差、頻率誤差等。在揭示變數(shù)間的相互關(guān)系方面,用相關(guān)系數(shù)來描述2個(gè)變數(shù)間的線性關(guān)系;用回歸系數(shù)、偏回歸系數(shù)等來描述原因變數(shù)變化所引起的結(jié)果變數(shù)的平均變化的數(shù)量,用通徑系數(shù)來描述成分性狀對目標(biāo)性狀的貢獻(xiàn)程度等。有關(guān)數(shù)量關(guān)系和數(shù)量變化方面的內(nèi)容將在第9至11章介紹。二、參數(shù)估計(jì)量的評(píng)選標(biāo)準(zhǔn)討論參數(shù)估計(jì)方法前需要了解數(shù)學(xué)期望(expectation)的概念和評(píng)價(jià)估計(jì)方法優(yōu)劣的標(biāo)準(zhǔn)。(一)數(shù)學(xué)期望在抽樣分布中,已經(jīng)講述了從總體中抽出所有可能樣本的樣本平均數(shù)的平均數(shù)等于總體平均數(shù),這里,樣本平均數(shù)的平均數(shù)就是一種數(shù)學(xué)期望。例如,一個(gè)大豆品種的含油量為20%,測定一次可能是大于20%,再測定可能小于20%,大量反復(fù)測定后平均結(jié)果為20%,這時(shí)20%便可看作為該大豆品種含油量的數(shù)學(xué)期望,而每單獨(dú)測定一次所獲的值只是1個(gè)隨機(jī)變量。抽象地,隨機(jī)變量的數(shù)字特征是指隨機(jī)變量的數(shù)學(xué)期望值,本書以前各章常見的數(shù)學(xué)期望有平均數(shù)和方差等。求數(shù)學(xué)期望往往是求總體的特征參數(shù)表達(dá)式。對于離散型(間斷性)隨機(jī)變量y的分布列為:P{y=y.}=p.,其中,i=l,2,…,那么隨機(jī)變量y的數(shù)學(xué)期望E(y)為: 11E(y)=£yp (8?1)ii=1這樣可以求得總體平均值。對于連續(xù)型隨機(jī)變數(shù)y的數(shù)學(xué)期望E(y)為:E(y)=J+8yf(y)dy (8?2)其中f(y)為隨機(jī)變量y的概率密度函數(shù),這樣可以求得總體均值。方差在前面已有大量應(yīng)用,這里用D(y)表示,有D(y)=E[y-E(y)]2 (8?3)這就是隨機(jī)變量函數(shù)的數(shù)學(xué)期望。同理,離散型隨機(jī)變量方差的數(shù)學(xué)期望為:D(y)=£^y-E(y)1p (8?4)iii=1連續(xù)型隨機(jī)變量方差的數(shù)學(xué)期望為:D(y)=J+8b-E(y)1f(y)dy (8?5)—8數(shù)學(xué)期望有這樣一些常用的性質(zhì):(1)常數(shù)的數(shù)學(xué)期望為常數(shù)本身;(2)隨機(jī)變量與常數(shù)的乘積的數(shù)學(xué)期望是常數(shù)與隨機(jī)變量的數(shù)學(xué)期望的乘積;(3)多個(gè)隨機(jī)變量分別與常數(shù)的乘積的求和函數(shù)的數(shù)學(xué)期望是常數(shù)與多個(gè)隨機(jī)變量的數(shù)學(xué)期望的乘積的和;(4)多個(gè)相互獨(dú)立的隨機(jī)變量的乘積的數(shù)學(xué)期望是多個(gè)隨機(jī)變量的數(shù)學(xué)期望的乘積。(二)參數(shù)估計(jì)量的評(píng)選標(biāo)準(zhǔn)參數(shù)估計(jì)可用不同的方法,后文將介紹矩法、最小二乘法和極大似然法等,使用不同的方法會(huì)得到不同的參數(shù)估計(jì)量(parameterestimator),各種估計(jì)量均有其優(yōu)點(diǎn),評(píng)價(jià)估計(jì)量優(yōu)劣的標(biāo)準(zhǔn)主要有無偏性、有效性、相合性等。無偏性參數(shù)估計(jì)量的期望值與參數(shù)真值是相等的,這種性質(zhì)稱為無偏性,具有無偏性的估計(jì)量稱為無偏估計(jì)量。例如,在抽樣分布中已經(jīng)介紹了離均差平方和除以自由度得到的均方的平均數(shù)等于總體方差,即該均方的數(shù)學(xué)期望等于相應(yīng)總體參數(shù)方差,這就是說該均方估計(jì)量是無偏的。估計(jì)量的數(shù)學(xué)期望值在樣本容量趨近于無窮大時(shí)與參數(shù)的真值相等的性質(zhì)稱為漸進(jìn)無偏性,具有漸進(jìn)無偏性的估計(jì)量稱為漸進(jìn)無偏估計(jì)量。有效性無偏性表示估計(jì)值是在真值周圍波動(dòng)的一個(gè)數(shù)值,即無偏性表示估計(jì)值與真值間平均差異為0,近似可以用估計(jì)值作為真值的一個(gè)代表。同一個(gè)參數(shù)可以有許多無偏估計(jì)量,但不同估計(jì)量的期望方差不同,也就是估計(jì)量在真值周圍的波動(dòng)大小不同。估計(jì)量的期望方差越大說明用其估計(jì)值代表相應(yīng)真值的有效性越差;否則越好,越有效。不同的估計(jì)量具有不同的方差,方差最小說明最有效。如果一個(gè)無偏估計(jì)量相對與其它所有可能無偏估計(jì)量,其期望方差最小,那么稱這種估計(jì)量為一致最小方差無偏估計(jì)量。相合性用估計(jì)量估計(jì)參數(shù)涉及一個(gè)樣本容量大小問題,如果樣本容量越大估計(jì)值越接近真值,那么這種估計(jì)量是相合估計(jì)量。除以上三方面標(biāo)準(zhǔn)外,還有充分性與完備性也是??紤]的。充分性指估計(jì)量應(yīng)充分利用樣本中每一變量的信息;完備性指該估計(jì)量是充分的唯一的無偏估計(jì)量。前幾章介紹了平均數(shù)與方差的計(jì)算公式,實(shí)際上估計(jì)總體平均數(shù)與方差有多種統(tǒng)計(jì)數(shù)或公式,如平均數(shù)有算術(shù)平均數(shù)、中數(shù)、眾數(shù)等,方差有以(n-1)或n為除數(shù)的方法等。經(jīng)比較算術(shù)平均數(shù)與由自由度n-1計(jì)算的方差最符合上述各項(xiàng)標(biāo)準(zhǔn)的綜合要求,因而得到廣泛的應(yīng)用。

第二節(jié)矩法一、矩的概念矩(moment)分為原點(diǎn)矩和中心矩兩種。對于樣本y,y,…,y,各觀測值的k次方的平12n1均值,稱為樣本的k階原點(diǎn)矩,記為yk,有yk=£yk,例如,算術(shù)平均數(shù)就是一階原點(diǎn)矩;ni=1 ' 用觀測值減去平均數(shù)得到的離均差的k次方的平均數(shù)稱為樣本的k階中心矩,記為(y-y)k或Q,有(y-y)k=丄£(y-y)k,例如,樣本方差丄£(y-y)2就是二階中心矩。k ni=1i ni=1'對于總體y,y,…,y,各觀測值的k次方的平均值,稱為總體的k階原點(diǎn)矩,記為12NE(yk),有E(yk)=丄Nyk;用觀測值減去平均數(shù)得到的離均差的k次方的平均數(shù)稱為總體的Ni=1ik階中心矩,記為E[(y-卩)k]或卩,有E[(y-p)k]= £(y-p)k。k Ni=1i二、矩法及矩估計(jì)量所謂矩法就是利用樣本各階原點(diǎn)矩來估計(jì)總體相應(yīng)各階原點(diǎn)矩的方法,即—1yk=£yk—E(yk) (8?6)ni=1i并且也可以用樣本各階原點(diǎn)矩的函數(shù)來估計(jì)總體各階原點(diǎn)矩同一函數(shù),即若Q=f(E(y),E(y2),???,E(yk))則 _ _/Xq=f(y,2,…,,)由此得到的估計(jì)量稱為矩估計(jì)量。[例&1] 現(xiàn)獲得正態(tài)分布N(P,Q2)的隨機(jī)樣本y,y,…,y,要求正態(tài)分布1 2nN(p,Q2)參數(shù)卩和q2的矩估計(jì)量。首先,求正態(tài)分布總體的1階原點(diǎn)矩和2階中心矩:e(y)=J+8yf(y)dy=J+8y1-^^exp神2兀1-^^exp神2兀Q(y-卩)22q2(此處exP-丁表示自然對數(shù)底數(shù)e的丁[的指數(shù)式,即丄才])EE[(y-n)]2=J+8(y-n)2f(y)dy=J+8(y-n)2?丄exp-8 -8 v2kq(y-A)2 ,一_£2_dy=Q22q2然后求樣本的1階原點(diǎn)矩和2階中心矩,為八 1 1 . /卩=y= £y,卩=s2= £(y-y)2ni=1i2 ni=1i最后,利用矩法,獲得總體平均數(shù)和方差的矩估計(jì)n=y」£y,Q2=s2=丄£(y-y)2ni ni

故總體平均數(shù)和方差的矩估計(jì)值分別為樣本平均數(shù)和樣本方差,方差的分母為n。單峰分布曲線還有二個(gè)特征數(shù),即偏度(skewness)與峰度(kurtosis),可分別用三階中心矩卩和四階中心矩卩來度量。但卩和卩是有單位的,為轉(zhuǎn)化成相對數(shù)以便不同分布之間的比3434較,可分別用偏度系數(shù)和峰度系數(shù)作測度。偏度系數(shù)(coefficientofskewness)是指3階中心矩與標(biāo)準(zhǔn)差的3次方之比;峰度系數(shù)(coefficientofkurtosis)是指4階中心矩與標(biāo)準(zhǔn)差的4次方之比。當(dāng)偏度為正值時(shí),分布向大于平均數(shù)方向偏斜;偏度為負(fù)值時(shí)則向小于平均數(shù)方向偏斜當(dāng)偏度的絕對值大于2時(shí),分布的偏斜程度嚴(yán)重。當(dāng)峰度大于3時(shí),分布比較陡峭,峰態(tài)明顯,即總體變數(shù)的分布比較集中。由樣本計(jì)算的偏度系數(shù)cs=n迫由樣本計(jì)算的偏度系數(shù)cs=n迫3二丄£(y—y)33 ni=l'峰度系數(shù)ck=n「64二丄£(y—y)44 ni=i'-£(y-y)2ni=1 ,£(y-y)2ni=i'(8?7)(8?8)[例8.2]計(jì)算表3.4數(shù)據(jù)資料(-40行水稻產(chǎn)量)所屬分布曲線的偏度和峰度。首先,計(jì)算樣本的2、3、4階中心矩n, ,以及標(biāo)準(zhǔn)差估計(jì)值:234n=-£(y—y)2=1303.735ni=1 'n=-£(y—y)3=3953.891ni=1 'n=-£(y—y)4=4.67729X106ni=l' 6二示二J-£(y—y)2=36.1072 'n1i然后,根據(jù)矩法原理,該分布的偏度與峰度估計(jì)值分別為:cs=n/63=0.08493ck=n/64=2.7523因此,說明資料比較集中在平均數(shù)左右,分布曲線并不是特別陡峭。[例&3]例6.9為研究秈粳稻雜交F5代系間單株干草重的遺傳變異,隨機(jī)抽取76個(gè)系進(jìn)行試驗(yàn),每系隨機(jī)取2個(gè)樣品測定干草重(g/株)。按單向分組方差分析進(jìn)行分析,結(jié)果見表6.9。此處用來說明由矩法估計(jì)誤差62、遺傳方差62和干草的遺傳力h2。T因?yàn)?6個(gè)系是隨機(jī)抽取的,因而為隨機(jī)模型。方差結(jié)果說明系間差異顯著,因而系間效應(yīng)存在。根據(jù)矩法,首先應(yīng)求出系間和誤差變異來源的樣本均方和總體期望均方(表6.9)。然后,利用矩估計(jì)原理,令樣本的均方與總體相應(yīng)變異的期望均方相等,從而求出62和62的T矩估計(jì)值。此處E(MS系統(tǒng)間)=E[Tt-E(Tt)]2,(Tt為各個(gè)系統(tǒng)的總和數(shù))=62+n62TE(MS)=E@),(e為誤差)誤差=62因而&2=17.7762+262=72.79T

c?2=(72.79-17.77)/2=27.51T27.5127.51+17.77=60.76%C27.5127.51+17.77=60.76%h2=g=g=t C2c2+C2c2+C2pgeT第三節(jié)最小二乘法從總體中抽出的樣本觀察值與總體平均數(shù)是有差異的,這種差異屬于抽樣誤差。因而,在總體平均數(shù)估計(jì)時(shí)要盡可能地降低這種誤差,使總體平均數(shù)估計(jì)值盡可能好。參數(shù)估計(jì)的最小二乘法就是基于這種考慮提出的。其基本思想是使誤差平方和最小,達(dá)到在誤差之間建立一種平衡,以防止某一極端誤差對決定參數(shù)的估計(jì)值起支配地位。這有助于揭示更接近真實(shí)的狀況。具體方法是為使誤差平方和Q為最小,可通過求Q對待估參數(shù)的偏導(dǎo)數(shù),并令其等于0,以求得參數(shù)估計(jì)量。[例&4]用最小二乘法求總體平均數(shù)卩的估計(jì)量。若從平均數(shù)為卩的總體中抽得樣本為y「y2、y3、…、yn,則觀察值可剖分為總體平均數(shù)卩與誤差ei之和,iy=^+eii總體平均數(shù)卩的最小二乘估計(jì)量就是使丁‘與卩間的誤差平方和為最小,即Q=Ze2=£(y-“)2iii=1為最小。為獲得其最小值,求Q對卩的導(dǎo)數(shù),并令導(dǎo)數(shù)等于0,可得:=-2£(y-R)=0即 i=1'即總體平均數(shù)的估計(jì)量為:1n

i?=-£y.ni=1i因此,算術(shù)平均數(shù)為總體平均數(shù)的最小二乘估計(jì)。這與矩法估計(jì)是一致的。此處順便介紹估計(jì)離均差平方和Q'=£(y-y)2的數(shù)學(xué)期望:iEQ')=E[£(y—y)2]=E[£(y—?—y+?)2]ii=E[£(y—?)2-2£(y—?)(y—?)+£(y—?)2]ii=E[£(y—?)2-£(y—卩)2]=nc2—nc2/ni=(n-1)c2因而,c2估計(jì)為:c2=Q'..(n—1)=£(y—刃2/(n—1)i與矩法所得不同,而與常規(guī)以自由度為除數(shù)法一致。[例8.5]求例6.13的兩向分組方差分析資料缺1個(gè)小區(qū)(表8.1)的最小二乘估計(jì)量和估計(jì)值。從第6章可知,這種資料模式的線性模型為:y=?+t+p+£。該模型的約束條件ij ijiji=1j=1為:£t=0,£0i=1j=1Q=££€2二工工(y-^-T—卩)2為最小時(shí)可以求出效應(yīng)和缺失小區(qū)y的估計(jì)量,即ijijijei=1j=1TOC\o"1-5"\h\z=££2(y..—A—t—卩)(—1)=0

i=1j=1 ” 1 7=£2(y..—卩—T.—卩)(—1)=0

.=1 .1.-=£2(y..—卩—T.一卩)(—1)=0

i=1 " 1 .=££2(y..—y—T.—0)=0

i=1j=1 ” 1 .從而,最小二乘估計(jì)量分別為:卩=y=丄££y..ari=1j=1ijT=y.—y=-£y..—丄££y..i i rj=1ijari=1j=1ij卩.=y.—y=£y..— ££y..jj ai=1ijari=i.=1ijTOC\o"1-5"\h\z1r1 a1 a ry=n+T.+p.=-£y.+-£y.—丄££y..i.r.=1 .a .=1 .ar .=1 .=1 .表8.1生長素處理豌豆的試驗(yàn)結(jié)果處理(A)-組(B)總和Ti平均yiIIIIIIIV對照(CK)6062616024360.8赤霉素656568ye198+ye動(dòng)力精6361616024561.3吲哚乙酸6467636125563.8硫酸腺嘌吟6265626425363.3馬來酸6162626525062.5總和T..——375382377310+兒T=1444+y”TOC\o"1-5"\h\z因而表8.1中,缺失小區(qū)的估計(jì)值可由下式求出:198+y310+y144+4yy= e+ e e4 6 4x6解上述方程,最小二乘估計(jì)值為:y=65.6。丿e缺區(qū)估計(jì)是根據(jù)線性模型,以及最小二乘法的原理得到的。不過,試驗(yàn)中盡可能不要缺區(qū),因?yàn)槿眳^(qū)估計(jì)盡管可以估計(jì)缺區(qū)的值,但是誤差的自由度將減少,本試驗(yàn)的誤差自由度將減少1。一般地,若m個(gè)自變數(shù)X]、x2、x3、…、xm與依變數(shù)y存在統(tǒng)計(jì)模型關(guān)系y=f(x,x,…,x;0,0,…,0)+£ (8?9)TOC\o"1-5"\h\z1 2m1 2k其中,0,0,…,0為待估參數(shù)。通過n次觀測(n>k)得到n組含有1 2 kX,x,…,x,y(i=1,2..”n)的數(shù)據(jù)以估計(jì)0,0,…,0。其最小二乘估計(jì)值為使1i 2i mii 1 2k

Q=£€2=£[y-f(x,x,…,x;0,0,…,0)]2 (8?10)i 1i 2i mi12ki=1 i=1為最小的0,0,…,0。這種估計(jì)方法稱為參數(shù)估計(jì)的最小二乘法(leastsquares),或最小平12k方法。第9章將應(yīng)用最小二乘法估計(jì)線性回歸中有關(guān)參數(shù)的估計(jì)量,此處不再贅述。第四節(jié)極大似然法極大似然法(maximumlikelihoodmethod)是參數(shù)估計(jì)的重要方法。首先,通過舉例來說明其思路。例如,有1個(gè)射手射擊3次,命中0次。試問該射手的命中概率最有可能為3個(gè)命中概率:1/5、8/15和4/5中的哪一個(gè)?回答該問題可以從兩方面來看,一方面,該射手的命中率為0,與此最接近的命中概率為1/5,即1/5最有可能;另一方面,分別假定該射手的命中率為1/5、8/15和4/5,根據(jù)二項(xiàng)分布原理分別計(jì)算出該射手射擊3次命中0次的概率分別為:C0(-)0(1-C0(-)0(1--)335517283375C。(-^。仃-—)33-5 -5343337544C0()。(1——)335 5273375因此,選擇使事件發(fā)生概率最大的可能命中概率為-/5,從而認(rèn)為該射手的命中概率最有可能為-/5。這種參數(shù)估計(jì)方法稱為極大似然法。極大似然法,包括二個(gè)步驟:首先建立包括有該參數(shù)估計(jì)量的似然函數(shù)(likelihoodfunction),然后根據(jù)實(shí)驗(yàn)數(shù)據(jù)求出似然函數(shù)達(dá)極值時(shí)的參數(shù)估計(jì)量或估計(jì)值。上面根據(jù)二項(xiàng)分布計(jì)算概率,因而包含有待估概率的二項(xiàng)分布便是似然函數(shù),它是關(guān)于待估參數(shù)的函數(shù)。由于試驗(yàn)結(jié)果是由總體參數(shù)決定的,那么參數(shù)估計(jì)值就應(yīng)該使參數(shù)真值與試驗(yàn)結(jié)果盡可能一致,似然函數(shù)正是溝通參數(shù)與試驗(yàn)結(jié)果一致性的函數(shù)。一、似然函數(shù)對于離散型隨機(jī)變量,似然函數(shù)是多個(gè)獨(dú)立事件的概率函數(shù)的乘積,該乘積是概率函數(shù)值,它是關(guān)于總體參數(shù)的函數(shù)。例如,一只大口袋里有紅、白、黑3種球,采用復(fù)置抽樣50次,得到紅、白、黑3種球的個(gè)數(shù)分別為-2,24,-4,那么根據(jù)多項(xiàng)式的理論,可以建立似然函數(shù)為:其中P1,p2,P3分別為口袋中紅、白、黑3種球的概率(p3=1-pi-p2),它們是需要估計(jì)的。50!12!24!14!50!12!24!14!(p1)12(p2)24(p3)14對于連續(xù)型隨機(jī)變量,似然函數(shù)是每個(gè)獨(dú)立隨機(jī)觀測值的概率密度函數(shù)的乘積,則似然函數(shù)為:L(0)=L(y,y,…,y;0)=f(y;0)f(y;0)???f(y;0) (8?11)12n12n若y1服從正態(tài)分布N(p,Q2),則0=(卩,q),上式可變?yōu)椋海▂—W)2 (y——卜I)2 1L(p, Q)= 「e— 2。2 … 「e— 2。2 =( 「)ne—2。2[(y1-W)2+…+(y”—W)2] (8?12)2兀Q 2兀。 2兀。

二、極大似然估計(jì)所謂極大似然估計(jì)就是指使似然函數(shù)為最大以獲得總體參數(shù)估計(jì)的方法。其中,所獲得的估計(jì)總體參數(shù)的表達(dá)式稱為極大似然估計(jì)量,由該估計(jì)量獲得的總體參數(shù)的估計(jì)值稱為總體參數(shù)的極大似然估計(jì)值。為了計(jì)算上的方便,一般將似然函數(shù)取對數(shù),稱為對數(shù)似然函數(shù),因?yàn)槿?shù)后似然函數(shù)由乘積變?yōu)榧邮?,其表達(dá)式為:InL(0)=InL(y,y,…,y;0)=£Inf(y,0) (8?13)12nii=1通過對數(shù)似然函數(shù)和似然函數(shù)的極大化以估計(jì)總體參數(shù)的結(jié)果是一致的,一般說來,前者在計(jì)算上要容易處理些。因此,往往利用對數(shù)似然函數(shù)極大化的方法來獲得極大似然估計(jì)。求=£詁(y「=£詁(y「;0「i=1k由此獲得總體參數(shù)的極大似然估計(jì)量。[例&6]設(shè)y,y,…,yN(p,Q2)參數(shù)的極大似然估計(jì)量。y1,0=(0,0,…,0),有12lQlnL(y,y,…,y;0,0,…,0)Q0 1 2 n 1 2 lk0,…,0)=0(k=1, l) (8?14)2l是正態(tài)總體Ng,Q2)的隨機(jī)樣本,求正態(tài)分布似然函數(shù)為:Lg,Q2)=n^^exp[—(yi 池]=[-^-}2exp[—-—£(y—卩)2]i=]丁2兀o 2q2 12兀Q2丿 2q2曰z取對數(shù),得:lnL(卩,lnL(卩,°2)=—:ln(2K)—:ln°2—12°2£(y.-卩)2ii=1那么似然方程組為:Q 1——lnL(y,°2)=——£(y一卩)=0即 °2.i<1Q n1 lnL@,°2)= + £(y一卩)2=02 2°2 2°41z解得:1-n卩=一£y.=yni=1z°2=丄£(y—A)2n.=1 z因此,正態(tài)分布總體平均數(shù)的極大似然估計(jì)量為:d=1£y=y。當(dāng)總體平均值為未知ni=1i時(shí),方差估計(jì)量為°2=丄£(y—y)2;當(dāng)總體平均值為已知時(shí),方差估計(jì)量為ni=1i°2=丄£(y—d)2。ni=1i[例&7]求紅、白、黑球事例中p,p,p的極大似然估計(jì)值。

50!由12!24;14!(pi)12(p2)24(p3)14可獲得對數(shù)似然函數(shù)InL(p,p,p)=C+12Inp+24Inp+14Inp1 2 3 1 2 3=C+12Inp+24Inp+14ln(1一p—p)1212其中,C為常數(shù)。分別求InL(pjp2,1-pi—p2)對P],p2的偏導(dǎo)數(shù),并令為0,得似然方程組:lnL(p,p,1—p—p)=—^ — (—1)=0dp 1 2 1 2p1—p—p<11 1 2d 24 14 lnL(p,p,1—p—p)=—+ (—1)=0dp 1 2 1 2p1—p—p2212聯(lián)立求解,得:p=6/2冷,=12/2歷=7/251 2 3顯然,極大似然估計(jì)值p,p,p等于其觀測頻率。123[例&8]兩個(gè)親本的基因型分別為AABB和aabb,這兩個(gè)親本雜交后F2出現(xiàn)了4種基因型,分別為A_B_、A_bb、aaB_和aabb,得到四種基因型的個(gè)數(shù)分別為c、d、e、f已知AA和BB兩對基因間存在連鎖關(guān)系,現(xiàn)欲估計(jì)重組率?設(shè)重組率為r,根據(jù)遺傳學(xué)推導(dǎo),可以得到4種基因型的概率見表&2。表8.2F2群體基因型的分離情況基因型 2^.ABAbbaaBaabb總數(shù)觀察得到基因型個(gè)數(shù)c(289)d(26)e(29)f(76)n(420)概率2+(1—r)241-(1-r)241—(1—r)24(1—r)241首先,通過表&3介紹由兩對連鎖主基因控制的F2群體16種基因型的概率計(jì)算出4種表現(xiàn)型的概率(表8.2)。表8.3只2群體的基因型及其概率配子及概率ABr2 2^-Ab(1—r)2aB(1—r)2abri2AB r.,''‘2AABBr2/4AABbr(1—r)/4AaBBr(1—r)/4AaBbr2?:4Ab(1—r)/2AABbr(1—r)?4AAbb(1—r)24AaBb(1—r)2/4Aabbr(1—r)?4aB(1—r)2AaBBr(1—r)4AaBb(1—r)2/4aaBB(1—r)2/4aaBbr(1—r)?4abrl2AaBbr2/4Aabbr(1—r”4aaBbr(1—r)/4aabbr2J4按多項(xiàng)式分布,可以根據(jù)概率函數(shù)得到似然函數(shù)為:(8?15)(8?16)(8?17)n! J2+(1—r)21cf1—(1—r)2 J1—(1—r)2(8?15)(8?16)(8?17)c!d!e!f!I4II4II4II4I若以0=(1-r)2代入上式,則似然函數(shù)和對數(shù)似然函數(shù)分別為:L咲chf!I竽}C擰}d{字}e佇}f2 I0 1一0 0lnL(0)=k+cln[- ]+(d+e)ln[- ]+fln[](k是常數(shù)項(xiàng))4 4 4對上式求導(dǎo)數(shù),并令導(dǎo)數(shù)為0,可得方程:

TOC\o"1-5"\h\zc d+e f 八\o"CurrentDocument"-+=0

2+o I-。 e上式化解為一元二次方程ne2-(c-2d—2e+f)-2f=0入(c-2d-2e-f)±、:'(c-2d-2e-f)2+8fn z 、e= (8?18)2n在e的兩個(gè)解中取一個(gè)符合遺傳規(guī)律的解,那么,重組率的解為:r=1-扁\對于本例,有 e(289-2X26-2x29+76)±<(289-2x26-2x29+76)2+8x76x420—2x420=0.1226±0.6140取正根,e=0.7366,由此,r—1-J0.7366=0.142。統(tǒng)計(jì)理論已證明:重組率方差估計(jì)量為:(1-e統(tǒng)計(jì)理論已證明:重組率方差估計(jì)量為:(1-e)(2+0)2n(1+26)(8?⑼對于本例,有—0.019sG)=JD?)=](1-0.7366)(2+0.7366)

S廠_丫? 2x420x(1+2x—0.019三、關(guān)于三種估計(jì)方法的討論通過上述3種參數(shù)估計(jì)方法已獲得總體平均數(shù)、方差的估計(jì)量。對于總體平均數(shù)的估計(jì)量,3種估計(jì)方法都具有無偏性、有效性和相合性;對于總體方差的估計(jì)量,由離均差平方和期望值所得的是無偏的,但由矩法和極大似然法所得兩種估計(jì)量是有偏的,但都是相合的;最小二乘法無直接的總體方差估計(jì)量。本章介紹了點(diǎn)估計(jì)的3種常用方法,但其要求不同。極大似然法要求已知總體的分布,才能獲得估計(jì)量,另外兩種方法對分布沒有嚴(yán)格的要求。一般地,極大似然法估計(jì)結(jié)果大多具有無偏性、有效性和相合性等優(yōu)良的估計(jì)量性質(zhì),因此被廣泛采用,但也并不是該法估計(jì)的結(jié)果就一定最好,例如極大似然方法估計(jì)平均數(shù)盡管是無偏估計(jì),但其估計(jì)的方差是有偏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論