數(shù)理統(tǒng)計全集專題培訓(xùn)課件_第1頁
數(shù)理統(tǒng)計全集專題培訓(xùn)課件_第2頁
數(shù)理統(tǒng)計全集專題培訓(xùn)課件_第3頁
數(shù)理統(tǒng)計全集專題培訓(xùn)課件_第4頁
數(shù)理統(tǒng)計全集專題培訓(xùn)課件_第5頁
已閱讀5頁,還剩404頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)理統(tǒng)計全集一、總體和個體二、樣本簡單隨機樣本一、總體和個體

一個統(tǒng)計問題總有它明確的研究對象.…研究某批燈泡的質(zhì)量研究對象的全體稱為總體(母體),組成總體的每個元素稱為個體.總體

然而在統(tǒng)計研究中,人們關(guān)心總體僅僅是關(guān)心其每個個體的一項(或幾項)數(shù)量指標和該數(shù)量指標在總體中的分布情況.這時,每個個體具有的數(shù)量指標的全體就是總體.某批燈泡的壽命該批燈泡壽命的全體就是總體國產(chǎn)轎車每公里的耗油量國產(chǎn)轎車每公里耗油量的全體就是總體

所研究的對象的某個(或某些)數(shù)量指標的全體稱為總體,它是一個隨機變量(或多維隨機變量),記為X

.X

的分布函數(shù)和數(shù)字特征稱為總體分布函數(shù)和總體數(shù)字特征.總體:

例如:研究某批燈泡的壽命時,總體X是這批燈泡的壽命,而其中每個燈泡的壽命就是個體。每個燈泡的壽命個體總體國產(chǎn)轎車每公里的耗油量國產(chǎn)轎車每公里耗油量的全體就是總體

又如:研究某批國產(chǎn)轎車每公里的耗油量時,總體X是這批轎車每公里的耗油量,而其中每輛轎車的耗油量就是個體。

類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時,若關(guān)心的數(shù)量指標是身高和體重,我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機變量(X,Y)來表示,而每個學(xué)生的身高和體重就是個體.

為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個體進行觀察試驗,以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個體稱為樣本.樣本中所包含的個體數(shù)目稱為樣本容量.二、樣本簡單隨機樣本1)抽樣和樣本

樣本的抽取是隨機的,每個個體是一個隨機變量.容量為n的樣本可以看作n維隨機變量,用X1,X2,…,Xn表示.

而一旦取定一組樣本,得到的是n個具體的數(shù)(x1,x2,…,xn),稱其為樣本的一個觀察值,簡稱樣本值

.2.X1,X2,…,Xn相互獨立.

由于抽樣的目的是為了對總體進行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作“簡單隨機抽樣”,它要求抽取的樣本滿足下面兩點:1.樣本X1,X2,…,Xn中每一個Xi與所考察的總體X有相同的分布.2)簡單隨機樣本

由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,它可以用與總體獨立同分布的n個相互獨立的隨機變量X1,X2,…,Xn表示.

簡單隨機樣本是應(yīng)用中最常見的情形,今后,當說到“X1,X2,…,Xn是取自某總體的樣本”時,若不特別說明,就指簡單隨機樣本.

設(shè)X1,X2,…,Xn

是總體X的一個簡單隨機樣本,1)若X為離散型總體,其分布律是p(x),則X1,X2,…,Xn的聯(lián)合分布律為p(x1)p

(x2)…

p

(xn)2)若X為連續(xù)型總體,其概率密度是f(x),則X1,X2,…,Xn的聯(lián)合分布律為f(x1)f

(x2)…

f(xn)

事實上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班大學(xué)生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本.我們只能觀察到隨機變量取的值而見不到隨機變量.3)總體、樣本、樣本值的關(guān)系

統(tǒng)計是從手中已有的資料—

樣本值,去推斷總體的情況

總體分布F(x)的性質(zhì).

總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.樣本是聯(lián)系二者的橋梁4)經(jīng)驗分布函數(shù)

設(shè)X1,X2,…,Xn為取自總體X的樣本,x1,x2,…,xn為其觀察值.對于每個固定的x,設(shè)事件{X≤x}在n次觀察中出現(xiàn)的次數(shù)為vn(x),于是事件{X≤x}發(fā)生的頻率為:顯然Fn(x)為不減右連續(xù)函數(shù),且稱Fn(x)為樣本分布函數(shù)或經(jīng)驗分布函數(shù).定理(格列文科)當n→∞時,經(jīng)驗分布函數(shù)Fn(x)依概率1關(guān)于x一致收斂與總體分布函數(shù),即定理表明:當樣本容量n充分大時,經(jīng)驗分布函數(shù)Fn(x)幾乎一定會充分趨近總體分布函數(shù)F(x),這是用樣本來推斷總體的理論依據(jù).第二節(jié)統(tǒng)計量與抽樣分布一、統(tǒng)計量二、統(tǒng)計學(xué)中三個常用分布和上α分位點三、抽樣分布定理一、統(tǒng)計量

由樣本值去推斷總體情況,需要對樣本值進行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)信息集中起來.定義中不含有任何的未知參數(shù),則稱函數(shù)g(X1,X2,…,Xn)如果樣本X1,X2,…,Xn的函數(shù)g(X1,X2,…,Xn)為統(tǒng)計量.g(x1,x2,…,xn)為統(tǒng)計量g(X1,X2,…,Xn)的一個若x1,x2,…,xn是相應(yīng)的樣本值,則稱函數(shù)值觀察值.若,2

已知,則是統(tǒng)計量,而例如:是X的一個樣本,則不是統(tǒng)計量.也是統(tǒng)計量.是未知參數(shù),

幾個常用的統(tǒng)計量樣本均值樣本方差它反映了總體均值的信息它反映了總體方差的信息樣本k階原點矩樣本k階中心矩

k=1,2,…它反映了總體k

階矩的信息它反映了總體k

階中心矩的信息它們的觀察值分別為:由大數(shù)定律可知:依概率收斂于例1.

從一批相同的電子元件中隨機地抽出8個,測得使用壽命(單位:小時)分別為:2300,2430,2580,2400,2280,1960,2460,2000,試計算樣本均值、樣本方差及樣本二階矩.解:抽樣分布

統(tǒng)計量是樣本的函數(shù),而樣本是隨機變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,它的分布稱為“抽樣分布”

.

二、統(tǒng)計學(xué)中三個常用分布和上α分位點下面介紹三個來自正態(tài)總體的抽樣分布.分布1、定義:

設(shè)相互獨立,都服從標準正態(tài)分布N(0,1),

則稱隨機變量:

所服從的分布為自由度為

n

的分布,記為分布的概率密度為在其中是函數(shù)處的值.n=1n=4n=10f(y)01357911131517x0.50.40.30.20.1有所改變.分布的概率密度圖形如下:顯然分布的概率密度圖形隨自由度的不同而性質(zhì)1.

設(shè)則證明:設(shè)相互獨立,則分布的性質(zhì):這個性質(zhì)稱為分布的可加性.性質(zhì)2.

設(shè)且與相互獨立,則t的概率密度為:

定義:

設(shè)X~N(0,1),Y~所服從的分布為自由度為n的t

分布.記為t~t(n).2、t分布,且X與Y相互獨立,則稱變量n=4n=10n=1t(x;n)t分布的概率密度函數(shù)關(guān)于t=0對稱,且當n充分大時(n≥30),其圖形與標準正態(tài)分布的概率密度函數(shù)的圖形非常接近.但對于較小的n,t分布與N(0,1)分布相差很大.由定義可見,3、F分布則稱統(tǒng)計量服從自由度為n1及n2的F分布,n1稱為第一自由度,~F(n2,n1)定義:

設(shè)X與Y相互獨立,n2稱為第二自由度,記作F~F(n1,n2).若X~F(n1,n2),則X的概率密度為注意:統(tǒng)計的三大分布的定義、基本性質(zhì)在后面的學(xué)習(xí)中經(jīng)常用到,要牢記!!4、上α分位點定義:設(shè)隨機變量X的概率密度為f(x),對于任意給定的α(0<α<1),若存在實數(shù)xα,使得:則稱點xα為該概率分布的上α分位點正態(tài)分布的上α分位點

對標準正態(tài)分布變量Z~N(0,1)和給定的,上分位數(shù)是由:P{Z≥z}=即P{Z<z}=1-(z)=1-確定點z.如圖:例如,=0.05,而P{Z≥1.645}=0.05所以,

z0.05=1.645.φ(x)xzαo說明:

1)除標準正態(tài)分布外,分布、t分布、F分布的上分位點都有表可查.

2)對于分布,當n充分大時(n>45),其中Zα是標準正態(tài)分布的上α分位點3)對于t分布a)由其對稱性,有:

b)當n充分大時(n>45),

4)對于F分布,有:例2.

查表求下列值:

解:,例3.設(shè)總體X和Y相互獨立,同服從分布,而X1,X2,…,X9和Y1,Y2,…,Y9的分布.分別是來自X和Y的簡單隨機樣本,求統(tǒng)計量解:X1,X2,…,X15是來自X的簡單隨機樣本,求例4.設(shè)總體X服從分布,而的分布.統(tǒng)計量解:例5

設(shè)總體為總體

X

的樣本,

試確定常數(shù)c,使解:故因此分布.cY服從

當總體為正態(tài)分布時,教材上給出了幾個重要的抽樣分布定理.這里我們不加證明地敘述.三、抽樣分布定理定理1

設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,則有(1)樣本均值(2)樣本均值與樣本方差相互獨立。(3)隨機變量定理2

設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有

定理3

(兩個總體樣本均值差的分布)且X與Y獨立,分別是這兩個樣本的樣本均值,自Y的樣本,分別是這兩個樣本的樣本方差,則有是取自X的樣本,X1,X2,…,Y1,Y2,…,是取

定理4(兩個總體樣本方差比的分布)且X與Y獨立,分別是這兩個樣本的樣本均值,Y的樣本,分別是這兩個樣本的樣本方差,則有X1,X2,…,是取自X的樣本,Y1,Y2,…,是取自上述4個抽樣分布定理很重要,要牢固掌握.的概率不小于90%,則樣本容量至少取多少?例6.設(shè),為使樣本均值大于70的概率解:設(shè)樣本容量為n,則令得即所以至少取例7.

從正態(tài)總體中,抽取了n=20的樣本解:

(1)即故(2)

故3掌握給出的四個抽樣分布定理。第六章小結(jié)1.給出了總體、個體、樣本和統(tǒng)計量的概念,要掌2.給出了分布、t分布、F分布的定義和性質(zhì),要會查表求其上α分位點。握樣本均值和樣本方差的計算及基本性質(zhì)。附:幾種重要隨機變量的數(shù)學(xué)期望和方差一.二點分布二.二項分布三.泊松分布四.均勻分布五.正態(tài)分布六.指數(shù)分布一.二點分布X01Pk1-p

p若隨機變量X服從二點分布,其分布律為:二.二項分布隨機變量X~B(n,p),其分布律為:由二項分布定義可知,X是n重貝努利試驗中事件A發(fā)生的次數(shù),且在每次試驗中A發(fā)生的概率為p,設(shè)則Xk服從二點分布,其分布律為:X01Pk

1-pp若隨機變量X~B(n,p),則即:三.泊松分布隨機變量,其分布律為:即:若隨機變量X~π(λ),則四.均勻分布設(shè)隨機變量X在區(qū)間(a,b)上服從均勻分布,其概率密度為即若隨機變量X~U(a,b),則五.正態(tài)分布隨機變量,其概率密度為:(令)(令)即若隨機變量X~N(μ,σ2),則六.指數(shù)分布隨機變量X服從參數(shù)為λ的指數(shù)分布,其概率密度為:若隨機變量X服從參數(shù)為λ的指數(shù)分布,則即例1.已知求解:則解:X在區(qū)間(1,5)上服從均勻分布,例2.已知X和Y相互獨立,且X在區(qū)間(1,5)上服從均勻分布,求(1)(X,Y)的概率密度;(2)由X和Y相互獨立得:

概率論中用來闡明大量隨機現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理,稱為大數(shù)定律第一節(jié)大數(shù)定律一個常數(shù),若對于任給的正數(shù)>0,總成立隨機變量序列依概率收斂于常數(shù)定義設(shè)是一個隨機變量序列,a是則稱隨機變量序列依概率收斂于a,記為性質(zhì)1.設(shè),g(x)是連續(xù)函數(shù),則2.設(shè)g(x,y)是二元連續(xù)函數(shù),則

設(shè)n重貝努里試驗中事件A發(fā)生的次數(shù)為μn,A在每次試驗中發(fā)生的概率為p

,則對任給的ε>0,總成立定理1(貝努利大數(shù)定律)即:三個常見的大數(shù)定律貝努里大數(shù)定律的意義在概率的統(tǒng)計定義中,事件A

發(fā)生的頻率“穩(wěn)定于”事件A在一次試驗中發(fā)生的概率是指:頻率與p有較大偏差大時可以用頻率近似代替p.是小概率事件,因而在n

足夠

貝努里大數(shù)定律提供了通過試驗來確定事件概率的方法.定理2(契比雪夫大數(shù)定律的特殊情形)

設(shè)隨機變量序列X1,X2,…相互獨立,并且具有相同的數(shù)學(xué)期望和方差,E(Xi)=μ,D(Xi)=σ2,i=1,2,…,則對任給的ε>0,總成立即定理2的意義

具有相同數(shù)學(xué)期望和方差的獨立隨機變量序列的算術(shù)平均值依概率收斂于數(shù)學(xué)期望.當

n

足夠大時,實驗結(jié)果的算術(shù)平均幾乎是一常數(shù).

因此,在實際應(yīng)用中,當試驗次數(shù)足夠大時,可用獨立重復(fù)試驗結(jié)果的算術(shù)平均數(shù)來估計隨機變量的數(shù)學(xué)期望.定理3(契比雪夫大數(shù)定律的一般情形)

設(shè)隨機變量序列X1,X2,…相互獨立,它們都具有數(shù)學(xué)期望:E(Xi)=μi,并且都具有被同一常數(shù)C所限制的方差:D(Xi)=<C,i=1,2,…,則對任給的ε>0,總成立即接近于其數(shù)學(xué)期望的算術(shù)平均的概率接近于1.即當n充分大時,

差不多不再是隨機的了,取值定理3的意義

定理表明,獨立隨機變量序列{Xn},如果方差有共與其數(shù)學(xué)期望小的概率接近于1.同的上界,則偏差很

設(shè)隨機變量序列X1,X2,…相互獨立,服從同一分布,具有相同的數(shù)學(xué)期望E(Xi)=μ,i=1,2,…,則對于任給正數(shù)ε>0,總成立定理4(辛欽大數(shù)定律)即推論

設(shè)隨機變量序列X1,X2,…相互獨立,服從同一分布,且具有相同的k階矩則對任給正數(shù)ε>0,總成立即這一節(jié)我們介紹了大數(shù)定律大數(shù)定律以嚴格的數(shù)學(xué)形式表達了隨機現(xiàn)象最根本的性質(zhì)之一:它是隨機現(xiàn)象統(tǒng)計規(guī)律的具體表現(xiàn).在理論和實際中都有廣泛的應(yīng)用.平均結(jié)果的穩(wěn)定性第二節(jié)中心極限定理

客觀背景:客觀實際中,許多隨機變量是由大量相互獨立的偶然因素的綜合影響所形成,每一個微小因素,在總的影響中所起的作用是很小的,但總起來,卻對總和有顯著影響,這種隨機變量往往近似地服從正態(tài)分布。

概率論中有關(guān)論證獨立隨機變量的和的極限分布是正態(tài)分布的一系列定理稱為中心極限定理。

由于無窮個隨機變量之和可能趨于∞,故我們不研究n個隨機變量之和本身而考慮它的標準化的隨機變量的極限分布.下面介紹常用的三個中心極限定理。定理1(獨立同分布下的中心極限定理)

設(shè)X1,X2,…是獨立同分布的隨機變量序列,且E(Xi)=μ,D(Xi)=σ2,i=1,2,…,則

定理表明:當n充分大時,標準化隨機變量近似服從標準正態(tài)分布.

由此可知:對于獨立的隨機變量序列,不管服從什么分布,只要它們是同分布,且有有限的數(shù)學(xué)期望和方差,那么,當n充分大時,這些隨機變量之和近似地服從正態(tài)分布(1)至少命中180發(fā)炮彈的概率;(2)命中的炮彈數(shù)不到200發(fā)的概率.例1.炮火轟擊敵方防御工事100

次,每次轟擊命中的炮彈數(shù)服從同一分布,其數(shù)學(xué)期望為2,均方差為1.5.若各次轟擊命中的炮彈數(shù)是相互獨立的,求100

次轟擊中解:設(shè)Xk

表示第

k次轟擊命中的炮彈數(shù),設(shè)X表示100次轟擊命中的炮彈數(shù),則由獨立同分布中心極限定理,有則相互獨立,又(1)(2)例2.一食品店有三種蛋糕出售,由于售出哪一種蛋糕是隨機的,因而售出一只蛋糕的價格是一個隨機變量,它取1(元),1.2(元),1.5(元)各值的概率分別為0.3,0.2,0.5.某天售出300只蛋糕.求這天的收入至少達400(元)的概率解:設(shè)第i只蛋糕的價格為Xi,i=1,2,…,300,則Xi的分布律為P11.21.5Xi0.30.20.5由獨立同分布中心極限定理知:即定理2(德莫佛-拉普拉斯中心極限定理)

設(shè)n重貝努利試驗中事件A發(fā)生的次數(shù)為μn,事件A在每次試驗中發(fā)生的概率為p,則對于任給實數(shù)x,總成立

定理表明:若服從二項分布,當n很大時,近似服從標準正態(tài)的標準化隨機變量

由此可知:當n很大,0<p<1是一個定值時(或者說,np(1-p)也不太小時),服從二項分布B(n,p)的隨機變量近似服從正態(tài)分布N(np,np(1-p)).分布.例3

某次課堂測驗,有200道選擇題,每一題有4個答案.試問一位完全不會的學(xué)生,想憑著猜測的方法回答此200題中的80題,而答對25題至30題的概率是多少?設(shè)答對的題數(shù)為X,則解:X~B(80,0.25),例4

某電視機廠每周生產(chǎn)10000臺電視機,但它的顯像管車間的正品率為0.8,為了能以0.997的概率保證出廠的電視機都裝上正品顯像管,該車間每周應(yīng)生產(chǎn)多少只顯像管?解:設(shè)該車間每周生產(chǎn)n只顯像管,其中正品的個數(shù)為X,則X~B(n,0.8),即:查表,知從而得:即該車間每周至少應(yīng)生產(chǎn)12655只顯像管,才能以0.997的概率保證出廠的電視機都裝上正品顯像管.定理3(李雅普諾夫中心極限定理)則第一節(jié)參數(shù)估計的意義和種類一、參數(shù)估計問題二、未知參數(shù)的估計量和估計值三、參數(shù)估計的種類

數(shù)理統(tǒng)計的基本問題是根據(jù)樣本提供的信息,對總體的分布以及分布的某些數(shù)字特征作出推斷。這個問題中的一類是總體分布的類型為已知,而它的某些參數(shù)為未知,根據(jù)所得樣本對這些參數(shù)作出推斷,這類問題稱為參數(shù)估計。如:一、參數(shù)估計問題

已知顯象管的使用壽命服從指數(shù)分布,但參數(shù)θ未知,現(xiàn)抽樣得樣本X1,X2,…,Xn,依據(jù)某理論(后述)用樣本來估計參數(shù)θ.這就是參數(shù)估計問題.二、未知參數(shù)的估計量和估計值樣本X1,X2,…,Xn

,樣本值x1,x2,…,xn

.設(shè)有一個總體X,其分布函數(shù)為F(x,θ),其中θ為未知參數(shù)(θ也可以是未知向量).現(xiàn)從該總體抽樣,得g(X1,X2,…Xn)為θ的估計量,將樣本值x1,x2,…,xn若構(gòu)造出適當?shù)慕y(tǒng)計量g(X1,X2,…Xn)來估計θ,則稱代入,則稱g(x1,x2,…xn)為θ的估計值.估計未知參數(shù)的值估計未知參數(shù)的取值范圍,并使此范圍包含未知參數(shù)真值的概率為給定的值.參數(shù)估計的種類點估計:區(qū)間估計三、參數(shù)估計的種類設(shè)這5個數(shù)是:1.651.671.681.781.69若估計μ為1.68,這是點估計.這是區(qū)間估計.若估計μ在區(qū)間(1.57,1.84)內(nèi),

現(xiàn)從該總體選取容量為5的樣本,我們的任務(wù)是要例如:我們要估計某隊男生的平均身高.且假定身高服從正態(tài)分布根據(jù)選出的樣本值(5個數(shù))求出總體均值μ的估計值.而全部信息就由這5個數(shù)組成.一、矩估計法第二節(jié)點估計的求法

二、極大似然估計法一.矩估計法理論依據(jù):記總體k階矩為樣本k階矩為(辛欽大數(shù)定律及其推論)則樣本k

階矩依概率收斂于總體k

階矩.

方法:出待估參數(shù).用樣本k

階矩估計總體k

階矩建立含有待估參數(shù)的方程,從而解樣本

X1,X2,…,Xn的前k

階矩記為步驟:設(shè)總體的分布函數(shù)的形式已知,待估參數(shù)為總體的前k

階矩存在.(1)求出總體的前k

階矩,一般是這k個參數(shù)的函函數(shù),記為:7-12(3)解此方程組,得

k

個統(tǒng)計量:

稱為未知參數(shù)

1,,k

的矩估計量這是含未知參數(shù)

1,2,,k

的k個方程構(gòu)成的方程組,(2)令7-12代入樣本值,得

k個數(shù):稱為未知參數(shù)

1,,k

的矩估計值例1.設(shè)總體X~B(m,p),

其中p未知,X1,X2,…,Xn為總體的樣本,求p的矩估計量.解:令7-13得總體矩樣本矩例2.設(shè)總體X的概率密度為解:X1,…,Xn為樣本,求參數(shù)的矩估計.令得總體矩樣本矩

例3.設(shè)X1,X2,…Xn是取自總體X的一個樣本其中θ>0,求θ,μ的矩估計.解:令解得用樣本矩估計總體矩由課文本節(jié)例1知:不論總體為何分布,總體均值的矩估計量總是總體方差的矩估計量總是例4.設(shè)從某燈泡廠某天生產(chǎn)的燈泡中隨機抽取10只燈泡,測得其壽命為(單位:小時)1050,1100,1080,1120,1200,1250,1040,1130,1300,1200,試用矩法估計該廠這天生產(chǎn)的燈泡的平均壽命及壽命分布的方差.解:7-14

二、極大似然估計法

即:在一次試驗中,概率最大的事件最有可能發(fā)生.引例:

有兩個外形相同的箱子,各裝100個球,一箱中取得的球是白球.問:所取的球來自哪一箱?答:

第一箱.中有99個白球1個紅球,一箱中有1個白球99個紅球?,F(xiàn)從兩箱中任取一箱,并從箱中任取一球,結(jié)果所

一般說,若事件A發(fā)生的概率與參數(shù)有關(guān),取值不同,P(A)也不同。則應(yīng)記事件A發(fā)生的概率為P(A|).若一次試驗,事件A發(fā)生了,可認為此時的值應(yīng)是在中使P(A|)達到最大的那一個。這就是極大似然原理.(極大似然原理)極大似然估計法的理論依據(jù):X1,X2,…Xn是取自總體X的樣本,x1,x2,…

xn是樣本值.則樣本的聯(lián)合分布律為:似然函數(shù):其中為未知待估參數(shù),1.X是離散型總體,其分布律為:記2.X是連續(xù)型總體,其概率密度為為其樣本的似然函數(shù).則稱稱為樣本的似然函數(shù).似然函數(shù)的值的大小實質(zhì)上反映的是該樣本值出現(xiàn)的可能性大小.極大似然估計的方法:對于給定的樣本值x1,x2,…,xn,選取使得其似然函數(shù)達到最大值。即求使得7-22稱為未知參數(shù)1,,k

的極大似然估計值這樣得到的估計值對應(yīng)的統(tǒng)計量稱為未知參數(shù)1,,k

的極大似然估計量(1)由總體分布和所給樣本,求得似然函數(shù)步驟:(2)求似然函數(shù)的對數(shù)函數(shù)函數(shù)(化積商為和差,而和同時取得最大值)(3)解方程組LLLLLLL7-12(4)得未知參數(shù)1,,k的極大似然估計值及其對應(yīng)的極大似然估計量7-12若待估參數(shù)只有一個,則似然函數(shù)是一元函數(shù)L(θ),此時,只須將上述步驟中求偏導(dǎo)改為求導(dǎo)即可。說明:例5.

設(shè)總體X服從參數(shù)為的泊松分布,求參數(shù)λ的極大似然估計量解:的樣本,樣本觀察值為由X服從泊松分布,得X的分布律為為從總體X中隨機抽取設(shè)似然函數(shù)為兩邊取對數(shù),得=0得對λ求導(dǎo),并令其為0,所以參數(shù)λ的極大似然估計量為:,其中λ>0總體X的樣本值,求參數(shù)λ的極大似然估計值.例6.

設(shè)總體X的概率密度為為待估參數(shù),a>0是已知常數(shù),是取自解:兩邊取對數(shù),得對λ求導(dǎo),并令其為0,得這就是λ的極大似然估計值.其中θ是未知參數(shù),3,1,3,0,3,1,2,3,是來自總體X的樣本觀察值,求參數(shù)θ的極大似然估計值.例7.

設(shè)總體X的分布律解:兩邊取對數(shù),得對θ求導(dǎo),并令其為0,=0得和因為不合題意,所以θ的極大似然估計值為1.可證明極大似然估計具有下述性質(zhì):設(shè)θ的函數(shù)g=g(θ)是上的實值函數(shù),且有唯一反函數(shù).如果是θ的極大似然估計,則g()也是g(θ)的極大似然估計.關(guān)于極大似然估計的兩點說明:此性質(zhì)稱為極大似然估計的不變性例8.

設(shè)X1X2,…,Xn為取自參數(shù)為θ的指數(shù)分布總體的樣本,a>0為一給定實數(shù)。求p=P{X<a}的極大似然估計解:概率密度和分布函數(shù)分別為由總體X服從參數(shù)為θ的指數(shù)分布知,X的兩邊取對數(shù),得對θ求導(dǎo),并令其為0,得θ的極大似然估計值為因為所以,p=P{X<a}的極大似然估計值為2、當似然函數(shù)不是可微函數(shù)時,須用極大似然原理來求待估參數(shù)的極大似然估計.例9.

設(shè)X~U(a,b),x1,x2,…,xn是

X

的一個樣本值,求

a,b的極大似然估計值與極大似然估計量.解:由X~U(a,b)知,X的密度函數(shù)為似然函數(shù)為似然函數(shù)只有當a<xi<b,i=1,2,…,n時才能獲得最大值,且a越大,b越小,L(a,b)越大.令xmin=min{x1,x2,…,xn}xmax=max{x1,x2,…,xn}取則對滿足的一切a<b,都有故是a,b的極大似然估計值.分別是a,b的極大似然估計量.,其中為待估參數(shù),是取自總體X

的樣本值,例10.

設(shè)總體X的概率密度為的矩估計值和極大似然估計值.

求參數(shù)解:令得θ的矩估計值:(1)矩估計兩邊取對數(shù),得(2)極大似然估計得θ的極大似然估計值:對θ求導(dǎo),并令其為0,

通過例10可見,對同一個待估參數(shù),用不同的方法進行點估計,可能得到不同的估計量.這樣就有必要判斷哪一個估計量更好,這就是下一節(jié)要講的內(nèi)容:評價估計量優(yōu)良性的標準一、無偏性二、有效性三、一致性第三節(jié)估計量的評選標準一、無偏性隨機變量,每次抽樣后得到的θ的估計值不一定與提出了無偏性的衡量標準。由于未知參數(shù)θ的估計量是真值θ相吻合,其誤差為我們自然希望平均誤差為零,即也就是說這就定義:設(shè)是未知參數(shù)的估計量,若則稱是

的無偏估計量.

總體X服從什么分布,樣本的k階矩例1.設(shè)總體X的k階矩存在,是總體X的一個樣本,試證明:不論是總體k階矩的無偏估計.證明:由于X1,X2,…,Xn和總體X同分布,因而所以樣本的k階矩是總體k階矩的無偏估計例2.設(shè)總體X的期望與方差存在,X的樣本為(1)不是D(X)的無偏估量;(2)是D(X)的無偏估計量.證明:先證明(n>1).證明所以因而所以

不是D(X)的無偏估計量;所以是D(X)的無偏估計量.例3.已知泊松總體,驗證樣本方差是λ的無偏估計,并對于任一值α也是λ的無偏估計.由總體為知:證明:由上例可知:所以樣本方差是λ的無偏估計又則所以也是λ的無偏估計.

由上例我們可知,一個未知參數(shù)有時會有多個無偏估計,這就又產(chǎn)生了一個問題:哪一個無偏估計量更優(yōu)呢?設(shè)和都是θ的無偏估計量,即兩個估計量小的那一個,這就有了有效性的衡量標準.

和都圍繞著θ波動,我們自然選擇波動幅度都是總體參數(shù)

的無偏估計量,且則稱比更有效.

設(shè)二、有效性定義(2)試判斷g1和g2哪一個更有效?例4.已知總體的數(shù)學(xué)期望和方差都存在,X1,X2,X3是總體的樣本.設(shè)(1)證明g1和g2都是的無偏估計解:(1)所以,g1和g2都是的無偏估計(2)因為所以g1較g2更有效.(2)求常數(shù)k1和k2,使得它在所有形如的無偏估計量中方差最小.(1)常數(shù)k1和k2為何值時,也是θ的無偏估計量.例5.設(shè)和是參數(shù)θ的兩個相互獨立的無偏估計量,且的方差為的方差的兩倍.解:由題意知:(1)令得(2)羅—克拉美(Rao–Cramer)不等式若是參數(shù)

的無偏估計量,則其中p(x,)是總體X的分布律或概率密度,稱計量,此時稱為最有效的估計量,簡稱有效估計量.為方差的下界.當時,稱為的達到方差下界的無偏估例6.設(shè)(0-1)總體中參數(shù)p為未知,證明是參數(shù)p的無偏、有效估計量.證明:

因為總體X是(0-1)分布,即:

而所以是參數(shù)p的無偏估計量且又所以是參數(shù)p的有效估計量

參數(shù)的估計量是樣本的函數(shù),與樣本容量n有關(guān),我們當然希望,樣本容量n越大,估計量與參數(shù)的真值的偏差越小.這就有了一致性的衡量標準.三、一致性設(shè)是總體參數(shù)的估計量.則稱是總體參數(shù)的一致(或相合)估計量.若對于任意的,當n時,依概率收斂于,定義即對于任意正數(shù)ε,有一致性是對一個估計量的基本要求,若估計量不具有一致性,那么不論將樣本容量n取得多么大,都不能將θ估計得足夠準確,這樣的估計量是不可取的.證明:例7.設(shè)總體X服從參數(shù)為的指數(shù)分布,證明是的無偏、有效、一致估計量.由總體X服從參數(shù)為的指數(shù)分布可知:而故是的有效無偏估計量.又由辛欽大數(shù)定律可知:所以是的無偏、有效、一致估計量.關(guān)于一致性的兩個常用結(jié)論1.樣本k階矩是總體k

階矩的一致估計量.由大數(shù)定律證明用契比雪夫不等式證明一般,矩估計法得到的估計量為一致估計量.2.設(shè)是的無偏估計量且則是

的一致估計量.

我們已講了參數(shù)的點估計以及評價估計量優(yōu)良性的標準,參數(shù)的點估計是用一個確定的值去估計未知的參數(shù).但是,估計值與參數(shù)真值的誤差有多大?估計值的可靠性有多大?這些問題在點估計中是無法回答的。這就需要引入?yún)^(qū)間估計.也就是下一節(jié)要講的內(nèi)容.一、假設(shè)檢驗問題的提出二、顯著性檢驗的推理方法和基本步驟三、兩類錯誤第一節(jié)假設(shè)檢驗的基本概念

假設(shè)檢驗是統(tǒng)計推斷中另一類重要內(nèi)容。它是在總體分布未知或雖知其分布類型但含有未知參數(shù)的時候,提出有關(guān)總體分布或分布中某些未知參數(shù)的假設(shè)。然后根據(jù)樣本所提供的信息,推斷假設(shè)是否合理,并作出接受或拒絕所提出假設(shè)的決定。

為了具體了解假設(shè)檢驗解決哪些類型的問題,下面看幾個例子:一、假設(shè)檢驗問題的提出產(chǎn)記錄中隨機地抽取n=25的樣本,算得平均含硅例1.

某煉鐵廠生產(chǎn)的生鐵含硅量X服從正態(tài)分布N(0.005,0.032)。現(xiàn)改變原料,并從改變原料后的生后生鐵含硅量的均值有無顯著變化?量,均方差σ沒有改變,問改變原料

此實例的問題是:根據(jù)抽樣的結(jié)果推斷假設(shè)“

”是否為真。

此實例的問題是:根據(jù)抽樣的結(jié)果來推斷假設(shè)“總體服從泊松分布”是否為真。實例2.某電話交換臺在一分鐘內(nèi)得到的呼喚次數(shù)統(tǒng)計的記錄如下:試檢驗電話呼喚次數(shù)X

是否服從泊松分布?呼喚次數(shù)0123456≥7頻數(shù)81617106210總體分布已知,對未知參數(shù)提出的假設(shè)進行檢驗.總體分布未知,對總體分布形式或類型的假設(shè)進行檢驗.假設(shè)檢驗的種類參數(shù)假設(shè)檢驗:非參數(shù)假設(shè)檢驗:假設(shè)檢驗的種類

在假設(shè)檢驗問題中,把要檢驗的假設(shè)稱為原假設(shè)(零假設(shè)或基本假設(shè)),記為H0,把原假設(shè)的對立面稱為備擇假設(shè)或?qū)α⒓僭O(shè),記為H1

。原假設(shè)H0和備擇假設(shè)H1兩者中必有且僅有一個為真。二、顯著性檢驗的推理方法和基本步驟實例.某廠生產(chǎn)的螺釘,按標準,平均強度應(yīng)為68mm,實際生產(chǎn)的強度X服從N(,3.62),現(xiàn)從整批螺釘中取容量為n=36的樣本,其均值為,問這批螺釘是否符合要求?若=68,則認為這批螺釘符合要求,否則認為不符合要求.為此提出如下假設(shè):原假設(shè)備擇假設(shè)若原假設(shè)H0正確,則因而應(yīng)是小概率事件.應(yīng)較集中在零的周圍.即取較大值標準化后,

偏離68不應(yīng)該太遠,乎不發(fā)生的.根據(jù)小概率原理,小概率事件在一次試驗中是幾那么,概率小到什么程度才能算作“小概率事件”呢?此小概率記為α,一般取為0.1,0.05,0.01等.為此,可以確定一個常數(shù)c使得然后,計算若即一次試驗小概率事件就發(fā)生了,可以認為原假設(shè)不合理,拒絕原假設(shè)H0而接受備擇假設(shè)H1.否則,接受原假設(shè)H0而拒絕備擇假設(shè)H1.此時,稱區(qū)間為的H0的拒絕域.現(xiàn)取,原假設(shè)為真時,

因為小概率事件沒發(fā)生,無理由認為原假設(shè)不合理,所以,接受原假設(shè)H0,認為這批螺釘是符合要求的.所以(稱U為檢驗統(tǒng)計量)由此例可見:1.假設(shè)檢驗的理論依據(jù):實際推斷原理(小概率原理)小概率事件在一次試驗中幾乎是不可能發(fā)生的2.假設(shè)檢驗是概率意義下的反證法.即:首先假定原假設(shè)H0成立,依照事先給定的概率α(稱為顯著性水平),構(gòu)造一個小概率事件。然后根據(jù)抽樣的結(jié)果,觀察此小概率事件是否發(fā)生。若此小概率事件發(fā)生了,則認為原假設(shè)是不真的,從而作出拒絕H0的判斷。否則,就接受H0。由此可見:

拒絕原假設(shè)是有說服力的,而接受原假設(shè)是沒有說服力的.3.不否定H0并不是肯定H0一定對,而只是說差異還不夠顯著,還沒有達到足以否定H0的程度.因此應(yīng)把希望否定的假設(shè)作為原假設(shè).假設(shè)檢驗的一般步驟:(1)根據(jù)實際問題的要求,充分考慮和利用已知的背景知識,提出原假設(shè)H0及備擇假設(shè)H1

;(2)給定顯著性水平α,選取檢驗統(tǒng)計量,并確定其分布;(3)由P{拒絕H0|H0為真}=α確定H0的拒絕域的形式;(4)由樣本值求得檢驗統(tǒng)計量的觀察值,若觀察值在拒絕域內(nèi),則拒絕原假設(shè)H0,否則接受原假設(shè)H0.假設(shè)檢驗的兩類錯誤第一類錯誤(棄真錯誤):第二類錯誤(取偽錯誤):三、兩類錯誤原假設(shè)H0為真,但拒絕了原假設(shè)H0.原假設(shè)H0不真,但接受了原假設(shè)H0.P{拒絕H0|H0為真}=α,P{接受H0|H0不真}=β.顯然,顯著性水平α為犯第一類錯誤的概率.記處理原則:

任何檢驗方法都不能完全排除犯錯誤的可能性.理想的檢驗方法應(yīng)使犯兩類錯誤的概率都很小,但在樣本容量固定時,一類錯誤概率的減少必會導(dǎo)致另一類錯誤概率的增加.

控制犯第一類錯誤的概率,然后,若有必要,通過增大樣本容量的方法來減少犯第二類錯誤的概率

.關(guān)于原假設(shè)與備擇假設(shè)的選取H0與H1地位應(yīng)平等,但在控制犯第一類錯誤的概率的原則下,使得采取拒絕H0的決策變得較慎重,即H0得到特別的保護.因而通常把有把握的、有經(jīng)驗的結(jié)論作為原假設(shè),或者盡可能使后果嚴重的錯誤成為第一類錯誤.注:一、單一正態(tài)總體均值μ的假設(shè)檢驗二、單一正態(tài)總體方差σ2的假設(shè)檢驗三、兩個正態(tài)總體均值的假設(shè)檢驗四、兩個正態(tài)總體方差的假設(shè)檢驗第二節(jié)正態(tài)總體的假設(shè)檢驗一、單一正態(tài)總體均值μ的假設(shè)檢驗1.已知時,總體均值μ

的假設(shè)檢驗(1)μ的雙邊檢驗:設(shè)總體X~N(,

2).X1,X2,…,Xn是取自X的樣本,樣本均值樣本方差S2原假設(shè)備擇假設(shè)取檢驗統(tǒng)計量:則拒絕域為:~N(0,1)當H0為真時,此時,因為是μ0的無偏估計量,不應(yīng)太大.P{拒絕H0|H0為真}所以即:由此知,拒絕域為:推導(dǎo):(2)μ的單邊檢驗:原假設(shè)備擇假設(shè)檢驗統(tǒng)計量:拒絕域為:統(tǒng)計中把拒絕域在某個區(qū)間的兩側(cè)的檢驗稱為雙邊檢驗(這里是區(qū)間的兩側(cè))(a)(證明略)原假設(shè)備擇假設(shè)檢驗統(tǒng)計量:拒絕域為:統(tǒng)計中把拒絕域在某個區(qū)間的某一側(cè)的檢驗稱為單邊檢驗(這里是區(qū)間的某一側(cè))(b)

這里由于使用的是服從正態(tài)分布的U

統(tǒng)計量來進行檢驗,也稱為U

檢驗法(或正態(tài)檢驗法)。0000

<

0

>

0U檢驗法(02已知)原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗0000

<

0

>

0T檢驗法(2未知)原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗2.未知時,總體均值μ

的假設(shè)檢驗例1.設(shè)某次考試的考生的成績服從正態(tài)分布,從中隨機地抽取36位考生的成績,算得平均成績?yōu)?6.5分,標準差為15分,問在顯著性水平0.05下,是否可以認為在這次考試中全體考生的平均成績?yōu)?0分?解:原假設(shè)備擇假設(shè)檢驗統(tǒng)計量:拒絕域:n=36,α=0.05,所以接受H0,在顯著性水平0.05下,可以認為在這次考試中全體考生的平均成績?yōu)?0分。因為解:原假設(shè)備擇假設(shè)由σ2=0.022知,檢驗統(tǒng)計量為拒絕域:

例2.一臺機床加工軸的橢圓度X服從正態(tài)分布N(0.095,0.022)(單位:mm)。機床經(jīng)調(diào)整后隨機取20根測量其橢圓度,算得mm。已知總體方差不變,問調(diào)整后機床加工軸的橢圓度的均值有無顯著降低?n=20,α=0.05,所以接受H0,

在顯著性水平0.05下,認為調(diào)整后機床加工軸的橢圓度的均值無顯著降低.因為

例3.某種電子元件,要求使用壽命不得低于1000小時?,F(xiàn)從一批這種元件中隨機抽取25件,測其壽命,算得其平均壽命950小時,設(shè)該元件的壽命X~N(μ,1002),在顯著性水平0.05下,確定這批元件是否合格?解:原假設(shè)備擇假設(shè)由σ2=1002知,檢驗統(tǒng)計量為拒絕域:n=25,α=0.05,所以拒絕H0,在顯著性水平0.05下,認為這批元件不合格.因為χ2

檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗1.已知時,總體方差σ2的假設(shè)檢驗二、單一正態(tài)總體方差σ2的假設(shè)檢驗當H0為真時,P{拒絕H0|H0為真}所以拒絕域為:推導(dǎo)(雙邊檢驗情形):此時,因為是σ2的無偏估計量,拒絕域應(yīng)表現(xiàn)為偏小或偏大,χ2

檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗2.μ未知時,總體方差σ2的假設(shè)檢驗例4.

在生產(chǎn)線上隨機地取10只電阻測得電阻值(單位:歐姆)如下:114.2,91.9,107.5,89.1,87.2,87.6,95.8,98.4,94.6,85.4設(shè)電阻的電阻值總體服從正態(tài)分布,問在顯著性水平α=0.1下方差與60是否有顯著差異?解:原假設(shè)備擇假設(shè)檢驗統(tǒng)計量:拒絕域:n=10,α=0.1,所以接受H0,因為即在顯著性水平α=0.1下,認為方差與60無顯著差異.例5.

某種導(dǎo)線,要求其電阻的標準差不得超過0.005歐姆,今在生產(chǎn)的一批導(dǎo)線中取樣本9根,測得s=0.007歐姆.設(shè)總體服從正態(tài)分布,參數(shù)均未知,問在顯著性水平α=0.05下,能否認為這批導(dǎo)線的標準差顯著地偏大?解:原假設(shè)備擇假設(shè)檢驗統(tǒng)計量:拒絕域:n=9,α=0.05,所以拒絕H0,因為即在顯著性水平α=0.05下,認為這批導(dǎo)線的標準差顯著地偏大.三、兩個正態(tài)總體均值的假設(shè)檢驗為取自總體

N(112)的樣本,為取自總體N(2

22)

的樣本,分別表示兩樣本的樣本均值與樣本方差且兩總體相互獨立。121

2121

21

<

21

>

2U檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗1.已知時,總體均值的假設(shè)檢驗121

2121

21

<

21

>

2原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗2.未知,但時,總體均值的假設(shè)檢驗T檢驗法例6.測得兩批小學(xué)生的身高(單位:厘米)為:第一批:140,138,143,142,144,137,141第二批:135,140,142,136,138,140.設(shè)這兩個相互獨立的總體都服從正態(tài)分布,且方差相同,試判斷這兩批學(xué)生的平均身高是否相等(α=0.10)。解:原假設(shè)檢驗統(tǒng)計量:拒絕域:備擇假設(shè)α=0.10所以接受H0,因為認為這兩批學(xué)生的平均身高是相等的.例7.某校從經(jīng)常參加體育鍛煉的男生中隨機地選出50名,測得平均身高174.34cm,從不經(jīng)常參加體育鍛煉的男生中隨機地選出50名,測得平均身高172.42cm,統(tǒng)計資料表明兩種男生的身高都服從正態(tài)分布,其標準差分別為5.35cm和6.11cm,問該校經(jīng)常參加體育鍛煉的男生是否比不經(jīng)常參加體育鍛煉的男生平均身高要高些?(α=0.05)解:原假設(shè)檢驗統(tǒng)計量:拒絕域:備擇假設(shè)所以拒絕H0,因為認為該校經(jīng)常參加體育鍛煉的男生比不經(jīng)常參加體育鍛煉的男生平均身高要高些.F

檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗1.已知時,總體方差的假設(shè)檢驗四、兩個正態(tài)總體方差的假設(shè)檢驗F

檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗2.未知時,總體方差的假設(shè)檢驗例8.設(shè)兩家銀行儲戶的年存款余額均服從正態(tài)分布,經(jīng)市場調(diào)查,分別抽取容量為21和16的樣本,得樣本均值分別為650元和800元,樣本方差分別為802和702,能否認為第二家銀行儲戶的平均年存款余額顯著高于第一家銀行儲戶的平均年存款余額。(α=0.10)解:檢驗統(tǒng)計量:拒絕域:(1)先檢驗兩家銀行儲戶的年存款余額的方差有無顯著性差異。原假設(shè)備擇假設(shè)α=0.10所以接受H0,因為認為兩家銀行儲戶的年存款余額的方差無顯著性差異.原假設(shè)檢驗統(tǒng)計量:拒絕域:備擇假設(shè)(2)再檢驗第二家銀行儲戶的平均年存款余額是否顯著高于第一家銀行儲戶的平均年存款余額。α=0.10所以拒絕H0,因為

認為第二家銀行儲戶的平均年存款余額顯著高于第一家銀行儲戶的平均年存款余額第三節(jié)(0-1)總體參數(shù)p的大樣本檢驗

在實際問題中,經(jīng)常會遇到要對(0-1)總體中參數(shù)p進行檢驗的問題。這時,一般是抽取大容量(n>30)的樣本,利用中心極限定理,對參數(shù)p進行假設(shè)檢驗.

下面先用此方法對雙邊檢驗進行假設(shè)檢驗,然后推廣到單邊檢驗。已知總體X服從(0-1)分布,其分布律為現(xiàn)抽取容量為n(n>30)的樣本X1,X2,…,Xn,樣本均值為則對參數(shù)p

的雙邊檢驗:極限定理可知:當原假設(shè)為真時,由獨立同分布中心原假設(shè)備擇假設(shè)得:因為是p的達到方差界的無偏估計,所以U的為|U|偏大。即拒絕域應(yīng)形如:設(shè)顯著性水平為α,由值應(yīng)較集中在零附近,而的拒絕域應(yīng)體現(xiàn)pp0pp0pp0pp0p<

p0p

>

p0U檢驗法原假設(shè)

H0備擇假設(shè)

H1檢驗統(tǒng)計量拒絕域類型雙邊檢驗單邊檢驗例1.

某藥廠在廣告上聲稱該藥品對某種疾病的治愈率為80%,一家醫(yī)院對這種藥品臨床使用120例,治愈85人,問該藥品的廣告是否真實(α=0.02)?解:由于n=120為大樣本,設(shè)隨機變量X為則X~(0-1)分布.原假設(shè)備擇假設(shè)檢驗統(tǒng)計量為拒絕域:α=0.02,所以拒絕H0,因為認為該藥品的廣告不真實.例2.

若在猜硬幣正反面的游戲中,某人在100次試猜中共猜中60次,是否可以認為此人有訣竅?(α=0.05)解:由于n=100為大樣本,設(shè)隨機變量X為則X~(0-1)分布.原假設(shè)備擇假設(shè)檢驗統(tǒng)計量為拒絕域:α=0.05,若有訣竅,則猜中的概率p應(yīng)大于1/2.所以拒絕H0,因為可以認為此人猜硬幣有某種訣竅。第三節(jié)單因素方差分析

在第八章第二節(jié)中,我們討論了兩個方差相等的正態(tài)總體對均值比較的假設(shè)檢驗問題,而在實際應(yīng)用中還經(jīng)常需要對有相同方差的多個正態(tài)總體均值進行比較的假設(shè)檢驗問題.方差分析就是解決這類問題的有效方法,在實際中有著廣泛的應(yīng)用。一、基本概念二、單因素方差分析的數(shù)學(xué)模型四、部分總體均值μj和方差σ2的估計三、單因素方差分析的假設(shè)檢驗一、基本概念

我們將要考察的對象的某種特征稱為指標,影響指標的各種因素稱為因子,一般將因子控制在幾個不同的狀態(tài)上,每一個狀態(tài)稱為因子的一個水平.

若一項試驗中只有一個因子在改變,而其它的因子保持不變,稱這樣的試驗為單因素試驗.多于一個因子在改變的的試驗為多因素試驗.這里,我們只討論單因素試驗.實例1.對某種型號的電池進行抽查,隨機抽取了來自A,B,C三個工廠的產(chǎn)品,測得其壽命(h)見下表,設(shè)各工廠所生產(chǎn)的電池的壽命服從有相同方差的正態(tài)分布,問這三個工廠所生產(chǎn)的電池的平均壽命有無顯著差異?電池的壽命(h)A1A2A3374740606095869867926910098

試驗的目的是為了考察不同廠家生產(chǎn)的電池平均壽命是否有顯著差異。如果有顯著差異,表明生產(chǎn)工廠這一因子對電池壽命的影響是顯著的.在此實例中,指標:電池的壽命;因子:生產(chǎn)電池的工廠;水平:工廠A1、A2、A3

在此試驗中,除生產(chǎn)電池的工廠這一因子外,其它因子不變,這是一個單因素試驗。實例2.為了比較各個工作日進入某一商場的顧客人數(shù),測得各工作日下午4時~5時進入商場的顧客人數(shù)如下表,問各個工作日對顧客人數(shù)有無顯著影響?工作日顧客人數(shù)周一周二周三周四周五869678661007710254986991867482788478779084727484889410296

試驗的目的是為了考察不同工作日顧客的人數(shù)是否有顯著差異。如果有顯著差異,表明工作日這一因子對顧客人數(shù)的影響是顯著的.在此實例中,指標:顧客人數(shù);因子:工作日;水平:周一、周二、周一、周四、周五

在此試驗中,除工作日這一因子外,其它因子不變,這是一個單因素試驗。二、單因素方差分析的數(shù)學(xué)模型

設(shè)在單因素試驗中,影響指標的因子A有s個水平A1,

A2

,…,As

,將每個水平Aj下要考察的指標作為一個總體稱為部分總體,仍記為Aj,則共有s個總體,假設(shè)假設(shè)前提:

2)部分總體的方差都相等,即:其中和都是未知參數(shù)。1)每個部分總體都服從正態(tài)分布,即:3)不同的部分總體下的樣本是相互獨立的。在水平Aj下進行nj次獨立試驗,得樣本則記稱其為隨機誤差,則由此得:單因素方差分析的數(shù)學(xué)模型:各個隨機誤差相互獨立,和未知.對每個水平Aj下的樣本引進統(tǒng)計量:樣本和:樣本均值:將單因素試驗的數(shù)據(jù)列表如下:樣本總均值:單因素試驗數(shù)據(jù)表T.1T.2…T.s樣本和T.jx11x12…x1s

x21x22…x2s·

·

··

·

…··

·

·xn11xn22…xnss樣本值

…A1A2…As部分總體樣本均值(1)檢驗假設(shè):不全相等.(2)求出未知參數(shù)和的估計量單因素方差分析的任務(wù):根據(jù)樣本提供的信息,三、單因素方差分析的假設(shè)檢驗

單因素方差分析法是將樣本全部偏差的平方和分解成兩個平方和,通過這兩個平方和之間的比較,導(dǎo)出假設(shè)檢驗的統(tǒng)計量和拒絕域.偏差平方和及其分解總平方和:效應(yīng)(組間)平方和:說明:SA反映了在每個水平下的樣本均值與樣本總均值的差異,它是由因子A取不同水平引起的,所以,稱SA是因子A的效應(yīng)(組間)平方和.誤差(組內(nèi))平方和:平方和分解公式:說明:SE表示在每個水平下的樣本值與該水平下的樣本均值的差異,它是由隨機誤差引起的,所以,稱SE是誤差(組內(nèi))平方和.證明:又所以即:總平方和=效應(yīng)(組間)平方和+誤差(組內(nèi))平方和SA和SE

的統(tǒng)計特征在單因素方差分析的模型下,(2)SA和SE相互獨立。(3)為真時,定理:(1)由定理(1),有即結(jié)合定理(1)(2)(3),有ST,SA,SE

的計算方法記化簡得單因素方差分析的假設(shè)檢驗:(1)提出統(tǒng)計假設(shè)不全相等.(2)取假設(shè)統(tǒng)計量(3)拒絕域:說明:如果組間差異比組內(nèi)差異大得多,則說明各水平間有顯著差異,H0不真。單因素方差分析的假設(shè)檢驗的步驟:(1)提出統(tǒng)計假設(shè)不全相等.(2)編制單因素試驗數(shù)據(jù)表(3)根據(jù)數(shù)據(jù)表計算(4)填制單因素方差分析表單因素方差分析表n-1ST總和SA/s-1SE/n-ss-1n-sSASE因子A隨機誤差臨界值F值均方自由度平方和方差來源(5)檢驗,若否則接受H0

,認為因子A對指標沒有顯著影響.則拒絕H0,例1.在顯著性水平α=0.01下,用單因素方差分析法判斷實例1中,三個工廠所生產(chǎn)的電池的平均壽命有無顯著差異?解:提出統(tǒng)計假設(shè)不全相等.編制單因素試驗數(shù)據(jù)表18446

37

6069478610040679860929598樣本和樣本值

樣本均值A(chǔ)1A2A3部分總體4982678389單因素方差分析表總和因子A隨機誤差臨界值F值均方自由度平方和方差來源所以拒絕H0,因為認為三個工廠所生產(chǎn)的電池的平均壽命有顯著差異.四、部分總體均值μj和方差σ2的估計前面已說明:又所以可以證明,例2.試驗4種不同的農(nóng)藥,觀察它們的殺蟲率有無明顯的不同,試驗結(jié)果如下表所示:部分總體A1A2A3A4樣本值87.485.080.290.588.587.394.756.262.455.048.21)在顯著性水平α=0.01下,問4種農(nóng)藥的殺蟲率的均值是否有明顯不同?2)分別求4種不同農(nóng)藥的殺蟲率的均值和方差的估計值。解:編制單因素試驗數(shù)據(jù)表252.6

87.4

90.5

56.2

55.085.088.562.448.280.287.3

94.7

樣本和樣本值樣本均值A(chǔ)1A2A3A4部分總體84.236190.2559.3118.6103.251.6(1)提出統(tǒng)計假設(shè)不全相等.單因素方差分析表所以拒絕H0,因為總和因子A隨機誤差臨界值F值均方自由度平方和方差來源認為4種農(nóng)藥的殺蟲率的均值是有明顯不同的.(2)第四節(jié)分布函數(shù)的擬合優(yōu)度檢驗

前面幾節(jié)中討論了總體分布形式已知時關(guān)于總體參數(shù)的假設(shè)檢驗。但在許多實際問題中并不能預(yù)先知道總體分布的形式。這時,就需要根據(jù)樣本提供的信息,對總體的分布作出假設(shè),并對此假設(shè)進行檢驗。本節(jié)我們將介紹由英國統(tǒng)計學(xué)家卡爾·皮爾遜提出的擬合優(yōu)度檢驗法。擬合優(yōu)度檢驗法的基本原理和步驟:1.提出原假設(shè)H0:總體X

的分布函數(shù)為F(x)備擇假設(shè)H1:總體X

的分布函不是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論