




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第四章參數(shù)估計與假設檢驗
第一節(jié)參數(shù)估計的一般問題參數(shù)估計的意義何在?◆人們往往先假定某數(shù)據(jù)來自一個特定的總體族(比如正態(tài)分布族);◆而要確定是總體族的哪個成員(也就是其具體分布)則需要知道總體參數(shù)值(比如總體均值和總體方差);◆于是,人們希望用相應的樣本統(tǒng)計量(比如樣本均值和樣本方差)來估計出相應的總體參數(shù),從而能夠確定總體的分布形態(tài)。一、統(tǒng)計量、估計量、估計值
估計:根據(jù)現(xiàn)有信息對現(xiàn)實世界進行某種判斷。估計量:樣本的(不包含未知總體參數(shù)的)函數(shù)稱為統(tǒng)計量;用于估計總體參數(shù)的統(tǒng)計量稱為估計量(estimator,估計子),如用于估計總體參數(shù)的樣本均值、樣本比率(成數(shù))、樣本方差等。由于一個統(tǒng)計量對于不同的樣本取值不同,所以估計量也是隨機變量,并有其分布。第一節(jié)參數(shù)估計的一般問題估計值:如果樣本已經(jīng)得到,把數(shù)據(jù)帶入之后,估計量就有了一個數(shù)值,稱為該估計量的一個實現(xiàn)(realization)或取值,也稱為一個估計值(estimate)??梢?,統(tǒng)計量是樣本的函數(shù),是對樣本的一個變換。我們之所以進行這種變換,是希望用這個統(tǒng)計量去估計總體的某個參數(shù),或者實現(xiàn)我們的其他目的,比如要檢驗某一個假設。不過,在實際轉(zhuǎn)換的過程中,一般來說,會有一定的信息損失,也就是說,統(tǒng)計量包含的信息比原始樣本本身包含的信息要少。第一節(jié)參數(shù)估計的一般問題這樣,就可能出現(xiàn)兩種結(jié)果:
一種結(jié)果是,抓住了問題的實質(zhì),刪繁就簡,只丟掉了一些無關(guān)要旨的東西,保存了樣本中關(guān)于所要估計的總體參數(shù)的全部信息;另一種結(jié)果是,把樣本中關(guān)于所要估計的總體參數(shù)的信息喪失了或喪失很多,因此從這個統(tǒng)計量出發(fā)對總體參數(shù)進行推斷,還不如從樣本本身對總體進行推斷。如果這個統(tǒng)計量滿足第一種情況,我們就說它是充分統(tǒng)計量。第一節(jié)參數(shù)估計的一般問題二、點估計與區(qū)間估計點估計(pointestimation):用估計量的實現(xiàn)值來近似相應的總體參數(shù)。區(qū)間估計(intervalestimation):給出包括估計量在內(nèi)(有時是以估計量為中心)的一個區(qū)間;該區(qū)間被認為很可能包含總體參數(shù)。點估計給出一個數(shù)字,用起來很方便;而區(qū)間估計給出一個區(qū)間,說起來留有余地;不像點估計那么絕對。第一節(jié)參數(shù)估計的一般問題三、點估計用什么樣的估計量來估計參數(shù)呢?沒有限制。任何統(tǒng)計量,只要人們覺得合適就可以當成估計量。比如,一位專家來學校進行評估,想了解《概率論與數(shù)理統(tǒng)計》的考試情況,在食堂碰到你,問:你們班這門課的平均成績大概是多少?你說:不太清楚。他只好又問:那你考了多少?你說:38。第一節(jié)參數(shù)估計的一般問題三、點估計那么,什么樣的估計量才算合適呢?從理論上來說,一個合適的估計量至少要具備如下特點:
1、要能夠知道其概率分布;
2、要能夠根據(jù)現(xiàn)有條件算出估計量的值。那么,怎么樣比較不同估計量之間的好壞呢?第一節(jié)參數(shù)估計的一般問題1、無偏性(unbiasedness)
所謂無偏性,就是指我們所選定的估計量的數(shù)學期望等于被估計量,這時統(tǒng)計量的值才能在真實值上下擺動,從而保證用它來估計被估計參數(shù)在理論上沒有偏差。在統(tǒng)計中,人們一般不用樣本方差S2n來估計總體方差,正是因為用樣本方差S2n來估計總體方差是有偏(差)的,而用樣本修正方差S2n-1來估計總體方差是沒有偏(差)的。第一節(jié)參數(shù)估計的一般問題樣本修正方差的無偏性:一個統(tǒng)計實驗第一節(jié)參數(shù)估計的一般問題第一節(jié)參數(shù)估計的一般問題
2、一致性(consistency,相合性)
隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)。即:
設為未知參數(shù)θ的估計量,當n→∞時,要求依概率收斂于θ,即第一節(jié)參數(shù)估計的一般問題
2、一致性(consistency)第一節(jié)參數(shù)估計的一般問題
3、有效性(efficiency)
若和均為的無偏估計,且,則稱無偏估計比更有效。若是的無偏估計的最有效者,即具有最小方差,則稱是的最小方差無偏估計。有效性要求估計量的方差要盡可能地小。第一節(jié)參數(shù)估計的一般問題四、區(qū)間估計(IntervalEstimation)
當描述一個人的體重時,你一般可能不會說這個人是76.35公斤,你會說這個人是七八十公斤,或者是在70公斤到80公斤之間。這個范圍就是區(qū)間估計的例子。第一節(jié)參數(shù)估計的一般問題置信度與置信區(qū)間:置信度的概念是大量重復抽樣時的一個漸近概念。類似于“我們目前得到的置信度為95%的置信區(qū)間以概率0.95覆蓋總體真值”的說法是錯誤的。實際上應該說“重復類似的抽樣所得到的大量區(qū)間中有大約95%的覆蓋總體真值(該真值可能永遠未知)。第一節(jié)參數(shù)估計的一般問題
這里的置信區(qū)間(如72,78)是固定的,而總體真值也是固定的值。因此只有兩種可能:或者該區(qū)間包含總體比例,或者不包含;這當中沒有任何概率可言。至于區(qū)間(72,78)是否覆蓋總體真值,除非一個不漏地調(diào)查所有的人,否則永遠也無法知道。第一節(jié)參數(shù)估計的一般問題一、總體方差已知時對總體均值進行區(qū)間估計例
CJW公司是一家專營體育設備和附件的郵購公司。該公司竭盡全力向顧客提供最優(yōu)質(zhì)的服務。為了監(jiān)控公司的服務質(zhì)量,CJW公司每月都要隨機地抽取一個郵購顧客的樣本,并與被抽到的樣本中的每個顧客進行聯(lián)系,詢問他們一系列有關(guān)CJW公司服務水平的問題,根據(jù)顧客給出的答案計算出該顧客的滿意分數(shù),這些分數(shù)的范圍從0分(可能的最差等級)到100分(可能的最好等級)。在此基礎上,公司進一步計算出滿意分數(shù)的樣本均值作為CJW公司所有顧客總體的滿意分數(shù)均值的點估計。第二節(jié)總體指標的區(qū)間估計
前面每個月的調(diào)查顯示:盡管各個月的樣本滿意分數(shù)的均值都有變化,但是,滿意分數(shù)的標準差卻穩(wěn)定在20分左右。因此,我們就假定總體的標準差為20分。最近,CJW公司對100名顧客進行了調(diào)查,結(jié)果表明:顧客滿意分數(shù)的樣本均值為82。試給出滿意分數(shù)總體均值的區(qū)間估計(置信度95%)。
解:根據(jù)題意可知,n=100,總體標準差σ=20,樣本均值為82。根據(jù)中心極限定理可知,。因此可反查標準正態(tài)分布表求解。第二節(jié)總體指標的區(qū)間估計第二節(jié)總體指標的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計二、總體方差未知時對總體均值進行區(qū)間估計當總體服從正態(tài)分布、方差б2未知時,則用樣本方差代替б2??紤]到樣本方差S2的有偏性和樣本修正方差的無偏性,為提高推斷的準確性,用樣本修正方差S2n-1來代替б2進行估計。第二節(jié)總體指標的區(qū)間估計考察統(tǒng)計量
在T中,分子,分母。因此,T~t(n-1)。因此,要以95%的置信度求出μ的置信區(qū)間,只需借鑒б2已知的做法,反查t分布表,找到一個對稱區(qū)間[-t,t],使P(-t﹤T﹤t)=0.95即可。第二節(jié)總體指標的區(qū)間估計經(jīng)整理,總體均值μ的置信區(qū)間為:在大樣本情況下,也可以用正態(tài)分布代替t分布,也就是用Zα/2代替上式中的tα/2即可。第二節(jié)總體指標的區(qū)間估計
練習:下表是工商07級1班、2班某門課的考試成績。試根據(jù)該樣本數(shù)據(jù)求管理學院2007級學生該門課程成績均值的置信區(qū)間(置信度為95%)。第二節(jié)總體指標的區(qū)間估計
思考:如果這樣做正確的話,隱含的前提假設是什么?第二節(jié)總體指標的區(qū)間估計總體方差未知時對總體均值進行區(qū)間估計:當總體服從正態(tài)分布、方差б2未知時,則用樣本方差代替б2??紤]到樣本方差S2的有偏性和樣本修正方差的無偏性,為提高推斷的準確性,用樣本修正方差S2n-1來代替б2進行估計。
考慮:在這里,我們?yōu)槭裁匆印翱傮w服從正態(tài)分布”這個條件,要是總體不服從正態(tài)分布呢?會有什么問題?第二節(jié)總體指標的區(qū)間估計三、正態(tài)總體方差的區(qū)間估計
1、總體均值μ已知時的區(qū)間估計
2、總體均值μ未知時的區(qū)間估計第二節(jié)總體指標的區(qū)間估計
例從自動機床加工的零件中抽取10件,測得其長度為(單位:mm):12.5,12.12,12.01,12.28,12.09,12.03,12.01,12.11,12.06,12.14。設零件長度服從正態(tài)分布,求零件長度的方差的置信區(qū)間(置信度95%)。解:第二節(jié)總體指標的區(qū)間估計四、兩正態(tài)總體均值差的區(qū)間估計對于兩個相互獨立的正態(tài)總體N(μ1,σ12)、N(μ2,σ22),其樣本均值差
1、σ12、σ22都已知時μ1-μ2的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計
2、σ12=σ22=σ2,但σ2未知時μ1-μ2的區(qū)間估計
第二節(jié)總體指標的區(qū)間估計
同理,在大樣本條件下,。因此,總體比例也可參照總體均值的方法進行估計。第二節(jié)總體指標的區(qū)間估計一、假設檢驗的基本思想第三節(jié)假設檢驗的一般問題一、假設檢驗的基本思想
參數(shù)估計和假設檢驗是統(tǒng)計推斷的兩種方法,只不過角度不同。假設檢驗的基本思路是:事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷是否能推翻原假設。我認為該企業(yè)生產(chǎn)的零件的平均長度為4厘米!第三節(jié)假設檢驗的一般問題一、假設檢驗的基本思想假設檢驗的特點:
采用邏輯上的反證法;
依據(jù)統(tǒng)計上的小概率原理。第三節(jié)假設檢驗的一般問題
例:某廠生產(chǎn)一種標準件,其長度為4厘米,標準差為0.1厘米。進行工藝改革后,抽查了100個零件,測得樣本平均長度為3.94厘米。試以95%的把握程度,檢驗該廠進行工藝改革前后生產(chǎn)的標準件的長度是否發(fā)生了顯著變化。
解:1、區(qū)間估計的方法~Z(0,1);P(-1.96<<1.96)=0.95
即:-1.96<μ<+1.963.94-1.96×0.1/10<μ<3.94+1.96×0.1/10
計算得:3.9204<μ<3.9596
可見,工藝改革后該廠的標準件長度發(fā)生了顯著變化。第三節(jié)假設檢驗的一般問題
解:2、假設檢驗的方法假設工藝改革后標準件長度沒有明顯變化,也即μ=4厘米。應有:
即P(-1.96<<1.96)=0.95
此為小概率事件。小概率事件發(fā)生說明原假設是錯誤的,工藝改革前后標準件長度發(fā)生了顯著變化。第三節(jié)假設檢驗的一般問題二、假設檢驗的過程均值
X=20
總體
我認為人口的平均年齡是50歲1、提出假設
拒絕假設別無選擇3、作出決策
2、抽取隨機樣本
第三節(jié)假設檢驗的一般問題二、假設檢驗的過程假設檢驗的具體步驟:第一,提出原假設(nullhypothesis)和備擇假設(alternativehypothesis);第二,確定合適的檢驗統(tǒng)計量;第三,規(guī)定顯著性水平α;第四,根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值;第五,統(tǒng)計決策。第三節(jié)假設檢驗的一般問題原假設的設定原則:在假設檢驗中,一般要設立一個原假設(nullhypothesis);而設立該假設的動機主要是企圖利用人們掌握的反映現(xiàn)實世界的數(shù)據(jù)來找出假設和現(xiàn)實的矛盾,從而否定這個假設。也就是說,假設檢驗都是以否定原假設為目標。如否定不了,那就說明證據(jù)不足,無法否定原假設。但這不等于原假設正確,而是“沒有足夠證據(jù)拒絕原假設”,因此不能“接受原假設”。第三節(jié)假設檢驗的一般問題需要注意的問題:
1、零假設和備擇假設在我們設計的假設檢驗中并不對稱。檢驗統(tǒng)計量的分布是從零假設導出的。第三節(jié)假設檢驗的一般問題第三節(jié)假設檢驗的一般問題需要注意的問題:
2、多數(shù)軟件直接給出p值,而不給出α。p值(p-value)是在零假設下,檢驗統(tǒng)計量取其實現(xiàn)值及(沿著備擇假設的方向)更加極端值的概率。如果p值很小,意味著在零假設下小概率事件發(fā)生。給定p值有很多方便之處。比如α=0.05,而假定所得到的p值等于0.001。這時如果采用p值作為新的顯著性水平,即新的α=0.001,于是就可以說,在顯著性水平為0.001時,拒絕零假設。這樣,拒絕零假設時犯錯誤的概率實際只是α=0.001而不是原來的α=0.05。在這個意義上,p值又稱為觀測的顯著性水平(observedsignificantlevel),或者一個原假設可被拒絕的最低(最小)顯著性水平。第三節(jié)假設檢驗的一般問題需要注意的問題:
3、對于同一個假設檢驗問題,往往都有多個檢驗統(tǒng)計量;而且人們還在構(gòu)造更優(yōu)良的檢驗統(tǒng)計量。人們不可能把所有的目前存在的和將來可能存在的檢驗都實施。因此,只能夠說,按照目前的證據(jù),不足以拒絕零假設而已。后面將會用例子說明“接受零假設”的說法是不妥當?shù)摹5谌?jié)假設檢驗的一般問題三、假設檢驗的兩類錯誤(決策風險)第一類錯誤:拒真錯誤。原假設為真,但由于樣本的隨機性落入拒絕區(qū)域,使我們做出錯誤決策。小概率事件只是發(fā)生的概率很小,但并非絕對不發(fā)生。犯這類錯誤的概率就是小概率事件發(fā)生的概率。第二類錯誤:納偽錯誤。原假設為假,但由于樣本的隨機性落入接受區(qū)域,使我們做出錯誤決策。在樣本容量一定時,降低犯第一類錯誤的概率,就會增大犯第二類錯誤的概率。要同時降低犯第一類錯誤和第二類錯誤的概率,必須增大樣本容量。第三節(jié)假設檢驗的一般問題陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確H0檢驗決策實際情況H0為真H0為假接受H01-a第二類錯誤(b)拒絕H0第一類錯誤(a)功效(1-b)假設檢驗就好像一場審判過程假設檢驗過程H0:無罪第三節(jié)假設檢驗的一般問題一、總體均值的假設檢驗(一)總體方差已知時總體均值的假設檢驗
例:公司欲購進一批零件。根據(jù)合同規(guī)定,零件使用壽命平均不能低于1000天。為檢驗零件質(zhì)量,公司隨機抽取100個,測得平均壽命為960天。若零件使用壽命服從正態(tài)分布,標準差為60天。公司是否該購買這批零件?(顯著性水平
=0.05)第四節(jié)總體指標的假設檢驗
解:假設H0:
≥1000;H1:
<1000。則~Z(0,1)查表可知,P(>-1.645)=1-0.05
經(jīng)計算,可見該廠的零件平均壽命低于1000天,不應購買。第四節(jié)總體指標的假設檢驗思考:
1、該假設檢驗的拒絕域如何確定?
2、該假設檢驗的P值(p-value)應如何計算?一、總體均值的假設檢驗(二)總體方差未知時總體均值的假設檢驗
當總體服從正態(tài)分布、方差б2未知時,則用樣本方差S2代替б2。考慮到S2的有偏性和樣本修正方差S2n-1=
的無偏性,為提高推斷的準確性,用S2n-1代替б2進行檢驗。第四節(jié)總體指標的假設檢驗
在大樣本情況下,變量T的分子,分母服從。因此,有T~t(n-1)。
同時,對上式進行變形,還有:
因此,也可以直接用樣本方差的數(shù)據(jù)來進行檢驗。第四節(jié)總體指標的假設檢驗
考慮:在這里,我們?yōu)槭裁匆印翱傮w服從正態(tài)分布”這個條件,要是總體不服從正態(tài)分布呢?會有什么問題?第四節(jié)總體指標的假設檢驗
例:自動裝車系統(tǒng)裝車的重量服從正態(tài)分布,每車標準重量為1000噸。某日隨機抽查9車,測得樣本平均重量為986噸,樣本標準差為24噸。試問在0.05的顯著性水平上,能否認為這天自動裝車系統(tǒng)工作不正常?
解:假設H0:
=1000;H1:
≠1000。則~t(n-1)計算得:==-1.65
查表知,當自由度為8時,P(-2.306≤T≤2.306)=1-0.05??梢?,沒有理由認為自動裝車系統(tǒng)工作不正常。第四節(jié)總體指標的假設檢驗思考:
1、該假設檢驗的拒絕域如何確定?
2、該假設檢驗的P值(p-value)應如何計算?
例:一個大米加工廠賣給超市一批標明10kg重的大米。而該超市懷疑該廠家缺斤短兩,對10包大米進行了稱重,得到下列數(shù)據(jù)(單位:千克):9.93,9.83,9.76,9.95,10.07,9.89,10.03,9.97,9.89,9.87。這里假定打包的大米重量服從正態(tài)分布。由于發(fā)生分歧,于是大米加工廠老板、大米加工廠律師、超市分別對大米重量的均值進行了檢驗。第四節(jié)總體指標的假設檢驗1、加工廠老板取了樣本的頭兩個數(shù)—9.93和9.83進行t檢驗,通過計算得:樣本均值9.88kg,p=0.1257,因此在α=0.05的水平上“接受零假設”;
2、超市用樣本全部數(shù)據(jù)進行t檢驗,計算得到:樣本均值9.92kg,p=0.0106,因此在α=0.05的水平上“拒絕零假設”;第四節(jié)總體指標的假設檢驗3、加工廠律師用了全部數(shù)據(jù),但使用中位數(shù)符號檢驗(注意對于正態(tài)分布,對中位數(shù)的檢驗等價于對均值的檢驗),通過計算得到:p=0.0547,因此在α=0.05的水平上“接受零假設”。并認為,“既然三個檢驗中有兩個都接受零假設,就應該接受”。第四節(jié)總體指標的假設檢驗評價:
1、加工廠老板實際上減少了作為證據(jù)的數(shù)據(jù),因此使得“證據(jù)不足,無法拒絕零假設”,而不應該“接受零假設”;
2、律師雖用了全部數(shù)據(jù),但用了不同的方法。他也只能夠說“在這個檢驗方法下,證據(jù)不足以拒絕零假設”而不能說“接受零假設”;第四節(jié)總體指標的假設檢驗評價:
3、對于同一個檢驗問題,可能有多種檢驗方法,但只要有一個拒絕,就應該拒絕。那些不能拒絕的檢驗方法是能力
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025買賣合同格式范本
- 禽類飼養(yǎng)回收合同范本
- 脂肪肝的護理診斷及措施
- 2025年網(wǎng)絡設備采購合同合同范本
- 2025合資股份借款合同協(xié)議書范本
- 2025年標準合同文本:員工聘用合同簡化版示例
- 紙品銷售合同范本
- 外賣站施工合同范本
- 賣車分期合同范本
- 2025建筑工程設計委托合同
- 2023年鄭州黃河護理職業(yè)學院單招職業(yè)適應性測試題庫及答案解析
- 環(huán)境信息系統(tǒng)的GIS基礎 01講 GIS導論
- DCS集散型控制系統(tǒng)安裝調(diào)試施工方案
- 教學設計 分數(shù)的基本性質(zhì) 全國一等獎
- GB/T 35856-2018飛機電氣設備絕緣電阻和耐電壓試驗方法
- GA/T 487-2020橡膠減速丘
- 母乳喂養(yǎng)知識理論知識考核試題及答案
- 因私出國(境)管理有關(guān)政策的解讀課件
- 液壓挖掘機操作手冊-DH60-7-
- 市政工程監(jiān)理平行檢驗表格(參考版)
- 重癥醫(yī)學科診療常規(guī)
評論
0/150
提交評論