分布類型的檢驗(yàn)_第1頁
分布類型的檢驗(yàn)_第2頁
分布類型的檢驗(yàn)_第3頁
分布類型的檢驗(yàn)_第4頁
分布類型的檢驗(yàn)_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

分布類型的檢驗(yàn)第1頁/共52頁第10章分布類型的檢驗(yàn)10.1假設(shè)檢驗(yàn)的基本思想10.2正態(tài)分布檢驗(yàn)10.3二項(xiàng)分布檢驗(yàn)10.4游程檢驗(yàn)10.5本章小結(jié)第2頁/共52頁第11章連續(xù)變量的統(tǒng)計(jì)推斷(一)——t檢驗(yàn)

11.1

t檢驗(yàn)基礎(chǔ)

11.2樣本均數(shù)與總體均數(shù)的比較

11.3成組設(shè)計(jì)兩樣本均數(shù)的比較

11.4配對設(shè)計(jì)樣本均數(shù)的比較

11.5本章小結(jié)第3頁/共52頁10.1假設(shè)檢驗(yàn)的基本思想10.1.1問題的提出10.1.2假設(shè)檢驗(yàn)的基本思想10.1.3假設(shè)檢驗(yàn)的兩類錯(cuò)誤10.1.4假設(shè)檢驗(yàn)中的其他問題第4頁/共52頁10.1.1問題的提出在總體的分布函數(shù)完全未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服正態(tài)分布的假設(shè);對正態(tài)總體提出均值等于a0的假設(shè)等等。假設(shè)檢驗(yàn)就是根據(jù)樣本對所提出的假設(shè)作出判斷:是接受,還是拒絕。第5頁/共52頁10.1.1問題的提出假設(shè)檢驗(yàn)是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。第6頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想如何利用樣本值對一個(gè)具體的假設(shè)進(jìn)行檢驗(yàn)?通常借助于直觀分析和理論分析相結(jié)合的做法,其基本原理就是人們在實(shí)際問題中經(jīng)常采用的所謂小概率反證法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次試驗(yàn)中基本上不會(huì)發(fā)生。第7頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如可能性小,則認(rèn)為假設(shè)不成立,若可能性大,則還不能認(rèn)為假設(shè)不成立。第8頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想先要根據(jù)問題的題意或者對總體分布的未知參數(shù)提出個(gè)原假設(shè),比如某正態(tài)總體的均值等于5(a=5)。這種原假設(shè)也稱為零假設(shè)(nullhypothesis),記為H0?;蛘邔傮w分布的形式做出假設(shè),例如總體服從正態(tài)分布。前者屬于參數(shù)假設(shè)檢驗(yàn),后者屬于非參數(shù)假設(shè)檢驗(yàn)。第9頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想與此同時(shí)必須提出備選假設(shè)(或稱為備擇假設(shè),alternativehypothesis),比如總體均值大于5(a>5)。備選假設(shè)記為H1a。備選假設(shè)應(yīng)該按照實(shí)際世界所代表的方向來確定,即它通常是被認(rèn)為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實(shí)。比如上面的H1為a>5;這意味著,至少樣本均值應(yīng)該大于5;第10頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想至于是否顯著,依檢驗(yàn)結(jié)果而定。檢驗(yàn)結(jié)果顯著(significant)意味著有理由拒絕零假設(shè)。因此,假設(shè)檢驗(yàn)也被稱為顯著性檢驗(yàn)(significanttest)。第11頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想有了兩個(gè)假設(shè),就要根據(jù)數(shù)據(jù)來對它們進(jìn)行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計(jì)量;它在檢驗(yàn)中被稱為檢驗(yàn)統(tǒng)計(jì)量(teststatistic)。根據(jù)零假設(shè)(不是備選假設(shè)?。?,可得到該檢驗(yàn)統(tǒng)計(jì)量的分布;再看這個(gè)統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)值(realization)屬不屬于小概率事件。第12頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想也就是說把數(shù)據(jù)代入檢驗(yàn)統(tǒng)計(jì)量,看其值是否落入零假設(shè)下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說“該檢驗(yàn)顯著?!狈駝t說“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗(yàn)不顯著。”第13頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想在零假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量取其實(shí)現(xiàn)值及(沿著備選假設(shè)的方向)更加極端值的概率稱為p-值(p-value)。如果得到很小的p-值,就意味著在零假設(shè)下小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當(dāng)然多半是相信數(shù)據(jù),拒絕零假設(shè)。第14頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想但小概率并不能說明不會(huì)發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯(cuò)誤常被稱為第一類錯(cuò)誤(typeIerror)。在備選假設(shè)正確時(shí)反而說零假設(shè)正確的錯(cuò)誤,稱為第二類錯(cuò)誤(typeIIerror)。第15頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想零假設(shè)和備選假設(shè)哪一個(gè)正確,是確定性的,沒有概率可言。而可能犯錯(cuò)誤的是人。涉及假設(shè)檢驗(yàn)的犯錯(cuò)誤的概率就是犯第一類錯(cuò)誤的概率和犯第二類錯(cuò)誤的概率。負(fù)責(zé)任的態(tài)度是無論做出什么決策,都應(yīng)該給出該決策可能犯錯(cuò)誤的概率。第16頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想到底p-值是多小時(shí)才能夠拒絕零假設(shè)呢?也就是說,需要有什么是小概率的標(biāo)準(zhǔn)。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計(jì)書和軟件中,使用最多的標(biāo)準(zhǔn)是在零假設(shè)下(或零假設(shè)正確時(shí))根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設(shè)的概率應(yīng)小于0.05,當(dāng)然也可能是0.01,0.005,0.001等等。第17頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想這種事先規(guī)定的概率稱為顯著性水平(significantlevel),用字母alpha來表示。alpha并不一定越小越好,因?yàn)檫@很可能導(dǎo)致不容易拒絕零假設(shè),使得犯第二類錯(cuò)誤的概率增大。第18頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想當(dāng)p-值小于或等于alpha時(shí),就拒絕零假設(shè)。所以,alpha是所允許的犯第一類錯(cuò)誤概率的最大值。當(dāng)p-值小于或等于alpha時(shí),拒絕原假設(shè)H0,就說這個(gè)檢驗(yàn)是顯著的。無論統(tǒng)計(jì)學(xué)家用多大的alpha作為顯著性水平都不能脫離實(shí)際問題的背景。統(tǒng)計(jì)顯著不一定等價(jià)于實(shí)際顯著。反過來也一樣。第19頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想實(shí)際上,多數(shù)計(jì)算機(jī)軟件僅僅給出p-值,這有很多方便之處。比如alpha=0.05,而假定所得到的p-值等于0.001。這時(shí)如果采用p-值作為新的顯著性水平,即新的alpha=0.001,于是就可以說,在顯著性水平為0.001時(shí),拒絕零假設(shè)。第20頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想這樣,拒絕零假設(shè)時(shí)犯錯(cuò)誤的概率實(shí)際只是千分之一而不是舊的alpha所表明的百分之五。在這個(gè)意義上,p-值又稱為觀測的顯著性水平(observedsignificantlevel)。在統(tǒng)計(jì)軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫“Sig”就是這個(gè)道理。第21頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想歸納起來,假設(shè)檢驗(yàn)的一般步驟為:1.寫出零假設(shè)和備選假設(shè);2.確定檢驗(yàn)統(tǒng)計(jì)量;3.確定顯著性水平;4.根據(jù)數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值;5.根據(jù)這個(gè)實(shí)現(xiàn)值計(jì)算p-值;第22頁/共52頁10.1.2假設(shè)檢驗(yàn)的基本思想6.進(jìn)行判斷:如果p-值小于或等于alpha,就拒絕零假設(shè),這時(shí)犯(第一類)錯(cuò)誤的概率最多為alpha;如果p-值大于alpha,就不拒絕零假設(shè),因?yàn)樽C據(jù)不足。第23頁/共52頁10.1.4假設(shè)檢驗(yàn)中的其他問題(1)做假設(shè)檢驗(yàn)之前,應(yīng)注意資料本身是否有可比性。(2)當(dāng)差別有統(tǒng)計(jì)學(xué)意義時(shí)應(yīng)注意這樣的差別在實(shí)際應(yīng)用中有無意義。(3)根據(jù)資料類型和特點(diǎn)選用正確的假設(shè)檢驗(yàn)方法。(4)根據(jù)專業(yè)及經(jīng)驗(yàn)確定是選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。第24頁/共52頁10.1.4假設(shè)檢驗(yàn)中的其他問題(5)當(dāng)檢驗(yàn)結(jié)果為拒絕無效假設(shè)時(shí),應(yīng)注意有發(fā)生I類錯(cuò)誤的可能性,即錯(cuò)誤地拒絕了本身成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是知道的,即檢驗(yàn)水準(zhǔn)那么大;當(dāng)檢驗(yàn)結(jié)果為不拒絕無效假設(shè)時(shí),應(yīng)注意有發(fā)生II類錯(cuò)誤的可能性,即仍有可能錯(cuò)誤地接受了本身就不成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯(cuò)誤的大小有關(guān)系。第25頁/共52頁10.1.4假設(shè)檢驗(yàn)中的其他問題(6)判斷結(jié)論時(shí)不能絕對化,應(yīng)注意無論接受或拒絕檢驗(yàn)假設(shè),都有判斷錯(cuò)誤的可能性。(7)報(bào)告結(jié)論時(shí)是應(yīng)注意說明所用的統(tǒng)計(jì)量,檢驗(yàn)的單雙側(cè)及P值的確切范圍。第26頁/共52頁10.2正態(tài)分布檢驗(yàn)

10.2.1

K-S檢驗(yàn)的原理

10.2.2分析實(shí)例第27頁/共52頁10.2.1

K-S檢驗(yàn)的原理單樣本的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn),柯爾莫哥諾夫-斯米爾諾夫檢驗(yàn))是用來檢驗(yàn)一個(gè)數(shù)據(jù)的觀測累積分布是否是已知的理論分布。設(shè)總體X~F(x),F(xiàn)(x)是未知的,F(xiàn)0(x)是一個(gè)給定的分布函數(shù),欲檢驗(yàn)H0:F(x)=F0(x)第28頁/共52頁10.2.1

K-S檢驗(yàn)的原理由于當(dāng)n較大時(shí),理論上有經(jīng)驗(yàn)分布函數(shù)Fn(x)是F(x)的良好近似。構(gòu)造Kolmogorov–Smirnov統(tǒng)計(jì)量來反映F(x)和F0(x)之間的差異,若D較小,表明二者間沒有顯著差異,否則有顯著差異。第29頁/共52頁10.2.1

K-S檢驗(yàn)的原理Kolmogorov–Smirnov證明了統(tǒng)計(jì)量D的極限分布為Q()分布,計(jì)算出記為Z值,并根據(jù)極限分布計(jì)算出相應(yīng)的顯著性概率若Sig.小于給點(diǎn)的顯著性水平alpha,則拒絕H0,否則,接受H0.第30頁/共52頁10.2.2分析實(shí)例例12.1請判斷SPSS自帶數(shù)據(jù)集anxity.sav中score的分布是否服從正態(tài)分布。操作如下:AnalyzeNonparametictest1-sampleK-STestvariablelist框:選入scoreTestdistribution復(fù)選框組:選中normal復(fù)選框單擊OK鈕系統(tǒng)給出的統(tǒng)計(jì)分析結(jié)果,具體如下:第31頁/共52頁數(shù)據(jù)文件第32頁/共52頁操作過程第33頁/共52頁由于p=Sig.=0.652>0.05,故接受原假設(shè),認(rèn)為score服從正態(tài)分布。第34頁/共52頁

變量名Score樣本量

48正態(tài)分布參數(shù)均數(shù)10.00

標(biāo)準(zhǔn)差5.17最極端的差異絕對值.106

正值.088

負(fù)值-.106K-S檢驗(yàn)的統(tǒng)計(jì)量Z值

.735近似P值(雙側(cè))

.652第35頁/共52頁注意K-S檢驗(yàn)可以檢驗(yàn)正態(tài)分布,均勻分布,泊松分布,指數(shù)分布。第36頁/共52頁10.3二項(xiàng)分布檢驗(yàn)10.3.1二項(xiàng)分布檢驗(yàn)的原理10.3.2分析實(shí)例第37頁/共52頁10.3.1二項(xiàng)分布檢驗(yàn)的原理當(dāng)一個(gè)變量只取0,1值時(shí),稱為二分值變量。當(dāng)一個(gè)問題只有兩種可能結(jié)果時(shí),稱為二分值問題。二分值問題的一種結(jié)果稱為“成功”,另一種稱為“失敗”。二項(xiàng)分布檢驗(yàn)(BinomialTest)就是對二分值問題的成功概率進(jìn)行檢驗(yàn)。第38頁/共52頁10.3.1二項(xiàng)分布檢驗(yàn)的原理設(shè)S+表示對二分值問題進(jìn)行n次試驗(yàn)中成功的次數(shù)。例如用同樣的方法擲一枚硬幣100次,出現(xiàn)正面44次,出現(xiàn)反面56次,問該硬幣是否均勻?該例中S+=44,S-=56,檢驗(yàn)假設(shè)為:H0:p=p0=0.5當(dāng)H0為真時(shí),S+服從參數(shù)為P0的二項(xiàng)分布。第39頁/共52頁10.3.1二項(xiàng)分布檢驗(yàn)的原理計(jì)算S+的值,并根據(jù)二項(xiàng)分布計(jì)算相應(yīng)的顯著性概率Sig.,若Sig.小于給定的顯著性水平alpha,則拒絕H0,否則接受拒絕H0。因?yàn)槭腔诙?xiàng)分布的概率進(jìn)行判斷,所以此種檢驗(yàn)法稱為二項(xiàng)分布檢驗(yàn)法。當(dāng)試驗(yàn)總次數(shù)n較大時(shí),S+近似服從正態(tài)分布。所以往往根據(jù)正態(tài)分布計(jì)算Sig.的近似值。第40頁/共52頁10.3.2分析實(shí)例例10.6根據(jù)以往經(jīng)驗(yàn),新生兒染色體異常率一般為1%,現(xiàn)某醫(yī)院觀察了當(dāng)?shù)毓?00名新生兒,只發(fā)現(xiàn)一例染色體異常。數(shù)據(jù)見binominal.sav,該地新生兒染色體異常率是否低于一般?第41頁/共52頁10.3.2分析實(shí)例原假設(shè):H0:p=0.01,異常率并無不同備擇假設(shè):H1:p<0.01,異常率低于一般加權(quán):DataWeightCases:頻數(shù)numAnalyzeNonparametricTests->BinomialTestVariable:染色體異常率illTestProportion:0.01第42頁/共52頁10.3.2分析實(shí)例Sig=.090(按正態(tài)分布近似計(jì)算)>0.05,不能拒絕原假設(shè),尚不能認(rèn)為異常率低于一般。第43頁/共52頁10.4游程檢驗(yàn)10.4.1游程檢驗(yàn)的原理10.4.2分析實(shí)例第44頁/共52頁10.4.1游程檢驗(yàn)的原理游程檢驗(yàn)(Runstest)與二項(xiàng)分布檢驗(yàn)都是對二分值問題進(jìn)行檢驗(yàn),但它不是對“成功”概率進(jìn)行檢驗(yàn),而是檢驗(yàn)多個(gè)二分值問題之間是否相互獨(dú)立?原假設(shè)H0:多個(gè)二分值問題之間獨(dú)立游程檢驗(yàn)是基于游程數(shù)的多少來檢驗(yàn),那么什么是游程呢?第45頁/共52頁10.4.1游程檢驗(yàn)的原理游程就是0,1序列中0或者1的連續(xù)段,即0或1的每個(gè)連續(xù)段稱為一個(gè)游程。設(shè)天氣預(yù)報(bào)記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對以后天氣是否下雨有無影響?易知該記錄總游程數(shù)U=11。第46頁/共52頁10.4.1游程檢驗(yàn)的原理如果原假設(shè)H0成立,則0,1序列交替均勻,從而總游程數(shù)U較大,否則U較小。所以,我們可以通過總游程數(shù)U的大小來判斷H0是否成立。選擇U為檢驗(yàn)統(tǒng)計(jì)量,當(dāng)樣本數(shù)n較大時(shí),U近似服從正態(tài)分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論