




已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三部分常用假設(shè)檢驗(yàn)方法,第10章分布類型的檢驗(yàn),10.1假設(shè)檢驗(yàn)的基本思想10.2正態(tài)分布檢驗(yàn)10.3二項(xiàng)分布檢驗(yàn)10.4游程檢驗(yàn)10.5本章小結(jié),第11章連續(xù)變量的統(tǒng)計(jì)推斷(一)t檢驗(yàn),11.1t檢驗(yàn)基礎(chǔ)11.2樣本均數(shù)與總體均數(shù)的比較11.3成組設(shè)計(jì)兩樣本均數(shù)的比較11.4配對(duì)設(shè)計(jì)樣本均數(shù)的比較11.5本章小結(jié),10.1假設(shè)檢驗(yàn)的基本思想,10.1.1問題的提出10.1.2假設(shè)檢驗(yàn)的基本思想10.1.3假設(shè)檢驗(yàn)的兩類錯(cuò)誤10.1.4假設(shè)檢驗(yàn)中的其他問題,10.1.1問題的提出,在總體的分布函數(shù)完全未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服正態(tài)分布的假設(shè);對(duì)正態(tài)總體提出均值等于a0的假設(shè)等等。假設(shè)檢驗(yàn)就是根據(jù)樣本對(duì)所提出的假設(shè)作出判斷:是接受,還是拒絕。,10.1.1問題的提出,假設(shè)檢驗(yàn)是用來(lái)判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計(jì)推斷方法。,10.1.2假設(shè)檢驗(yàn)的基本思想,如何利用樣本值對(duì)一個(gè)具體的假設(shè)進(jìn)行檢驗(yàn)?通常借助于直觀分析和理論分析相結(jié)合的做法,其基本原理就是人們?cè)趯?shí)際問題中經(jīng)常采用的所謂小概率反證法思想。小概率思想是指小概率事件(P5;這意味著,至少樣本均值應(yīng)該大于5;,10.1.2假設(shè)檢驗(yàn)的基本思想,至于是否顯著,依檢驗(yàn)結(jié)果而定。檢驗(yàn)結(jié)果顯著(significant)意味著有理由拒絕零假設(shè)。因此,假設(shè)檢驗(yàn)也被稱為顯著性檢驗(yàn)(significanttest)。,10.1.2假設(shè)檢驗(yàn)的基本思想,有了兩個(gè)假設(shè),就要根據(jù)數(shù)據(jù)來(lái)對(duì)它們進(jìn)行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計(jì)量;它在檢驗(yàn)中被稱為檢驗(yàn)統(tǒng)計(jì)量(teststatistic)。根據(jù)零假設(shè)(不是備選假設(shè)?。?,可得到該檢驗(yàn)統(tǒng)計(jì)量的分布;再看這個(gè)統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)值(realization)屬不屬于小概率事件。,10.1.2假設(shè)檢驗(yàn)的基本思想,也就是說(shuō)把數(shù)據(jù)代入檢驗(yàn)統(tǒng)計(jì)量,看其值是否落入零假設(shè)下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說(shuō)“該檢驗(yàn)顯著?!狈駝t說(shuō)“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗(yàn)不顯著?!?10.1.2假設(shè)檢驗(yàn)的基本思想,在零假設(shè)下,檢驗(yàn)統(tǒng)計(jì)量取其實(shí)現(xiàn)值及(沿著備選假設(shè)的方向)更加極端值的概率稱為p-值(p-value)。如果得到很小的p-值,就意味著在零假設(shè)下小概率事件發(fā)生了。如果小概率事件發(fā)生,是相信零假設(shè),還是相信數(shù)據(jù)呢?當(dāng)然多半是相信數(shù)據(jù),拒絕零假設(shè)。,10.1.2假設(shè)檢驗(yàn)的基本思想,但小概率并不能說(shuō)明不會(huì)發(fā)生,僅僅發(fā)生的概率很小罷了。拒絕正確零假設(shè)的錯(cuò)誤常被稱為第一類錯(cuò)誤(typeIerror)。在備選假設(shè)正確時(shí)反而說(shuō)零假設(shè)正確的錯(cuò)誤,稱為第二類錯(cuò)誤(typeIIerror)。,10.1.2假設(shè)檢驗(yàn)的基本思想,零假設(shè)和備選假設(shè)哪一個(gè)正確,是確定性的,沒有概率可言。而可能犯錯(cuò)誤的是人。涉及假設(shè)檢驗(yàn)的犯錯(cuò)誤的概率就是犯第一類錯(cuò)誤的概率和犯第二類錯(cuò)誤的概率。負(fù)責(zé)任的態(tài)度是無(wú)論做出什么決策,都應(yīng)該給出該決策可能犯錯(cuò)誤的概率。,10.1.2假設(shè)檢驗(yàn)的基本思想,到底p-值是多小時(shí)才能夠拒絕零假設(shè)呢?也就是說(shuō),需要有什么是小概率的標(biāo)準(zhǔn)。這要看具體應(yīng)用的需要。但在一般的統(tǒng)計(jì)書和軟件中,使用最多的標(biāo)準(zhǔn)是在零假設(shè)下(或零假設(shè)正確時(shí))根據(jù)樣本所得的數(shù)據(jù)來(lái)拒絕零假設(shè)的概率應(yīng)小于0.05,當(dāng)然也可能是0.01,0.005,0.001等等。,10.1.2假設(shè)檢驗(yàn)的基本思想,這種事先規(guī)定的概率稱為顯著性水平(significantlevel),用字母alpha來(lái)表示。alpha并不一定越小越好,因?yàn)檫@很可能導(dǎo)致不容易拒絕零假設(shè),使得犯第二類錯(cuò)誤的概率增大。,10.1.2假設(shè)檢驗(yàn)的基本思想,當(dāng)p-值小于或等于alpha時(shí),就拒絕零假設(shè)。所以,alpha是所允許的犯第一類錯(cuò)誤概率的最大值。當(dāng)p-值小于或等于alpha時(shí),拒絕原假設(shè)H0,就說(shuō)這個(gè)檢驗(yàn)是顯著的。無(wú)論統(tǒng)計(jì)學(xué)家用多大的alpha作為顯著性水平都不能脫離實(shí)際問題的背景。統(tǒng)計(jì)顯著不一定等價(jià)于實(shí)際顯著。反過來(lái)也一樣。,10.1.2假設(shè)檢驗(yàn)的基本思想,實(shí)際上,多數(shù)計(jì)算機(jī)軟件僅僅給出p-值,這有很多方便之處。比如alpha=0.05,而假定所得到的p-值等于0.001。這時(shí)如果采用p-值作為新的顯著性水平,即新的alpha=0.001,于是就可以說(shuō),在顯著性水平為0.001時(shí),拒絕零假設(shè)。,10.1.2假設(shè)檢驗(yàn)的基本思想,這樣,拒絕零假設(shè)時(shí)犯錯(cuò)誤的概率實(shí)際只是千分之一而不是舊的alpha所表明的百分之五。在這個(gè)意義上,p-值又稱為觀測(cè)的顯著性水平(observedsignificantlevel)。在統(tǒng)計(jì)軟件輸出p-值的位置,有的用“p-value”,有的用significant的縮寫“Sig”就是這個(gè)道理。,10.1.2假設(shè)檢驗(yàn)的基本思想,歸納起來(lái),假設(shè)檢驗(yàn)的一般步驟為:1.寫出零假設(shè)和備選假設(shè);2.確定檢驗(yàn)統(tǒng)計(jì)量;3.確定顯著性水平;4.根據(jù)數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的實(shí)現(xiàn)值;5.根據(jù)這個(gè)實(shí)現(xiàn)值計(jì)算p-值;,10.1.2假設(shè)檢驗(yàn)的基本思想,6.進(jìn)行判斷:如果p-值小于或等于alpha,就拒絕零假設(shè),這時(shí)犯(第一類)錯(cuò)誤的概率最多為alpha;如果p-值大于alpha,就不拒絕零假設(shè),因?yàn)樽C據(jù)不足。,10.1.4假設(shè)檢驗(yàn)中的其他問題,(1)做假設(shè)檢驗(yàn)之前,應(yīng)注意資料本身是否有可比性。(2)當(dāng)差別有統(tǒng)計(jì)學(xué)意義時(shí)應(yīng)注意這樣的差別在實(shí)際應(yīng)用中有無(wú)意義。(3)根據(jù)資料類型和特點(diǎn)選用正確的假設(shè)檢驗(yàn)方法。(4)根據(jù)專業(yè)及經(jīng)驗(yàn)確定是選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。,10.1.4假設(shè)檢驗(yàn)中的其他問題,(5)當(dāng)檢驗(yàn)結(jié)果為拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生I類錯(cuò)誤的可能性,即錯(cuò)誤地拒絕了本身成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是知道的,即檢驗(yàn)水準(zhǔn)那么大;當(dāng)檢驗(yàn)結(jié)果為不拒絕無(wú)效假設(shè)時(shí),應(yīng)注意有發(fā)生II類錯(cuò)誤的可能性,即仍有可能錯(cuò)誤地接受了本身就不成立的H0,發(fā)生這種錯(cuò)誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯(cuò)誤的大小有關(guān)系。,10.1.4假設(shè)檢驗(yàn)中的其他問題,(6)判斷結(jié)論時(shí)不能絕對(duì)化,應(yīng)注意無(wú)論接受或拒絕檢驗(yàn)假設(shè),都有判斷錯(cuò)誤的可能性。(7)報(bào)告結(jié)論時(shí)是應(yīng)注意說(shuō)明所用的統(tǒng)計(jì)量,檢驗(yàn)的單雙側(cè)及P值的確切范圍。,10.2正態(tài)分布檢驗(yàn),10.2.1K-S檢驗(yàn)的原理10.2.2分析實(shí)例,10.2.1K-S檢驗(yàn)的原理,單樣本的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn),柯爾莫哥諾夫-斯米爾諾夫檢驗(yàn))是用來(lái)檢驗(yàn)一個(gè)數(shù)據(jù)的觀測(cè)累積分布是否是已知的理論分布。設(shè)總體XF(x),F(xiàn)(x)是未知的,F(xiàn)0(x)是一個(gè)給定的分布函數(shù),欲檢驗(yàn)H0:F(x)=F0(x),10.2.1K-S檢驗(yàn)的原理,由于當(dāng)n較大時(shí),理論上有經(jīng)驗(yàn)分布函數(shù)Fn(x)是F(x)的良好近似。構(gòu)造KolmogorovSmirnov統(tǒng)計(jì)量,來(lái)反映F(x)和F0(x)之間的差異,若D較小,表明二者間沒有顯著差異,否則有顯著差異。,10.2.1K-S檢驗(yàn)的原理,KolmogorovSmirnov證明了統(tǒng)計(jì)量D的極限分布為Q()分布,計(jì)算出,記為Z值,并根據(jù)極限分布計(jì)算出相應(yīng)的顯著性概率,若Sig.小于給點(diǎn)的顯著性水平alpha,則拒絕H0,否則,接受H0.,10.2.2分析實(shí)例,例12.1請(qǐng)判斷SPSS自帶數(shù)據(jù)集anxity.sav中score的分布是否服從正態(tài)分布。操作如下:AnalyzeNonparametictest1-sampleK-STestvariablelist框:選入scoreTestdistribution復(fù)選框組:選中normal復(fù)選框單擊OK鈕系統(tǒng)給出的統(tǒng)計(jì)分析結(jié)果,具體如下:,數(shù)據(jù)文件,操作過程,由于p=Sig.=0.6520.05,故接受原假設(shè),認(rèn)為score服從正態(tài)分布。,注意,K-S檢驗(yàn)可以檢驗(yàn)正態(tài)分布,均勻分布,泊松分布,指數(shù)分布。,10.3二項(xiàng)分布檢驗(yàn),10.3.1二項(xiàng)分布檢驗(yàn)的原理10.3.2分析實(shí)例,10.3.1二項(xiàng)分布檢驗(yàn)的原理,當(dāng)一個(gè)變量只取0,1值時(shí),稱為二分值變量。當(dāng)一個(gè)問題只有兩種可能結(jié)果時(shí),稱為二分值問題。二分值問題的一種結(jié)果稱為“成功”,另一種稱為“失敗”。二項(xiàng)分布檢驗(yàn)(BinomialTest)就是對(duì)二分值問題的成功概率進(jìn)行檢驗(yàn)。,10.3.1二項(xiàng)分布檢驗(yàn)的原理,設(shè)S+表示對(duì)二分值問題進(jìn)行n次試驗(yàn)中成功的次數(shù)。例如用同樣的方法擲一枚硬幣100次,出現(xiàn)正面44次,出現(xiàn)反面56次,問該硬幣是否均勻?該例中S+=44,S-=56,檢驗(yàn)假設(shè)為:H0:p=p0=0.5當(dāng)H0為真時(shí),S+服從參數(shù)為P0的二項(xiàng)分布。,10.3.1二項(xiàng)分布檢驗(yàn)的原理,計(jì)算S+的值,并根據(jù)二項(xiàng)分布計(jì)算相應(yīng)的顯著性概率Sig.,若Sig.小于給定的顯著性水平alpha,則拒絕H0,否則接受拒絕H0。因?yàn)槭腔诙?xiàng)分布的概率進(jìn)行判斷,所以此種檢驗(yàn)法稱為二項(xiàng)分布檢驗(yàn)法。當(dāng)試驗(yàn)總次數(shù)n較大時(shí),S+近似服從正態(tài)分布。所以往往根據(jù)正態(tài)分布計(jì)算Sig.的近似值。,10.3.2分析實(shí)例,例10.6根據(jù)以往經(jīng)驗(yàn),新生兒染色體異常率一般為1%,現(xiàn)某醫(yī)院觀察了當(dāng)?shù)毓?00名新生兒,只發(fā)現(xiàn)一例染色體異常。數(shù)據(jù)見binominal.sav,該地新生兒染色體異常率是否低于一般?,10.3.2分析實(shí)例,原假設(shè):H0:p=0.01,異常率并無(wú)不同備擇假設(shè):H1:pBinomialTestVariable:染色體異常率illTestProportion:0.01,10.3.2分析實(shí)例,Sig=.090(按正態(tài)分布近似計(jì)算)0.05,不能拒絕原假設(shè),尚不能認(rèn)為異常率低于一般。,10.4游程檢驗(yàn),10.4.1游程檢驗(yàn)的原理10.4.2分析實(shí)例,10.4.1游程檢驗(yàn)的原理,游程檢驗(yàn)(Runstest)與二項(xiàng)分布檢驗(yàn)都是對(duì)二分值問題進(jìn)行檢驗(yàn),但它不是對(duì)“成功”概率進(jìn)行檢驗(yàn),而是檢驗(yàn)多個(gè)二分值問題之間是否相互獨(dú)立?原假設(shè)H0:多個(gè)二分值問題之間獨(dú)立游程檢驗(yàn)是基于游程數(shù)的多少來(lái)檢驗(yàn),那么什么是游程呢?,10.4.1游程檢驗(yàn)的原理,游程就是0,1序列中0或者1的連續(xù)段,即0或1的每個(gè)連續(xù)段稱為一個(gè)游程。設(shè)天氣預(yù)報(bào)記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對(duì)以后天氣是否下雨有無(wú)影響?易知該記錄總游程數(shù)U=11。,10.4.1游程檢驗(yàn)的原理,如果原假設(shè)H0成立,則0,1序列交替均勻,從而總游程數(shù)U較大,否則U較小。所以,我們可以通過總游程數(shù)U的大小來(lái)判斷H0是否成立。選擇U為檢驗(yàn)統(tǒng)計(jì)量,當(dāng)樣本數(shù)n較大時(shí),U近似服從正態(tài)分布。根據(jù)相應(yīng)分布計(jì)算p值,然后做出判斷。,10.4.2分析實(shí)例,設(shè)天氣預(yù)報(bào)記錄20天是否下雨的情況,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨對(duì)以后天氣是否下雨有無(wú)影響?建立數(shù)據(jù)文件見右圖所示,10.4.2分析實(shí)例,AnalyzeNonparametricTestsRunsTestVariable:下雨否CutPoint:Custom:1注意:有時(shí)在一些數(shù)據(jù)表中所檢驗(yàn)的變量不是二分值變量,如教材例10.7,此時(shí)需要給定一個(gè)分割點(diǎn)(CutPoint),把它轉(zhuǎn)化為二分值變量。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生作文我的夢(mèng)想征文
- 云南省怒江傈僳族自治州福貢縣聯(lián)考2024-2025學(xué)年高一上學(xué)期1月期末生物學(xué)試題(含答案)
- 國(guó)際貿(mào)易實(shí)務(wù)中的結(jié)算方式知識(shí)考點(diǎn)
- 個(gè)人自助圖書館借閱服務(wù)合同
- 現(xiàn)代服務(wù)業(yè)服務(wù)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)知識(shí)考點(diǎn)
- 互聯(lián)網(wǎng)產(chǎn)品策劃題
- 辦公空間能源消耗表格:能耗統(tǒng)計(jì)、節(jié)能減排
- 金融投資行業(yè)市場(chǎng)波動(dòng)風(fēng)險(xiǎn)免責(zé)聲明
- 醫(yī)學(xué)知識(shí)視頻培訓(xùn)課件
- 工作計(jì)劃完成情況統(tǒng)計(jì)表格
- 《字體設(shè)計(jì)》課程標(biāo)準(zhǔn)
- 中醫(yī)婦科病治療
- 中小學(xué)語(yǔ)文教師教學(xué)培訓(xùn)核心素養(yǎng)下的整本書閱讀教學(xué)培訓(xùn)課件如何教好孩子閱讀
- 預(yù)拌混凝土培訓(xùn)課件教案
- 認(rèn)知癥培訓(xùn)課件
- HGT4134-2022 工業(yè)聚乙二醇PEG
- 組織內(nèi)外部環(huán)境識(shí)別表
- 河邊基礎(chǔ)施工方案
- 國(guó)民經(jīng)濟(jì)行業(yè)分類大類一覽表
- 廣州光伏發(fā)電安裝限高屋頂搭建不得超過2.8米四周不得圍蔽
- 重修課程免聽申請(qǐng)表
評(píng)論
0/150
提交評(píng)論