分布類型的檢驗

上傳人：農(nóng)*** IP屬地：廣東上傳時間：2023-05-25 格式：PPT 頁數(shù)：51 大?。?.17MB 積分：18 舉報 版權申訴

已閱讀5頁，還剩46頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

分布類型的檢驗第一頁，共五十一頁，編輯于2023年，星期五第10章分布類型的檢驗10.1假設檢驗的基本思想10.2正態(tài)分布檢驗10.3二項分布檢驗10.4游程檢驗10.5本章小結第二頁，共五十一頁，編輯于2023年，星期五第11章連續(xù)變量的統(tǒng)計推斷(一)——t檢驗

11.1

t檢驗基礎

11.2樣本均數(shù)與總體均數(shù)的比較

11.3成組設計兩樣本均數(shù)的比較

11.4配對設計樣本均數(shù)的比較

11.5本章小結第三頁，共五十一頁，編輯于2023年，星期五10.1假設檢驗的基本思想10.1.1問題的提出10.1.2假設檢驗的基本思想10.1.3假設檢驗的兩類錯誤10.1.4假設檢驗中的其他問題第四頁，共五十一頁，編輯于2023年，星期五10.1.1問題的提出在總體的分布函數(shù)完全未知或只知其形式，但不知其參數(shù)的情況下，為了推斷總體的某些性質，提出某些關于總體的假設。例如，提出總體服正態(tài)分布的假設；對正態(tài)總體提出均值等于a0的假設等等。假設檢驗就是根據(jù)樣本對所提出的假設作出判斷：是接受，還是拒絕。第五頁，共五十一頁，編輯于2023年，星期五10.1.1問題的提出假設檢驗是用來判斷樣本與樣本，樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統(tǒng)計推斷方法。第六頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想如何利用樣本值對一個具體的假設進行檢驗?通常借助于直觀分析和理論分析相結合的做法,其基本原理就是人們在實際問題中經(jīng)常采用的所謂小概率反證法思想。小概率思想是指小概率事件（P<0.01或P<0.05）在一次試驗中基本上不會發(fā)生。第七頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想反證法思想是先提出假設(檢驗假設H0)，再用適當?shù)慕y(tǒng)計方法確定假設成立的可能性大小，如可能性小,則認為假設不成立，若可能性大，則還不能認為假設不成立。第八頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想先要根據(jù)問題的題意或者對總體分布的未知參數(shù)提出個原假設，比如某正態(tài)總體的均值等于5(a=5)。這種原假設也稱為零假設(nullhypothesis)，記為H0?；蛘邔傮w分布的形式做出假設，例如總體服從正態(tài)分布。前者屬于參數(shù)假設檢驗，后者屬于非參數(shù)假設檢驗。第九頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想與此同時必須提出備選假設(或稱為備擇假設，alternativehypothesis)，比如總體均值大于5（a>5）。備選假設記為H1a。備選假設應該按照實際世界所代表的方向來確定，即它通常是被認為可能比零假設更符合數(shù)據(jù)所代表的現(xiàn)實。比如上面的H1為a>5；這意味著，至少樣本均值應該大于5；第十頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想至于是否顯著，依檢驗結果而定。檢驗結果顯著(significant)意味著有理由拒絕零假設。因此，假設檢驗也被稱為顯著性檢驗(significanttest)。第十一頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想有了兩個假設，就要根據(jù)數(shù)據(jù)來對它們進行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計量；它在檢驗中被稱為檢驗統(tǒng)計量（teststatistic）。根據(jù)零假設（不是備選假設?。傻玫皆摍z驗統(tǒng)計量的分布；再看這個統(tǒng)計量的數(shù)據(jù)實現(xiàn)值（realization）屬不屬于小概率事件。第十二頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想也就是說把數(shù)據(jù)代入檢驗統(tǒng)計量,看其值是否落入零假設下的小概率范疇；如果的確是小概率事件，那么就有可能拒絕零假設，或者說“該檢驗顯著?！狈駝t說“沒有足夠證據(jù)拒絕零假設”，或者“該檢驗不顯著?！钡谑摚参迨豁?，編輯于2023年，星期五10.1.2假設檢驗的基本思想在零假設下，檢驗統(tǒng)計量取其實現(xiàn)值及（沿著備選假設的方向）更加極端值的概率稱為p-值（p-value）。如果得到很小的p-值，就意味著在零假設下小概率事件發(fā)生了。如果小概率事件發(fā)生，是相信零假設，還是相信數(shù)據(jù)呢？當然多半是相信數(shù)據(jù)，拒絕零假設。第十四頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想但小概率并不能說明不會發(fā)生，僅僅發(fā)生的概率很小罷了。拒絕正確零假設的錯誤常被稱為第一類錯誤（typeIerror）。在備選假設正確時反而說零假設正確的錯誤，稱為第二類錯誤（typeIIerror）。第十五頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想零假設和備選假設哪一個正確，是確定性的，沒有概率可言。而可能犯錯誤的是人。涉及假設檢驗的犯錯誤的概率就是犯第一類錯誤的概率和犯第二類錯誤的概率。負責任的態(tài)度是無論做出什么決策，都應該給出該決策可能犯錯誤的概率。第十六頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想到底p-值是多小時才能夠拒絕零假設呢？也就是說，需要有什么是小概率的標準。這要看具體應用的需要。但在一般的統(tǒng)計書和軟件中，使用最多的標準是在零假設下（或零假設正確時）根據(jù)樣本所得的數(shù)據(jù)來拒絕零假設的概率應小于0.05，當然也可能是0.01，0.005，0.001等等。第十七頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想這種事先規(guī)定的概率稱為顯著性水平(significantlevel)，用字母alpha來表示。alpha并不一定越小越好，因為這很可能導致不容易拒絕零假設，使得犯第二類錯誤的概率增大。第十八頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想當p-值小于或等于alpha時，就拒絕零假設。所以，alpha是所允許的犯第一類錯誤概率的最大值。當p-值小于或等于alpha時，拒絕原假設H0，就說這個檢驗是顯著的。無論統(tǒng)計學家用多大的alpha作為顯著性水平都不能脫離實際問題的背景。統(tǒng)計顯著不一定等價于實際顯著。反過來也一樣。第十九頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想實際上，多數(shù)計算機軟件僅僅給出p-值，這有很多方便之處。比如alpha=0.05，而假定所得到的p-值等于0.001。這時如果采用p-值作為新的顯著性水平，即新的alpha=0.001，于是就可以說，在顯著性水平為0.001時，拒絕零假設。第二十頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想這樣，拒絕零假設時犯錯誤的概率實際只是千分之一而不是舊的alpha所表明的百分之五。在這個意義上，p-值又稱為觀測的顯著性水平（observedsignificantlevel）。在統(tǒng)計軟件輸出p-值的位置，有的用“p-value”，有的用significant的縮寫“Sig”就是這個道理。第二十一頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想歸納起來，假設檢驗的一般步驟為：1.寫出零假設和備選假設；2.確定檢驗統(tǒng)計量；3.確定顯著性水平；4.根據(jù)數(shù)據(jù)計算檢驗統(tǒng)計量的實現(xiàn)值；5.根據(jù)這個實現(xiàn)值計算p-值；第二十二頁，共五十一頁，編輯于2023年，星期五10.1.2假設檢驗的基本思想6.進行判斷：如果p-值小于或等于alpha，就拒絕零假設，這時犯（第一類）錯誤的概率最多為alpha；如果p-值大于alpha，就不拒絕零假設，因為證據(jù)不足。第二十三頁，共五十一頁，編輯于2023年，星期五10.1.4假設檢驗中的其他問題（1）做假設檢驗之前，應注意資料本身是否有可比性。（2）當差別有統(tǒng)計學意義時應注意這樣的差別在實際應用中有無意義。（3）根據(jù)資料類型和特點選用正確的假設檢驗方法。（4）根據(jù)專業(yè)及經(jīng)驗確定是選用單側檢驗還是雙側檢驗。第二十四頁，共五十一頁，編輯于2023年，星期五10.1.4假設檢驗中的其他問題（5）當檢驗結果為拒絕無效假設時，應注意有發(fā)生I類錯誤的可能性，即錯誤地拒絕了本身成立的H0，發(fā)生這種錯誤的可能性預先是知道的，即檢驗水準那么大；當檢驗結果為不拒絕無效假設時，應注意有發(fā)生II類錯誤的可能性，即仍有可能錯誤地接受了本身就不成立的H0，發(fā)生這種錯誤的可能性預先是不知道的，但與樣本含量和I類錯誤的大小有關系。第二十五頁，共五十一頁，編輯于2023年，星期五10.1.4假設檢驗中的其他問題（6）判斷結論時不能絕對化，應注意無論接受或拒絕檢驗假設，都有判斷錯誤的可能性。（7）報告結論時是應注意說明所用的統(tǒng)計量，檢驗的單雙側及P值的確切范圍。第二十六頁，共五十一頁，編輯于2023年，星期五10.2正態(tài)分布檢驗

10.2.1

K-S檢驗的原理

10.2.2分析實例第二十七頁，共五十一頁，編輯于2023年，星期五10.2.1

K-S檢驗的原理單樣本的Kolmogorov-Smirnov檢驗（K-S檢驗，柯爾莫哥諾夫-斯米爾諾夫檢驗）是用來檢驗一個數(shù)據(jù)的觀測累積分布是否是已知的理論分布。設總體X～F(x)，F(xiàn)(x)是未知的，F(xiàn)0(x)是一個給定的分布函數(shù)，欲檢驗H0:F(x)=F0(x)第二十八頁，共五十一頁，編輯于2023年，星期五10.2.1

K-S檢驗的原理由于當n較大時，理論上有經(jīng)驗分布函數(shù)Fn(x)是F(x)的良好近似。構造Kolmogorov–Smirnov統(tǒng)計量來反映F(x)和F0(x)之間的差異，若D較小，表明二者間沒有顯著差異，否則有顯著差異。第二十九頁，共五十一頁，編輯于2023年，星期五10.2.1

K-S檢驗的原理Kolmogorov–Smirnov證明了統(tǒng)計量D的極限分布為Q()分布，計算出記為Z值，并根據(jù)極限分布計算出相應的顯著性概率若Sig.小于給點的顯著性水平alpha，則拒絕H0,否則，接受H0.第三十頁，共五十一頁，編輯于2023年，星期五10.2.2分析實例例12.1請判斷SPSS自帶數(shù)據(jù)集anxity.sav中score的分布是否服從正態(tài)分布。操作如下：AnalyzeNonparametictest1-sampleK-STestvariablelist框：選入scoreTestdistribution復選框組：選中normal復選框單擊OK鈕系統(tǒng)給出的統(tǒng)計分析結果，具體如下：第三十一頁，共五十一頁，編輯于2023年，星期五數(shù)據(jù)文件第三十二頁，共五十一頁，編輯于2023年，星期五操作過程第三十三頁，共五十一頁，編輯于2023年，星期五由于p=Sig.=0.652>0.05，故接受原假設，認為score服從正態(tài)分布。第三十四頁，共五十一頁，編輯于2023年，星期五

變量名Score樣本量

48正態(tài)分布參數(shù)均數(shù)10.00

標準差5.17最極端的差異絕對值.106

正值.088

負值-.106K-S檢驗的統(tǒng)計量Z值

.735近似P值(雙側)

.652第三十五頁，共五十一頁，編輯于2023年，星期五注意K-S檢驗可以檢驗正態(tài)分布，均勻分布，泊松分布，指數(shù)分布。第三十六頁，共五十一頁，編輯于2023年，星期五10.3二項分布檢驗10.3.1二項分布檢驗的原理10.3.2分析實例第三十七頁，共五十一頁，編輯于2023年，星期五10.3.1二項分布檢驗的原理當一個變量只取0，1值時，稱為二分值變量。當一個問題只有兩種可能結果時，稱為二分值問題。二分值問題的一種結果稱為“成功”，另一種稱為“失敗”。二項分布檢驗（BinomialTest）就是對二分值問題的成功概率進行檢驗。第三十八頁，共五十一頁，編輯于2023年，星期五10.3.1二項分布檢驗的原理設S+表示對二分值問題進行n次試驗中成功的次數(shù)。例如用同樣的方法擲一枚硬幣100次，出現(xiàn)正面44次，出現(xiàn)反面56次，問該硬幣是否均勻？該例中S+=44，S-=56，檢驗假設為：H0:p=p0=0.5當H0為真時，S+服從參數(shù)為P0的二項分布。第三十九頁，共五十一頁，編輯于2023年，星期五10.3.1二項分布檢驗的原理計算S+的值，并根據(jù)二項分布計算相應的顯著性概率Sig.，若Sig.小于給定的顯著性水平alpha，則拒絕H0，否則接受拒絕H0。因為是基于二項分布的概率進行判斷，所以此種檢驗法稱為二項分布檢驗法。當試驗總次數(shù)n較大時，S+近似服從正態(tài)分布。所以往往根據(jù)正態(tài)分布計算Sig.的近似值。第四十頁，共五十一頁，編輯于2023年，星期五10.3.2分析實例例10.6根據(jù)以往經(jīng)驗，新生兒染色體異常率一般為1%，現(xiàn)某醫(yī)院觀察了當?shù)毓?00名新生兒，只發(fā)現(xiàn)一例染色體異常。數(shù)據(jù)見binominal.sav，該地新生兒染色體異常率是否低于一般？第四十一頁，共五十一頁，編輯于2023年，星期五10.3.2分析實例原假設：H0：p=0.01，異常率并無不同備擇假設：H1：p<0.01，異常率低于一般加權：DataWeightCases：頻數(shù)numAnalyzeNonparametricTests－>BinomialTestVariable：染色體異常率illTestProportion：0.01第四十二頁，共五十一頁，編輯于2023年，星期五10.3.2分析實例Sig=.090(按正態(tài)分布近似計算)>0.05，不能拒絕原假設，尚不能認為異常率低于一般。第四十三頁，共五十一頁，編輯于2023年，星期五10.4游程檢驗10.4.1游程檢驗的原理10.4.2分析實例第四十四頁，共五十一頁，編輯于2023年，星期五10.4.1游程檢驗的原理游程檢驗（Runstest）與二項分布檢驗都是對二分值問題進行檢驗，但它不是對“成功”概率進行檢驗，而是檢驗多個二分值問題之間是否相互獨立？原假設H0：多個二分值問題之間獨立游程檢驗是基于游程數(shù)的多少來檢驗，那么什么是游程呢？第四十五頁，共五十一頁，編輯于2023年，星期五10.4.1游程檢驗的原理游程就是0，1序列中0或者1的連續(xù)段，即0或1的每個連續(xù)段稱為一個游程。設天氣預報記錄20天是否下雨的情況，得到以下序列（1表示下雨，0表示不下雨）00110111000100100010，研究者想知道某一天下雨或不下雨對以后天氣是否下雨有無影響？易知該記錄總游程數(shù)U=11。第四十六頁，共五十一頁，編輯于2023年，星期五10.4.1游程檢驗的原理如果原假設H0成立，則0，1序列交替均勻，從而總游程數(shù)U較大，否則U較小。所以，我們可以通過總游程數(shù)U的大小來判

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

分布類型的檢驗

文檔簡介

溫馨提示

最新文檔

評論

分布類型的檢驗

文檔簡介

溫馨提示

最新文檔

評論

相關文檔