非參數(shù)檢驗I:χ檢驗_第1頁
非參數(shù)檢驗I:χ檢驗_第2頁
非參數(shù)檢驗I:χ檢驗_第3頁
非參數(shù)檢驗I:χ檢驗_第4頁
非參數(shù)檢驗I:χ檢驗_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、參數(shù)檢驗,參數(shù)檢驗,也就是說檢驗?zāi)繕?biāo)是判斷總體參數(shù)是否也就是說檢驗?zāi)繕?biāo)是判斷總體參數(shù)是否等于某一指定值,或兩個總體的某一參數(shù)是否相等。等于某一指定值,或兩個總體的某一參數(shù)是否相等。非參數(shù)檢驗,非參數(shù)檢驗,檢驗的目標(biāo)一般與參數(shù)無關(guān),而是檢驗的目標(biāo)一般與參數(shù)無關(guān),而是總總體分布的某種性質(zhì)是否存在體分布的某種性質(zhì)是否存在,例如是否服從某種指定,例如是否服從某種指定的分布,兩個事件是否獨立等等。的分布,兩個事件是否獨立等等。2檢驗在非參數(shù)檢驗中應(yīng)用相當(dāng)廣泛。檢驗在非參數(shù)檢驗中應(yīng)用相當(dāng)廣泛。非參數(shù)檢驗非參數(shù)檢驗I:2檢驗檢驗在一個總體中進行隨機抽樣在一個總體中進行隨機抽樣,n為樣本含量,具有為樣本含量,

2、具有r種不同屬種不同屬性出現(xiàn)(或可分為性出現(xiàn)(或可分為r組),組),Oi為樣本中第為樣本中第i種屬性出現(xiàn)的次數(shù)的觀察種屬性出現(xiàn)的次數(shù)的觀察值,值,T為為i樣本中第樣本中第i種屬性出現(xiàn)次數(shù)的理論值,則種屬性出現(xiàn)次數(shù)的理論值,則Pearson統(tǒng)計量定統(tǒng)計量定義為:義為:如果樣本來自理論總體,那么如果樣本來自理論總體,那么Oi和和Ti之間的差異就只是隨機誤差之間的差異就只是隨機誤差,則有隨,則有隨n的增加漸近于的增加漸近于自由度為自由度為r-1的的2分布。分布。2分布分布riiiiTTO122)(X2F(x2)Df=1Df=6Df=102分布是抽樣分布,根據(jù)分布是抽樣分布,根據(jù)自由度自由度變化而變化

3、,每一個不同自由變化而變化,每一個不同自由度對應(yīng)一個度對應(yīng)一個2分布曲線,分布曲線,2分布具有一組曲線。分布具有一組曲線。2一一尾表尾表2分布具有一組曲線分布具有一組曲線0126 如果樣本確實抽自由(如果樣本確實抽自由(P P1 1,P P2 2,PPr r)代表的總體,)代表的總體,Oi和和Ti之間的差異就只是隨機誤差,則之間的差異就只是隨機誤差,則Pearson統(tǒng)計量可視為服從統(tǒng)計量可視為服從2 2分布;反之若樣本不是抽自由(分布;反之若樣本不是抽自由(P P1 1,P P2 2,PPr r)代表的總體,)代表的總體,Oi和和Ti之間的差異就不只是隨機誤差,從而使計算出的統(tǒng)計量有之間的差異

4、就不只是隨機誤差,從而使計算出的統(tǒng)計量有偏大的趨勢。偏大的趨勢。 因此對上述因此對上述Pearson統(tǒng)計量進行統(tǒng)計量進行上單尾檢驗上單尾檢驗可用于判斷離散可用于判斷離散型數(shù)據(jù)的觀察值與理論值是否吻合。型數(shù)據(jù)的觀察值與理論值是否吻合。 此時此時統(tǒng)計假設(shè)為:統(tǒng)計假設(shè)為:H0:Oi=Ti;HA:OiTI,但檢驗是上單,但檢驗是上單尾檢驗。尾檢驗。 檢驗是上單尾檢驗檢驗是上單尾檢驗riiiiTTO122)5 . 0(若自由度為若自由度為1,則應(yīng)作連續(xù)性矯正,即把統(tǒng)計量改為,則應(yīng)作連續(xù)性矯正,即把統(tǒng)計量改為:連續(xù)性矯連續(xù)性矯(1)建立假設(shè))建立假設(shè):H0:Oi=Ti;HA:OiTI,但檢驗是上,但檢驗是

5、上單尾檢驗。單尾檢驗。(2)確定顯著水平確定顯著水平(3)由由H0:Oi=TI出發(fā),計算樣本資料的出發(fā),計算樣本資料的2值值(4)根據(jù))根據(jù)df和顯著水平,查和顯著水平,查2臨界值。臨界值。(5)結(jié)果判斷)結(jié)果判斷2大于大于2臨界值,否定臨界值,否定H0;2小于小于2臨界值臨界值,接受,接受H0;假設(shè)測驗步驟假設(shè)測驗步驟一、吻合度檢驗一、吻合度檢驗。用于檢驗總體是否服從某個指定分布。用于檢驗總體是否服從某個指定分布。方法為:設(shè)給定分布函數(shù)為方法為:設(shè)給定分布函數(shù)為F(x)。首先首先把把x的值域分為的值域分為r個不相個不相重重合的區(qū)間,并統(tǒng)計樣本含量為合的區(qū)間,并統(tǒng)計樣本含量為n的一次抽樣中,觀

6、察值落入各的一次抽樣中,觀察值落入各區(qū)區(qū)間的次數(shù),把落入?yún)^(qū)間間的次數(shù),把落入?yún)^(qū)間i i的次數(shù)記為的次數(shù)記為Oi,i=1, 2, ri=1, 2, r;再算出再算出在在指定的分布下,指定的分布下,x落入每一區(qū)間的概率落入每一區(qū)間的概率pi,i=1, 2i=1, 2, r r。由于。由于樣本含量為樣本含量為n,因此理論上落入每一區(qū)間的次數(shù)應(yīng)為,因此理論上落入每一區(qū)間的次數(shù)應(yīng)為Ti=npi;從;從而可用而可用Pearson統(tǒng)計量進行檢驗。統(tǒng)計量進行檢驗。Pearson統(tǒng)計量的應(yīng)用主要有以下兩個方面:統(tǒng)計量的應(yīng)用主要有以下兩個方面:一般來說,如果給定的分布函數(shù)一般來說,如果給定的分布函數(shù)F(x)中不含

7、有未知參數(shù),中不含有未知參數(shù),則則Pearson統(tǒng)計量的自由度就是統(tǒng)計量的自由度就是r1;但如果但如果F(x)中含有一個或幾個未知參數(shù),需要用從樣本中中含有一個或幾個未知參數(shù),需要用從樣本中計算出的估計量代替,則使用了幾個估計量自由度一般就應(yīng)計算出的估計量代替,則使用了幾個估計量自由度一般就應(yīng)在在r1的基礎(chǔ)上再減去幾。的基礎(chǔ)上再減去幾。如,觀測值共分了如,觀測值共分了9組,自由度本應(yīng)為組,自由度本應(yīng)為91=8,但由于理論,但由于理論分布的分布的和和2未知,使用估計量代替未知,使用估計量代替,因此自由度應(yīng)為,因此自由度應(yīng)為82=6。Pearson統(tǒng)計量的自由度可能發(fā)生變化統(tǒng)計量的自由度可能發(fā)生變

8、化調(diào)查了某地調(diào)查了某地200名男孩身高,名男孩身高,分組數(shù)據(jù)見下表。男孩身高分組數(shù)據(jù)見下表。男孩身高是否符合正態(tài)分布?是否符合正態(tài)分布?42. 7, 5 .139Sx男孩身高男孩身高是否符合正態(tài)分布是否符合正態(tài)分布1組號區(qū)間OiPiTi(Oi - Ti)2/Ti1(-, 126)80.03446.880.18062126, 130)130.065813.160.00193130, 134)170.129125.813.00814134, 138)370.190638.120.03325138, 142)550.212042.403.74206142, 146)330.177635.510.17

9、817146, 150)180.112022.400.86378150, 154)100.053210.640.03809154, +)90.02535.073.0506表中前三列是觀察數(shù)據(jù),后三列是計算所得。計算公式為:表中前三列是觀察數(shù)據(jù),后三列是計算所得。計算公式為:設(shè)區(qū)間為設(shè)區(qū)間為xi-1,xi),則),則,其中其中為為N(0,1)的分布函數(shù),可查表得到。)的分布函數(shù),可查表得到。Ti=200Pi)()()(11SxxSxxxxxPpiiiii男孩身高男孩身高是否符合正態(tài)分布是否符合正態(tài)分布2riiiiTTO1220963.11)(自由度自由度df=912=6(用用,、S2作為作為,2

10、的估計量,的估計量,應(yīng)再減去二個自由度應(yīng)再減去二個自由度)。查。查2分布表,得:分布表,得:由于由于2故可認為男孩身高分布與正態(tài)分布無明顯差異。故可認為男孩身高分布與正態(tài)分布無明顯差異。x592.12)6(295. 0295. 0男孩身高男孩身高是否符合正態(tài)分布是否符合正態(tài)分布3 以紅米非糯稻和白米糯稻雜交,子二代檢測以紅米非糯稻和白米糯稻雜交,子二代檢測179株,數(shù)據(jù)株,數(shù)據(jù)如下。如下。問子二代分離是否符合問子二代分離是否符合9:3:3:1的規(guī)律?的規(guī)律?屬性(x)紅米非糯(0) 紅米糯(1) 白米非糯(2) 白米糯(3)合計株數(shù)96 37 31 15 179是否符合是否符合9:3:3:1的

11、規(guī)律的規(guī)律1 10651. 22992. 11956. 03521. 02182. 01875.11)1875.1115(5625.33)5625.3331(5625.33)5625.3337(6875.100)6875.10096()(22223022iiiiTTO查表,查表,差異不顯著,接受差異不顯著,接受H0,子二代分離,子二代分離規(guī)律符合規(guī)律符合9:3:3:1。本題理論分布中沒有未知參數(shù),因此本題理論分布中沒有未知參數(shù),因此2統(tǒng)計量自由度仍為統(tǒng)計量自由度仍為3。 2295. 08147. 7)3(是否符合是否符合9:3:3:1的規(guī)律的規(guī)律2 2列聯(lián)表獨立性檢驗是列聯(lián)表獨立性檢驗是Pea

12、rsson統(tǒng)計量的又一重要應(yīng)用。它主要統(tǒng)計量的又一重要應(yīng)用。它主要用于檢驗兩個事件是否獨立,例如處理方法和效果是否獨立。問題用于檢驗兩個事件是否獨立,例如處理方法和效果是否獨立。問題可以這樣提出:可以這樣提出: 設(shè)實驗中可采用設(shè)實驗中可采用r種處理方法,可能得到種處理方法,可能得到C種不同的實驗結(jié)果種不同的實驗結(jié)果。一個常見的問題就是:這。一個常見的問題就是:這r種方法的效果是否相同?或改一種問種方法的效果是否相同?或改一種問法:方法與效果是否獨立?法:方法與效果是否獨立? 列聯(lián)表的獨立性檢驗列聯(lián)表的獨立性檢驗下表是對某種藥的試驗結(jié)果:給藥方式與藥效試驗結(jié)果下表是對某種藥的試驗結(jié)果:給藥方式與

13、藥效試驗結(jié)果給藥方式與藥效試驗給藥方式與藥效試驗B給藥方式有效(A)無效()總數(shù)有效率口服(B)58409859.2%注射()64319567.4%總數(shù)12271193 問給藥方式對藥效果是否有影響?問給藥方式對藥效果是否有影響? 表中各行、各列總數(shù)分別為口服與注射、有效與無效的總表中各行、各列總數(shù)分別為口服與注射、有效與無效的總數(shù)。數(shù)。 若若A代表有效,代表有效,B代表口服,則應(yīng)有:代表口服,則應(yīng)有:P(A)=第一列總數(shù)第一列總數(shù)/總總數(shù);數(shù);P(B)=第一行總數(shù)第一行總數(shù)/總數(shù)。總數(shù)。 若再有若再有H0成立,即藥效與給藥方式無關(guān)成立,即藥效與給藥方式無關(guān),A與與B互相獨立,互相獨立,則有:

14、則有:P(AB)=P(A)P(B)。 此時總數(shù)此時總數(shù)P(AB)就應(yīng)是口服且有效的理論值。與此類似就應(yīng)是口服且有效的理論值。與此類似理論值理論值可用以下方法計算出可用以下方法計算出各格的理論值各格的理論值Ti:Ti=(行總數(shù)行總數(shù)列總數(shù)列總數(shù))/總數(shù),總數(shù),從而可使用從而可使用Pearson統(tǒng)計量對統(tǒng)計量對H0:OT=0(或或A與與B獨立獨立)進行進行檢驗。這種方法就稱為列聯(lián)表獨立性檢驗。檢驗。這種方法就稱為列聯(lián)表獨立性檢驗。計算出各格的理論值計算出各格的理論值Ti設(shè)表有設(shè)表有r行行c列,由于在這種方法中使用了各行、各列總數(shù)列,由于在這種方法中使用了各行、各列總數(shù)作為常數(shù),自由度也應(yīng)相應(yīng)減少。

15、若各行總數(shù)都確定了,總數(shù)作為常數(shù),自由度也應(yīng)相應(yīng)減少。若各行總數(shù)都確定了,總數(shù)當(dāng)然也就確定了;此時列總數(shù)只要確定當(dāng)然也就確定了;此時列總數(shù)只要確定c1個即可,最后一個個即可,最后一個可用解方程的方法算出來。因此實際使用的常數(shù)不是可用解方程的方法算出來。因此實際使用的常數(shù)不是r+c個,個,而是而是r+c1個。這樣一來,自由度應(yīng)為:個。這樣一來,自由度應(yīng)為:df=(行總數(shù)行總數(shù)1)(列總數(shù)列總數(shù)1) 1() 1(1crcrcrr行行c列,自由度列,自由度A95.61193122981T05.3619371982TB05.60193122953T95.3419371954T 有效(A)無效()行總數(shù)

16、口服(B)O1 = 58 O2 = 40 98注射()O3 = 64 O4 = 31 95列總數(shù)12271總數(shù):193計算各格理論值Ti Df=(21)(21)=105.60)5 . 005.6064(05.36)5 . 005.3640(95.61)5 . 095.6158(2222061. 134056. 019821. 033017. 019213. 095.34) 5 . 095.3431(2841. 3) 1 (295. 0 接受H0,給藥方式與藥效無關(guān)。 給藥方式與藥效試驗給藥方式與藥效試驗1總數(shù)列總數(shù)行總數(shù)總數(shù)列總數(shù)總數(shù)行總數(shù)1由于保持各列、行總數(shù)不變,相當(dāng)每行、每列均加了一個約

17、由于保持各列、行總數(shù)不變,相當(dāng)每行、每列均加了一個約束,因此對束,因此對r行行c列列聯(lián)表,自由度為列列聯(lián)表,自由度為df=(r1)(c1)。2由于由于A與與B獨立,有:獨立,有:P(AB)=P(A)P(B);這樣在);這樣在保持各行各列總數(shù)不變的條件下,可得保持各行各列總數(shù)不變的條件下,可得Ti的計算公式為:的計算公式為:Ti=npI=nP(AB)=nP(A)P(B)=總數(shù)總數(shù)由于常用的由于常用的22列聯(lián)表自由度為列聯(lián)表自由度為1,因此一般應(yīng)加連續(xù)性矯,因此一般應(yīng)加連續(xù)性矯正。正。幾點說明:幾點說明:3例例3.24為檢測不同灌溉方式對水稻葉片衰老的影響,收集為檢測不同灌溉方式對水稻葉片衰老的影

18、響,收集如下資料:如下資料:水稻葉片衰老情況水稻葉片衰老情況水稻葉片衰老情況水稻葉片衰老情況灌溉方式綠葉數(shù)黃葉數(shù)枯葉數(shù)總計深水淺水濕潤146(140.69)183(180.26)152(160.04)7(8.78)9(11.24)14(9.98)7(10.53)13(13.49)16(11.98)160205182總計4813036547問葉片衰老是否與灌溉方式有關(guān)?問葉片衰老是否與灌溉方式有關(guān)?解:根據(jù)公式計算各格理論值,放在相應(yīng)格的括號中。解:根據(jù)公式計算各格理論值,放在相應(yīng)格的括號中??倲?shù)列總數(shù)行總數(shù)iT第一行第一列為:第一行第一列為:69.140547481160第一行第二列為:第一行第二列為: ,等等。,等等。 78. 85471603062. 598.11)98.1116(98. 9)98. 914(04.160)04.160152(49.13)49.1313(24.11)24.119(26.180)26.180183(53.10)53.107(78. 8)78. 87(69.140)69.140146(22222

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論