食品實驗設計_第1頁
食品實驗設計_第2頁
食品實驗設計_第3頁
食品實驗設計_第4頁
食品實驗設計_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

食品實驗設計第1頁,共75頁,2023年,2月20日,星期日非參數檢驗的概念是指在總體不服從正態(tài)分布且分布情況不明時,用來檢驗數據資料是否來自同一個總體假設的一類檢驗方法。由于這些方法一般不涉及總體參數故得名。這類方法的假定前提比參數性假設檢驗方法少的多,也容易滿足,適用于計量信息較弱的資料且計算方法也簡單易行,所以在實際中有廣泛的應用。第2頁,共75頁,2023年,2月20日,星期日非參數檢驗的過程1.Chi-Squaretest卡方檢驗2.Binomialtest二項分布檢驗3.Runstest游程檢驗4.1-SampleKolmogorov-Smirnovtest一個樣本柯爾莫哥洛夫-斯米諾夫檢驗5.2independentSamplesTest兩個獨立樣本檢驗6.KindependentSamplesTestK個獨立樣本檢驗7.2relatedSamplesTest兩個相關樣本檢驗8.KrelatedSamplesTest兩個相關樣本檢驗第3頁,共75頁,2023年,2月20日,星期日12.1卡方檢驗Chi-Squaretest

這里介紹的卡方檢驗可以檢驗列聯(lián)表中某一個變量的各個水平是否有同樣比例或者等于你所想象的比例(如5:4:1)實例1:擲骰子300次,變量LMT,1、2、3、4、5、6分別代表六面的六個點,試問這骰子是否均勻。數據data12-01(300個cases)。Analyze->NonparametricTests->ChiSquareTestVariable:lmt想要檢驗的變量由于這是一個均勻分布檢測,使用默認選擇(ExpectedValues:Allcategoriesequal作為零假設);比較有用的結果:sig=.111>0.5,不能拒絕零假設,認為均勻。實例1的數據可以組織成:兩個變量(side面和number次數),6個cases。但在卡方檢驗前要求用number加權。結果同。第4頁,共75頁,2023年,2月20日,星期日補充:卡方檢驗實例實例:心臟病人猝死人數與日期的關系,收集168個觀測數據。其中用1、2、3、4、5、6、7表示是星期幾死的。而人數分別為55、23、18、11、26、20、15。推斷心臟病人猝死人數與日期的關系是否為2.8:1:1:1:1:1:1。(變量2個:死亡日期和死亡人數,Cases7個)加權:Data->WeightCases:死亡人數Analyze->NonparametricTests->ChiSquareTestVariable:死亡日期ExpectedValues:2.8:1:1:1:1:1:1

比較有用的結果:sig=.256>0.5,不能拒絕零假設,認為心臟病人猝死人數與日期的關系為2.8:1:1:1:1:1:1。第5頁,共75頁,2023年,2月20日,星期日12.2二項分布檢驗Binomialtest

二項分布:在現實生活中有很多的取值是兩類的,如人群的男和女、產品的合格和不合格、學生的三好學生和非三好學生、投擲硬幣的正面和反面。這時如果某一類出現的概率是P,則另一類出現的概率就是1-P。這種分布稱為二項分布。實例1:擲一枚比賽用的挑邊器31次,變量tbh,1為出現A面、2為出現A面,試問這挑邊器是否均勻。數據data12-03(31個cases)。Analyze->NonparametricTests->BinomialTestVariable:tbh由于這是一個均勻分布檢測,使用默認選擇(TestProportion:0.5);比較有用的結果:兩組個數和sig=1.00>0.5,不能拒絕零假設,認為挑邊器是均勻。實例1的數據可以組織成:兩個變量(side面和number次數),2個cases。但在二項分布檢驗前要求用number加權。結果同。第6頁,共75頁,2023年,2月20日,星期日補充:二項分布檢驗實例實例:為驗證某批產品的一等品率是否達到90%,現從該批產品中隨機抽取23個樣品進行檢測,結果有19個一等品(1-一等品,0-非一等品)。(變量2個:一等品和個數,Cases2個:119和04)加權:Data->WeightCases:個數Analyze->NonparametricTests->BinomialTestVariable:一等品TestProportion:0.9比較有用的結果:兩組個數和sig=.193>0.5,不能拒絕零假設,認為該批產品的一等品率達到了90%。第7頁,共75頁,2023年,2月20日,星期日12.3游程檢驗Runstest單樣本變量隨機性檢驗是對某變量值出現是否隨機進行檢驗。實例1(同二項分布檢驗)

:擲一枚比賽用的挑邊器31次,變量tbh,1為出現A面、2為出現A面,試問這挑邊器出現AB面是否隨機。數據data12-03(31個cases)。Analyze->NonparametricTests->Runs

TestVariable:tbhCutPoint:Custom:2比較有用的結果:總case數(31)、游程Run數(21)、sig=.142>0.5,不能拒絕零假設,認為挑邊器出現AB面是隨機的。第8頁,共75頁,2023年,2月20日,星期日12.4一個樣本柯爾莫哥洛夫-斯米諾夫檢驗

1-SampleKolmogorov-Smirnovtest單樣本K-S檢驗是利用樣本數據推斷總體是否服從某一理論分布,適用于探索連續(xù)型隨機變量的分布形態(tài)(判斷定距變量的分布情況):Normal正態(tài)分布、Uniform均勻分布、Poisson泊松分布、Exponential指數分布。實例

:盧瑟福和蓋革作了一個著名的實驗,他們觀察了長為7.5秒的時間間隔里到達某個計數器的由某塊放射物資放出的alfa粒子質點數,共觀察了2608次。數據data12-05(1個變量zd,2608個cases,按0-10排序)。試問這種分布規(guī)律是否服從泊松分布Analyze->NonparametricTests->1-SampleK-STestVariable:zdTestDistribution:Poisson比較有用的結果:均值(3.8673)、sig=.850>0.5,不能拒絕零假設,認為服從泊松分布。第9頁,共75頁,2023年,2月20日,星期日12.5兩個獨立樣本檢驗

2independentSamplesTest通過分析兩個樣本數據,推斷它們的分布是否存在顯著性差異。方法有四種:Mann-WhitneyU:是通過對平均秩的研究來實現推斷的K-SZ:是通過對分布的研究來實現推斷的Mosesextremereactions:一個作為控制樣本,另一個作為實驗樣本WaldWolfwitzRuns:是通過對游程的研究來實現推斷的實例

:甲乙兩種安眠藥服用后的效果。數據data12-06(2個變量:組別zb和延長時間ycss,20個cases)。試問這兩種藥物的療效是否有顯著性差異。Analyze->NonparametricTests->2independentSamples

TestVariable:ycssGrouping:zb(1,2)Testtype:四種均選比較有用的結果:比較四個sig值,有三個sig>.5,不能拒絕零假設認為療效無顯著性差異。第10頁,共75頁,2023年,2月20日,星期日12.6多個獨立樣本檢驗

KindependentSamplesTest通過分析多個樣本數據,推斷它們的分布是否存在顯著性差異。方法有三種:Median:是通過對中位數的研究來實現推斷的K-W:是通過對推廣的平均秩的研究來實現推斷的J-T:與兩個獨立樣本檢驗的Mann-WhitneyU類似實例

:某車間用四種不同的操作方法檢測產品優(yōu)等品率的實驗數據。數據data12-07(2個變量:方法ff和優(yōu)等品率ydpl,21個cases)。試問這四種不同的操作方法對產品優(yōu)等品率是否有顯著性差異。Analyze->NonparametricTests->KindependentSamples

TestVariable:ydpl

Grouping:ff(1,4)Testtype:三種均選比較有用的結果:比較三個sig值,K-W方法的sig=.009<.05,拒絕零假設,認為這四種不同的操作方法對產品優(yōu)等品率是有顯著性差異。其他二個方法的sig>.5,但不用,原因是觀測量太少。第11頁,共75頁,2023年,2月20日,星期日12.7兩個相關樣本檢驗

2relatedSamplesTest同一個被測試者,前后測兩次,彼此相關。方法有四種。實例

:某校15名男生的長跑鍛煉后晨脈變化數據。數據data12-08(2個變量:鍛煉前dlq和鍛煉后dlh優(yōu),21個cases)。試問鍛煉前后的晨脈有無顯著性差異。Analyze->NonparametricTests->2relatedSamples

TestPairs:dlq-dlhTesttype:選一種或多種比較有用的結果:看sig值,sig<.05,拒絕零假設,認為鍛煉前后的晨脈有顯著性的差異。第12頁,共75頁,2023年,2月20日,星期日12.8多個相關樣本檢驗

KrelatedSamplesTest對多個被測試者,多個打分,看打分是否有顯著性差異。方法有三種:CochranQ:要求樣本數據為二值的(1-滿意0-不滿意)Friedman:利用秩實現Kendall協(xié)同系數檢驗:H0:協(xié)同系數為0(評分標準不相關的或者是隨機的)實例

:9個顧客對三種款式襯衫的喜愛程度(1-最喜愛2-其次3-不喜愛)。數據data12-09(3個變量:款式A,款式B,款式C,27個cases)。試問顧客對三種款式襯衫的喜愛程度是否相同。Analyze->NonparametricTests->krelatedSamples

TestVariables:abcTesttype:選一種或多種比較有用的結果:看sig值,sig<.05,拒絕零假設,認為顧客對三種款式襯衫的喜愛程度是不相同的。第13頁,共75頁,2023年,2月20日,星期日補充:非參數檢驗以下的講義是吳喜之教授有關非參數檢驗的講義,我覺得比書上講得清楚。第14頁,共75頁,2023年,2月20日,星期日非參數檢驗第15頁,共75頁,2023年,2月20日,星期日為什么用非參數方法?

經典統(tǒng)計的多數檢驗都假定了總體的背景分布。但也有些沒有假定總體分布的具體形式,僅僅依賴于數據觀測值的相對大小(秩)或零假設下等可能的概率等和數據本身的具體總體分布無關的性質進行檢驗。這都稱為非參數檢驗。第16頁,共75頁,2023年,2月20日,星期日為什么用非參數方法?

這些非參數檢驗在總體分布未知時有很大的優(yōu)越性。這時如果利用傳統(tǒng)的假定分布已知的檢驗,就會產生錯誤甚至災難。非參數檢驗總是比傳統(tǒng)檢驗安全。但是在總體分布形式已知時,非參數檢驗就不如傳統(tǒng)方法效率高。這是因為非參數方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設的情況,非參數檢驗無法拒絕。但非參數統(tǒng)計在總體未知時效率要比傳統(tǒng)方法要高,有時要高很多。是否用非參數統(tǒng)計方法,要根據對總體分布的了解程度來確定。

第17頁,共75頁,2023年,2月20日,星期日非參數方法這里介紹一些非參數檢驗。關于非參數方法的確切定義并不很明確。我們就其最廣泛的意義來理解。在計算中,諸如列聯(lián)表分析中的許多問題都有精確方法,MonteCarlo抽樣方法和用于大樣本的漸近方法等選擇。精確方法比較費時間,后兩種要粗糙一些,但要快些。

第18頁,共75頁,2023年,2月20日,星期日秩(rank)

非參數檢驗中秩是最常使用的概念。什么是一個數據的秩呢?一般來說,秩就是該數據按照升序排列之后,每個觀測值的位置。例如我們有下面數據Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數據Xi的秩。

第19頁,共75頁,2023年,2月20日,星期日秩(rank)

利用秩的大小進行推斷就避免了不知道背景分布的困難。這也是大多數非參數檢驗的優(yōu)點。多數非參數檢驗明顯地或隱含地利用了秩的性質;但也有一些非參數方法沒有涉及秩的性質。

第20頁,共75頁,2023年,2月20日,星期日列聯(lián)表問題

我們講過列聯(lián)表的c2檢驗問題(第七章)。這里介紹的檢驗可以檢驗列聯(lián)表中某一個變量的各個水平是否有同樣比例或者等于你所想象的比例。每個檢驗都可以選擇使用精確方法,MonteCarlo抽樣方法或用于大樣本的漸近方法。利用數據table7.sav,假定你想知道收入的比例是否是5比4比1(零假設)。而且選擇精確檢驗,你可以得到各種檢驗結果如下:第21頁,共75頁,2023年,2月20日,星期日列聯(lián)表問題

利用數據table7.sav,假定你想知道收入的比例是否是5比4比1(零假設)。而且選擇精確檢驗,你可以得到各種檢驗結果如下:第22頁,共75頁,2023年,2月20日,星期日列聯(lián)表問題

該結果除了給出了精確檢驗的p值,表明無論還給出漸近檢驗的p值;兩個都是0.000;這表明零假設的比例欠妥。輸出還給出了Pearson統(tǒng)計量中的Oi和Ei(分別為下表中的ObservedN和ExpectedN):第23頁,共75頁,2023年,2月20日,星期日列聯(lián)表問題

如果要檢驗變量的各水平是否都相等,從SPSS可以得到對這三個變量的檢驗(對每個變量的零假設是各水平影響相同)結果:

SPSS還分別給出對每個變量的Pearson統(tǒng)計量中的Oi和Ei。第24頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

用table7.sav數據。假定已經加權了(number:權)Analyze-NonparametricTests-ChiSquare。然后選擇想要檢驗的變量(如income),如要檢驗其水平是否相等,則在ExpectedValues選Allcategoriesequal作為零假設(默認選擇);如要檢驗其水平是否為某比例,則在下面Values輸入你的比例(我們是5比4比1,逐個輸入)作為零假設。點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。如果選入的變量多于一個,則檢驗的都是水平相等的零假設。最后OK即可。第25頁,共75頁,2023年,2月20日,星期日

單樣本Kolmogorov-Smirnov檢驗

單樣本的Kolmogorov-Smirnov檢驗(K-S檢驗)是用來檢驗一個數據的觀測累積分布是否是已知的理論分布。這些作為零假設的理論分布在SPSS的選項中有正態(tài)分布(Normal),泊松分布(Poisson),均勻分布(Uniform)和指數分布(Exponential)。在SPSS軟件中對于是否是正態(tài)分布或均勻分布的檢驗統(tǒng)計量為第26頁,共75頁,2023年,2月20日,星期日數據ksdata.sav的K-S檢驗

我們檢驗它是否是正態(tài)分布、均勻分布和指數分布。輸出結果分別顯示在下面三個表中:由于sig=.074>.05,不能拒絕正態(tài)分布(Normal)零假設。第27頁,共75頁,2023年,2月20日,星期日由于sig=.000<.05,拒絕均勻分布(Uniform)零假設第28頁,共75頁,2023年,2月20日,星期日由于sig=.664>.05,不能拒絕指數分布(Exponential)零假設比較三種分布檢驗,認為是該數據服從指數分布第29頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用我們的ksdata.sav數據。選項為Analyze-NonparametricTests-1SampleK-S。然后把變量(這里是x)選入VariableList。再在下面TestDistribution選中零假設的分布(Normal、Poisson、Uniform和Exponential)作為零假設。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可。

第30頁,共75頁,2023年,2月20日,星期日關于隨機性的游程檢驗(runtest)

游程檢驗方法是檢驗一個取兩個值的變量的這兩個值的出現是否是隨機的。假定下面是由0和1組成的一個這種變量的樣本(數據run1.sav):0000111111001011100000000其中相同的0(或相同的1)在一起稱為一個游程(單獨的0或1也算)。這個數據中有4個0組成的游程和3個1組成的游程。一共是R=7個游程。其中0的個數為m=15,而1的個數為n=10。

第31頁,共75頁,2023年,2月20日,星期日關于隨機性的游程檢驗(runtest)

出現0和1的的這樣一個過程可以看成是參數為某未知p的Bernoulli試驗。但在給定了m和n之后,在0和1的出現是隨機的零假設之下,R的條件分布就和這個參數無關了。根據初等概率論,R的分布可以寫成(令N=m+n)第32頁,共75頁,2023年,2月20日,星期日關于隨機性的游程檢驗(runtest)

于是就可以算出在零假設下有關R的概率,以及進行有關的檢驗了。利用上面公式可進行精確檢驗;也可以利用大樣本的漸近分布和利用MonteCarlo方法進行檢驗。利用上面數據的結果是:第33頁,共75頁,2023年,2月20日,星期日關于隨機性的游程檢驗(runtest)

當然,游程檢驗并不僅僅用于只取兩個值的變量,它還可以用于某個連續(xù)變量的取值小于某個值及大于該值的個數(類似于0和1的個數)是否隨機的問題??聪旅胬?。例(run2.sav):從某裝瓶機出來的30盒化妝品的重量如下(單位克)71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了看該裝瓶機是否工作正常,首先需要驗證是否大于和小于中位數的個數是否是隨機的(零假設為這種個數的出現是隨機的)。

第34頁,共75頁,2023年,2月20日,星期日關于隨機性的游程檢驗(runtest)

如果把小于中位數的記為0,否則記為1,上面數據變成下面的0-1序列111111110111101000000000000110這就歸為上面的問題。當然這里進行這種變換只是為了易于理解。實際計算時,用不著這種變換,計算機會自動處理這個問題的。直接利用這個數據,通過SPSS,得到下面游程檢驗結果的輸出。

第35頁,共75頁,2023年,2月20日,星期日第36頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

用run2.sav數據。選項為Analyze-NonparametricTests-Runs。然后把變量(這里是length)選入VariableList。再在下面CutPoint選中位數(Median)。當然,也可以選其他值,如均值(Mean),眾數(Mode)或任何你愿意的數目(放在Custom)。注意在對前面的由0和1組成的序列(run1.sav進行隨機性檢驗時,要選均值(為什么?)。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可。第37頁,共75頁,2023年,2月20日,星期日Wilcoxon(Mann-Whitney)秩和檢驗這里介紹常用的Wilcoxon(或稱Mann-Whitney)秩和檢驗。它的原理很簡單,假定第一個樣本有m個觀測值,第二個有n個觀測值。把兩個樣本混合之后把這m+n個觀測值升冪排序,記下每個觀測值在混合排序下面的秩。之后分別把兩個樣本所得到的秩相加。記第一個樣本觀測值的秩的和為WX而第二個樣本秩的和為WY。這兩個值可以互相推算,稱為Wilcoxon統(tǒng)計量。該統(tǒng)計量的分布和兩個總體分布無關。由此分布可以得到p-值。直觀上看,如果WX與WY之中有一個顯著地大,則可以選擇拒絕零假設。該檢驗需要的唯一假定就是兩個總體的分布有類似的形狀(不一定對稱)。第38頁,共75頁,2023年,2月20日,星期日Wilcoxon(Mann-Whitney)秩和檢驗下面數據(GDP.sav)是地區(qū)1的十個城市和地區(qū)2的15個城市的人均GDP(元)。現在要想以此作為兩個樣本來檢驗兩個地區(qū)的人均GDP的中位數m1和m2是否一樣,即雙尾檢驗H0:m1=m2對Ha:m1≠m2。由于地區(qū)2的人均GDP的中位數大于地區(qū)1的中位數,因此也可以做單尾檢驗H0:m1=m2對Ha:m1<m2。地區(qū)1:3223 4526 3836 2781 5982 3216 4710 5628 2303 4618地區(qū)2:5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257由SPSS的輸出可以得到下面結果:

第39頁,共75頁,2023年,2月20日,星期日第40頁,共75頁,2023年,2月20日,星期日Wilcoxon(Mann-Whitney)秩和檢驗該結果頭兩行顯示了Mann-Whitney和Wilcoxon統(tǒng)計量的值。另外和我們需要結果的相關部分為:對于雙尾檢驗H0:m1=m2對Ha:m1≠m2,p-值為0.016(見“ExactSig.(2-tailed)”);而對于單尾檢驗H0:m1=m2對Ha:m1<m2(見“ExactSig.(1-tailed)”),p-值為0.008。這兩個結果是精確計算的。通常在樣本量大的時候利用近似方法得到漸近分布的p-值(見“Asymp.Sig.(2-tailed)”),它只給了雙尾檢驗的近似p-值0.017,和精確值差別不大。注意單尾檢驗的p-值是雙尾檢驗的p-值的一半。這個例子的結果表明,可以拒絕原假設,即有理由認為地區(qū)2的人均GDP的中位數要高一些。第41頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用GDP.sav數據。選項為Analyze-NonparametricTests-2IndependentSamples。把變量(gdp)選入TestVariable

List;再把用1和2分類的變量area輸入進GroupingVariable,在DefineGroups輸入1和2。在TestType選中Mann-Whitney。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第42頁,共75頁,2023年,2月20日,星期日兩樣本分布的Kolmogorov-Smirnov檢驗

假定有分別來自兩個獨立總體的兩個樣本。要想檢驗它們背后的總體分布相同的零假設,可以進行兩獨立樣本的Kolmogorov-Smirnov檢驗。原理完全和單樣本情況一樣。只不過把檢驗統(tǒng)計量中零假設的分布換成另一個樣本的經驗分布即可。假定兩個樣本的樣本量分別為n1和n2,用S1(X)和S2(X)分別表示兩個樣本的累積經驗分布函數。再記Dj=S1(Xj)-S2(Xj)。近似正態(tài)分布的檢驗統(tǒng)計量為

第43頁,共75頁,2023年,2月20日,星期日計算結果

twonp.sav:兩種破壞性試驗的持續(xù)時間。根據這個數據,n1=30,n2=25。由SPSS輸出,得到

第44頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用twonp.sav數據。選項為Analyze-NonparametricTests-2IndependentSamples。把變量(duration)選入TestVariableList;再把用1和2分類的變量type輸入到GroupingVariable,在DefineGroups輸入1和2。在TestType選中Kolmogorov-SmirnovZ。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第45頁,共75頁,2023年,2月20日,星期日兩樣本Wald-Wolfowitz游程檢驗

Wald-Wolfowitz游程檢驗(Wald-Wolfowitzrunstest)和Kolmogorov-Smirnov檢驗都是看兩個樣本所代表的總體是否分布類似。但是所采取的方法不一樣。Wald-Wolfowitz游程檢驗把兩個樣本混合之后,按照大小次序排列,一個樣本的觀測值在一起的為一個游程。和單樣本的游程問題類似。可以由游程個數R看出兩個樣本在排序中是否隨機出現。由twonp.sav數據,可以得到下面SPSS關于Wald-Wolfowitz游程檢驗的輸出:

第46頁,共75頁,2023年,2月20日,星期日軟件使用:數據和前面一樣,只在TestType選Wald-Wolfowitzruns。

第47頁,共75頁,2023年,2月20日,星期日Kruskal-Wallis關于多個樣本的秩和檢驗

這個檢驗的目的是看多個總體的位置參數是否一樣。方法和Wilcoxon-Mann-Whitney檢驗的思想類似。假定有k個總體。先把從這個k個總體來的樣本混合起來排序,記各個總體觀測值的秩之和為Ri,i=1,…,k。顯然如果這些Ri很不相同,就可以認為它們位置參數相同的零假設不妥(備選假設為各個位置參數不全相等)。第48頁,共75頁,2023年,2月20日,星期日Kruskal-Wallis關于多個樣本的秩和檢驗

注意這里所說的位置參數是在下面意義上的qi;由于它在分布函數Fi(x)中可以和變元x相加成為F(x+qi)的樣子,所以稱qi為位置參數。形式上,假定這些樣本有連續(xù)分布F1,…,Fk,零假設為H0:F1=…=Fk,備選假設為Ha:Fi(x)=F(x+qi),i=1,…,k,這里F為某連續(xù)分布函數,而且這些參數qi并不相等。Kruskal-Wallis檢驗統(tǒng)計量為

第49頁,共75頁,2023年,2月20日,星期日Kruskal-Wallis關于多個樣本的秩和檢驗

公式中ni為第i個樣本量,而N為各個樣本量之和(總樣本量)。如果觀測值中有大小一樣的數值,這個公式會有稍微的變化。這個統(tǒng)計量在位置參數相同的零假設下有漸近的自由度為k-1的c2分布。Kruskal-Wallis檢驗僅僅要求各個總體變量有相似形狀的連續(xù)分布。第50頁,共75頁,2023年,2月20日,星期日數據house.sav:三個區(qū)域房價的數據

為了調查三個地區(qū)的房價是否類似,在每個地區(qū)抽樣,得到三個樣本量分別為20、30、25的房價樣本。利用SPSS軟件,很容易得到下面的檢驗結果:第51頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用house.sav數據。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariable

List;再把數據中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Kruskal-WallisH。點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第52頁,共75頁,2023年,2月20日,星期日Jonckheere-Terpstra多樣本的秩檢驗

這個檢驗處理的問題和Kruskal-Wallis檢驗類似,零假設都是各個總體的位置參數相同,但這里的備選假設為各個總體的位置參數按升冪排列(如為降冪排列,可把總體編號顛倒順序即為升冪排列)。注意這里所說的位置參數和前面的Kruskal-Wallis檢驗中的位置參數意義一樣。Jonckheere-Terpstra檢驗先在每兩個樣本所有觀測值對之間比較,計算第i個樣本觀測值中小于第j個樣本觀測值的對子數:第53頁,共75頁,2023年,2月20日,星期日數據house.sav:三個區(qū)域房價的數據

很容易得到SPSS的Jonckheere-Terpstra檢驗結果輸出:

第54頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用house.sav數據。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariableList;再把數據中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Jonckheere-Terpstra。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可

第55頁,共75頁,2023年,2月20日,星期日Brown-Mood中位數檢驗

在有數個獨立樣本的情況,希望知道它們的中位數是否相等。零假設是這些樣本所代表的總體的中位數相等。備選假設是這些中位數不全相等。假定有k個總體,ni為第i個樣本量;把所有樣本量之和記為N。先把從這個k個總體來的樣本混合起來排序,找出它們的中位數。再計算每個總體中小于該中位數的觀測值個數O1i,i=1,…,k,和每個總體中大于該中位數的觀測值個數O2i,i=1,…,k。這樣就形成了一個由元素Oij組成的2×k表。其列總和為ni,i=1,…,k;而兩個行總和為各樣本小于總中位數的觀測值總和:R1=O11+O12+…+O1k及各樣本大于總中位數的觀測值總和R2=O21+O22+…+O2k。這顯然是一個列聯(lián)表,可以用Pearsonc2統(tǒng)計量,即第56頁,共75頁,2023年,2月20日,星期日house.sav數據這里第57頁,共75頁,2023年,2月20日,星期日第58頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用house.sav數據。選項為Analyze-NonparametricTests-KIndependentSamples。把變量(這里是price)選入TestVariableList;再把數據中用1、2、3來分類的變量group輸入GroupingVariable,在DefineGroups輸入1、2、3。在下面TestType選中Median。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可

第59頁,共75頁,2023年,2月20日,星期日Friedman秩和檢驗

前面討論了兩因子試驗設計數據的方差分析,那里所用的F檢驗需要假定總體的分布為正態(tài)分布。有一種非參數方差分析方法,稱為Friedman(兩因子)秩和檢驗,或Friedman方差分析。它適用于兩個因子的各種水平的組合都有一個觀測值的情況。第60頁,共75頁,2023年,2月20日,星期日Friedman秩和檢驗

假定第一個因子有k個水平(稱為處理,treatment),第二個因子有b個水平(稱為區(qū)組);因此一共有k×b=kb個觀測值。這里之所以稱一個因子為處理,是因為這是我們想要看該因子各水平是否對試驗結果有顯著的不同(它的各個水平的觀測值也就是本小節(jié)的多個相關樣本)。而另一個因子稱為區(qū)組,不同的區(qū)組也可能對結果有影響。下面是一個例子。第61頁,共75頁,2023年,2月20日,星期日數據fert.sav這里有三種肥料作為第一個因子(肥料因子)的三個水平;而四種土壤為第二個因子(土壤因子)的四個水平。感興趣于是否這三種肥料對于某作物的產量有區(qū)別。稱肥料因子為處理,而土壤因子為區(qū)組。數據在下表中(表中數字為相應組合的產量,單位公斤)。

肥料種類肥料A肥料B肥料C土壤類型土壤1224668土壤2253648土壤3182120土壤4111319第62頁,共75頁,2023年,2月20日,星期日Friedman秩和檢驗

Friedman秩和檢驗是關于位置的,和Kruskal-Wallis檢驗類似,形式上,假定這些樣本有連續(xù)分布F1,…,Fk,零假設為H0:F1=…=Fk,備選假設為Ha:Fi(x)=F(x+qi),i=1,…,k,這里F為某連續(xù)分布函數,而且這些參數qi并不相等。雖然這和以前的Kruskal-Wallis檢驗一樣,但是由于區(qū)組的影響,要首先在每一個區(qū)組中計算各個處理的秩;再把每一個處理在各區(qū)組中的秩相加.如果Rij表示在j個區(qū)組中第i個處理的秩。則秩按照處理而求得的和為

第63頁,共75頁,2023年,2月20日,星期日Friedman秩和檢驗

這樣做的目的是在每個區(qū)組內比較處理。例如,同個年齡段中比較藥品的療效比不分年齡來比較療效要合理;在同一個部位比較不同的材料要比混合起來比較要合理等等。這里要引進的Friedman統(tǒng)計量定義為第一個式子表明,如果各個處理很不一樣,和的平方就會很大,結果就顯著。第二個公式是為了計算方便而導出的。它有近似的(有k-1個自由度的)c2分布。

第64頁,共75頁,2023年,2月20日,星期日fert.sav數據第65頁,共75頁,2023年,2月20日,星期日SPSS軟件使用說明

使用fert.sav數據。選項為Analyze-NonparametricTests-KRelatedSamples。然后把變量(這里是a、b、c)選入TestVariableList。在下面TestType選中Friedman。在點Exact時打開的對話框中可以選擇精確方法(Exact),MonteCarlo抽樣方法(MonteCarlo)或用于大樣本的漸近方法(Asymptoticonly)。最后OK即可第66頁,共75頁,2023年,2月20日,星期日Kendall協(xié)同系數檢驗在實踐中,常需要按照某些特別的性質來多次對一些個體進行評估或排序;比如幾個(m個)評估機構對一些(n個)學校進行排序。人們想要知道,這些機構的不同結果是否一致。如果很不一致,則該評估多少有些隨機,意義不大。換句話說,這里想要檢驗的零假設是:這些對于不同學校的排序是不相關的或者是隨機的;而備選假設為:這些對不同學校的排序是正相關的或者是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論