第六章非參數(shù)檢驗_第1頁
第六章非參數(shù)檢驗_第2頁
第六章非參數(shù)檢驗_第3頁
第六章非參數(shù)檢驗_第4頁
第六章非參數(shù)檢驗_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章非參數(shù)檢驗第1頁,共42頁,2023年,2月20日,星期三主要內容非參數(shù)檢驗和參數(shù)檢驗的區(qū)別總體分布的卡方檢驗二項分布檢驗SPSS單樣本變量值隨機性檢驗SPSS單樣本K-S檢驗兩獨立樣本非參數(shù)檢驗多獨立樣本非參數(shù)檢驗兩配對樣本非參數(shù)檢驗多配對樣本非參數(shù)檢驗第2頁,共42頁,2023年,2月20日,星期三非參數(shù)檢驗簡介參數(shù)檢驗方法檢驗的內容是總體分布的某些參數(shù),例如均值,方差,比率等。非參數(shù)檢驗主要用于不考慮被研究對象的總體分布,或對總體的分布不做任何事先的假定的檢驗。非參數(shù)檢驗的內容不是總體分布的某些參數(shù),而是檢驗總體某些有關的性質,例如總體的分布位置、分布形狀之間的比較,或者各樣本所在總體是否獨立等。第3頁,共42頁,2023年,2月20日,星期三非參數(shù)檢驗方法的優(yōu)點穩(wěn)健性:因對總體分布的約束條件放寬,從而對一些離群值或極端值不至于太敏感。使用范圍廣:對數(shù)據(jù)的度量標準(或測量測度)無約束,定序數(shù)據(jù)、定量數(shù)據(jù)都可;部分數(shù)據(jù)缺失也可;小樣本、分布未知樣本、數(shù)據(jù)污染樣本、混雜樣本等都可以應用非參數(shù)方法。第4頁,共42頁,2023年,2月20日,星期三非參數(shù)檢驗的應用范圍參數(shù)檢驗方法的條件不滿足。例如樣本來自的總體不服從正態(tài)分布,T檢驗不適用,必須應用非參數(shù)方法來比較兩個總體的中心趨勢。研究定類變量和定序變量之間的關系。第5頁,共42頁,2023年,2月20日,星期三SPSS非參數(shù)檢驗第6頁,共42頁,2023年,2月20日,星期三非參數(shù)檢驗非參數(shù)檢驗根據(jù)樣本數(shù)目以及樣本之間的關系可以分為:單樣本非參數(shù)檢驗兩獨立樣本非參數(shù)檢驗多獨立樣本非參數(shù)檢驗兩配對樣本非參數(shù)檢驗多配對樣本非參數(shù)檢驗第7頁,共42頁,2023年,2月20日,星期三單樣本非參數(shù)檢驗SPSS的單樣本非參數(shù)檢驗方法包括:總體分布的卡方(Chi-square)檢驗二項分布(Binomial)檢驗單樣本K-S(Kolmogorov-Smirnov)檢驗單樣本變量值隨機性檢驗(RunsTest)第8頁,共42頁,2023年,2月20日,星期三卡方檢驗卡方檢驗是一種常用的對總體分布進行檢驗的非參數(shù)檢驗方法。例如,醫(yī)生研究心臟病人猝死人數(shù)與日期的關系,檢驗現(xiàn)在的人口結構和十年前是否一樣,血型是否和人的性格有關系,現(xiàn)代社會中受過高等教育、高中畢業(yè)、初中畢業(yè)、小學畢業(yè)和文盲的比例是否為3:6:10:2:1等問題都可以通過卡方檢驗來實現(xiàn)。第9頁,共42頁,2023年,2月20日,星期三卡方檢驗的定義定義:總體分布的卡方檢驗適用于配合度檢驗,是根據(jù)樣本數(shù)據(jù)的實際頻數(shù)推斷總體分布與期望分布或理論分布是否有顯著差異??ǚ綑z驗的原假設是:H0樣本來自的總體的分布與假設的分布(又稱期望分布或者理論分布)無顯著差異。第10頁,共42頁,2023年,2月20日,星期三卡方檢驗的原理(1)卡方檢驗的基本思想是,如果從一個隨機變量X所在的總體中隨機抽取若干個觀察樣本,這些觀察樣本落在X的k個互不相交的子集中的觀測頻數(shù)服從一個多項分布,這個多項分布當k趨于無窮時近似服從卡方分布。第11頁,共42頁,2023年,2月20日,星期三卡方檢驗的原理(2)因此假設樣本來自總體服從某個期望分布或理論分布,同時獲得樣本數(shù)據(jù)各子集的實際觀察頻數(shù),并根據(jù)下面的公式計算統(tǒng)計量Q,作出推斷:其中,Qi表示觀察頻數(shù),Ei表示期望頻數(shù)或理論頻數(shù)??梢奞值越大,表示觀察頻數(shù)和理論頻數(shù)越不接近;Q值越小,說明觀察頻數(shù)和理論頻數(shù)越接近。第12頁,共42頁,2023年,2月20日,星期三卡方檢驗的原理(3)SPSS將自動計算Q統(tǒng)計量,由于Q統(tǒng)計量服從自由度為k-1的卡方分布,因此SPSS將根據(jù)卡方分布表給出Q統(tǒng)計量所對應的相伴概率值。如果相伴概率小于或等于顯著性水平α,則應拒絕零假設H0,認為樣本來自的總體分布形態(tài)與期望分布或理論分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設,認為樣本來自的總體分布形態(tài)與期望分布或理論分布不存在顯著差異。第13頁,共42頁,2023年,2月20日,星期三卡方檢驗例子某地一周內各日患憂郁癥的人數(shù)分布如下表所示,請檢驗一周內各日患憂郁癥人數(shù)是否滿足1:1:2:2:1:1:1第14頁,共42頁,2023年,2月20日,星期三單擊Data菜單中的WeightCases命令,彈出WeightCases對話框,選中Weightcasesby選項,將變量“患者數(shù)”添加到FrequencyVariable框中,定義該變量為權數(shù),再單擊OK按鈕,返回數(shù)據(jù)編輯窗口。第15頁,共42頁,2023年,2月20日,星期三第16頁,共42頁,2023年,2月20日,星期三彈出Chi-SquareTest對話框,要對一周內各日的人數(shù)進行分布分析,故在對話框左側的變量列表中選擇“周日”變量,使之添加到TestVariableList框中。確定待檢驗樣本的取值范圍所有數(shù)據(jù)都參加檢驗用戶自定義一個取值范圍,只有在這個范圍內的數(shù)據(jù)才參與檢驗給出期望分布的頻數(shù)表示所有分組的期望頻數(shù)都相同,即期望分布為均勻分布要求用戶輸入期望分布的頻率數(shù),通過單擊Add(增加),Change(更改),Remove(刪除)按鈕對期望分布進行操作第17頁,共42頁,2023年,2月20日,星期三單擊Chi-SquareTest對話框中的Options按鈕,打開上圖對話框。Options對話框中的Statistics框用來指定輸出附加的分析結果,其中:Descriptive:表示輸出待檢驗變量的描述統(tǒng)計量Quartiles:表示輸出待檢驗變量的四分位數(shù)MissingValues框用來說明缺失值如何處理,其中:Excludecasestest-by-test:表示當分析計算涉及到含有缺失值的變量時,則去掉在該變量上是缺失值的個案Excludecaseslistwise:表示去除所有含缺失值的個案后再進行分析第18頁,共42頁,2023年,2月20日,星期三結果分析第一個表中,周一到周日實際患病的人數(shù)(ObservedN)分別為31、38、70、80、29、24、31,按照給定的理論分布,這一周各天的期望頻數(shù)(ExpectedN)應為33.7、33.7、67.3、67.3、33.7、33.7、33.7。實際觀察頻數(shù)和期望頻數(shù)的差(Residual)分別為-2.7、4.3、2.7、12.7、-4.7、-9.7、-2.7第二表中,Asymp.Sig值即相伴概率值0.331,大于顯著性水平0.05,因此不能拒絕零假設,可以認為樣本來自的總體分布與指定的期望分布無顯著差異,即憂郁癥患病人數(shù)在一周內的比例關系基本是1:1:2:2:1:1:1第19頁,共42頁,2023年,2月20日,星期三二項分布檢驗現(xiàn)實生活中有很多數(shù)據(jù)的取值只有兩類,如醫(yī)學中的生與死、患病的有與無、性別中的男與女、產品的合格與不合格等。從這種二分類總體中抽取的所有可能結果,要么是對立分類中的這一類,要么是另一類,其頻數(shù)分布稱為二項分布。SPSS二項分布檢驗就是根據(jù)收集到的樣本數(shù)據(jù),推斷總體分布是否服從某個指定的二項分布。第20頁,共42頁,2023年,2月20日,星期三二項分布檢驗其零假設是:樣本來自的總體與所指定的某個二項分布不存在顯著的差異。如果相伴概率小于或等于顯著性水平α,則應拒絕零假設H0,認為樣本來自的總體分布形態(tài)與指定的二項分布存在顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設,認為樣本來自的總體分布形態(tài)與指定的二項分布不存在顯著差異。第21頁,共42頁,2023年,2月20日,星期三二項分布檢驗例:某地某一時期內出生35名嬰兒,其中女性19名,男性16名,問這個地方出生嬰兒的性別比例與通常的男女比例(總體概率約為0.5)是否不同?第22頁,共42頁,2023年,2月20日,星期三在Analyze菜單NonparametricTests中選擇BinomialTest命令第23頁,共42頁,2023年,2月20日,星期三在彈出的BinomialTest對話框中,將變量“性別”添加到TestVariableList框中。DefineDichotomy用來確定待檢驗樣本的取值范圍。其中:Getfromdata:表示所有觀察數(shù)據(jù)都參與檢驗,而且這些數(shù)據(jù)本身就是二值數(shù)據(jù)的情況。Cutpoint:如果檢驗變量的數(shù)據(jù)不是二值數(shù)據(jù),則可以選擇該項,并在這里輸入一個分割點,小于該分割點值的觀察值為一類,大于該值為另外一類。輸入二項分布的檢驗概率值第24頁,共42頁,2023年,2月20日,星期三單擊BinomialTest對話框中的Options按鈕,打開上圖對話框。Options對話框中的Statistics框用來指定輸出附加的分析結果,其中:Descriptive:表示輸出待檢驗變量的描述統(tǒng)計量Quartiles:表示輸出待檢驗變量的四分位數(shù)MissingValues框用來說明缺失值如何處理,其中:Excludecasestest-by-test:表示當分析計算涉及到含有缺失值的變量時,則去掉在該變量上是缺失值的個案Excludecaseslistwise:表示去除所有含缺失值的個案后再進行分析第25頁,共42頁,2023年,2月20日,星期三結果分析總共35個觀察數(shù)據(jù),男性16人,女性19人,分別占的比率(ObservedProp.)為0.46和0.54,最后一列(Asymp.Sig.)給出相伴概率為0.736,大于顯著性水平0.05,因此不能拒絕零假設,認為該地區(qū)出生的嬰兒性別比例相等。第26頁,共42頁,2023年,2月20日,星期三SPSS單樣本變量值隨機性檢驗定義:單樣本變量值的隨機性檢驗是對某變量的取值出現(xiàn)是否隨機進行檢驗,也稱為游程檢驗(Run過程)。例如,某村發(fā)生一種地方病,其住戶沿一條河居住,調查時對發(fā)病的住戶標記為“1”,對非發(fā)病住戶標記為“0”。經過調查就可以得到一個以1、0組成的數(shù)據(jù)序列,如101110000111010.人們就會問,這種病的出現(xiàn)是否具有隨機性。要研究這個問題,就需要對上面的0、1序列進行分析,通過驗證0、1出現(xiàn)是否隨機來判定該病出現(xiàn)是否具有隨機性。第27頁,共42頁,2023年,2月20日,星期三SPSS單樣本變量值隨機性檢驗單樣本變量值隨機性檢驗的零假設是:總體某變量的變量值出現(xiàn)是隨機的。單樣本變量值隨機性檢驗通過游程(Run)數(shù)來實現(xiàn)。所謂游程是樣本序列中連續(xù)出現(xiàn)的變量值的次數(shù)。如果該地方病的出現(xiàn)是隨機的,那么在上面的數(shù)據(jù)序列中,將不太可能有許多0或1連續(xù)出現(xiàn)的情況,同時也不太可能出現(xiàn)1和0交叉頻繁的現(xiàn)象。因此出現(xiàn)太少或太多的游程就表明相應的變量值出現(xiàn)在一定程度上不是隨機的。第28頁,共42頁,2023年,2月20日,星期三SPSS單樣本變量值隨機性檢驗在SPSS單樣本變量值隨機性檢驗中,SPSS將利用游程構造Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應拒絕零假設,認為樣本值的出現(xiàn)不是隨機的;如果相伴概率大于顯著性水平,則不能拒絕零假設,認為變量值的出現(xiàn)是隨機的。第29頁,共42頁,2023年,2月20日,星期三SPSS單樣本變量值隨機性檢驗例,某村發(fā)生一種地方病,其住戶沿一條河居住,調查時對發(fā)病的住戶標記為“1”,對非發(fā)病住戶標記為“0”,共35戶居民,問這種病的出現(xiàn)是否具有隨機性。第30頁,共42頁,2023年,2月20日,星期三在彈出的RunsTest對話框中,在左側的變量列表中選擇“發(fā)病情況”變量,使之添加到TestVariableList框中。在臨近割點CutPoint框中有4個選項:Median:中位數(shù)作臨界割點,在臨界割點之下的為一類,大于或等于臨界割點的為另一類。Mode:眾數(shù)作臨界割點,在臨界割點之下的為一類,大于或等于臨界割點的為另一類。Mean:均數(shù)作臨界割點,在臨界割點之下的為一類,大于或等于臨界割點的為另一類。Custom:用戶指定臨界割點,在臨界割點之下的為一類,大于或等于臨界割點的為另一類。本例選擇Custom項,在其方框中輸入1(根據(jù)需要選項,本例是0、1二分變量,故臨界割點值是1.)第31頁,共42頁,2023年,2月20日,星期三單擊RunsTest對話框中的Options按鈕,打開上圖對話框。Options對話框中的Statistics框用來指定輸出附加的分析結果,其中:Descriptive:表示輸出待檢驗變量的描述統(tǒng)計量Quartiles:表示輸出待檢驗變量的四分位數(shù)MissingValues框用來說明缺失值如何處理,其中:Excludecasestest-by-test:表示當分析計算涉及到含有缺失值的變量時,則去掉在該變量上是缺失值的個案Excludecaseslistwise:表示去除所有含缺失值的個案后再進行分析第32頁,共42頁,2023年,2月20日,星期三結果分析從結果表格中看出,總共35個觀察數(shù)據(jù),游程數(shù)(NumberofRuns)為14,測試值(TestValue)為1,得到的相伴概率為0.181,大于顯著性水平0.05,因此不能拒絕零假設,認為患病的住戶沿河分布的情況無聚集性,而是呈隨機分布。第33頁,共42頁,2023年,2月20日,星期三SPSS單樣本K-S檢驗定義:單樣本K-S檢驗是以兩位前蘇聯(lián)數(shù)學家Kolmogorov和Smirnov命名的,也是一種擬合優(yōu)度的非參數(shù)檢驗方法。單樣本K-S檢驗是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機變量的分布形態(tài)。單樣本K-S檢驗可以將一個變量的實際頻數(shù)分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)、指數(shù)(Exponential)分布進行比較。第34頁,共42頁,2023年,2月20日,星期三SPSS單樣本K-S檢驗SPSS單樣本K-S檢驗的零假設為:樣本來自的總體與指定的理論分布無顯著差異。SPSS在統(tǒng)計中將計算K-S的Z統(tǒng)計量。并依據(jù)K-S分布表(小樣本)或正態(tài)分布表(大樣本)給出對應的相伴概率值。如果相伴概率小于或等于用戶的顯著性水平α,則應拒絕零假設,認為樣本來自的總體與指定的分布有顯著差異;如果相伴概率值大于顯著性水平,則不能拒絕零假設,認為樣本來自的總體與指定的分布無顯著差異。第35頁,共42頁,2023年,2月20日,星期三SPSS單樣本K-S檢驗某地144個周歲兒童的身高數(shù)據(jù),問該地區(qū)兒童身高是否呈正態(tài)分布?第36頁,共42頁,2023年,2月20日,星期三彈出的One-SampleKolmogorov-SmirnovTest對話框,左側變量列表中的“人數(shù)”使之添加到TestVariableList框中TestDistribution框中選擇理論

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論