第七章 SPSS的非參數(shù)檢驗.ppt_第1頁
第七章 SPSS的非參數(shù)檢驗.ppt_第2頁
第七章 SPSS的非參數(shù)檢驗.ppt_第3頁
第七章 SPSS的非參數(shù)檢驗.ppt_第4頁
第七章 SPSS的非參數(shù)檢驗.ppt_第5頁
已閱讀5頁,還剩129頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7章SPSS的非參數(shù)檢驗 前面已經(jīng)討論的許多統(tǒng)計分析方法對總體有特殊的要求 如T檢驗要求總體符合正態(tài)分布 F檢驗要求誤差呈正態(tài)分布且各組方差整齊 等等 這些方法常用來估計或檢驗總體參數(shù) 統(tǒng)稱為參數(shù)檢驗 但許多調查或實驗所得的科研數(shù)據(jù) 其總體分布未知或無法確定 因為有的數(shù)據(jù)不是來自所假定分布的總體 或者數(shù)據(jù)根本不是來自一個總體 還有可能數(shù)據(jù)因為某種原因被嚴重污染 這樣在假定分布的情況下進行推斷的做法就有可能產(chǎn)生錯誤的結論 此時人們希望檢驗對一個總體分布形狀不必作限制 這種不是針對總體參數(shù) 而是針對總體的某些一般性假設 如總體分布 的統(tǒng)計分析方法稱非參數(shù)檢驗 NonparametricTests 非參數(shù)檢驗根據(jù)樣本數(shù)目以及樣本之間的關系可以分為單樣本非參數(shù)檢驗 兩獨立樣本非參數(shù)檢驗 多獨立樣本非參數(shù)檢驗 兩配對樣本非參數(shù)檢驗和多配對樣本非參數(shù)檢驗幾種 本節(jié)將介紹總體分布的卡方 Chi square 檢驗 二項分布 Binomial 檢驗 單樣本K S Kolmogorov Smirnov 檢驗 單樣本變量值隨機性檢驗 RunsTest 等常用的非參數(shù)檢驗方法 7 1單樣本的非參數(shù)檢驗 7 1 1總體分布的卡方 Chi square 檢驗 在得到一批樣本數(shù)據(jù)后 人們往往希望從中得到樣本所來自的總體的分布形態(tài)是否和某種特定分布相擬合 這可以通過繪制樣本數(shù)據(jù)直方圖的方法來進行粗略的判斷 如果需要進行比較準確的判斷 則需要使用非參數(shù)檢驗的方法 其中總體分布的卡方檢驗 也記為 2檢驗 就是一種比較好的方法 7 1 1 1卡方檢驗的基本思想 定義 總體分布的卡方檢驗適用于吻合性檢驗 是根據(jù)樣本數(shù)據(jù)推斷總體分布與期望分布或理論分布是否有顯著差異 它的零假設H0 樣本來自的總體分布和期望分布或某一理論分布沒有顯著差異 因此 總體分布的卡方檢驗是一種吻合性檢驗 比較適用于一個因素的多項分類數(shù)據(jù)分析 總體分布的卡方檢驗的數(shù)據(jù)是實際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 7 1 1 2總體分布卡方檢驗的應用舉例 研究問題為研究心臟病人猝死人數(shù)與日期的關系 收集到了168個觀察數(shù)據(jù) 其中星期一至星期日的死亡人數(shù)分別依次為55 23 18 11 26 20 15 并用數(shù)字1 7表示星期 現(xiàn)在利用這批樣本數(shù)據(jù) 推斷心臟病人猝死人數(shù)與日期的關系是否為2 8 1 1 1 1 1 1 問題 為驗證某批產(chǎn)品的一級品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機抽取23個樣品進行檢測并得到檢測結果數(shù)據(jù) 其中1表示一級品 0表示非一級品 7 1 2二項分布檢驗 7 1 2 1二項分布檢驗的基本思想 現(xiàn)實生活中有很多數(shù)據(jù)的取值只有兩類 如醫(yī)學中的生與死 患病的有與無 性別中的男性和女性 產(chǎn)品的合格與不合格等 從這種二分類總體中抽取的所有可能結果 要么是對立分類中的這一類 要么是另一類 其頻數(shù)分布稱為二項分布 調用SPSS中的二項分布檢驗 Binomial 可對樣本資料進行二項分布分析 SPSS二項分布檢驗就是根據(jù)收集到的樣本數(shù)據(jù) 推斷總體分布是否服從某個指定的二項分布 其零假設是H0 樣本來自的總體與所指定的某個二項分布不存在顯著的差異 SPSS中的二項分布檢驗 在樣本小于或等于30時 采用精確檢驗 按照計算二項分布概率的公式進行計算 計算n次試驗中成功出現(xiàn)的次數(shù)小于等于K次的概率 樣本數(shù)大于30時 采用近似檢驗 計算的是Z統(tǒng)計量 認為在零假設下 Z統(tǒng)計量服從正態(tài)分布 Z統(tǒng)計量的計算公式如下 SPSS將自動計算Z統(tǒng)計量 并給出相應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為樣本來自的總體分布形態(tài)與指定的二項分布存在顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為樣本來自的總體分布形態(tài)與指定的二項分布不存在顯著差異 SPSS二項分布檢驗的數(shù)據(jù)是實際收集到的樣本數(shù)據(jù) 而非頻數(shù)數(shù)據(jù) 研究問題1為驗證某批產(chǎn)品的一級品率是否低于90 現(xiàn)從該批產(chǎn)品中隨機抽取23個樣品進行檢測并得到檢測結果數(shù)據(jù) 其中1表示一級品 0表示非一級品 7 1 2 2二項分布檢驗的應用舉例 研究問題2根據(jù)居民儲蓄 存款 的樣本數(shù)據(jù) 分析儲戶對未來收入的看法 檢驗儲戶總體對收入持保守或悲觀態(tài)度的比例是否與0 4有顯著性差異 持樂觀態(tài)度的比例是否與0 6有顯著性差異 問題 為檢驗某耐壓設備在某段時間內工作是否持續(xù)正常 測試并記錄下該時間段內各個時間點上的設備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動是隨機的 可認為該設備工作一直正常 否則認為該設備有不能正常工作的現(xiàn)象 7 1 3SPSS單樣本變量值隨機性檢驗 7 1 3 1變量值隨機性檢驗的基本思想 定義 單樣本變量值的隨機性檢驗是對某變量的取值出現(xiàn)是否隨機進行檢驗 也稱為游程檢驗 Run過程 單樣本變量值的隨機性檢驗是由Wald提出的 它的零假設為H0 總體某變量的變量值出現(xiàn)是隨機的 單樣本變量值的隨機性檢驗通過游程 Run 數(shù)來實現(xiàn) 所謂游程是一個或一個以上相同符號連續(xù)出現(xiàn)的段 設某樣本n 12人的標志表現(xiàn)為男 女 有以下三種排列 i 男男女女女男女女男男男 ii 男男男男男男男女女女女女 iii 男女男女男女男女男女男男請問游程數(shù)分別為多少 問28次投擲硬幣出現(xiàn)正反兩面的變量值序列為1011011010011000101010000111 游程數(shù)為多少 利用游程數(shù)構造檢驗統(tǒng)計量 設為出現(xiàn)1的個數(shù) 為出現(xiàn)0的個數(shù) 當較大時 游程的抽樣分布的均值為 方差為 在大樣本時 游程近似服從正態(tài)分布 即其中為游程數(shù) 在SPSS單樣本變量值的隨機性檢驗中 SPSS將利用游程構造Z統(tǒng)計量 并依據(jù)正態(tài)分布表給出對應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為樣本值的出現(xiàn)不是隨機的 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為變量值的出現(xiàn)是隨機的 7 1 3 2變量值隨機性檢驗的應用舉例 研究問題為檢驗某耐壓設備在某段時間內工作是否持續(xù)正常 測試并記錄下該時間段內各個時間點上的設備耐壓的數(shù)據(jù) 如果耐壓數(shù)據(jù)的變動是隨機的 可認為該設備工作一直正常 否則認為該設備有不能正常工作的現(xiàn)象 7 1 4 1單樣本K S檢驗的基本思想 7 1 4SPSS單樣本K S檢驗 定義 單樣本K S檢驗是以兩位前蘇聯(lián)數(shù)學家Kolmogorov和Smirnov命名的 也是一種擬合優(yōu)度的非參數(shù)檢驗方法 單樣本K S檢驗是利用樣本數(shù)據(jù)推斷樣本來自的總體是否與某一理論分布有顯著差異 適用于探索連續(xù)型隨機變量的分布 單樣本K S檢驗可以將一個變量的實際頻數(shù)分布與正態(tài)分布 Normal 均勻分布 Uniform 指數(shù) Exponential 分布 泊松分布 Poisson 進行比較 其零假設H0為樣本來自的總體與指定的理論分布無顯著差異 SPSS在統(tǒng)計中將計算K S的D統(tǒng)計量 并依據(jù)Kolmogorov分布表 小樣本 或K x 分布表 大樣本 給出對應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為樣本來自的總體與指定的分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為樣本來自的總體與指定的分布無顯著差異 7 1 4 2單樣本K S檢驗的應用舉例 研究問題1利用收集到的21名周歲兒童身高的樣本數(shù)據(jù) 利用K S方法檢驗周歲兒童身高的總體是否與正態(tài)分布有顯著差異 研究問題2利用K S檢驗分析儲戶一次存款金額的總體是否服從正態(tài)分布 問題 從甲乙兩種不同工藝生產(chǎn)出來的產(chǎn)品中隨機選取若干個樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 7 2兩獨立樣本的非參數(shù)檢驗 定義 兩獨立樣本的非參數(shù)檢驗是在對總體分布不很了解的情況下 通過分析樣本數(shù)據(jù) 推斷樣本來自的兩個獨立總體分布是否存在顯著差異 一般用來對兩個獨立樣本的均數(shù) 中位數(shù) 離散趨勢 偏度等進行差異比較檢驗 兩個樣本是否獨立 主要看在一個總體中抽取樣本對另外一個總體中抽取樣本有無影響 如果沒有影響 則可以認為兩個總體是獨立的 SPSS提供了4種兩獨立樣本的非參數(shù)檢驗方法 1 兩獨立樣本的Mann WhitneyU檢驗 兩獨立樣本的Mann WhitneyU檢驗的零假設H0為兩組獨立樣本來自的兩總體分布沒有顯著差異 兩獨立樣本的Mann WhitneyU檢驗主要通過對平均秩的研究來實現(xiàn)推斷 秩簡單地說就是變量值排序的名次 如果將數(shù)據(jù)按照升序進行排序 這時每一個變量值都會有一個在整個變量值中的位置或名次 這就是該變量值的秩 變量值有多少個 秩便有多少個 基本步驟 計算示例 應用舉例 研究問題從甲乙兩種不同工藝生產(chǎn)出來的產(chǎn)品中隨機選取若干個樣本 分析兩種工藝產(chǎn)品的使用壽命是否存在顯著性差異 2 兩獨立樣本的K S檢驗 兩獨立樣本的K S檢驗能夠對兩獨立樣本的總體分布情況進行比較 其零假設是H0為兩組獨立樣本來自的兩總體的分布沒有顯著差異 兩獨立樣本的K S檢驗實現(xiàn)方法是 首先將兩組樣本數(shù)據(jù) X1 X2 Xm 和 Y1 Y2 Yn 混合并按升序排列 m和n是兩組樣本的樣本容量 然后分別計算兩組樣本秩的累計頻數(shù)和累計頻率 最后將兩個累計頻率相減 得到差值序列數(shù)據(jù) 見教材151頁表7 8 兩獨立樣本的K S檢驗將關注差值序列 SPSS將自動計算K SD統(tǒng)計量及對應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為兩個樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為兩個樣本來自的總體分布無顯著差異 3 兩獨立樣本的游程檢驗 Wald WolfwitzRuns 兩獨立樣本的游程檢驗用來檢驗兩組獨立樣本來自的兩總體的分布是否存在顯著差異 其零假設是H0為兩組獨立樣本來自的兩總體的分布沒有顯著差異 兩獨立樣本的游程檢驗中 計算游程的方法與觀察值的秩有關 首先 將兩組樣本混合并按照升序排列 在數(shù)據(jù)排序時 兩組樣本的每個觀察值對應的樣本組標志值序列也隨之重新排列 然后對標志值序列按照前面討論的方法求游程 兩獨立樣本游程檢驗計算示例 如果計算出的游程數(shù)相對比較小 則說明樣本來自的兩總體的分布形態(tài)存在較大差距 如果得到的游程數(shù)相對比較大 則說明樣本來自的兩總體的分布形態(tài)不存在顯著差異 SPSS將自動計算游程數(shù)得到Z統(tǒng)計量并依據(jù)正態(tài)分布表給出對應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為兩個樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為兩個樣本來自的總體分布無顯著差異 4 兩獨立樣本的極端反應檢驗 MosesExtremeReactions 兩獨立樣本的極端反應檢驗用來檢驗兩組獨立樣本來自的兩總體的分布是否存在顯著差異 其零假設H0為兩組獨立樣本來自的兩總體的分布沒有顯著差異 兩獨立樣本的極端反應檢驗將一個樣本作為控制樣本 另外一個樣本作為實驗樣本 以控制樣本作對照 檢驗實驗樣本是否出現(xiàn)了極端反應 首先將兩組樣本混合并按升序排列 然后找出控制樣本最小秩和最大秩之間所包含的觀察值個數(shù) 即跨度 Span也即最大秩 最小秩 1 為消除樣本數(shù)據(jù)中極端值對分析結果的影響 也可以先按比例 通常為5 去除控制樣本中部分靠近兩端的樣本值 然后再求跨度 這個跨度稱為截頭跨度 極端反應檢驗的基本思想 極端反應檢驗計算示例 兩獨立樣本的極端檢驗計算跨度和截頭跨度 如果跨度或截頭跨度很小 則表明兩個樣本數(shù)據(jù)無法充分混合 可以認為實驗樣本出現(xiàn)了極端反應 樣本來自的兩總體分布存在顯著差異 反之 如果跨度或截頭跨度較大 則表明兩個樣本數(shù)據(jù)充分混合 可以認為實驗樣本沒有出現(xiàn)極端反應 樣本來自的兩總體分布沒有顯著差異 SPSS自動計算跨度和截頭跨度的H檢驗統(tǒng)計量依據(jù)分布表給出對應的相伴概率值 如果相伴概率小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為兩個樣本來自的總體分布有顯著差異 如果相伴概率值大于顯著性水平 則不能拒絕零假設H0 認為兩個樣本來自的總體分布無顯著差異 四種檢驗方法的說明 1 Man WhitneyU 默認 相當于兩樣本秩和檢驗 與參數(shù)檢驗的t檢驗相對 是對數(shù)據(jù)大小次序進行檢驗 變量至少為順序測量 即檢驗A樣本中的數(shù)值是否多數(shù)都大于B樣本 2 Kolmogorov SmirnovZ檢驗兩個獨立樣本是否取自同一總體 原理是做出兩個樣本的累積頻數(shù)分布曲線進行比較 檢驗的是總體分布情況是否相同 而不僅僅是其中心位置是否相同 可以用于連續(xù)性資料 3 Wald Wolfowitzruns屬于游程檢驗的一種 即檢驗的是總體分布情況是否相同 只要兩樣本各自所在總體有分布上的差異 無論是集中 離散 偏度等都可檢驗出來 注意 給出結果為單側檢驗 4 Mosesextremereactions有特定的用途 注意給出的結果均為單側檢驗 如果施加的處理使得某些個體出現(xiàn)正向效應 而另一些個體出現(xiàn)負向效應 則應該采用它 5 兩獨立樣本非參數(shù)檢驗的練習 研究問題利用居民儲蓄調查 存款 數(shù)據(jù) 對城鎮(zhèn)和農(nóng)村儲戶存款金額的分布進行比較分析 問題 從北京 上海 成都 廣州四城市中隨機選取若干個周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 7 3多獨立樣本的非參數(shù)檢驗 定義 多獨立樣本非參數(shù)檢驗分析樣本數(shù)據(jù)是推斷樣本來自的多個獨立總體分布是否存在顯著差異 SPSS多獨立樣本非參數(shù)檢驗一般推斷多個獨立總體的均值或中位數(shù)是否存在顯著差異 多個樣本之間是否獨立 需要看在一個總體中抽取樣本對其他總體中抽取樣本是否有影響 如果沒有影響 則認為這些總體之間是獨立的 例如 隨機抽取3個班級之間學生的學生成績 分析3個班級總體的成績是否存在顯著的差異 由于對各個班級都是隨機抽取樣本 抽樣沒有相互影響 可以認為這三個班級學生成績是獨立的 SPSS中有3種多獨立樣本非參數(shù)檢驗方法 1 多獨立樣本的中位數(shù)檢驗 Median 多獨立樣本的中位數(shù)檢驗通過對多組獨立樣本的分析檢驗它們來自的多個總體的中位數(shù)是否存在顯著差異 多獨立樣本的中位數(shù)檢驗的零假設H0為 多個獨立樣本來自的多個總體的中位數(shù)無顯著差異 基本思想 如果多個總體的中位數(shù)無顯著差異 或者說多個總體有共同的中位數(shù) 那么這個共同的中位數(shù)應在各樣本組中處在中間位置上 于是 每組樣本中大于該中位數(shù)或小于該中位數(shù)的樣本數(shù)目應大致相同 基本步驟 1 首先將多組樣本混合按升序排序 并求出混合樣本的中位數(shù) 2 分別計算各組樣本中大于和小于上述中位數(shù)的樣本個數(shù) 形成列聯(lián)表 見教材156頁 3 利用卡方檢驗方法分析各組樣本來自的總體對于上述中位數(shù)的分布是否一致 研究問題從北京 上海 成都 廣州四城市中隨機選取若干個周歲兒童身高的樣本 分析四城市周歲兒童身高分布是否存在顯著性差異 應用舉例 2 多獨立樣本的K W檢驗 多獨立樣本的K W檢驗是Kruskal Waillis檢驗的縮寫 是一種推廣的平均秩檢驗 其零假設為 多個獨立樣本來自的多個總體的分布無顯著差異 多獨立樣本的K W檢驗的基本方法是 首先將多組樣本數(shù)混合并按升序排列 求出每個變量值的秩 然后對多組樣本的秩分別求平均值 如果各組樣本的平均秩大致相等 則可以認為多個總體的分布沒有顯著差異 如果各樣本的平均秩相差很大 則認為多個總體的分布有顯著差異 K W檢驗統(tǒng)計量 計算示例 3 多獨立樣本的Jonkheere Terpstra檢驗 多獨立樣本的Jonkheere Terpstra檢驗用于分析多個獨立樣本來自的多個總體分布是否存在顯著差異 其零假設是 多個獨立樣本來自的多個總體的分布無顯著差異 多獨立樣本的Jonkheere Terpstra檢驗的基本方法和兩獨立樣本的Mann WhitneyU檢驗比較類似 也是計算一組樣本的觀察值小于其他組樣本觀察值的個數(shù) 檢驗統(tǒng)計量 計算示例 研究問題利用居民儲蓄調查 存款 數(shù)據(jù) 對不同職業(yè)儲戶存款金額的分布進行比較分析 4 多獨立樣本非參數(shù)檢驗的應用舉例 說明 中位數(shù)檢驗強調中間位置 Kruskal Wallis檢驗重點分析平均秩 Jonckheere Terpstra檢驗則通過比較同向對數(shù)來分析 各種方法各有長短 在應用時應嘗試用多種方法進行分析 并注意結合實際問題對分析結果進行解釋 問題 對統(tǒng)計學是否重要的問題進行分析 7 4兩配對樣本非參數(shù)檢驗 定義 兩配對樣本 2RelatedSamples 非參數(shù)檢驗是在對總體分布不很清楚的情況下 對兩配對樣本來自的兩個總體分布是否存在顯著性差異進行檢驗 兩配對樣本非參數(shù)檢驗一般用于同一研究對象 或兩配對對象 分別給予兩種不同處理的效果比較 以及同一研究對象 或兩配對對象 處理前后的效果比較 前者推斷兩種效果有無差別 后者推斷某種處理是否有效 兩配對樣本非參數(shù)檢驗的前提要求兩個樣本應是配對的 在應用領域中 主要的配對資料包括 具有年齡 性別 體重 病況等非處理因素相同或相似者 首先兩個樣本的觀察數(shù)目相同 其次兩樣本的觀察值順序不能隨意改變 SPSS中有以下3種兩配對樣本非參數(shù)檢驗方法 1 兩配對樣本的McNemar變化顯著性檢驗 McNemar變化顯著性檢驗以研究對象自身為對照 檢驗其 前后 兩組樣本變化是否顯著 其零假設為 兩配對樣本來自的兩總體分布無顯著差異 McNemar變化顯著性檢驗要求待檢驗的兩組樣本的觀察值是二值數(shù)據(jù) 在實際分析中有一定的局限性 McNemar變化顯著性檢驗基本方法采用二項分布檢驗 它通過對兩組樣本前后變化的頻率 計算二項分布的概率值 研究問題對統(tǒng)計學是否重要的問題 采用兩配對樣本的McNemar檢驗進行分析 應用舉例 分析10個學生接受某種方法進行訓練的效果 收集到這些學生在訓練前 后的成績 如表7 9所示 表格的每一行表示一個學生的4個成績 其中第一列表示 訓練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓練前學生的具體成績 第四列表示訓練后學生的具體成績 問訓練前后學生的成績是否存在顯著差異 問題 表7 9訓練前后的成績 2 兩配對樣本的符號 Sign 檢驗 當兩配對樣本的觀察值不是二值數(shù)據(jù)時 無法利用前面一種檢驗方法 這時可以采用兩配對樣本的符號 Sign 檢驗方法 其零假設為 兩配對樣本來自的兩總體的分布無顯著差異 兩配對樣本的符號檢驗利用正 負符號的個數(shù)多少來進行檢驗 首先 將第二組樣本的各個觀察值減去第一組樣本對應的觀察值 如果得到差值是一個正數(shù) 則記為正號 差值為負數(shù) 則記為負號 然后計算正號的個數(shù)和負號的個數(shù) 通過比較正號的個數(shù)和負號的個數(shù) 可以判斷兩組樣本的分布 例如 正號的個數(shù)和負號的個數(shù)大致相當 則可以認為兩配對樣本數(shù)據(jù)分布差距較小 正號的個數(shù)和負號的個數(shù)相差較多 可以認為兩配對樣本數(shù)據(jù)分布差距較大 SPSS將自動對差值正負符號序列作單樣本二項分布檢驗 計算出實際的概率值 如果得到的概率值小于或等于用戶的顯著性水平 則應拒絕零假設H0 認為兩配對樣本來自的總體分布有顯著差異 如果概率值大于顯著性水平 則不能拒絕零假設H0 認為兩配對樣本來自的總體分布無顯著差異 研究問題分析10個學生接受某種方法進行訓練的效果 收集到這些學生在訓練前 后的成績 如表7 9所示 表格的每一行表示一個學生的4個成績 其中第一列表示 訓練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓練前學生的具體成績 第四列表示訓練后學生的具體成績 問訓練前后學生的成績是否存在顯著差異 應用舉例 表7 9訓練前后的成績 3 兩配對樣本的Wilcoxon符號秩檢驗 兩配對樣本的符號檢驗考慮了總體數(shù)據(jù)變化的性質 但沒有考慮兩組樣本變化的程度 兩配對樣本的Wilcoxon符號秩檢驗考慮了這方面的因素 其零假設為 兩配對樣本來自的兩個總體的分布無顯著差異 兩配對樣本的Wilcoxon符號秩檢驗首先按照符號檢驗的方法 將第二組樣本的各個觀察值減去第一組樣本對應的觀察值 如果得到差值是一個正數(shù) 則記為正號 差值為負數(shù) 則記為負號 同時保存差值數(shù)據(jù) 然后將差值變量按升序排序 并求出相應的秩 最后分別計算正號秩和統(tǒng)計量W 負號秩和統(tǒng)計量W 計算示例 如果正秩和負秩大致相當 則可以認為兩配對樣本數(shù)據(jù)正負變化程度基本相當 兩配對總體的分布無顯著性差異 兩配對樣本的Wilcoxon符號秩檢驗按照下面的公式計算Z統(tǒng)計量 n為總樣本數(shù) 它近似服從正態(tài)分布 研究問題分析10個學生接受某種方法進行訓練的效果 收集到這些學生在訓練前 后的成績 如表7 9所示 表格的每一行表示一個學生的4個成績 其中第一列表示 訓練前的成績是否合格 0表示不合格 1表示合格 第二列表示訓練后的成績是否合格 0表示不合格 1表示合格 第三列表示訓練前學生的具體成績 第四列表示訓練后學生的具體成績 問訓練前后學生的成績是否存在顯著差異 應用舉例 表7 9訓練前后的成績 問題 利用不同促銷形式的銷售額的數(shù)據(jù) 分析不同促銷形式是否對銷售額產(chǎn)生了顯著影響 7 5多配對樣本的非參數(shù)檢驗 定義 多配對樣本非參數(shù)檢驗是對多個匹配樣本的總體分布是否存在顯著性差異進行統(tǒng)計分析 SPSS中有以下3種多配對樣本非參數(shù)檢驗方法 1 多配對樣本的Friedman檢驗 多配對樣本的Friedman檢驗是利用秩實現(xiàn)多個總體分布是否存在顯著性差異檢驗的一種方法 多配對樣本的Friedman檢驗要求數(shù)據(jù)是定距的 其零假設為 多個配對樣本來自的多個總體的分布無顯著差異 多配對樣本的Friedman檢驗的實現(xiàn)原理是 首先以行為單位 將各個數(shù)據(jù)按照升序排列 并求得各變量值在各自行中的秩 然后計算各組樣本下的秩和與平均秩 計算示例 如果多個配對樣本的分布存在顯著的差異 那么數(shù)值普遍偏大的組秩和必然偏大 數(shù)值普遍偏小的組 秩和也必然偏小 各組的秩之間就會存在顯著差異 如果各樣本的平均秩大致相當 那么可以認為各組的總體分布沒有顯著差異 Friedman檢驗統(tǒng)計量為k為樣本組數(shù) n為樣本數(shù) 為平均秩 大樣本下Friedman檢驗統(tǒng)計量近似服從k 1個自由度的卡方分布 應用舉例 研究問題 利用不同促銷形式的銷售額的數(shù)據(jù) 分析不同促銷形式是否對銷售額產(chǎn)生了顯著影響 問題 利用評委給歌手打分的數(shù)據(jù) 分析評委的評分標準是否一致 2 多配對樣本的Kendall協(xié)同系數(shù)檢驗 多配對樣本的Kendall協(xié)同系數(shù)檢驗和Friedman檢驗非常類似 也是一種多配對樣本的非參數(shù)檢驗 但分析的角度不同 多配對樣本的Kendall協(xié)同系數(shù)檢驗主要用在分析評判者的判別標準是否一致公平方面 它將每個評判對象的分數(shù)都看作是來自多個配對總體的樣本 一個評判對象對不同被判定對象的分數(shù)構成一個樣本 其零假設為 樣本來自的多個配對總體的分布無顯著差異 即評判者的評判標準不一致 舉例 Kendall協(xié)同系數(shù)檢驗中會計算Friedman檢驗方法 得到Friedman統(tǒng)計量和相伴概率 如果相伴概率小于顯著性水平 可以認為這10個節(jié)目之間沒有顯著差異 那么可以認為這5個評委判定標準不一致 也就是判定結果不一致 協(xié)同系數(shù) 其中m是評判者人數(shù) n是被評判者人數(shù) 為第i個被評判者的秩和 取值范圍在0至1之間 W協(xié)同系數(shù)越接近1 表明秩的組間差異越大 意味著被評判者所得分數(shù)間有顯著差異 進而說明評判者的評判標準具有一致性 反之 W協(xié)同系數(shù)越接近0 表明秩的組間差異越小 意味著各個被評判者所得分數(shù)間的差異不明顯 說明評判者對于各被評判者的意見很不一致 沒有理由認為評判者的評判標準具有一致性 應用舉例 研究問題 利用評委給歌手打分的數(shù)據(jù) 分析評委的評分標準是否一致 問題 利用乘客對三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務水平是否存在顯著性差異 3 多配對樣本的CochranQ檢驗 多配對樣本的CochranQ檢驗也是對多個互相匹配樣本總體分布是否存在顯著性差異的統(tǒng)計檢驗 不同的是多配對樣本的CochranQ檢驗所能處理的數(shù)據(jù)是二值的 0和1 其零假設是 多配對樣本來自的多個總體分布無顯著差異 基本思想及檢驗統(tǒng)計量 基本思想 認為每行中取1的個數(shù)是可確定的 CochranQ檢驗統(tǒng)計量 計算示例 在大樣本時 Q統(tǒng)計量近似服從 k 1 個自由度的卡方分布 SPSS將自動計算Q統(tǒng)計量和對應的概率P值 應用舉例 研究問題 利用乘客對三家航空公司是否滿意的數(shù)據(jù) 分析三家航空公司的服務水平是否存在顯著性差異 4 多配對樣本非參數(shù)檢驗的練習 研究問題1為了試驗某種減肥藥的性能 測量10個人在服用該藥前以及服用該藥一個月后 兩個月后 3個月后的體重 問在這4個時期 10個人的體重有無發(fā)生顯著的變化 數(shù)據(jù)如表7 10所示 表7 104個時期的體重 kg 研究問題2某文藝晚會中有5個節(jié)目 共有5個評委參與打分 問這5個評委的判斷標準是否一致 數(shù)據(jù)如表7 11所示 表7 115個評委的打分表 研究問題3消費者協(xié)會調查了顧客對3種品牌的電視機的滿意程度 共有10個顧客參與了滿意度調查 數(shù)據(jù)如表7 12所示 表7 12顧客的滿意度表格 小結 非參數(shù)檢驗主要用于那些總體分布不能用有限個實參數(shù)來刻畫 或者不考慮被研究的對象為何種分布以及是否已知的情況 這種方法進行的并不是參數(shù)間的比較 而是分布位置 分布形狀之間的比較 研究目標總體與理論總體分布是否相同 或者各樣本所在總體的分布位置是否相同等 小結 1 一般不需要嚴格的前提假設 2 非參數(shù)檢驗特別適用于順序資料或等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論