復習spss非參數(shù)檢驗PPT課件.pptx_第1頁
復習spss非參數(shù)檢驗PPT課件.pptx_第2頁
復習spss非參數(shù)檢驗PPT課件.pptx_第3頁
復習spss非參數(shù)檢驗PPT課件.pptx_第4頁
復習spss非參數(shù)檢驗PPT課件.pptx_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

判別分析是判別觀測值所屬類型的一種統(tǒng)計分析方法 它是解決分類問題的 判別分析和前面的聚類分析有什么不同呢 主要不同點就是 在聚類分析中一般人們事先并不知道或并不一定明確應該分成幾類 完全根據(jù)數(shù)據(jù)來確定 而在判別分析中 至少有一個已經(jīng)明確知道類別的 訓練樣本 利用這個數(shù)據(jù) 就可以建立判別準則 并通過預測變量來為未知類別的觀測值進行判別了 2020 2 4 1 也就是說 已經(jīng)有一批樣本的觀測值數(shù)據(jù) 知道它們被分成了多少類 也知道了它們所屬的類別 在此基礎上根據(jù)某些準則建立判別方程 這些方程能夠使上述樣本的分類出錯率最低 然后應用這些判別方程對未知類型的樣本進行判別分類 而對于聚類分析來說 一批給定樣本要劃分的類型事先并不知道 正需要通過聚類分析來確定類型 2020 2 4 2 在SPSS中分為一般判別和逐步判別兩種 一般判別 是指不對自變量做任何篩選 直接使用所有指定的自變量進行判別函數(shù)的構建和分析 逐步判別 法的基本思想與逐步回歸法類似 即把最重要的自變量逐個引入判別函數(shù) 同時對判別函數(shù)中已經(jīng)存在的舊變量進行檢驗 如果它們的判別能力隨著新變量的引入而變得不那么顯著了 那么就將它們從判別函數(shù)中剔除 直至沒有新變量引入 也沒有舊變量需要剔除為止 這個過程使用F檢驗 原假設為 該自變量對判別的貢獻為零 若P值 0 05 則拒絕原假設 接受備擇假設 認為該變量的判別能力是顯著的 2020 2 4 3 總體理論分布未知 有極端值等情況下 不能使用t檢驗和方差分析 而要用非參數(shù)檢驗方法 非參數(shù)檢驗方法大多要用到 秩 rank 秩 就是排隊以后的順序值 利用它進行秩和檢驗 ranktest 要求樣本含量必須大于5 秩的應用降低了分布的重要性 減少了樣本中極端值的影響 即減少了其權重 對于小樣本資料來說 t檢驗和F檢驗 方差分析 適用的條件是 各樣本都來自正態(tài)總體或近似正態(tài)總體 只有符合這個條件 才能用它們來檢驗各樣本所屬的總體參數(shù)的差異顯著性 2020 2 4 4 非參數(shù)檢驗 非參數(shù)檢驗對總體分布不做假定 直接從樣本發(fā)掘總體信息 推斷總體分布 它在推斷總體分布時沒有涉及總體分布的參數(shù) 所以稱為非參數(shù)檢驗或自由分布檢驗 與傳統(tǒng)的參數(shù)檢驗相比 非參數(shù)檢驗具有以下優(yōu)點 由于非參數(shù)檢驗對總體的假定比較少 因而具有廣泛的適應性 同時具有較好的穩(wěn)健性 可以在較少樣本的情況下進行 在一定程度上彌補了有些情況下樣本資料不足的缺陷 對連續(xù)性變量和間斷性變量同樣適用 計算方法比較簡單 非參數(shù)檢驗也有不足之處 最大缺點是它常會導致部分信息損失 降低檢驗效能 2020 2 4 5 參數(shù)檢驗與非參數(shù)檢驗的區(qū)別 參數(shù)檢驗需要假定總體的分布 而非參數(shù)不需要 非參數(shù)方法應用范圍大于參數(shù)方法 因為它不需要假定總體分布 所以任何分布都可以用非參數(shù)的方法進行研究 研究的對象目標不同 參數(shù)方法假定了總體分布 所以研究目標就是總體的參數(shù) 而非參數(shù)方法直接從樣本推導總體的分布 所以它的目標是總體的分布或兩個目標的分布是否相同 2020 2 4 6 研究的統(tǒng)計量不同 非參數(shù)方法常用符號 秩 秩和等構造統(tǒng)計量 大小樣本都可 而參數(shù)檢驗雖不用秩 但如果是小樣本 要求服從正態(tài)分布 兩者的效率有差距 當總體的真實分布大體是假定的分布時 參數(shù)方法的準確性好 效率高 但假定的分布不是總體的真實分布時 非參數(shù)方法的效率高 例如 對非配對資料的秩和檢驗 其效率僅為t檢驗的86 換句話說 以相同概率判斷出顯著差異 t檢驗所需樣本含量要比秩和檢驗少14 2020 2 4 7 卡方檢驗 卡方檢驗又稱為卡方擬合優(yōu)度檢驗或適應性檢驗 它是判斷屬性各類別的實際出現(xiàn)次數(shù)是否與理論次數(shù)相符合的一種非參數(shù)檢驗方法 它分析的目的是檢驗分類數(shù)據(jù)樣本所在的總體分布是否與已知分布相同 卡方構造公式如下 卡方檢驗的無效假設是 樣本來自的總體分布與某一理論分布或期望分布沒有顯著差異 2020 2 4 8 二項分布檢驗 有些個體的某種性狀 只能產(chǎn)生非此即彼的兩種結果 即其取值只能是二值的 如 種子的發(fā)芽與不發(fā)芽 施藥后害蟲的死亡與存活 產(chǎn)品的合格與不合格 硬幣投擲的正面與背面 這種由非此即彼的結果構成的總體叫做二項總體 而其頻數(shù)的分布稱為二項分布 SPSS中二項分布檢驗是通過樣本數(shù)據(jù) 二值變量 檢驗其來自的總體是否服從指定頻率為P的二項分布 其無效假設為 樣本來自的總體與指定的某個頻率為P的二項分布不存在顯著差異 2020 2 4 9 游程檢驗 許多時候 研究者關心的不僅僅是分布的位置或者形狀 也希望考察樣本的隨機性如何 因為如果樣本不是從總體中隨機抽取的 那么所做的任何推斷都將變得沒有價值 而游程檢驗就是滿足此類分析需求的一種基本的檢驗方法 游程檢驗又稱為連貫檢驗或串檢驗 可用來檢驗樣本的隨機性 這對于統(tǒng)計推斷是很重要的 可用來檢驗任何序列的隨機性 而不管這個序列是如何產(chǎn)生的 可用來判斷兩個總體的分布是否相同 從而檢驗出它們的位置中心有無顯著差異 2020 2 4 10 2020 2 4 11 游程檢驗 在一串二元序列中 一個由0或1連續(xù)構成的串稱為一個游程 一個游程中數(shù)據(jù)的個數(shù)稱為游程的長度 00011100000110001111100 有4個0游程和3個1游程 共7個游程 即游程數(shù)R 7 一個有太多或太少游程的樣本暗示著該樣本不是隨機的游程檢驗根據(jù)游程數(shù)來檢驗變量的兩個值或符號出現(xiàn)的順序是否是隨機的 對一個序列 可定義一個分界點來兩分數(shù)據(jù) 如指定一個特點的數(shù) 或計算得到的統(tǒng)計量 如樣本均值 中位數(shù) 眾數(shù) 游程檢驗的無效假設為 兩分類變量值的出現(xiàn)是隨機的 2020 2 4 12 單樣本K S檢驗 K S檢驗是Kolmogorov Smirnov檢驗的簡稱 K S檢驗是用來考察觀測值的分布和指定的理論分布符合程度的一種方法 SPSS提供的理論分布有正態(tài)分布 常規(guī) 均勻分布 相等 泊松分布 泊松 指數(shù)分布 指數(shù)分布 K S檢驗不僅可以用于檢驗間斷性變量的分布形態(tài) 也可以用于檢驗連續(xù)性變量的分布形態(tài) 其原假設是 假設樣本來自的總體的分布與指定的理論分布沒有顯著差異 2020 2 4 13 多個獨立樣本檢驗 多個獨立樣本的非參數(shù)檢驗是通過分析多個獨立樣本數(shù)據(jù) 推斷樣本來自的多個總體的中位數(shù)或分布是否存在顯著差異 它是單因素方差分析對應的非參數(shù)檢驗方法 原假設是 多獨立總體分布無顯著差異 PASW提供了三種檢驗法 Kruskal WallisH檢驗 中位數(shù)檢驗 Jonckheere Terpstra檢驗 在進行完全隨機設計的多組均值比較時 試驗觀測結果有時會嚴重偏離正態(tài)分布 或組間方差不齊 或觀測結果是有序的 這時就只好用多個樣本比較的非參數(shù)檢驗了 2020 2 4 14 多個獨立樣本檢驗 Kruskal WallisH方法 系統(tǒng)默認的方法 是Mann WhitneyU檢驗法的擴展 類似單方向 因素 方差分析 該法的前提是假設抽樣總體是連續(xù)的和相同的 利用各樣本的秩和來推斷它們所代表的總體在分布位置上的差異顯著性 其基本思路是 首先把所有樣本合并升序排列 得出每個數(shù)據(jù)的秩 然后對各組樣本求平均秩 如果平均秩相差很大 則認為兩組樣本所屬的總體有顯著差異 適用于 順序數(shù)據(jù) 總體非正態(tài)分布數(shù)據(jù) 方差不齊數(shù)據(jù) 有序分類變量等 即方差分析不適用的數(shù)據(jù) 該檢驗法的適用范圍是 每組樣本量 5 2020 2 4 15 中位數(shù)檢驗 探討多總體的中位數(shù)是否有差異 適用于數(shù)值變量資料 基本思路是 將所有樣本混合升序排列 并計算中位數(shù) 然后計算各組樣本中大于和小于這個中位數(shù)的樣本的個數(shù) 如果這些數(shù)據(jù)差距過大 則認為兩組樣本所屬的總體有顯著差異 多個獨立樣本檢驗 2020 2 4 16 兩個相關 配對 關聯(lián) 樣本檢驗 主要用于同一研究對象 或兩個配對對象 分別給予兩種不同處理的效果比較以及同一研究對象 或兩個配對對象 處理前后的效果比較 前者推斷兩種效果有無差異 后者推斷某種處理是否有效 如同一批運動員在使用新訓練方法前后的成績比較此時的樣本間不是獨立的 而是彼此相關 此時檢驗樣本的總體間是否分布相同 而參數(shù)t檢驗是檢驗均值是否相等 零假設是兩配對樣本來自的兩總體的分布無顯著差異 2020 2 4 17 兩個相關樣本檢驗 Wilcoxon檢驗也叫符號秩檢驗 是一種改進的符號檢驗 其效能高于符號檢驗 其基本思路是 如果兩樣本來自的兩相關配對總體沒有顯著差異的話 不但差值中正數(shù)的個數(shù)和負數(shù)的個數(shù)應大致相等 而且正值和負值的秩和也大致相等 當然 它的效率大約是t檢驗的95 符號檢驗是對配對樣本值計算其差值 觀測所得的差值的符號 如果差值中正數(shù)的個數(shù)和負數(shù)的個數(shù)差距較大 則認為兩樣本差異顯著 它們來自兩個不同的總體 兩個相關樣本的非參數(shù)檢驗方法有4種 根據(jù)數(shù)據(jù)類型確定 如果數(shù)據(jù)是連續(xù)的 使用符號檢驗和Wilcoxon檢驗 2020 2 4 18 多個相關 配對樣本檢驗 多個相關樣本的檢驗是判斷它們是否來自同一個總體 有三種檢驗方法 Friedman Kendall的W Cochran的Q原假設都是 多個配對樣本的總體分布無顯著差異 Friedman檢驗為雙向方差分析 也是把所有樣本值排列后利用秩及秩和構造統(tǒng)計量來判斷 Kendall的W協(xié)同系數(shù)檢驗 適用于幾個分類變量均為有序分類的情況 考察多次評價 評判 的排列是否隨機 Cochran的Q檢驗 是兩相關樣本McNemar檢驗的多樣本推廣 適用于定性變量和二分類變量 2020 2 4 19 在進行單個觀測值正交試驗資料的方差分析時 其誤差是由 空列 來估計的 實際上 空列 并不是 空 的 它是留給試驗因素間的交互作用的 所以上述誤差既包含試驗誤差 也包含試驗因素之間的交互作用 稱之為模型誤差 如果試驗因素間不存在交互作用 用模型誤差估計試驗誤差是可行的 如果因素間存在交互作用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論