統(tǒng)計學(xué)--第十二章卡方檢驗.ppt_第1頁
統(tǒng)計學(xué)--第十二章卡方檢驗.ppt_第2頁
統(tǒng)計學(xué)--第十二章卡方檢驗.ppt_第3頁
統(tǒng)計學(xué)--第十二章卡方檢驗.ppt_第4頁
統(tǒng)計學(xué)--第十二章卡方檢驗.ppt_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十二章卡方檢驗 一 用于檢驗 1 兩組或幾組率或構(gòu)成比的差異有無顯著性2 各行的平均分間有無差異3 行與列兩個順序分類變量之間是否相關(guān)4 擬合優(yōu)度檢驗 第一節(jié)四格表資料的 2檢驗 以P153例12 1為例1 四格表 將資料列成表格 表格中四個數(shù)字是基本的 63 17 31 68 稱四格表fourfoldtable2 實際數(shù) 表內(nèi)各格數(shù)字為實際資料的數(shù)字 稱observedvalue actualfrequency 記為O或A兩樣本率不同的原因 抽樣誤差 總體率確實不同 兩種類型胃潰瘍病內(nèi)科療法治療結(jié)果 為檢驗是否為第二種情況 無效假設(shè)為兩種治愈率本無不同 差別僅由抽樣誤差所致 3 理論治愈率 根據(jù)兩組治愈率相同的假設(shè) 合計治療179人 總治愈94人 得理論治愈率為94 179 52 51 4 理論數(shù) 一般潰瘍患者80 按理論治愈率應(yīng)治愈80 52 51 42 01 稱theoreticalvalue theoreticalfrequency 記為T 同理可得其余理論數(shù) 亦可由減法求得 Trc nrnc n 理論數(shù)為行合計乘列合計除總合計理論數(shù)有兩個特征 1 理論頻數(shù)表的構(gòu)成比相同 即不但各行構(gòu)成比相同 而且各列亦相同 2 各個基本格子實際數(shù)與理論數(shù)的差別 絕對值 相同5 樣本率的差別演繹為實際數(shù)與理論數(shù)的差別 兩樣本率相差愈大 則實際數(shù)與理論數(shù)的差別就愈大 若無效假設(shè)成立 實際數(shù)與理論數(shù)之差就不會很大 1 實際數(shù)與理論數(shù)之間的差別等價于兩樣本率的差別2 檢驗假設(shè)H0 四格表的構(gòu)成比相同 等價于H0 兩總體率相等3 對實際數(shù)與理論數(shù)差值的假設(shè)檢驗 等價于對兩樣本率差值的假設(shè)檢驗 6 2檢驗的基本思想 及計算步驟 1 假設(shè)兩總體率相等 構(gòu)成比相同 HO 1 2 即兩總體陽性率相等H1 1 2 即兩總體陽性率不等 0 05不妨把H0看作 1 2 兩樣本合并的陽性率2 實際數(shù)與理論數(shù)的差值服從 2分布 又稱pearson 2 2值是以理論數(shù)為基數(shù)的相對誤差 它反映了實際數(shù)與理論數(shù)吻合的程度 差別的程度 若檢驗假設(shè)成立 則實際數(shù)與理論數(shù)的差別不會很大 出現(xiàn)大的 2值的概率是很小的 若P 就懷疑假設(shè) 因而拒絕它 若P 則尚無理由拒絕它 2值的大小隨著格子數(shù)的增加而變大 即 2分布與自由度有關(guān) 因而考慮 2值大小的意義時 要考慮到格子數(shù) 當(dāng)周邊合計數(shù)固定的情況下 四個基本數(shù)據(jù)當(dāng)中只有一個可以自由取值 即自由度為1 R 1 C 1 R行C列時 R行中有一行數(shù)據(jù)受到列合計的限制而不能自由變動 C列中亦有一列數(shù)據(jù)在行合計的限制下不能自由取值3 查 2分布界值表確定P值并作出推論 2 39 93 自由度為1 查附表6 7 20 05 1 3 84 20 01 1 6 63 20 001 1 10 83一般類型的治愈率高于特殊類型 結(jié)合樣本率作實際推論 P 0 001 按 0 05水準(zhǔn) 拒絕H0接受H1 因而認(rèn)為兩總體的陽性率有差別 統(tǒng)計學(xué)推論 結(jié)果說明 兩組胃潰瘍病人治愈率的差別有高度統(tǒng)計意義 7 2值的校正 四格表 2檢驗的條件實際上 2值是根據(jù)正態(tài)分布中 2 xi 2的定義計算出來的 用前述公式算得的值只能說近似于 2分布 在自由度大于1 理論數(shù)皆大于5時 這種近似較好 自由度為1 當(dāng)有理論數(shù)小于5時 需進(jìn)行 連續(xù)性 校正 2檢驗條件 四格表 1 當(dāng)n 40且所有T 5時 用普通的 2檢驗 若所得P 改用確切概率法 2 當(dāng)n 40但有1 T 5時 用校正 2檢驗3 當(dāng)n 40或有T 1時 不能用 2檢驗 改用確切概率法 8 四格表專用公式為方便起見 當(dāng)基本格子的實際數(shù)命名為a b c d 行合計寫為a b c d 列合計寫為a c b d n為總觀察數(shù) 第二節(jié)行 列表的 2檢驗 當(dāng)行或列超過2組時通稱為行 列表 或R C表 亦稱列聯(lián)表contingencytable 可用于1 多個率的比較可用以下簡化公式 無相應(yīng)校正公式 適用條件 不能有理論數(shù)小于1 并且1 T 5的格子數(shù)不超過總格子數(shù)1 5 條件不足時的三種處理方法 1 增大樣本例數(shù)使理論數(shù)變大2 刪除理論數(shù)太小的行或列3 將理論數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并 使重新計算的理論數(shù)增大 但是此處理可能損失信息 也會損害樣本的隨機(jī)性 不同的合并方式所得的結(jié)果也不一樣 因而在不得已時慎用 2 多個構(gòu)成比比較3 雙向有序分類資料的關(guān)聯(lián)性檢驗表格是按兩個變量從小到大順序分類整理出來的 目的是研究兩變量間有無關(guān)聯(lián)性 從左上角往右下角看 頻數(shù)有無集中在此對角線上的趨勢 即兩變量有關(guān)聯(lián) 若頻數(shù)在這些格子均勻分布 或各行分布 構(gòu)成比 相同 且各列分布 構(gòu)成比 相同 則表示兩個變量無關(guān)聯(lián)性了 R C表 2檢驗注意事項若表格有一個方向按多個等級分類 則稱為單向有序行列表 當(dāng)?shù)燃墧?shù)大于3時 一般用秩和檢驗分析更為合適 似然比卡方統(tǒng)計量 Likelihoodratiochi square自由度的確定及臨界值與Pearson卡方一致理論上當(dāng)樣本量相當(dāng)大時 Pearson卡方和似然比卡方都接近卡方分布 樣本不夠大時都偏離卡方分布 兩者的數(shù)值不同但接近 實踐中這兩個統(tǒng)計量可同時使用 結(jié)合起來下結(jié)論 第三節(jié)四格表精確檢驗法 卡方檢驗的基本公式和校正公式有其應(yīng)用條件 且僅為近似 當(dāng)四格表中有理論數(shù)小于1或總觀察例數(shù)小于40時 需改用四格表的確切概率法exactprobabilitiesin2 2table 基本思想 在四格表周邊合計不變的情況下 獲得某個四格表的概率為a 表示factoriala或afactorial0 1 3 3 2 1 6該方法計算出的概率為分布中單側(cè)的概率 故雙側(cè)時應(yīng)以0 025為顯著性水平 結(jié)合實際確定采用單側(cè)還是雙側(cè) 1 有實際數(shù)為0的情況下 只需代入公式計算P值即可2 沒有實際數(shù)為0的情況時 要把更加極端的情況都算入 更加極端的情況是指 原來治愈率高的治愈人數(shù)更要加多 治愈率低的治愈人數(shù)更要減少 直至出現(xiàn)0為止 但保持合計及總合計數(shù)字不變 見P157例12 4最后將幾情況的概率相加得P值 單側(cè) 可用查表法或計算機(jī)直接給出 雙側(cè)檢驗時 1 單側(cè)概率加倍2 加上對側(cè) 當(dāng)前四格表的概率的所有概率 這兩種方法的結(jié)果有時可能會有所不同 教科書建議以第二種方法為準(zhǔn) 第四節(jié)配對計數(shù)資料的 2檢驗 一 兩種處理方法的比較 P169 其中b c為兩種培養(yǎng)基生長情況不同的數(shù)字 a b兩培養(yǎng)基相同可不考慮當(dāng)b c 40時可不校正 而b c 40時 則一定要用校正公式 注意 1 配對四格表中的數(shù)字為對子數(shù)2 當(dāng)a格與d格的數(shù)字都特別大 而b c格的數(shù)字都相對較小時 即使配對四格表卡方檢驗結(jié)果有統(tǒng)計意義 其實際意義也不大 因此 配對四格表的卡方檢驗一般用于檢驗樣本含量不太大的資料 二 兩種以上處理方法的比較見P170 171例12 15僅供了解 第五節(jié)列變量為順序變量的列聯(lián)表 行平均分差檢驗 一 2 C表P163例12 10Pearson卡方只能得出兩組構(gòu)成是否相同的結(jié)論 不能得出哪組療效較好的結(jié)論人為地給各療效一個分?jǐn)?shù) 如無效為1 好轉(zhuǎn)為2 顯效為3 痊愈為4 計算其均數(shù) 稱行平均分rowmeanscore aj為各療效得分 n1j為第一行各療效的頻數(shù) n1 為第一行合計同理計算第二行平均分再進(jìn)行行平均得分差檢驗 s2 為平均期望得分 為方差 平均得分統(tǒng)計量的樣本大小較容易達(dá)到 只要主觀確定一個分割點 把列分為 J和J 1 r兩部分 變成四格表 把新的四格中各部分實際數(shù)相加 只要四格表中大部分超過 即可 二 行為名義變量列為順序變量的行 列表1 行平均分的計算行平均分可采用 整數(shù)給分法2 行平均分差別統(tǒng)計意義檢驗 第六節(jié)行列變量的相關(guān)檢驗 行與列變量都是順序變量時可檢驗兩者是否相關(guān) P166例12 12行c與列a都給予得分用a和c計算線性函數(shù)f再分別計算行平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論