卡方檢驗及SPSS分析_第1頁
卡方檢驗及SPSS分析_第2頁
卡方檢驗及SPSS分析_第3頁
卡方檢驗及SPSS分析_第4頁
卡方檢驗及SPSS分析_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Chi-SquareTest

預(yù)防醫(yī)學(xué)教研室2021/5/91課程內(nèi)容第一節(jié):四格表(fourfolddata)資料的x2檢驗**第二節(jié):配對(paireddata)資料的x2檢驗**第三節(jié):R×C表資料的x2檢驗*第四節(jié):分層卡方檢驗第五節(jié):多個樣本率間的多重比較課程小結(jié)2021/5/92SPSS統(tǒng)計分析交叉表(Crosstabs)過程 (一)四格表(fourfolddata)資料的x2檢驗 (二)配對(paireddata)資料的x2檢驗 (三)R×C表資料的x2檢驗

(四)兩分類變量有無關(guān)聯(lián)分析及列聯(lián)系數(shù)C卡方(Chi-Square)過程 (五)擬合問題-比較樣本與已知總體的分布2021/5/93第一節(jié)

四格表資料的檢驗

x2testoffourfolddata

2021/5/94目的:推斷兩個總體率(構(gòu)成比)是否有差別要求:兩樣本的兩分類個體數(shù)排列成四格表資料2021/5/95一、2

檢驗的基本思想

2是一種用途較廣的計數(shù)資料的假設(shè)檢驗方法,屬于非參數(shù)檢驗的范疇。根本思想:在于比較理論頻數(shù)和實際頻數(shù)的吻合程度或擬合優(yōu)度問題。

x2檢驗:以x2分布為方法的理論基礎(chǔ)2021/5/96

2

檢驗的基本公式A為實際頻數(shù)(actualfrequency),T為理論頻數(shù)(theoreticalfrequency)nR是行和,nC是列和,n是四格數(shù)之和

2表示觀察值與期望值之間的偏離程度。1900年由英國統(tǒng)計學(xué)家KarlPearson首次提出,故被稱為Pearson

2。2021/5/972021/5/98*例1:四格表資料的x2檢驗

x2

檢驗基本步驟建立檢驗假設(shè)

H0

:兩總體齲患率相等

H1

:兩總體齲患率不等計算理論頻數(shù)計算x2

統(tǒng)計量確定P值,作出推論2021/5/99

四格表檢驗的條件:

1)2)3)校正公式:2021/5/910SPSS操作過程①建立數(shù)據(jù)文件:例1.sav

數(shù)據(jù)格式:包括4行3列的頻數(shù)格式,3個變量即行變量(group)、列變量(effect)和頻數(shù)變量(freq)。②說明頻數(shù)變量:數(shù)據(jù)加權(quán)個案

DataWeightCases③x2檢驗:從菜單選擇分析描述統(tǒng)計

交叉表

Analyze

DescriptiveStatisticsCrosstabs結(jié)合例1數(shù)據(jù)演示操作過程。2021/5/911首先建立數(shù)據(jù)文件,如下。2021/5/912

注意:由于上表給出的不是原始數(shù)據(jù),而是頻數(shù)表數(shù)據(jù),應(yīng)該進(jìn)行預(yù)處理。2021/5/913*****指定加權(quán)變量(weightcases)在實際的統(tǒng)計中,經(jīng)常需要計算數(shù)據(jù)的加權(quán)平均數(shù)。例如,希望了解不用牙膏使用者的平均患齲量。如果僅以各種牙膏的患齲量的平均數(shù)作為平均患齲量是不合理的還應(yīng)考慮到各牙膏使用者的患齲量對平均患齲量的影響。因此,以各牙膏使用者的患齲量作為權(quán)重計算各牙膏患齲率的加權(quán)平均數(shù),才是我們需要求的數(shù)據(jù)。在SPSS處理中就需要將各牙膏的患齲量作為加權(quán)變量。2021/5/914不設(shè)置權(quán)重設(shè)置權(quán)重頻數(shù)變量“WeightCases”對話框2021/5/9152021/5/916交叉表(Crosstabs)過程Crosstabs過程用于對分類資料和有序分類資料進(jìn)行統(tǒng)計描述和統(tǒng)計推斷。統(tǒng)計描述過程可以產(chǎn)生2維至n維列聯(lián)表,并計算相應(yīng)的百分?jǐn)?shù)指標(biāo)。統(tǒng)計推斷包括了常用的x2檢驗、Kappa值,分層X2(X2M-H),以及四格表資料的確切概率(Fisher’sExactTest)值。2021/5/917行變量列變量計算統(tǒng)計量單元格卡方統(tǒng)計量Kappa系數(shù)風(fēng)險度配對四格表McNemar檢驗實際頻數(shù)理論頻數(shù)2021/5/918Crosstabs過程詳解界面說明-[行Rows框]用于選擇行×列表中的行變量。-[列Columns框]用于選擇行×列表中的列變量。-[層Layer框]指定分層變量,即控制變量。如果要指定不同的分層變量做分析,則將其選入Layer框,并用Previous和Next鈕設(shè)為不同層。-[Displayclusteredbarcharts復(fù)選框]:顯示復(fù)式條圖-[Suppresstable復(fù)選框]:不在輸出結(jié)果中給出行×列表。2021/5/919Crosstabs過程詳解界面說明精確(Exact)子對話框:針對2×2以上的行×列表設(shè)計計算確切概率的方法。統(tǒng)計量(Statistics)子對話框:用于定義所需計算的統(tǒng)計量-Chi-square復(fù)選框:計算pearson卡方值,對四格表資料自動給出校正卡方檢驗和確切概率法結(jié)果。-Correlations復(fù)選框:計算行列變量的pearson相關(guān)系數(shù)和Spearman等級相關(guān)系數(shù)。2021/5/920Crosstabs過程詳解界面說明-Kappa復(fù)選框:計算Kappa值,即內(nèi)部一致性系數(shù),介于0~0.7071之間;-Risk復(fù)選框:計算比數(shù)比OR值、RR值;-McNemanr復(fù)選框:進(jìn)行配對卡方檢驗的McNemanr檢驗(一種非參數(shù)檢驗)-Cochran’sandMantel-Haenszelstatistics復(fù)選框:計算X2M-H統(tǒng)計量、X2CMH,可在下方輸出H0假設(shè)的OR值,默認(rèn)為1。2021/5/921Crosstabs過程詳解界面說明單元格(Cells)子對話框:用于定義列聯(lián)表單元格中需要計算的指標(biāo)。-Counts復(fù)選框:是否輸出實際觀察數(shù)(Observed)和理論頻數(shù)(Expected)-Percentages復(fù)選框:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計百分?jǐn)?shù)(Total)-Residuals復(fù)選框:選擇殘差的顯示方式格式(Format)子對話框:用于選擇行變量是升序還是降序排列。2021/5/922

表示含氟牙膏與一般牙膏患齲率的比較,除了觀察值以外,還有期望值。實際頻數(shù)理論頻數(shù)SPSS結(jié)果輸出2021/5/923結(jié)論:

2=2.82,P=0.093,按

=0.05水準(zhǔn),不拒絕H0,尚不能認(rèn)為使用含氟牙膏比使用一般牙膏兒童的齲患率低??ǚ街底杂啥萈值雙側(cè)確切概率值單側(cè)確切概率值Pearson卡方連續(xù)校正卡方似然比卡方Fisher確切卡方線性相關(guān)檢驗樣本數(shù)注意檢查樣本例數(shù)n和理論頻數(shù)T是否滿足條件:N≥40且理論頻數(shù)T≥5。2021/5/924*例2.

x2檢驗----校正公式將116例癲癇患者隨機分為兩組,一組70例接受常規(guī)加高壓氧治療(高壓氧組),另一組46例接受常規(guī)治療(常規(guī)組),結(jié)果如下。問兩種療法的有效率有無差別?2021/5/9252021/5/9262021/5/927T<52021/5/928

,按

檢驗水準(zhǔn)不拒絕,尚不能認(rèn)為組有效率不等。

本資料若不校正時,,結(jié)論與之相反。2021/5/929*例3.

x2檢驗----Fisher確切概率法2021/5/930(一)適用條件①T<1或n<40②P≈

(二)基本思想(超幾何分布)

在四格表周邊合計不變的條件下,直接計算表內(nèi)四個數(shù)據(jù)的各種組合之概率。找出的所有表格并將概率求和,若這些表的合計P<,則推翻H0假設(shè)。*例3.

x2檢驗----Fisher確切概率法2021/5/931(三)檢驗步驟假設(shè)H0、H1

2.計算最小理論頻數(shù)及值邊緣合計不變條件下,變動表中數(shù)據(jù)

3.找出邊緣合計中的最小值

對應(yīng)的格子中的數(shù)據(jù)從0到,排出所有可能的四格表。5.選出值的所有表,分別求P值后相加。

2021/5/9322021/5/933SPSS操作過程①建立數(shù)據(jù)文件:例3.sav

數(shù)據(jù)格式:包括4行3列的頻數(shù)格式,3個變量即行變量(group)、列變量(effect)和頻數(shù)變量(freq)。②說明頻數(shù)變量:數(shù)據(jù)加權(quán)個案

DataWeightCases③x2檢驗:從菜單選擇分析描述統(tǒng)計

交叉表

Analyze

DescriptiveStatisticsCrosstabs結(jié)合數(shù)據(jù)(例3.sav)演示操作過程。2021/5/934實際頻數(shù)理論頻數(shù)2021/5/935Fisher確切概率2021/5/936第二節(jié)

配對資料的檢驗

x2testofpairedfourfolddata2021/5/937

與計量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計和配對設(shè)計一樣,計數(shù)資料推斷兩個總體率(構(gòu)成比)是否有差別也有成組設(shè)計和配對設(shè)計,即四格表資料和配對四格表資料。2021/5/938例4某抗癌新藥的毒理研究,將78只大鼠按性別、窩別、體重、年齡等因素配成39對,每個對子的兩只大鼠經(jīng)隨機分配,分別接受甲劑量和乙劑量注射,試驗結(jié)果見下表。分析該新藥兩種不同劑量的毒性有無差異。

配對(paireddata)資料的x2檢驗2021/5/939

上述配對設(shè)計實驗中,就每個對子而言,兩種處理的結(jié)果不外乎有四種可能:①兩種劑量方法皆為陽性數(shù)(a);②兩種劑量方法皆為陰性數(shù)(d);③甲劑量注射法為陽性,乙劑量注射法法為陰性數(shù)(b);④乙劑量注射法為陽性,甲劑量注射法為陰性數(shù)(c)。2021/5/940其中,a,d為兩法結(jié)果一致的兩種情況,

b,c為兩法結(jié)果不一致的兩種情況。檢驗統(tǒng)計量為

2021/5/941注意:

本法一般用于樣本含量不太大的資料。因為它僅考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對較小時,即便是檢驗結(jié)果有統(tǒng)計學(xué)意義,其實際意義往往也不大。2021/5/942檢驗步驟:2021/5/943SPSS操作過程①建立數(shù)據(jù)文件:例4.sav

數(shù)據(jù)格式:包括4行3列的頻數(shù)格式,三個變量分別為行變量、列變量和頻數(shù)變量。②說明頻數(shù)變量:數(shù)據(jù)加權(quán)個案

DataWeightCases③x2檢驗:從菜單選擇分析描述統(tǒng)計

交叉表

Analyze

DescriptiveStatisticsCrosstabs統(tǒng)計量Statistics:√McNemar√Kappa2021/5/944選中進(jìn)行配對卡方檢驗2021/5/9452021/5/946P<0.05,按α=0.05水準(zhǔn),拒絕H0,接受H1,可以認(rèn)為兩種劑量的毒性有差異,甲劑量組的死亡率較高(因為b>c)2021/5/947例4的問題改為:試評價兩種劑量對老鼠致死率的一致性。(評價兩種方法對同一樣本的一致性)配對四格表McNemar檢驗Kappa系數(shù)2021/5/948在Pearson卡方檢驗中,對行變量和列變量的相關(guān)性作檢驗,其中行變量和列變量是一個事物的兩個不同屬性。在實際中,還有一種列聯(lián)表,其行變量和列變量反映的是一個事物的同一屬性的相同水平,只是對該屬性各水平的區(qū)分方法不同。Kappa一致性檢驗?zāi)康模簷z驗兩種方法對同一個樣本(研究對象)的檢驗結(jié)果是否一致一致性檢驗2021/5/949

一般認(rèn)為,當(dāng)Kappa≥0.75時,表明兩者一致性較好;

0.75>Kappa≥0.4時,表明一致性一般;

Kappa<0.4時,表明兩者一致性較差。一致性檢驗2021/5/950P值Kappa系數(shù)=0.198<0.4,

p>0.05,說明兩種方法的吻合度沒有統(tǒng)計學(xué)意義,且吻合度較差。P<0.05,按α=0.05水準(zhǔn),拒絕H0,接受H1,可以認(rèn)為兩種劑量的毒性有差異,甲劑量組的死亡率較高(因為b>c)兩種結(jié)論一致2021/5/951*例5用A、B兩種方法檢查已確診的乳腺癌患者140名,A法檢出91名(65%),B法檢出77名(55%),A、B兩法一致的檢出56名(40%),問哪種方法陽性檢出率更高?練習(xí)題(課后自行練習(xí))2021/5/952注意?。?!計數(shù)資料的配對設(shè)計常用于兩種檢驗方法、培養(yǎng)方法、診斷方法的比較特點:對樣本中各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的技術(shù)結(jié)果2021/5/953第三節(jié)

行×列表資料的檢驗

testofR×Ctable2021/5/954比較某市重污染區(qū)、一般市區(qū)和農(nóng)村三個地區(qū)的出生嬰兒的致畸率。以母乳、牛乳、混合三種不同方式喂養(yǎng)的新生兒體重增長的構(gòu)成是否一致。推斷2個分類變量是否有關(guān)聯(lián),如:研究冠心病與眼底動脈硬化的關(guān)系。。。。。。。。。。。。。。2021/5/955行×列表資料①

多個樣本率比較時,有R行2列,稱R×2表;②

兩樣本的構(gòu)成比比較時,有2行C列,稱2×C表;③

多個樣本的構(gòu)成比比較,以及雙向無序分類資料關(guān)聯(lián)性檢驗時,有行列,稱R×C表。2021/5/956檢驗統(tǒng)計量2021/5/9573.1多個樣本率的比較

例6用A、B、C三種不同方法分別處理新生兒臍帶,發(fā)生感染的情況見下表,試比較3種不同方法的臍帶感染率有無差異。

三種臍帶處理方法的臍帶感染情況

2021/5/9582021/5/959SPSS操作過程(行×列表卡方檢驗)①建立數(shù)據(jù)文件:例6.sav 數(shù)據(jù)格式:包括6行3列的頻數(shù)格式,3個變量分別為行變量、列變量和頻數(shù)變量。②說明頻數(shù)變量:數(shù)據(jù)加權(quán)個案

DataWeightCases③x2檢驗:從菜單選擇分析描述統(tǒng)計

交叉表

Analyze

DescriptiveStatisticsCrosstabs結(jié)合例6數(shù)據(jù)(例6.sav)演示操作及界面。2021/5/960結(jié)論:按α=0.05檢驗水準(zhǔn)拒絕H0,接受H1,可以認(rèn)為三種處理臍帶感染率有差別。

2021/5/9613.2兩組構(gòu)成比的比較

例7為研究某種新藥對尿路疼痛的止痛效果,將有尿路疼痛的患者144例隨機分為兩組,每組72例,一組服該新藥(治療組),另一組服安慰劑(對照組)。兩組患者尿路疼痛的原因見下表,問兩組患者尿路疼痛原因的分布有無差異?

兩組患者尿路疼痛原因的分布2021/5/9622021/5/963結(jié)論:按α=0.05檢驗水準(zhǔn)不拒絕H0,尚不可認(rèn)為兩組患者尿路疼痛原因的分布有差異。2021/5/9643.4多組構(gòu)成比的比較例8

在某項疼痛測量研究中,給160例手術(shù)后疼痛的患者提供四種疼痛測量量表,即直觀模擬量表(VAS),數(shù)字評估量表(NRS),詞語描述量表(VDS),面部表情疼痛量表(FPS),患者首選的量表以及患者的文化程度見下表,問患者首選疼痛量表與文化程度是否有關(guān)?不同文化程度患者首選疼痛量表的類型2021/5/9652021/5/966結(jié)論:按α=0.05檢驗水準(zhǔn)不拒絕H0,尚不能認(rèn)為術(shù)后疼痛患者首選測痛量表類型與文化程度有關(guān)。2021/5/9673.5雙向無序分類資料的關(guān)聯(lián)性檢驗

表中兩個分類變量皆為無序分類變量的行列表資料,又稱為雙向無序表資料。注意:雙向無序分類資料為兩個或多個樣本,做差別檢驗(例7);若為單樣本,做關(guān)聯(lián)性檢驗(例9)。2021/5/968例9

測得某地5801人的ABO血型和MN血型結(jié)果如下表,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?

(單樣本,做關(guān)聯(lián)性檢驗)2021/5/969

上表資料,可用行×列表資料檢驗來推斷兩個分類變量之間有無關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:

列聯(lián)系數(shù)C取值范圍在0~0.7071之間。0表示完全獨立;0.7071表示完全相關(guān)。2021/5/970檢驗步驟2021/5/971由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。2021/5/972SPSS操作過程①建立數(shù)據(jù)文件:例9.sav

數(shù)據(jù)格式:包括12行3列的頻數(shù)格式,三個變量分別為行變量、列變量和頻數(shù)變量。②說明頻數(shù)變量:數(shù)據(jù)加權(quán)個案

DataWeightCases③x2檢驗:從菜單選擇分析描述統(tǒng)計

交叉表

Analyze

DescriptiveStatisticsCrosstabs統(tǒng)計量Statistics:√Chi-square

名義√相依系數(shù)Contingencycoefficient2021/5/973SPSS輸出結(jié)果2021/5/974結(jié)論:按α=0.05檢驗水準(zhǔn)拒絕H0,接受H1,可認(rèn)為兩種血型系統(tǒng)間有關(guān)聯(lián),但由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。2021/5/9751.行列表中的各格T≥1,并且1≤T<5的格子數(shù)不宜超過1/5格子總數(shù),否則可能產(chǎn)生偏性。處理方法有三種:

增大樣本含量以達(dá)到增大理論頻數(shù)的目的(首選)。根據(jù)專業(yè)知識,刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會損失信息及損害樣本的隨機性。例如:不同年齡組可以合并,但不同血型就不能合并。改用雙向無序R×C表的Fisher確切概率法。R×C表檢驗的注意事項2021/5/9762021/5/9772021/5/978練習(xí)題

例10.某實驗室為研究乙肝免疫球蛋白預(yù)防小白鼠胎兒宮內(nèi)感染HBV的效果,將33例HBsAg陽性小白鼠(孕鼠)隨機分為預(yù)防注射組和非預(yù)防組,結(jié)果見下表。問兩組新生小白鼠的HBV總體感染率有無差別?

組別陽性陰性合計感染率(%)

預(yù)防注射組4182218.18

非預(yù)防組561145.45

合計9243327.272021/5/979第四節(jié)

分層資料的卡方檢驗

TestsofConditionalIndependence

2021/5/980例11.Doll和Hill以709例肺癌患者做病例,709個非腫瘤患者做對照,按性別分層,研究吸煙與肺癌的關(guān)系,調(diào)查結(jié)果如下,試做肺癌的病例對照分析。2021/5/981Weightcases2021/5/9822021/5/9832021/5/9842021/5/9852021/5/9862021/5/987關(guān)于OR值與RR值相對危險度RR:是一個概率的比值,指試驗組人群反應(yīng)陽性概率與對照組人群反應(yīng)陽性概率的比值。數(shù)值為1,表明試驗因素與反應(yīng)陽性無關(guān)聯(lián);小于1時,表明試驗因素導(dǎo)致反應(yīng)陽性的發(fā)生率降低;大于1時,表明試驗因素導(dǎo)致反應(yīng)陽性的發(fā)生率增加。優(yōu)勢比OR:是一個比值的比,是反應(yīng)陽性人群中試驗因素有無的比例與反應(yīng)陰性人群中試驗因素有無的比例之比。暴露者的疾病危險度為非暴露者的多少倍。OR>1說明疾病的危險度因暴露而增加,暴露與疾病為“正”關(guān)聯(lián);OR<1說明疾病的危險度因暴露而減少,“負(fù)”關(guān)聯(lián)。當(dāng)關(guān)注的事件發(fā)生概率比較小時(<0.1),優(yōu)勢比可作為相對危險度的近似。2021/5/9882021/5/9892021/5/9902021/5/991第五節(jié)

多個樣本率間的多重比較

Multiplecomparisonofsamplerates

2021/5/992一、基本思想(卡方分割法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論