版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
臨床研究的資料分析第一節(jié)臨床科研中變量的類型1.定量變量(quantitativevariable)稱數(shù)值變量,是對(duì)每個(gè)觀察對(duì)象用定量方法測(cè)定某項(xiàng)指標(biāo)大小所得的資料,一般有度量衡單位常見計(jì)量單位包括:年齡、身高、體重、血壓等類型
離散型變量:取值之間有“縫隙”,如家庭人口數(shù)
連續(xù)性變量:某一區(qū)間可以取任何值,如年齡一、定性變量和定量變量2、定性變量(categoricalvariable)
也稱分類變量,先將觀察對(duì)象按某種屬性或類別分組,然后清點(diǎn)各組觀察對(duì)象的個(gè)數(shù)所得的資料按照變量之間的順序、等級(jí)劃分
有序變量:變量之間呈順序關(guān)系,如療效、疾病嚴(yán)重程度
名義變量:變量之間無(wú)順序關(guān)系,如性別按照類別數(shù)劃分
二分類變量:采用0、1編碼,稱指示變量多分類變量:有序分類變量按由小到大編碼,如1、2、3、4
名義變量的編碼:可以用任何數(shù)值,但僅指其名稱作用,多因素分析時(shí)的啞變量3、變量的轉(zhuǎn)換定量變量定性變量注意:搜集數(shù)據(jù)階段盡可能搜集定量數(shù)據(jù)
例如血壓二、按研究因素間的因果聯(lián)系分類根據(jù)研究變量在在疾病過(guò)程中的發(fā)生作用,可以分為四類:自變量、因變量、中介變量、混雜變量病因病因中介變量自變量因變量混雜因素圖13-1病因關(guān)系中的變量類型
第二節(jié)統(tǒng)計(jì)方法的選擇一、統(tǒng)計(jì)方法選擇基本原則1、研究目的研究目的一定要明確選擇合理的統(tǒng)計(jì)分析方法
統(tǒng)計(jì)描述:通過(guò)統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖或統(tǒng)計(jì)表,對(duì)數(shù)據(jù)資料進(jìn)行最基本的統(tǒng)計(jì)分析,使其反應(yīng)數(shù)據(jù)資料的基本特征
統(tǒng)計(jì)推斷:利用樣本提供的信息對(duì)總體進(jìn)行推斷,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)分析不同干預(yù)措施間效果有無(wú)差異t檢驗(yàn)回歸分析相關(guān)分析秩和檢驗(yàn)卡方檢驗(yàn)方差分析主成分分析、因子分析分析不同因素間關(guān)系將變量或記錄分成若干類別分析影響生存時(shí)間和生存結(jié)局時(shí)間序列數(shù)據(jù)用以預(yù)測(cè)對(duì)同類結(jié)果進(jìn)行定量分析生存分析時(shí)間序列模型判別分析聚類分析Meta分析根據(jù)研究目的選擇統(tǒng)計(jì)分析方法的常見規(guī)則(二)設(shè)計(jì)類型不同設(shè)計(jì)類型,對(duì)應(yīng)著不同統(tǒng)計(jì)方法常見的設(shè)計(jì)類型包括完全隨機(jī)設(shè)計(jì)、配對(duì)設(shè)計(jì)、隨機(jī)區(qū)組設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)、和重復(fù)設(shè)計(jì)等(三)資料類型
分析資料前,首先區(qū)分變量的類型和特征圖13-2臨床研究中統(tǒng)計(jì)方法選擇流程圖(四)統(tǒng)計(jì)方法的應(yīng)用條件
應(yīng)用統(tǒng)計(jì)方法前,先看是否滿足檢驗(yàn)方法所需的前提條件,必要時(shí)可做變量轉(zhuǎn)換
例如:成組t檢驗(yàn)資料滿足獨(dú)立性、正態(tài)、方差齊
χ2檢驗(yàn)樣本量大于40且最小理論頻數(shù)大于5二、統(tǒng)計(jì)方法的具體應(yīng)用單變量分析雙變量分析多變量分析(一)單變量分析對(duì)不含自變量,僅有因變量的資料所進(jìn)行的分析稱為單變量統(tǒng)計(jì)分析應(yīng)用包括:樣本推斷總體參數(shù)和可信區(qū)間單組樣本資料的假設(shè)檢驗(yàn)配對(duì)樣本的假設(shè)檢驗(yàn)檢驗(yàn)樣本的總體分布圖13-3定量資料單變量分析統(tǒng)計(jì)方法選擇流程圖1.因變量為定量資料總體均數(shù)估計(jì):通過(guò)樣本統(tǒng)計(jì)量推斷總體參數(shù)點(diǎn)估計(jì)區(qū)間估計(jì)當(dāng)總體標(biāo)準(zhǔn)差σ已知,或σ未知但樣本量足夠大時(shí)可信區(qū)間為為總體標(biāo)準(zhǔn)差,如計(jì)算95%可信區(qū)間,Z0.05/2=1.96,如計(jì)算99%可信區(qū)間,Z0.01/2=2.58。當(dāng)不知時(shí),可用下式計(jì)算為樣本均數(shù),n為樣本含量,
為標(biāo)準(zhǔn)誤,S為樣本標(biāo)準(zhǔn)差(代替總體標(biāo)準(zhǔn)差),t,是按自由度=n-1的t分布曲線下,兩側(cè)尾部面積各占
所對(duì)應(yīng)的臨界值。單組樣本資料的假設(shè)檢驗(yàn)
通過(guò)樣本均數(shù)
與已知總體均數(shù)之間的差異與標(biāo)準(zhǔn)誤比值,來(lái)推斷樣本均數(shù)所代表的未知總體均數(shù)與已知總體均數(shù)差異是否是抽樣誤差造成的,即是否相同σ已知或樣本量≥30Z檢驗(yàn)σ未知t檢驗(yàn)注意:無(wú)論t檢驗(yàn)還是Z檢驗(yàn)都要求樣本來(lái)自于正態(tài)分布配對(duì)樣本的假設(shè)檢驗(yàn)
將受試對(duì)象按一定條件配成對(duì)子(同種屬、同年齡組、同性別等),再隨機(jī)分配每對(duì)中的受試對(duì)象到不同處理組若差值服從正態(tài)分布,可采用配對(duì)t檢驗(yàn);否則,采用配對(duì)資料的符號(hào)秩和檢驗(yàn)。檢驗(yàn)公式為樣本中各對(duì)差值d的均數(shù),n為對(duì)子數(shù),為樣本差值的標(biāo)準(zhǔn)差2.因變量為定性資料,應(yīng)用包括總體率的參數(shù)估計(jì)單組樣本頻率的假設(shè)檢驗(yàn)等檢驗(yàn)樣本來(lái)自的總體分布(如二項(xiàng)分布、Poisson分布等)圖13-4定性資料單變量分析統(tǒng)計(jì)方法選擇流程圖總體率的參數(shù)估計(jì)
樣本量n足夠大時(shí)(n>50),np和n(1-p)均大于5,p的分布接近正態(tài)分布,用下式計(jì)算總體概率(1-)的可信區(qū)間(CI)p為樣本率,Sp為率的標(biāo)準(zhǔn)誤當(dāng)樣本含量較小(n50),且p很接近0或1時(shí),總體率的可信區(qū)間可按二項(xiàng)分布原理計(jì)算單組樣本頻率的假設(shè)檢驗(yàn)
當(dāng)樣本量n較大時(shí),n
及n(1-
)均大于5時(shí),可利用樣本頻率p的分布近似正態(tài)分布,進(jìn)行單組樣本頻率的Z檢驗(yàn)p為樣本率,為總體率,
為率的標(biāo)準(zhǔn)誤,n為樣本數(shù)如果資料服從二項(xiàng)分布,但n<5時(shí),用二項(xiàng)分布概率函數(shù)直接求出累積概率,然后與規(guī)定的作比較
雙變量分析是指對(duì)只含有一個(gè)因變量和一個(gè)自變量的資料進(jìn)行分析,因此統(tǒng)計(jì)分析方法的選擇不僅要考慮因變量的類型,還要考慮自變量的類型(二)雙變量分析圖13-5因變量為定量資料的雙變量統(tǒng)計(jì)方法選擇流程圖因變量為定量資料1)自變量為定量資料線性相關(guān)相關(guān)程度用Pearson積矩相關(guān)系數(shù)(Pearsonproduct-momentcorrelationcoefficient)表示,符號(hào)為r,計(jì)算公式r無(wú)單位,介于-1~1之間,絕對(duì)值≥0.7,表示相關(guān)程度較強(qiáng);0.4≤|r值的絕對(duì)值|≤0.7,表示中等程度相關(guān);r值的絕對(duì)值<0.4,表示相關(guān)程度較弱。對(duì)相關(guān)系數(shù)ρ進(jìn)行假設(shè)檢驗(yàn)分母為相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤,自由度=n-2。
等級(jí)相關(guān)
如果X、Y不服從雙變量正態(tài)分布,總體分布類型未知,數(shù)據(jù)本身有不確定值或?yàn)榈燃?jí)資料,應(yīng)用秩相關(guān)(rankcorrelation)或稱等級(jí)相關(guān)來(lái)描述兩個(gè)變量間相關(guān)的程度與方向。相關(guān)系數(shù)稱為Spearman秩相關(guān)系數(shù)或等級(jí)相關(guān)系數(shù),用rs
表示簡(jiǎn)單線性回歸應(yīng)用:存在線性關(guān)系,可進(jìn)行簡(jiǎn)單線性回歸(simplelinearregression)分析方法:最小二乘法回歸方程:x,y為相應(yīng)的兩個(gè)變量;a為截距,b為直線的斜率,又稱回歸系數(shù)(regressioncoefficient),計(jì)算公式:線性回歸應(yīng)用條件滿足線性獨(dú)立正態(tài)等方差決定系數(shù)(determinantcoefficient)或確定系數(shù)R2常被用來(lái)反映回歸模型的擬合效果。介于0~1之間2)自變量為定性資料兩獨(dú)立樣本t檢驗(yàn)方差齊時(shí)方差不齊時(shí)要求:兩樣本均來(lái)自正態(tài)分布且方差齊,不滿足時(shí)可選用非參檢驗(yàn)中的Mann-Whitney法對(duì)兩組獨(dú)立樣本進(jìn)行比較。
單因素方差分析只安排一種處理因素的設(shè)計(jì)稱為單因素設(shè)計(jì),不安排其他任何控制因素的單因素設(shè)計(jì)即為完全隨機(jī)設(shè)計(jì)。常用公式見表13-1變異來(lái)源離均差平方和SS自由度均方MSF值總變異N-1組間變異g-1SS組間/g-1MS組間/MS組內(nèi)組內(nèi)變異SS總-SS組間N-kSS組內(nèi)/N-g表13-1完全隨機(jī)設(shè)計(jì)方差分析公式若F檢驗(yàn)發(fā)現(xiàn)差異,需進(jìn)一步進(jìn)行兩兩比較,常用方法包括:LSD-t檢驗(yàn)、SNK-q檢驗(yàn)和Bonferroni法注意:進(jìn)行方差分析的前提條件是,各處理組均來(lái)自正態(tài)分布的總體,當(dāng)不能滿足,可采用Kruskal-Wallis非參檢驗(yàn)法。2、因變量為定性資料1)自變量為定量資料根據(jù)因變量是二分類、無(wú)序多分類和有序多分類,分別采用二分類Logistic回歸、無(wú)序多分類Logistic回歸和有序Logistic回歸進(jìn)行分析(詳細(xì)介紹見多變量分析)圖13-6因變量為定性資料雙變量分析統(tǒng)計(jì)方法選擇流程圖2).因變量自變量均為定性資料因變量無(wú)序分類自變量無(wú)序或有序2檢驗(yàn)或Fisher精確概率法因變量有序分類自變量無(wú)序分類秩和檢驗(yàn)或Ridit分析因變量無(wú)序自變量無(wú)序一致性檢驗(yàn)或2趨勢(shì)檢驗(yàn)
四格表資料的2檢驗(yàn)要用來(lái)檢驗(yàn)兩樣本的率或構(gòu)成比有無(wú)差別。整理表見表13-2處理或特征狀態(tài)合計(jì)+-有aba+b無(wú)cdc+d合計(jì)a+cb+dn=a+b+c+d表13-2四格表2檢驗(yàn)整理表專用公式a、b、c、d分別為四格表的實(shí)際頻數(shù),n為總例數(shù)校正公式當(dāng)1≤T<5且n≥40時(shí)確切概率計(jì)算法當(dāng)T<1或n<40時(shí)配對(duì)2檢驗(yàn)可應(yīng)用McNemar公式作配對(duì)2檢驗(yàn)。整理表見表13-3對(duì)照病例合計(jì)有暴露史無(wú)暴露史有暴露史aba+b無(wú)暴露史cdc+d合計(jì)a+cb+dn=a+b+c+d表13-31:1配對(duì)病例對(duì)照研究資料整理表專用公式校正公式b+c<40
行列表2檢驗(yàn)用于多個(gè)樣本率的比較,樣本構(gòu)成比的比較
為第i行第j列所對(duì)應(yīng)格子的觀察頻數(shù),n為總例數(shù),及分別為第i行合計(jì)數(shù)與第j列合計(jì)數(shù)。行列表的2檢驗(yàn)要求理論頻數(shù)小于5的格子數(shù)不應(yīng)超過(guò)l/5,否則應(yīng)先對(duì)列聯(lián)表進(jìn)行處理。處理方法主要有:增加樣本例數(shù)刪除理論頻數(shù)較小的行或列可將較小理論頻數(shù)所在行或列與性質(zhì)相近的鄰行或鄰列合并采用確切概率法2趨勢(shì)檢驗(yàn)?zāi)骋蛩氐谋┞斗殖捎傻偷礁卟煌乃剑治霰┞端脚c發(fā)病率之間的劑量-反應(yīng)關(guān)系,增加因果關(guān)系推斷的依據(jù)暴露水平Xi合計(jì)X0X1X2…Xi病例aia0a1a2…aim1對(duì)照bib0b1b2…bim0合計(jì)min0n1n2…nin表13-42趨勢(shì)檢驗(yàn)資料整理表公式(自由度為1)xi的取值方法有兩種:取每一暴露水平的中點(diǎn)值,或者取第i暴露水平的xi=i。(三)多變量分析對(duì)一個(gè)因變量與兩個(gè)或兩個(gè)以上的自變量之間關(guān)系進(jìn)行的分析應(yīng)用:篩選影響因素校正混雜因素預(yù)測(cè)或預(yù)報(bào)1.因變量為定量資料圖13-7因變量為定量資料多變量分析統(tǒng)計(jì)方法選擇流程圖配伍組設(shè)計(jì)的方差分析
又稱兩因素方差分析。公式如下變異來(lái)源離均差平方和SS自由度均方MSF值總變異N-1處理組間k-1SS處理/處理MS處理/MS誤差配伍組間b-1SS配伍/配伍MS配伍/MS誤差誤差SS總-SS處理-SS配伍(k-1)(b-1)SS誤差/誤差注意:前提是滿足方差分析條件,如不滿足則采用非參數(shù)Friedman檢驗(yàn)。協(xié)方差分析(analysisofcovariance,ANCOVA)
一種把線性回歸法與方差分析結(jié)合起來(lái)的方法,即扣除協(xié)變量的影響后再對(duì)修正后的主效應(yīng)進(jìn)行方差分析。協(xié)方差分析主要用于控制實(shí)驗(yàn)中非處理因素對(duì)實(shí)驗(yàn)效應(yīng)的影響多重線性回歸分析(multiplelinearregression)研究多個(gè)自變量(X)與一個(gè)因變量(Y)之間是否存在線性關(guān)系公式
為因變量的估計(jì)值,b0為回歸方程的常數(shù)項(xiàng),
bi偏回歸系數(shù)原理:最小二乘法要求:線性、獨(dú)立正態(tài)、等方差假設(shè)檢驗(yàn):回歸方程、總體偏回歸是系數(shù)其他分析:負(fù)相關(guān)分析、偏相關(guān)分析圖13-8因變量為定性資料多變量分析統(tǒng)計(jì)方法選擇流程圖2.因變量為定性資料分層分析當(dāng)自變量為定性資料,且有兩個(gè)或兩個(gè)以上時(shí),可按這些自變量分成數(shù)層(亞組),然后分析它們同因變量的關(guān)系作用:1)控制混雜因素
2)判斷效應(yīng)修飾作用方法:
Mantel-Haenszel分層檢驗(yàn)Logistic回歸分析
能夠克服多重線性回歸,分層分析,χ2檢驗(yàn)的缺點(diǎn)Logistic回歸方程三種表達(dá)式lnP/(1-P)與各因素間呈線性關(guān)系,xi可以為危險(xiǎn)因素、混雜因素,也可是因素間的交互作用。i為L(zhǎng)ogistic回歸的偏回歸系數(shù)研究類型非條件Logistic隊(duì)列研究成組病例對(duì)照條件Logistic配比病例對(duì)照因變量類型二分類Logistic無(wú)序多分類LogisticLogistic分類Cox模型
又稱比例風(fēng)險(xiǎn)模型(proportionalhazardmodel),是一種多因素生存分析方法,它以生存結(jié)局和生存時(shí)間為因變量,可同時(shí)分析眾多因素對(duì)生存期的影響h0(t)是在時(shí)間t時(shí)相應(yīng)的自變量處于0(或標(biāo)準(zhǔn))狀態(tài)下的風(fēng)險(xiǎn)函數(shù),為回歸系數(shù),hi(t/X)為第i個(gè)患者生存到時(shí)間t的風(fēng)險(xiǎn)函數(shù)。特點(diǎn):能處理生存資料中特有的刪失數(shù)據(jù)。它不要求估計(jì)資料基本生存函數(shù)的類型,且可以處理分布未知的資料;因變量hi(t)是不可觀測(cè)的,且隨時(shí)間變化。第三節(jié)
統(tǒng)計(jì)結(jié)果的表達(dá)與解釋描述性統(tǒng)計(jì)分析結(jié)果的表達(dá)與解釋統(tǒng)計(jì)圖表定量資料定性資料統(tǒng)計(jì)推斷結(jié)果的表達(dá)與解釋多重比較結(jié)果的報(bào)告與解釋方差分析結(jié)果的報(bào)告與解釋關(guān)聯(lián)和相關(guān)分析結(jié)果的報(bào)告與解釋回歸分析結(jié)果的報(bào)告與解釋生存分析結(jié)果的報(bào)告與解釋統(tǒng)計(jì)圖表
統(tǒng)計(jì)表原則,重點(diǎn)突出、簡(jiǎn)單明了、主謂分明、層次清楚具體要求:標(biāo)題概括地指明表的內(nèi)容標(biāo)目分為縱標(biāo)目和橫標(biāo)目不宜太多表線,不允許使用豎線與斜線表中數(shù)字一律用阿拉伯?dāng)?shù)字,同列數(shù)據(jù)應(yīng)取相同的小數(shù)位,表中不應(yīng)有空格。不詳?shù)臄?shù)據(jù)可用“…”表示,不存在的數(shù)據(jù)應(yīng)以“-”號(hào)表明,零值應(yīng)用“0”表示釋一律列在表下方,可用“*”等符號(hào)表示一、描述性統(tǒng)計(jì)分析結(jié)果的表達(dá)與解釋統(tǒng)計(jì)圖的基本要求按照資料的性質(zhì)與分析目的恰當(dāng)?shù)剡x擇圖形標(biāo)題位于圖的正下方對(duì)圖中的不同事物應(yīng)通過(guò)不同的圖案或顏色加以區(qū)別,并附圖例涉及坐標(biāo)系的統(tǒng)計(jì)圖,數(shù)軸應(yīng)標(biāo)注合適的原點(diǎn)、尺度和單位(二)定量資料定量資料集中趨勢(shì)算術(shù)均數(shù)、中位數(shù)、眾數(shù)幾何平均數(shù)和調(diào)和平均數(shù)離散趨勢(shì)標(biāo)準(zhǔn)差(方差)、四分位間距、極差和變異系數(shù)對(duì)稱分布資料算術(shù)均數(shù)和標(biāo)準(zhǔn)差非對(duì)稱資料及分布類型未知的資料中位數(shù)和四分位間距其他類型資料幾何均數(shù)取對(duì)數(shù)后呈對(duì)稱分布調(diào)和均數(shù)正偏峰分布資料變異系數(shù)
不同量綱的比較或相差懸殊的數(shù)據(jù)眾數(shù)概略分析(三)定性資料采用相對(duì)數(shù)指標(biāo),計(jì)算陽(yáng)性事件的頻率、頻率分布、強(qiáng)度和相對(duì)比例13-1陳榮昌等人針對(duì)重癥SARS激素治療的有效性和安全性的問(wèn)題,對(duì)廣州市2002年12月到2003年6月期間收治的401例SARS病例進(jìn)行回顧分析,探索激素治療的有效性和安全性(Rong-changChen,Xiao-pingTang,Shou-yongTan,etal.GuangzhouExperienceTreatmentofSevereAcuteRespiratorySyndromeWithGlucosteroids:TheGuangzhouExperience.Chest,2006,129:1441-1452)。原文中Table1列出401例患者中一般資料的基本特征,由于Table1內(nèi)容太多,表13-6僅節(jié)選其中一部分作為示范參數(shù)合計(jì)(401例)非重癥(249例)重癥(152例)統(tǒng)計(jì)量P值年齡(歲)34.7±13.331.5±11.440.0±14.6Z=-6.4#<0.001性別(男/女)129/27261/18868/84
=17.7$<0.001死亡人數(shù)25(6.23)0(0)25(16.5)=43.7<0.001接受激素治療人數(shù)268(66.8)147(59.0)121(79.6)=18.0<0.001激素累積劑量(中位數(shù),IQR),mg1868.0(2132)1372.18(1430)2470.48(3080)Z=-3.6<0.001激素日平均劑量(中位數(shù),IQR),mg131.4(103.0)105.3(88.3)163.2(162.8)Z=-3.9<0.001OI分級(jí)Ⅰ級(jí)(OI<100)14(3.5)0(0)14(9.2)Fisherexacttest<0.001Ⅱ級(jí)(100≤I<200)37(9.2)0(0)37(24.3)Ⅲ級(jí)(200≤I<300)101(25.2)0(0)101(66.4)Ⅳ級(jí)(OI≥300)249(62.1)249(100)0(0)表13-6非重癥和重癥SARS患者的一般情況*(節(jié)選)*
數(shù)據(jù)用均數(shù)±標(biāo)準(zhǔn)差,例數(shù)(%)或中位數(shù)(四分位數(shù)間距)表示#
Mann-WhitneyU非參數(shù)檢驗(yàn)$
(df)二、統(tǒng)計(jì)推斷結(jié)果的表達(dá)與解釋包括假設(shè)檢驗(yàn)方法、單側(cè)或雙側(cè)檢驗(yàn)、檢驗(yàn)水準(zhǔn)、檢驗(yàn)統(tǒng)計(jì)量、自由度及其P值與有關(guān)參數(shù)的可信區(qū)間常見的幾種統(tǒng)計(jì)方法結(jié)果解釋包括:多重比較結(jié)果方差分析結(jié)果關(guān)聯(lián)和相關(guān)分析回歸分析生存分析結(jié)果多重比較結(jié)果的報(bào)告與解釋常用的多重比較方法:均數(shù)比較方法LSD-t檢驗(yàn)、Bonferroni法、Student-Newman-Keuls(SNK)法和Dunnett-t檢驗(yàn)等;秩均值多重比較方法有Bonferroni法、q檢驗(yàn)和Nemenyi檢驗(yàn)等;率多重比較方法有檢驗(yàn)水準(zhǔn)調(diào)整法(如基于Bonferroni思想)、Scheffe可信區(qū)間法簡(jiǎn)單用t檢驗(yàn)、χ2檢驗(yàn),會(huì)導(dǎo)致一類錯(cuò)誤增大在報(bào)告結(jié)果時(shí),不僅要報(bào)告多組資料差異比較采用的統(tǒng)計(jì)方法、統(tǒng)計(jì)量及其P值,還要報(bào)告多重比較采用的方法及其結(jié)果方差分析結(jié)果的報(bào)告與解釋方差分析(AnalysisofVariance,ANOVA),又稱F檢驗(yàn),通過(guò)變異分解的原理進(jìn)行推斷分類:因素方差分析、雙因素方差分析、多因素方差、完全隨機(jī)設(shè)計(jì)方差分析、配伍組設(shè)計(jì)方差分析、交叉設(shè)計(jì)方差分析等前提條件:相互獨(dú)立,正態(tài)分布,方差齊性
例:
為研究茶多酚保健飲料對(duì)急性缺氧的影響,將60只Wistar小白鼠隨機(jī)分為對(duì)照組、低劑量、中劑量和高劑量四個(gè)組,每組15只。40天后,測(cè)得四個(gè)組小白鼠耐缺氧存活時(shí)間均數(shù)±標(biāo)準(zhǔn)差分別為(21.55±3.43)分鐘、(22.88±3.56)分鐘、(28.06±4.38)分鐘、(31.83±4.54)分鐘;4組總體均數(shù)的95%可信區(qū)間分別為(19.47分鐘,23.62分鐘)、(20.81分鐘,24.95分鐘)、(25.98分鐘,30.13分鐘)和(29.76分鐘,33.91分鐘)由方差分析得F=21.14,P<0.01;進(jìn)一步經(jīng)LSD-t檢驗(yàn),除低劑量組外,其他任何兩組間在延長(zhǎng)小白鼠耐缺氧生存時(shí)間上的差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05)關(guān)聯(lián)和相關(guān)分析結(jié)果的報(bào)告和解釋
關(guān)聯(lián)(association)與相關(guān)(correlation)是用來(lái)描述兩個(gè)變量間的相互關(guān)系(relationship)的統(tǒng)計(jì)學(xué)術(shù)語(yǔ)類型關(guān)聯(lián)相關(guān)變量定性資料定量資料方法獨(dú)立χ2Pearson或Spearman取值范圍0~1-1~1散點(diǎn)圖計(jì)算得出相關(guān)系數(shù)對(duì)相關(guān)回歸系數(shù)做假設(shè)檢驗(yàn)解釋r和p值注意:相關(guān)和關(guān)聯(lián)是兩變量間數(shù)量上的相互關(guān)系,不能據(jù)此推論兩變量有生物學(xué)的聯(lián)系,或因果關(guān)系,有可能只是伴隨關(guān)系相關(guān)性分析結(jié)果報(bào)告內(nèi)容:各指標(biāo)的描述性統(tǒng)計(jì)內(nèi)容、相關(guān)或關(guān)聯(lián)分析過(guò)程(如散點(diǎn)圖是否顯示線性相關(guān)趨勢(shì))、相關(guān)系數(shù)的大小及其95%可信區(qū)間、假設(shè)檢驗(yàn)方法、檢驗(yàn)統(tǒng)計(jì)量和P值等、統(tǒng)計(jì)學(xué)結(jié)論(是否相關(guān)及相關(guān)性的強(qiáng)弱)。例:
為了探討學(xué)齡兒童身高與體重的關(guān)系,某人搜集了10名學(xué)齡兒童身高與體重?cái)?shù)據(jù)。10名兒童身高均數(shù)為157.6cm,標(biāo)準(zhǔn)差為8.4cm;體重均數(shù)為36.1kg,標(biāo)準(zhǔn)差為4.8kg。從散點(diǎn)圖(圖13-9)可見,學(xué)齡兒童身高和體重呈線性趨勢(shì),Pearson相關(guān)系數(shù)r=0.93(t=7.10,P<0.001),總體相關(guān)系數(shù)95%可信區(qū)間為(0.72,0.98)。結(jié)果表明,學(xué)齡兒童身高和體重間呈線性正相關(guān)圖13-9兒童體重和身高散點(diǎn)圖回歸分析結(jié)果的報(bào)告與解釋
1)線性回歸(
linearregression)研究一個(gè)變量(反應(yīng)變量,又稱因變量)和另外一個(gè)或一些變量(解釋變量,又稱自變量)線性依存關(guān)系的統(tǒng)計(jì)分析方法用途刻畫定性關(guān)系,篩選危險(xiǎn)因素,估計(jì)變量,預(yù)測(cè)和控制分類簡(jiǎn)單線性和多重線性要求線性、獨(dú)立、正態(tài)、等方差注意:多重共線性的識(shí)別與處理
線性回歸分析結(jié)果應(yīng)該包括如下內(nèi)容:回歸分析目的、確定分析用的自變量和因變量、檢驗(yàn)資料是否滿足進(jìn)行線性回歸的前提條件、擬合線性回歸模型的方法、篩選自變量的方法、自變量之間是否存在共線性、是否考慮自變量之間的交互作用、最終確定的模型及其相關(guān)統(tǒng)計(jì)量(如確定系數(shù)、偏回歸系數(shù)估計(jì)值及其標(biāo)準(zhǔn)誤、偏回歸系數(shù)的95%可信區(qū)間、標(biāo)準(zhǔn)偏回歸系數(shù)、t值、P值等)例:
ChangHT等人為了探討臺(tái)灣年老退伍軍人生活質(zhì)量和影響因素,收集了260名男性年老退伍軍人社會(huì)人口學(xué)和慢性疾病相關(guān)數(shù)據(jù),并用了WHOQOL臺(tái)灣簡(jiǎn)單版、SF-36、社會(huì)支持量表、老年人抑郁量表等量表進(jìn)行測(cè)量。采用逐步回歸的方法分析在四個(gè)領(lǐng)域中調(diào)查者的生活質(zhì)量,結(jié)果表明抑郁癥狀、慢性疾病的數(shù)量、退休時(shí)軍銜和親戚的支持跟身體和心理領(lǐng)域相關(guān),朋友的支持和抑郁癥狀與社會(huì)關(guān)系領(lǐng)域相關(guān),朋友的支持和日常娛樂(lè)生活與環(huán)境領(lǐng)域相關(guān)。(ChangHT,LiuLF,ChenCK,etal.Correlatesofinstitutionalizedseniorveterans’qualityoflifeinTaiwan.HealthQualLifeOutcomes,2010,8(1):70)。因原文中Table5列出生活質(zhì)量四個(gè)領(lǐng)域相關(guān)因素多重回歸結(jié)果,由于內(nèi)容太多,表13-7僅節(jié)選其中一個(gè)軀體領(lǐng)域(physicaldomain)作為示范表13-7生活質(zhì)量四個(gè)領(lǐng)域相關(guān)因素多重回歸結(jié)果(節(jié)選)影響因素偏回歸系數(shù)標(biāo)準(zhǔn)化回歸系數(shù)tP共線性容忍度方差膨脹因子軀體領(lǐng)域(校正
)常數(shù)項(xiàng)12.9812.52<0.0001抑郁癥狀-0.43-0.50-5.98<0.00010.901.11慢性疾病數(shù)量-0.45-0.33-3.77<0.00010.821.22教育程度0.680.202.12<0.050.741.36退休時(shí)軍銜0.620.202.33<0.050.881.14親戚支持0.120.182.14<0.050.911.092)
Logistic回歸
Logistic回歸適用因變量為分類變量的一種回歸分析方法,常被用于研究各種危險(xiǎn)因素與疾病發(fā)生之間的定量關(guān)系Logistic回歸分析結(jié)果的報(bào)告應(yīng)包括:分析目的、自變量基本統(tǒng)計(jì)描述、自變量篩選方法、自變量之間交互作用的考察、Logistic回歸系數(shù)、標(biāo)準(zhǔn)誤、P值、OR的估計(jì)值以及OR的95%可信區(qū)間。例:為研究子宮內(nèi)膜癌與過(guò)去服用雌激素的關(guān)系,用回顧性病例對(duì)照研究方法調(diào)查188例子宮內(nèi)膜癌患者,另選188例未患子宮內(nèi)膜癌婦女作對(duì)照,了解過(guò)去使用雌激素史。Logistic回歸分析結(jié)果見表13-8,結(jié)果表明服用雌激素與子宮內(nèi)膜癌發(fā)生有關(guān)(P<0.001),服用雌激素組的優(yōu)勢(shì)比為7.402,95%可信區(qū)間為(4.534,12.083)。變量系數(shù)標(biāo)準(zhǔn)誤Wald
POROR的95%CI雌激素2.0020.25064.078<0.0017.402(4.534,12.083)常數(shù)項(xiàng)-0.6870.13725.110<0.0010.503-表13-8子宮內(nèi)膜癌與雌激素關(guān)系的Logistic回歸分析結(jié)果5.生存分析結(jié)果的報(bào)告與解釋
生存分析是將終點(diǎn)事件的出現(xiàn)與否和出現(xiàn)終點(diǎn)事件所經(jīng)歷的時(shí)間結(jié)合起來(lái)分析的一類統(tǒng)計(jì)分析方法,可用于生存率估計(jì)、生存曲線比較、影響因素分析和生存預(yù)測(cè)生存分析壽命表法Kaplan-MeierLog-rank和BreslowCox回歸若是生存率估計(jì),分析結(jié)果報(bào)告應(yīng)是:生存率估計(jì)方法、生存曲線及中位生存期;若是生存曲線比較,則需報(bào)告生存曲線、生存曲線比較方法、檢驗(yàn)統(tǒng)計(jì)量及其P值;若是影響因素分析和生存預(yù)測(cè),結(jié)果報(bào)告包括:變量篩選方法、檢驗(yàn)水準(zhǔn)、各變量相對(duì)危險(xiǎn)度(RR)、RR95%可信區(qū)間及其P值。例:
LiangJF等人研究SPARC和
VEGF在結(jié)腸癌蛋白表達(dá)的關(guān)系和預(yù)后意義,采用Kaplan-Meier法和Log-rank檢驗(yàn)評(píng)價(jià)PARC和
VEGF表達(dá)對(duì)生存時(shí)間的影響,SPARC在間質(zhì)細(xì)胞(MSC)表達(dá)高反應(yīng)組和低反應(yīng)組總生存時(shí)間(overallsurvival)和無(wú)病生存時(shí)間(disease-freesurvival)有統(tǒng)計(jì)學(xué)的差異,生存預(yù)后的影響因素分析見表13-9
多變量Cox比例風(fēng)險(xiǎn)回歸分析表明,SPARC表達(dá)、VEGF表達(dá)以及TNM分期是總生存時(shí)間的獨(dú)立預(yù)后影響因素表13-9影響結(jié)腸癌患者總生存時(shí)間的預(yù)后因素Cox回歸分析結(jié)果參數(shù)回歸系數(shù)標(biāo)準(zhǔn)誤Wald相對(duì)危險(xiǎn)度95%CIP值下限上限腫瘤分化0.0760.2800.0741.0790.6231.8690.785淋巴結(jié)轉(zhuǎn)移-0.1740.3630.2300.8400.4121.7120.632淋巴結(jié)浸潤(rùn)-0.0120.3840.0010.9890.4662.0970.976入侵深度-0.3440.4310.6390.7090.3051.6490.424遠(yuǎn)處轉(zhuǎn)移-0.2050.4590.2000.8150.3312.0030.655TNM0.9590.3636.9722.6091.2805.3160.008SPARC0.9990.3677.4312.7171.3245.5740.006VEGF-0.3110.1534.1360.7330.5430.9890.042MVD0.0260.0280.8871.0270.9721.0850.346第四節(jié)中介效應(yīng)與交互作用分析中介效應(yīng)定義中介效應(yīng)識(shí)別和檢驗(yàn)中介效應(yīng)的估算方法中介效應(yīng)與間接效應(yīng)交互作用概述交互作用的識(shí)別交互作用分析交互作用解釋定義在疾病病因研究中,常會(huì)出現(xiàn)一種情況,由病因(自變量X)至疾?。ㄒ蜃兞縔)的過(guò)程中,不是直接的因果關(guān)系(X→Y),先是通過(guò)先引發(fā)一個(gè)或多個(gè)中間變化,間接產(chǎn)生影響,最終導(dǎo)致疾病的發(fā)生。其中的中間變化在病因分析中,被稱為中間變量或中介變量(mediatorvariable,M),而自變量X通過(guò)中介變量M對(duì)因變量Y產(chǎn)生的間接影響,被稱為中介效應(yīng)(mediatingeffect;mediation)。一、中介效應(yīng)以三變量為例,介紹中介效應(yīng)關(guān)系中介效應(yīng)XYe1Y=cX+e1(1)XYMabC,Ce2e3M=aX+e2(2)Y=c,X+bM+e3(3)意義:探索病因(X)導(dǎo)致疾?。╕)的作用機(jī)制整合已有的研究或理論,具有顯著的理論和實(shí)踐意義例子吸煙炎性反應(yīng)因子高血壓中介效應(yīng)中介效應(yīng)識(shí)別與檢驗(yàn)自變量與因變量存在關(guān)聯(lián)(系數(shù)c)自變量與中介變量的關(guān)聯(lián)也有關(guān)聯(lián)(系數(shù)a)在控制了自變量后,中介變量與因變量存在關(guān)聯(lián)(系數(shù)b)在控制了中介變量后,如果自變量仍與因變量存在有統(tǒng)計(jì)學(xué)意義的關(guān)聯(lián)(系數(shù)c′)識(shí)別對(duì)方程1中自變量(X)與因變量(Y)的回歸系數(shù)c做顯著檢驗(yàn)有統(tǒng)計(jì)學(xué)意義,繼續(xù)下面第2步,檢驗(yàn)方程2如果c沒有統(tǒng)計(jì)學(xué)意義(說(shuō)明X對(duì)Y無(wú)影響),則停止中介效應(yīng)檢驗(yàn)對(duì)方程2中自變量(X)與中介變量(M)的回歸系數(shù)a做顯著檢驗(yàn)如果a有統(tǒng)計(jì)學(xué)意義,繼續(xù)第(3)步,檢驗(yàn)方程(3)如果a沒有統(tǒng)計(jì)學(xué)意義(說(shuō)明M對(duì)Y無(wú)影響),則停止中介效應(yīng)檢驗(yàn)對(duì)方程3
(Y=c’X+bM+e3)中的回歸系數(shù)b和c’做顯著性檢驗(yàn)如果b有統(tǒng)計(jì)學(xué)意義,則說(shuō)明存在中介效應(yīng)。進(jìn)一步檢驗(yàn)c’,如果c’
有統(tǒng)計(jì)學(xué)意義,則說(shuō)明是不完全中介效應(yīng);若c’
沒有統(tǒng)計(jì)學(xué)意義,則說(shuō)明是完全中介效應(yīng),X對(duì)Y的作用完全通過(guò)M來(lái)實(shí)現(xiàn),檢驗(yàn)結(jié)束。果b沒有統(tǒng)計(jì)學(xué)意義,則不能排除中介效應(yīng),需要進(jìn)一步做4步,Sobel檢驗(yàn)。Sobel檢驗(yàn)該方法直接檢驗(yàn)中介效應(yīng)ab乘積項(xiàng)的系數(shù)是否有統(tǒng)計(jì)學(xué)意義,得到一個(gè)z值,將這個(gè)z值和標(biāo)準(zhǔn)正態(tài)分布的臨界z值進(jìn)行比較,如果z值大于臨界z值,說(shuō)明中介效應(yīng)存在,如果z值小于臨界z值,說(shuō)明中介效應(yīng)不存在中介效應(yīng)檢驗(yàn)中介效應(yīng)的估算方法在中介效應(yīng)分析時(shí),除了要報(bào)告中介效應(yīng)(ab)的大小外,還要報(bào)告中介效應(yīng)與總效應(yīng)之比,后者表示中介效應(yīng)占總效應(yīng)中的比重,或者中介效應(yīng)與直接效應(yīng)之比,它們都可以衡量中介效應(yīng)的相對(duì)大小在炎性反應(yīng)在吸煙與高血壓病的聯(lián)系中起中介效應(yīng)作用的研究中得到如下結(jié)果,吸煙量與炎癥因子CRP之間的偏回歸系數(shù)為a等于0.500,吸煙量與高血壓之間的偏回歸系數(shù)c為0.225;在同時(shí)納入吸煙量和炎癥因子CRP兩個(gè)變量時(shí),吸煙量和炎癥因子CRP與高血壓的偏回歸系數(shù)分別為0.047(c’)和0.133(b),并且c’不具有統(tǒng)計(jì)學(xué)意義。因此,推論炎癥因子CRP在吸煙量與高血壓的聯(lián)系中起完全中介效應(yīng),其中介效應(yīng)值為0.0665,中介效應(yīng)占總效應(yīng)的比重為58.59%,直接效應(yīng)占總效應(yīng)的比重等于41.41%(1-58.59%),中介效應(yīng)與直接效應(yīng)之比為1.41。即在吸煙量對(duì)高血壓的效應(yīng)中,有41.41%是直接效應(yīng),另外有58.59%是通過(guò)中介變量炎癥因子CRP中介效應(yīng)(或間接效應(yīng))起作用的例子圖13-12炎癥因子CRP對(duì)吸煙量和高血壓聯(lián)系中的中介效應(yīng)例子中介效應(yīng)與間接效應(yīng)區(qū)別:在中介變量不止一個(gè)時(shí),中介效應(yīng)要明確是哪個(gè)中介變量的中介效應(yīng),而間接效應(yīng)既可以是某特定中介變量的間接效應(yīng)(即中介效應(yīng)),也可是部分或所有中介效應(yīng)之和在只有一個(gè)中介變量的情形下,雖然中介效應(yīng)等于間接效應(yīng),但兩者還是不等同(一)概述
1.定義當(dāng)兩個(gè)或兩個(gè)以上因子共同作用于某一事件時(shí),其效應(yīng)明顯不同于該兩個(gè)或兩個(gè)以上因子單獨(dú)作用時(shí)的和或積,稱這些因子間存在交互作用(interaction)二、交互作用2.類型:協(xié)同作用
拮抗作用3.交互作用數(shù)學(xué)模型:相加模型相乘模型4.交互與混雜因素的區(qū)別:交互作用取決于因素的內(nèi)在機(jī)制,通過(guò)統(tǒng)計(jì)學(xué)方法進(jìn)行描述和評(píng)價(jià)混雜因素是對(duì)真實(shí)性的一種扭曲,在設(shè)計(jì)階段和資料分析方面可以避免(二)交互作用識(shí)別明確所研究的因素與事件之間是否存在統(tǒng)計(jì)學(xué)聯(lián)系否由偏倚或混雜所致判斷交互作用是否存在是否
判斷交互作用的方法分層分析
Mental-Haenszel法、Woolf法、直接分層分析和最大似然比檢驗(yàn)
注意:難以分析多因素間的交互作用,且無(wú)法調(diào)整和控制研究中的其他因素多因素分析
線性回歸模型是否有相加交互作用
Logistic或Cox回歸模型是否有相乘交互作用(三)交互作用分析1.定量分析交互作用超額相對(duì)危險(xiǎn)度(relativeexcessriskofinteraction,RERI)交互作用歸因比(attributableproportionsofinteraction,API)交互作用指數(shù)S(thesynergyindexS,S)表示X與Z兩個(gè)因素均不存在時(shí)的相對(duì)危險(xiǎn)度表示X與Z兩個(gè)因素均存在時(shí)的相對(duì)危險(xiǎn)度表示X因素存在而Z因素不存在時(shí)的相對(duì)危險(xiǎn)度表示X因素不存在而Z因素存在時(shí)的相對(duì)危險(xiǎn)度注意:API可以評(píng)價(jià)兩因子同時(shí)存在時(shí)可歸于其交互作用的比例,公共衛(wèi)生學(xué)意義較大2)相加交互作用的回歸分析當(dāng)模型中交互作用項(xiàng)的回歸系數(shù)無(wú)統(tǒng)計(jì)學(xué)意義時(shí),即
時(shí),兩因素同時(shí)存在時(shí)的作用等于兩因素單獨(dú)作用之和,此為交互作用的相加模型3)相乘交互作用的回歸分析檢驗(yàn)
是否為0便可判斷相乘交互作用是否存在(四)交互作用解釋統(tǒng)計(jì)學(xué)交互作用生物學(xué)交互作用公共衛(wèi)生學(xué)交互作用第五節(jié)臨床研究中的常見統(tǒng)計(jì)學(xué)錯(cuò)誤描述性分析中常見的常見的錯(cuò)誤統(tǒng)計(jì)推斷中常見的統(tǒng)計(jì)學(xué)錯(cuò)誤一、描述性分析中常見的錯(cuò)誤1.統(tǒng)計(jì)圖表統(tǒng)計(jì)圖常見錯(cuò)誤:該用表格之處未用;表格設(shè)計(jì)不合理;標(biāo)題過(guò)長(zhǎng);線條過(guò)多;數(shù)字小數(shù)位數(shù)不統(tǒng)一;表中數(shù)據(jù)的含義未表達(dá)清楚等統(tǒng)計(jì)表常見錯(cuò)誤:選用的統(tǒng)計(jì)圖類型與資料的性質(zhì)不吻合;坐標(biāo)軸上所標(biāo)的刻度值違背數(shù)學(xué)原則,橫軸等距離刻度表示不相等的數(shù)量,導(dǎo)致改變圖形應(yīng)有的變化趨勢(shì);縱橫坐標(biāo)軸交匯點(diǎn)不是坐標(biāo)原點(diǎn),破壞了直角坐標(biāo)系的嚴(yán)謹(jǐn)性等某文對(duì)50例皮膚癌p53蛋白和增殖細(xì)胞核抗原(PCNA)的檢測(cè)結(jié)果有如下一段敘述:“癌中p53蛋白和PCNA表達(dá)的比較:50例鱗癌中22例p53陰性但PCNA陽(yáng)性(44.0%),p53和PCNA均陽(yáng)性28例(56.0%),PCNA(+)12例,p53陰性9例(75.0%),陽(yáng)性3例(25.0%),PCNA(++)23例,p53陰性9例(39.1%),陽(yáng)性14例(60.9%),PCNA(+++)15例,p53陰性4例(26.7%),陽(yáng)性11例(73.3%),兩者呈平行關(guān)系(P<0.05)。”例13-7對(duì)差錯(cuò)的辨析與釋疑:以上一段話的描述,不能給人以清晰的印象,若用自身對(duì)照表(表13-11)列出,則不僅有利于對(duì)比,而且兩者關(guān)系一目了然表13-1150例皮膚鱗癌p53蛋白和增殖細(xì)胞核抗原表達(dá)的關(guān)系PCNAp53(例數(shù))p53陽(yáng)性率(%)+-合計(jì)+391225.0++1492360.9+++1141573.3合計(jì)28225056.0某研究目的是探討細(xì)胞代謝中產(chǎn)生的活性氧如氧自由基、H2O2等,對(duì)細(xì)胞具有毒害作用。利用誘導(dǎo)培養(yǎng)N-2a細(xì)胞,研究其死亡特征(圖13-13)例13-8圖13-13Bcl-XL基因可以抑制H2O2誘導(dǎo)培養(yǎng)的N-2a細(xì)胞死亡(條圖)
對(duì)差錯(cuò)的辨析與釋疑:培養(yǎng)時(shí)間是一個(gè)連續(xù)性變量,反映事物或者現(xiàn)象隨時(shí)間推移的變化趨勢(shì)時(shí)宜選用線圖(圖13-14),不應(yīng)該選用條圖。條圖割斷了時(shí)間點(diǎn)之間的聯(lián)系,它適合表達(dá)彼此之間相互獨(dú)立的項(xiàng)目的數(shù)量大小圖13-14Bcl-XL基因可以抑制H2O2誘導(dǎo)培養(yǎng)的N-2a細(xì)胞死亡(線圖)(二)定量變量
定量資料統(tǒng)計(jì)描述中常見的描述性錯(cuò)誤有:
誤用呈正態(tài)分布定量資料的方法“均數(shù)±標(biāo)準(zhǔn)差”來(lái)取代描述呈非正態(tài)分布定量資料的方法“中位數(shù)(四分位數(shù)間距)”;利用“均數(shù)±標(biāo)準(zhǔn)誤”代替“均數(shù)±標(biāo)準(zhǔn)差”來(lái)描述定量資料等。例13-9為了解膽石患者血清中相關(guān)元素和膳食狀況,原作者采用病例對(duì)照方法進(jìn)行了營(yíng)養(yǎng)膳食調(diào)查及血清中元素的測(cè)定,其中膽結(jié)石患者與健康人群的膳食結(jié)構(gòu)關(guān)系見表13-12表13-12平均每人每日各種食物的攝入量(
)(g/d)組別大米豆類水果類動(dòng)物油病例組189.06±51.9523.38±23.57128.12±145.82.38±19.83對(duì)照組198.17±82.9644.03±43.36189.67±134.21.67±18.29辨析與釋疑:動(dòng)物油所對(duì)應(yīng)的攝入量標(biāo)準(zhǔn)差是平均值9~10倍,很明顯此資料服從偏態(tài)分布,不適合用正態(tài)分布法進(jìn)行統(tǒng)計(jì)描述正確描述方法中位數(shù)(四分位數(shù)間距)
例13-9比較下頜升支矢狀截骨術(shù)(SSRO)和下頜升支垂直截骨術(shù)(IVRO)后下頜對(duì)口頜系統(tǒng)功能的影響。對(duì)27例下頜前突患者(16例接受SSRO,11例接受IVRO)分別在術(shù)前、術(shù)后3個(gè)月、6個(gè)月測(cè)定其頜力、咀嚼效能例13-10表13-13兩組患者術(shù)前和術(shù)后頜力的測(cè)定結(jié)果(kg,
)時(shí)間SSRO(n=16)IVRO(n=11)術(shù)前14.58±7.8516.89±9.14術(shù)后3個(gè)月10.54±5.879.63±7.24術(shù)后6個(gè)月15.02±6.6113.48±8.29辨析與釋疑:錯(cuò)用“平均數(shù)±標(biāo)準(zhǔn)誤”來(lái)描述數(shù)據(jù)分布的集中趨勢(shì)和離散程度正確描述方法中位數(shù)(四分位數(shù)間距)例13-10(三)定性資料
常見描述性錯(cuò)誤:
將構(gòu)成比與率混為一談;錯(cuò)誤地計(jì)算平均率;分母很小時(shí)也計(jì)算相對(duì)數(shù);相對(duì)數(shù)的比較沒有注意可比性某文有一段文字?jǐn)⑹觯骸霸诒茄拾└甙l(fā)區(qū)的廣州地區(qū),HD(霍奇金?。┎⒉簧僖?。在統(tǒng)計(jì)的1398例淋巴瘤中HD占28.5%,較中國(guó)的平均發(fā)病率10.9%高,但比英美國(guó)家(分別為42%和53%)低例13-11辨析與釋疑:錯(cuò)誤地將構(gòu)成比當(dāng)作率使用,HD占淋巴瘤總數(shù)的28.5%,只是構(gòu)成比,此處卻解釋為發(fā)病率,從而得出廣州地區(qū)的發(fā)病率比中國(guó)的平均發(fā)病率高的錯(cuò)誤結(jié)論參數(shù)估計(jì)中常見錯(cuò)誤
常見錯(cuò)誤:把總體均數(shù)的可信區(qū)間估計(jì)與參考值范圍估計(jì)相混淆;在進(jìn)行區(qū)間估計(jì)時(shí),沒有注意到是否符合正態(tài)近似條件而盲目套用公式二、統(tǒng)計(jì)推斷中常見的統(tǒng)計(jì)學(xué)錯(cuò)誤
表13-14是某研究者測(cè)得某地120名正常成人尿鉛含量(mg/L),由于尿鉛值高于某上限值才被看作異常,故采用
計(jì)算得到正常成人平均尿鉛含量95%可信區(qū)間的上限,從而得到95%可信區(qū)間為(
,26.031)例13-12表13-14120名正常成人尿鉛含量頻數(shù)表尿鉛含量0~4~8~12~16~20~24~28~32~36~合計(jì)例數(shù)1422291815106321120辨析與釋疑:把總體均數(shù)的可信區(qū)間估計(jì)與參考值范圍估計(jì)相混淆正確做法利用公式
計(jì)算得到正常成人尿鉛含量95%參考值范圍為(
,14.068)例13-12(二)假設(shè)檢驗(yàn)中常見錯(cuò)誤
1.不注意應(yīng)用條件而誤用統(tǒng)計(jì)分析方法
忽視t檢驗(yàn)和方差分析的前提條件不符合
檢驗(yàn)適用條件仍盲目套用公式研究CEA、CA19-9、CA72-4和CA242四項(xiàng)腫瘤標(biāo)志在結(jié)直腸癌診斷的作用,分別檢測(cè)手術(shù)前患者58名和手術(shù)后患者30名這4項(xiàng)指標(biāo)(表13-15),原作者對(duì)資料進(jìn)行了t檢驗(yàn)例13-13表13-15手術(shù)前后兩組4項(xiàng)腫瘤標(biāo)志檢測(cè)結(jié)果(
)組別CEA(μg/L)CA19-9(U/L)CA72-4(U/L)CA242(U/L)術(shù)前組(n=58)34.0±79.0209.0±739.07.2±4.8111.0±179.0術(shù)后組(n=30)2.0±1.211.0±10.94.3±2.810.8±17.5辨析與釋疑:忽視了t檢驗(yàn)的前提條件:正態(tài)性和方差齊例13-13正確做法通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行變量變換,使之滿足正態(tài)性和方差齊性的要求,或者是直接用非參數(shù)檢驗(yàn)方法。某文對(duì)31例腎細(xì)胞癌c2erbB22癌基因表達(dá)與預(yù)后的關(guān)系分析如下(表13-16):本組隨訪病例中5年存活者為17例,死亡14例,5年存活率為54.84%。死亡病例中13例為c2erbB22表達(dá)陽(yáng)性病例,5年存活率為43.48%;陰性病例的5年存活率為87.50%(7/8例),二者經(jīng)
檢驗(yàn),差異有統(tǒng)計(jì)學(xué)意義(=4.644,P<0.05)例13-14表13-1631例腎細(xì)胞癌c2erbB22表達(dá)不同者5年存活率c2erbB22存活死亡合計(jì)5年存活率(%)陽(yáng)性10132343.48陰性71887.50合計(jì)17143154.84辨析與釋疑:普通四格表資料做
檢驗(yàn)時(shí),要求樣本量n≥40,并且格子的期望頻數(shù)≥5。如果樣本量n≥40,但是有格子的期望頻數(shù)小于5但大于等于1,則需要校正
值;如果樣本量n<40,或有格子的期望頻數(shù)<1,應(yīng)采用Fisher確切概率法例13-14正確做法Fisher精確概率檢驗(yàn)法2.不考慮設(shè)計(jì)類型而誤用統(tǒng)計(jì)分析方法誤用成組設(shè)計(jì)t檢驗(yàn)處理配對(duì)設(shè)計(jì)的定量資料誤用成組設(shè)計(jì)t檢驗(yàn)代替單因素方差分析進(jìn)行多組間比較誤用t檢驗(yàn)處理析因設(shè)計(jì)的定量資料誤用t檢驗(yàn)處理重復(fù)測(cè)量設(shè)計(jì)的定量資料誤用一般
檢驗(yàn)代替配對(duì)設(shè)計(jì)McNemar檢驗(yàn)將高維列聯(lián)表簡(jiǎn)單拆分或合并成簡(jiǎn)單的列聯(lián)表后再處理誤用成組設(shè)計(jì)t檢驗(yàn)處理配對(duì)設(shè)計(jì)的定量資料例13-15
某文用改良的Seldinger插管技術(shù)對(duì)8例經(jīng)臨床及病理證實(shí)的惡性滋養(yǎng)細(xì)胞腫瘤進(jìn)行選擇性盆腔動(dòng)脈插管灌注化療。治療前后測(cè)血hCG放免測(cè)定值(表13-17),原作者采用一般t檢驗(yàn)進(jìn)行分析,得出治療前后血hCG值有統(tǒng)計(jì)學(xué)差異(P<0.05)病例灌注治療前(X1)灌注治療后(X2)lgX1lgX2112800002100006.10725.322227550033004.87793.518531245022104.09523.3444415000009.36.17610.968551000025004.00000.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609注:由于本組數(shù)據(jù)相差較大,故取其對(duì)數(shù)使之成為正態(tài)分布,經(jīng)t檢驗(yàn)(P<0.05)辨析與釋疑本資料為自身配對(duì)設(shè)計(jì),直接用t檢驗(yàn)比較,容易增大犯假陰性錯(cuò)誤的機(jī)會(huì)例13-15正確做法配對(duì)設(shè)計(jì)或配對(duì)秩和檢驗(yàn)誤用成組設(shè)計(jì)t檢驗(yàn)代替單因素方差分析進(jìn)行多組間比較例13-16表13-18為缺氧缺血性腦病動(dòng)物模型實(shí)驗(yàn)研究關(guān)于大腦重量的觀察結(jié)果,共分對(duì)照、治療和預(yù)防三個(gè)組,原作者采用t檢驗(yàn)進(jìn)行多組比較。分組動(dòng)物數(shù)(只)腦重量(g)左腦右腦對(duì)照130.392±0.096a0.587±0.023d治療180.452±0.116b0.587±0.044e預(yù)防210.529±0.585±表13-18各組大鼠病變大腦重量的比較(
)t檢驗(yàn)結(jié)果:a與b,P>0.05;a與c,P<0.01;b與c,P<0.05;a與d,P<0.01;b與e,P<0.01;c與f,P<0.01辨析與釋疑用t檢驗(yàn)分別對(duì)各組均數(shù)逐一進(jìn)行比較,且每次比較檢驗(yàn)水準(zhǔn)仍為=0.05,這樣就會(huì)增大犯錯(cuò)誤的概率例13-16正確做法一是三組間同側(cè)腦重量比較,需作單因素方差分析而不是t檢驗(yàn),當(dāng)差異有統(tǒng)計(jì)學(xué)意義后,再進(jìn)行兩兩比較。二是對(duì)同一組左右腦重量進(jìn)行比較,應(yīng)采用成組設(shè)計(jì)的t檢驗(yàn)誤用t檢驗(yàn)處理析因設(shè)計(jì)的定量資料例13-17為探討發(fā)育期營(yíng)養(yǎng)不良伴發(fā)癲癇持續(xù)狀態(tài)對(duì)海馬神經(jīng)發(fā)生的影響,將28只新生Wistar大鼠建模分為4組,分別為營(yíng)養(yǎng)良好組、營(yíng)養(yǎng)不良組、營(yíng)養(yǎng)良好+驚厥組、營(yíng)養(yǎng)不良+驚厥組,每組7只,測(cè)量各組齒狀回Brdu陽(yáng)性細(xì)胞數(shù),并采用t檢驗(yàn)比較各組的差異是否具有統(tǒng)計(jì)學(xué)意義(表13-19)。表13-19營(yíng)養(yǎng)狀態(tài)及有無(wú)驚厥幼鼠齒狀回Brdu陽(yáng)性細(xì)胞數(shù)比較(
)營(yíng)養(yǎng)狀態(tài)Brdu陽(yáng)性細(xì)胞(個(gè))有無(wú)驚厥比較(t值)單純組伴驚厥組不良303±20374±187.05良好269±18312±243.77營(yíng)養(yǎng)狀態(tài)比較(t值)3.325.51—辨析與釋疑本試驗(yàn)設(shè)計(jì)為析因設(shè)計(jì),使用t檢驗(yàn)割裂了整體設(shè)計(jì);資料利用率低;誤差自由度變小;增大犯假陽(yáng)性錯(cuò)誤概率;無(wú)法分析因素間可能存在的交互作用大小例13-17正確做法析因設(shè)計(jì)的方差分析方法,如不滿足參數(shù)檢驗(yàn)的前提條件,應(yīng)進(jìn)行變量轉(zhuǎn)化誤用t檢驗(yàn)處理重復(fù)測(cè)量設(shè)計(jì)的定量資料例13-18某文研究消炎痛栓對(duì)肝硬化門靜脈高壓癥患者門靜脈壓力的影響。在手術(shù)后10~14天停止全部用藥后進(jìn)行,首先經(jīng)術(shù)中留置的門靜脈插管測(cè)基礎(chǔ)門靜脈壓、血壓和脈搏,然后從肛門塞入消炎痛栓半枚(50g),再分別記錄給藥后0.5、1、3、5和10小時(shí)的門靜脈壓、血壓和脈搏(表13-20)。原作者采用自身對(duì)照t檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析。表13-20肝硬化門靜脈高壓癥患者應(yīng)用消炎痛栓后不同時(shí)間門靜脈壓、血壓和脈搏變化用藥時(shí)間(h)門靜脈壓(mmHg)收縮壓(mmHg)舒張壓(mmHg)脈搏(次/分)用藥前24.44±2.71121.13±11.2877.89±9.4082±10用藥后0.521.29±1.88114.21±10.3071.28±13.0179±9120.68±2.26124.50±13.0183.46±13.4683±12319.25±2.11123.68±7.4478.72±8.4277±9522.03±2.41125.56±11.8082.56±10.0882±81024.29±2.56119.40±9.9276.62±11.2076±10例13-18辨析與釋疑把重復(fù)測(cè)量的單因素設(shè)計(jì)用多個(gè)配對(duì)t檢驗(yàn)進(jìn)行均值之間兩兩比較,割裂了整體設(shè)計(jì),使資料利用率降低,增大了犯假陽(yáng)性錯(cuò)誤的概率例13-18正確做法重復(fù)測(cè)量的方差分析誤用一般
檢驗(yàn)代替配對(duì)設(shè)計(jì)McNemar檢驗(yàn)例13-19某文分析肺大細(xì)胞癌中p53蛋白表達(dá)和p53基因突變檢測(cè)結(jié)果的關(guān)系,p53蛋白表達(dá)陽(yáng)性者24例(40%),p53突變基因檢測(cè)陽(yáng)性者32例(53.3%),二者結(jié)果完全一致者44例(73.3%),二者結(jié)果不一致者16例(26.7%),見表13-21。原作者經(jīng)一般
檢驗(yàn),=14.464,P<0.01,認(rèn)為肺大細(xì)胞癌中p53突變基因陽(yáng)性多于p53蛋白陽(yáng)性表達(dá),差異有統(tǒng)計(jì)學(xué)意義。例13-19表13-2160例肺大細(xì)胞癌p53蛋白表達(dá)與突變基因結(jié)果對(duì)照p53蛋白p53突變基因陽(yáng)性陰性合計(jì)陽(yáng)性20424陰性122436合計(jì)322860辨析與釋疑本資料屬于配對(duì)四格表,采用一般的
檢驗(yàn),分析其關(guān)聯(lián)性(獨(dú)立性);或者采用McNemar檢驗(yàn),分析其差異性例13-19正確做法采用McNemar檢驗(yàn)將高維列聯(lián)表簡(jiǎn)單拆分或合并成簡(jiǎn)單的列聯(lián)表后再處理例13-20某文欲比較盆炎栓和野菊花治療慢性盆腔炎的療效,分別用盆炎栓和野菊花栓治療慢性盆腔炎300例和100例(表13-22)。經(jīng)
檢驗(yàn),認(rèn)為盆炎栓組的痊愈率高于野菊花栓的痊愈率,差異存在統(tǒng)計(jì)學(xué)意義(P<0.01)例13-20表13-22兩組療效比較病情程度盆炎栓組例數(shù)野菊花栓組例數(shù)痊愈未痊愈痊愈未痊愈輕度51361020中度64742428重度2352414辨析與釋疑這是一個(gè)結(jié)果變量為二分類變量(即痊愈與否)的三維列聯(lián)表資料例13-20正確做法加權(quán)
檢驗(yàn)或Mantel-Haenzel
檢驗(yàn)例13-21
某作者對(duì)實(shí)驗(yàn)組與對(duì)照組療效進(jìn)行比較,采用一般
檢驗(yàn),得出實(shí)驗(yàn)組療效顯著地優(yōu)于對(duì)照組的療效(表13-23)表13-23兩組患者在2個(gè)月、6個(gè)月、12個(gè)月時(shí)的療效(例數(shù))組別例數(shù)完全適應(yīng)基本適應(yīng)部分適應(yīng)未適應(yīng)總適應(yīng)率(%)值P值2個(gè)月
實(shí)驗(yàn)組11703179717.112.54<0.01
對(duì)照組1080031052.86個(gè)月
實(shí)驗(yàn)組1172612582182.169.30<0.01
對(duì)照組10839177926.912個(gè)月
實(shí)驗(yàn)組117732371488.053.64<0.01
對(duì)照組1081113216341.7例13-21表13-22兩組療效比較病情程度盆炎栓組例數(shù)野菊花栓組例數(shù)痊愈未痊愈痊愈未痊愈輕度51361020中度64742428重度2352414辨析與釋疑在收集和整理資料時(shí)違背了實(shí)驗(yàn)設(shè)計(jì)的要求,將原本屬于“重復(fù)觀測(cè)”的多因素定性資料錯(cuò)誤地按“獨(dú)立重復(fù)試驗(yàn)”方式進(jìn)行收集和整理將一個(gè)三維列聯(lián)表資料簡(jiǎn)單地拆分成三個(gè)獨(dú)立的二維列聯(lián)表資料對(duì)結(jié)果變量療效的有序性不予理睬例13-21正確做法嚴(yán)格按重復(fù)測(cè)量設(shè)計(jì)收集資料,并采用重復(fù)測(cè)量設(shè)計(jì)定性資料的統(tǒng)計(jì)分析方法進(jìn)行處理3.不考慮資料類型而誤用統(tǒng)計(jì)方法將定量資料誤判為定性資料從而誤用統(tǒng)計(jì)分析方法將定性資料誤判為定量資料從而誤用統(tǒng)計(jì)分析方法將分組變量有序而結(jié)果無(wú)序的單向有序列聯(lián)表誤判為分組變量無(wú)序而結(jié)果有序的單向有序列聯(lián)表,誤用秩和檢驗(yàn)取代
檢驗(yàn)或Fisher精確概率法;因變量為二分類變量時(shí)選用線性回歸;生存資料未用Cox回歸,而是選用線性回歸和檢驗(yàn)等例13-22為了探討雌激素受體(ER)、孕激素受體(PR)在血管瘤發(fā)生、發(fā)展中的意義。采用免疫組化方法對(duì)毛細(xì)血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤及正常皮膚組織的ER、PR受體進(jìn)行檢測(cè)。全部標(biāo)本經(jīng)10%甲醛固定,常規(guī)石蠟包埋。每例選一典型蠟塊,4~6μm切片,進(jìn)行免疫組化染色,高倍鏡下每例腫瘤區(qū)內(nèi)計(jì)數(shù)500個(gè)細(xì)胞,計(jì)數(shù)ER、PR陽(yáng)性細(xì)胞百分率(表13-24),原作者采用
檢驗(yàn)進(jìn)行分析將定量資料誤判為定性資料從而誤用統(tǒng)計(jì)分析方法例13-22表13-24血管瘤中ER、PR檢測(cè)結(jié)果(
)類別例數(shù)ER(%)PR(%)毛細(xì)血管瘤4574.18±11.7777.92±10.54混合型血管瘤4464.55±12.3468.12±15.38海綿狀血管瘤1823.00±7.8925.12±9.66淋巴管瘤2326.93±15.6230.00±18.87正常皮膚69.83±6.6911.00±4.56辨析與釋疑本例測(cè)量指標(biāo)為“陽(yáng)性細(xì)胞百分率”,研究的是四種疾病病例標(biāo)本和一組正常人標(biāo)本的ER、PR陽(yáng)性細(xì)胞率之均值是否相同,因而應(yīng)屬于定量資料,涉及一個(gè)實(shí)驗(yàn)因素,有5個(gè)水平例13-22正確做法做平方根反正弦變換,滿足正態(tài)和方差齊性,采用單因素五水平設(shè)計(jì)的方差分析,如不滿足,采用非參數(shù)檢驗(yàn)例13-23某作者研究美泰寧對(duì)戊巴比妥鈉誘導(dǎo)的小鼠睡眠的影響,選用40只體重相近的雄性小鼠,隨機(jī)分為溶劑對(duì)照組和3個(gè)劑量組,即0.0、12.5mg/kg、25.0mg/kg、75.0mg/kg,用蒸餾水配成所需濃度,每天灌胃。第7天灌胃15分鐘后,給各組動(dòng)物按28.0mg/kg劑量腹腔注射戊巴比妥鈉,以小鼠翻正反射消失達(dá)1分鐘以上作為入睡判斷標(biāo)準(zhǔn),觀察給戊巴比妥鈉25分鐘內(nèi)各組發(fā)生睡眠的動(dòng)物數(shù)。經(jīng)統(tǒng)計(jì)學(xué)處理,中、高劑量組與溶劑對(duì)照組比較差異具有統(tǒng)計(jì)學(xué)意義(P<0.01)。具體結(jié)果見表13-25將定量資料誤判為定性資料從而誤用統(tǒng)計(jì)分析方法例13-23表13-25美泰寧對(duì)閾下劑量戊巴比妥鈉誘導(dǎo)雄性小鼠睡眠發(fā)生率的影響劑量動(dòng)物數(shù)入睡動(dòng)物數(shù)睡眠發(fā)生率t值P值0.010220.012.510550.01.406>0.0525.010880.03.182<0.0175.010880.03.182<0.01辨析與釋疑
本資料從性質(zhì)上說(shuō)應(yīng)屬于定性資料,但原作者卻錯(cuò)誤地將其判斷為定量資料。例13-23正確做法檢驗(yàn)或Fisher精確概率法進(jìn)行統(tǒng)計(jì)分析例13-24某文運(yùn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024建筑玻璃幕墻施工協(xié)議范本
- 2024年商業(yè)客戶協(xié)議模板精簡(jiǎn)
- 2024年區(qū)域性成品油物流配送協(xié)議
- 2024年平面設(shè)計(jì)服務(wù)協(xié)議模板指南
- 2024年電腦設(shè)備租賃協(xié)議模板
- 2023-2024學(xué)年云南省玉溪市紅塔區(qū)普通高中高三寒假檢測(cè)試題數(shù)學(xué)試題
- 2024施工協(xié)議補(bǔ)充延期條款協(xié)議
- 2024借款額外條款協(xié)議匯編
- 2024年產(chǎn)品買賣協(xié)議范本2
- 2024工業(yè)物料采購(gòu)協(xié)議模板解析
- 《觀察葉片的結(jié)構(gòu)》 說(shuō)課課件
- 醫(yī)院透析患者安全管理應(yīng)急預(yù)案
- 《BIM技術(shù)的應(yīng)用研究開題報(bào)告(含提綱)》
- GB/T 40997-2021經(jīng)外奇穴名稱與定位
- GB/T 27021.1-2017合格評(píng)定管理體系審核認(rèn)證機(jī)構(gòu)要求第1部分:要求
- GB/T 22796-2021床上用品
- 中國(guó)聯(lián)通LAN工程施工及驗(yàn)收規(guī)范
- 二年級(jí)上冊(cè)連續(xù)加減括號(hào)混合豎式計(jì)算180題
- 中間表模式接口相關(guān)-住院與his-adt方案
- 臨床PCR檢驗(yàn)的室內(nèi)質(zhì)控方法課件
- 拉曼光譜簡(jiǎn)介課件
評(píng)論
0/150
提交評(píng)論