SPSS統(tǒng)計分析基礎3課件_第1頁
SPSS統(tǒng)計分析基礎3課件_第2頁
SPSS統(tǒng)計分析基礎3課件_第3頁
SPSS統(tǒng)計分析基礎3課件_第4頁
SPSS統(tǒng)計分析基礎3課件_第5頁
已閱讀5頁,還剩120頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SPSS統(tǒng)計分析基礎3 簡單線性相關與回歸 醫(yī)學研究中經常要研究兩個變量的關系問題,如年齡與體重,血壓與病死率等。在弄清兩個變量關系之后,可以從一個變量的數(shù)值去估計另一個變量的數(shù)值,例如可根據(jù)前人研究“體重(Kg)=年齡(周歲)2+8” 對體重做出估計,從而省去測量體重的麻煩。三、計量資料常用統(tǒng)計分析簡單線性相關應用條件 1 X、Y雙變量均為正態(tài)分布的資料。2 相關的變量應有內在聯(lián)系。如年齡與體重,年齡與 身高有內在聯(lián)系;而兒童身高與樹高是伴隨關系, 變量“時間”與身高及樹高的潛在聯(lián)系造成了身高與 樹高似有正相關關系的假象。3 奇異值應剔除。4 P0.05時,r 無意義。P0.05,如果r過小

2、,相關 程度較低,例如r=0.20, r2=0.04,說明因變量中只有 4%的量與自變量相關。例統(tǒng)計分析方法 Correlate Bivariate 進入雙變量 選擇相關分析指標 默認“Pearson” 默認“雙尾檢驗” OK結果:胸圍與肺活量無相關關系。例某地一年級12名女大學生的體重與肺活量側值如表,二者是否直線相關?體重(Kg)424246464650505052525858肺活量(L)2.552.202.752.402.802.813.413.103.462.853.503.00上圖為原始散點圖及編輯后相關關系圖下表為相關關系分析結果: P=0.005,r= 0.749, 強正相關例

3、某研究生論文中 AET-PET與QRS相關例 某研究生論文中 TsO最大與最小差與TsO標準差相關關系圖示:某篇論文中年齡與左、右心室功能的相關關系 分別為r=-0.73, r=-0.71 正相關:0r1 負相關:-1r0 不相關:r=0相關類型線性回歸的概念簡單線性回歸知道雙變量相關后,可建立線性回歸方程 Y=a+bX例8-1三、計量資料常用統(tǒng)計分析SPSS統(tǒng)計方法1 首先按LINE做判斷(線性、獨立、正態(tài)、方差齊) AnalyzeRegressionLinear選擇“自變量”及“應 變量” Method默認為“Enter” 單擊”Statistics選 取“Estimates”、“Mode

4、l fit”、“Durbin-Watson” 單 擊“Continue” 再單擊“Plots” 選擇“SRESID”作 為Y軸,“DEPENDNT”作為X軸ContinueOK三、計量資料常用統(tǒng)計分析結果:上圖:模型的擬合優(yōu)度良好, 相關系數(shù) r=0.882 中圖:模型的檢驗結果有統(tǒng)計學意義, p=0.004 下圖:常數(shù)項及自變量均有統(tǒng)計學意義, 常數(shù)a=1.662, 回歸系數(shù)0.139 Y=0.139X+1.662,即尿肌肝含量=0.139年齡+1.662三、計量資料常用統(tǒng)計分析注意:本圖為以尿肌酐含量為橫軸,學生化殘差為縱軸的散點 圖,用以觀察殘差是否有隨應變量增大而改變的趨勢, 也就是診

5、斷應變量的獨立性,本例殘差較集中。否則, 應采用下述“加權的簡單線性回歸”方法。加權的簡單線性回歸例1 首先繪制散點圖,可見IgG水平與年齡呈直線相關。2 擬合一般的線性回歸模型,繪制殘差散點圖。發(fā)現(xiàn) 應變量的方差不齊,有隨自變量增加而加大的趨勢。 由于不符合建立一般線性回歸模型。應進行加權線 性回歸。2 計算權重變量 w=1/x23 加權線性回歸操作步驟: 散點圖示有直線趨勢圖示 應變量的殘差有隨自變量增大而加大的趨勢。故應行加權線性回歸。上圖:模型擬合優(yōu)度, R=0.949中圖:擬合模型有統(tǒng)計學意義 P0.0001下圖:常數(shù)項a=-0.172; 回歸系數(shù)=40.951 y= 40.951x

6、 - 0.172相關系數(shù)r 在P0.05, 樣本N較大的前提下, r0.7 強相關決定系數(shù)r2 由自變量x解釋的部分占y的百分數(shù),例如 r2 =0.74030.7403=0.5408, 表明由自變量x解釋的部分只占y的54.8%,還遠未認清影響y 變異的其他因素, 三、計量資料常用統(tǒng)計分析簡單線性相關作圖方法:GraphsScatter/DotSimple Scatter 單擊“Define” Y 軸輸入“因變量”,X軸輸入“自變量” OK 然后在圖形編輯窗口編輯圖形簡單線性回歸方程計算方法:AnalyzeRegressionLinear選擇 “自變量”及 “應變量” Method默認為“En

7、ter” 單 擊“Statistics”選取 “Estimates”、“Model fit”、“Durbin- Watson” 單擊“Continue” 再單擊“Plots” 選擇“ SRESID”作為Y軸,“DEPENDNT”作為X軸 ContinueOption 選擇“Useprobality of F”, “Entre 0.05” 選擇:Includeconstantinequation” Continue OK三、計量資料常用統(tǒng)計分析上圖為簡單直線相關圖,下表包含有回歸方程中的a與b4 曲線回歸三、計量資料常用統(tǒng)計分析(1) 變量轉換法例 變量轉換后呈直線相關(2)曲線擬合法例本例散點

8、圖示非直線相關SPSS操作步驟三、計量資料常用統(tǒng)計分析回歸方程 Y=19.745+7.777InX圖示按對數(shù)曲線擬合的相關關系參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計 參數(shù)統(tǒng)計 非參數(shù)統(tǒng)計(parametric statistics) (nonparametric statistics) 對總體的分布類型不作任何要求 可用于任何類型資料, 對于符合參數(shù)統(tǒng)計分析條件者,采用非參 數(shù)統(tǒng)計分析,其檢驗效能較低。計量資料,呈正態(tài)分布依賴于特定分布類型,比較的是參數(shù)四、計數(shù)資料常用統(tǒng)計分析 1 描述性分析率 率=隨機事件實際發(fā)生數(shù)/可能發(fā)生該事件的總數(shù)100%,例如:治愈率=56/128=43.8%. 容易混淆的兩對率:病

9、死率與死亡率;患病率與發(fā)病率相對比 相對比=甲指標/乙指標(或100%),例如949年肺結核死亡率為174.5/10 萬,1965年為38.4/10萬,1949年是1965年的174.5/38.4=4.5倍,或1965年較1949 年下降38.4/174.5 100% =22%。構成比 構成比=事物內部某組成部分的個數(shù)/各組成部分總數(shù)100%例如,某醫(yī)院護 士總數(shù)217人,其中主任護師3人,主任護師構成比為3/217=1.4%。2 樣本率與已知總體率的比較二項分布檢驗(Binomial Test) 醫(yī)學中的生與死、患病與否、陽性與陰性只能是相互對立的兩類,稱為二項分布。例:某地某時期出生40名

10、嬰兒,其中女性12名(sex=0),男性28 名(sex=1),問出生比例是否失調(總體概率約為50%)?SPSS統(tǒng)計方法: 輸入數(shù)據(jù) 變量加權 AnalyzeNonparametric Tests Binomial Test 選擇分析變量進入“Test Variable List” “Test Proportion”中鍵入0.50 OK四、計數(shù)資料常用統(tǒng)計分析變量加權方法DataWeight Cases選擇“Weight Cases”為 “cases by”進入頻數(shù)變量OK結論:男嬰明顯比女嬰多。四、計數(shù)資料常用統(tǒng)計分析3 一個樣本內各計量值之間的比較非參數(shù)檢驗中的卡方檢驗(x2檢驗)例.

11、某地1周各日內死亡數(shù)如表,問每日死亡危險是否相同?星期死亡數(shù)一11二19三17四15五15六16日19四、計數(shù)資料常用統(tǒng)計分析SPSS統(tǒng)計方法: 輸入數(shù)據(jù) 變量加權 AnalyzeNonparametric Tests Chi-square Test 選擇分析變量(Day) 進入“Test Variable List” OK 結果:各日死亡率不相同。四、計數(shù)資料常用統(tǒng)計分析4 兩個樣本率的比較四聯(lián)表卡方檢驗四聯(lián)表資料陽性數(shù)陰性數(shù)合計甲組乙組合計四、計數(shù)資料常用統(tǒng)計分析皮爾遜卡方檢驗(Pearson Chi-squuare)例四、計數(shù)資料常用統(tǒng)計分析SPSS統(tǒng)計方法頻數(shù)加權Crosstabs過程

12、 四、計數(shù)資料常用統(tǒng)計分析結論:由b可知,本例沒有任何格子中的理論頻數(shù)5,無需校正,采用皮爾遜卡方檢驗,P=0.012。中藥與西藥的治愈率差異有統(tǒng)計學意義。中藥治愈率高。例 正常組45例,其中男25例,女20例;治療組60 例,男40例,女20例,問兩組性別是否有差異? 應用22列聯(lián)表法,P=0.246, 差異無顯著性。 男性 女性正常組 25 20治療組 40 201125122021402220耶茨連續(xù)性校正的卡方檢驗(Continuity Correction)四、計數(shù)資料常用統(tǒng)計分析本例在“Statistics”中加選“risk”后得到上表。 Odds Ratio for tiyudu

13、anlian(參加/未參加) OR=0.169 For cohort fufa=是 RR=0.195優(yōu)勢比( OR ,Odds Ratio,亦稱比值比) 優(yōu)勢比為兩個互相排斥概率之比,表現(xiàn)為兩個比值之比。本例中,冠心病復發(fā)者參加體育鍛煉的比例為2/10=20% 冠心病復發(fā)者未參加體育鍛煉的比例為8/10=80% 二者比值為0.2/0.8=0.25 無冠心病復發(fā)者參加體育鍛煉的比例為62/104=59.6% 無冠心病復發(fā)者未參加體育鍛煉的比例為42/104=40.4% 二者比值為0.596/0.404=1.48 參加體育鍛煉者冠心病復發(fā)的 OR=0.25/1.48=0.169結論:冠心病是否復發(fā)

14、與體育鍛煉有關,冠心病初發(fā)后進行體 育鍛煉者復發(fā)冠心病危險是不參加鍛煉者的0.169倍,即體 育鍛煉將減少1-0.169=0.831(83.1%)的復發(fā)危險。相對危險度(Relative Risk,RR) 本例中,冠心病復發(fā)的相對危險度是指參加體育鍛煉者復發(fā) 的概率與未參加體育鍛煉者復發(fā)概率的比值,其估計值為 (2/64)/(8/50)=0.195。即參加體育鍛煉者復發(fā)危險是未參加體育鍛 煉者復發(fā)的0.195倍,亦即減少1-0.195=0.805(80.5%), 與OR =0.169 (減少83.1%) 相近。 當事件發(fā)生率較?。ɡ?.1) 時,OR可作為RR的估計值。 RR多用于前瞻性資料

15、,OR多用于回顧性資料。風險比(Hazard Radio, HR) HR是Cox回歸模型得到的比值,以Exp(B)表示,意義與RR相同。 Exp (B) 為指數(shù)函數(shù), 其中B為Cox回歸系數(shù), Exp (B) =e的B次方 , e=2.718281舉例供參考,統(tǒng)計方法從略 左上圖:整理后數(shù)據(jù) 右上圖:基于各協(xié)變量均值的生存曲線 下圖:第2步中,年齡及手術時間都是死亡危險因素,性別不是。 年齡 HR= Exp(B)= 1.263, 每增1歲,術后死亡風險增加26%。 手術時間 HR= Exp(B)= 1.560, 確診后到手術時間每增1個月,術后死亡風險增加56%OR出現(xiàn)于 “列聯(lián)表”卡方檢驗中

16、HR(或稱RR)出現(xiàn)于Cox回歸模型中RR = HR OR (發(fā)生事件的概率小時)5 費歇爾精確概率檢驗(Fisher檢驗)四、計數(shù)資料常用統(tǒng)計分析SPSS統(tǒng)計方法: 由于N 40,且理論頻數(shù)5 的格子數(shù) 40,且理論頻數(shù)1-5的格子數(shù)20%時Yates連續(xù)校正。N 40, 或理論頻數(shù)0.0167, 差異無顯著性。 甲丙比較:P=0.0120.0167,差異無顯著性。四、計數(shù)資料常用統(tǒng)計分析7 多個構成比的比較RC無序列聯(lián)表的卡方檢驗四、計數(shù)資料常用統(tǒng)計分析SPSS統(tǒng)計方法:與四格表卡方檢驗相同,但Cell中選擇“Column”的百分數(shù)。結果:各年齡中異常、可疑、正常率分別為7.9%, 18%

17、,73.1%. P=0.000, 差異有統(tǒng)計學意義。RC無序列聯(lián)表的卡方檢驗的注意事項1 表中一般不宜有20%以上格子的理論頻數(shù)5,或一 個格子的理論頻數(shù)1。否則應進行下述處理: 增加樣本含量。 將理論頻數(shù)太小的行或列合并。 Fisher檢驗2 要想知道哪兩個樣本率或構成比之間有差異,需進行 RC表的卡方分割。8 RC表的費歇爾精確概率檢驗(Fisher檢驗)四、計數(shù)資料常用統(tǒng)計分析 結論:3格理論頻數(shù)5,采用蒙特卡羅方法,P=0.007。兩種方法的療效有顯著差異 。五、等級資料常用統(tǒng)計分析兩個獨立樣本單向有序 RC表資料-wilcoxon秩和檢驗(威爾科克森秩和檢驗,威-曼-懷氏秩和檢驗)

18、列聯(lián)表中一個是分類變量,另一個是等級變量。五、等級資料常用統(tǒng)計分析SPSS統(tǒng)計方法五、等級資料常用統(tǒng)計分析 結論:輕度與重度皮損的療效不同。五、等級資料常用統(tǒng)計分析趨勢卡方檢驗應用列聯(lián)表中線性關系(Linear-linear Association)統(tǒng)計量進行分析,過程如下: 皮爾遜檢驗p=0.142,即單從療效構成上看不出統(tǒng)計學差異。趨勢檢驗p=0.01,精確概率為0.011,因此可以認為皮損程度與療效間存在線性趨勢。2 多個獨立樣本單向有序RC表資料-Kruskal-Wallis檢驗(克魯卡爾-瓦利斯檢驗)五、等級資料常用統(tǒng)計分析SPSS統(tǒng)計方法五、等級資料常用統(tǒng)計分析結論:上圖:Krus

19、kal-Wallis H 檢驗結果,蒙特卡羅法 精確概率P=0.196下圖:為中位數(shù)檢驗結果,蒙 特卡羅法精確概率 P=0.273。注意:中位數(shù)檢驗效能低于 Kruskal-Wallis H檢驗。當格子中理論頻數(shù)小時,采 用蒙特卡羅法精確更合適。結論:三種手術方法的療效無 統(tǒng)計學差異。3 雙向有序RC表資料(1)兩個雙向有序變量是否有相關關系:典型相關分析 Spearman等級相關。(2)若兩個雙向有序變量有相關關系,是否為直線相關?可進 行Jonckheere-Terpstra線性趨勢檢驗。(3)多中心實驗結果,需進行Cochran-Mantel-Haenszel檢驗。五、等級資料常用統(tǒng)計分

20、析(1)Spearman(斯佩爾曼)等級相關檢驗五、等級資料常用統(tǒng)計分析SPSS統(tǒng)計方法Correlation Coefficients中可加選“Pearson”以對比。五、等級資料常用統(tǒng)計分析上表:Spearman結果, p=0.057,二 者不相關。下表:一般Peaeson結果, p=0.01, 二者相關。因本例為定性資料,故應采用Spearman結果(2) Jonckheere- Terpstra 線性趨勢檢驗五、等級資料常用統(tǒng)計分析SPSS統(tǒng)計方法 Nonparametric TestK Independent Samples 選擇試驗變量與分組變量選擇Jonckheere- Terp

21、stra 選擇精確檢驗 P=0.006, 結論:醫(yī)療形式與滿意度存在線性趨勢,即隨公費醫(yī)療比例的增加,滿意度也相應增加。(3)多中心Cochran-Mantel-Haenszel檢驗例五、等級資料常用統(tǒng)計分析SPSS統(tǒng)計方法 將“試驗中心”進入“分層變量”五、等級資料常用統(tǒng)計分析上表:卡方檢驗結果,二中心 的精確 檢驗P均接近0.05(0.049, 0.055)。下表:分層Cochran-Mantel-Haenszel檢驗 結果, P=0.003, P=0.005,表明去 除混雜因素后,病程與療效有關, 療程越短,療效越好。本例應選用 此方法。六、診斷試驗評價指標及ROC曲線一、存在“金標準”

22、 時的評價指標1 敏感性及特異性等1.1 應用前提 某診斷試驗結果與“金標準”檢查結果比較, 金標準 必須是可靠、公認的臨床診斷方法。1.2 方法 采用Yeyushalmy四格表評價模式。 Yeyushalmy四格表評價模式診斷試驗結果 金標準 病例(有?。?對照(無?。?陽性 真陽性 假陽性(誤診) 陰性 假陰性(漏診) 真陰性例 以冠脈造影為金標準,行CK-MB檢查: 15例患者,12例CK-MB(+)者中,10例是MI 真陽性 2例不是MI 假陽性3例CK-MB(-)者中, 2例不是MI 真陰性 1例是MI 假陰性1.3 名詞敏感性=真陽性/(真陽性+假陰性)特異性=真陰性/(真陰性+假

23、陽性)陽性預測值=真陽性/(真陽性+假陽性) 注:由診斷試驗檢測為陽性的樣本中,真正患者所占的比例為陽性預測值。陽性預 測值主要受患病率的影響,患病率越高,則陽性預測值也高;臨床醫(yī)師根據(jù)某病的 患病率和診斷試驗的陽性結果就能預測就診者患某病的可能性大??;當患病率一定 時,特異性越高,陽性預測值越準確。陰性預測值=真陰性/(真陰性+假陰性) 注:由診斷試驗檢測為陰性的樣本中,真正無病者所占的比例為陰性預測 值。當患病率一定時,診斷試驗的敏感性越高,則陰性預測值越高。準確性=(真陽性+真陰性)/ 受試總人數(shù) 注:準確性亦稱“功效率”、“粗一致性”、“約登指數(shù)”、“真實性”等,指 不產生假陽性和假陰

24、性結果的效率,是一種將敏感性及特異性相結合考 慮的綜合質量指標。陽性似然比= 敏感性/(1- 特異性)陰性似然比 = (1- 敏感性)/ 特異性患病率=(真陽性+假陰性)/ 受試總人數(shù)1.4 舉例檢測血清鐵蛋白水平診斷缺鐵性貧血(IDA)經與金標準診斷(骨穿)結果比較,有關數(shù)據(jù)填入四格表如下缺鐵性貧血 (骨穿證實,金標準)有病(是)無?。ǚ瘢┭彖F蛋白水平陽性(65mmol/L) 78 1500 敏感性=真陽性/(真陽性+假陰性)=90%特異性=真陰性/(真陰性+假陽性)=85%陽性預測值(即驗后概率) =真陽性/(真陽性+假陽性)=73%陰性預測值=真陰性/(真陰性+假陰性)=95%陽性似然

25、比 = 敏感性/(1- 特異性)=6 注:表示以血清鐵蛋白水平65mmol/L為界值時, 缺血性貧血出現(xiàn)陽性的概率是非 缺血性貧血出現(xiàn)陽性結果的概率的6倍。陰性似然比 = (1- 敏感性)/ 特異性=0.12 注:表示以血清鐵蛋白水平65mmol/L為界值時, 缺血性貧血出現(xiàn)陰性結果的概率 僅是非缺血性貧血出現(xiàn)陰性結果的概率的1/8左右?;疾÷? (真陽性+假陰性)/ 受試總人數(shù)= 32%SPSS統(tǒng)計方法 頻數(shù)加權AnalyzeDescriptive Crosstabs分別進入行、列變量單擊“Ststistics” 選“Risk” 單擊“Cell” 選“Row、Column” OK六、診斷試驗

26、評價指標及ROC曲線OR=67.19,表明出現(xiàn)MI者的ECG結果陽性的優(yōu)勢是不出現(xiàn)MI患者的67倍。二、不存在金標準時Kappa檢驗 兩種試驗方法均不是”金標準”時,只能比較其試驗結果的一致性, 不能計算敏感性及特異性等。 SPSS統(tǒng)計方法: 與靈敏度等相同,只在“Ststistics” 增選 “Kappa” 判斷: Kappa 00.4 一致性不理想 Kappa 0.40.7 一致性一般 Kappa0.75 具有較好的一致性 六、診斷試驗評價指標及ROC曲線例 靜脈血糖診斷試驗與末梢血糖診斷試驗 的比較 乙法甲法合計+-+-3671216548172合計43177220六、診斷試驗評價指標及

27、ROC曲線 本研究是傳統(tǒng)診斷試驗方法(靜脈血糖診斷試驗)與新診斷試驗方法(末梢血糖診斷試驗)的比較,不是某一診斷試驗與金標準結果的比較,其敏感性、特異性指標的計算是錯誤的。象這類研究對象中既有“有病者”亦有“無病者”的兩種試驗結果的比較,可選Kappa一致度系數(shù)k進行評價本例k=0.737,表明靜脈血糖診斷試驗與末梢血糖診斷試驗結果具有較好的一致性。ROC 曲線 (receiver operating characteristic curve ,受試者工作特性曲線 ) 同一項檢測方法,采用不同的診斷臨界值,就有不同的敏感度及特異度,為了更好地評價檢測方法的診斷價值,必須考慮各種可能的診斷臨界值

28、。 ROC曲線就是通過改變診斷臨界值,獲得多對敏感度及特異度值,然后按敏感度為橫坐標,1-特異度為縱坐標,繪制ROC曲線,計算與比較ROC曲線下面積,反映診斷試驗的診斷價值。 ROC分析資料分為連續(xù)性資料(常見于某些定量資料)、有序分類資料(醫(yī)學影像資料及心理學評價資料)兩類。3.1 簡單連續(xù)性資料首先整理數(shù)據(jù):一列為MCV結果,另一列為骨髓診斷結果: 0=正常,1=異常SPSS統(tǒng)計方法由ROC曲線可得出某試驗方法理想的敏感性及特異性界值:即最靠左上角的某點所對應的敏感性及特異性。理想界值計算方法MCV Sep 1-Spe Spe Sep+Spe 51 0 0 1 1 55 0.029 0 1 1.029。 79.5 0.559 0.288 0.712 1.271 80.5 0.618 0.318 0.682 1.300 81.5 0.706 0.364 0.636 1.342 82.5 0.735

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論