常用統(tǒng)計分析方法及其軟件實現(xiàn)_第1頁
常用統(tǒng)計分析方法及其軟件實現(xiàn)_第2頁
常用統(tǒng)計分析方法及其軟件實現(xiàn)_第3頁
常用統(tǒng)計分析方法及其軟件實現(xiàn)_第4頁
常用統(tǒng)計分析方法及其軟件實現(xiàn)_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于常用統(tǒng)計分析方法及其軟件實現(xiàn)第1頁,共53頁,2022年,5月20日,0點7分,星期四2基本概念變量類型定性變量二分類變量如性別:男、女,某種疾?。河?、無,某種結局:出現(xiàn)、未出現(xiàn)等。無序多分類如職業(yè):工人、農民、民工、商人、學生等有序變量(等級變量)如問卷調查中對某件事情的滿意程度:非常不滿意、有點滿意、滿意、很滿意、非常滿意;臨床體檢或實驗室檢驗常用、來表示測量結果第2頁,共53頁,2022年,5月20日,0點7分,星期四3定量變量離散型:只能取整數(shù)值,如一年中的手術病人數(shù),一年里的新生兒數(shù),細菌菌落數(shù)等;連續(xù)型:可以取實數(shù)中的任何數(shù)值,如血壓、身高、體重等,可以在實數(shù)的一定范圍內連續(xù)取

2、值第3頁,共53頁,2022年,5月20日,0點7分,星期四4例:某縣乳腺癌相關高危因素調查問卷(部分) 練習:判斷變量類型第4頁,共53頁,2022年,5月20日,0點7分,星期四5數(shù)據(jù)的簡單描述 定量資料集中趨勢:算術均數(shù)、中位數(shù)、幾何均數(shù)、眾數(shù)離散趨勢:標準差、四分位數(shù)間距、方差、極差、變異系數(shù)注意:分析時,根據(jù)資料正態(tài)性特征,用算術均數(shù)與標準差,或中位數(shù)與四分位數(shù)間距描述資料的集中趨勢和離散趨勢有序或分類資料頻數(shù)分析第5頁,共53頁,2022年,5月20日,0點7分,星期四6例:以“數(shù)據(jù)1.sav”為例,計算年齡的集中趨勢和離散趨勢指標。菜單:分析描述統(tǒng)計描述第6頁,共53頁,2022

3、年,5月20日,0點7分,星期四7菜單:分析描述統(tǒng)計頻率第7頁,共53頁,2022年,5月20日,0點7分,星期四8現(xiàn)場調查資料常用推斷性統(tǒng)計分析方法單因素分析兩組之間比較定量資料比較t檢驗、U檢驗;Wilcoxon秩和檢驗分類資料比較(二分類、無序多分類)卡方檢驗有序資料比較Wilcoxon秩和檢驗兩組及以上之間比較定量資料比較單因素方差分析;Kruskal-wallis秩和檢驗分類資料比較(二分類、無序多分類)卡方檢驗有序資料比較Kruskal-wallis秩和檢驗雙變量相關分析:有序資料(kendall),非正態(tài)、定量(spearman);正態(tài)、定量(pearson相關分析)回歸分析:線

4、性回歸、單因素Logistic回歸第8頁,共53頁,2022年,5月20日,0點7分,星期四9現(xiàn)場調查資料常用推斷性統(tǒng)計分析方法多因素分析多重線性回歸多因素Logistic回歸(因變量二分類、有序、無序多分類)成組個體匹配:條件Logistic回歸群組匹配:考慮群內聚集性,將群組設為層變量第9頁,共53頁,2022年,5月20日,0點7分,星期四10可以選用的方法有成組設計的t檢驗、u檢驗、單樣本t檢驗(與總體作比較,實際上此時因素也為二分類)、配對t檢驗、非參數(shù)Wilcoxon檢驗、符號檢驗、符號秩和檢驗等。 參數(shù)檢驗與非參數(shù)檢驗的區(qū)別?通常參數(shù)檢驗的檢驗效能要高于非參數(shù)檢驗,但當參數(shù)檢驗的

5、條件(正態(tài)性、方差齊性)得不到滿足、開口資料、等級資料或資料的總體分布未知時,可以使用非參數(shù)檢驗的方法進行分析。成組設計和配對設計的區(qū)別?配對設計是按照一些非實驗因素將受試對象配成對子,給予每對中的個體以不同的處理,配對的條件一般為年齡、性別、體重。其優(yōu)點是在同一對的試驗對象間取得均衡,從而提高試驗的效率。通常分為自身配對設計(某中措施作用于同一個體或兩種措施作用于同一個體)和非自身配對設計兩種。兩組之間定量資料的比較第10頁,共53頁,2022年,5月20日,0點7分,星期四11 (1)成組設計的t檢驗,設計類型為成組設計,且因素變量為二分類變量,分析前需要先對資料的正態(tài)性和方差齊性進行檢驗

6、(這是很多參數(shù)檢驗的前提條件)。 例:兩組雌鼠,分別飼以高蛋白和低蛋白飼料,8周后記錄各鼠體重增加量(克),問兩組動物的增重是否有差別?(此處正態(tài)性和方差齊性檢驗略)。 利用SPSS進行分析,數(shù)據(jù)文件及格式見“成組設計t檢驗.sav”,SPSS菜單操作為:分析比較均值獨立樣本T檢驗 結果見下頁第11頁,共53頁,2022年,5月20日,0點7分,星期四12 方差齊性檢驗的分析結果,P值(Sig)0.9050.05,表明方差齊性 t檢驗分析結果,P值(Sig)0.0760.05,表明兩組動物增加的重量無差異(無統(tǒng)計學意義)。 當方差齊性時,看第一行的結果(t1.891,P0.076),當方差不齊

7、時,看第二行的結果(t1.911,P0.078)第12頁,共53頁,2022年,5月20日,0點7分,星期四13 (2)成組設計的u檢驗,當樣本量較大時,兩組之間均數(shù)的比較可以用u檢驗,其在SPSS中的實現(xiàn)過程同t檢驗,此處略。 (3)單樣本t檢驗; 例:通過以往大規(guī)模調查,已知某地嬰兒出生體重均數(shù)為3.30kg,今測得某地一組嬰兒的出生體重,問該地嬰兒出生體重是否與一般嬰兒出生體重不同? 利用SPSS進行分析,數(shù)據(jù)文件及格式見“單樣本t檢驗.sav”,SPSS菜單操作為:分析比較均值單樣本T檢驗 第13頁,共53頁,2022年,5月20日,0點7分,星期四14 (4)配對t檢驗 例:用某藥治

8、療10例高血壓病人,測得治療前后各病人的舒張壓,問該藥是否有降低舒張壓的作用? 利用SPSS進行分析,數(shù)據(jù)文件及格式見“配對t檢驗.sav”,SPSS菜單操作為:分析比較均值配對樣本T檢驗結果見下頁第14頁,共53頁,2022年,5月20日,0點7分,星期四15 第15頁,共53頁,2022年,5月20日,0點7分,星期四16 (5)非參數(shù)Wilcoxon秩和檢驗,適用于成組設計資料。 例:測得某病的健康人12人和患者10人的某指標值,問兩組之間該指標值是否有差異? 第16頁,共53頁,2022年,5月20日,0點7分,星期四17 第17頁,共53頁,2022年,5月20日,0點7分,星期四1

9、8兩組之間分類資料比較 (1)二分類資料 I 成組設計:所用統(tǒng)計方法為四格表2 檢驗。 第18頁,共53頁,2022年,5月20日,0點7分,星期四19 第19頁,共53頁,2022年,5月20日,0點7分,星期四20 第20頁,共53頁,2022年,5月20日,0點7分,星期四21 II 配對設計:對一組樣品同時用兩種檢測方法對其進行檢測,每種檢測方法檢測結果都分為陽性和陰性,數(shù)出兩種檢測方法同時判定為陽性、陰性的樣品數(shù)以及它們檢測結果不一致的樣品數(shù),將結果表示成配對四格表的資料格式。所用統(tǒng)計方法為配對四格表2 檢驗。 實例1中,兩種檢測方法不知何者為優(yōu),任何一種方法檢測的結果都有假陽性和假

10、陰性,比較它們檢測結果不一致的兩個頻數(shù),無論差別有無統(tǒng)計學意義,都不能說明兩種檢測方法何者為優(yōu),缺乏“金標準”,因而沒有必要做統(tǒng)計分析。第21頁,共53頁,2022年,5月20日,0點7分,星期四22 實例2屬于隱含金標準的配對四格表資料,若甲培養(yǎng)基培養(yǎng)出陽性結果,而乙卻培養(yǎng)出陰性結果,表明甲優(yōu)于乙,這種陽性結果為真陽性,此時值得做統(tǒng)計分析。實例3則可以明確地判定試驗檢測方法的優(yōu)劣。配對四格表的2 檢驗可用McNemar 2 檢驗,以檢測結果不一致部分差別是否具有統(tǒng)計學意義。當然也可用Kappa檢驗法檢驗兩種檢測方法的檢測結果是否具有一致性。 估計值P值卡方34.0000 5.51121E-0

11、9校正卡方32.0294 1.51856E-08估計值P值卡方0.14290.705457校正卡方0.0000 1.000000結果結果第22頁,共53頁,2022年,5月20日,0點7分,星期四23 第23頁,共53頁,2022年,5月20日,0點7分,星期四24(2)無序多分類資料:所用方法為2C表的2檢驗。 SPSS數(shù)據(jù)格式第24頁,共53頁,2022年,5月20日,0點7分,星期四25可以采用兩組有序變量資料的Wilcoxon秩和檢驗 兩組之間有序資料比較干預過去三個月您抽煙嗎U ValueP Value從不很少有時經常前4648461345291-2.88510.0039后31632

12、97181164合計7811758526455第25頁,共53頁,2022年,5月20日,0點7分,星期四26 第26頁,共53頁,2022年,5月20日,0點7分,星期四27 第27頁,共53頁,2022年,5月20日,0點7分,星期四28當多組之間比較時,可以選用的方法有單因素方差分析、配伍組設計的方差分析(屬兩因素方差分析,其與二分類的配對t檢驗相對應)、非參數(shù)Kruskal-Wallis檢驗及非參數(shù)Friedman檢驗等。 (1)單因素方差分析 例:某醫(yī)生為研究一種四類降糖新藥的療效,以統(tǒng)一的納入標準和排除標準選擇了60名2型糖尿病患者,按完全隨機設計方案將患者分為三組進行雙盲臨床試驗

13、。其中,將糖新藥高劑量組21人、低劑量組19人、對照組20人。對照組用公認的降糖藥物,治療4周后測得其餐后2小時血糖的下降值。問治療4周后,餐后2小時血糖下降值的三組總體平均水平是否不同?(此處正態(tài)性和方差齊性檢驗略)。 利用SPSS進行分析,數(shù)據(jù)文件及格式見“單因素方差分析.sav”,SPSS菜單操作為:分析比較均值單因素Anova 兩組及以上定量資料的比較 第28頁,共53頁,2022年,5月20日,0點7分,星期四29 截圖二:兩兩比較對話框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法。截圖一:方差同質性檢驗第29頁,共53頁,2022年,5月20

14、日,0點7分,星期四30 方差齊性檢驗結果:P0.05,方差齊方差分析結果,F(xiàn)=5.537,P=0.0060.05,說明三組之間總體平均水平不同。因而進一步用Dunnett法作多個試驗組與一個對照組間的比較(見下頁)。第30頁,共53頁,2022年,5月20日,0點7分,星期四31 第31頁,共53頁,2022年,5月20日,0點7分,星期四32 (2)非參數(shù)Kruskal-Wallis檢驗 例:仍以上述資料為例,假設此時資料不符合正態(tài)性或方差齊性的要求,我們使用非參數(shù)Kruskal-Wallis檢驗進行分析。SPSS菜單操作為:分析非參數(shù)檢驗舊對話框 K 個獨立樣本第32頁,共53頁,202

15、2年,5月20日,0點7分,星期四33(1)二分類:所用方法為R2表的2檢驗。 如幾種藥物的療效(有效、無效)比較;不同職業(yè)人群某病發(fā)生率的比較等等。 兩組及以上分類資料的比較 第33頁,共53頁,2022年,5月20日,0點7分,星期四34第34頁,共53頁,2022年,5月20日,0點7分,星期四35(2)多分類:所用方法為RC表的2檢驗。 第35頁,共53頁,2022年,5月20日,0點7分,星期四36 實例2中小于5的理論頻數(shù)的格子數(shù)超過了總格子數(shù)的1/5,若選用一般的2檢驗公式計算,將增大犯假陽性錯誤的概率,故此處應選用Fishers精確檢驗法。第36頁,共53頁,2022年,5月2

16、0日,0點7分,星期四37第37頁,共53頁,2022年,5月20日,0點7分,星期四38第38頁,共53頁,2022年,5月20日,0點7分,星期四39此時資料屬于單向有序的RC表資料,可以使用秩和檢驗方法分析。 兩組及以上有序資料的比較 第39頁,共53頁,2022年,5月20日,0點7分,星期四40 Kruskal-Wallis Test:使用SPSS分析實例2資料,數(shù)據(jù)格式見右側截圖。菜單操作為:分析非參數(shù)檢驗舊對話框 K 個獨立樣本注意:例數(shù)必須先進行加權操作第40頁,共53頁,2022年,5月20日,0點7分,星期四41 雙變量相關分析 菜單:分析相關雙變量數(shù)據(jù)格式分析結果相關分析

17、對話框第41頁,共53頁,2022年,5月20日,0點7分,星期四例:淡菜食用個數(shù)與臨床癥狀嚴重程度的關系第42頁,共53頁,2022年,5月20日,0點7分,星期四43 線性回歸 菜單:分析回歸線性 例:淡菜食用個數(shù)與腹瀉次數(shù)的回歸分析第43頁,共53頁,2022年,5月20日,0點7分,星期四線性回歸分析結果(淡菜食用個數(shù)與腹瀉次數(shù)的回歸分析)Regression coefficientStd. errortP95%CIlowerupperconstant5.6461.7072.2219.071number of mussels consumed0.4040.1203.3800.0010.

18、1640.644第44頁,共53頁,2022年,5月20日,0點7分,星期四45Logistic回歸分析 Logistic回歸是適用于反應變量(即因變量)為分類變量的回歸分析,近年來在許多研究領域得到了廣泛的應用。 Logistic歸按照反應變量的類型可分為:兩分類反應變量的Logistic回歸;多分類有序反應變量的Logistic回歸(本課件不介紹)多分類無序反應變量的Logistic回歸(本課件不介紹)Logistic回歸按照研究設計的類型可分為:成組設計:非條件Logistic回歸,即研究對象未經匹配;配對設計:條件Logistic回歸,1:1、 1:m、m:n群組匹配:(本課件不介紹)第45頁,共53頁,2022年,5月20日,0點7分,星期四46非條件Logistic回歸分析單因素 (1)因素為定量變量(如結婚年齡)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論