常見的幾種統(tǒng)計方法_第1頁
常見的幾種統(tǒng)計方法_第2頁
常見的幾種統(tǒng)計方法_第3頁
常見的幾種統(tǒng)計方法_第4頁
常見的幾種統(tǒng)計方法_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于常見的幾種統(tǒng)計方法第一頁,共六十一頁,2022年,8月28日前言

學習統(tǒng)計學方法,主要目的在于建立統(tǒng)計學觀念,提高醫(yī)學統(tǒng)計學思維,學會運用統(tǒng)計學理論和方法充分挖掘資料中蘊含的信息,恰如其分地進行理性概括,并據此寫出嚴謹的研究報告和學術論文。

第二頁,共六十一頁,2022年,8月28日呋喃硝胺

100人西米替丁

100人療效85人療效90人

例如:某醫(yī)生比較兩種療法對活動期十二指腸球部潰瘍的療效。據此能否立即下結論,呋喃硝胺的療效高于西米替???第三頁,共六十一頁,2022年,8月28日顯效有效無效合計單純西藥925640冠心靈1918542冠心靈與單純西藥療效對比

問題:某醫(yī)師用“冠心靈”治療冠心病,其療效是否優(yōu)于單純西藥?第四頁,共六十一頁,2022年,8月28日授課提綱醫(yī)學統(tǒng)計學概述統(tǒng)計工作的基本步驟統(tǒng)計資料的類型醫(yī)學統(tǒng)計中的基本概念常用的幾種統(tǒng)計方法第五頁,共六十一頁,2022年,8月28日一、醫(yī)學統(tǒng)計學概述

定義

是用統(tǒng)計學原理和方法研究生物醫(yī)學問題的一門學科。醫(yī)學統(tǒng)計方法在醫(yī)學研究中的運用主要有三個方面:第六頁,共六十一頁,2022年,8月28日一、醫(yī)學統(tǒng)計學概述①以正確的方式收集數據,如實驗設計、調查設計等。②描述數據的統(tǒng)計特征,如數據化簡、統(tǒng)計指標的選擇與計算、統(tǒng)計結果的表達等。③統(tǒng)計分析及得出正確結論,如根據概率分布,對實驗和觀察結果存在的差異和關聯作出統(tǒng)計推斷。

第七頁,共六十一頁,2022年,8月28日工作生活中常見的統(tǒng)計學問題如何判斷藥物的療效?(假設檢驗)明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強度有多大?(相關與回歸)美國的民意測驗是如何進行的?(設計,抽樣)中國的市場調查的可信性有多大?(現場調查)

統(tǒng)計學是對令人困惑費解的數字問題做出設想的藝術。第八頁,共六十一頁,2022年,8月28日

醫(yī)學論文中的統(tǒng)計學問題60年代到80年代,國外醫(yī)學雜志調查結果:有統(tǒng)計錯誤的論文20%~72%。1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志占6.9%),數據分析方法誤用達55.7%。第九頁,共六十一頁,2022年,8月28日

60年代到80年代,國外醫(yī)學雜志調查表明:20%~72%的論文有統(tǒng)計錯誤。

1984年對《中華醫(yī)學雜志》、《中華內科雜志》、《中華外科雜志》、《中華婦產科雜志》、《中華兒科雜志》595篇論文的調查結果為:相對數誤用占11.2%,抽樣方法誤用占15.9%,統(tǒng)計圖表誤用占11.7%1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志占6.9%),數據分析方法誤用達55.7%。

2001年《中華預防醫(yī)學雜志》:中華醫(yī)學會系列雜志誤用約54%(1995)。1996年,有機構對申報科技成果的4586篇科研論文分析,統(tǒng)計方法使用率為76%。醫(yī)學論文中統(tǒng)計運用錯誤,除了影響論文的科學性,還可能導致嚴重的倫理學問題。

第十頁,共六十一頁,2022年,8月28日

偽造統(tǒng)計數據違反科學道德1976年NewScience雜志關于科研舞弊行為的調查(1)74%的調查表反映有不正當修改數據的情況(2)17%拼湊實驗結果(3)7%憑空捏造數據(4)2%故意曲解結果第十一頁,共六十一頁,2022年,8月28日

二、統(tǒng)計工作的基本步驟設計收集資料整理資料分析資料第十二頁,共六十一頁,2022年,8月28日1.專業(yè)設計:選題、建立假說、確定研究對象和技術方法等→個性

2.統(tǒng)計設計:圍繞專業(yè)設計確定統(tǒng)計設類型、樣本大小、分組方法、統(tǒng)計分析指標及統(tǒng)計分析方法。

(一)設計

第十三頁,共六十一頁,2022年,8月28日

(二)收集資料

(一)資料來源第一手資料①

經常性:統(tǒng)計報表(死亡登記、疫情報告等),工作記錄(病歷、化驗);②一時性:專題調查、實驗或臨床試驗。第二手資料:已公布的資料,如全國、全省衛(wèi)生統(tǒng)計資料。第十四頁,共六十一頁,2022年,8月28日(二)收集資料

(二)資料要求

1.完整:觀察單位及觀察項目完整。

觀察單位:最基本的獲取數據的單元??梢允且粋€體,亦可以是一個單位、家庭、地區(qū),一批樣品,一個采樣點。

2.準確:即真實、可靠。真實是統(tǒng)計學的靈魂。

3.及時:即時限性。如人口普查規(guī)定調查開始日期和截止日期。第十五頁,共六十一頁,2022年,8月28日(三)整理資料

整理資料即原始數據的條理化、系統(tǒng)化的過程。所采取的手段→合理化分組,目的→實現專業(yè)目標。質分組:按事物的屬性或性質分組→分類變量;量分組:按數據的大小→數值變量。第十六頁,共六十一頁,2022年,8月28日(四)分析資料

1.統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)計圖表對資料的數量特征及分布規(guī)律進行測定和描述。

2.統(tǒng)計推斷:用樣本信息推斷總體特征:①參數估計。②假設檢驗。第十七頁,共六十一頁,2022年,8月28日

三、統(tǒng)計資料的類型

有三種類型的資料:

計量資料,計數資料,等級資料基本概念:變量及變量值,研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。按變量值的性質可將資料分為定量資料和定性資料。第十八頁,共六十一頁,2022年,8月28日1.計量資料定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數據資料。特點:有度量衡單位多為連續(xù)性資料(通過測量得到)如患者的身高(cm)、體重(kg)、血壓(mmHg)、脈搏(次/分)、紅細胞計數(1012/L)第十九頁,共六十一頁,2022年,8月28日定義:將全體觀測單位按照某種性質或特征分組,然后再分別清點各組觀察單位的個數。特點:沒有度量衡單位多為間斷性資料(通過枚舉或記數得來)如膚色(黑、白)、血型(ABO)、職業(yè)(工農兵)、性別(男女)

2.計數資料第二十頁,共六十一頁,2022年,8月28日

定義:介于計量資料和計數資料之間的一種資料,通過半定量方法測量得到。特點:每一個觀察單位沒有確切值各組之間有性質上的差別或程度上的不同。①癌癥分期:早、中、晚。②藥物療效:治愈、好轉、無效、死亡。③尿蛋白:,,,++,+++及以上3.等級資料第二十一頁,共六十一頁,2022年,8月28日對觀察對象按屬性或類型分組計數所得的資料。每個對象之間沒有量的差異,只有質的不同。

資料的類型

計量資料(數值變量或定量資料)

計數資料(無序分類變量或定性資料)

等級資料(有序分類變量或半定量資料)

對每一觀察對象用定量的方法,測定某項指標所得的資料。一般有度量衡單位,每個對象之間有量的區(qū)別。

對觀察對象按屬性或類型程度的不同分組計數,但各屬性或類型之間又有程度的差別。

第二十二頁,共六十一頁,2022年,8月28日

(1)不同類型的資料采用的統(tǒng)計分析方法不同;(2)三類資料類型可以相互轉化。

注意:第二十三頁,共六十一頁,2022年,8月28日例:某地調查高血壓的患病情況。每人的血壓:以mmHg計計量資料以舒張壓≥90mmHg為高血壓,結果在1000人中有10名高血壓患者,990名非高血壓患者,整理后的資料

計數資料按低血壓、正常、高血壓分組所得資料。等級資料第二十四頁,共六十一頁,2022年,8月28日四、統(tǒng)計學中的基本概念(一)總體與樣本1、總體(population)

根據研究目的所確定的同質的所有觀察單位某項變量值的集合。

有關總體的三個要點:研究目的、同質的、全體第二十五頁,共六十一頁,2022年,8月28日觀察對象:該地2002年全部正常成人同質:

同一地區(qū)、同一年份、同為正常成人全體:該地2002年全部正常成人白細胞數目的:了解某地2002年正常成人白細胞數觀察單位:每個人

觀察值:測得的白細胞數例如:了解某地2002年正常成人白細胞數第二十六頁,共六十一頁,2022年,8月28日四、統(tǒng)計學中的基本概念(二)變異:同質基礎上個體值之間的差異,稱為變異。同質:指觀察單位或觀察指標受共同因素制約的部分。例如,同種族、同年齡、同性別的健康人,在相同的條件下測其脈搏、呼吸、體溫等生理指標可以有很大差異。第二十七頁,共六十一頁,2022年,8月28日四、統(tǒng)計學中的基本概念(三)參數和統(tǒng)計量

1.參數:總體指標。

2.統(tǒng)計量:樣本指標。(四)抽樣誤差

1.定義:在統(tǒng)計學上把由抽樣造成的樣本統(tǒng)計量和總體參數之間的差異或者是各個樣本統(tǒng)計量之間的差異統(tǒng)稱為抽樣誤差。

第二十八頁,共六十一頁,2022年,8月28日四、統(tǒng)計學中的基本概念(五)概率概率:是描述隨機事件發(fā)生的可能性大小的數值。(1)必然事件:P(A)=1(2)不可能事件:P(A)=0(3)隨機事件(偶然事件):0<P(A)<1(4)小概率事件:P≤0.05或P≤0.01第二十九頁,共六十一頁,2022年,8月28日t檢驗不是處理計數資料的萬能方法第三十頁,共六十一頁,2022年,8月28日雙向無序,兩個分類變量皆為無序分類變量,一般用卡方檢驗。單向有序資料,采用秩和檢驗。雙向有序且屬性相同,研究目的通常是分析兩種檢測方法的一致性,此時應用一致性檢驗。雙向有序屬性不同,根據具體情況可選擇秩和檢驗,等級相關分析或者線性趨勢檢驗??ǚ綑z驗不是處理計數資料的萬能方法第三十一頁,共六十一頁,2022年,8月28日卡方檢驗第三十二頁,共六十一頁,2022年,8月28日秩和檢驗或Ridit分析第三十三頁,共六十一頁,2022年,8月28日原則:選擇最恰當的統(tǒng)計指標準確描述資料的特征。非正態(tài)分布計量資料正態(tài)分布計數資料

率或比第三十四頁,共六十一頁,2022年,8月28日

X2檢驗

X2檢驗或稱卡方檢驗,是一種用途較廣的假設檢驗方法,常用于檢驗兩個或多個樣本率及構成比之間有無差別,還用來檢驗配對定性資料及兩種屬性或特征之間是否有關系等。第三十五頁,共六十一頁,2022年,8月28日2檢驗的適用資料兩組樣本率的比較;多組樣本率的比較;兩組或多組構成比的比較;配對設計下兩分類資料檢驗。第三十六頁,共六十一頁,2022年,8月28日一、四格表資料的檢驗四格表資料的檢驗主要用于兩個樣本率(或構成比)的假設檢驗,一般制成表6-2的計算格式(以陽性和陰性為例)。第三十七頁,共六十一頁,2022年,8月28日表6-2四格表資料檢驗計算表組別陽性數陰性數合計甲組aba+b乙組cdc+d合計a+cb+da+b+c+d=n第三十八頁,共六十一頁,2022年,8月28日X2檢驗的基本公式為理論頻數T

條件:n>40,T>=5第三十九頁,共六十一頁,2022年,8月28日四格表檢驗專用公式省去計算T值第四十頁,共六十一頁,2022年,8月28日例6.7以例6.6資料為例表6-3用藥組和對照組流感發(fā)病率的比較組別

發(fā)病人數

未發(fā)病人數合計用藥組14(20)86(80)100對照組30(24)90(96)120合計44176220第四十一頁,共六十一頁,2022年,8月28日兩種方法計算結果第四十二頁,共六十一頁,2022年,8月28日結果判斷X2臨界值:X20.05,1=3.84,

請記?。篨20.01,1=6.63,X2=u2

本例:X2=4.125>X20.05,1=3.84,兩組差別有統(tǒng)計學意義。與前面的結論相同。第四十三頁,共六十一頁,2022年,8月28日四格表值的校正

條件:(1)任一格的1≤T<5,且n≥40時,需計算校正值。(2)任一格的T<1或n≤40時,用確切概率計算法。基本公式專用公式第四十四頁,共六十一頁,2022年,8月28日例6.8

某醫(yī)師用甲、乙兩療法治療小兒單純性消化不良,治療結果如表6-4,問兩療法的治愈率是否相等?表6-4甲、乙兩療法治療小兒單純性消化不良的治愈率比較組別

發(fā)病人數

未發(fā)病人數合計用藥組26(28.8)7(4.2)33對照組36(33.2)2(4.8)38合計62971第四十五頁,共六十一頁,2022年,8月28日計算結果及判斷本例:X2=2.71<X20.05,1=3.84本例若對X2值不校正,α=4.06,得P<0.05,結論正好相反。第四十六頁,共六十一頁,2022年,8月28日三、行×列表的檢驗行×列表(R×C表)的檢驗主要用于解決多個樣本率或多個樣本構成比的比較以及有序分類資料的關聯性檢驗。

式中n為總例數,A為每格子的實際頻數,nR、nC分別為與某格子實際頻數(A)同行、同列的合計數。第四十七頁,共六十一頁,2022年,8月28日

行×列表資料的檢驗的注意事項1.理論數不宜太小,一般不宜有1/5以上格子的理論頻數小于5,或有一個理論頻數小于1。對理論數太小有三種處理方法:①最好增加樣本含量以增大理論頻數;根本的方法。②刪去理論頻數太小的行和列;此法不好。③將理論頻數較小的行或列與鄰行或鄰列合并以增大理論頻數。但后兩法可能會損失信息,第四十八頁,共六十一頁,2022年,8月28日

行×列表資料的檢驗的注意事項2.當多個樣本率(或構成比)比較的檢驗,結論為拒絕檢驗假設,只能認為各總體率(或總體構成比)之間不全相等,但不能認為彼此間都不相等。若要比較彼此間的差別,可用下述的行×列表的分割法。3.對于行×列表單向等級資料(單向有序資料)組間的比較,宜用第八章秩和檢驗,如作卡方檢驗法只說明各處理組的效應在構成比上有無差異,而不能說明組間整體效應的差異。第四十九頁,共六十一頁,2022年,8月28日t檢驗與u檢驗的應用條件兩組數值變量資料比較;小樣本時用t檢驗,要求資料為隨機樣本并服從正態(tài)分布;大樣本時用u檢驗,仍要求資料為隨機樣本,但正態(tài)性條件可以放寬;在兩樣本均數比較的t和u檢驗中,要求兩組總體方差相等,即方差齊性;組間要求具有均衡可比性。第五十頁,共六十一頁,2022年,8月28日

單樣本均數的t檢驗對于總體標準差未知的小樣本數據(n<60),單樣本均數的假設檢驗采用t檢驗,計算公式為第五十一頁,共六十一頁,2022年,8月28日

例通過以往大規(guī)模調查,已知某地新生兒出生體重均數為3.30kg。從該地難產兒中隨機抽取35名新生兒作為研究樣本,平均出生體重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論