醫(yī)學(xué)統(tǒng)計學(xué)第二章_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)第二章_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)第二章_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)第二章_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)第二章_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2 2 統(tǒng)計資料的整理與描述統(tǒng)計資料的整理與描述原始資料雜亂無章【例例2.1】 2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。分類資料的整理 列出類別,計算頻數(shù),列表2.1 頻數(shù)表頻數(shù)表資料整理的必要性 條理化,系統(tǒng)化,顯示數(shù)量特征、分布規(guī)律,便于進一步統(tǒng)計分析數(shù)值變量資料的整理2.1.1. 頻數(shù)表的編制 【例例2.1】 2011年某市120名7歲男童身高(cm)資料如下,試編制頻數(shù)表。頻數(shù)表的編制方法如下頻數(shù)表的編制方法如下 :(1)找出觀察值中的最大值和最小值,并求出極差極差 (2)決定組段數(shù)、組段和組距 確定組段數(shù)要以充分反映數(shù)據(jù)的分布特征為原則 組距26.6/102

2、.66可以參考斯特奇斯(Sturges)提出的經(jīng)驗公式來確定分組數(shù)cmcmcmR6 .264 .1170 .144組數(shù)極差組距 2lglg1nk(3)列表劃記:計算各組段包含的觀察單位個數(shù)2.1.2 頻數(shù)分布的圖示 圖圖2.1 2011年某地年某地120名名7歲男童身高的頻數(shù)分布歲男童身高的頻數(shù)分布 2.1.3. 頻數(shù)分布的分析對頻數(shù)表的分析,主要在于以下幾個方面: (1)有無可疑值 通過對頻數(shù)分布的分析,發(fā)現(xiàn)某些特大或特小的離 群值、可疑值 (2)分布的類型 頻數(shù)分布可分為對稱分布和偏態(tài)分布兩種類型. 不同類型的分布,應(yīng)采用不同的統(tǒng)計分析方法 對稱分布,是指觀察值向中央部分集中,以中等數(shù)據(jù)居

3、多,左右兩側(cè)分布大體對稱。 如:正常人身高、體重,脈搏,血紅蛋白等的分布所謂偏態(tài)分布,是指觀察值偏離中央所謂偏態(tài)分布,是指觀察值偏離中央 尾部偏向數(shù)軸正側(cè)(或右側(cè)),稱正偏態(tài)(或右偏態(tài)); 如:食物中毒引起腹瀉的潛伏期尾部偏向數(shù)軸負側(cè)(或左側(cè)),稱負偏態(tài)(或左偏態(tài)) 如:慢性病患者年齡的分布(3)分布特征分布特征 分布的兩個重要特征:集中趨勢和離散趨勢 總體中的個體總是具有同質(zhì)性,這些同質(zhì)性使得觀察值應(yīng)趨向同一數(shù)值(即集中趨勢)。同一總體中的個體之間又普遍存在著各種差別,使得個體觀察值不會完全相同。2.2 集中趨勢的描述集中趨勢的描述平均數(shù)反映一組觀察值的集中趨勢、中心位置或平均水平它是該組數(shù)

4、據(jù)的代表,能對一群同類事物或現(xiàn)象的數(shù)量特征作出概括的說明,是統(tǒng)計學(xué)中應(yīng)用最廣泛、最重要的一個指標體系。常用的平均數(shù)有(算術(shù))均數(shù),幾何均數(shù)和中位數(shù) 2.2.1 均數(shù)均數(shù) 均數(shù)是算術(shù)均數(shù)的簡稱,習(xí)慣上用希臘字母 表示總體均數(shù);用 表示樣本均數(shù)。均數(shù)反映一組觀察值在數(shù)量上的平均水平,最適合單峰對稱分布資料的平均水平的描述。1)未分組資料(原始資料)的均數(shù)的計算方法: 將所有的觀察值直接相加,再除以總觀察數(shù)nX2)分組資料的均數(shù)計算法 有時我們面對的資料不是原始數(shù)據(jù),而是經(jīng)過加工整理后的分組資料。這時用加權(quán)法求均數(shù)。 iiiikkfXffXfXfXfX2211 式中 fi是第 i 組的頻數(shù),fi表示

5、各組段頻數(shù)之和,即總觀察數(shù) n; Xi是第 i 組的組中值,即該組的(下限+上限)/2。 由于只知道有 fi個觀察值屬于該組段,而不知道具體的數(shù)值,故該組的 fi個觀察值均以組中值代替。 【例例 2.3 】 求表2.1中資料的均數(shù)2.2.2 幾何均數(shù)幾何均數(shù) 有些醫(yī)學(xué)資料,如抗體的滴度,細菌計數(shù)等,其頻數(shù)分布呈明顯偏態(tài),各觀察值之間呈倍數(shù)變化(等比關(guān)系),算術(shù)均數(shù)對這類資料集中趨勢的代表性就差,這時宜用幾何均數(shù)反映其平均增(減)倍數(shù)。幾何均數(shù)一般用G表示,適用于各變量值之間成倍數(shù)關(guān)系,但作對數(shù)變換后指標成單峰對稱分布的資料。 (1) 未分組資料的幾何均數(shù)計算法。將 n 個觀察值 X1,X2,X

6、n直接相乘 再開 n 次方,即為幾何均數(shù)。以公式表示: nnXXXG 21 nXininXnXXXGlg121110lglglglglglg【例例2.4 】 5人的血清抗體滴度分別為1:10,1:20,1:40,1:40,1:160,求平均滴度。8 .34160404020105G8 .345160lg40lg40lg20lg10lglg1G(2)分組資料的幾何均數(shù)計算法。 nXffXfXfXfGiiikklglglglglglg122111 【例例2.5 】 某地107人接種疫苗后抗體滴度見表2.2第(1)(2)欄,求平均滴度。表表2.2 107例試驗受試者免疫后麻疹例試驗受試者免疫后麻疹H

7、I抗體滴度及平均滴度計算抗體滴度及平均滴度計算計算幾何均數(shù)時注意 變量值中不能有0,因為0與任何數(shù)的乘積均為0,且0不能取對數(shù)。 同一組變量值不能同時存在正、負值。 若變量值全為負值,可在計算時將負號除去,算出結(jié)果后再冠以負號 2.2.3 中位數(shù)與百分位數(shù)中位數(shù)與百分位數(shù) 資料是偏態(tài)分布的,資料中的少數(shù)數(shù)據(jù)過分偏大(或偏?。?,分布不規(guī)則,一端或兩端有不確定數(shù)據(jù)(開口資料)時,用中位數(shù)表示他們的集中趨勢比算術(shù)均數(shù)合理。 中位數(shù)(median,簡記為M)是將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù)百分位數(shù)(percentile)是一種位置指標,以 表示,一個百分位數(shù) 將總體或樣本的

8、全部觀察值分為兩個部分,理論上有X的觀察值比 小,有(100-X)觀察值比 大XPXPXPXP中位數(shù)與百分位數(shù)的計算(1)未分組資料的中位數(shù)計算法 設(shè)個觀察值X1,X2,Xn已按從小到大的順序排列,則:【例2.6 】 9名沙門菌食物中毒患者的潛伏期(小時)為:2,5,9,12,14,15,18,24,60。求其中位數(shù)。為偶數(shù)當(dāng)為奇數(shù)當(dāng)nXXXMnnn2/n12/2/2/1【例2.7】 8名桿菌痢疾治愈者的住院天數(shù)如下,求其中位數(shù)。 4,9,10,12,14,20,24,61(2)分組資料的中位數(shù)和百分位數(shù)計算法 百分位數(shù)的計算公式:LxxfXnfiLP%例 2.8 157 名桿菌痢病治愈者的住

9、院天數(shù)如表 2.3 第(1)(2)欄所示,試計算其中位數(shù)及25和 75百分位數(shù)。 表 2.3 157 名桿菌痢病治愈者的住院天數(shù) 住院天數(shù) 治愈人數(shù) 累計頻數(shù) 累計頻率(%) (1) (2) (3) (4) 0 3 3 1.9 5 38 41 26.1 10 49 90 57.3 15 24 114 72.6 20 13 127 80.9 25 8 135 86.0 30 7 142 90.4 35 4 146 93.0 40 4 150 95.5 45 1 151 96.2 50 1 152 96.8 55 2 154 98.1 60 1 155 98.7 65 1 156 99.4 70

10、0 156 99.4 75 1 157 100.0 2.3 離散程度的描述離散程度的描述【例例2.9】 三組同性別、同年齡兒童的體重(kg)如下,試分析其集中趨勢和離散程度。 甲組 26 28 30 32 34 乙組 24 27 30 33 36 丙組 26 29 30 31 34 kgXkgXkgX303030丙乙甲 三組的的均數(shù)相同,但顯然5個數(shù)據(jù)間參差不齊的程度是不一樣的。二者結(jié)合,才能全面全面認識事物。 描述離散程度的指標有極差、四分位數(shù)間距、方差、標準差及變異系數(shù) 2.3.1. 極差極差極差(range,記為R)亦稱全距。即一組數(shù)據(jù)中最大值與最小值之差。反映個體的變化范圍。極差大,說

11、明變異度大;反之,說明變異度小 優(yōu)點:優(yōu)點:計算簡單,意義明確。 缺點:缺點:1. 除了最大值和最小值外,不能反映組內(nèi)其它數(shù)據(jù)的變異程度 ;2. 樣本例數(shù)懸殊時不宜比較極差;3. 抽樣誤差較大,極不穩(wěn)定。 2.3.2 四分位數(shù)間距四分位數(shù)間距 四分位數(shù)四分位數(shù)(quartile,記為Q),是特定的百分位數(shù),即P25(下四分位數(shù))和P75(上四分位數(shù)) 四分位數(shù)間距(inter-quartile range)就是上四分位數(shù)與下四分位數(shù)之差 QQUQL 四分位數(shù)間距可看成中間一半觀察值的極差 用四分位數(shù)間距反映變異程度的大小 優(yōu)點:優(yōu)點:比極差穩(wěn)定, 缺點:缺點:但仍未考慮全部觀察值的變異程度。

12、適用場合:適用場合:如集中趨勢用中位數(shù)描述,則相應(yīng)的離散趨勢用四分位數(shù)間距描述。2.3.3 方差與標準差方差與標準差 離均差 :總體中每個變量值X與總體均數(shù)之差,X-,稱為離均差 離均差平方和:將離均差平方后再相加,得(X-)2,稱為離均差平方和(sum of squares) ,其除了與變異度有關(guān),還與變量值的個數(shù)N有關(guān)。 總體方差: NX22 方差的度量單位是原變量值度量單位的平方 總體標準差 : 方差標準差越大說明個體的變異度越大;反之,說明個體的變異度就越小NXNii12)( 樣本標準差s : 實際計算時用公式:12nXXs1/22nnXXs 分組資料用公式 :1/X22nnfXfs2

13、.3.4. 相對離散度相對離散度為什么要引進相對離散度?常用的相對離散度指標有:極差與中位數(shù)之比;四分位數(shù)間距(QU-QL)與(QU+QL)之比;而最常用的是變異系數(shù)(coefficient of variation,記為CV)。 變異系數(shù)(離散系數(shù)): 主要用于 :1. 度量衡單位不同的幾組資料間的比較 2. 均數(shù)相差懸殊的幾組資料間的比較 %100XsCV注解:”來表達。四分位數(shù)間距適合用“中位數(shù)布。此類資料可以認定資料呈偏態(tài)分或遠大于均數(shù),若計算出的標準差大于正態(tài)分布的資料是用來表達呈標準差平均數(shù);sx 2.4 分類資料的率和比分類資料的率和比分類資料常用的描述性指標是相對數(shù)表表 2.4

14、 某市某年各區(qū)急性傳染病發(fā)生數(shù)及其相對數(shù)某市某年各區(qū)急性傳染病發(fā)生數(shù)及其相對數(shù) 市區(qū)市區(qū) 年平均年平均 人口數(shù)人口數(shù) 急性傳染急性傳染病發(fā)生數(shù)病發(fā)生數(shù) 各區(qū)與各區(qū)與 I 區(qū)區(qū) 發(fā)病數(shù)之比發(fā)病數(shù)之比 各區(qū)急性傳染病各區(qū)急性傳染病發(fā)生數(shù)構(gòu)成 (發(fā)生數(shù)構(gòu)成 (%) 各區(qū)急性傳染各區(qū)急性傳染病發(fā)病率 (病發(fā)病率 (1/萬)萬) (1) (2) (3) (4) (5) (6) I 636723 2433 18.9 38.21 II 389540 3033 1.25 23.5 77.86 III 699712 1650 0.68 12.8 23.58 IV 328363 1503 0.62 11.6 45

15、.77 V 286967 1282 0.53 10.0 44.67 VI 317504 1853 0.76 14.4 58.36 VII 153838 1130 0.46 8.8 73.45 合計合計 2812647 12884 100.0 45.81 2.4.1 比比 (相對比相對比 )比亦稱相對比,是A、B兩個有關(guān)指標之比,說明A為B的若干倍或百分之幾。 比A/B例如:新生嬰兒(全人口)性別比,醫(yī)護比,病床數(shù)與醫(yī)護人員之比,醫(yī)院的門診人數(shù)與病床數(shù)之比,發(fā)展速度和增長速度等等。2.4.2 2.4.2 構(gòu)成比構(gòu)成比 說明一種事物內(nèi)部各組成部分所占的比重或分布,常以百分數(shù)表示,計算公式為: 如:

16、班級女生比例,不及格比例,死因構(gòu)成比%100觀察單位總數(shù)同一事物各組成部分的位數(shù)某一組成部分的觀察單構(gòu)成比2.4.3 2.4.3 率率u如:流感發(fā)生有季節(jié)性;南部非洲是愛滋病的重災(zāi)區(qū),說明現(xiàn)象發(fā)生的強度是有差異的 說明某現(xiàn)象發(fā)生的頻率或強度.常以百分率()、千分率()、萬分率(1/萬)、十萬分率(1/10萬)等表示。計算公式為: 比例基數(shù)的選取:至少保留一二位整數(shù) 醫(yī)學(xué)中有些頻率指標的定義并不符合率的定義)比例基數(shù)(單位總數(shù)可能發(fā)生某現(xiàn)象的觀察單位數(shù)實際發(fā)生某現(xiàn)象的觀察率K2.4.4. 2.4.4. 應(yīng)用相對數(shù)時應(yīng)注意的問題應(yīng)用相對數(shù)時應(yīng)注意的問題1.1. 計算相對數(shù)的分母不宜過小計算相對數(shù)的

17、分母不宜過小 原理:頻率的穩(wěn)定性 實際應(yīng)用中,如果觀察例數(shù)小于20時,都不宜計算相對數(shù)。 發(fā)生率的大小對抽樣研究中的樣本的大小有指導(dǎo)意義 設(shè)計的周密程度,實驗條件的嚴格控制不同時對研究對象的例數(shù)要求不同2.2.分析時不能以構(gòu)成比代替率(強度相對數(shù))分析時不能以構(gòu)成比代替率(強度相對數(shù)) 構(gòu)成比(構(gòu)成相對數(shù))只能說明事物各組成部分的比重,并不說明某現(xiàn)象發(fā)生的頻率或強度3.3.當(dāng)各分組的觀察單位數(shù)不等時當(dāng)各分組的觀察單位數(shù)不等時,不能直接將各不能直接將各分組的率相加求其平均而成為總率分組的率相加求其平均而成為總率 4.4.對比時應(yīng)注意資料的可比性對比時應(yīng)注意資料的可比性 除研究因素外,其他的重要影

18、響因素應(yīng)相同或相近 觀察對象同質(zhì),時間相近,研究方法相同,以及地區(qū)、民族等客觀條件一致 其它影響因素在各組的內(nèi)部構(gòu)成應(yīng)相近2.4.5 2.4.5 標準化法標準化法(1)(1)標準化法的概念標準化法的概念 當(dāng)比較兩類事物的總率時,如果此兩同類事物的內(nèi)部構(gòu)成,特別是某項能影響指標水平的重要特征在構(gòu)成上不同,往往會造成總率的上升或下降,在這種情況下,冒然進行兩總率的比較,會產(chǎn)生錯誤的結(jié)論,此時,必須設(shè)法消除這種內(nèi)部構(gòu)成上的差別,才能進行比較。統(tǒng)計學(xué)上特將這種方法稱為率的標準化,即采用統(tǒng)一的標準對內(nèi)部構(gòu)成不同的各組頻率進行調(diào)整和對比的方法,調(diào)整后的率為標準化率,簡稱為標化率,亦稱調(diào)整率。 表表 2.5

19、 某市某市甲乙兩甲乙兩院院各各科出院和治愈人數(shù)科出院和治愈人數(shù) 甲甲 院院 乙乙 院院 科室科室 出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%) 出院人數(shù)出院人數(shù) 治愈人數(shù)治愈人數(shù) 治愈率治愈率(%) (1) (2) (3) (4) (5) (6) (7) 內(nèi)科內(nèi)科 876 295 33.67 329 104 31.61 外科外科 305 292 95.74 702 657 93.59 婦科婦科 564 492 87.23 591 501 84.77 兒科兒科 329 301 91.49 263 233 88.59 合計合計 2074 1380 66.54 1885 1495 79.31 表 2.6 計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論