第1、2、3章 緒論、計量統(tǒng)計描述_第1頁
第1、2、3章 緒論、計量統(tǒng)計描述_第2頁
第1、2、3章 緒論、計量統(tǒng)計描述_第3頁
第1、2、3章 緒論、計量統(tǒng)計描述_第4頁
第1、2、3章 緒論、計量統(tǒng)計描述_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章

醫(yī)學統(tǒng)計學中的基本概念葉孟良統(tǒng)計學(statistics):1.Statistics:Asciencedealingwiththecollection,analysis,interpretation,andpresentationofnumericaldata.(Webster’s國際大辭典)2.Statistics:Thescienceandartofdealingwithvariationindatathroughcollection,classification,analysisinsuchawayastoobtainreliableresults.(JohnM.Last,流行病學詞典)總之,統(tǒng)計學是一門處理數(shù)據(jù)中變異性的科學與藝術(shù),內(nèi)容包括收集、分析、解釋和表達數(shù)據(jù),目的是求得可靠的結(jié)論一、緒論

統(tǒng)計學思維和方法已經(jīng)滲透到醫(yī)學研究和衛(wèi)生決策之中,在科研的總體設(shè)計、資料的收集、整理、分析直到最后得出結(jié)論都與之密切相關(guān)。例:1.北京某醫(yī)院某大夫使用“烏貝散”治療胃潰瘍出血107例,有效101例,有效率94.4%,那么別的醫(yī)生也一定是94.4%嗎?那么是多少?高還是低?(求置信區(qū)間)

2.重慶某醫(yī)院有位老大夫,用“冠心靈”治療冠心病,其對照組用西藥,觀察結(jié)果如表

表冠心靈與單存西藥療效對比顯效有效無效合計單純西藥925640冠心靈1918542請問:冠心靈是否比單純西藥有效?(涉及統(tǒng)計學中假設(shè)檢驗的問題)二、醫(yī)學統(tǒng)計工作的內(nèi)容和資料的類型1、醫(yī)學統(tǒng)計工作的內(nèi)容:①design(設(shè)計)②collectiondata(收集)③sortingdata(整理資料)④analyzingdata(分析資料)①design(設(shè)計)根據(jù)研究目的制定研究方案專業(yè)設(shè)計:統(tǒng)計設(shè)計:研究對象的選擇(納入與排除標準),樣本量和樣本取得的方法,實驗組與對照組的分組原則,觀察指標及其精度,試驗過程中的質(zhì)量控制,擬采用的統(tǒng)計分析方法等。②collectiondata(收集)收集準確、完整、充滿信息的原始資料資料的來源:

專題試驗(實驗)研究、流行病學調(diào)查等常規(guī)登記資料:例如門診病例、住院登記資料等衛(wèi)生工作報表③sortingdata(整理資料)把收集到的原始資料,有目的地進行加工,使資料系統(tǒng)化、條理化,以便進一步統(tǒng)計分析歸類核查資料的完整性、可靠性(例如:漏項、邏輯性檢查、專業(yè)合理性、專業(yè)一致性檢查)④analyzingdata(分析資料)

統(tǒng)計描述統(tǒng)計分析

統(tǒng)計推斷參數(shù)估計假設(shè)檢驗把經(jīng)過整理的資料做一系列的統(tǒng)計描述和統(tǒng)計推斷,闡明事物的特征和規(guī)律。2、typeofdata(資料的類型)兩類:①定量(計量、數(shù)值變量)資料②定性(計數(shù)、分類變量)資料①定量(計量、數(shù)值變量)資料每個觀察對象通過定量測定的方法都有一個確切的值,通常有單位,但也有例外(例如淋巴細胞轉(zhuǎn)化率)。醫(yī)學中:身高、體重、血壓、血紅蛋白值等②定性(計數(shù)、分類變量)資料按照研究對象的某個特征進行分組,然后分組計數(shù)所獲得的資料。例如:男25女35無序分類資料:分組時表現(xiàn)為互不相容的類別

二分類:性別(男25女35有效無效)多分類:血型(A10B5AB7O3)、職業(yè)有序分類資料(等級資料):按照程度遞增或遞減例:①癌癥分期:早、中、晚。

②藥物療效:治愈、好轉(zhuǎn)、無效、死亡。

③幽門螺旋桿菌感染程度(-+++++++++)判斷資料類型的標準:

看每個觀察對象是否有一個確切的值,有:計量無:計數(shù)

資料可以由高級向低級轉(zhuǎn)化(高精度向低精度),如血壓值(正常、異常)住院號年齡身高體重住院天數(shù)職業(yè)文化程度分娩方式妊娠結(jié)局20256552716571.55無中學順產(chǎn)足月20256532216074.05無小學助產(chǎn)足月20258302515868.06管理員大學順產(chǎn)足月20225432316169.05無中學剖宮產(chǎn)足月20224662515962.011商業(yè)中學剖宮產(chǎn)足月20245352715768.02無小學順產(chǎn)早產(chǎn)20258342015866.04無中學助產(chǎn)早產(chǎn)20194642415870.53無中學助產(chǎn)足月20257832915457.07干部中學剖宮產(chǎn)足月觀察單位observations個體individuals變量variablesQuantitativedata計量資料Qualitativedata計數(shù)資料Units;elements三、統(tǒng)計學中的幾個基本概念

(一)同質(zhì)與變異(二)總體與樣本(三)參數(shù)與統(tǒng)計量(四)誤差(五)頻率與概率

(一)同質(zhì)與變異

homogeneityandvariation

1、同質(zhì):是指觀察單位間被研究指標的影響因素相同。如:研究兒童的生長發(fā)育,規(guī)定的同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)的兒童。

研究目的條件下的性質(zhì)相同

觀察單位的研究特征為變量。變量的觀察結(jié)果為變量值。2、變異:性質(zhì)相同的同質(zhì)對象的某個或某幾個特征值不同。同質(zhì)與變異的例子例1調(diào)查2006年重慶7歲男童的身高和體重同質(zhì):2006年、重慶市、7歲男童變異:身高和體重各不相同例2研究某降壓藥的療效同質(zhì):高血壓患者、用某藥治療變異:療效各不相同(二)總體與樣本

populationandsample總體:根據(jù)研究目的確定的同質(zhì)研究對象的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分觀察單位

代表性的條件隨機抽樣足夠數(shù)量(樣本含量)樣本的分布與總體的分布一致(構(gòu)成)隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。足夠數(shù)量:樣本含量樣本的結(jié)構(gòu)分布與總體的分布特征一致例如:欲研究重慶市7歲兒童的生長發(fā)育情況總體:男107:女100樣本:應該接近或近似男107:女100(三)參數(shù)與統(tǒng)計量

parameterandstatistic參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、標準差,采用希臘字母分別記為μ、σ。固定的常數(shù)

總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

推斷inference統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。(四)誤差

error誤差:實際觀察值與客觀真實值之差,以及統(tǒng)計量與參數(shù)之差。(1)系統(tǒng)誤差(2)隨機誤差(1)系統(tǒng)誤差systematicerror在實際觀測過程中,由受試對象、研究者、儀器設(shè)備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。流行病學稱之為偏倚(bias)。特點:觀察值有系統(tǒng)性、方向性、周期性的偏離真值??梢酝ㄟ^嚴格的實驗設(shè)計和技術(shù)措施消除。(2)隨機誤差randomerror排除上述誤差后尚存的誤差,受多種無法控制的因素的影響。特點:大小方向不一的隨機變化。隨機測量誤差(randommeasurementerror)——提高操作者熟練程度可以減少這種誤差

隨機抽樣誤差(random

samplingerror):由抽樣造成的樣本統(tǒng)計量和總體參數(shù)間的差異。——不可避免,但有一定的分布規(guī)律,可估計。(五)概率與頻率

probabilityand

frequency

確定性現(xiàn)象:在一定條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。

隨機現(xiàn)象:在同樣條件下可能會出現(xiàn)兩種或多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機事件。隨機事件的特征:①隨機性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。概率:隨機事件發(fā)生的可能性大小,用大寫的P表示,是一個穩(wěn)定的值;取值[0,1]。必然事件P=1不可能事件P=0隨機事件0<P<1

P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習慣),統(tǒng)計學上認為不大可能發(fā)生。小概率事件樣本的實際發(fā)生率稱為頻率,具有波動性。設(shè)在相同條件下,獨立重復進行n次試驗,事件A出現(xiàn)f次,則事件A出現(xiàn)的頻率為f/n。頻率與概率間的關(guān)系:

樣本頻率總是圍繞概率上下波動樣本含量n越大,波動幅度越小,頻率越接近概率。頻率frequency復習:總體與樣本、統(tǒng)計量與參數(shù)、系統(tǒng)誤差與抽樣誤差1、調(diào)查某地某年7歲正常男童的身高2、觀察某人群脈搏數(shù)(次/分)3、觀察某人群脈搏數(shù),定義脈搏數(shù)在60次/分-100次/分為正常,<60次/分或>100次/分為異常,按“正?!迸c“異常”分別清點人數(shù)得到的資料4、某單位職工體檢101名正常成年女子的血清總膽固醇(mmol/L)5、某醫(yī)院1998年在某城區(qū)隨機調(diào)查了8589例60歲以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例,高血壓患病率為2823/8589*100/%=32.87%資料的統(tǒng)計描述葉孟良統(tǒng)計描述的意義

社會活動看似雜亂無章,對個體來說有很多不確定性,但總體上都是服從一些統(tǒng)計規(guī)律的。醫(yī)學工作有很多數(shù)據(jù),統(tǒng)計學描述就是對這些數(shù)據(jù)進行加工和提煉,找出規(guī)律、預測未知。統(tǒng)計描述是最簡潔有力的語言。概念:即用少量幾個統(tǒng)計指標刻畫出原始數(shù)據(jù)的特征稱為統(tǒng)計描述。計量資料的統(tǒng)計描述方法:(單變量)1.通過頻數(shù)表描述數(shù)據(jù)特征2.用統(tǒng)計指標定量描述數(shù)據(jù)的特征。

描述計量資料的統(tǒng)計方法有兩類:統(tǒng)計圖表:主要是頻數(shù)分布表(圖)

統(tǒng)計指標:定量描述數(shù)據(jù)的特征一、數(shù)值變量的頻數(shù)分布(一)、頻數(shù)分布表頻數(shù)分布表:將變量值分為不同數(shù)量的組段,清點各組段的例數(shù)。意義:概括了解變量值在各組段的分布和規(guī)律。頻數(shù)表的編制

例:某年某市120名12歲男童的身高(cm)資料如下,作統(tǒng)計描述。142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2

125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7

160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.91、求數(shù)據(jù)的極差(range):極差是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)變異的幅度。本例極差:

R=160.9-125.9=35cm2、劃分組段(1)確定組數(shù):制作頻數(shù)表是為了簡化資料,顯示數(shù)據(jù)的分布規(guī)律,因此組數(shù)不能太多。也不能太少,太少會掩蓋數(shù)據(jù)分布的規(guī)律。適宜的分組數(shù)與觀察值的個數(shù)n的多少有關(guān)。n為30時,可分5到6組,隨著n的增加,分組適當增加,較大樣本時,一般取10組左右。(2)確定組距一般采取等距分組。

組距=極差/組數(shù)

本例組距=35/10=3.5≈4(3)確定各組段的上下限:下限(lowlimit):每個組段的起點上限(upperlimit):每個組段的終點上限=下限+組距

第一組段必須包含最小值,其下限一般取包含最小值的較為整齊的數(shù)值。本例最小值為125.9,取125為第一組段的下限。其上限=125+4=129。各組段不能重疊,每一組段均為半開半閉區(qū)間。3、用手工或電腦編制畫記表3、統(tǒng)計各組段內(nèi)的數(shù)據(jù)頻數(shù)得到頻數(shù)表組段劃記頻數(shù)f頻率(%)累計頻數(shù)(1)(2)(3)(4)(5)125~一10.81129~正43.35133~正正97.514137~正正正正正正2823.342141~正正正正正正正3529.277145~正正正正正正2722.5104149~正正一119.2115153~正43.3119157~161一10.8120合計120100身高是一個連續(xù)變化的量,被稱為連續(xù)性變量。已婚育齡婦女的現(xiàn)有子女數(shù)、幼兒的牙齒數(shù)等,其取值是0、1、2等不連續(xù)的量,這種變量被稱為離散型變量。4、頻率與累計頻率頻率:頻數(shù)表中的各組頻數(shù)之和等于總例數(shù)n,將各組的頻數(shù)除以n所得的比值被稱為頻率。累計頻數(shù):某組段及前面各組段的頻數(shù)之和。累計頻率:累計頻數(shù)除以總例數(shù)。(二)頻數(shù)分布圖125129133137141145149153157(三)頻數(shù)分布特征從頻數(shù)表,特別是頻數(shù)分布圖可以看到頻數(shù)分布有兩個特征:1、大多數(shù)12歲男童的身高向中央集中,為集中趨勢;2、少部分男童的身高較低和較高,向兩端離散,為離散趨勢。(四)、頻數(shù)分布的類型1、對稱分布:指集中位置在中間,左右兩側(cè)對稱。2、偏態(tài)分布:指集中位置偏向一側(cè),頻數(shù)分布不對稱。正偏態(tài)

負偏態(tài)(五)頻數(shù)分布表的用途1、揭示資料的分布類型及特征2、便于發(fā)現(xiàn)某些特大或特小的可疑值3、便于進一步計算統(tǒng)計指標和作統(tǒng)計處理4、組段的頻率作為概率的估計。125129133137141145149153157對稱分布圖2-1

101名正常成年女性血清總膽固醇頻數(shù)分布

頻數(shù)血清總膽固醇正態(tài)分布對稱分布圖2-259名鏈球菌咽喉炎患者潛伏期正偏態(tài)分布負偏態(tài)分布集中趨勢的描述平均數(shù)指標的概念和作用平均數(shù)表示一組同質(zhì)計量數(shù)據(jù)集中趨勢的位置和平均水平。作用:是一組計量數(shù)據(jù)平均水平的代表值;可作為不同組間的比較值。

常用的三種平均數(shù)指標有:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)(一)算術(shù)均數(shù)簡稱均數(shù)

總體均數(shù)用表示

樣本均數(shù)用表示公式適用頻數(shù)為正態(tài)或近似正態(tài)分布的計量資料.適用條件1、直接法(樣本例數(shù)較少)將所有數(shù)據(jù)直接相加,再除以總例數(shù)n:例如:測定了5名健康人第一小時末血沉,分別是6、3、2、9、10mm,求均數(shù)2、加權(quán)法(樣本例數(shù)較多,近似計算)

用各組段的組中值代替該組段中的任一觀察值,該組段的頻數(shù)是f,即有f個組中值,則有組中值與頻數(shù)的乘積代替該組段的各個值相加.計算公式:

利用頻數(shù)表,將每組段的組中值即(下限+上限)/2代替該組段觀察值的實際取值,用加權(quán)法求算術(shù)平均數(shù)。在樣本例數(shù)較多的情況下,加權(quán)法與直接法算得的結(jié)果相差不大。見P10當數(shù)據(jù)呈單峰對稱分布時,位于分布的中心,它是頻數(shù)分布最集中的位置。若數(shù)據(jù)分布不對稱,則不位于分布的中心,也不在分布的集中趨勢位置,它不反映數(shù)據(jù)的一般水平。二、幾何均數(shù)(G,geometricmean)適用于原始①數(shù)據(jù)分布不對稱,但經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料;②滴度資料(等比資料)。如血清滴度資料。公式:例2.2測得10個人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。

幾何均數(shù)是對數(shù)轉(zhuǎn)換后的數(shù)據(jù)的算術(shù)均數(shù)的反對數(shù)。當資料中出現(xiàn)相同觀察值時,也可用加權(quán)法計算幾何均數(shù):例2.3(頻數(shù)表資料)

應用:主要用于血清學和微生物學中。

三、中位數(shù)(median)

中位數(shù)是指將一組觀察值從小到大排序后居于中間位置的那個數(shù)值,全部觀察值中,大于和小于中位數(shù)的觀察值個數(shù)相等。任何分布的定量數(shù)據(jù)均可用中位數(shù)描述其分布的集中趨勢。直接法公式:

當n為偶數(shù)時

當n為奇數(shù)時1.原始資料如測得5個人的VLDL中的apo_B的含量(mg/dl)為0.84、2.85、5.46、8.58、9.60,則

M=5.46(mg/dl)若測量結(jié)果:0.84、2.85、8.58、9.6,則

M=(2.85+8.58)/2=5.72(mg/dl)

2.頻數(shù)表資料表2-4某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數(shù)累積頻數(shù)累積頻率(%)0.10~27274.30.40~16919631.10.70~16736357.6M1.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0

合計630--L、iM、fM分別為M所在組段的下限、組距和頻數(shù),fL為M所在組段之前各組段的累積頻數(shù)。連續(xù)型變量中位數(shù)的的計算可用公式:

組距中位數(shù)所在組前一組的累計頻數(shù)

中位數(shù)所在組下限中位數(shù)所在組的頻數(shù)四、百分位數(shù)(percentile)是一種位置指標,樣本的第X百分位數(shù)常記為Px,它是指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分成兩部分,在不包括Px的全部數(shù)據(jù)中有X%的數(shù)據(jù)小于Px,有(100-X)%的數(shù)據(jù)大于Px。中位數(shù)是特殊的百分位數(shù),第50百分位數(shù),M=P50。連續(xù)性變量頻數(shù)表資料百分位數(shù)計算公式:百分位數(shù)的應用1、中位數(shù)是百分位數(shù)的特例。其特點是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無確定數(shù)值數(shù)據(jù)的平均水平。2、多個百分位數(shù)相結(jié)合可以用來說明一特定的問題:離散程度、參考值范圍、把資料劃分等級第三章變異程度的統(tǒng)計描述

前面一節(jié)講述了一組觀察值的集中趨勢,但平均數(shù)并不能使我們?nèi)娴卣J識事物,試看下例:例:

對甲、乙兩名高血壓患者連續(xù)觀察5天,測得的收縮壓分別為(mmHg):甲患者162145178142186(=162.6)乙患者164160163159166(=162.4)

平均水平差不多,但甲患者的血液波動較大第一節(jié)衡量變異程度的指標分為兩類:1、間距計算:極差(R)、四分位數(shù)間距(Q)2、平均差距計算:平均偏差、離均差平方和、均方差(σ2、s2)、標準差(σ、s)和變異系數(shù)(cv)等一、極差和四分位數(shù)間距

1、全距(range)極差R=max-min

優(yōu)點:

該法簡單明了、容易使用,如用于說明傳染病、食物中毒等的最短、最長潛伏期等缺點:①只用到最大、最小值,樣本信息沒能充分利用。②當資料呈明顯偏態(tài)時,最大、最小值不穩(wěn)③樣本例數(shù)越多,R可能越大,兩組觀察值例數(shù)懸殊時不用R比較。2、四分位間距(inter-quartilerange)Q極差不穩(wěn)定,主要是受兩端的數(shù)據(jù)的影響,所以有人建議將兩端數(shù)據(jù)截去一定比例,如各去掉25%Q=p75-p25=Qu-QL

例如:50歲~60歲正常女性血清甘油三脂含量的百分位數(shù)P75和P25的位置分別為63.2mg/dl和135.7mg/dl,則

四分位間距比R穩(wěn)定,但仍未考慮每個觀察值,在統(tǒng)計分析應用得不普遍

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論