醫(yī)學統(tǒng)計學課件:第二章 計量資料的統(tǒng)計描述_第1頁
醫(yī)學統(tǒng)計學課件:第二章 計量資料的統(tǒng)計描述_第2頁
醫(yī)學統(tǒng)計學課件:第二章 計量資料的統(tǒng)計描述_第3頁
醫(yī)學統(tǒng)計學課件:第二章 計量資料的統(tǒng)計描述_第4頁
醫(yī)學統(tǒng)計學課件:第二章 計量資料的統(tǒng)計描述_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章計量資料的統(tǒng)計描述

計量資料的分類:1.離散型資料(discretedata):是指變量取值可以一一列舉的資料。例如,每個育齡婦女現(xiàn)有的子女數(shù)。2.連續(xù)型資料(continuitydata):是指變量取值不能一一列舉(即變量取值為一定范圍內(nèi)的任意值)的資料。例如,人體的身高(cm)、體重(kg)等。第一節(jié)頻數(shù)分布表和頻數(shù)分布圖頻數(shù)表適用于:觀察例數(shù)較多的計量資料。一、頻數(shù)分布表:

頻數(shù)(frequency):不同組別內(nèi)的觀察值個數(shù)稱為頻數(shù),表示觀察值在各組內(nèi)出現(xiàn)的頻繁程度。

頻數(shù)表:將分組標志和相應(yīng)的頻數(shù)列表,即為頻數(shù)分布表,簡稱頻數(shù)表。

(一)離散型計量資料的頻數(shù)表見P7(二)連續(xù)型計量資料的頻數(shù)表頻數(shù)表編制:

1.求全距(極差):

R=MAX-MIN

2.定組距和組段,一般8~15組為宜組距=[R/10]組段=R÷組距

組中值=(本組段下限+下組段下限)÷2

第一組段應(yīng)包括MIN最末組段應(yīng)包括MAX且同時寫出下限和上限每一組段數(shù)值范圍:下限≤X<上限下限(lowerlimit):每個組段的起點稱為該組的下限。上限(upperlimit):每個組段的終點稱為該組的上限。

3.列表劃記頻數(shù)分布表的用途(1)是大樣本數(shù)據(jù)常用的表達方式。(2)便于觀察數(shù)據(jù)的分布類型(以便選擇相應(yīng)的統(tǒng)計指標和分析方法)。對稱分布:集中位置在中間。左右兩側(cè)頻數(shù)基本對稱。偏態(tài)分布正偏態(tài)分布:集中位置偏向數(shù)值較小的一側(cè)。負偏態(tài)分布:集中位置偏向數(shù)值較大的一側(cè)。(3)便于發(fā)現(xiàn)資料中的可疑值(4)當n足夠大時,以f

P的估計值,便于進一步計算統(tǒng)計指標和進行統(tǒng)計分析。二、頻數(shù)分布圖直方圖:適合描述連續(xù)型資料的頻數(shù)分布。第二節(jié)計量資料集中趨勢的描述平均數(shù)(average):是一類描述計量資料集中位置或平均水平的統(tǒng)計指標。常用的平均數(shù)——算術(shù)平均數(shù)、幾何均數(shù)、中位數(shù)一、算術(shù)均數(shù)算術(shù)均數(shù)簡稱均數(shù)(mean),描述一組同質(zhì)資料的平均水平??傮w均數(shù):樣本均數(shù):(一)計算方法

1.直接法:適用于樣本量較小的計量資料。2.加權(quán)法:適用于樣本量較大的計量資料。(二)均數(shù)的特性1.各觀察值與均數(shù)之差(離均差)的總和等于零,即2.各觀察值的離均差平方和最小,即(三)均數(shù)的應(yīng)用1.均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作為樣本的代表值與其他樣本進行比較。2.均數(shù)適用于描述單峰對稱分布,特別是正態(tài)或近似正態(tài)分布資料的集中趨勢。

二、幾何均數(shù)(geometricmean)(一)計算方法

1.直接法:適用于樣本量較小的計量資料?;?/p>

2.加權(quán)法:適用于樣本量較大的計量資料,如頻數(shù)表資料。(二)幾何均數(shù)的應(yīng)用注意事項

1.幾何均數(shù)常用于等比資料或?qū)?shù)正態(tài)分布資料,如血清抗體滴度、細菌計數(shù)等。2.觀察值中若有0或負值,則不宜直接使用幾何均數(shù)。3.觀察值一般不能同時有正值和負值。若全是負值,計算時可先將負號去掉,得出結(jié)果后再加上負號。三、中位數(shù)(median)中位數(shù)是將一組觀察值按大小順序排列后,位次居中的觀察值。(一)計算方法

1.直接法:適用于樣本量較小的計量資料。當為奇數(shù)時

當為偶數(shù)時

2.頻數(shù)表法(百分位數(shù)法):適用于樣本量較大的計量資料,如頻數(shù)表資料。

(二)中位數(shù)的應(yīng)用注意事項1.中位數(shù)可用于各種分布的資料。2.中位數(shù)不受極端值的影響,因此,實際工作中主要用于:(1)偏態(tài)分布資料(2)端點無確切值的資料(3)分布不明確的資料百分位數(shù)1.定義:百分位數(shù)(percentile)是指將觀察值從小到大排列后處于第x百分位置上的數(shù)值。用符號表示為,它是個位置指標。2.計算方法:

PX

X%(100-X)%

8010012029.81%64.40%第三節(jié)計量資料離散趨勢

的描述

X=M=4例1:甲:13457乙:44444

衡量變異程度(或離散程度)的指標分類:(按間距)—極差(R)和四分位數(shù)間距(Q)(按平均差距)—離均差平方和(SS)、方差(S2)、標準差(S)和變異系數(shù)(CV)公式:R=MAX-MIN性質(zhì):R大(?。┳儺惗却螅ㄐ。?/p>

一、極差和四分位數(shù)間距(一)極差(全距)(range)應(yīng)用:適用于任何分布的計量資料(端點無確切值者除外)優(yōu)點:簡單明了,應(yīng)用廣泛,如用于說明傳染病、食物中毒等的最短、最長潛伏期等。

缺點:a.除MAX和MIN外,不能反映組內(nèi)其它數(shù)據(jù)變異度。b.極差抽樣誤差大,受兩個極端值影響,不夠穩(wěn)定,通常只用于資料的粗略分析和小樣本數(shù)據(jù)。X=M=4例1:甲:14447乙:44444

R=6R=0例2:A26℃A2℃BB50℃

X=26℃X=M=6例3:甲:246810

乙:256710R=8百分位數(shù)1.定義:百分位數(shù)(percentile)是指將觀察值從小到大排列后處于第x百分位置上的數(shù)值。用符號表示為,它是個位置指標。2.計算方法:

0P25P50P75100%(二)四分位數(shù)間距(quartile,簡記為Q公式:性質(zhì):Q越大,說明數(shù)據(jù)的變異越大;反之,Q越小,說明變異越小。

應(yīng)用:適用于任何分布的計量資料,計算結(jié)果較穩(wěn)定,尤其適用于大樣本偏態(tài)分布資料。

Q=P75-P25特點:比極差穩(wěn)定,但仍未考慮到每個觀察值的變異度,在統(tǒng)計分析中應(yīng)用得不普遍。

(一)平均偏差(meandifference,簡記為M.D)公式:平均偏差=

二、離均差平方和、方差、標準差應(yīng)用:平均偏差是一個很直觀的變異量度,但由于用了絕對值,在數(shù)學上不便于繼續(xù)處理,使它在應(yīng)用上受到很大的限制,實際中很少使用。

(二)離均差平方和(SS)

公式:SS=

(三)方差(variance),方差有時也表示為MS方差計算公式:(1)總體方差:=

(2)樣本方差:

方差性質(zhì):方差越大說明數(shù)據(jù)的變異越大

自由度(degreeoffreedom,簡記為DF)(1)定義:隨機變量能自由取值的個數(shù)(2)計算公式:υ=n-限制條件個數(shù)

例:有一四個(n=4)數(shù)據(jù)樣本,受到的條件限制,在自由確定4,2,5三個數(shù)據(jù)后,第四個數(shù)只能是9,因而υ=n-1=3。

(四)標準差(standarddeviation)方差是用取平方后的單位來表示的,如果原始數(shù)據(jù)用毫米汞柱表示,則方差就是毫米汞柱的平方。在統(tǒng)計分析中為了方便,通常將方差取平方根,還原成與原始觀察值單位相同的變異量度。

計算公式

(1)總體標準差:(2)樣本標準差:直接法:

加權(quán)法(頻數(shù)表資料)性質(zhì):一組觀察值的標準差愈大說明其變異程度愈大;應(yīng)用:適合于正態(tài)分布或近似正態(tài)分布的資料。標準差與正態(tài)分布有明確的關(guān)系,它與均數(shù)結(jié)合能夠完整地概括一個正態(tài)分布。

式中x和

f

分別為各組段的組中值及出現(xiàn)的頻數(shù)。變異系數(shù)(coefficientofvariation,簡記為CV),又稱為離散系數(shù)(coefficientofdispersion)計算方法:

三、變異系數(shù)

應(yīng)用:a.比較度量衡單位不同的多組資料的變異程度。b.比較均數(shù)相差懸殊的多組資料的變異程度(如舒張壓和收縮壓;兒童身高與成人身高)。計算器(統(tǒng)計功能)的使用Casiofx-570ms型

開機:進入統(tǒng)計狀態(tài):清除內(nèi)存:

SHIFTONMODE1

SD

SclMODE=CLR1實例1:求1,3,5的算術(shù)平均數(shù),標準差和方差。

M+M+M+SHIFT5

X132=求出x=31SHIFT2

Xσn-1

求出s=2若接著按

x2

則可求出s2=4==

3實例2:加權(quán)法求算術(shù)平均數(shù),

標準差和方差。

組段組中值X頻數(shù)f0~2~4~6135567合計18

求出x=3.2222M+M+M+5131756SHIFT

=SHIFT,

;SHIFT,SHIFTSHIFT,

X

;23

Xσn-1求出s=1.6647若接著按

x2則可求出s2=2.7712SHIFT==2實例3:加權(quán)法求幾何均數(shù)

抗體滴度滴度倒數(shù)x頻數(shù)f1:41:81:161:321:641:1281:256481632641282564921201254合計

75M+M+M+log44………log2564SHIFT,

;SHIFTSHIFT,

;1SHIFT

=

X顯示1.43692若接著按logSHIFT10x=得到第四節(jié)正態(tài)分布及應(yīng)用

正態(tài)分布是最常見、最重要的一種連續(xù)型隨機變量的概率分布,它首先由德國數(shù)學家和天文學家德.莫阿弗爾(A.deMoivre,1667—1754)于1733年提出。德國數(shù)學家Gauss發(fā)現(xiàn)雖然稍晚,但他迅速將之應(yīng)用于天文學研究,使正態(tài)分布廣為人知,故正態(tài)分布又稱為Gauss分布.一、正態(tài)分布簡記為N(μ,σ2)1.正態(tài)分布的概率密度函數(shù):

如果隨機變量X的分布服從概率密度函數(shù)則稱X服從正態(tài)分布,記作X~N(μ,σ2),μ為X的總體均數(shù),σ2為總體方差

2.正態(tài)分布的圖形μ3.正態(tài)分布特征:正態(tài)密度函數(shù)曲線在橫軸上方均數(shù)處最高。正態(tài)分布以均數(shù)為中心,左右對稱。正態(tài)分布中的X取值范圍理論上沒有邊界。正態(tài)分布有兩個參數(shù),即位置參數(shù)μ和變異參數(shù)σ。當σ固定后,μ增大,曲線沿橫軸向

右移動.μ減小,曲線沿橫軸向左移動。當μ固定后,σ越大,曲線的形狀越“矮胖”,表示數(shù)據(jù)分布越分散;σ越小,曲線的形狀越“瘦高”,表示數(shù)據(jù)分布越集中。

正態(tài)曲線下的面積分布有一定的規(guī)律。欲求其一定區(qū)間的面積(頻數(shù)比例),則可通過對公式積分來實現(xiàn),即

正態(tài)分布曲線下的面積分布規(guī)律在(μ-σ,μ+σ)內(nèi)的面積約為68.27%;在(μ-1.96σ,μ+1.96σ)內(nèi)約為95.00%;在(μ-2.58σ,μ+2.58σ)內(nèi)約為99.00%.。二、標準正態(tài)分布標準正態(tài)分布(standardnormaldistribution)是總體均數(shù)為0、標準差為1的正態(tài)分布。簡記為N(0,1)1.標準正態(tài)分布的概率密度函數(shù):

正態(tài)分布是一個分布族,對應(yīng)于不同的參數(shù)μ和σ會產(chǎn)生不同位置、不同形狀的正態(tài)分布。為了應(yīng)用方便,令2.標準正態(tài)分布函數(shù):與φ(u)相對應(yīng)的曲線下面積分布函數(shù)為Φ(u),為曲線下自-∞到u的面積,表達式為:

根據(jù)公式可制成附表1,欲求一定區(qū)間標準正態(tài)分布曲線下的面積只需查表即可

且有Φ(u)=1-Φ(-u)

標準正態(tài)分布曲線下面積查表時注意事項:(1)(μ和σ已知)(2)(μ和σ未知)

以0為中心,左右兩側(cè)曲線下對稱于0的區(qū)間面積相等。

u0.000.050.060.07-2.0-1.7-1.6-1.2-1.0-0.3-0.20.02280.05480.11510.14690.40130.03920.3557三、正態(tài)分布的應(yīng)用(一)估計頻率分布(見例2.2)(二)確定醫(yī)學參考值范圍醫(yī)學參考值(medicalreferencevalue)是指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標常數(shù),也稱正常值。由于存在個體差異,生物醫(yī)學數(shù)據(jù)并而一定范圍內(nèi)波動,故采用醫(yī)學參考值范圍作為判定正常和異常的參考標準。

所謂的“正常人”不同于“健康人”,絕對健康是不存在的,而是指排除了影響被研究指標的疾病和有關(guān)因素的同質(zhì)人群。1.選擇足夠數(shù)量的正常人(或動物)作為參照樣本。一般認為至少應(yīng)在120例以上。例數(shù)過少,確定的參考值范圍往往不夠準確。2.對選定的正常人進行準確的測量

3.決定取單側(cè)范圍還是雙側(cè)范圍值。

醫(yī)學參考值范圍涉及到采用單側(cè)界值還是雙側(cè)界值的問題,這通常依據(jù)醫(yī)學專業(yè)知識而定例:肺活量〉下限甘油三酯,尿糖,尿鉛〈上限血清總膽固醇,紅(白)細胞數(shù)下限<X<上限4.選擇適當?shù)陌俜址秶?。所謂的“絕大多數(shù)”究竟是多少,取決于資料的性質(zhì)和研究的目的所規(guī)定的百分界限。最常用的百分界限是95%

若主要目的在減少假陽性(如用于確診病人),參考值范圍的百分數(shù)范圍要取大一些(如95%或99%);反之,若主要目的在減少假陰性(如用于初篩病人),百分數(shù)范圍可以小一些(如90%或80%)。例題P18-195.估計參考值范圍的界限(1)百分位數(shù)法應(yīng)用:適用于任何分布,特別是偏態(tài)分布的資料。公式:雙側(cè)1-α參考值范圍P100α/2~P100-100α/2

單側(cè)1-α

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論