版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章計(jì)量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)分布第二節(jié)集中趨勢的描述第三節(jié)離散趨勢的描述第四節(jié)正態(tài)分布第五節(jié)醫(yī)學(xué)參考值范圍的制定第二講計(jì)量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)分布
一、頻數(shù)分布表(frequencytable)
以表格的形式同時(shí)列出觀察指標(biāo)可能取值及其出現(xiàn)的頻數(shù)。
第二講計(jì)量資料的統(tǒng)計(jì)描述例2-1測得130名健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876第二講計(jì)量資料的統(tǒng)計(jì)描述(1)求極差(range):即最大值與最小值之差,又稱為全距。R=84–57=27(次/分)(2)決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個(gè)組。組距=極差/組數(shù),為方便計(jì),組距為極差的十分之一,再略加調(diào)整。27/10=2.7≈3
(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值。56~59~……80~83~85(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。頻數(shù)表的編制步驟第二講計(jì)量資料的統(tǒng)計(jì)描述表2-1130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f第二講計(jì)量資料的統(tǒng)計(jì)描述
二、頻數(shù)分布圖第二講計(jì)量資料的統(tǒng)計(jì)描述三、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類型(對稱分布、偏態(tài)分布)
(1)對稱分布:就是集中位置在中間,左右兩側(cè)頻數(shù)大體對稱。第二講計(jì)量資料的統(tǒng)計(jì)描述是否為對稱分布?第二講計(jì)量資料的統(tǒng)計(jì)描述(2)偏態(tài)分布:
1)正偏態(tài)分布(右偏態(tài)分布):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。
第二講計(jì)量資料的統(tǒng)計(jì)描述表2-2115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布
第二講計(jì)量資料的統(tǒng)計(jì)描述2)負(fù)偏態(tài)分布(左偏態(tài)分布):
左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。第二講計(jì)量資料的統(tǒng)計(jì)描述表2-3101名正常人的血清肌紅蛋白含量分布第二講計(jì)量資料的統(tǒng)計(jì)描述2.描述頻數(shù)分布的特征表2-1數(shù)據(jù)的頻數(shù)分布特征:①數(shù)據(jù)變異(離散)的范圍在57~84(次/分)②數(shù)據(jù)集中(平均)的組段在68~73(次/分)之間,尤以組段的人數(shù)71~(次/分)最多。且上下組段的頻數(shù)分布基本對稱。第二講計(jì)量資料的統(tǒng)計(jì)描述3.便于發(fā)現(xiàn)一些特大或特小的可疑值
4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二講計(jì)量資料的統(tǒng)計(jì)描述第二節(jié)集中趨勢的描述
統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:
算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)
第二講計(jì)量資料的統(tǒng)計(jì)描述一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)
可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。總體均數(shù)用μ
表示,樣本均數(shù)用表示。第二講計(jì)量資料的統(tǒng)計(jì)描述1、計(jì)算方法(1)直接計(jì)算法
公式:舉例:試計(jì)算4,4,4,6,6,8,8,8,10的均數(shù)?第二講計(jì)量資料的統(tǒng)計(jì)描述例2-1測得130健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876第二講計(jì)量資料的統(tǒng)計(jì)描述(2)加權(quán)法(利用頻數(shù)表):公式:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。第二講計(jì)量資料的統(tǒng)計(jì)描述表2-2130名健康成年男子脈搏(次/分)的頻數(shù)分布表N=∑f∑fX∑fX2第二講計(jì)量資料的統(tǒng)計(jì)描述2、應(yīng)用
均數(shù)適用于對稱分布,特別是正態(tài)分布資料。第二講計(jì)量資料的統(tǒng)計(jì)描述二、幾何均數(shù)(geometricmean)
可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。第二講計(jì)量資料的統(tǒng)計(jì)描述幾何均數(shù)(geometricmean)幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。
其他對數(shù)(如自然對數(shù))變換獲得相同的幾何均數(shù)第二講計(jì)量資料的統(tǒng)計(jì)描述例2-2有8份血清的抗體效價(jià)分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價(jià)。平均抗體效價(jià)為:1:57第二講計(jì)量資料的統(tǒng)計(jì)描述(2)加權(quán)法公式:第二講計(jì)量資料的統(tǒng)計(jì)描述
例2-369例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見表2-4第(1)、(2)欄,求其平均抗體滴度。第二講計(jì)量資料的統(tǒng)計(jì)描述2、應(yīng)用:
適用于成等比數(shù)列的資料,特別是服從對數(shù)正態(tài)分布資料。第二講計(jì)量資料的統(tǒng)計(jì)描述三、
中位數(shù)與百分位數(shù)11個(gè)大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?(一)中位數(shù)(median)是將每個(gè)變量值從小到大排列,位置居于中間的那個(gè)變量值。
第二講計(jì)量資料的統(tǒng)計(jì)描述計(jì)算公式:
n為奇數(shù)時(shí)
n為偶數(shù)時(shí)
第二講計(jì)量資料的統(tǒng)計(jì)描述例2-49名中學(xué)生甲型肝炎的潛伏期分別為12,13,14,14,15,16,16,17,19天,求其中位數(shù)。第二講計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表資料的中位數(shù)L為中位數(shù)所在組段的下限;i為頻數(shù)表中的組距;fm為中位數(shù)所在組段的頻數(shù);fL為中位數(shù)所在組段以前的累積頻數(shù)。第二講計(jì)量資料的統(tǒng)計(jì)描述例2-1頻數(shù)表中位數(shù)的計(jì)算N=∑f中位數(shù)=71+3x[(130x50%-59)/26]=71.69第二講計(jì)量資料的統(tǒng)計(jì)描述應(yīng)用①明顯偏態(tài)分布;②總體分布型不明的資料;
③開放型數(shù)據(jù)。第二講計(jì)量資料的統(tǒng)計(jì)描述
百分位數(shù)示意圖(二)百分位數(shù)(percentile)第二講計(jì)量資料的統(tǒng)計(jì)描述百分位數(shù):是一種位置指標(biāo),將數(shù)據(jù)從小到大排序后,位于x百分位置的數(shù)值,記為Px。它將全部數(shù)據(jù)分成兩部分,在不包括Px的數(shù)據(jù)中,有x%的數(shù)據(jù)小于Px
,有(100-x)%的數(shù)據(jù)大于Px。第二講計(jì)量資料的統(tǒng)計(jì)描述頻數(shù)表法
公式:
第二講計(jì)量資料的統(tǒng)計(jì)描述
當(dāng)時(shí),公式(2-9)即為中位數(shù)的計(jì)算公式第二講計(jì)量資料的統(tǒng)計(jì)描述
例2-5試分別求例2-1頻數(shù)表的第25、第75百分位數(shù)。P25=65+3/15[(130x25%-19)]=65.90P75=74+3/19[(130x75%-85)]=74.66第二講計(jì)量資料的統(tǒng)計(jì)描述
例2-6某市大氣中SO2的日平均濃度(μg/m3)見表2.5第(1)、(2)欄,分別求第25、75、95百分位數(shù)和中位數(shù)。
表2.5某市大氣中SO2日平均濃度的百分位數(shù)和中位數(shù)計(jì)算第二講計(jì)量資料的統(tǒng)計(jì)描述計(jì)算累計(jì)頻數(shù)及累計(jì)頻率,見第(3)、(4)欄;P25=50+25/67(361×25%-39)=69.12
P75=125+25/45(361×75%-233)=145.97P95=250+25/6(361×95%-341)=258.12
P50=M=100+25/63(361/2–170)=104.17第二講計(jì)量資料的統(tǒng)計(jì)描述
設(shè)有甲、乙、丙三名醫(yī)生,分別對相同的5份血樣進(jìn)行紅細(xì)胞計(jì)數(shù)(萬/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,見下圖2,三名醫(yī)生的計(jì)數(shù)結(jié)果得到的均數(shù)均為500,5個(gè)數(shù)值之和均為2500。第三節(jié)離散趨勢的描述甲醫(yī)生得出的5個(gè)觀察值間的差異(離散程度)較大,而丙醫(yī)生得出的5個(gè)觀察值間的差異(離散程度)較小。第二講計(jì)量資料的統(tǒng)計(jì)描述常用統(tǒng)計(jì)指標(biāo):極差、四分位數(shù)間距、方差和標(biāo)準(zhǔn)差、變異系數(shù)。一、極差(Range)
極差,用R表示:即一組變量值最大值與最小值之差。對于書中例2-1數(shù)據(jù),有簡單,但僅利用了兩端點(diǎn)值,穩(wěn)定性差。第二講計(jì)量資料的統(tǒng)計(jì)描述適用條件
該指標(biāo)適用于任何分布類型的資料。但因其只受兩側(cè)極端值的影響,故反映一組觀察值的變異程度時(shí)較粗糙。第二講計(jì)量資料的統(tǒng)計(jì)描述二、四分位數(shù)間距
(quartilerange)
四分位數(shù)間距,用Q表示:
Q=下四分位數(shù):上四分位數(shù):例2-1數(shù)據(jù)P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66第二講計(jì)量資料的統(tǒng)計(jì)描述適用條件
該指標(biāo)的適用條件同中位數(shù),而且通常與中位數(shù)(亦稱第50百分位數(shù))結(jié)合,全面描述偏態(tài)及不明分布資料的特征。應(yīng)用時(shí)需注意:當(dāng)樣本含量不夠大時(shí),該指標(biāo)不夠穩(wěn)定,故不宜選用。第二講計(jì)量資料的統(tǒng)計(jì)描述三、方差與標(biāo)準(zhǔn)差
1.方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。
總體方差
樣本方差
離均差平方和SS第二講計(jì)量資料的統(tǒng)計(jì)描述
2.
公式:
樣本標(biāo)準(zhǔn)差用表示,其度量單位與均數(shù)一致,所以最常用。公式:ν:自由度第二講計(jì)量資料的統(tǒng)計(jì)描述
標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為適用于描述對稱分布資料的離散趨勢。第二講計(jì)量資料的統(tǒng)計(jì)描述例2-7對例2-1的前10個(gè)數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計(jì)算標(biāo)準(zhǔn)差。第二講計(jì)量資料的統(tǒng)計(jì)描述例2-8
利用表2-2中的數(shù)據(jù)和頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差。N=∑f∑fX∑fX2第二講計(jì)量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的意義和用途說明資料的離散趨勢(或變異程度),標(biāo)準(zhǔn)差的值越大,說明變異程度越大,均數(shù)的代表性越差。標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報(bào)告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來描述資料的集中趨勢與離散趨勢。用于計(jì)算變異系數(shù)。用于計(jì)算標(biāo)準(zhǔn)誤。結(jié)合均值與正態(tài)分布的規(guī)律,估計(jì)參考值的范圍。第二講計(jì)量資料的統(tǒng)計(jì)描述四、變異系數(shù)
變異系數(shù)(coefficientofvariation,CV)常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。第二講計(jì)量資料的統(tǒng)計(jì)描述與其他四個(gè)指標(biāo)的不同之處描述的不是數(shù)據(jù)分布的絕對離散程度,而是相對離散程度無單位第二講計(jì)量資料的統(tǒng)計(jì)描述
某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,
比較其變異度?
第二講計(jì)量資料的統(tǒng)計(jì)描述第四節(jié)正態(tài)分布第二講計(jì)量資料的統(tǒng)計(jì)描述
一、正態(tài)分布的概念和特征
1.正態(tài)分布曲線的數(shù)學(xué)表達(dá)式(概率密度函數(shù),probabilitydensityfunction,pdf
)
,第二講計(jì)量資料的統(tǒng)計(jì)描述正態(tài)分布的概念正態(tài)分布(normaldistribution),又稱高斯分布,是醫(yī)學(xué)和生物界最常見的分布。該分布是以均數(shù)為中心,低于均數(shù)的頻數(shù)與高于均數(shù)的頻數(shù)大致相等,越接近均數(shù),頻數(shù)越多,離均數(shù)越遠(yuǎn),頻數(shù)逐漸減少,形成以均數(shù)為中心兩側(cè)基本對稱的鐘型分布。這種資料在臨床中很常見,稱為正態(tài)分布。用N(μ,σ2)表示。第二講計(jì)量資料的統(tǒng)計(jì)描述2.正態(tài)分布的特征
正態(tài)曲線下面積分布有一定的規(guī)律,總面積=1。第二講計(jì)量資料的統(tǒng)計(jì)描述第二講計(jì)量資料的統(tǒng)計(jì)描述累積面積可通過對概率密度函數(shù)f(X)積分求得(累積)分布函數(shù):第二講計(jì)量資料的統(tǒng)計(jì)描述圖2-7正態(tài)曲線面積分布示意圖
第二講計(jì)量資料的統(tǒng)計(jì)描述3.正態(tài)分布的應(yīng)用1、正態(tài)分布是很多統(tǒng)計(jì)方法的理論基礎(chǔ):
后面要討論到的χ2分布、t分布、F分布等都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的。某些分布,如t分布、二項(xiàng)分布、Poisson分布等的極限均為正態(tài)分布,在一定條件下,均可按正態(tài)近似的原理來處理。2、制作質(zhì)量控制圖
利用正態(tài)分布規(guī)律檢查和確認(rèn)可疑值的性質(zhì)。正常波動(dòng)或系統(tǒng)誤差。3、估計(jì)醫(yī)學(xué)參考值范圍第二講計(jì)量資料的統(tǒng)計(jì)描述二、標(biāo)準(zhǔn)正態(tài)分布第二講計(jì)量資料的統(tǒng)計(jì)描述第二講計(jì)量資料的統(tǒng)計(jì)描述例2-1的130名健康成年男子脈搏資料的均數(shù)、標(biāo)準(zhǔn)差分別為:71.32與5.80(次/分);問在正態(tài)分布假下,脈搏在65~75(次/分)之間有多少人?第二講計(jì)量資料的統(tǒng)計(jì)描述
正態(tài)分布
標(biāo)準(zhǔn)正態(tài)分布第二講計(jì)量資料的統(tǒng)計(jì)描述第五節(jié)醫(yī)學(xué)參考值范圍的制定第二講計(jì)量資料的統(tǒng)計(jì)描述
1.定義:醫(yī)學(xué)參考值范圍(referencerange)是指特定的“正?!比巳旱慕馄省⑸?、生化、免疫等各種數(shù)據(jù)的波動(dòng)范圍。習(xí)慣上取95%該人群的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版門頭裝修工程環(huán)保檢測與評估合同4篇
- 2024年09月河南2024中原銀行信陽分行秋季校園招考筆試歷年參考題庫附帶答案詳解
- 2025年度創(chuàng)新型民間借款擔(dān)保人責(zé)任保險(xiǎn)合同樣本4篇
- 2024年09月河北2024年國家開發(fā)銀行河北分行校園招考筆試歷年參考題庫附帶答案詳解
- 2024離婚財(cái)產(chǎn)分割見證服務(wù)合同
- 2024年09月江蘇浙江泰隆商業(yè)銀行社會(huì)招考(927)筆試歷年參考題庫附帶答案詳解
- 2024年09月江蘇2024年寧波銀行無錫分行校園招考筆試歷年參考題庫附帶答案詳解
- 2024年09月新疆2024年中國光大銀行烏魯木齊分行秋季校園招考筆試歷年參考題庫附帶答案詳解
- 2024年09月2024年徽商銀行六安分行校園招考筆試歷年參考題庫附帶答案詳解
- 2025年度個(gè)人勞務(wù)合同(項(xiàng)目管理專家范本)2篇
- 中國華能集團(tuán)公司風(fēng)力發(fā)電場運(yùn)行導(dǎo)則(馬晉輝20231.1.13)
- 中考語文非連續(xù)性文本閱讀10篇專項(xiàng)練習(xí)及答案
- 2022-2023學(xué)年度六年級數(shù)學(xué)(上冊)寒假作業(yè)【每日一練】
- 法人不承擔(dān)責(zé)任協(xié)議書(3篇)
- 電工工具報(bào)價(jià)單
- 反歧視程序文件
- 油氣藏類型、典型的相圖特征和識(shí)別實(shí)例
- 流體靜力學(xué)課件
- 顧客忠誠度論文
- 實(shí)驗(yàn)室安全檢查自查表
- 證券公司績效考核管理辦法
評論
0/150
提交評論