第二計(jì)量資料的統(tǒng)計(jì)描述_第1頁(yè)
第二計(jì)量資料的統(tǒng)計(jì)描述_第2頁(yè)
第二計(jì)量資料的統(tǒng)計(jì)描述_第3頁(yè)
第二計(jì)量資料的統(tǒng)計(jì)描述_第4頁(yè)
第二計(jì)量資料的統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

會(huì)計(jì)學(xué)1第二計(jì)量資料的統(tǒng)計(jì)描述

統(tǒng)計(jì)描述的意義

社會(huì)活動(dòng)看似雜亂無章,對(duì)個(gè)體來說有很多不確定性,但總體上都是服從一些統(tǒng)計(jì)規(guī)律的。醫(yī)學(xué)工作有很多數(shù)據(jù),統(tǒng)計(jì)學(xué)描述就是對(duì)這些數(shù)據(jù)進(jìn)行加工和提煉,找出規(guī)律、預(yù)測(cè)未知。統(tǒng)計(jì)描述是最簡(jiǎn)潔有力的語(yǔ)言。第1頁(yè)/共50頁(yè)

第二章計(jì)量資料的統(tǒng)計(jì)描述

概念:即用少量幾個(gè)統(tǒng)計(jì)指標(biāo)刻畫出原始數(shù)據(jù)的特征稱為統(tǒng)計(jì)描述。計(jì)量資料的統(tǒng)計(jì)描述方法:(單變量)1.通過頻數(shù)表描述數(shù)據(jù)特征

2.用統(tǒng)計(jì)指標(biāo)定量描述數(shù)據(jù)的特征。

第2頁(yè)/共50頁(yè)表100例高血壓患者治療后臨床記錄編號(hào)年齡性別治療組舒張壓體溫療效

X1

X2

X3

X4X5

X6137男A11.2737.5顯效

245女B12.5337.0有效

343男A10.9336.5有效

459女B14.6737.8無效

10054男B16.8037.6無效第3頁(yè)/共50頁(yè)

第一節(jié)頻數(shù)分布

一、頻數(shù)分布表頻數(shù)分布表:將變量值分為不同數(shù)量的組段,清點(diǎn)各組段的例數(shù)。意義:概括了解變量值在各組段的分布和規(guī)律。例:表2-1第4頁(yè)/共50頁(yè)例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇(mmol/L)的測(cè)量結(jié)果

2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.274.523.194.593.753.984.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.26第5頁(yè)/共50頁(yè)

計(jì)量資料頻數(shù)表的編制步驟例2-1數(shù)據(jù)

1.確定全距(R)=最大值—

最小值2.定組數(shù)(8-15組)和組距:例:3.36/10=0.336≈0.33.寫出組段的下限:第1組段值小于或等于最小變量值,并以整數(shù)(0,5或2,4,6,8)較好。如2.3~4.劃計(jì)并計(jì)數(shù):變量(x)歸為L(zhǎng)≤x<U(見表2-1)組距(i)=全距(R)/組數(shù)第6頁(yè)/共50頁(yè)表2-1101名正常成年女性血清總膽固醇頻數(shù)表

組段頻數(shù)(f)f(%)

2.3-11.02.6-33.02.9-66.03.2-88.03.5-1717.03.8-2020.04.1-1717.04.4-1212.04.7-99.05.0-55.05.3-22.05.6-5.911.0

合計(jì)101100.0第7頁(yè)/共50頁(yè)二頻數(shù)表及分布圖的用途1.通過頻數(shù)表了解數(shù)據(jù)的分布特征。

X值分布情況:偏態(tài)或正態(tài)分布取值情況:變量值取值范圍集中趨勢(shì):變量值集中位置。2.便于發(fā)現(xiàn)資料中的可疑值。3.組段的頻率作為概率的估計(jì)。第8頁(yè)/共50頁(yè)例:表2-1資料頻數(shù)分布圖—直方圖圖2-1

101名正常成年女性血清總膽固醇頻數(shù)分布

頻數(shù)血清總膽固醇正態(tài)分布第9頁(yè)/共50頁(yè)圖2-259名鏈球菌咽喉炎患者潛伏期正偏態(tài)分布第10頁(yè)/共50頁(yè)講義表2-4數(shù)據(jù)圖2-3負(fù)偏態(tài)分布第11頁(yè)/共50頁(yè)例:某院出院患者住院天數(shù)的頻數(shù)表組段(天)頻數(shù)(f)

0-65-2110-1415-1320-625-230-335-140及以上13合計(jì)79第12頁(yè)/共50頁(yè)

第二節(jié)集中趨勢(shì)的描述

平均數(shù)指標(biāo)的概念和作用概念:平均數(shù)表示一組同質(zhì)計(jì)量數(shù)據(jù)集中趨勢(shì)的位置和平均水平。作用:是一組計(jì)量數(shù)據(jù)平均水平的代表值;可作為不同組間的比較值。醫(yī)學(xué)中常用的平均數(shù)指標(biāo)有:算數(shù)均數(shù)、幾何均數(shù)、中位數(shù)第13頁(yè)/共50頁(yè)一、算術(shù)均數(shù)(mean)

簡(jiǎn)稱均數(shù),用表示.

公式適用頻數(shù)為正態(tài)或近似正態(tài)分布的計(jì)量資料.基本公式(2-1,2-2)加權(quán)法公式(例數(shù)多)適用條件第14頁(yè)/共50頁(yè)表2-1101名正常成年女性血清總膽固醇頻數(shù)表

組段頻數(shù)(f)組中值XfX

2.3-12.452.452.6-32.758.252.9-63.0518.303.2-83.35…

3.5-173.653.8-203.954.1-174.254.4-124.554.7-94.855.0-55.155.3-25.455.6-5.915.75

合計(jì)101——409.7第15頁(yè)/共50頁(yè)加權(quán)法公式計(jì)算頻數(shù)(f)作為X值的權(quán)數(shù)第16頁(yè)/共50頁(yè)二、幾何均數(shù)(Geometricmean)

適用條件:X值呈倍數(shù)增長(zhǎng)或部分?jǐn)?shù)據(jù)偏離過大偏態(tài)分布(正偏態(tài))資料。計(jì)算公式:直接法,例數(shù)較少用(2-3)加權(quán)法,(2-4)或第17頁(yè)/共50頁(yè)例2-4某地5例微絲蚴血癥患者治療7年后用間接熒光抗體試驗(yàn)測(cè)得其抗體滴度分別為1/10,1/20,1/40,1/80,1/160,求幾何均數(shù)。結(jié)論:平均抗體滴度為1:34(幾何均數(shù)法)第18頁(yè)/共50頁(yè)表2-569例RA患者血清EBV-lgG抗體測(cè)定結(jié)果

滴度倒數(shù)

X人數(shù)

flgXflgX1041.00004.00002031.30103.903040101.602116.021080101.903119.0310160112.204124.2451320152.505137.5765640142.806239.2868128023.10726.2144合計(jì)69150.2778第19頁(yè)/共50頁(yè)幾何均數(shù)計(jì)算例2-5:例數(shù)合計(jì)

結(jié)論:69例RA患者血清EBV-lgG抗體平均滴度為1:150.6

第20頁(yè)/共50頁(yè)三、中位數(shù)和百分位數(shù)(一)中位數(shù)(Median,

M):適用于描述偏態(tài)分布資料的平均水平。如潛伏期、病程資料。計(jì)算定義:將一組變量值由小到大依次排列,居以中間位次的觀察值即為中位數(shù),為這組數(shù)據(jù)的平均數(shù)。

X:5,5,6,7,20(d)位次12345第21頁(yè)/共50頁(yè)中位數(shù)的計(jì)算1.例數(shù)較少(公式2-5,2-6)n為偶數(shù)n為奇數(shù)中位數(shù)優(yōu)點(diǎn):不受數(shù)據(jù)中極大或極小值的影響,取決于中間位置的數(shù)。第22頁(yè)/共50頁(yè)(二)百分位數(shù)百分位數(shù)(percentile)是一種位置指標(biāo),用表示。例計(jì)算定義:將一組變量值由小到大依次排列,為第x百分位數(shù)的秩次,其對(duì)應(yīng)的變量值(x)為第x百分位數(shù),記為Px。X:15810……48….105秩次123450100x%1%2%3%4%50%100%一組數(shù)據(jù)(n=100),由小到大排列例:第23頁(yè)/共50頁(yè)百分位數(shù)計(jì)算方法1.直接法(不要求)將樣本值由小到大排隊(duì),用確定Px的位次和PX。當(dāng)為帶有小數(shù)位時(shí)用式2.7:當(dāng)為整數(shù)時(shí)用式2.8trunc(a)表示對(duì)數(shù)字取其整數(shù)。式2.8式2.7第24頁(yè)/共50頁(yè)例:8位患者某病的住院天數(shù):

22233456求50%位數(shù)和80%位數(shù)。解:第50%位次:nX%=8×0.5=4,用式2.8

中位數(shù)=P50=3(天)第80%位次:nX%=8×0.8=6.4,用公式2.7第25頁(yè)/共50頁(yè)2.頻數(shù)表法(例數(shù)較多)Lx:第X%位數(shù)所在組段的下限值ix:第X%位數(shù)所在組段的組距fx:第X%位數(shù)所在組段的頻數(shù):第X%位數(shù)所在組段上個(gè)組段的累計(jì)頻數(shù)式中:(2-9)第26頁(yè)/共50頁(yè)表2-5118名鏈球菌咽喉炎患者的潛伏期

天數(shù)人數(shù)累計(jì)頻數(shù)累計(jì)頻數(shù)%12~41-43.424~175-2117.836~3222-5344.948~2454-7765.360~189580.572~1210790.784~511294.996~411698.3108-2118100.0中位數(shù)所在組段第27頁(yè)/共50頁(yè)計(jì)算頻數(shù)表資料P25、P50和P951.計(jì)算x=25%和50%的位次2.按公式2-9計(jì)算Px第28頁(yè)/共50頁(yè)百分位數(shù)計(jì)算結(jié)果的應(yīng)用1.常計(jì)算P25、P50、P75、和P95,為臨床治療提供依據(jù)。例2-9:120名細(xì)菌性痢疾治愈的住院天數(shù)

P5=3.5(天),即只有5%的人住院低于3.5天。

P95=15(天)2.確定醫(yī)學(xué)指標(biāo)的參考值第29頁(yè)/共50頁(yè)如P25=39.2天P50=51天(中位數(shù))118名鏈球菌咽喉炎患者的潛伏期第30頁(yè)/共50頁(yè)第三節(jié)、離散趨勢(shì)的描述

描述計(jì)量資料數(shù)據(jù)間離散(變異)程度的指標(biāo)

—變異指標(biāo)第31頁(yè)/共50頁(yè)例2-11三組同齡男孩的身高(cm)

R

甲組909510010511010020乙組96981001021041008丙組96991001011041008

三組男孩身高值的變異一樣嗎?第32頁(yè)/共50頁(yè)三個(gè)指標(biāo)測(cè)定值分布變異不同變異的大小反映某組指標(biāo)的穩(wěn)定性第33頁(yè)/共50頁(yè)

幾個(gè)常用的變異指標(biāo)一、極差(Range):用(R)表示即R=最大值–

最小值意義:

R值越大,表示該組數(shù)據(jù)的變異越大。缺點(diǎn):數(shù)據(jù)利用不全,部分信息損失,在例數(shù)少時(shí)結(jié)果不穩(wěn)定。極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)第34頁(yè)/共50頁(yè)二、四分位數(shù)間距(quartilerange)

四分位數(shù)間距:常用QR表示常計(jì)算:QR=P75%-P25%

作為變異指標(biāo)比極差穩(wěn)定。常用于表示偏態(tài)分布資料的變異。例:QR=P75%-P25%=67.7-39.2=28.5天表示方法:Md(QR)

M=51天,(QR=28.5天)第35頁(yè)/共50頁(yè)

三、標(biāo)準(zhǔn)差和方差

(Standarddeviationandvariance)

公式總體方差(σ2)(2-11)(2-12)總體標(biāo)準(zhǔn)差(σ)樣本標(biāo)準(zhǔn)差(s)(2-13)第36頁(yè)/共50頁(yè)

標(biāo)準(zhǔn)差的簡(jiǎn)化計(jì)算公式:

(2-14)例數(shù)較少(2-15)頻數(shù)表資料第37頁(yè)/共50頁(yè)例2-11甲組5名同齡男孩的身高值(cm)

XX2908100959025100100001051102511012100

標(biāo)準(zhǔn)差的計(jì)算第38頁(yè)/共50頁(yè)表2-1101名正常女子血清膽固醇值組段(X)

頻數(shù)(f)fXfx22.30~2.4512.456.002.60~2.7538.2522.692.90~3.05618.3055.823.20~3.358…

….3.50~3.65173.80~3.95204.10~4.25174.40~4.55124.70~4.8595.00~5.1555.30~5.4525.6~5.751409.751705.09

合計(jì)101第39頁(yè)/共50頁(yè)統(tǒng)計(jì)描述:某地101名正常女子血清膽固醇值平均為4.06(mmol/L),標(biāo)準(zhǔn)差為0.654

(mmol/L)第40頁(yè)/共50頁(yè)例2-10三組同齡男孩的身高值(cm)

RS甲組9095100105110100207.91乙組969810010210410083.16丙組969910010110410082.92標(biāo)準(zhǔn)差的意義:

反映一組變量值變異程度,組間單位相同時(shí),S越小,表示數(shù)據(jù)的變異程度越小。第41頁(yè)/共50頁(yè)四、變異系數(shù)(CV)應(yīng)用:1.組間單位不同時(shí)變異程度的比較。

2.比較組單位相同,但均數(shù)相差懸殊的組間變異程度.意義:CV越大,表示數(shù)據(jù)變異越大。常用于衡量方法、儀器的精密度。公式:(2-16)第42頁(yè)/共50頁(yè)1.單位不同時(shí)組間變異程度的比較。

某地7歲年齡組男童身高與體重

指標(biāo)SCV(%)身高(cm)123.104.713.83體重(kg)22.292.2610.14結(jié)論:7歲年齡組男童身高與體重值指標(biāo)比較,體重指標(biāo)的變異大于身高指標(biāo)。第43頁(yè)/共50頁(yè)

某地不同年齡組男童身高(cm)年齡組SCV%1-2月56.32.13.735-6月66.52.23.313-3.5歲96.13.13.225-5.5歲107.83.33.06結(jié)論:隨著年齡增加,身高的變異變小。2.比較組單位相同,但均數(shù)相差懸殊的組間變異程度比較第44頁(yè)/共50頁(yè)計(jì)量數(shù)據(jù)的統(tǒng)計(jì)描述小結(jié)

1.在醫(yī)學(xué)雜志中正態(tài)或近似正態(tài)的資料,常以的形式表達(dá),描述和比較數(shù)據(jù)的平均水平和離散程度。

兩組患者年齡(歲)的比較組別n范圍值試

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論