變異程度的統(tǒng)計描述_第1頁
變異程度的統(tǒng)計描述_第2頁
變異程度的統(tǒng)計描述_第3頁
變異程度的統(tǒng)計描述_第4頁
變異程度的統(tǒng)計描述_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

變異程度的統(tǒng)計描述第一頁,共六十五頁,2022年,8月28日掌握:描述數(shù)據(jù)分布離散趨勢的指標;正態(tài)分布的概念和特征、標準正態(tài)分布下面積分布規(guī)律。熟悉:醫(yī)學(xué)參考值范圍的意義和計算;了解:正態(tài)分布表、正態(tài)分布的應(yīng)用。學(xué)習(xí)目的和要求第二頁,共六十五頁,2022年,8月28日描述數(shù)值變量資料的分布特征必須從集中趨勢和離散趨勢兩方面來進行,缺一不可。例:三組同年齡女大學(xué)生體重(kg)如下,試分析其分布特征。

甲組4648515357=51

乙組4447525557=51

丙組4549505556=51R=11R=13R=11第三頁,共六十五頁,2022年,8月28日一、極差和四分位數(shù)間距(一)極差(range)R,也稱全距。例:甲、乙兩人高血壓患者測量5天的收縮壓(mmHg)得:甲162145178142186=162.6乙164160163159166=162.4第一節(jié)衡量變異程度的指標

R甲=186-142=44R乙=166-159=7第四頁,共六十五頁,2022年,8月28日四分位數(shù)間距(quartileinterval,Q)就是上四分位數(shù)QU(即P75)與下四分位數(shù)間距QL(即P25)之差。其間包含了全部觀察值的一半,單位與原觀察值相同。四分位數(shù)間距越大,則數(shù)據(jù)的變異度越大;反之,說明變異度越小。(二)四分位數(shù)間距(quartile)Q第五頁,共六十五頁,2022年,8月28日

0255075100四分位數(shù)間距與中位數(shù)一起可全面描述偏態(tài)分布資料的分布特征。Q=135.7-63.2=72.5(mg/dl)第六頁,共六十五頁,2022年,8月28日例2.4某地630名正常女性血清甘油三酯含量的頻數(shù)表甘油三酯(mg/dl)頻數(shù)累積頻數(shù)累積頻率(1)(2)(3)(4)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630--第七頁,共六十五頁,2022年,8月28日(一)平均偏差(meandifference)

二、離均差平方和、方差、標準差和變異系數(shù)第八頁,共六十五頁,2022年,8月28日例:對甲乙兩名高血壓患者連續(xù)觀察5天,測得的收縮圧分別為:甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4甲患者的血壓波動較乙患者大。第九頁,共六十五頁,2022年,8月28日平均偏差是一個很直觀的變異度量,但由于使用了絕對值,在數(shù)學(xué)上不便于繼續(xù)處理,使它在應(yīng)用上受到很大的限制,實際中很少使用。為了克服平均偏差使用絕對值不便進一步運算的缺點,可以不通過取絕對值,而是通過取平方來避免正負抵消,即使用離均差平方和。第十頁,共六十五頁,2022年,8月28日(二)離均差平方和(sumofsquare,SS)第十一頁,共六十五頁,2022年,8月28日(三)方差與標準差(variance,standarddeviation,S或SD)N-1稱自由度Degreeoffreedom第十二頁,共六十五頁,2022年,8月28日第十三頁,共六十五頁,2022年,8月28日例3.1對甲乙兩名高血壓患者連續(xù)觀察5天,測得的收縮壓分別為:甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4甲患者:ΣX=162+145+178+142+186=813

ΣX2=1622+1452+...+1862=133713甲乙第十四頁,共六十五頁,2022年,8月28日大樣本頻數(shù)表資料可用下列公式計算標準差:第十五頁,共六十五頁,2022年,8月28日例3.2根據(jù)第2章表2-2資料計算其標準差紅細胞數(shù)組中值(x)頻數(shù)(f)fxfx2

(1)(2)(3)(4)=(2)(3)(5)=(2)(4)3.80~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.88.....5.80~5.9015.9034.81

合計140669.803224.20(×1012/L)第十六頁,共六十五頁,2022年,8月28日在所有的變異指標中,標準差或方差是其它變異指標所不能比擬的。標準差能夠直接用于代數(shù)運算,如根據(jù)來自總體的幾個樣本的標準差可以直接求得合并樣本的標準差,而不必根據(jù)合并樣本重新計算。第十七頁,共六十五頁,2022年,8月28日計量資料的主要描述性指標及其適用條件主要指標適用條件

、s

對稱分布、正態(tài)或近似正態(tài)分布資料G、lg-1Slgx

等比級數(shù)或?qū)?shù)正態(tài)分布資料

M、Q

偏態(tài)分布、分布不明或分布末端無確

定值的資料

第十八頁,共六十五頁,2022年,8月28日用標準差比較兩個樣本的變異程度時需注意:1.兩組數(shù)據(jù)的均數(shù)相差不大2.單位相同(標準差使用的度量衡單位與原始數(shù)據(jù)相同)第十九頁,共六十五頁,2022年,8月28日(五)變異系數(shù)(coefficientofvariation,CV)例3.3已知:舒張壓均數(shù)為77.5標準差為10.7收縮壓均數(shù)為122.9標準差為17.1舒張壓

可見兩種指標的變異度幾乎沒有什么差別。收縮壓第二十頁,共六十五頁,2022年,8月28日例7.10某地調(diào)查110名20男大學(xué)生,其身高均數(shù)為172.73cm,標準差為4.09cm;其體重均數(shù)為55.04kg,標準差為4.10kg,試比較兩者變異程度。身高體重第二十一頁,共六十五頁,2022年,8月28日指高峰位于中央(均數(shù)所在處)、兩測逐漸降低且左右對稱、不與橫軸相交的光滑的曲線。以某地140名正常男子紅細胞數(shù)資料為例:第二節(jié)正態(tài)分布及其應(yīng)用正態(tài)分布曲線:第二十二頁,共六十五頁,2022年,8月28日表2-2某地140名正常男子紅細胞數(shù)的頻數(shù)表紅細胞數(shù)劃記組中值頻數(shù)頻率(1)(2)(3)(4)(5)3.80~T3.9021.44.00~正一4.1064.34.20~正正一4.30117.94.40~正正正正正4.502517.94.60~正正正正正正T4.703222.94.80~正正正正正T4.902719.35.00~正正正T5.101712.15.20~正正T5.30139.35.40~5.5042.95.60~T5.7021.45.80~6.00一5.9010.7第二十三頁,共六十五頁,2022年,8月28日第二十四頁,共六十五頁,2022年,8月28日若橫坐標為紅細胞數(shù)(變量值X),第i組的組距和人數(shù)分別用△Xi和fi表示,則在(X,X+△Xi)區(qū)間內(nèi)每單位紅細胞數(shù)的頻率為:

f(X)稱作密度函數(shù)

將前圖表示人數(shù)的縱坐標換成f(X)后可以得到下圖:第二十五頁,共六十五頁,2022年,8月28日矩形面積等于紅細胞在這一區(qū)間內(nèi)出現(xiàn)的頻率第二十六頁,共六十五頁,2022年,8月28日第二十七頁,共六十五頁,2022年,8月28日第二十八頁,共六十五頁,2022年,8月28日第二十九頁,共六十五頁,2022年,8月28日正態(tài)分布的密度函數(shù):

在μ

和σ

未知的情況下,可用和S作為μ和σ

的估計值。-∝<x<∝第三十頁,共六十五頁,2022年,8月28日正態(tài)分布的幾個特征以均值μ為中心,左右對稱曲線下的面積集中在以均數(shù)為中心的部分,越遠離中心,曲線下面積越小。正態(tài)曲線下面積分布有一定規(guī)律:范圍內(nèi)的面積為68.3%范圍內(nèi)的面積為95.0%范圍內(nèi)的面積為99.0%正態(tài)分布有兩個參數(shù),μ和σ第三十一頁,共六十五頁,2022年,8月28日第三十二頁,共六十五頁,2022年,8月28日第三十三頁,共六十五頁,2022年,8月28日第三十四頁,共六十五頁,2022年,8月28日二、標準正態(tài)分布(Standardnormaldistribution)是均數(shù)為0,標準差為1的正態(tài)分布。對任何參數(shù)μ和σ的正態(tài)分布,都可以通過一個簡單的變量變化轉(zhuǎn)成標準正態(tài)分布,即第三十五頁,共六十五頁,2022年,8月28日標準正態(tài)分布的密度函數(shù)-<u<分布函數(shù)求標準正態(tài)曲線下的面積。標準正態(tài)分布的分布函數(shù)當(dāng)均數(shù)為0,標準差為1時第三十六頁,共六十五頁,2022年,8月28日第三十七頁,共六十五頁,2022年,8月28日第三十八頁,共六十五頁,2022年,8月28日

例如:成年男子紅細胞數(shù)近似服從正態(tài)分布,均數(shù)為4.78(×1012/L),標準差為0.38(×1012/L)。現(xiàn)想知道紅細胞數(shù)在4×

1012/L以下所占的比例?一旦完成了這種變換,就可以利用標準正態(tài)分布表求出與原始變量X有關(guān)的概率值??梢韵葘⒆儞Q為相應(yīng)的u值,即:第三十九頁,共六十五頁,2022年,8月28日例:已知均數(shù)為4.78,標準差為0.38

查附表1(P194),標準正態(tài)曲線下左側(cè)尾部面積,得Φ(-2.05)=0.0202,即在4×1012/L以下者占總?cè)藬?shù)的2.02%。第四十頁,共六十五頁,2022年,8月28日若需要求出在4×1012/L~5.5×1012/L范圍內(nèi)所占的比例,可以通過下面計算獲得??傮w平均數(shù)總體標準差即在4×1012/L~5.5×1012/L范圍內(nèi)占總?cè)藬?shù)的95.04%。第四十一頁,共六十五頁,2022年,8月28日例:成年男子紅細胞數(shù)近似服從正態(tài)分布,均數(shù)為4.78(×1012/L)標準差為0.38(×1012/L),現(xiàn)想知道紅細胞數(shù)在4×1012/L~5.5×1012/L范圍內(nèi)所占的比例。第一步:進行U變換第四十二頁,共六十五頁,2022年,8月28日第二步:查附表1,標準正態(tài)分布曲線下面積。Φ(-2.05)=0.0202Φ(-1.89)=0.0294(1.89查不到)第四十三頁,共六十五頁,2022年,8月28日第四十四頁,共六十五頁,2022年,8月28日正態(tài)分布的應(yīng)用是各種統(tǒng)計推斷方法的理論基礎(chǔ)可進行醫(yī)學(xué)參考值范圍的估計可進行誤差分析和檢測的質(zhì)量控制第四十五頁,共六十五頁,2022年,8月28日第三節(jié)醫(yī)學(xué)參考值范圍醫(yī)學(xué)參考值范圍(refrencevaluerange)又稱正常值范圍(normalrange)。指正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。一、醫(yī)學(xué)參考值范圍的概念第四十六頁,共六十五頁,2022年,8月28日1、臨床實踐:著眼于個體,作為劃分正常人與異常人的界線。2、預(yù)防醫(yī)學(xué)實踐:著眼于群體,如評價兒童的發(fā)育水平。參考值范圍的應(yīng)用:第四十七頁,共六十五頁,2022年,8月28日二、醫(yī)學(xué)參考值范圍的制定方法1.選擇足夠數(shù)量的正常人作為參照樣本2.對選定的正常人進行準確的測定3.決定取單側(cè)范圍還是雙側(cè)范圍值4.選擇適當(dāng)?shù)陌俜址秶?.選擇適當(dāng)?shù)姆椒ü烙媴⒖贾捣秶慕缦薜谒氖隧摚擦屙摚?022年,8月28日第四十九頁,共六十五頁,2022年,8月28日青光眼病人和正常人眼內(nèi)壓分布圖

受檢人數(shù)正常人患者14161820222426283032343638眼內(nèi)壓重疊區(qū)若將眼內(nèi)壓的陽性診斷標準定為22mmHg,所有患者均被判為陽性。但是,眼內(nèi)壓在22-26mmHg之間的正常人被誤判為陽性(假陽性),造成誤診。若將眼內(nèi)壓的陽性診斷標準定為26mmHg,所有的正常人均被判為陰性。但是,眼內(nèi)壓在22-26mmHg之間的患者被誤判為陰性(假陰性),造成漏診。第五十頁,共六十五頁,2022年,8月28日表3-2參考值范圍所對應(yīng)的百分位數(shù)百分范圍(%)單側(cè)雙側(cè)(對稱)下限上限下限上限

95P5P95P2.5P97.599P1P99P0.5P99.5

表3-3參考值范圍所對應(yīng)的正態(tài)分布區(qū)間百分范圍(%)單側(cè)雙側(cè)(對稱)下限上限下限上限

95-1.645s+1.645s-1.96s+1.96s99-2.33s+2.33s-2.58s+2.58s

第五十一頁,共六十五頁,2022年,8月28日醫(yī)學(xué)參考值計算方法1.正態(tài)分布法適用于正態(tài)或近似正態(tài)分布資料

雙側(cè)界值:單側(cè)上界:單側(cè)下界:

第五十二頁,共六十五頁,2022年,8月28日求:該地成年男子紅細胞數(shù)的95%參考值范圍。

下限:

上限:例:已知第五十三頁,共六十五頁,2022年,8月28日2.對數(shù)正態(tài)分布法適用于對數(shù)正態(tài)分布資料雙側(cè)界值:單側(cè)上界:單側(cè)下界:3.百分位數(shù)法常用于偏態(tài)分布資料

雙側(cè)界值:P2.5和P97.5

單側(cè)上界:P95

單側(cè)下界:P5例:第二章表2-4資料。估計血清甘油三酯含量的95%單側(cè)參考值范圍第五十四頁,共六十五頁,2022年,8月28日例2.4某地630名正常女性血清甘油三酯含量的頻數(shù)表甘油三酯(mmol/L)

頻數(shù)累積頻數(shù)累積頻率(1)(2)(3)(4)

0.10~27274.3

0.40~16919631.1

0.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合計630--第五十五頁,共六十五頁,2022年,8月28日第五十六頁,共六十五頁,2022年,8月28日不同方法比較:正態(tài)分布法:資料必須服從正態(tài)或近似正態(tài)分布。特點:是結(jié)果比較穩(wěn)定,在樣本含量不是很大的情況下(n<100)仍然能夠處理;百分位數(shù)法:不符合正態(tài)分布法或?qū)?shù)正態(tài)分布法的資料。特點:適用范圍較廣,故在實際中較為常用。但因兩端數(shù)據(jù)波動較大,使用百分位數(shù)法必須有較大樣本含量,否則結(jié)果不穩(wěn)定。第五十七頁,共六十五頁,2022年,8月28日例8-11某年某市調(diào)查了200例正常成人血鉛含量(g/100g)如下,試估計該市成人血鉛含量95%醫(yī)學(xué)參考值范圍。

第五十八頁,共六十五頁,2022年,8月28日200個血鉛測量值第五十九頁,共六十五頁,2022年,8月28日組段頻數(shù)f

3~368~3913~4718~2023~1828~1633~338~743~148~153~158~621

200名血鉛頻數(shù)表第六十頁,共六十五頁,2022年,8月28日組段頻數(shù)f累計頻數(shù)f累計頻率(%)3~363618.08~397537.513~4712261.018~2015276.023~1817085.028~1618693.033~318994.538~719698.043~119798.548~119899.053~119999.558~621200100.0

200名血鉛頻數(shù)表及P95計算表第六十一頁,共六十五頁,2022年,8月28日求95%的單側(cè)上界:第六十二頁,共六十五頁,2022年,8月28日對數(shù)組段頻數(shù)f組中值(lgX)flgXf(lgX)20.45~10.50.50.250.55~50.63.01.800.65~100.77.04.900.75~

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論