第2講 定量資料的統(tǒng)計(jì)描述課件_第1頁(yè)
第2講 定量資料的統(tǒng)計(jì)描述課件_第2頁(yè)
第2講 定量資料的統(tǒng)計(jì)描述課件_第3頁(yè)
第2講 定量資料的統(tǒng)計(jì)描述課件_第4頁(yè)
第2講 定量資料的統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講定量資料的統(tǒng)計(jì)描述

楊土保教授博士中南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系2010-03-12第2講定量資料的統(tǒng)計(jì)描述主要內(nèi)容頻數(shù)分布表和頻數(shù)分布圖集中位置的描述離散程度的描述正態(tài)分布及其應(yīng)用第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布頻數(shù)與頻數(shù)分布頻數(shù):某個(gè)測(cè)量值的個(gè)(例)數(shù)。頻數(shù)分布表(frequencydistributiontable):又稱頻數(shù)表。是將原始數(shù)據(jù)值適當(dāng)分組后得到各組的頻數(shù),如表4-1頻數(shù)分布表。適用樣本量較大的資料進(jìn)行統(tǒng)計(jì)描述的常用方法。通過(guò)頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)??捎檬止ず陀?jì)算機(jī)軟件(如SAS、SPSS等)方便制作頻數(shù)表。第2講定量資料的統(tǒng)計(jì)描述

頻數(shù)分布表(frequencytable)

用途:用于描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類相同類別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)第2講定量資料的統(tǒng)計(jì)描述表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.19第2講定量資料的統(tǒng)計(jì)描述1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。第2講定量資料的統(tǒng)計(jì)描述(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。第2講定量資料的統(tǒng)計(jì)描述

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布離散型定量變量的頻數(shù)表

某市2005年進(jìn)行學(xué)生體質(zhì)評(píng)價(jià),抽樣調(diào)查了102名高中男生引體向上完成次數(shù)的情況,根據(jù)該資料制作頻數(shù)表。本次調(diào)查資料“引體向上完成次數(shù)”是離散型定量變量,所以按變量的取值(次數(shù))為單位分組,再列出各組的頻數(shù),如表4.1的第(1),(2)欄,就能得到相應(yīng)的頻數(shù)表。將各組的頻數(shù)除以總頻數(shù)所得的值稱為頻率,見(jiàn)第(3)欄。某組的累計(jì)頻數(shù)是該組與前面各組頻數(shù)之和,見(jiàn)第(4)欄。顯然,第一組的累計(jì)頻數(shù)等于其頻數(shù),最后一組的累計(jì)頻數(shù)等于總例數(shù);累計(jì)頻數(shù)除以總頻數(shù)所得的值稱為累計(jì)頻率,見(jiàn)第(5)欄。

第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布表4.12005年某市102名高中男生引體向上完成次數(shù)的頻數(shù)分布完成次數(shù)

頻數(shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合計(jì)102100.00——第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布例4.2

在某市2005年進(jìn)行的小學(xué)生體質(zhì)評(píng)價(jià)研究中,測(cè)定了120名9歲男孩的肺活量(L),資料如下,根據(jù)該資料制作頻數(shù)表。1.7061.3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.9892.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.3521.8321.4441.7371.4591.4501.7821.5551.6341.5082.3431.5091.7451.9531.7441.6951.7071.9011.8251.5972.3381.7081.7111.8561.6441.7161.9781.5341.9001.5951.6461.9051.6101.6141.4222.3012.1271.3481.3171.0621.8301.9801.5701.4951.8642.1702.0001.7051.8631.4242.0222.0681.5761.8331.6592.2121.3992.1281.5431.5621.3821.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735連續(xù)型定量變量的頻數(shù)表第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布手工編制表4.2步驟。(1)計(jì)算全距(range,R),也稱為極差

(2)確定組段數(shù)與組距:組段數(shù)一般可在10~15之間選擇。一般當(dāng)觀察值的個(gè)數(shù)n

在50以下時(shí)可分5到8組,n在50以上時(shí)可分9到15組,實(shí)際運(yùn)用時(shí)應(yīng)根據(jù)分析的要求,靈活確定組數(shù)。本例n為120,擬分11組。組距=上限-下限=R/(預(yù)計(jì)的組段數(shù))。本例如果預(yù)計(jì)取11個(gè)組段,則組距長(zhǎng)度可取0.130。兩端的組段應(yīng)分別包含最小值或最大值;(3)列表做出如表4.2的表格,將選好的組段順序地列在(1)列。按照“下限≤x<上限”的原則確定每一例數(shù)據(jù)x應(yīng)歸屬的組段。第2講定量資料的統(tǒng)計(jì)描述表4.2

2005年某市120名9歲男孩肺活量(L)頻數(shù)分布組段頻數(shù)(f)頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)(1)(2)(3)(4)(5)0.980~54.1754.171.110~54.17108.331.240~75.831714.171.370~1411.673125.831.500~1915.835041.671.630~2924.177965.831.760~1512.509478.331.890~1210.0010688.332.020~65.0011293.332.150~43.3311696.672.280~2.41043.33120100.00合計(jì)120100.00——表4.22005年某市120名9歲男孩肺活量(L)頻數(shù)分布第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布頻數(shù)分布圖:在表4.2的基礎(chǔ)上,可以繪制出圖4.1,稱為直方圖(頻率直方圖)。橫軸:男孩的肺活量縱軸:頻率密度,即頻率/組距(直條面積等于相應(yīng)組段的頻率)。在組距相等時(shí),直方圖中矩形直條的高度與相應(yīng)組段的頻率成正比。第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布圖4.12005年某市120名9歲男孩肺活量頻數(shù)分布

第2講定量資料的統(tǒng)計(jì)描述頻數(shù)與頻數(shù)分布對(duì)稱分布:頻數(shù)最多的組段在中央,圖4.1正偏峰分布:峰向左側(cè)偏移的分布,右側(cè)的組段數(shù)多于左側(cè),為右偏峰分布。圖4.2負(fù)偏峰分布:峰向右側(cè)偏移的分布,左側(cè)的組段數(shù)多于右側(cè),稱為左偏峰分布。圖4.3第2講定量資料的統(tǒng)計(jì)描述圖4.22004年我國(guó)麻疹患者的年齡分布

圖4.3

某市219名乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量評(píng)分的分布

第2講定量資料的統(tǒng)計(jì)描述第2講定量資料的統(tǒng)計(jì)描述頻數(shù)分布表和頻數(shù)分布圖的主要用途1.揭示頻數(shù)分布的特征

兩個(gè)重要特征:集中趨勢(shì)(centraltendency)和離散趨勢(shì)(dispersiontendency)。集中趨勢(shì)是指一組數(shù)據(jù)向某一個(gè)位置聚集或集中的傾向,離散程度則反映的是一組數(shù)據(jù)的分散性或變異度2.揭示頻數(shù)分布的類型

兩種類型:對(duì)稱型和不對(duì)稱型偏態(tài)分布:正偏態(tài)(positiveskew),負(fù)偏態(tài)(negativeskew),

用頻數(shù)分布表和頻數(shù)分布圖揭示頻數(shù)分布的類型和特征,便于選用適當(dāng)?shù)慕y(tǒng)計(jì)方法。

4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理3.便于發(fā)現(xiàn)一些特大或特小的可疑值*第2講定量資料的統(tǒng)計(jì)描述第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)集中位置(centraltendency)的描述

平均數(shù)(average)是描述定量變量集中位置的特征值,用來(lái)說(shuō)明數(shù)據(jù)的平均水平,它反映了一組資料的“一般”、“大多數(shù)”、“平常”等情況。平均數(shù)是一類統(tǒng)計(jì)指標(biāo)的統(tǒng)稱,在醫(yī)學(xué)領(lǐng)域中常用的平均數(shù)有算術(shù)均數(shù)(arithmeticmean)

、幾何均數(shù)(geometricmean)和中位數(shù)(median)

算術(shù)均數(shù):適合描述對(duì)稱分布資料的集中位置(也稱為平均水平)。其計(jì)算公式為

第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)1)直接計(jì)算法:計(jì)算公式為

式中X1,X2和Xn為所有觀察值,n為樣本含量,∑(希臘字母,讀作sigma)為求和的符號(hào)。例4.3利用例4.2的120名9歲男孩的肺活量資料,用直接法計(jì)算平均肺活量。

第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)測(cè)得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。算術(shù)均數(shù)=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075(U/L)第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)2)加權(quán)頻數(shù)表法:計(jì)算公式為加權(quán)均數(shù)直接法均數(shù)=1.672(L)f為權(quán)數(shù)第2講定量資料的統(tǒng)計(jì)描述均數(shù)的特性各觀察值與均數(shù)之差(離均差)的總和等于零。

各觀察值的離均差平方和最小。均數(shù)的應(yīng)用1.均數(shù)反映一組同質(zhì)觀察值的平均水平。2.均數(shù)適用于單峰對(duì)稱分布資料,特別是正態(tài)分布或近似正態(tài)分布的資料。

3.均數(shù)可用來(lái)描述正態(tài)分布的特征第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)幾何均數(shù)(geometricmean,G)

適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料。醫(yī)學(xué)研究中的某些資料如血清抗體滴度、細(xì)菌計(jì)數(shù)、體內(nèi)某些微量元素含量等,其特點(diǎn)是原始觀察值呈正偏態(tài)分布,但經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)或近似正態(tài)分布,或者其觀察值數(shù)值相差極大甚至達(dá)到不同數(shù)量級(jí),此時(shí)若計(jì)算均數(shù)則不能正確描述其集中位置,宜采用幾何均數(shù)(geometricmean)

。其計(jì)算公式為

第2講定量資料的統(tǒng)計(jì)描述幾何均數(shù)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

第2講定量資料的統(tǒng)計(jì)描述幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)第2講定量資料的統(tǒng)計(jì)描述2006年某市衛(wèi)生監(jiān)督所對(duì)33家商場(chǎng)空氣中的細(xì)菌密度(個(gè)/m3)進(jìn)行了監(jiān)測(cè),資料如下,試求其平均密度。109051282645119722028527216228741376945962564483013881106326724016453973715510710878015654598267713257413313112226664354124922629488

第2講定量資料的統(tǒng)計(jì)描述頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.00第2講定量資料的統(tǒng)計(jì)描述幾何均數(shù)的應(yīng)用1.幾何均數(shù)常用于變量值間呈倍數(shù)關(guān)系的偏態(tài)分布資料,特別是變量經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料。2.因?yàn)?不能取對(duì)數(shù),所以數(shù)據(jù)中若有0則不宜直接使用幾何均數(shù),此時(shí)可將所有觀察值加上一個(gè)常數(shù)k,使,計(jì)算出結(jié)果后再還原,即。

3.觀察值若同時(shí)有正、負(fù)值,可將所有觀察值加上一個(gè)常數(shù)k,使,計(jì)算出結(jié)果后再還原,即。觀察值若全是負(fù)值,計(jì)算時(shí)可先將負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。

第2講定量資料的統(tǒng)計(jì)描述中位數(shù)(median)

意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md

適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

第2講定量資料的統(tǒng)計(jì)描述中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20第2講定量資料的統(tǒng)計(jì)描述例

為研究燃煤型砷中毒患者體內(nèi)砷負(fù)荷狀況,某醫(yī)學(xué)院對(duì)17名燃煤型砷中毒患者進(jìn)行了發(fā)砷含量測(cè)定,結(jié)果為:1.61、1.91、2.24、2.24、2.30、2.60、2.84、3.15、3.33、3.75、3.75、3.75、3.81、4.42、6.42、6.42、14.76,試求其平均含量。

例7在前述17名燃煤型砷中毒患者發(fā)砷含量的基礎(chǔ)上,又測(cè)得1名燃煤型砷中毒患者的發(fā)砷含量為15.39,求這18名燃煤型砷中毒患者發(fā)砷含量的中位數(shù)。

第2講定量資料的統(tǒng)計(jì)描述百分位數(shù)法計(jì)算中位數(shù):頻數(shù)表資料百分位數(shù)的計(jì)算公式為

式中LX、iX和fX分別為第百分位數(shù)所在組段的下限、組距和頻數(shù),∑fL為小于各組段的累計(jì)頻數(shù),LX為總例數(shù)。即為中位數(shù)的計(jì)算公式第2講定量資料的統(tǒng)計(jì)描述頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md第2講定量資料的統(tǒng)計(jì)描述例

為研究乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量的狀況,某醫(yī)院對(duì)219名術(shù)后康復(fù)期乳腺癌患者進(jìn)行了生存質(zhì)量測(cè)定,結(jié)果如表4.4,求平均評(píng)分。評(píng)分頻數(shù)累計(jì)頻數(shù)累計(jì)頻率(%)0~220.9130~241.8340~373.2050~11188.2260~304821.9270~6311150.6880~6017178.0890~10048219100.00第2講定量資料的統(tǒng)計(jì)描述中位數(shù)的應(yīng)用1.中位數(shù)可用于各種分布的資料,在正態(tài)分布資料中,中位數(shù)等于均數(shù),在對(duì)數(shù)正態(tài)分布資料中,中位數(shù)等于幾何均數(shù)。

2.中位數(shù)不受極端值的影響,因此,實(shí)際工作中主要用于不對(duì)稱分布類型的資料、兩端無(wú)確切值或分布不明確的資料。

第2講定量資料的統(tǒng)計(jì)描述均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)

眾數(shù)(mode):原指總體中出現(xiàn)機(jī)會(huì)最高的數(shù)值。樣本眾數(shù)則是在樣本中出現(xiàn)次數(shù)最多的數(shù)值。

調(diào)和均數(shù)(harmonicmean,H):先求原始數(shù)據(jù)倒數(shù)的算術(shù)均數(shù)。該算術(shù)均數(shù)的倒數(shù)便稱為原數(shù)據(jù)的調(diào)和均數(shù)。第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)其計(jì)算公式為例接受某種處理的5只小鼠生存時(shí)間(分鐘)分別為49.1、60.8、63.3、63.6和63.6,試計(jì)算其調(diào)和均數(shù)。

第2講定量資料的統(tǒng)計(jì)描述小結(jié):

集中趨勢(shì)的描述——平均數(shù)

平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。

不同的分布使用不同的指標(biāo)

(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)第2講定量資料的統(tǒng)計(jì)描述描述離散趨勢(shì)的特征數(shù)

(變異(variation)指標(biāo))

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)離散程度的描述

例某醫(yī)學(xué)院用自編生存質(zhì)量量表測(cè)得三組同年齡、同性別中年知識(shí)分子的軀體功能維度得分,資料如下:甲組

88910111212乙組

56810121415丙組

125101518193組的例數(shù)都是7例,均數(shù)和中位數(shù)都是10分,但憑直觀就可以發(fā)現(xiàn)三組數(shù)據(jù)變異的程度是不相同的,這在分析資料時(shí)須加以考慮。

第2講定量資料的統(tǒng)計(jì)描述

盤編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬(wàn)/mm3)甲乙丙第2講定量資料的統(tǒng)計(jì)描述極差(Range)(全距)

1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。

優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。

缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)第2講定量資料的統(tǒng)計(jì)描述計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)

極差是最簡(jiǎn)單但又較粗略的變異指標(biāo),可用于各種分布的資料,但它只涉及兩個(gè)極端值,沒(méi)有利用全部數(shù)據(jù)的信息,不能反映組內(nèi)其他觀察值的變異。同時(shí)由于樣本含量較大時(shí)抽到極大值或極小值的可能性較大,也可能較大,故極差一般常用于描述單峰對(duì)稱分布小樣本資料的離散程度,或用于初步了解資料的變異程度;當(dāng)樣本含量相差較大時(shí),不宜用極差來(lái)比較資料的離散程度。

例4.10計(jì)算例4.9中三組中年知識(shí)分子軀體功能維度得分的極差:甲組

12-8=4乙組

15-5=10丙組

19-1=18

甲組數(shù)據(jù)離散程度最小,丙組數(shù)據(jù)離散程度最大,乙組居中。

第2講定量資料的統(tǒng)計(jì)描述百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:

(定義:P53)Q=P75-P25

四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px第2講定量資料的統(tǒng)計(jì)描述頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px第2講定量資料的統(tǒng)計(jì)描述P25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無(wú)確切值或分布不明確資料的離散程度

第2講定量資料的統(tǒng)計(jì)描述百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征第2講定量資料的統(tǒng)計(jì)描述定量變量的特征數(shù)3.方差方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。離均差:每一個(gè)變量值與均數(shù)的差值,離均差平方和(sumofsquares):離均差平方后相加得到的值方差:離均差平方和除以得到的值總體方差用表示第2講定量資料的統(tǒng)計(jì)描述第2講定量資料的統(tǒng)計(jì)描述樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。分母為n-1,稱為自由度(能自由取值的變量的個(gè)數(shù))。第2講定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。第2講定量資料的統(tǒng)計(jì)描述加權(quán)法

用于頻數(shù)表資料

例4.16

用加權(quán)法計(jì)算2005年某市120名9歲男孩肺活量的標(biāo)準(zhǔn)差,由表4.2資料計(jì)算組中值X

標(biāo)準(zhǔn)差是描述單峰對(duì)稱分布資料離散程度最常用的指標(biāo)。標(biāo)準(zhǔn)差大,表示觀察值之間變異程度大,即一組觀察值的分布較分散;標(biāo)準(zhǔn)差小,表示觀察值之間變異程度小,即一組觀察值的分布較集中。對(duì)于經(jīng)對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料,應(yīng)將原始觀察值取對(duì)數(shù)值后計(jì)算幾何標(biāo)準(zhǔn)差。

第2講定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的計(jì)算盤編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.91第2講定量資料的統(tǒng)計(jì)描述方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8第2講定量資料的統(tǒng)計(jì)描述5.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-13第2講定量資料的統(tǒng)計(jì)描述1.比較計(jì)量單位不同的幾組資料的離散程度例4.17某年某市城區(qū)120名5歲女孩身高均數(shù)為110.10cm,標(biāo)準(zhǔn)差為5.90cm;體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,比較身高與體重的離散程度。身高體重第2講定量資料的統(tǒng)計(jì)描述2.比較均數(shù)相差懸殊的幾組資料的離散程度例4.18某年某市城區(qū)120名5歲女孩體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,同年該地120名5個(gè)月女孩體重均數(shù)為7.37kg,標(biāo)準(zhǔn)差為0.77kg,比較其離散程度。

5歲女孩體重

5個(gè)月女孩體重第2講定量資料的統(tǒng)計(jì)描述變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距第2講定量資料的統(tǒng)計(jì)描述分布形態(tài)特征數(shù)描述分布形態(tài)的統(tǒng)計(jì)量:偏度系數(shù)與峰度系數(shù)。偏度系數(shù)

(coefficientofskewness,SKEW):理論上總體偏度系數(shù)為0時(shí),分布是對(duì)稱的;取正值時(shí),分布為負(fù)偏峰;取負(fù)值時(shí)分布為正偏峰。樣本偏度系數(shù)計(jì)算公式:

第2講定量資料的統(tǒng)計(jì)描述峰度系數(shù)(coefficientofkurtosis,KURT)

理論上,正態(tài)分布的總體峰度系數(shù)為0;取負(fù)值時(shí),其分布較正態(tài)分布的峰平闊;取正值時(shí),其分布較正態(tài)分布的峰尖峭。樣本峰度系數(shù)第2講定量資料的統(tǒng)計(jì)描述

1.正態(tài)分布的概念和特征如果隨機(jī)變量的分布服從概率密度函數(shù)正態(tài)分布及其應(yīng)用第2講定量資料的統(tǒng)計(jì)描述2.正態(tài)分布的圖形

正態(tài)分布曲線呈對(duì)稱的鐘形,在均數(shù)處最高,兩側(cè)不斷降低,逐漸與橫軸接近,但不會(huì)與橫軸相交,即以橫軸為漸近線。(3)正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)m和形態(tài)參數(shù)s。若固定s,改變m值,曲線沿著X軸平行移動(dòng),其形狀不變?nèi)艄潭╩,s越小,曲線越陡峭;反之,s越大,曲線越平坦

第2講定量資料的統(tǒng)計(jì)描述圖4.4概率密度曲線示意圖

第2講定量資料的統(tǒng)計(jì)描述圖4.5不同和的正態(tài)分布示意圖

第2講定量資料的統(tǒng)計(jì)描述圖4.5-1

正態(tài)分布形態(tài)變換示意圖

第2講定量資料的統(tǒng)計(jì)描述(4)正態(tài)曲線下的面積分布有一定的規(guī)律。第2講定量資料的統(tǒng)計(jì)描述①X軸與正態(tài)曲線所夾面積恒等于1或100%;

④區(qū)間的面積為99.00%。見(jiàn)圖4.6

第2講定量資料的統(tǒng)計(jì)描述圖4.6正態(tài)曲線面積分布示意圖

第2講定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)正態(tài)分布

正態(tài)分布是一個(gè)分布族,對(duì)應(yīng)于不同的參數(shù)m和s會(huì)產(chǎn)生不同位置、不同形狀的正態(tài)分布。

為了應(yīng)用方便,令

:

XZms-=

若X服從正態(tài)分布,經(jīng)此變換后,則Z就服從均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布N(0,1),稱為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)或Z分布,

第2講定量資料的統(tǒng)計(jì)描述圖4.7查表法求標(biāo)準(zhǔn)正態(tài)曲線下面積示意圖第2講定量資料的統(tǒng)計(jì)描述例4.19已知,,求標(biāo)準(zhǔn)正態(tài)曲線下范圍內(nèi)的面積。查附表2,得范圍內(nèi)面積,范圍內(nèi)面積,因此范圍內(nèi)的面積為

第2講定量資料的統(tǒng)計(jì)描述正態(tài)分布的應(yīng)用估計(jì)總體變量值的頻率分布

例4.21已知120名9歲男孩的肺活量,,欲估計(jì)該市肺活量介于1.200~1.500L范圍內(nèi)的9歲男孩的比例。

估計(jì)該市肺活量在1.200~1.500L范圍內(nèi)的9歲男孩的比例為22.39%。

第2講定量資料的統(tǒng)計(jì)描述

制定醫(yī)學(xué)參考值范圍參考值是具有明確背景資料的參考人群某項(xiàng)指標(biāo)的測(cè)定值,醫(yī)學(xué)參考值范圍(medicalreferencerange)指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標(biāo)觀察值的波動(dòng)范圍,一般在臨床上用作判定正常和異常的參考標(biāo)準(zhǔn)第2講定量資料的統(tǒng)計(jì)描述制定醫(yī)學(xué)參考值范圍的步驟和注意事項(xiàng)如下:確定觀察對(duì)象和抽取足夠的觀察單位

制定醫(yī)學(xué)參考值范圍中的所謂“正常人”不是指機(jī)體器官組織和功能都完全健康的人,而是指排除了影響所研究變量的疾病和有關(guān)因素的同質(zhì)人群。一般要求每組應(yīng)在100例以上,如果影響研究變量的因素較復(fù)雜,數(shù)據(jù)變異度大,還應(yīng)適當(dāng)增加樣本含量。

測(cè)定方法應(yīng)統(tǒng)一、準(zhǔn)確

決定是否分組制定參考值范圍

確定取雙側(cè)或單側(cè)參考值范圍范圍

選定適當(dāng)?shù)陌俜纸缦?/p>

第2講定量資料的統(tǒng)計(jì)描述

醫(yī)學(xué)參考值范圍涉及到采用單側(cè)界值還是雙側(cè)界值的問(wèn)題,這通常依據(jù)醫(yī)學(xué)專業(yè)知識(shí)而定。

雙側(cè)

:血清總膽固醇無(wú)論過(guò)低或過(guò)高均屬異常白細(xì)胞數(shù)無(wú)論過(guò)低或過(guò)高均屬異常單側(cè)

:血清轉(zhuǎn)氨酶僅過(guò)高異常肺活量?jī)H過(guò)低異常

第2講定量資料的統(tǒng)計(jì)描述

醫(yī)學(xué)參考值范圍有、、等,最常用的為。計(jì)算醫(yī)學(xué)參考值范圍的常用方法:正態(tài)分布法百分位數(shù)法第2講定量資料的統(tǒng)計(jì)描述二、方法1、正態(tài)分布法:許多生物醫(yī)學(xué)數(shù)據(jù)服從或近似服從正態(tài)分布,如同年齡同性別兒童的身高值、體重值,同性別健康成人的紅細(xì)胞數(shù)等;有些醫(yī)學(xué)資料雖然呈偏態(tài)分布,但若能通過(guò)適當(dāng)?shù)淖兞孔儞Q轉(zhuǎn)換為正態(tài)分布,也可采用正態(tài)分布法制定參考值范圍。適用:正態(tài)分布資料第2講定量資料的統(tǒng)計(jì)描述

表4.5參考值范圍的制定%正態(tài)分布法

百分位數(shù)法雙側(cè)單側(cè)

雙側(cè)單側(cè)只有下限只有上限

只有下限只有上限95

P2.5~P97.5P5P9599

P0.5~P99.5P1P99第2講定量資料的統(tǒng)計(jì)描述第2講定量資料的統(tǒng)計(jì)描述例4.22某地調(diào)查正常成年男子200人的紅細(xì)胞數(shù),,

,試估計(jì)該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍。

因紅細(xì)胞數(shù)過(guò)多或過(guò)少均屬異常,故按雙側(cè)估計(jì)該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍為:

該地正常成年男子紅細(xì)胞數(shù)的95%參考值范圍為54.52×1012/L~56.00×1012/L。

第2講定量資料的統(tǒng)計(jì)描述百分位數(shù)法適用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論