第二章定量數(shù)據(jù)的統(tǒng)計描述_第1頁
第二章定量數(shù)據(jù)的統(tǒng)計描述_第2頁
第二章定量數(shù)據(jù)的統(tǒng)計描述_第3頁
第二章定量數(shù)據(jù)的統(tǒng)計描述_第4頁
第二章定量數(shù)據(jù)的統(tǒng)計描述_第5頁
已閱讀5頁,還剩109頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第二章第二章定量數(shù)據(jù)的統(tǒng)計描述定量數(shù)據(jù)的統(tǒng)計描述【例例2-1】2006年某市年某市120名名10歲男孩的身高歲男孩的身高(cm)資料如下資料如下135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141

2、.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 14

3、1.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5 【問題問題2-1】該資料為何種類型資料?該資料為何種類型資料?如何對該資料進行描述?如何對該資料進行描述?第一節(jié)第一節(jié) 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖第二節(jié)第二節(jié) 集中趨勢的描述集中趨勢的描述第三節(jié)第三節(jié) 離散趨勢的離散趨勢的描述描述第四節(jié)

4、第四節(jié) 正態(tài)分布及其應用正態(tài)分布及其應用頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖由于個體變異的存在,醫(yī)學研究中某指標在各個由于個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。將原始數(shù)據(jù)按照一定的標準劃分為若干個組,合將原始數(shù)據(jù)按照一定的標準劃分為若干個組,合計各組的頻數(shù),得到頻數(shù)分布表;也可再將頻數(shù)計各組的頻數(shù),得到頻數(shù)分布表;也可再將頻數(shù)表繪制成頻數(shù)分布圖表繪制成頻數(shù)分布圖。頻數(shù)頻數(shù)(frequency):一組資料中各觀察值或

5、不:一組資料中各觀察值或不同組段內(nèi)觀察值出現(xiàn)的頻繁程度(次數(shù))同組段內(nèi)觀察值出現(xiàn)的頻繁程度(次數(shù))。頻數(shù)分布表頻數(shù)分布表(frequency table):由變量值及:由變量值及其頻數(shù)編制而成的表其頻數(shù)編制而成的表。一、頻數(shù)分布表(一)頻數(shù)表的編制1. 求極差求極差(range): 極差又稱全距,是指全部觀察值中最極差又稱全距,是指全部觀察值中最大值與最小值之差,用符號大值與最小值之差,用符號R表示。表示。 R=xmax-xmin155.4 130.225.2Rcm2. 確定組數(shù)和組距確定組數(shù)和組距 (1) 根據(jù)樣本含量的大小及研究目的確定組數(shù)根據(jù)樣本含量的大小及研究目的確定組數(shù): 一般設一般

6、設815個組。個組。 (n50,915)。 (2)確定組距(確定組距(class interval):相鄰兩個組相鄰兩個組段下限之差為組距,一般采用等距分組。段下限之差為組距,一般采用等距分組。 i=R/組數(shù)組數(shù),為了方便資料整理匯總,組距,為了方便資料整理匯總,組距一般取整數(shù)一般取整數(shù)。25.2 102.522.00icm 3. 確定組段確定組段組段起點稱為下限(組段起點稱為下限(lower limit)組段終點稱為上限(組段終點稱為上限(upper limit)注意:注意:第一組段必須包含最小值,最后一個組第一組段必須包含最小值,最后一個組段必須包括最大值,各組段不能重疊。除最末段必須包括

7、最大值,各組段不能重疊。除最末一個組段需同時寫出上下限外,其余組段只寫一個組段需同時寫出上下限外,其余組段只寫出其下限出其下限。4. 歸組計數(shù),整理成表歸組計數(shù),整理成表用計算機或手工劃記法匯總,得到各組段觀察用計算機或手工劃記法匯總,得到各組段觀察單位個數(shù),單位個數(shù),繪制成頻數(shù)分布表。繪制成頻數(shù)分布表。表表2-1 2006年某市年某市120名名10歲男孩身高(歲男孩身高(cm)的頻數(shù)表)的頻數(shù)表身高身高(1)頻數(shù)頻數(shù)(2)頻率(頻率(%)(3)累計頻數(shù)累計頻數(shù)(4)累計頻率(累計頻率(%)(5)130132134136138140142144146148150152 154156 1 3 4

8、 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.7 8.3 5.0 2.5 0.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.7 13.3 23.3 37.5 55.0 71.7 83.3 91.7 96.7 99.2100.0合計合計 120 100.0 (二)頻數(shù)分布表的用途(二)頻數(shù)分布表的用途1. 揭示揭示頻數(shù)分布特征頻數(shù)分布特征2. 揭示揭示頻數(shù)分布類型頻數(shù)分布類型3. 便于發(fā)現(xiàn)特大或特小的可疑值便于發(fā)現(xiàn)特大或特小的可疑值4. 便于進一步計算統(tǒng)計指標和進行統(tǒng)便于進一步計算統(tǒng)

9、計指標和進行統(tǒng)計分析計分析頻數(shù)分布的兩個特征頻數(shù)分布的兩個特征集中趨勢(集中趨勢(central tendency):指一組數(shù):指一組數(shù)據(jù)向某個位置聚集或集中的傾向據(jù)向某個位置聚集或集中的傾向。 離散趨勢離散趨勢(dispersion tendency):指一組:指一組數(shù)據(jù)的分散性或變異度數(shù)據(jù)的分散性或變異度。 肌紅蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人數(shù)121086420Std. Dev = 10.75 Mean = 27.1N = 91.00血清總膽固醇(mmol/L)5

10、.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗體滴度1250.01000.0750.0500.0250.00.03020100頻 數(shù)頻頻 數(shù)數(shù)頻頻 數(shù)數(shù)血清肌紅蛋白血清肌紅蛋白(g/ml)負(左)偏態(tài)負(左)偏態(tài)對稱分布對稱分布正(右)偏態(tài)正(右)偏態(tài)二、頻數(shù)分布圖頻數(shù)分布圖(頻數(shù)分布圖(graph of frequency)是以變)是以變量值為橫坐標、頻數(shù)(或頻率)為縱坐標量值為橫坐標、頻數(shù)(或頻率)為縱坐標(不等距分組時以頻率(不等距分組時以頻率/組距組距=頻率密度為頻率密度為縱坐標),以每個等寬的距形面積

11、表示每縱坐標),以每個等寬的距形面積表示每組的頻數(shù)(或頻率)組的頻數(shù)(或頻率)。連續(xù)型定量資料:頻數(shù)圖中各距形是相連連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱的,又稱直方圖直方圖(histogram)。離散型定量資料:頻數(shù)圖中各距形是間隔離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱的,又稱直條圖直條圖(bar graph)。圖圖2-1 2006年某市年某市120名名10歲男孩身高的頻數(shù)圖歲男孩身高的頻數(shù)圖離散型計量資料的頻數(shù)表 434名少數(shù)民族已婚婦女現(xiàn)有子女數(shù)頻數(shù)分布圖名少數(shù)民族已婚婦女現(xiàn)有子女數(shù)頻數(shù)分布圖集中趨勢的描述集中趨勢的描述平均數(shù)平均數(shù)(average)是一類描述計量資料是一類描

12、述計量資料集中集中位置或平均水平位置或平均水平的統(tǒng)計指標,在醫(yī)學領域的統(tǒng)計指標,在醫(yī)學領域中常用的平均數(shù)有中常用的平均數(shù)有算術均數(shù)、幾何均數(shù)、算術均數(shù)、幾何均數(shù)、中位數(shù)中位數(shù)、眾數(shù)、調(diào)和均數(shù)、眾數(shù)、調(diào)和均數(shù)。一、算術均數(shù)一、算術均數(shù)(arithmetic mean)簡稱均數(shù)簡稱均數(shù)(mean),總體均數(shù)用希臘字母總體均數(shù)用希臘字母 (miu)表示,樣本均數(shù)用表示,樣本均數(shù)用 (x bar)表表示。均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均示。均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均水平水平。x直接法直接法將所有數(shù)據(jù)直接相加,再除以總例數(shù)將所有數(shù)據(jù)直接相加,再除以總例數(shù):是希臘字母,讀作是希臘字母,讀作sigma,為

13、求和符號,為求和符號。12.nxxxxxnn1. 計算方法計算方法【例例2-2】某醫(yī)生測量了某醫(yī)生測量了10名腦出血患者的血尿素氮名腦出血患者的血尿素氮(mmol/L)分別是:)分別是:7.4、6.7、6.9、7.3、7.6、6.5、 7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的均數(shù)。,試計算該組數(shù)據(jù)的均數(shù)。7.46.76.96.67.310 xxn1 12212iikkkif xf xf xf xxffff加權法加權法 用于頻數(shù)表資料或樣本中相同觀察值較多用于頻數(shù)表資料或樣本中相同觀察值較多時,將相同觀察值的個數(shù)時,將相同觀察值的個數(shù)(頻數(shù)頻數(shù) f )乘以該乘以該觀察值觀察值 x,以代替

14、相同觀察值逐個相加,以代替相同觀察值逐個相加。【例例2-3】根據(jù)表根據(jù)表2-1資料,用加權法求資料,用加權法求120名名10歲男孩身高的均數(shù)歲男孩身高的均數(shù)f 起了起了“權數(shù)權數(shù)”的作用,權衡了各組中值由的作用,權衡了各組中值由于頻數(shù)不同對均數(shù)的影響。于頻數(shù)不同對均數(shù)的影響。加權法計算的加權法計算的均數(shù)是近似的。均數(shù)是近似的。1 1313 1334 135135 cm131120iiif xxf 適用于描述單峰對稱分布,特別適用于描述單峰對稱分布,特別是是正態(tài)分布或近似正態(tài)分布資料正態(tài)分布或近似正態(tài)分布資料的集中趨勢。的集中趨勢。均數(shù)在描述正態(tài)分布特征方面有均數(shù)在描述

15、正態(tài)分布特征方面有重要意義。重要意義。均數(shù)的應用均數(shù)的應用我也我也知道知道了!了!例例 現(xiàn)有現(xiàn)有5人,其血清抗體效價分別為人,其血清抗體效價分別為1:10、 1:100、 1:1000、 1:10000和和 1:100000,求,求其效價倒數(shù)的平均水平其效價倒數(shù)的平均水平。若計算效價倒數(shù)的算術均數(shù)若計算效價倒數(shù)的算術均數(shù)用算術均數(shù)反映這類資料的平均水平是用算術均數(shù)反映這類資料的平均水平是不不合適的合適的。22222x 先求效價倒數(shù)對數(shù)值的均數(shù),然后求反對數(shù)先求效價倒數(shù)對數(shù)值的均數(shù),然后求反對數(shù)1000位于位于10、100、1000、10000、100000的中間的中間位置,具有很好的表性,這種

16、平均數(shù)就稱為位置,具有很好的表性,這種平均數(shù)就稱為幾何幾何均數(shù)均數(shù)。1lg10lg100lg1000lg10000lg100000lg35lg31000GGu是是n個觀察值乘積的個觀察值乘積的n次方根,又稱倍數(shù)次方根,又稱倍數(shù)均數(shù),用均數(shù),用G表示表示 。 幾何均數(shù)(幾何均數(shù)(geometric mean) 二、幾何均數(shù)二、幾何均數(shù)(Geometric mean,G)直接法:當直接法:當 n 較小時,直接將較小時,直接將 n 個個觀察值的乘積開觀察值的乘積開n 次方次方。12nnGx xx1lglg ()xGn1. 計算方法計算方法二、幾何均數(shù)二、幾何均數(shù)(Geometric mean,G)

17、【例例2-4】 某實驗室測得某實驗室測得7人血清中某種抗人血清中某種抗體的滴度分別為體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平,試求平均滴度均滴度。 111lg4 lg8lg25610.5361lglglg 1.5052 3277G 加權法:當資料中出現(xiàn)相同觀察值較多或資料已加權法:當資料中出現(xiàn)相同觀察值較多或資料已編制成頻數(shù)表時,也可用加權法計算幾何均數(shù)。編制成頻數(shù)表時,也可用加權法計算幾何均數(shù)。11112212lglglglglglgiikkkifxfxfxfxGffff【例例2-6】50名麻疹易感兒接種麻疹疫苗后,測得血凝名麻疹易感兒接種麻

18、疹疫苗后,測得血凝抑制抗體滴度資料見表抑制抗體滴度資料見表4-3,求抗體的平均滴度。,求抗體的平均滴度。表表4-3 50名麻疹易感兒血凝抑制抗體滴度名麻疹易感兒血凝抑制抗體滴度1111 lg43 lg87 lg256lg1 3786.9977lglg 1.73995450G 即即50名麻疹易感兒接種麻疹疫苗后血凝名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為抑制抗體的平均滴度為1/54。 2. 應用及注意事項應用及注意事項幾何均數(shù)應用于:幾何均數(shù)應用于: 等比資料,如抗體平均滴度;等比資料,如抗體平均滴度; 對數(shù)正態(tài)分布資料。對數(shù)正態(tài)分布資料。Remember!使用幾何均數(shù)時應注意:使用幾

19、何均數(shù)時應注意: 觀察值不能有觀察值不能有0; 觀察值不能同時有正值和負值。若全為觀察值不能同時有正值和負值。若全為負值,在計算時先把負號去掉,得出結負值,在計算時先把負號去掉,得出結果再加上負號果再加上負號。Be careful! 【例例2-7】200名食物中毒患者潛伏期資料如表名食物中毒患者潛伏期資料如表2-4,研究人員據(jù)此采用加權法計算均數(shù)得平,研究人員據(jù)此采用加權法計算均數(shù)得平均潛伏期為均潛伏期為27小時。小時。(1)該組數(shù)據(jù)在分布上有何特點?)該組數(shù)據(jù)在分布上有何特點? (2)用均數(shù)描述該資料的平均水平是否合適?)用均數(shù)描述該資料的平均水平是否合適?三、中位數(shù)與百分位數(shù)三、中位數(shù)與百

20、分位數(shù)表表2-4 200名食物中毒患者的潛伏期名食物中毒患者的潛伏期潛伏期(小時)潛伏期(小時)(1)頻數(shù)頻數(shù)(2)累計頻數(shù)累計頻數(shù)(3)累計頻率(累計頻率(%)(4)=(3)/n 030 3015.0127110150.5244915075.0362817889.0481419296.060 719999.5 7284 1200 100.0合計合計 200中位數(shù)中位數(shù)(median):):一組觀察值從小到大一組觀察值從小到大排列,位次居中的觀察值即中位數(shù),是一排列,位次居中的觀察值即中位數(shù),是一個位置指標個位置指標。直接法直接法 n為奇數(shù),為奇數(shù), n為偶數(shù),為偶數(shù),1 222 12nnnM

21、xMxx【例例2-8】某實驗師對某實驗師對10只小白鼠染毒后觀察各小只小白鼠染毒后觀察各小鼠的生存時間(分鐘),得數(shù)據(jù)為:鼠的生存時間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計算小白鼠的平,試計算小白鼠的平均生存時間均生存時間將將10個觀察值由小到大排列:個觀察值由小到大排列:35,60,62,63,63,65,66,68,69,69 22 126365264nnMxx 頻數(shù)表法頻數(shù)表法()2MLMinMLffLM 中位數(shù)所在組段下限中位數(shù)所在組段下限Mf Lfi組距組距中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段前一組的累計頻數(shù)中位數(shù)所在組

22、段前一組的累計頻數(shù)【例例2-9】根據(jù)例根據(jù)例4-7的資料計算中位數(shù)的資料計算中位數(shù)表表2-4 200名食物中毒患者的潛伏期名食物中毒患者的潛伏期潛伏期(小時)潛伏期(小時)(1)頻數(shù)頻數(shù)(2)累計頻數(shù)累計頻數(shù)(3)累計頻率(累計頻率(%)(4)=(3)/n 030 3015.0127110150.5244915074.5362817889.0481419296.060 719999.5 7284 1200 100.0合計合計 200()212 200 12(30)71223.8MLMinMLff 百分位數(shù)(百分位數(shù)(percentile):是指將一組觀察值):是指將一組觀察值由小到大排序后,將

23、其平均分成由小到大排序后,將其平均分成100等份,等份,對應于每一分割位置上的數(shù)值就稱為一個百對應于每一分割位置上的數(shù)值就稱為一個百分位數(shù),用分位數(shù),用 表示表示。xP 是一種位置指標,一個百分位數(shù)將一組觀是一種位置指標,一個百分位數(shù)將一組觀察值分為兩部分,理論上有察值分為兩部分,理論上有x%的觀察值比它小,的觀察值比它小,有(有(100-x)%的觀察值比它大。的觀察值比它大。xP(%)xLxiPLn xff(%)xxLxiPLnxffixfxLLf式中:式中:第第x百分位數(shù)所在組段下限百分位數(shù)所在組段下限組距組距第第x百分位數(shù)所在組段的頻數(shù)百分位數(shù)所在組段的頻數(shù)第第x百分位數(shù)所在組段前一組百

24、分位數(shù)所在組段前一組的累計頻數(shù)的累計頻數(shù)【例例4-10】根據(jù)表根據(jù)表4-4,計算,計算P25、P7525(%)1212(200 25%30)15.471xLxiPLnxff75(%)1224(200 75% 101)3649xLxiPLnxff適用條件:適用條件: 偏態(tài)分布資料偏態(tài)分布資料 分布類型不明確的資料分布類型不明確的資料 “開口資料開口資料”(即一端或兩端無確切數(shù)值的資料即一端或兩端無確切數(shù)值的資料)Understand?均數(shù)、中位數(shù)均數(shù)、中位數(shù)正態(tài)分布正態(tài)分布時:時: 均數(shù)中位數(shù)均數(shù)中位數(shù)正偏態(tài)分布正偏態(tài)分布時:時:均數(shù)均數(shù) 中位數(shù)中位數(shù)負偏態(tài)分布負偏態(tài)分布時時:均數(shù)均數(shù)中位數(shù)中位

25、數(shù)集中趨勢指標小結1.即計量資料分布與平均數(shù)的選擇即計量資料分布與平均數(shù)的選擇2.2.計量資料的分布與統(tǒng)計分析計量資料的分布與統(tǒng)計分析 分布類型分布類型 算術均數(shù)算術均數(shù)幾何均數(shù)幾何均數(shù)中位數(shù)中位數(shù) 正態(tài)分布正態(tài)分布對數(shù)正態(tài)分布對數(shù)正態(tài)分布其他分布其他分布正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布可轉換為正態(tài)分布可轉換為正態(tài)分布其他分布其他分布應用手段豐富應用手段豐富應用手段有限應用手段有限離散趨勢的描述離散趨勢的描述描述離散趨勢的常用指標描述離散趨勢的常用指標極差極差(range)四分位數(shù)間距四分位數(shù)間距(interquartile range)方差方差(variance)和標準差和標準差(sta

26、ndard deviation) 變異系數(shù)變異系數(shù)(coefficient of variation)1. 極差極差/全距全距(range) 全部觀察值中最大值與最小值之差,用符號全部觀察值中最大值與最小值之差,用符號R表示,表示, 即即常用于描述單峰對稱分布小樣本資料的變異常用于描述單峰對稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度程度,或用于初步了解資料的變異程度maxminRxx極差描述離散趨勢的局限極差描述離散趨勢的局限只考慮最大值與最小值之差異,不能反只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異程度映組內(nèi)其它觀察值的變異程度樣本含量越大,極差可能越大,樣本含樣

27、本含量越大,極差可能越大,樣本含量相差懸殊時不宜用極差作比較量相差懸殊時不宜用極差作比較 四分位數(shù)四分位數(shù) : P25,P50,P75三個點將全部觀三個點將全部觀察值等分為四部分,處于分位點上的數(shù)值察值等分為四部分,處于分位點上的數(shù)值就是四分位數(shù)就是四分位數(shù)下四分位數(shù)即第下四分位數(shù)即第25百分位數(shù),用百分位數(shù),用QL表示表示 上四分位數(shù)即第上四分位數(shù)即第75百分位數(shù),用百分位數(shù),用QU表示表示2. 四分位數(shù)間距四分位數(shù)間距四分位數(shù)間距四分位數(shù)間距(interquartile range)即上、即上、下四分位數(shù)之差下四分位數(shù)之差200名食物中毒患者的潛伏期資料,名食物中毒患者的潛伏期資料,P25

28、=15.4, P75=36ULQQQ36 15.420.6Q 四分位數(shù)間距常用于描述偏態(tài)分布及分布四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無確切數(shù)值資料的離散程度的一端或兩端無確切數(shù)值資料的離散程度四分位數(shù)間距較全距穩(wěn)定,但仍不能全面四分位數(shù)間距較全距穩(wěn)定,但仍不能全面概括所有觀察值的變異情況概括所有觀察值的變異情況x()x2()x22()xNx22()xN22()1xxsn3. 方差方差(variance)和標準差和標準差(SD)式中式中 n 1 稱為自由度稱為自由度(Degree of freedom),允許自由取值的變量值個數(shù),用符號允許自由取值的變量值個數(shù),用符號 (niu)表

29、示表示方差的度量單位是原度量單位的平方方差的度量單位是原度量單位的平方方差開方后即與原數(shù)據(jù)的度量單位相同,方差開方后即與原數(shù)據(jù)的度量單位相同,這就是這就是標準差標準差(standard deviation)2()xN 標準差應用公式標準差應用公式 直接法直接法 加權法加權法222()()11xxxxnsnn221fxfxnsn 【例例2-13】某醫(yī)生測量了某醫(yī)生測量了10名腦出血患者名腦出血患者的血尿素氮(的血尿素氮(mmol/L)分別是:)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的標準差試計算該組數(shù)據(jù)的標準差22222(7.46.

30、76.96.6 ) (7.4 6.7 6.96.6) /100.61(mmol/L)10 1s【例例2-14】根據(jù)表根據(jù)表4-1資料,計算資料,計算120名名10歲男歲男孩身高的標準差孩身高的標準差描述對稱分布,特別是正態(tài)分布或近似正態(tài)描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度分布資料的變異程度222()(17202)24686321204.79(cm)1120 1iiiiiif xf xfsf 【例例2-15】某醫(yī)院預防保健科,對一組某醫(yī)院預防保健科,對一組5歲男孩歲男孩進行體檢,測量身高、體重等指標。得身高均進行體檢,測量身高、體重等指標。得身高均數(shù)與標準差為數(shù)與標準差為11

31、5.8cm和和4.5cm,體重均數(shù)與標,體重均數(shù)與標準差為準差為20.2kg和和0.56kg,由此認為身高的變異,由此認為身高的變異程度比體重大。程度比體重大。上述結論是否正確?上述結論是否正確?4. 變異系數(shù)變異系數(shù)(coefficient of variation) 【例例2-16】某實驗室分別測量了某實驗室分別測量了10只小白鼠只小白鼠和和10只家兔的體重,得小白鼠體重的均數(shù)只家兔的體重,得小白鼠體重的均數(shù)與標準差分別為與標準差分別為22g和和3g,家兔體重的均數(shù),家兔體重的均數(shù)與標準差分別為與標準差分別為1500g和和100g。經(jīng)比較得出。經(jīng)比較得出結論,因家兔體重的標準差大于小白鼠體

32、結論,因家兔體重的標準差大于小白鼠體重的標準差,所以家兔體重的變異程度比重的標準差,所以家兔體重的變異程度比小白鼠體重的變異程度大。小白鼠體重的變異程度大。變異系數(shù)(變異系數(shù)(coefficient of variation, CV):):是一組觀察值的標準差與其均數(shù)的比值是一組觀察值的標準差與其均數(shù)的比值用途:用途:比較度量衡單位不同的資料的變異度比較度量衡單位不同的資料的變異度比較均數(shù)相差懸殊的資料的變異度比較均數(shù)相差懸殊的資料的變異度100%sCVx4.5 100%3.89%115.80.56 100%2.77%20.2HeightCVWeightCV描述數(shù)值變量資料集中趨勢的指標描述數(shù)

33、值變量資料集中趨勢的指標平均數(shù)平均數(shù) 意義意義 應用場合應用場合 均數(shù)均數(shù) 平均數(shù)量水平平均數(shù)量水平 對稱分布, 尤其正態(tài)分布對稱分布, 尤其正態(tài)分布 幾何均數(shù)幾何均數(shù) 平均增減倍數(shù)平均增減倍數(shù) 等比、對數(shù)正態(tài)分布等比、對數(shù)正態(tài)分布 中位數(shù)中位數(shù) 位次居中的觀察值水平位次居中的觀察值水平 偏態(tài)、 分布不明確、 分布偏態(tài)、 分布不明確、 分布末端無確定值末端無確定值 描述數(shù)值變量資料離散趨勢的指標描述數(shù)值變量資料離散趨勢的指標離散趨勢指標離散趨勢指標 意義意義 應用應用 極差極差 四分位數(shù)間距四分位數(shù)間距 方差和標準差方差和標準差 變異系數(shù)變異系數(shù) 反映一組數(shù)據(jù)的變異范圍反映一組數(shù)據(jù)的變異范圍

34、反映全部觀察值居中一半的范圍反映全部觀察值居中一半的范圍 反映全部觀察值之間的變異程度反映全部觀察值之間的變異程度 標準差相對于均數(shù)的大小標準差相對于均數(shù)的大小 資料不限資料不限 資料不限資料不限 適用于對稱分布,尤正態(tài)適用于對稱分布,尤正態(tài) 適用于單位不同或均數(shù)適用于單位不同或均數(shù)差別較大的變量之間的差別較大的變量之間的比較比較 描述頻數(shù)分布特征的指標總結描述頻數(shù)分布特征的指標總結對稱分布對稱分布偏態(tài)分布偏態(tài)分布對數(shù)正態(tài)分布對數(shù)正態(tài)分布集中趨勢集中趨勢均數(shù)均數(shù)中位數(shù)中位數(shù)幾何均數(shù)幾何均數(shù)離散趨勢離散趨勢標準差標準差四分位數(shù)間距四分位數(shù)間距 對數(shù)標準差的對數(shù)標準差的反對數(shù)反對數(shù)正態(tài)分布及其應用

35、正態(tài)分布及其應用圖圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意圖頻數(shù)分布逐漸接近正態(tài)分布示意圖1. 正態(tài)分布的概念及特征正態(tài)分布的概念及特征正態(tài)分布正態(tài)分布(Normal distribution),也稱高斯,也稱高斯分布分布(Gaussian distribution),是一種非常是一種非常重要的連續(xù)型隨機變量的概率分布,重要的連續(xù)型隨機變量的概率分布,是自是自然界中最常見的一種分布然界中最常見的一種分布正態(tài)分布(正態(tài)分布(normal distribution)稱為高斯分)稱為高斯分布(布(Gauss distribution),如果連續(xù)型隨機),如果連續(xù)型隨機變量變量X的概率密度函數(shù)為:的概率

36、密度函數(shù)為: 概念概念正態(tài)分布的概念與特征正態(tài)分布的概念與特征 則稱隨機變量則稱隨機變量X服從參數(shù)為服從參數(shù)為 和和 的正態(tài)分布,的正態(tài)分布,記作:記作: 22()21( )2xf xex ,XN 正態(tài)曲線(正態(tài)曲線(normal curve)在橫軸上方均數(shù))在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對稱;兩端處最高;并以均數(shù)為中心,左右對稱;兩端與橫軸永不相交,呈鐘形的曲線。與橫軸永不相交,呈鐘形的曲線。 正態(tài)分布特征正態(tài)分布特征正態(tài)分布的概念與特征正態(tài)分布的概念與特征 正態(tài)曲線正態(tài)曲線正態(tài)分布有兩個參數(shù),即位置參數(shù)正態(tài)分布有兩個參數(shù),即位置參數(shù) 和形狀和形狀參數(shù)參數(shù) 正態(tài)分布的概念與特征正

37、態(tài)分布的概念與特征 -6-5-4-3-2-10123456321123位置參數(shù)方差相等、均數(shù)不等的正態(tài)分布圖示312-3-2-10123332121形態(tài)參數(shù)正態(tài)分布的概念與特征正態(tài)分布的概念與特征 均數(shù)相等、方差不等的正態(tài)分布圖示213正態(tài)分布的概念與特征正態(tài)分布的概念與特征 正態(tài)曲線下面積的分布有一定的規(guī)律。正態(tài)曲線下面積的分布有一定的規(guī)律。 正態(tài)分布曲線下一定區(qū)間內(nèi)的面積代表了取值正態(tài)分布曲線下一定區(qū)間內(nèi)的面積代表了取值于相應區(qū)間內(nèi)的觀察值個數(shù)在全部觀察值總數(shù)中于相應區(qū)間內(nèi)的觀察值個數(shù)在全部觀察值總數(shù)中所占的比例(概率),或者是觀察值落在該區(qū)間所占的比例(概率),或者是觀察值落在該區(qū)間內(nèi)的

38、概率。內(nèi)的概率。正態(tài)分布的概念與特征正態(tài)分布的概念與特征 正態(tài)曲線下面積的分布規(guī)律:正態(tài)曲線下面積的分布規(guī)律: 正態(tài)曲線與橫軸之間的面積恒等于正態(tài)曲線與橫軸之間的面積恒等于1或或100%;對稱分布,對稱軸兩側的面積各為對稱分布,對稱軸兩側的面積各為50;在在 區(qū)間的面積為區(qū)間的面積為68.27 在在 區(qū)間的面積為區(qū)間的面積為95.00 在在 區(qū)間的面積為區(qū)間的面積為99.00 , 1.96 ,1.96 2.58 ,2.58 正態(tài)曲線下的面積規(guī)律-+15.87%15.87%68.27%-1.96+1.962.5%2.5%95%-2.58+2.580.5%0.5%99% 若若X服從正態(tài)分布服從正態(tài)

39、分布 ,則,則Z就服從就服從 。 ,N 0,1NXZ012. 標準正態(tài)分布標準正態(tài)分布標準正態(tài)分布與標準化變換(標準正態(tài)分布與標準化變換(Z變換)變換)標準正態(tài)分布曲線下面積分布規(guī)律標準正態(tài)分布曲線下面積 (z) z 0.00 0.02 0.04 0.06 0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0

40、465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.2810 00.50000.49200.48400.47610.46810z 【例例2-18】 已知某地已知某地2003年年18歲男大學生身高的均歲男大學生身高的均數(shù)數(shù) cm,標準差,標準差 cm,且,且18歲男大歲男大學生的身高服從正態(tài)分布。問該地學生的身高服從正態(tài)分布。問該地18歲男大學生歲男大學生中身高在中身高在166.8 cm及其以下者占多大的比例?及其以下者占多大的比例? 173.503.42()/166.8 173.5 /3.421.96zx 查附表

41、查附表3:表的左側找:表的左側找-1.9,表的上方找,表的上方找0.06,相,相交處為交處為0.025 3. 正態(tài)分布的應用正態(tài)分布的應用估計頻率分布估計頻率分布 【例例2-19】某地某地2003年抽樣調(diào)查了年抽樣調(diào)查了100名名18歲男大學生身高,算得均數(shù)為歲男大學生身高,算得均數(shù)為172.70cm,標準差為標準差為4.01cm。該地。該地18歲男大學生中身歲男大學生中身高在高在162.35cm183.05cm范圍內(nèi)者所占的范圍內(nèi)者所占的比例是多少?比例是多少?查附表查附表3, 左側的面積為左側的面積為0.005,由正態(tài)分布曲,由正態(tài)分布曲線的對稱性可知,線的對稱性可知, 右側的面積也為右側

42、的面積也為0.005,又,又由正態(tài)分布曲線下的總面積為由正態(tài)分布曲線下的總面積為1,可得,可得-2.58與與2.58之間之間的面積為的面積為1-20.005=0.99=99% 。11()/(162.35 172.0)/4.012.58zxxS 22()/(183.05 172.7)/4.012.58zxxS58. 22Z58. 21Z制定醫(yī)學參考值范圍制定醫(yī)學參考值范圍 醫(yī)學參考值范圍也稱正常值范圍醫(yī)學參考值范圍也稱正常值范圍 絕大多數(shù)正常人某觀察指標的波動范圍。絕大多數(shù)正常人某觀察指標的波動范圍。絕大絕大多數(shù):多數(shù):90%、95%、99%等,最常用的是等,最常用的是95% 正常人:不是指完全

43、健康的人,而是指排除了正常人:不是指完全健康的人,而是指排除了影響研究指標的疾病和有關因素的同質人群影響研究指標的疾病和有關因素的同質人群正常人正常人病人病人假陽性率假陽性率假陰性率假陰性率正常人與病人的數(shù)據(jù)分布重疊示意圖正常人與病人的數(shù)據(jù)分布重疊示意圖( (單側單側) ) 制定醫(yī)學參考值范圍的注意事項:制定醫(yī)學參考值范圍的注意事項:要確定一批樣本含量足夠大的要確定一批樣本含量足夠大的“正常人正常人”根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰蹈鶕?jù)研究目的和使用要求選定適當?shù)陌俜纸缰蹈鶕?jù)專業(yè)知識確定單側或雙側界值根據(jù)專業(yè)知識確定單側或雙側界值根據(jù)資料的分布選用恰當?shù)挠嬎惴椒ǜ鶕?jù)資料的分布選用恰當?shù)挠嬎惴椒?根據(jù)醫(yī)學專業(yè)知識確定!根據(jù)醫(yī)學專業(yè)知識確定!單側:下限單側:下限: 肺活量、肺活量、IQ 上限上限: 轉氨酶、尿鉛、發(fā)汞轉氨酶、尿鉛、發(fā)汞雙側:白細胞計數(shù)、血清總膽固醇雙側:白細胞計數(shù)、血清總膽固醇 過低異常過低異常-單側下限單側下限 過高異常過高異常-單側上限單側上限 過低、過高均異常過低、過高均異常-雙側雙側單側下限單側下限異常異常正常正常單側上限單側上限異常異常正常正常異常異常正常正常雙側下限雙側下限雙側上限雙側上限異常異常正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布的資料正態(tài)分布法:適用于正態(tài)或近似正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論