第4章 定量資料的統(tǒng)計(jì)描述課件_第1頁(yè)
第4章 定量資料的統(tǒng)計(jì)描述課件_第2頁(yè)
第4章 定量資料的統(tǒng)計(jì)描述課件_第3頁(yè)
第4章 定量資料的統(tǒng)計(jì)描述課件_第4頁(yè)
第4章 定量資料的統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩128頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章

定量資料的統(tǒng)計(jì)描述流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室第4章定量資料的統(tǒng)計(jì)描述【例4-1】2006年某市120名10歲男孩的身高(cm)資料如下135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5第4章定量資料的統(tǒng)計(jì)描述【問(wèn)題4-1】該資料為何種類型資料?如何對(duì)該資料進(jìn)行描述?(描述10歲男孩身高的數(shù)量特征)第4章定量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)表和頻數(shù)圖第二節(jié)集中趨勢(shì)的描述第三節(jié)離散趨勢(shì)的描述第四節(jié)正態(tài)分布及其應(yīng)用本章主要內(nèi)容第4章定量資料的統(tǒng)計(jì)描述由于個(gè)體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個(gè)體上的觀察結(jié)果不是恒定不變的,但也不是雜亂無(wú)章的,而是有一定規(guī)律的,呈一定的分布(distribution)將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為若干各組,合計(jì)各組的頻數(shù),得到頻數(shù)分布表;也可再將頻數(shù)表繪制成頻數(shù)分布圖第4章定量資料的統(tǒng)計(jì)描述頻數(shù)(frequency):一組資料中各觀察值或不同組段內(nèi)觀察值出現(xiàn)的頻繁程度(次數(shù))頻數(shù)分布表(frequencytable):由變量值及其頻數(shù)編制而成的表,簡(jiǎn)稱頻數(shù)表。一、頻數(shù)分布表第4章定量資料的統(tǒng)計(jì)描述(一)頻數(shù)表的編制1.求極差(range):極差又稱全距,是指全部觀察值中最大值與最小值之差,用符號(hào)R表示

R=xmax-xmin第4章定量資料的統(tǒng)計(jì)描述2.確定組數(shù)和組距

(1)根據(jù)研究目的和分析要求靈活確定組數(shù):若為計(jì)算用,組數(shù)可適當(dāng)增多,以減少計(jì)算誤差;若為顯示分布特征,則組數(shù)不宜太多或太少,一般n<50,5~8,n>50,9~15第4章定量資料的統(tǒng)計(jì)描述

(2)確定組距(classinterval):相鄰兩個(gè)組段下限之差為組距,一般采用等距分組。i=R/組數(shù),為了方便資料整理匯總,組距一般取整數(shù)第4章定量資料的統(tǒng)計(jì)描述

3.確定組段組段起點(diǎn)稱為下限(lowerlimit)組段終點(diǎn)稱為上限(upperlimit)注意:第一組段必須包含最小值,最后一個(gè)組段必須包括最大值,各組段不能重疊。除最末一個(gè)組段需同時(shí)寫(xiě)出上下限外,其余組段只寫(xiě)出其下限第4章定量資料的統(tǒng)計(jì)描述

確定組段即確定每一組的起點(diǎn)(下限)和終點(diǎn)(上限)。

起點(diǎn)稱為下限(lowerlimit)終點(diǎn)稱為上限(upperlimit)

上限=下限+組距第4章定量資料的統(tǒng)計(jì)描述4.歸組計(jì)數(shù),整理成表確定組段界限后,采用計(jì)算機(jī)或用劃記法將各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀察例數(shù),也就是頻數(shù)。用計(jì)算機(jī)或手工劃記法匯總,得到各組段觀察單位個(gè)數(shù),繪制成頻數(shù)分布表第4章定量資料的統(tǒng)計(jì)描述表4-12006年某市120名10歲男孩身高(cm)的頻數(shù)表身高(1)頻數(shù)(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合計(jì)120100.0——第4章定量資料的統(tǒng)計(jì)描述(二)頻數(shù)分布表的用途1.揭示頻數(shù)分布特征2.揭示頻數(shù)分布類型3.便于發(fā)現(xiàn)特大或特小的可疑值4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)行統(tǒng)計(jì)分析第4章定量資料的統(tǒng)計(jì)描述頻數(shù)分布的兩個(gè)特征集中趨勢(shì)(centraltendency):指一組數(shù)據(jù)向某個(gè)位置聚集或集中的傾向離散趨勢(shì)(dispersion):指一組數(shù)據(jù)的分散性或變異度

第4章定量資料的統(tǒng)計(jì)描述

頻數(shù)分布的類型

對(duì)稱分布(symmetricdistribution):集中位置在中間,左右兩側(cè)頻數(shù)基本對(duì)稱第4章定量資料的統(tǒng)計(jì)描述偏態(tài)分布(skeweddistribution):集中位置偏向一側(cè),兩側(cè)頻數(shù)分布不對(duì)稱正偏態(tài)(positiveskew)平均數(shù)大于眾數(shù)(右偏)

負(fù)偏態(tài)(negativeskew)平均數(shù)小于眾數(shù)

(左偏)

第4章定量資料的統(tǒng)計(jì)描述3.便于發(fā)現(xiàn)某些特大或特小的可疑值

對(duì)于頻數(shù)表,如果連續(xù)某幾個(gè)組段的頻數(shù)為0,接下來(lái)的組段出現(xiàn)頻數(shù)不為0的數(shù)值,此數(shù)值即為可疑值。4.便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理可利用頻數(shù)表計(jì)算百分位數(shù)、中位數(shù)、標(biāo)準(zhǔn)差等第4章定量資料的統(tǒng)計(jì)描述二、頻數(shù)分布圖頻數(shù)分布圖(graphoffrequency)是以變量值為橫坐標(biāo)、頻數(shù)(或頻率)為縱坐標(biāo)(不等距分組時(shí)以頻率/組距=頻率密度為縱坐標(biāo)),以每個(gè)等寬的距形面積表示每組的頻數(shù)(或頻率)第4章定量資料的統(tǒng)計(jì)描述連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱直方圖(histogram)離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱直條圖(bargraph)第4章定量資料的統(tǒng)計(jì)描述圖4-12006年某市120名10歲男孩身高的頻數(shù)圖第4章定量資料的統(tǒng)計(jì)描述頻數(shù)頻數(shù)頻數(shù)血清肌紅蛋白(μg/ml)負(fù)(左)偏態(tài)對(duì)稱分布正(右)偏態(tài)第4章定量資料的統(tǒng)計(jì)描述圖69例RA患者血清EBV-VCA-IgG抗體滴度的頻數(shù)分布圖101名正常人血清肌紅蛋白的頻數(shù)分布正(右)偏態(tài)負(fù)(左)偏態(tài)23第4章定量資料的統(tǒng)計(jì)描述434名少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)頻數(shù)分布圖第4章定量資料的統(tǒng)計(jì)描述集中趨勢(shì)的描述第4章定量資料的統(tǒng)計(jì)描述平均數(shù)(average)是一類描述計(jì)量資料集中位置或平均水平的統(tǒng)計(jì)指標(biāo),在醫(yī)學(xué)領(lǐng)域中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù)第4章定量資料的統(tǒng)計(jì)描述一、算術(shù)均數(shù)(arithmeticmean)簡(jiǎn)稱均數(shù)(mean),總體均數(shù)用希臘字母

(miu)表示,樣本均數(shù)用(xbar)表示。均數(shù)描述一組數(shù)據(jù)在數(shù)量上的平均水平第4章定量資料的統(tǒng)計(jì)描述直接法

將所有數(shù)據(jù)直接相加,再除以總例數(shù)

Σ:是希臘字母,讀作sigma,為求和符號(hào)1.計(jì)算方法第4章定量資料的統(tǒng)計(jì)描述【例4-2】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的均數(shù)第4章定量資料的統(tǒng)計(jì)描述加權(quán)法

用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),將相同觀察值的個(gè)數(shù)(頻數(shù)f)乘以該觀察值x,以代替相同觀察值逐個(gè)相加第4章定量資料的統(tǒng)計(jì)描述【例4-3】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身高的均數(shù)第4章定量資料的統(tǒng)計(jì)描述f起了“權(quán)數(shù)”的作用,權(quán)衡了各組中值由于頻數(shù)不同對(duì)均數(shù)的影響。加權(quán)法計(jì)算的均數(shù)是近似的第4章定量資料的統(tǒng)計(jì)描述均數(shù)兩個(gè)重要的性質(zhì)第4章定量資料的統(tǒng)計(jì)描述適用于描述單峰對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢(shì)均數(shù)在描述正態(tài)分布特征方面有重要意義均數(shù)的應(yīng)用我也知道了!第4章定量資料的統(tǒng)計(jì)描述例現(xiàn)有5人,其血清抗體效價(jià)分別為1:10、1:100、1:1000、1:10000和1:100000,求其效價(jià)倒數(shù)的平均水平若計(jì)算效價(jià)倒數(shù)的算術(shù)均數(shù)用算術(shù)均數(shù)反映這類資料的平均水平是不合適的第4章定量資料的統(tǒng)計(jì)描述先求效價(jià)倒數(shù)對(duì)數(shù)值的均數(shù),然后求反對(duì)數(shù)1000位于10、100、1000、10000、100000的中間位置,具有很好的代表性,這種平均數(shù)就稱為幾何均數(shù)第4章定量資料的統(tǒng)計(jì)描述二、幾何均數(shù)(Geometricmean,G)

是n個(gè)觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示。

第4章定量資料的統(tǒng)計(jì)描述直接法:當(dāng)n較小時(shí),直接將n個(gè)觀察值的乘積開(kāi)n次方1.計(jì)算方法第4章定量資料的統(tǒng)計(jì)描述加權(quán)法:當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù)第4章定量資料的統(tǒng)計(jì)描述

【例4-4】某實(shí)驗(yàn)室測(cè)得7人血清中某種抗體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平均滴度

直接法第4章定量資料的統(tǒng)計(jì)描述【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝抑制抗體滴度資料見(jiàn)表4-3,求抗體的平均滴度。表4-350名麻疹易感兒血凝抑制抗體滴度加權(quán)法第4章定量資料的統(tǒng)計(jì)描述即50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54

第4章定量資料的統(tǒng)計(jì)描述2.應(yīng)用及注意事項(xiàng)幾何均數(shù)應(yīng)用于:等比資料,如抗體平均滴度對(duì)數(shù)正態(tài)分布資料Remember!第4章定量資料的統(tǒng)計(jì)描述使用幾何均數(shù)時(shí)應(yīng)注意:觀察值不能有0觀察值不能同時(shí)有正值和負(fù)值。若全為負(fù)值,在計(jì)算時(shí)先把負(fù)號(hào)去掉,得出結(jié)果再加上負(fù)號(hào)Becareful!第4章定量資料的統(tǒng)計(jì)描述

【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權(quán)法計(jì)算均數(shù)得平均潛伏期為27小時(shí)。(1)該組數(shù)據(jù)在分布上有何特點(diǎn)?(2)用均數(shù)描述該資料的平均水平是否合適?三、中位數(shù)與百分位數(shù)第4章定量資料的統(tǒng)計(jì)描述表4-4200名食物中毒患者的潛伏期潛伏期(小時(shí))(1)頻數(shù)(2)累計(jì)頻數(shù)(3)累計(jì)頻率(%)(4)=(3)/n0~303015.012~7110150.524~4915075.036~2817889.048~1419296.060~719999.572~841200100.0合計(jì)200--第4章定量資料的統(tǒng)計(jì)描述中位數(shù)(median):一組觀察值從小到大排列,位次居中的觀察值即中位數(shù),是一個(gè)位置指標(biāo)第4章定量資料的統(tǒng)計(jì)描述中位數(shù)(median):將一組觀察值由小到大排序后,居于中間位置的數(shù)值即為中位數(shù),用表示。

中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列平均分為兩部分,小于和大于中位數(shù)的觀察值個(gè)數(shù)相等,各占50%。第4章定量資料的統(tǒng)計(jì)描述直接法:觀察值個(gè)數(shù)較少n為奇數(shù),n為偶數(shù),第4章定量資料的統(tǒng)計(jì)描述【例4-8】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生存時(shí)間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計(jì)算小白鼠的平均生存時(shí)間將10個(gè)觀察值由小到大排列:35,60,62,63,63,65,66,68,69,69

第4章定量資料的統(tǒng)計(jì)描述頻數(shù)表法LM

中位數(shù)所在組段下限

組距中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段前一組的累計(jì)頻數(shù)第4章定量資料的統(tǒng)計(jì)描述【例4-9】根據(jù)例4-7的資料計(jì)算中位數(shù)表4-4200名食物中毒患者的潛伏期潛伏期(小時(shí))(1)頻數(shù)(2)累計(jì)頻數(shù)(3)累計(jì)頻率(%)(4)=(3)/n0~303015.012~7110150.524~4915074.536~2817889.048~1419296.060~719999.572~841200100.0合計(jì)200--第4章定量資料的統(tǒng)計(jì)描述(小時(shí))

第4章定量資料的統(tǒng)計(jì)描述百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對(duì)應(yīng)于每一分割位置上的數(shù)值就稱為一個(gè)百分位數(shù),用

表示x%(100-x)%第4章定量資料的統(tǒng)計(jì)描述x%

Px(100-x)%50%分位數(shù)就是中位數(shù)25%,75%分位數(shù)稱四分位數(shù)(quartile)

第4章定量資料的統(tǒng)計(jì)描述

是一種位置指標(biāo),一個(gè)百分位數(shù)將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。第4章定量資料的統(tǒng)計(jì)描述式中:第x百分位數(shù)所在組段下限組距第x百分位數(shù)所在組段的頻數(shù)第x百分位數(shù)所在組段前一組的累計(jì)頻數(shù)頻數(shù)表法第4章定量資料的統(tǒng)計(jì)描述【例4-10】根據(jù)表4-4,計(jì)算P25、P75(小時(shí))(小時(shí))第4章定量資料的統(tǒng)計(jì)描述中位數(shù)適用條件:偏態(tài)分布資料分布類型不明確的資料“開(kāi)口資料”(即一端或兩端無(wú)確切數(shù)值的資料)Understand?百分位數(shù):非正態(tài)分布資料第4章定量資料的統(tǒng)計(jì)描述

三組軀體功能維度得分甲組88910111212乙組56810121415丙組12510151819第4章定量資料的統(tǒng)計(jì)描述離散趨勢(shì)的描述第4章定量資料的統(tǒng)計(jì)描述

【例4-11】分別觀察兩組各9只動(dòng)物的每日進(jìn)食量(mg/g),結(jié)果如下:

A組242526272829303132B組202122232425262764兩組動(dòng)物每日進(jìn)食量的平均數(shù),均為28mg/g。

思考:28mg/g能否分別代表兩組動(dòng)物每日近食量的平均水平?第4章定量資料的統(tǒng)計(jì)描述離散趨勢(shì)是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只有將集中趨勢(shì)與離散趨勢(shì)結(jié)合起來(lái)描述才能全面反映定量資料的數(shù)量特征。第4章定量資料的統(tǒng)計(jì)描述描述離散趨勢(shì)的常用指標(biāo)極差(range)四分位數(shù)間距(interquartilerange)方差(variance)和標(biāo)準(zhǔn)差(standarddeviation)變異系數(shù)(coefficientofvariation)第4章定量資料的統(tǒng)計(jì)描述1.極差/全距(range)

全部觀察值中最大值與最小值之差,用符號(hào)R表示,即常用于描述單峰對(duì)稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度極差越大表示數(shù)據(jù)離散程度越大。第4章定量資料的統(tǒng)計(jì)描述極差描述離散趨勢(shì)的局限只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異程度樣本含量越大,極差可能越大,樣本含量相差懸殊時(shí)不宜用極差作比較

第4章定量資料的統(tǒng)計(jì)描述四分位數(shù):P25,P50,P75三個(gè)點(diǎn)將全部觀察值等分為四部分,處于分位點(diǎn)上的數(shù)值就是四分位數(shù)下四分位數(shù)即第25百分位數(shù),用QL表示上四分位數(shù)即第75百分位數(shù),用QU表示2.四分位數(shù)間距第4章定量資料的統(tǒng)計(jì)描述四分位數(shù)間距(interquartilerange)即上、下四分位數(shù)之差200名食物中毒患者的潛伏期資料,P25=15.4,P75=36(小時(shí))第4章定量資料的統(tǒng)計(jì)描述四分位數(shù)間距常用于描述偏態(tài)分布及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度四分位數(shù)間距較全距穩(wěn)定,但仍不能全面概括所有觀察值的變異情況

四分位數(shù)間距常和中位數(shù)結(jié)合全面描述偏態(tài)分布等資料的離散趨勢(shì)和集中趨勢(shì)。第4章定量資料的統(tǒng)計(jì)描述每個(gè)觀察值x與間的變異稱為離均差由于變異程度用離均差平方和反應(yīng)

方差考慮觀察值個(gè)數(shù)N的影響

3.方差(variance)和標(biāo)準(zhǔn)差(SD)第4章定量資料的統(tǒng)計(jì)描述第4章定量資料的統(tǒng)計(jì)描述在實(shí)際工作中,采用樣本方差n-1稱為自由度(degreeoffreedom)方差適用:描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。

第4章定量資料的統(tǒng)計(jì)描述式中n–1稱為自由度(Degreeoffreedom),允許自由取值的變量值個(gè)數(shù),用符號(hào)(niu)表示第4章定量資料的統(tǒng)計(jì)描述方差的度量單位是原度量單位的平方方差開(kāi)方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差(standarddeviation)標(biāo)準(zhǔn)差

第4章定量資料的統(tǒng)計(jì)描述在實(shí)際工作中,常計(jì)算樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差適用:描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。常和均數(shù)結(jié)合使用。

第4章定量資料的統(tǒng)計(jì)描述數(shù)學(xué)上可以證明:第4章定量資料的統(tǒng)計(jì)描述

標(biāo)準(zhǔn)差應(yīng)用公式

直接法

加權(quán)法第4章定量資料的統(tǒng)計(jì)描述

【例4-13】某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的標(biāo)準(zhǔn)差第4章定量資料的統(tǒng)計(jì)描述【例4-14】根據(jù)表4-1資料,計(jì)算120名10歲男孩身高的標(biāo)準(zhǔn)差第4章定量資料的統(tǒng)計(jì)描述描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的變異程度第4章定量資料的統(tǒng)計(jì)描述

【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組5歲男孩進(jìn)行體檢,測(cè)量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為115.8cm和4.5cm,體重均數(shù)與標(biāo)準(zhǔn)差為20.2kg和0.56kg,由此認(rèn)為身高的變異程度比體重大。上述結(jié)論是否正確?4.變異系數(shù)(coefficientofvariation)第4章定量資料的統(tǒng)計(jì)描述

【例4-16】某實(shí)驗(yàn)室分別測(cè)量了10只小白鼠和10只家兔的體重,得小白鼠體重的均數(shù)與標(biāo)準(zhǔn)差分別為22g和3g,家兔體重的均數(shù)與標(biāo)準(zhǔn)差分別為1500g和100g。經(jīng)比較得出結(jié)論,因家兔體重的標(biāo)準(zhǔn)差大于小白鼠體重的標(biāo)準(zhǔn)差,所以家兔體重的變異程度比小白鼠體重的變異程度大。第4章定量資料的統(tǒng)計(jì)描述變異系數(shù)(coefficientofvariation,CV):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值用途:比較度量衡單位不同的資料的變異度比較均數(shù)相差懸殊的資料的變異度第4章定量資料的統(tǒng)計(jì)描述第4章定量資料的統(tǒng)計(jì)描述描述頻數(shù)分布特征的指標(biāo)總結(jié)對(duì)稱分布偏態(tài)分布對(duì)數(shù)正態(tài)分布集中趨勢(shì)均數(shù)中位數(shù)幾何均數(shù)離散趨勢(shì)標(biāo)準(zhǔn)差四分位數(shù)間距對(duì)數(shù)標(biāo)準(zhǔn)差的反對(duì)數(shù)第4章定量資料的統(tǒng)計(jì)描述描述數(shù)值變量資料分布特征的內(nèi)容:分布范圍集中趨勢(shì)離散趨勢(shì)是否對(duì)稱第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布及其應(yīng)用第4章定量資料的統(tǒng)計(jì)描述圖4-1120名10歲男孩身高資料的頻數(shù)圖第4章定量資料的統(tǒng)計(jì)描述圖4-2頻數(shù)分布逐漸接近正態(tài)分布示意圖第4章定量資料的統(tǒng)計(jì)描述1.正態(tài)分布的概念及特征正態(tài)分布(Normaldistribution),也稱高斯分布(Gaussiandistribution),是一種非常重要的連續(xù)型隨機(jī)變量的概率分布,是自然界中最常見(jiàn)的一種分布第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布(normaldistribution)稱為高斯分布(Gaussdistribution),如果連續(xù)型隨機(jī)變量X的概率密度函數(shù)為:

概念正態(tài)分布的概念與特征則稱隨機(jī)變量X服從參數(shù)為和的正態(tài)分布,記作:-∞<x<+∞第4章定量資料的統(tǒng)計(jì)描述正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對(duì)稱;兩端與橫軸永不相交,呈鐘形曲線。

正態(tài)分布特征正態(tài)曲線第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布圖示x0.1.2.3.4f(x)第4章定量資料的統(tǒng)計(jì)描述概率密度函數(shù)(PDF)和累積分布函數(shù)(CDF)第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)和形狀參數(shù)

峰的位置-位置參數(shù)μ第4章定量資料的統(tǒng)計(jì)描述方差相等、均數(shù)不等的正態(tài)分布圖示

3

1

2第4章定量資料的統(tǒng)計(jì)描述形態(tài)參數(shù)σ第4章定量資料的統(tǒng)計(jì)描述均數(shù)相等、方差不等的正態(tài)分布圖示

2

1

3第4章定量資料的統(tǒng)計(jì)描述正態(tài)曲線下面積的分布有一定的規(guī)律。

①正態(tài)曲線與橫軸之間的面積恒等于1或100%;②對(duì)稱分布,對(duì)稱軸兩側(cè)的面積各為50%;③在區(qū)間的面積為68.27%在區(qū)間的面積為95.00%在區(qū)間的面積為99.00%

第4章定量資料的統(tǒng)計(jì)描述第4章定量資料的統(tǒng)計(jì)描述正態(tài)曲線下的面積規(guī)律

-

+

15.87%15.87%68.27%第4章定量資料的統(tǒng)計(jì)描述

-1.96

+1.96

2.5%2.5%95%第4章定量資料的統(tǒng)計(jì)描述

-2.58

+2.58

0.5%0.5%99%第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布的特征概率密度函數(shù)曲線在均數(shù)處最高以均數(shù)為中心左右對(duì)稱,且逐漸減少正態(tài)分布有兩個(gè)參數(shù),即

曲線下的面積分布有一定規(guī)律第4章定量資料的統(tǒng)計(jì)描述正態(tài)分布的判斷方法⑴利用頻數(shù)分布表或頻數(shù)分布圖⑵根據(jù)專業(yè)知識(shí)判斷⑶正態(tài)分布的經(jīng)驗(yàn)判斷①若,可認(rèn)為資料呈偏態(tài)分布②若,則有理由懷疑資料呈偏態(tài)分布⑷正態(tài)性檢驗(yàn)(P108)第4章定量資料的統(tǒng)計(jì)描述思考:能否編制正態(tài)曲線下面積的分布表,然后通過(guò)查表來(lái)確定某區(qū)間對(duì)應(yīng)的面積呢?

2.標(biāo)準(zhǔn)正態(tài)分布

統(tǒng)計(jì)學(xué)家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)一的,的正態(tài)分布,該正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)。第4章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換第4章定量資料的統(tǒng)計(jì)描述這種變換稱為標(biāo)準(zhǔn)化變換或Z變換。若X服從正態(tài)分布,則Z就服從。第4章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律第4章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)正態(tài)分布曲線下面積

(z)

z 0.00 0.02 0.04 0.06 0.08-3.0 0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.28100 0.5000 0.4920 0.4840 0.4761 0.46810z第4章定量資料的統(tǒng)計(jì)描述

【例4-18】

已知某地2003年18歲男大學(xué)生身高的均數(shù)cm,標(biāo)準(zhǔn)差cm,且18歲男大學(xué)生的身高服從正態(tài)分布。問(wèn)該地18歲男大學(xué)生中身高在166.8cm及其以下者占多大的比例?

查附表3:表的左側(cè)找-1.9,表的上方找0.06,相交處為0.025

第4章定量資料的統(tǒng)計(jì)描述3.正態(tài)分布的應(yīng)用估計(jì)正態(tài)分布資料的頻率分布

【例4-19】某地2003年抽樣調(diào)查了100名18歲男大學(xué)生身高,算得均數(shù)為172.70cm,標(biāo)準(zhǔn)差為4.01cm。

【問(wèn)題】該地18歲男大學(xué)生中身高在162.35cm~183.05cm范圍內(nèi)者所占的比例是多少?第4章定量資料的統(tǒng)計(jì)描述查附表3得:第4章定量資料的統(tǒng)計(jì)描述

查附表3,左側(cè)的面積為0.005,由正態(tài)分布曲線的對(duì)稱性可知,右側(cè)的面積也為0.005,又由正態(tài)分布曲線下的總面積為1,可得-2.58與2.58之間的面積為1-2×0.005=0.99=99%。第4章定量資料的統(tǒng)計(jì)描述制定醫(yī)學(xué)參考值范圍醫(yī)學(xué)參考值范圍即正常值范圍,絕大多數(shù)“正常人”的解剖、生理、生化等指標(biāo)的波動(dòng)范圍。絕大多數(shù)正常人某觀察指標(biāo)的波動(dòng)范圍。絕大多數(shù):90%、95%、99%等,最常用的是95%正常人:不是指完全健康的人,而是指排除了影響研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群用于判斷正常與異常第4章定量資料的統(tǒng)計(jì)描述確定參考值范圍的原則以同質(zhì)的正常人為研究對(duì)象控制測(cè)量誤差判斷是否分組(性別、年齡組)決定取單側(cè)還是雙側(cè)選定合適的百分界限根據(jù)資料分布類型選擇適當(dāng)方法制定參考值第4章定量資料的統(tǒng)計(jì)描述根據(jù)醫(yī)學(xué)專業(yè)知識(shí)確定!單側(cè):下限:肺活量、IQ

……

上限:轉(zhuǎn)氨酶、尿鉛、發(fā)汞……雙側(cè):白細(xì)胞計(jì)數(shù)、血清總膽固醇……

過(guò)低異常---單側(cè)下限過(guò)高異常---單側(cè)上限過(guò)低、過(guò)高均異常---雙側(cè)單側(cè)下限異常正常單側(cè)上限異常正常異常正常雙側(cè)下限雙側(cè)上限異常第4章定量資料的統(tǒng)計(jì)描述正常人病人假陽(yáng)性率假陰性率正常人與病人的數(shù)據(jù)分布重疊示意圖(單側(cè))第4章定量資料的統(tǒng)計(jì)描述制定醫(yī)學(xué)參考值范圍常用方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論