第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述課件_第1頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述課件_第2頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述課件_第3頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述課件_第4頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二節(jié)數(shù)值變量資料的統(tǒng)計分析

——統(tǒng)計描述

DescriptiveStatistics信陽職業(yè)技術學院趙玉霞第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述一數(shù)值變量資料的頻數(shù)表二集中趨勢指標三離散程度指標四正態(tài)分布及其應用

主要內容

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述學習目標1.說出頻數(shù)表的編制方法,頻數(shù)分布的兩種趨勢;2.學會數(shù)值變量資料常用指標(平均水平、離散程度)的計算方法3.描述正態(tài)分布的基本特征與內容,了解醫(yī)學參考值范圍的估計方法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述編號血清甘油三脂編號血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77表160名正常成年女子的血清甘油三酯(mmol/L)

一、頻數(shù)表(frequencytable)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

組段

劃記

頻數(shù),f0.5~

30.6~正90.7~正正120.8~正正130.9~正正正171.0~正正正181.1~正正正正201.2~正正正181.3~正正正171.4~正正131.5~正91.6~正81.7~1.8

合計

3160

1.頻數(shù)表的編制(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=1.77-0.51=1.26(mmol/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調整。本例i=R/10=1.26/10=0.126≈0.1。(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述①集中趨勢(centraltendency):變量值集中位置。本例在組段“1.1~”。——平均水平指標②離散趨勢(tendencyofdispersion):變量值圍繞集中位置的分布情況。本例0.9~1.4,共有90人,占56%;離“中心”位置越遠,頻數(shù)越?。磺覈@“中心”左右對稱?!儺愃街笜?.頻數(shù)表的分布特征

組段

頻數(shù),f0.5~30.6~90.7~120.8~130.9~171.0~181.1~201.2~181.3~171.4~131.5~91.6~81.7~1.8

合計3160第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述1.

正態(tài)分布normaldistribution(圖2-1)

2.左偏態(tài)(skewedtotheright),也稱正偏態(tài)(positiveskewed)(圖2-2)

3.

右偏態(tài)(skewedtotheleft),也稱負偏態(tài)(negativeskewed)(圖2-3)3.正態(tài)分布與偏態(tài)分布第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述.

計量資料頻數(shù)分布與圖示——正態(tài)分布

組段

頻數(shù),f0.5~30.6~90.7~120.8~130.9~171.0~181.1~201.2~181.3~171.4~131.5~91.6~81.7~1.8

合計3160中間高、兩邊低、左右對稱如果觀察例數(shù)逐漸增多,組段不斷分細,頻數(shù)分布“中間高,兩側低”的特征會越來越明顯直方圖頂端的連線就會逐漸形成一條高峰位于中央(均數(shù)所在處),兩側逐漸降低且左右對稱,不與橫軸相交的光滑曲線圖“中間高、兩邊低、左右對稱”第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述正偏態(tài)分布:長尾向右延伸負偏態(tài)分布:長尾向左延伸計量資料頻數(shù)分布與圖示——偏態(tài)分布第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述總稱為平均數(shù)(average)反映了資料的集中趨勢(centraltendency)。常用的有:

二集中趨勢指標算術均數(shù)幾何均數(shù)G中位數(shù)M第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述正態(tài)分布非正態(tài)分布可轉換為正態(tài)分布其他分布GM計量資料的分布與平均數(shù)的關系第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

算術均數(shù)(mean)

2.常用μ表示總體均數(shù),表示樣本均數(shù)。

1.簡稱均數(shù)3.應用條件:適用于正態(tài)或近似正態(tài)的資料。

Xf(X)m第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述均數(shù)計算方法Σ為求和符號,讀成sigma

②加權法:利用頻數(shù)表,用組中值計算①直接計算法:用原始數(shù)據(jù)直接計算第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述②加權法:當數(shù)據(jù)較少時,可用直接法計算大樣本,即資料數(shù)據(jù)較多時,?,F(xiàn)將資料整理成頻數(shù)表,再用加權法計算加權法的計算原理:以組中值代替原始數(shù)據(jù)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

組段

頻數(shù),f

組中值,XfX0.5~30.551.650.6~90.655.850.7~120.759.000.8~130.8511.050.9~170.9516.151.0~181.0518.901.1~201.1523.001.2~181.2522.501.3~171.3522.951.4~131.4518.851.5~91.5512.401.6~81.6514.851.7~1.8

合計31.755.25160182.30加權計算法1.計算組中值:組中值指組段的中間值第一組段的組中值X=(0.5+0.6)÷2=0.55第二組段的組中值X=(0.6+0.7)÷2=0.65

其他組段以此類推2.計算各組的fX即各組的f和X的乘積第一組段的fX=3×0.55=1.65第二組段的fX=9×0.65=5.85

其他組段以此類推3.計算ΣfX=182.30

ΣfΣfXX=4.計算=182.30/160=1.14第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述加權法的原理

組段

頻數(shù),f

組中值,XfX0.5~30.551.650.6~90.655.850.7~120.759.000.8~130.8511.050.9~170.9516.151.0~181.0518.901.1~201.1523.001.2~181.2522.501.3~171.3522.951.4~131.4518.851.5~91.5512.401.6~81.6514.851.7~1.8

合計31.755.25160182.30在頻數(shù)表中,160個數(shù)據(jù)的原始數(shù)值已無法得知以組段0.6~為例,該組含9個數(shù)據(jù),數(shù)值均在0.6~0.7之間,如將7個數(shù)據(jù)值都以中間值0.65代替,則該組段fX=5.85,可看成是9個0.65之和以此類推,182.30實際是160個組中值之和第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述大樣本資料可用直接法計算均數(shù)嗎?直接法和加權法公式中,分子內“X”的含義有何區(qū)別?同一資料用直接法和加權法計算均數(shù),何種結果更精確?均數(shù)與平均數(shù)有何區(qū)別?討論第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述適用條件:呈倍數(shù)關系的等比資料或對數(shù)正態(tài)分布(正偏態(tài))資料,如抗體滴度資料

幾何均數(shù)(geometricmean)計算方法:1.直接計算法

2.加權法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述幾何均數(shù):變量對數(shù)值的算術均數(shù)的反對數(shù)。幾何均數(shù)(geometricmean)——直接計算法

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述如抗體滴度資料血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)幾何均數(shù)(geometricmean)——直接計算法

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷f·lgX⑸1:2.5

1:101:401:1601:640

合計141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.1032幾何均數(shù)(geometricmean)——加權法

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述為什么血清抗體滴度的幾何均數(shù)加權法計算不用組中值?正態(tài)分布資料為什么選用算術均數(shù)表

示集中趨勢?討論第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號為Md或M,反映一批觀察值在位次上的平均水平。

適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

中位數(shù)(median)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述直接法加權法中位數(shù)計算方法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

先將觀察值按從小到大順序排列,再按以下公式計算:特點:僅僅利用了中間的1~2個數(shù)據(jù)中位數(shù)計算方法——直接法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述例如:某病有患者7人,其潛伏期分別為5d,6d,7d,8d,9d,10d,20d,求中位數(shù)。觀察值個數(shù)為奇數(shù),中位數(shù)所在位次為(n+1)/2=(7+1)/2=4本例:M=X4=8中位數(shù)計算方法——直接法計算第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述直接法加權法中位數(shù)計算方法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述中位數(shù)計算方法——加權法

計算關鍵:

計算公式:以n/2,找出中位數(shù)所在組段第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

組段

頻數(shù),f

累計頻數(shù)Sf0.5~330.6~9120.7~12240.8~13370.9~17541.0~18721.1~20921.2~181101.3~171271.4~131401.5~91491.6~81571.7~1.8

合計3160160中位數(shù)計算方法——加權法計算以n/2得80,表示中位數(shù)排序在第80位。從累計頻數(shù)可見,在組段“1.1~”前累計了92個數(shù)據(jù),排序第73-92位,含第80位數(shù)(中位數(shù))已知中位數(shù)所在組段為“1.1~”=1.1+0.1×

[(160x50%-72)/20

=1.14第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述均數(shù)、中位數(shù)正態(tài)分布時:均數(shù)=中位數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)負偏態(tài)分布時:均數(shù)<中位數(shù)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述集中趨勢指標小結1.即計量資料分布與平均數(shù)的選擇2.計量資料的分布與統(tǒng)計分析

分布類型

算術均數(shù)幾何均數(shù)中位數(shù)正態(tài)分布√×√對數(shù)正態(tài)分布×√√其他分布××√正態(tài)分布非正態(tài)分布可轉換為正態(tài)分布其他分布應用手段豐富應用手段有限第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

反映數(shù)據(jù)的離散度(Dispersion)。即個體觀察值的變異程度。常用的指標有:

1.

極差(Range)(全距)

2.

百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.

方差

Variance

4.

標準差StandardDeviation

5.

變異系數(shù)

CoefficientofVariation

三離散程度指標第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述盤編號甲乙丙14404804902460490495350050050045405105055560520510合計250025002500均數(shù)500500500

例:設甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結果如下(萬/mm3)甲乙丙離散程度指標第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述優(yōu)點:簡便缺點:1.只利用了兩個極端值

2.n大,R也會大

3.不穩(wěn)定12040201.極差(Range)(全距)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述百分位數(shù):數(shù)據(jù)從小到大排列;在第x百分位次所對應的值。記為Px。四分位間距:Q=P75-P25P100(max)P75P50(中位數(shù))P25P0(min)Px2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述百分位數(shù)計算方法

計算關鍵:

計算公式:以x%,找出Px所在組段L:Px所在組段的下限

i:Px所在組段的組距fx:Px所在組段的頻數(shù)

ΣfL:為小于L的各組段的累計頻數(shù)

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

組段

頻數(shù),f

累計頻數(shù)Sf累計頻率0.5~331.9(0~1.9)0.6~9127.5(1.9~7.5)0.7~122415.0(7.5~15.0)0.8~133723.1(15.2~23.1)0.9~175433.8(23.1~33.8)1.0~187245.0(33.8~45.0)1.1~209257.5(45.0~57.5)1.2~1811068.8(57.5~68.8)1.3~1712779.4(68.8~79.4)1.4~1314087.5(79.4~87.5)1.5~914993.1(87.5~93.1)1.6~815798.1(93.1~98.1)1.7~1.8

合計3160100.0(98.1~100)160百分位數(shù)的計算例:計算P25從累計頻率可見,表示P25在組段“0.9~”P25=0.9+0.1x[(160x25%-37)/17]=0.92P75

=1.3+0.1x[(160x75%-110)/17]=1.36

Q=1.36-0.92=0.44例:計算P75從累計頻率可見,表示P75在組段“1.3~”第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述(2)確定醫(yī)學參考值范圍

(referencerange):指所謂“正常人”的解剖、生理、生化等指標的波動范圍。95%醫(yī)學參考值范圍表示有95%正常個體的測量值在此范圍。百分位數(shù)的應用(1)中位數(shù)M與四分位間距Q一起使用,描述偏態(tài)分布資料的特征第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述百分位數(shù)的應用——確定醫(yī)學參考值范圍

P2.5P97.5

雙側95%正常值范圍:

P2.5~P97.5

單側95%正常值范圍:<P95(上限)

>P5

(下限)適用于偏態(tài)分布資料

P5P95第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述百分位數(shù)的應用——確定醫(yī)學參考值范圍

例:1.確定正常成年男子血紅蛋白的醫(yī)學參考值范圍

雙側:

P2.5~P97.5

2.確定正常成年男子尿鉛的醫(yī)學參考值范圍

過低為異常,單側:<P95(上限)

3.確定正常成年男子肺活量的醫(yī)學參考值范圍

過高為異常,單側:

>P5

(下限)

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

方差

(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。應用條件:適用于正態(tài)或近似正態(tài)分布資料意義:方差大,表示觀察值的變異度大;反之,方差小,表示觀察值的變異度小。3.方差第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述離均差Σ(X-μ)=0方差——公式總體方差樣本方差離均差平方和Σ(X-μ)2

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述優(yōu)點:考慮了每個數(shù)值考慮觀察值個數(shù)N的影響缺點:將原變量單位平方了方差——優(yōu)缺點第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

標準差

(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。4.標準差

適用于正態(tài)或近似正態(tài)分布資料

S大,表示觀察值的變異度大,數(shù)據(jù)分散“矮胖”;應用條件:意義:

反之,S小,表示觀察值的變異度小,數(shù)據(jù)集中“瘦高”。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述標準差——計算樣本標準差總體標準差直接法頻數(shù)表法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述盤編號甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計250025002500標準差50.9915.817.91標準差的計算第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

組段

(1)

頻數(shù),f(3)

組中值,X(4)fX(5)=(3)×(4)fX2(5)=(3)×(4)20.5~30.551.650.910.6~90.655.853.800.7~120.759.006.750.8~130.8511.059.390.9~170.9516.1515.341.0~181.0518.9019.851.1~201.1523.0026.451.2~181.2522.5028.131.3~171.3522.9530.981.4~131.4518.8527.331.5~91.5513.9521.621.6~81.6513.2021.781.7~1.8

合計31.755.259.19160182.30221.52方差=(221.52-182.302/160)/(160-1)=0.0869標準差=0.29方差、標準差的計算第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述①觀察指標單位不同,如身高、體重

②同單位資料,但均數(shù)相差懸殊均數(shù)

標準差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

5.變異系數(shù)(coefficientofvariation,CV)計算公式:適用條件:第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述1.極差較粗,適合于任何分布2.標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標和變異指標分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標準差;

偏態(tài)分布:中位數(shù)、四分位間距變異指標小結第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

正態(tài)分布(normaldistribution)也叫高斯分布(Gaussiandistribution),是最常見、最重要的一種連續(xù)型分布,頻數(shù)分布高峰位于中部,左右兩側大致對稱。

1.正態(tài)分布的特征

2.標準正態(tài)分布

3.正態(tài)分布的應用

四正態(tài)分布分布及其應用

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述圖形特點:鐘型(中間高、兩頭低、左右對稱)正態(tài)分布記為N(μ,σ2)或N(μ,σ)μ為位置參數(shù),決定曲線的位置;σ為形態(tài)參數(shù)決定曲線的形狀最高處對應于X軸的值就是均數(shù)曲線下面積為1Xf(X)m1.正態(tài)分布的特征第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述2.標準正態(tài)分布標準正態(tài)分布(standardnormaldistribution)的兩個參數(shù)為:μ=0,σ=1記為

N(0,1)

經標準正態(tài)變量u

變換:一般正態(tài)分布N(μ,σ2)

被轉化為標準正態(tài)分布N(0,1);其中

一般正態(tài)分布為一個分布族:N(μ,σ2)

;標準正態(tài)分布只有一個N(0,1)

;這樣簡化了應用

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-統(tǒng)計描述0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%曲線下面積分布規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論