定量變量的統(tǒng)計描述_第1頁
定量變量的統(tǒng)計描述_第2頁
定量變量的統(tǒng)計描述_第3頁
定量變量的統(tǒng)計描述_第4頁
定量變量的統(tǒng)計描述_第5頁
已閱讀5頁,還剩94頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于定量變量的統(tǒng)計描述第一頁,共一百頁,2022年,8月28日定量變量的統(tǒng)計描述統(tǒng)計圖表統(tǒng)計指標:集中趨勢指標離散趨勢指標

利用統(tǒng)計表對數(shù)據(jù)進行概括,用統(tǒng)計圖對分布形態(tài)及分布間的關系做直觀的表達,用于描述定量資料的統(tǒng)計指標的意義與計算。第二頁,共一百頁,2022年,8月28日一、頻率分布表與頻率分布圖

(Frequency/Frequencydistribution)二、描述平均水平統(tǒng)計指標

(Descriptionofcentraltendency)

【教學內(nèi)容】三、描述變異程度統(tǒng)計指標

(Descriptionoftendencyofdispersion)

第三頁,共一百頁,2022年,8月28日四、描述分布形態(tài)統(tǒng)計指標

(Descriptionofdistribution)五、統(tǒng)計表與統(tǒng)計圖

(statisticaltable,statisticchart)

【教學內(nèi)容】

第四頁,共一百頁,2022年,8月28日變量統(tǒng)計學

衛(wèi)生統(tǒng)計學

研究內(nèi)容定性變量定量變量統(tǒng)計描述統(tǒng)計推斷隨機性現(xiàn)象概率論數(shù)理統(tǒng)計第五頁,共一百頁,2022年,8月28日統(tǒng)計描述:從資料中獲取信息最基本的方法

把握資料基本的特征為統(tǒng)計分析打下基礎第六頁,共一百頁,2022年,8月28日表2-2

120名18-35歲健康男性居民血清鐵含量(umol/L)7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.417.3229.6419.6921.6923.917.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.422.5517.5516.117.9820.132114.5619.8919.8217.4814.8918.3719.517.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.421.3617.1413.7712.520.420.319.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.911.7424.6614.1816.52第七頁,共一百頁,2022年,8月28日目的:描述該組18-35歲健康男性居民血清鐵含量的分布規(guī)律。問題1.該組居民血清鐵含量平均值多少?問題4.用表/圖表示血清鐵分布?問題2.血清鐵含量范圍?最高多少?最低多少?問題3.血清鐵含量主要集中在哪個范圍??集中趨勢頻數(shù)表頻數(shù)分布圖離散趨勢第八頁,共一百頁,2022年,8月28日【教學要求】

了解頻數(shù)分布表的編制方法及應用

掌握數(shù)值變量資料的平均水平、變

異程度常用統(tǒng)計描述指標,及各自的應用。第九頁,共一百頁,2022年,8月28日第一節(jié)

頻數(shù)與頻數(shù)分布

頻數(shù)(frequency):對一個隨機變量做重復觀察,其中某變量值出現(xiàn)的次數(shù)。

頻數(shù)分布表(frequencydistributiontable):將各變量值及其相應的頻數(shù)列成表格的形式。

例2-2

抽樣調(diào)查某地120名18歲~35歲健康男性居民血清鐵含量(μmol/L),試編制頻數(shù)分布表。頻數(shù)表的編制:一、連續(xù)型定量變量的頻數(shù)分布第十頁,共一百頁,2022年,8月28日(二)連續(xù)型變量頻數(shù)表的編制方法:求全距列表劃記步驟:寫組段定組距第十一頁,共一百頁,2022年,8月28日⒈求全距(Range,簡記R):是一組資料中

最大值(Xmax)與最小值(Xmin)之差,亦稱極差。全距(R)=Xmax-Xmin=29.64–7.42=22.22(

umol/L)7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.417.3229.6419.6921.6923.917.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.422.5517.5516.117.9820.132114.5619.8919.8217.4814.8918.3719.517.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.421.3617.1413.7712.520.420.319.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.911.7424.6614.1816.52第十二頁,共一百頁,2022年,8月28日2.定組距:將全距分為若干段,稱為組段。

組與組之間的距離,稱為組距;用小寫i表示。原則:(1)“組段”數(shù)一般為8-15個;

(2)“組距”一般為R/10取整;

(3)為計算方便根據(jù)組距采取取整數(shù)方法

本例題:組距(i)=全距/預分組段=22.22

/10=2.22≈2(umol/L

)第十三頁,共一百頁,2022年,8月28日3.寫組段:即將全距分為若干段的過程。

原則:(1)第一組段要包括Xmin,最末組段包括Xmax

;(2)每組段均用下限值加“~

”表示,最終組段同時注明上下限。

注意:各組段不能重疊,每一組段均為半開半閉區(qū)間。4.列表劃記:根據(jù)預定的組段和組距,用

劃記的方法整理原始資料。第十四頁,共一百頁,2022年,8月28日

表2-3120名18-35歲健康男性居民血清鐵含量的頻數(shù)分布表6~8~10~12~14~16~18~20~22~24~26~28~30

合計一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841組段劃記頻數(shù)120第十五頁,共一百頁,2022年,8月28日表2.2120名18-35歲健康男性居民血清鐵含量(umol/L)頻數(shù)表組段頻數(shù)頻率%累計頻數(shù)累計頻率%6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合計120100.0第十六頁,共一百頁,2022年,8月28日特點:中間高、兩側逐漸下降、左右基本對稱的分布--直方圖(直條間連續(xù)),用于表達連續(xù)型變量的頻數(shù)分布。頻數(shù)直方圖(frequencydistributionfigure)

:根據(jù)頻數(shù)分布表,以變量值為橫坐標,頻數(shù)為縱坐標,繪制的直方圖。第十七頁,共一百頁,2022年,8月28日

的頻數(shù)是7,

頻率為7.3%,進行3次檢查

的頻數(shù)是11,

頻率

11.5%,……,進行5次以上檢查的

頻數(shù)是12,頻率為12.5%。

進行0次檢查的頻數(shù)是4,其頻率為4.2%,

進行1次

檢查

0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,……,4,7二、離散型定量變量的頻數(shù)分布例2-1(P11)第十八頁,共一百頁,2022年,8月28日離散型變量的頻數(shù)分布表每一個組段就是一個固定的取值第十九頁,共一百頁,2022年,8月28日

離散型變量的頻數(shù)分布圖

直條圖

橫坐標為產(chǎn)前檢查次數(shù);縱坐標為頻率,即產(chǎn)前檢查K次的婦女在被統(tǒng)計婦女中所占的比例%。圖中等寬矩形長條的高度與相應檢查次數(shù)的頻率呈正比。第二十頁,共一百頁,2022年,8月28日

頻率:各組的頻數(shù)除以總例數(shù)n所得的比值。頻率描述了各組頻數(shù)在全體中所占的比重,各組

頻率之和等于100%。累計頻數(shù):本組段的頻數(shù)與以前各組段的頻數(shù)

相加;

累計頻率:每組段的累計頻數(shù)除以總例數(shù)。

第二十一頁,共一百頁,2022年,8月28日

三、頻數(shù)分布的兩個特征

集中趨勢:血清鐵含量向中央部分集中,即中等含量者居多,集中在18這個組段,這種現(xiàn)象為集中趨勢。離散趨勢:從中央部分到兩側的頻數(shù)分布逐漸減少,而且血清鐵含量的值參差不齊,最低的接近6,最高的接近30,這種現(xiàn)象稱為離散趨勢。由于同質性,所有實測值趨向同一數(shù)值的趨勢稱為集中趨勢。離散趨勢或變異程度是指觀察值之間參差不齊的程度。第二十二頁,共一百頁,2022年,8月28日血清膽固醇組段(1)劃記(2)頻數(shù)(3)

2.30~

2.60~

2.90~

3.20~

3.50~

3.80~

4.10~

4.40~

4.70~

5.00~

5.30~

5.60~

一下正一正下正正正丅正正正正正正正丅正正丅正止正丅一

1368172017129521表2-2某地101名正常成年女子血清總膽固醇的頻數(shù)表合計

140從中央部分到兩側的頻數(shù)分布逐漸減少、血清膽固醇的的值參差不齊——離散趨勢血清膽固醇值向中央部分集中,即中等含量者居多—集中趨勢第二十三頁,共一百頁,2022年,8月28日

頻數(shù)分布

四、頻數(shù)分布的類型對稱分布型:指集中位置在正中,左右兩側頻數(shù)分布大體對稱。偏態(tài)分布型:指集中位置偏向一側,頻數(shù)分布不對稱。偏態(tài)分布正偏態(tài)分布:集中位置偏向數(shù)值小的一側。負偏態(tài)分布:集中位置偏向數(shù)值大的一側。第二十四頁,共一百頁,2022年,8月28日第二十五頁,共一百頁,2022年,8月28日第二十六頁,共一百頁,2022年,8月28日第二十七頁,共一百頁,2022年,8月28日(三)頻數(shù)表的用途:1.揭示變量的分布特征

圖3.1某市100名8歲男童身高(cm)的頻數(shù)分布離散趨勢(tendencyofdispersion)集中趨勢與離散趨勢結合能全面反映頻數(shù)的分布特征集中趨勢(centraltendency)

身高(cm)頻數(shù)分布特征第二十八頁,共一百頁,2022年,8月28日2.揭示變量的分布類型

頻數(shù)分布偏態(tài)分布正偏

負偏集中部位在中部,兩端漸少,左右兩側的基本對稱,為對稱(正態(tài))分布。

對稱分布集中部位偏于較小值一側(左側),較大值方向漸減少,為正偏態(tài)分布。集中部位偏于較大值一側(右側),較小值方向漸減少,為負偏態(tài)分布。第二十九頁,共一百頁,2022年,8月28日4.便于進一步計算統(tǒng)計指標和統(tǒng)計分析3.便于發(fā)現(xiàn)某些離群值或極端值。

圖3.1某市101名8歲男童身高(cm)的頻數(shù)分布身高(cm)頻數(shù)第三十頁,共一百頁,2022年,8月28日

一.集中趨勢統(tǒng)計指標:反映總體內(nèi)部的同質。

二.離散度統(tǒng)計指標:反映總體內(nèi)個體間的變異。

三.分布形態(tài)統(tǒng)計指標:反映高峰的形態(tài)。

第二節(jié)描述平均水平的統(tǒng)計指標第三十一頁,共一百頁,2022年,8月28日平均數(shù):描述一組同質計量資料的集中趨勢;反映一組觀察值的平均水平。常用的平均數(shù)有算術均數(shù),幾何均數(shù)和中位數(shù)。(一)算術均數(shù)(mean):簡稱均數(shù),總體均數(shù)用希臘字母μ表示,樣本均數(shù)用拉丁字母表示。

1.計算方法

1)直接法:適用于樣本例數(shù)n較少的資料。

其中X1,X2…Xn為各變量值,n為樣本例數(shù)。第三十二頁,共一百頁,2022年,8月28日

2)加權法:適用于變量值較多的資料。

K=1、2、3….,fk為第k組段的頻數(shù),X0k為第k組段的組中值,組中值=(本組段下限+下組段下限)/2。權即頻數(shù)多,權數(shù)大,作用也大,頻數(shù)小,權數(shù)小,作用也小。第三十三頁,共一百頁,2022年,8月28日10,10,10,15,1510有3個,權數(shù)為3,計算均數(shù)時起3/5的作用——頻數(shù)多,權數(shù)大,作用大15有2個,權數(shù)為2,計算均數(shù)時起2/5的作用——頻數(shù)小,權數(shù)小,作用小第三十四頁,共一百頁,2022年,8月28日

例2-3某年某醫(yī)院8名女性晚期肺癌患者紅細胞計數(shù)(1012/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術均數(shù)。

例2-4求例2-2中某地120名18-35歲健康男性居民的血清鐵含量的均數(shù)。第三十五頁,共一百頁,2022年,8月28日120名18-35歲健康男性居民血清鐵含量均數(shù)、標準差計算表(加權法)

組段頻數(shù)(f)組中值(X0)fX0(1)(2)(3)(4)=(2)(3)(5)=(3)(4)

6~8~10~12~14~16~18~20~22~24~26~28~30

合計

120(∑f)2228(∑fX0)43640()13681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841第三十六頁,共一百頁,2022年,8月28日2.算數(shù)均數(shù)的應用

它最適用于對稱分布資料,尤其是正態(tài)分布資料。因為這時均數(shù)位于分布的中心,最能反映資料的集中趨勢。第三十七頁,共一百頁,2022年,8月28日

(二)幾何均數(shù)(geometricmean):

(幾何均數(shù)也稱為倍數(shù)均數(shù),用G表示)

1.幾何均數(shù)的計算方法

1)直接法:適用于樣本例數(shù)n較少的資料。將n個觀察值X1,X2,X3…Xn的乘積開n次方

對數(shù)形式:G=lg-1{(lgX1+lgX2+lgX3+…lgXn)/n}

=lg-1(∑lgX/n)第三十八頁,共一百頁,2022年,8月28日

例2-57名慢性遷延性肝炎患者的HBsAg滴度資料為1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效價。7份HBsAg的平均滴度為1:64第三十九頁,共一百頁,2022年,8月28日2)加權法:適用于樣本例數(shù)n較多的資料。X1,X2…Xn為各組段的滴度或滴度倒數(shù)。f1,f2…fn分別為各組段的頻數(shù)。第四十頁,共一百頁,2022年,8月28日

例2-652例慢性肝炎患者的HBsAg滴度數(shù)據(jù)見表,求其平均滴度。

52例慢性肝炎患者的HBsAg滴度的幾何均數(shù)為1:119.74705第四十一頁,共一百頁,2022年,8月28日

二)幾何均數(shù)應用的注意事項:

1)幾何均數(shù)常用于等比資料或對數(shù)正態(tài)分布資料。

2)觀察值中不能有0。

3)觀察值中不能同時有正值和負值。

第四十二頁,共一百頁,2022年,8月28日練習題:1.有8份血清的抗體效價分別為:

1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640

求平均抗體效價。2.有50人的血清抗體效價,分別為:

5人1:10,9人1:20,20人1:40,10人1:80,6人1:160

求平均抗體效價。第四十三頁,共一百頁,2022年,8月28日

中位數(shù)(median,M):將一組變量值從小到大按順序排列,位次居中的那個變量值就是中位數(shù)。

(三)中位數(shù)和百分位數(shù)

百分位數(shù)(percentile,Px):指把數(shù)據(jù)從小到大排列后位于第X%位置的數(shù)值。有n個觀察值X1,X2…Xn,把他們由小到大按順序排列成X1≤X2≤X3…≤Xn,將這n個觀察值平均的分為100等份,對應于每一等份的數(shù)值就是一個百分位數(shù),對應于前面X%個位置的數(shù)值稱為第X百分位數(shù),用Px表示。

一個百分位數(shù)Px將總體或樣本的全部觀察值分為兩部分,理論上,在不包括Px的全部數(shù)據(jù)中有X%的觀察值比它小,有(100-X)%的觀察值比它大。第四十四頁,共一百頁,2022年,8月28日

1.中位數(shù)和百分位數(shù)的計算

1)直接法:適用于樣本例數(shù)n較少的資料。

將觀察值按大小順序排列,當n為奇數(shù)時,中

間那個數(shù)就是中位數(shù)。當n為偶數(shù)時,中間兩個數(shù)

的平均數(shù)就是中位數(shù)。

例2-7某藥廠觀察9只小鼠口服高山紅景天醇提物(RSAE)后在乏氧條件下的生存時間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0

n為奇數(shù),M=63.6(cm)第四十五頁,共一百頁,2022年,8月28日練習:1.某病患者9名,發(fā)病潛伏期分別為順序

2、3、3、3、4、5、6、9、16d,求中位數(shù)。2.某病患者8名,發(fā)病潛伏期從小到大排分別為

5、6、8、9、11、11、13、16d,

求平均潛伏期。第四十六頁,共一百頁,2022年,8月28日2)頻數(shù)表法計算中位數(shù)和百分位數(shù):適用于

樣本例數(shù)n較多的資料。

累計頻數(shù):本組段的頻數(shù)與以前各組段的頻數(shù)

相加;

累計頻率:每組段的累計頻數(shù)除以總例數(shù)。

公式為

L為百分位數(shù)所在組段的下限,i為該組段的組距,fx為該組段的頻數(shù),fL為百分位數(shù)所在組段的前一組段的累計頻數(shù),n為總例數(shù)。第四十七頁,共一百頁,2022年,8月28日例2-850例鏈球菌咽峽炎患者潛伏期(h),計算其中位數(shù)。

組段頻數(shù)累計頻數(shù)累計頻率(%)12~24~36~48~60~72~84~96~108~120

合計50112781611193811306073774542844469224896250100

第四十八頁,共一百頁,2022年,8月28日求P25,P75。第四十九頁,共一百頁,2022年,8月28日

2.中位數(shù)和百分位數(shù)的應用

1)中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢,反映位次居中的觀察值的平均水平。在對稱分布的資料中,中位數(shù)和均數(shù)在理論上是相同的。

2)百分位數(shù)可用于確定醫(yī)學參考值范圍(詳后)。

3)分布在中部的百分位數(shù)相當穩(wěn)定,具有較好的代表性,但靠近兩端的百分位數(shù),只有在樣本例數(shù)足夠多時才比較穩(wěn)定。第五十頁,共一百頁,2022年,8月28日

應用平均數(shù)的注意事項

1.平均數(shù)的計算和應用必須具備同質基礎,必須先合理分組。

不同質的事物要分別求平均數(shù),以便分析比較。

2.根據(jù)資料的分布選用適當?shù)钠骄鶖?shù)。對稱分布資料,尤其是正態(tài)分布資料,宜用均數(shù),也可用中位數(shù),而偏態(tài)分布資料則中位數(shù)的代表性較好,對數(shù)正態(tài)分布及等比級數(shù)資料宜用幾何均數(shù)。

第五十一頁,共一百頁,2022年,8月28日4.眾數(shù)(mode)

是一組觀察值中出現(xiàn)頻率最高的那個觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個組段。第五十二頁,共一百頁,2022年,8月28日例有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)?出現(xiàn)頻數(shù)最多的數(shù)值為58,故眾數(shù)為58。58歲為高血壓的高發(fā)年齡。眾數(shù)從概念上易于理解。但沒有充分利用樣本觀察值的全部信息。第五十三頁,共一百頁,2022年,8月28日

例.對甲乙兩名高血壓患者連續(xù)觀察5天,測得的收縮壓(mmHg)結果如下:

可以看出:兩患者收縮壓的均數(shù)十分接近,但甲患者的血壓波動較大,而乙患者相對穩(wěn)定。

患者第1天第2天第3天第4天第5天均數(shù)甲患者162145178142186162.6乙患者164160163159166162.4

第三節(jié)、描述變異程度的統(tǒng)計指標第五十四頁,共一百頁,2022年,8月28日

只用平均數(shù)描述資料的弊病甲組2629303134均數(shù)30kg乙組2427303336均數(shù)30kg丙組2628303234均數(shù)30kg丙乙甲三組兒童體重的離散程度第五十五頁,共一百頁,2022年,8月28日例2-11試觀察3組數(shù)據(jù)的離散情況。A組2628303234B組2427303336C組2629303134為了全面的把握數(shù)據(jù)的分布特征,通常,描述一組觀察值,除需要表示其平均水平外,還要說明它的離散或變異的情況。

第五十六頁,共一百頁,2022年,8月28日離散趨勢:用于描述一組數(shù)值變量觀察值之間參差不齊的程度,即變異程度。包括極差(Range,R)四分位數(shù)間距(Quartile,Q)方差(Variance,)標準差(Standarddeviation,S)變異系數(shù)(Coefficientofvariation,CV)第五十七頁,共一百頁,2022年,8月28日1.極差(range,R)

也稱為全距,用R表示,即一組資料中,最大值與最小值之差。

缺點:1)除了最大、最小值外,不能反映組內(nèi)其他數(shù)據(jù)的變異度。2)樣本例數(shù)越多,抽到較大或較小變量值的可能性越大,因而極差可能越大。3)即使樣本含量相同,極差也不夠穩(wěn)定。

第五十八頁,共一百頁,2022年,8月28日

1、適用條件:常用于描述單峰對稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度。

2、意義:對于計量單位相同的變量,極差越大,觀察值的離散程度越大。

3、優(yōu)點:用以說明數(shù)據(jù)分布的離散程度,方法簡單明了;理論上可用于各種分布資料

第五十九頁,共一百頁,2022年,8月28日4、缺點(1)除了最大值與最小值外,不能反映組內(nèi)其它觀察值的變異度;穩(wěn)定性差。(2)樣本較大時,抽到較大值與較小值的可能性也較大,因而樣本極差也較大,故樣本含量相差較大時,不宜用極差來比較分布的離散度。(3)當兩組樣本例數(shù)相差懸殊時,不宜選用極差作為比較兩組變異程度的指標

第六十頁,共一百頁,2022年,8月28日

2.四分位數(shù)間距(quartilerange,Q)

簡記為Q,可看為特定的百分位數(shù)。P25表示全部觀

察值中有25%(1/4)的觀察值比它小,記為下四分位數(shù)QL,P75表示全部觀察值中有75%的觀察值比它小,記為上四分位數(shù)QU。

Q適用于各種類型的連續(xù)型變量,特別是偏態(tài)分布的資料。

第六十一頁,共一百頁,2022年,8月28日

例2-8第六十二頁,共一百頁,2022年,8月28日

四分位數(shù)間距的特點:適用于描述偏態(tài)分布、一端或兩端無確切數(shù)值、分布不明確資料的離散程度。

四分位數(shù)間距越大,數(shù)據(jù)分布的變異度越大;反之,變異度越小。與中位數(shù)一起描述偏態(tài)分布資料的分布特征。作為描述數(shù)據(jù)分布離散程度的指標,比極差穩(wěn)定,但仍未考慮到每個數(shù)據(jù)的大小,未考慮全部觀察值的變異度,在統(tǒng)計分析中應用的不夠普遍。第六十三頁,共一百頁,2022年,8月28日3.方差(Variance)公式及來源:極差和四分位間距未考慮全部觀察值的變異度全面地考慮每個變量值的離散情況為了衡量每個變量值的變異;先選擇一個數(shù)值作為比較標準;誰合適呢?均數(shù)最有代表性。第六十四頁,共一百頁,2022年,8月28日應考慮總體中每個變量值x與總體均數(shù)μ之差;x-μ稱為離均差。分析:為解決這個問題,給每項離均差平方后再相加,稱離均差平方和,

即∑(x-μ)2。但每個變量值與均數(shù)相減所得到得差值有正有負相消,即∑(x-x)=0;這樣就不能反映變異的大小??

第六十五頁,共一百頁,2022年,8月28日還有沒有問題沒考慮到?

離均差平方和的大小,除與變異度有關外,還與變量值的個數(shù)(多少)有關,為在變量值個數(shù)不等時進行比較,還要除以變量值的個數(shù),所得值即為總體方差,用σ2表示:σ2=總體方差:NX?-2)(m樣本方差:

以樣本均數(shù)代表μ,用樣本例數(shù)n代表總體例數(shù)N,所得方差稱樣本方差,用S2表示:nXXS?-=22)(第六十六頁,共一百頁,2022年,8月28日公式中存在的問題?

根據(jù)以上公式研究的結果表明求得的樣本方差總是偏??;為解決此問題,英國統(tǒng)計學家通過實驗,用n-1代替可消除誤差。

n-1稱為自由度(degreeoffreedom),用希臘字母υ[nju:]表示,表示隨機變量能夠自由取值的個數(shù)。n-1XXS?-=22)(樣本方差的公式調(diào)整為:第六十七頁,共一百頁,2022年,8月28日

(n-1)稱為自由度(degreeoffreedom),用希臘字母υ[nju:]表示,表示隨機變量能夠自由取值的個數(shù)。

分析:

如有一組四個(n=4)數(shù)據(jù)的樣本,受到=5的條件限制,在自由確定4、2、5三個數(shù)據(jù)后,第四個數(shù)據(jù)只能是9,否則≠5。因而這里的自由度=n-1=4-1=3。推而廣之,任何統(tǒng)計量的自由度=n-限制條件的個數(shù)。第六十八頁,共一百頁,2022年,8月28日

方差:分總體方差,樣本方差S2●計算:●意義:克服了R值的不足,考慮了每個變量值的離散情況并消除了N的影響。●優(yōu)點:全面地考慮每個變量值的離散情況●缺點:其單位是原度量單位的平方。總體方差樣本方差第六十九頁,共一百頁,2022年,8月28日例:計算三組數(shù)據(jù)的方差

A組:24,27,30,33,36;

B組:26,28,30,32,34;

C組:26,29,30,31,34。第七十頁,共一百頁,2022年,8月28日

方差的特點適用條件:對稱分布資料,特別是正態(tài)分布或近似正態(tài)分布資料。意義:方差越大,數(shù)據(jù)間的變異越大優(yōu)點:利用了每個數(shù)據(jù)的信息,是常用的描述數(shù)據(jù)分布離散程度指標不足:度量衡單位發(fā)生了改變,不便于實際應用。為此,更常用的是標準差。第七十一頁,共一百頁,2022年,8月28日4.標準差(Standarddeviation,SD或S)方差的單位是原度量單位的平方,不便使用。將方差公式展開,并開方,即得到另一個重要的離散趨勢的指標,即標準差,簡寫為S。公式來源:總體標準差:1()2--=?nXXs樣本標準差:第七十二頁,共一百頁,2022年,8月28日1.直接法:適用于n較小的資料求例題中A組數(shù)據(jù)的標準差。2.加權法:適用于n較大的資料第七十三頁,共一百頁,2022年,8月28日120名成年男子血清鐵含量均數(shù)、標準差計算表(加權法)

組段頻數(shù)(f)組中值(X0)fX0fX02(1)(2)(3)(4)=(2)(3)(5)=(3)(4)6~8~10~12~14~16~18~20~22~24~26~28~30

合計120(∑f)2228(∑fX0)43640(∑fX02)13681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841第七十四頁,共一百頁,2022年,8月28日3.標準差的應用:

1)表示變量分布的離散程度。

2)結合均數(shù)計算變異系數(shù)。

3)結合樣本含量計算標準誤。

4)結合均數(shù)描述正態(tài)分布特征。第七十五頁,共一百頁,2022年,8月28日問題的引入例:某校一年級男大學生身高樣本均數(shù)為167.4cm,標準差為5.8cm;體重均數(shù)為57.3kg,標準差為6.4kg。試比較其變異程度的大???第七十六頁,共一百頁,2022年,8月28日

5.變異系數(shù)(coefficientofvariation,CV)

公式為:

常用于:

1)

比較度量衡單位不同的多組資料的變異度。

例2-15某年通過10省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標準差為0.98kg;身高均數(shù)為72.4cm,標準差為3.0cm,試比較二者變異度。體重CV=0.98/8.42×100%=11.64%身高CV=3.0/72.4×100%=4.14%第七十七頁,共一百頁,2022年,8月28日2).比較均數(shù)相差懸殊的幾組資料的變異度。

運用變異系數(shù)的注意事項:1.有關的事物才能比較。2.均數(shù)小于標準差時要考慮其實際運用價值。

某地不同年齡段男子身高的變異度

年齡組人數(shù)均數(shù)標準差變異系數(shù)(%)

3-3.5歲10096.13.13.2330-35歲100170.24.02.35第七十八頁,共一百頁,2022年,8月28日變異系數(shù)的特點:與前面的四種離散程度指標相比,變異系數(shù)有以下兩個不同之處:1、它描述的不是數(shù)據(jù)分布的絕對離散程度,而是相對離散程度;不屬于描述性統(tǒng)計指標,是一個用于比較的統(tǒng)計指標。2、它不像極差、四分位數(shù)間距、方差、標準差那樣具有取值單位。它沒有取值單位第七十九頁,共一百頁,2022年,8月28日

偏度系數(shù)(coefficientofskewness,SKEW)理論上,總體偏度系數(shù)為0時,分布是對稱分布;取正值時,分布為正偏峰;取負值時,分布為負偏峰。

第四節(jié)、描述分布形態(tài)的特征數(shù)第八十頁,共一百頁,2022年,8月28日

峰度系數(shù)(coefficientofkurtosis,KURT)理論上,正態(tài)分布的總體峰度系數(shù)為0;取負值時,其分布較正態(tài)分布的峰平闊;取正值時,其分布較正態(tài)分布的峰尖峭。第八十一頁,共一百頁,2022年,8月28日SKEW=-0.19393,KURT=-0.01783第八十二頁,共一百頁,2022年,8月28日

小結反映集中趨勢的指標:

算術均數(shù):對稱分布幾何均數(shù):測定值按等比級數(shù)變化中位數(shù):不規(guī)則分布反映離散度的指標:標準差(方差):對稱分布變異系數(shù):對稱分布四分位數(shù)間距:不規(guī)則分布極差(全距):不規(guī)則分布反映峰型的指標:偏度系數(shù):測定高峰的位置,分布的對稱性.

峰度系數(shù):測定峰度的高低。集中趨勢的強度.第八十三頁,共一百頁,2022年,8月28日平均數(shù)與標準差(方差)聯(lián)合應用

中位數(shù)與四分位數(shù)間距(極差)聯(lián)合應用第八十四頁,共一百頁,2022年,8月28日

統(tǒng)計表(statisticaltable)和統(tǒng)計圖(statisticalchart)是統(tǒng)計描述的重要工具。醫(yī)學科學研究資料經(jīng)過整理和計算各種必要的統(tǒng)計指標后,所得結果除了用適當文字說明以外,常用統(tǒng)計表和統(tǒng)計圖表達分析結果。統(tǒng)計圖表可以對于數(shù)據(jù)進行概括、對比或做直觀的表達。統(tǒng)計表和統(tǒng)計圖不僅便于閱讀,而且便于分析比較。

第五節(jié)統(tǒng)計圖表和統(tǒng)計圖第八十五頁,共一百頁,2022年,8月28日1.概念:指在科技報告中,常將統(tǒng)計分析的事物及其指標用表格列出,以反映事物的內(nèi)在規(guī)律性和關聯(lián)性。2.作用:1)避免繁雜的文字敘述2)便于計算3)便于事物間的比較分析

一、統(tǒng)計表第八十六頁,共一百頁,2022年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論