第定量資料的統(tǒng)計描述_第1頁
第定量資料的統(tǒng)計描述_第2頁
第定量資料的統(tǒng)計描述_第3頁
第定量資料的統(tǒng)計描述_第4頁
第定量資料的統(tǒng)計描述_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

會計學1第定量資料的統(tǒng)計描述圖3-1某年某市120名1歲男童乳牙數(shù)的頻數(shù)分布第2頁/共56頁第1頁/共56頁

二、連續(xù)型定量資料

例3-2

某市2000年l20名6歲女孩的身高(cm)資料(連續(xù)型)105.4113.2118.7119.0107.0106.8114.2101.2114.9114.1119.5 104.3113.3112.2110.7112.7110.8115.6109.2116.0105.7127.8115.8118.5115.7116.7110.3118.0113.0118.5105.8118.9124.0117.5123.1113.7124.1125.3117.8108.7106.2 103.8122.6104.0126.5116.0117.5110.3120.1113.2123.4 112.4115.0128.1110.9125.1114.4110.2112.0116.4108.3110.9120.4108.2121.2112.3121.8117.0111.4117.2113.9116.1114.4118.8116.1108.4114.5109.0116.8110.8119.8 114.1118.8116.7113.4122.2118.1121.2114.0116.7112.3 121.1116.5110.3119.1118.4106.3115.3121.0107.5112.8121.6119.2113.5112.5123.1116.6129.5112.3126.8122.8121.1124.6125.7122.5121.0124.4120.9111.3112.5第3頁/共56頁第2頁/共56頁第4頁/共56頁第3頁/共56頁頻數(shù)表編制步驟:(一)求極差:一組變量值的最大值和最小值之差,亦稱為全距R=Xmax–Xmin=129.5-101.2=28.3(cm)第5頁/共56頁第4頁/共56頁定組距:組距=極差/組數(shù)

1、確定組數(shù):一般在8~15組左右

2、確定組距(等距或不等距):組距=極差/組數(shù)=28.3/10=2.83≈33、確定各組段的上下限:連續(xù)型資料,各組段寫為半開半閉型;離散型資料,既可寫成上限開口型,也可寫成上限閉口型(二)劃分組段:第6頁/共56頁第5頁/共56頁表3-2某市120名6歲女孩身高頻數(shù)分布組段劃記頻數(shù)f累計頻率(%)(1)(2)(3)(4)99~102~105~108~111~114~117~120~123~126~129~132合計一1

0.83干33.33正干8

10.00正正正15

22.50正正正正20

39.17正正正正王24

59.17正正正王19

75.00正正正1587.50正正10

95.83王4

99.17一1

100.00120-(三)列表劃記第7頁/共56頁第6頁/共56頁第8頁/共56頁第7頁/共56頁正偏態(tài)分布集中位置偏向于左側(cè)負偏態(tài)分布集中位置偏向于右側(cè)分布類型對稱分布,最常見的是正態(tài)分布不對稱分布:正偏態(tài)分布和負偏態(tài)分布第9頁/共56頁第8頁/共56頁1、便于發(fā)現(xiàn)特大和特小的可疑值;

2、揭示資料的分布類型;

3、可以看到頻數(shù)分布的兩個特征: 集中趨勢和離散趨勢頻數(shù)分布表的用途第10頁/共56頁第9頁/共56頁第二節(jié)集中趨勢的描述

一、算術(shù)均數(shù)(mean)總體均數(shù)用μ表示,樣本均數(shù)用表示。適用條件:對稱分布,特別是正態(tài)分布。第11頁/共56頁第10頁/共56頁(二)加權(quán)法:計算公式(一)直接法:……,……,……,……?!?2頁/共56頁第11頁/共56頁

表3-3某市120名6歲女孩身高(cm)均數(shù)的計算(加權(quán)法)組段

頻數(shù)f

組中值Xfx(1)

(2)

(3)

(4)=(2)×(3)

99~102~105~108~111~114~117~120~123~126~129~132合計

1

100.5

100.5

3

103.5

310.5

8

106.5

852.0

15

109.5

1642.5

20

112.5

2250.0

24

115.5

2772.0

19

118.5

2251.5

15

121.5

1822.5

10

124.5

1245.0

4

127.5

510.0

1

130.5

130.512013887

(cm)第13頁/共56頁第12頁/共56頁適用條件:變量值的變化呈倍數(shù)變化關(guān)系,特別是對數(shù)對稱分布、對數(shù)正態(tài)分布。

二、幾何均數(shù)(geometricmean

)幾何均數(shù)用G表示。第14頁/共56頁第13頁/共56頁(一)直接法:對數(shù)形式:…幾何均數(shù),…變量值對數(shù)之和,…反對數(shù)符號(二)加權(quán)法:第15頁/共56頁第14頁/共56頁第16頁/共56頁第15頁/共56頁(1)偏態(tài)分布資料,變量分布規(guī)律不清,有少數(shù)特小值或特大值,變量值一端或兩端無確定值。

三、中位數(shù)和百分位數(shù)(一)中位數(shù)(median,M)

適用資料:(2)所有資料。理論上對稱分布資料的算術(shù)均數(shù)與M相等,對數(shù)對稱資料宜用幾何均數(shù)第17頁/共56頁第16頁/共56頁n……,……1.直接由原始數(shù)據(jù)計算中位數(shù)

當變量值較少時,將n個變量值從小到大排列后記為xi,即有x1≤x2≤…≤xnn為奇數(shù)時,n為偶數(shù)時,第18頁/共56頁第17頁/共56頁例3-6.

測定7名成年男性紅細胞數(shù)(1012/L):3.83,4.25,4.58,4.83,5.17,5.60,5.95

例3-7.

測得某市某大學8名正常女子總膽固醇(mmol/L):2.58,3.02,3.41,3.87,

4.25,4.73,5.13,5.71第19頁/共56頁第18頁/共56頁2.用頻數(shù)表計算中位數(shù)適用條件是:樣本含量(n)足夠大(n>100)—M所在組段的頻率,iM—

該組段的組距,—小于該組段的各組累計頻數(shù)。L—

該組段的下限,計算公式:眾數(shù):一組數(shù)據(jù)中出現(xiàn)的頻數(shù)最多的數(shù)據(jù),描述集中趨勢的指標。第20頁/共56頁第19頁/共56頁第21頁/共56頁第20頁/共56頁(二)百分位數(shù)(percentile)PX

將觀察值從小到大排列后,等分成100份,位于第x百分位置上的數(shù)值稱第百分之x位數(shù),記為Px。有x%的數(shù)據(jù)比Px

小,有(100~X)%的數(shù)據(jù)比Px

大,故百分位數(shù)是一個位置指標。

第22頁/共56頁第21頁/共56頁第23頁/共56頁第22頁/共56頁第三節(jié)離散程度的描述例3-10:三組同性別、同年齡兒童的體重(kg)資料如下:甲組1618202224

乙組1417202326

丙組1619202124

均數(shù)相同,都是20kg,然而這3組數(shù)據(jù)間參差不齊的程度(即變異)是不相同的第24頁/共56頁第23頁/共56頁適用于各種分布類型R=極大值-

極小值極差可用于反映各種分布資料的變異程度,簡單明了;缺點:①只涉及最大值和最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異程度;②樣本較大時,抽樣誤差大,因此抽到最大值和最小值的可能性也越大。

一、極差(range)

亦稱全距第25頁/共56頁第24頁/共56頁兩端無確切值或分布不明確資料的離散程度。相對比較穩(wěn)定,但只反映了居中間的50%數(shù)據(jù)的變異情況,仍未考慮到每個觀察值的變異情況,不能代表全部觀察值的離散程度。

二、四分位數(shù)間距

(inter-quartilerange)四分位數(shù)間距Q=QU-QL。適用條件:各種分布類型,特別是偏態(tài)分布資料、第26頁/共56頁第25頁/共56頁適用條件:對稱分布資料,特別是正態(tài)分布資料(同均數(shù));偏態(tài)資料。

三、方差(variance)

四、標準差(standarddeviation)

總體標準差—σ,樣本標準差—s第27頁/共56頁第26頁/共56頁(二)加權(quán)法:…變量值平方和…變量值和的平方(一)直接法:總體標準差第28頁/共56頁第27頁/共56頁第29頁/共56頁第28頁/共56頁(1)描述變量值分布的離散程度,標準差大,變量值分散,標準差小,變量值集中。(2)概括地估計變量值的頻數(shù)分布(3)計算正常值范圍(4)計算標準誤(統(tǒng)計推斷中常用統(tǒng)計指標)應用:第30頁/共56頁第29頁/共56頁適用于:多組資料之間變異程度的比較時,1.單位不同,2.均數(shù)相差較大。

五、變異系數(shù)

(coefficientofvariation)

計算公式:第31頁/共56頁第30頁/共56頁第32頁/共56頁第31頁/共56頁第33頁/共56頁第32頁/共56頁第四節(jié)正態(tài)分布及其應用

一、正態(tài)分布的概念和特征

正態(tài)分布(normaldistribution)是一種重要的連續(xù)型分布。在醫(yī)學衛(wèi)生領(lǐng)域中,有許多變量都近似服從正態(tài)分布,如測量誤差、許多生化指標的值和人的身高、體重等。此外,許多分布可用正態(tài)分布近似,如大樣本偏態(tài)資料的樣本均數(shù)近似正態(tài)分布,還有些分布可由正態(tài)分布導出,因此,正態(tài)分布可以說是最重要的一種分布。第34頁/共56頁第33頁/共56頁表3-7

某地某年120名12歲女孩身高(cm)的頻數(shù)分布組段

x頻數(shù)

f頻率(1)(2)(3)125~10.01129~40.03133~90.08137~280.23141~350.29145~270.23149~110.09153~40.03157~16110.01合計1201.00第35頁/共56頁第34頁/共56頁頻率

(a)12512913313714114514915315716101234身高(cm)第36頁/共56頁第35頁/共56頁(b)第37頁/共56頁第36頁/共56頁(c)

圖3-3頻數(shù)分布逐漸接近正態(tài)分布示意圖第38頁/共56頁第37頁/共56頁正態(tài)分布的概率密度函數(shù):

正態(tài)分布具有下列特性:(1)正態(tài)密度函數(shù)曲線在橫軸上方,且曲線在均數(shù)處最高。(2)正態(tài)分布以均數(shù)為中心,左右對稱。(3)曲線下面積為1。(4)正態(tài)分布的兩個參數(shù)

分別決定分布的位置和形狀。第39頁/共56頁第38頁/共56頁

圖3-4不同均數(shù)、不同標準差的正態(tài)分布示意圖第40頁/共56頁第39頁/共56頁二、正態(tài)曲線下面積的分布規(guī)律

若x~N(,),則~N(0,1)(z)=1-(-z)第41頁/共56頁第40頁/共56頁例3-17.z1=-1.50,z2=-0.31,求標準正態(tài)分布曲線下(-1.50,-0.31)區(qū)間內(nèi)面積D。查附表1得

(-1.50)=0.0668和(-0.31)=0.3783,則面積

例3-18.

已知某地某年120名7歲女孩身高=122.0cm,s=4.7cm,試估計該地7歲女孩身高介于118cm和124cm范圍內(nèi)的比例及120名7歲女孩介于此范圍內(nèi)的人數(shù)。第42頁/共56頁第41頁/共56頁

(z1)=(-0.8511)=0.1989

(z2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646D=

(z1)-

(z2)=0.6646-0.1989=0.4657故估計該地某年身高界于118cm~124cm范圍內(nèi)的7歲女孩所占比例為0.4657,即46.57%。估計120名7歲女孩中身高界于118cm~124cm范圍內(nèi)的人數(shù)為12046.57%56名。第43頁/共56頁第42頁/共56頁第44頁/共56頁第43頁/共56頁三、參考值范圍

參考值范圍(referencerange)也稱為正常值范圍。醫(yī)學參考值是指包括絕大多數(shù)正常人的某指標值范圍,由于存在著個體差異,正常人的解剖,生理,生化等各種指標并非常數(shù),而是在一定范圍內(nèi)波動,故采用醫(yī)學參考值范圍(medicalreferencerange)作為判定正常和異常的參考標準。對于服從正態(tài)分布的指標,可根據(jù)正態(tài)分布的面積分布規(guī)律制定其參考值范圍;對于不服從正態(tài)分布的指標,可先進行變量變換使之服從正態(tài)分布或直接利用百分位數(shù)法制定其參考值范圍。第45頁/共56頁第44頁/共56頁制定醫(yī)學參考值范圍的基本步驟:1.從正常人群中抽樣,樣本含量要足夠大:所謂“正常人”并不是指完全健康的人,而是指排除了影響所研究指標的疾病和有關(guān)因素的同質(zhì)人群。3.確定是否需要分組制定參考值范圍4.決定取雙側(cè)還是取單側(cè)5.選定合適的百分界限6.對資料的分布作正態(tài)性檢驗7.根據(jù)資料的分布類型選用適當?shù)姆椒▉砉烙媴⒖贾捣秶?。?6頁/共56頁第45頁/共56頁(1)正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布的資料。

雙側(cè)參考值范圍

單側(cè)參考值范圍上限

單側(cè)參考值范圍下限

第47頁/共56頁第46頁/共56頁

例3-19.某地調(diào)查156名正常成年男子的紅細胞數(shù),資料近似正態(tài)分布,計算得均數(shù),s=0.441012

L。下限:-1.96s=5.38-.96×0.44=4.521012L

上限:+1.96s=5.38+1.96×0.44=6.241012L

μ的95%參考值范圍為4.52~6.24(×1012L)。(2)百分位數(shù)法:適用于任何分布類型的資料。但常用于經(jīng)過數(shù)據(jù)轉(zhuǎn)換仍然不呈正態(tài)分布或分布不明的資料。第48頁/共56頁第47頁/共56頁例3-20.用硫酸—高錳酸鉀—硝酸消化法和無火焰原子吸收光譜法測得某市238名正常人的發(fā)汞值第49頁/共56頁第48頁/共56頁第50頁/共56頁第49頁/共56頁datali3_2;inputx@@;cards;105.4113.2118.7119.0107.0106.8114.2101.2114.9114.1119.5104.3113.3112.2110.7112.7110.8115.6109.2116.0105.7…

…;proc

univariatenormal;run;第51頁/共56頁第50頁/共56頁

最佳選擇題1.描述一組偏態(tài)分布資料的變異度,以()指標較好。A.全距B.標準差C.變異系數(shù)D.四分位數(shù)間距E.方差2.用均數(shù)和標準差可全面描述()資料的特征。A.正偏態(tài)分布B.負偏態(tài)分布C.正態(tài)分布D.對稱分布E.對數(shù)正態(tài)分布3.各觀察值均加(或減)同一數(shù)后,()。A.均數(shù)不變,標準差變B.均數(shù)變,標準差不變C.兩者均不變D.兩者均變E.以上都不對4.比較身高和體重兩組數(shù)據(jù)變異度大小宜采用()。A.變異系數(shù)B.方差C.全距D.標準差E.四分位數(shù)間距5.偏態(tài)分布宜用()描述其分布的集中趨勢。A.算術(shù)均數(shù)B.標準差C.中位數(shù)D.幾何均數(shù)E.平均值第52頁/共56頁第51頁/共56頁6.各觀察值均乘以同一不等于0的數(shù)后,()不變。A.算術(shù)均數(shù)B.標準差C.中位數(shù)D.幾何均數(shù)√E.變異系數(shù)7.()分布資料,均數(shù)等于中位數(shù)。A.正偏態(tài)B.負偏態(tài)C.正態(tài)D.偏態(tài)E.對數(shù)正態(tài)8.對數(shù)正態(tài)分布是一種()分布。A.偏態(tài)B.負偏態(tài)C.正態(tài)√

D.右偏態(tài)E.對稱9.最?。ù螅┙M段無下(上)限的頻數(shù)分布資料,可用()描述其集中趨勢。A.均數(shù)B.標準差C.中位數(shù)D.幾何均數(shù)E.四分位數(shù)間距10.血清學滴度資料常用來表示其平均水平的指標是()。A.算術(shù)均數(shù)B.標準差C.中位數(shù)D.幾何均數(shù)E.變異系數(shù)第53頁/共56頁第52頁/共56頁

11.以下指標中()可用來描述定量資料的離散程度。

A.算術(shù)平均數(shù)B.幾何平均數(shù)

C.極差D.中位數(shù)

12.偏態(tài)分布資料宜用()描述其分布的趨勢。

A.算術(shù)平均數(shù)B.中位數(shù)

C.四分位數(shù)間距D.方差13.用均數(shù)和標準差可全面描述()資料的分布特征。

A.正態(tài)分布B.偏態(tài)分布

C.對稱分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論