變異程度的統(tǒng)計描述_第1頁
變異程度的統(tǒng)計描述_第2頁
變異程度的統(tǒng)計描述_第3頁
變異程度的統(tǒng)計描述_第4頁
變異程度的統(tǒng)計描述_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

變異程度的統(tǒng)計描述第一頁,共五十五頁,編輯于2023年,星期日離散趨勢(dispersiontendency)指標三組同年齡、同性別兒童的體重(kg)

甲組2628303234

乙組2427303336

丙組2629303134

303030第二頁,共五十五頁,編輯于2023年,星期日

全距表示一群變量值的最大值與最小值之差,反映個體差異的范圍,用R表示。全距大,說明變異度大;反之,說明變異度小。甲組2628303234

乙組2427303336R=8R=12全距(range)第三頁,共五十五頁,編輯于2023年,星期日1.不能全面反映資料的離散程度;2.不穩(wěn)定,易受極端值的影響,抽樣誤差大。優(yōu)點缺點1.表示變異范圍,簡單明了、容易使用,如用于說明傳染病、食物中毒等的最短、最長潛伏期等;2.各種分布類型的資料均可用。全距(range)第四頁,共五十五頁,編輯于2023年,星期日四分位數(shù)間距(quartileinterval)四分位數(shù)間距是上四分位數(shù)(QU=P75)和下四分位數(shù)(QL=P25)之差,用Q表示(QU-QL)。該數(shù)值越大,說明變異度越大;反之,說明變異度越小。第五頁,共五十五頁,編輯于2023年,星期日某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂頻數(shù)累計頻數(shù)累計頻率(%)0.10~

27

27

4.30.40~169196

31.10.70~167363

57.61.00~

94457

72.51.30~

81538

85.41.60~

42580

92.11.90~

28608

96.52.20~

14622

98.72.50~

4626

99.42.80~

3629

99.83.10~

1630100.0合計630

-

-第六頁,共五十五頁,編輯于2023年,星期日

L:組段的下限;iM:組距;fx:頻數(shù);

fL:Px所在組段之前的累積頻數(shù)。

第七頁,共五十五頁,編輯于2023年,星期日1.與中位數(shù)配套,用于偏態(tài)分布資料及分布的一端或兩端無確切數(shù)值的資料;2.比全距穩(wěn)定。未考慮到每個觀察值的變異度。優(yōu)點缺點四分位數(shù)間距(quartileinterval)第八頁,共五十五頁,編輯于2023年,星期日方差(variance)自由度=n-限制條件的個數(shù),用ν表示。(n-1):當選定時,n個變量值中能自由變動的變量值的個數(shù)。第九頁,共五十五頁,編輯于2023年,星期日二、平均差距指標(一)平均偏差(MeanDifference)

如對于例3.1:甲患者:

乙患者:

特點:直觀,易理解;但由于用了絕對值,不便于數(shù)學處理,實際中很少使用。

第十頁,共五十五頁,編輯于2023年,星期日(二)離均差平方和(SumofSquare,SS)

為了克服平均偏差的缺點,可以不通過取絕對值,而是通過取平方來避免正負抵消,即使用離均差平方和,其計算公式為

SS通常作為一個中間統(tǒng)計量使用。第十一頁,共五十五頁,編輯于2023年,星期日(三)方差(Variance)

方差是將離均差平方和再取平均,即

注意:對于樣本資料,分母用的是n-1,稱為自由度(degreeoffreedom,df)。方差的特點:便于數(shù)學上的處理,但由于有平方,度量衡發(fā)生變化,不便于實際應用。第十二頁,共五十五頁,編輯于2023年,星期日方差越大,資料的離散程度越大(全面考慮了每個觀察值);不受觀察值個數(shù)的影響。優(yōu)點缺點一些資料不適用于以平方表示。方差(variance)第十三頁,共五十五頁,編輯于2023年,星期日(四)標準差

(StandardDeviation)

將方差取平方根,還原成與原始觀察值單位相同的變異量度即為標準差:

例如對于例3.1經(jīng)計算有甲患者:

同理乙患者:第十四頁,共五十五頁,編輯于2023年,星期日例三組同年齡、同性別兒童的體重(kg)甲組2628303234乙組2427303336丙組2629303134標準差直接法第十五頁,共五十五頁,編輯于2023年,星期日標準差加權法第十六頁,共五十五頁,編輯于2023年,星期日14歲女孩身高平均值與標準差(cm)加權法計算用表身高(cm)頻數(shù)(fi)組中值(X)fiXifiXi2124~212625231752128~313039050700132~111341474197516136~221383036418968140~391425538786396144~271463942575532148~161502400360000152~5154770118580156~315847474892160~164216232452488合計130(Σfi)18600(ΣfiXi)2666824(ΣfiXi2)第十七頁,共五十五頁,編輯于2023年,星期日標準差應用1.表示觀察值分布的離散程度。均數(shù)相近、度量單位相同的條件下,S越大,觀察值的變異程度越大,均數(shù)的代表性越差。2.結合均數(shù)計算CV。3.結合均數(shù)描述正態(tài)分布資料的分布特征和估計醫(yī)學參考值范圍4.結合樣本含量計算標準誤。第十八頁,共五十五頁,編輯于2023年,星期日(五)變異系數(shù)(CoefficientofVariation

)

主要用于對均數(shù)相差較大或單位不同的幾組觀察值的變異程度進行比較。例3.3測得某地成年人舒張壓均數(shù)為77.5mmHg,標準差為10.7mmHg;收縮壓均數(shù)為122.9mmHg,標準差為17.1mmHg。試比較舒張壓和收縮壓的變異程度。第十九頁,共五十五頁,編輯于2023年,星期日變異系數(shù)

Coefficientofvariation(CV)應用1.表示數(shù)據(jù)分布的相對離散程度2.比較均數(shù)相差懸殊的兩組或多組資料的離散程度3.比較度量衡單位不同的兩組或多組資料的變異程度第二十頁,共五十五頁,編輯于2023年,星期日某地20歲男子160人,身高均數(shù)為166.06cm,標準差為4.95cm;體重均數(shù)為53.72kg,標準差為4.96kg。比較身高與體重的變異程度。20歲男子體重的變異程度比身高的變異程度大。第二十一頁,共五十五頁,編輯于2023年,星期日

某地不同年齡女童的身高(cm)資料如下表所示。試比較不同年齡身高的變異程度。某地不同年齡女童身高的變異程度年齡組人數(shù)均數(shù)標準差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.1第二十二頁,共五十五頁,編輯于2023年,星期日小結全距與四分位數(shù)間距:后者較穩(wěn)定,但均不能綜合反映各觀察值的變異程度。標準差:最為常用,對正態(tài)分布尤為重要變異系數(shù):可用于多組資料間度量衡單位不同或均數(shù)相差懸殊時作變異度的比較。以上指標都是數(shù)值越小,說明觀察值的變異度越小,均數(shù)的代表性越好。平均指標和變異指標常配套使用

如正態(tài)分布:均數(shù)、標準差;偏態(tài)分布:中位數(shù)、四分位間距第二十三頁,共五十五頁,編輯于2023年,星期日練習:

某市1974年為了解該地居民發(fā)汞的基礎水平,為汞污染的環(huán)境監(jiān)測積累資料,調(diào)查了留住該市一年以上,無明顯肝、腎疾病,無汞作業(yè)接觸史的居民238人的發(fā)汞含量(μmol/kg)如下:

用何種指標說明本資料的集中位置和變異程度較好?并計算之。

發(fā)汞值1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~人數(shù)2066604818166103第二十四頁,共五十五頁,編輯于2023年,星期日某檢驗師測定了10名正常成年鋼鐵工人的血紅蛋白值(g/dl)和紅細胞數(shù)(萬/mm3)如下,試比較這兩個檢測項目的結果哪個變異性大?血紅蛋白(g/dL)13.013.614.014.514.614.715.215.515.816.0血細胞數(shù)(萬/mm3)510515517518520522524525528530第二十五頁,共五十五頁,編輯于2023年,星期日238名正常人發(fā)汞值(μg/g)的頻數(shù)表發(fā)汞值頻數(shù)累計頻數(shù)累計頻率(%)0.3~20208.40.7~668636.11.1~6014661.31.5~4819481.51.9~1821289.12.3~1622895.82.7~623498.33.1~123598.73.5~023598.73.9~4.33238100.0第二十六頁,共五十五頁,編輯于2023年,星期日正態(tài)分布和醫(yī)學參考值范圍要求:掌握:正態(tài)分布及其特征,正態(tài)曲線下面積分布的規(guī)律。熟悉:醫(yī)學參考值范圍,參考值范圍估計的步驟,參考值范圍估計的正態(tài)分布法和百分位數(shù)法。標準正態(tài)分布。了解:參考值范圍估計的對數(shù)正態(tài)分布法。第二十七頁,共五十五頁,編輯于2023年,星期日圖3-1某地成年男子紅細胞數(shù)的分布逐漸接近正態(tài)分布示意圖一、正態(tài)分布(NormalDistribution)正態(tài)分布曲線:高峰位于中央,兩側逐漸下降、低平,左右完全對稱、兩端不與橫軸相交的鐘型曲線。正態(tài)分布:以均數(shù)為中心,中間多,兩側呈對稱性逐漸減少的鐘型分布。第二十八頁,共五十五頁,編輯于2023年,星期日正態(tài)分布的密度函數(shù)f(x)為:由上式可見,正態(tài)分布的圖形由和所決定,X~N(,2)第二十九頁,共五十五頁,編輯于2023年,星期日主要特征:

1.以為中心的對稱分布

2.鐘型曲線

3.曲線下面積分布有規(guī)律

4.兩個參數(shù)決定位置和變異

圖3-2正態(tài)分布曲線下的面積

圖3-3三種不同均值的正態(tài)分布圖3-4三種不同標準差的正態(tài)分布第三十頁,共五十五頁,編輯于2023年,星期日正態(tài)曲線下的面積F(x)的計算:第三十一頁,共五十五頁,編輯于2023年,星期日標準正態(tài)變換(u變換)u為標準正態(tài)變量或標準正態(tài)離差u變換的特點:若X服從正態(tài)分布,則u服從標準正態(tài)分布標準正態(tài)分布:指均數(shù)為0、標準差為1的正態(tài)分布,記為N(0,1)二、標準正態(tài)分布

(StandardNormalDistribution)第三十二頁,共五十五頁,編輯于2023年,星期日表中曲線下面積為-~u的面積;即P(u)可以利用標準正態(tài)分布表求出與原始變量X有關的概率值。第三十三頁,共五十五頁,編輯于2023年,星期日1.標準正態(tài)分布:求曲線下(u1,u2)范圍內(nèi)的面積。

u≤0:①查表,分別求從-∞到u2與從-∞到u1的面積;②兩者之差為所求面積。u2u1

u1u2第三十四頁,共五十五頁,編輯于2023年,星期日例:u1=-1.50,u2=-0.31則(-1.50,-0.31)范圍內(nèi)的面積第三十五頁,共五十五頁,編輯于2023年,星期日(2)u>0:利用正態(tài)分布的對稱性求曲線下從-∞到u范圍的面積。例:從-∞到u=1.76范圍內(nèi)的面積。1.76-1.760.03921-0.0392=0.96080.0392第三十六頁,共五十五頁,編輯于2023年,星期日

2.非標準正態(tài)分布:求曲線下任意(x1,x2)范圍內(nèi)的面積。第三十七頁,共五十五頁,編輯于2023年,星期日先作標準正態(tài)變換;再查標準正態(tài)分布表求得面積。例:已知110名7歲男童身高?,F(xiàn)欲估計該地身高界于116.5cm到119.0cm范圍內(nèi)7歲男童比例及110名7歲男童中身高界于此值范圍內(nèi)的人數(shù)。第三十八頁,共五十五頁,編輯于2023年,星期日

(1)標準正態(tài)分布變換:

(2)查表得:第三十九頁,共五十五頁,編輯于2023年,星期日

(3)求D:

估計該地身高界于116.5~119.0cm范圍內(nèi)的7歲男童比例為13.92%;估計110名7歲男童中有15名男童的身高界于116.5~119.0cm范圍內(nèi)。110×13.92%=15第四十頁,共五十五頁,編輯于2023年,星期日思考題:該地80%的男孩身高集中的范圍?第四十一頁,共五十五頁,編輯于2023年,星期日三、正態(tài)分布的應用1.估計頻數(shù)分布例:出生體重低于2500g為低體重兒。若由某項研究得某地嬰兒出生體重均數(shù)為3200g,標準差為350g,估計該地當年低體重兒所占的比例。查表,即從-∞到2500的比例為2.28%,故估計該地當年低體重兒所占的比例為2.28%。第四十二頁,共五十五頁,編輯于2023年,星期日2.制定醫(yī)學參考值范圍(ReferenceValueRange)3.質(zhì)量控制為了控制實驗中的誤差,實驗室的質(zhì)量控制中,常以作為上、下警戒限;以作為上、下控制限。(2s和3s是1.96s與2.58s的近似值)。4.統(tǒng)計處理方法的基礎第四十三頁,共五十五頁,編輯于2023年,星期日μ+3σμ+2σμ+σμμ-σμ-2σμ-3σ第四十四頁,共五十五頁,編輯于2023年,星期日

一、基本概念通常指正常人(排除了對所研究指標有影響的疾病和有關因素的特定人群)的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。主要目的:用于臨床疾病診斷。最常用的是95%參考值范圍。

第三節(jié)醫(yī)學參考值范圍

(ReferenceValueRange)

確定95%參考值范圍示意圖第四十五頁,共五十五頁,編輯于2023年,星期日二、醫(yī)學參考值范圍的制定方法

(一)選擇足夠數(shù)量的正常人作為參照樣本

選擇參照樣本必須要考慮可能影響所要制定參考值范圍指標的各種疾病及干擾因素,將這些人排除在外。例如在制定血清谷-丙轉氨酶活性正常值時,選取正常人的條件為肝、腎、心、腦、肌肉等無器質(zhì)性疾患,近期無特殊用藥史等。同時可能需要考慮性別、年齡、民族、地理位置等因素。樣本含量一般要較大,如n>120。第四十六頁,共五十五頁,編輯于2023年,星期日(二)對選定的參照樣本進行準確的測定為保證原始數(shù)據(jù)可靠,要嚴格控制檢測誤差,包括分析儀器的靈敏度、試劑的純度、操作技術及標準的掌握等,同時必須對測量條件做出統(tǒng)一的規(guī)定和說明,如臨床化驗參考值范圍的制定,應對收集樣本時的環(huán)境和生理條件(溫度、季節(jié)、體育活動強度、飲食、妊娠等),收集、轉運和儲藏樣品的方法及時間有明確的規(guī)定。第四十七頁,共五十五頁,編輯于2023年,星期日(三)決定取單側范圍還是雙側范圍值

有些指標如白細胞數(shù)過高或過低均屬異常(a),故其參考值范圍需要分別確定下限和上限,稱作雙側。有些指標如24小時尿糖含量僅在過高(b)、肺活量僅在過低時為異常(c),只需確定其上限或下限,稱作單側參考值范圍。(a)白細胞數(shù)參考值范圍(b)24小時尿糖參考值范圍(c)肺活量參考值范圍第四十八頁,共五十五頁,編輯于2023年,星期日(四)選擇適當?shù)陌俜址秶鷧⒖贾档陌俜址秶鷳鶕?jù)資料的性質(zhì)和研究目的選擇,它與診斷閾值有確定的關系。百分范圍的不同將導致不同的假陽性率和假陰性率。

若主要目的為減少假陽性(如確診病人)→大減少假陰性(如初篩病人)→小圖3-6正常人和病人數(shù)據(jù)分布重疊第四十九頁,共五十五頁,編輯于2023年,星期日(五)估計參考值范圍的界限參考值范圍估計主要有百分位數(shù)法和正態(tài)分布法。

百分范圍(%)

單側雙側下限上限下限上限

95

P5

P95

P2.5

P97.5

99

P1

P99

P0.5

P99.5百分范圍(%)

單側雙側下限上限下限上限

95

99

表3-2參考值范圍所對應的百分位數(shù)表3-3參考值范圍所對應的正態(tài)分布區(qū)間第五十頁,共五十五頁,編輯于2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論