數(shù)值變量資料的統(tǒng)計(jì)分析_第1頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)分析_第2頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)分析_第3頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)分析_第4頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩98頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第九章數(shù)值變量資料的統(tǒng)計(jì)分析1.主要內(nèi)容第一節(jié)數(shù)值型資料的統(tǒng)計(jì)描述第二節(jié)正態(tài)分布和參考值范圍的估計(jì)第三節(jié)數(shù)值型資料的統(tǒng)計(jì)推斷第四節(jié)t檢驗(yàn)和u檢驗(yàn)第五節(jié)方差分析2.

terminologystatisticaldescription統(tǒng)計(jì)描述statisticalinference統(tǒng)計(jì)推斷parameterestimation參數(shù)估計(jì)Frequencydistribution頻數(shù)分布frequencytable頻數(shù)表arithmeticMean,average算術(shù)平均值standarddeviation標(biāo)準(zhǔn)差variance方差range極差,全距,范圍geometricmean幾何平均值median中位數(shù)normaldistribution正態(tài)分布referencerange參考值范圍3.統(tǒng)計(jì)分析包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷兩大部分。統(tǒng)計(jì)描述(statisticaldescription)是用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)表和統(tǒng)計(jì)圖描述資料的分析規(guī)律及其數(shù)量特征;統(tǒng)計(jì)推斷(statisticalinference)

包括總體參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩個(gè)內(nèi)容。

參數(shù)估計(jì):是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)所在范圍。

假設(shè)檢驗(yàn):是利用樣本的實(shí)際資料來(lái)檢驗(yàn)事先對(duì)總體某些數(shù)量特征所作的假設(shè)是否成立。

4.一、數(shù)值變量資料的頻數(shù)分布二、平均水平指標(biāo)三、離散程度指標(biāo)5.1.頻數(shù)表(frequencytable)的編制方法2.頻數(shù)分布的兩個(gè)特征及兩種類型

3.頻數(shù)表的用途特征離散趨勢(shì)類型一、數(shù)值變量資料的頻數(shù)分布集中趨勢(shì)對(duì)稱分布偏態(tài)分布6.第一節(jié)數(shù)值型變量資料的統(tǒng)計(jì)描述例9.1某地用隨機(jī)抽樣的方法對(duì)140名健康成年男性血清尿素氮(BUN)濃度進(jìn)行了檢測(cè),所得數(shù)據(jù)如表9-1,如何進(jìn)行統(tǒng)計(jì)描述。7.6.005.283.905.304.203.905.605.664.104.004.503.774.344.304.225.305.133.794.805.204.702.945.904.502.105.605.902.854.904.225.633.214.663.005.963.453.504.233.903.884.244.534.882.483.403.263.213.602.734.154.604.354.965.615.875.014.335.744.873.963.003.933.155.003.443.502.854.874.603.404.793.026.234.982.895.826.305.205.403.002.804.434.505.526.404.865.904.703.474.664.785.702.264.103.705.403.704.374.206.104.805.105.552.975.113.263.046.015.074.225.395.344.473.585.264.544.073.833.976.054.022.692.525.216.554.284.455.154.455.373.803.734.492.442.763.333.016.433.552.63表9-1某地140名健康成年男性血清尿素氮濃度(mmol/L)8.統(tǒng)計(jì)描述的內(nèi)容:一、制頻數(shù)(分布)表(表9-2)和頻數(shù)分布圖(圖9-1)頻數(shù)表的用途(1)揭示資料的分布特征和分布類型(2)便于發(fā)現(xiàn)某些特大或特小的可疑值(3)便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析處理二、計(jì)算統(tǒng)計(jì)指標(biāo)(1)計(jì)算平均值—代表一組資料的平均水平;(2)計(jì)算標(biāo)準(zhǔn)差---反映資料的離散程度。三、繪制統(tǒng)計(jì)表和統(tǒng)計(jì)圖9.一、編制頻數(shù)分布表:制表步驟:(1)求極差或全距(range):R=Xmax-Xmin本例,R=6.55-2.10=4.45(mmol/L)。(2)決定組數(shù)、組段數(shù)和劃分組距(classinterval):根據(jù)樣本含量的多少確定組數(shù),一般設(shè)8~15組。組段數(shù)=取整(極差/組數(shù))。本例:組段數(shù)=取整(4.45/12)=0.370.4劃分組距:每組段的起點(diǎn)和終點(diǎn)分別稱為下限和上限。組距:本組內(nèi)的上限和下限之差。組段的劃分2.0~2.4~2.8~3.2~3.6~4.0~4.4~4.8~5.2~5.6~6.0~6.4~6.812345678910111210.(3)列頻數(shù)表:按上述組段序列制成表的形式,采用劃記法或計(jì)算機(jī)將原始數(shù)據(jù)匯總,得出各組段中所包含的觀察例數(shù),即為頻數(shù),如表9-2的第(2)欄。將各組段及其相應(yīng)的頻數(shù)列成表格,即為頻數(shù)表(frequencytable),如表9-2。所繪的圖形見(jiàn)圖9-1。表9-2140名健康成年男性血清尿素氮濃度(mmol/L)頻數(shù)表尿素氮濃度(mmol/L)頻數(shù)頻率(%)2.00~21.432.40~75.002.80~139.293.20~1410.003.60~1510.714.00~1913.574.40~1812.864.80~1611.435.20~1410.005.60~139.296.00~64.286.40~6.8032.14合計(jì)140100.0011.表9-2140名健康成年男性血清尿素氮濃度(mmol/L)頻數(shù)表尿素氮濃度(mmol/L)頻數(shù)累計(jì)頻數(shù)頻率(%)累計(jì)頻率(%)2.00~221.431.432.40~7956.42.80~13229.2915.713.20~14361025.713.60~155110.7136.434.00~197013.5750.004.40~188812.8662.864.80~1610411.4374.295.20~141181084.295.60~131319.2993.576.00~61374.2897.866.40~6.8031402.14100.0合計(jì)140-100-12.051015頻數(shù)22.42.83.23.644.44.85.25.666.46.8X2713141519181614136227131415191816141362圖9-1圖9-1140名健康成年男性血清尿素氮濃度頻數(shù)分布圖13.資料的分布類型:對(duì)稱分布或正態(tài)分布;2.偏態(tài)分布(正、負(fù)):高峰在左側(cè)或右側(cè);3.不規(guī)則分布:分布很散,無(wú)明顯高峰14.頻數(shù)表和頻數(shù)圖的用途

(1)可以將原來(lái)相對(duì)雜亂的數(shù)據(jù)以相對(duì)直觀、有序的表格或圖形的形式描述,便于進(jìn)一步分析。(2)揭示資料的分布類型,便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)分析處理(3)用于描述頻數(shù)分布的特征(4)便于發(fā)現(xiàn)某些特大或特小的可疑值,15.某公司員工工資,請(qǐng)描述平均水平1、1800,1900,1900,2000,2000,2000,2000,2100,2100,2200,平均工資為2000.2、1800,1900,1900,2000,2000,2000,2000,2100,2100,10000平均工資為2800,合理嗎?16.請(qǐng)描述以下資料中變量的平均水平1、8名某病患者血清抗體滴度為:1:2,1:4,1:8,1:16,1:32,1:64,1:128。2、某醫(yī)院收治某癌癥患者6人,其生存時(shí)間(月)分別為10,8,19,6,20,≥2517.

二、集中趨勢(shì)的描述集中趨勢(shì):一組數(shù)據(jù)向某一個(gè)位置聚集或集中的傾向。平均數(shù)(average):是描述一組同質(zhì)觀察值的集中趨勢(shì)或平均水平的指標(biāo)體系。一、意義:反映一組同質(zhì)變量值的平均水平或分布的集中位置。作為一組資料的代表值,便于組間的分析比較。二、衛(wèi)生領(lǐng)域常用的平均數(shù)指標(biāo):(一)算術(shù)均數(shù)(二)幾何均數(shù)(三)中位數(shù)其他平均數(shù):調(diào)和平均值、眾數(shù)

18.(一)算術(shù)均數(shù)算術(shù)均數(shù)(arithmeticmean,average):簡(jiǎn)稱均數(shù),等于所有觀察值的總和除以觀察值的個(gè)數(shù)常用表示樣本均數(shù),希臘字母μ表示總體均數(shù)。計(jì)量資料最常用的平均數(shù)。

1、適用條件:服從對(duì)稱分布(特別是服從正態(tài)分布或近似正態(tài)分布)或偏度不大的的計(jì)量資料

19.2、計(jì)算方法:

①直接法:xi

(i=1,2,…,n)為第i個(gè)觀察對(duì)象的觀察值20.例9-2某班級(jí)中10名女孩身高測(cè)量值分別為132.4,151.3,…137.6,求其平均身高。21.②加權(quán)法:(weightingmethod)xi為第i組的組中值,fi為第i組的例數(shù)22.表9-2分組資料加權(quán)法計(jì)算平均值及標(biāo)準(zhǔn)差用表尿素氮濃度(mmol/L)組中值(xi)頻數(shù)(fi)fi×xifi×xi22.00~2.2024.409.682.40~2.60718.2047.322.80~3.001339.00117.003.20~3.401447.60161.843.60~3.801557.00216.604.00~4.201979.80335.164.40~4.601882.80380.884.80~5.001680.00400.005.20~5.401475.60408.245.60~5.801375.40437.326.00~6.20637.20230.646.40~6.806.60319.80130.68合計(jì)-140616.802875.36直接法結(jié)果為4.38mmol/L23.(二)幾何均數(shù)(geometricmean,G)1、計(jì)算方法:①直接法:G等于所有n個(gè)觀察值的乘積的n次方根

24.例9-38份血清的某種抗體效價(jià)分別為1:200,1:25,1:400,1:800…,求其平均效價(jià)。先求其倒數(shù)的幾何均數(shù),平均效價(jià)為1:100.25.②加權(quán)法:χi為第i組的組中值(或觀察值),fi為第i組例數(shù):26.抗體滴度(i)人數(shù)fi滴度倒數(shù)Xilg

(Xi)fi×lg

(Xi)(1)(2)(3)(4)(5)=(2)×(4)1:4140.60210.60211:8380.90312.70931:1615161.204118.06151:3232321.505148.16321:6443641.806277.66661:128111282.107223.17921:25652562.408212.04101:51225122.70935.4186合計(jì)112-187.8415表9-4某地34名兒童接種麻疹疫苗后血清血凝抑制抗體滴度血清血凝抑制抗體的幾何平均滴度為1:47.55。27.2、幾何均數(shù)的適用條件:

(1)等比數(shù)列資料.(2)原始觀察值呈偏態(tài)分布、但經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料。如疾病的潛伏期、抗體滴度、平均效價(jià)等。注意:同一組觀察值的幾何均數(shù)總是小于它的算術(shù)均數(shù)。28.3、幾何均數(shù)的應(yīng)用1.幾何均數(shù)常用于等比資料,或用于對(duì)數(shù)正態(tài)分布資料。多應(yīng)用于血清學(xué)和微生物學(xué)。如抗體的平均滴度和平均效價(jià)、衛(wèi)生事業(yè)平均發(fā)展速度、人口的幾何增長(zhǎng)等;2.觀察值不能有0。因?yàn)?不能取對(duì)數(shù),不能與任何其他數(shù)呈倍數(shù)關(guān)系。否則在作對(duì)數(shù)變換之前需要加一個(gè)常數(shù)。3.觀察值不能同時(shí)有正值和負(fù)值。若全是負(fù)值,計(jì)算時(shí)可把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。29.(三)中位數(shù)(median,P50或M)和百分位數(shù):中位數(shù):將觀察值按大小排序后,位次居中的觀察值。M=X(P=50%)1、計(jì)算方法①直接法:設(shè)n

為觀察值的個(gè)數(shù),有公式(9-5)及(9-6)

/230.百分位數(shù)(percentile

)把一組數(shù)據(jù)從小到大排列,分成100等份,各等份含1%的觀察值,分割界限上的值就是百分位數(shù),用PX表示。它是一種位置指標(biāo),即一個(gè)百分位數(shù)PX將總體或樣本的全部變量值分為兩部分,理論上有X%的變量值比它小,有(100-X)%的變量值比它大。31.例9-58名食物中毒患者的潛伏期分別為1、2、3、3、4、5、8、16小時(shí),求中位數(shù)。

M=(3+4)/2=3.5(小時(shí))例9-6某傳染病11名患者的潛伏期(天)分別為1、2、2、3、3、4、5、6、7、7、9

M=4(天)32.②頻數(shù)表法:

Lx:第x百分位數(shù)所在組段下限ix:第x百分位數(shù)所在組段的組距fx:第x百分位數(shù)所在組段頻數(shù)fL:小于L的累計(jì)頻數(shù)33.血鉛值(μmol/L)人數(shù)f累計(jì)頻數(shù)Σf累計(jì)頻率(%)(1)(2)(3)(4)=(3)/n0~22226.470.25~365817.060.50~238123.820.75~4212336.181.00~4116448.241.25~5521964.411.50~3625575.001.75~2828383.242.00~1529887.652.25~2432294.712.50~632896.472.75~933799.123.00~3.253340100.00合計(jì)340表9-5340名7歲以下兒童血鉛值的頻數(shù)分布(中位數(shù)計(jì)算)L:中位數(shù)組段下限值,ΣfL:小于L的累計(jì)頻數(shù),i:中位數(shù)組距,f50%:中位數(shù)組頻數(shù).L=1.25ΣfL=164i=00.25f50%=5534.2、適用條件中位數(shù)不僅可以用于任何分布的定量資料,(對(duì)稱分布、偏態(tài)分布,不規(guī)則分布),還可以用于開(kāi)口資料(含不確定數(shù)值資料)。35.3、中位數(shù)在應(yīng)用中的特點(diǎn)(1)小于M的觀察值個(gè)數(shù)與大于M的觀察值個(gè)數(shù)相等。(2)不是由全部觀察值計(jì)算出來(lái)的,因而M不受個(gè)別特小或特大觀察值的影響,這一點(diǎn)優(yōu)于均數(shù),適用于明顯偏態(tài)、兩端無(wú)確定值、分布不規(guī)則或分散度很高的資料.(3)只受居中觀察值波動(dòng)的影響,因而不敏感(4)當(dāng)數(shù)據(jù)分布對(duì)稱的時(shí)候,理論上中位數(shù)等于算術(shù)均數(shù),當(dāng)數(shù)據(jù)分布對(duì)數(shù)轉(zhuǎn)換后對(duì)稱時(shí),理論上中位數(shù)等于幾何均數(shù)。(5)用中位數(shù)代替均數(shù)、幾何均數(shù)會(huì)減低靈敏度,且進(jìn)一步統(tǒng)計(jì)處理的方法較少,所以實(shí)際工作中,應(yīng)當(dāng)盡量使用算術(shù)均數(shù)或幾何均數(shù)。36.4、百分位數(shù)的應(yīng)用可用于任何頻數(shù)分布的資料??捎脕?lái)描述資料的觀察值序列在某百分位置的水平,中位數(shù)是其中的一個(gè)特例。

多個(gè)百分位數(shù)結(jié)合使用常常可以用來(lái)說(shuō)明某一特定的問(wèn)題,如用P25、P75描述資料的離散程度,用P2.5、及P97.5規(guī)定醫(yī)學(xué)95%的參考值范圍。分布中部的百分位數(shù)穩(wěn)定,具有較好的代表性;但靠近兩端的百分位數(shù)僅在樣本例數(shù)比較大時(shí)才比較穩(wěn)定(如n大于100)。當(dāng)樣本例數(shù)不多時(shí),不宜取太近兩端的百分位數(shù)。37.計(jì)量資料集中趨勢(shì)指標(biāo)適用條件總結(jié)反映資料的集中趨勢(shì)的指標(biāo)適用的資料類型1.算術(shù)均數(shù)對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布資料。2.幾何均數(shù)適用于對(duì)數(shù)正態(tài)或近似對(duì)數(shù)正態(tài)分布資料3.中位數(shù)分布不規(guī)則的資料,分散程度大的資料,明顯偏態(tài),分布不明38.三、離散程度的統(tǒng)計(jì)描述

(MeasuresofDispersion)

39.例對(duì)甲乙兩名高血壓患者連續(xù)觀察5天,測(cè)得的收縮壓(mmHg)結(jié)果如下:

可以看出:兩患者收縮壓的均數(shù)十分接近,但甲患者的血壓波動(dòng)較大,而乙患者相對(duì)穩(wěn)定。通常,描述一組觀察值,除需要表示其平均水平外,還要說(shuō)明它的離散或變異的情況。

患者第1天第2天第3天第4天第5天均數(shù)甲患者162145178142186162.6乙患者164160163159166162.440.第一節(jié)衡量變異程度的指標(biāo)

一類是按間距計(jì)算:

極差、四分位數(shù)間距一類則按平均差距計(jì)算:方差、標(biāo)準(zhǔn)差等

41.(一)全距(Range,用符號(hào)R表示)

也稱作極差,即觀察值中最大值和最小值之差,用符號(hào)R表示。如前例甲乙兩患者收縮壓的極差分別為

該法簡(jiǎn)單明了、容易使用,如用于說(shuō)明傳染病、食物中毒等的最短、最長(zhǎng)潛伏期等;缺點(diǎn)是不全面,易受極端值影響,結(jié)果不穩(wěn)定。

42.四分位數(shù):

P75、

P50、P253個(gè)點(diǎn)將全部觀察值分為四個(gè)部分,處于分位點(diǎn)上的數(shù)值即為四分位數(shù)四分位數(shù)間距Q:Q=QU-QL=P75-P25

其間包括了一組觀察值的一半,故四分位數(shù)間距可看成是中間50%觀察值的極差。(二)四分位數(shù)間距

(Quartile)

43.四分位數(shù)間距的計(jì)算(interquartilerange,Q):25%位數(shù)計(jì)算公式:75%位數(shù)計(jì)算公式血鉛值(μmol/L)人數(shù)f累計(jì)頻數(shù)Σf累計(jì)頻率(%)(1)(2)(3)(4)=(3)/n0~22226.470.25~365817.060.50~238123.820.75~4212336.181.00~4116448.241.25~5521964.411.50~3625575.001.75~2828383.242.00~1529887.652.25~2432294.712.50~632896.472.75~933799.123.00~3.253340100.00合計(jì)34044.四分位數(shù)間距(interquartilerange,Q)計(jì)算公式:Q=P75–P25=1.75-0.77=0.98(mmol/L)

X0%X25%X50%X75%X100%|Q|00.771.251.75X1…Xn45.四分位數(shù)間距的特點(diǎn):適用于描述偏態(tài)分布、一端或兩端無(wú)確切數(shù)值、分布不明確資料的離散程度。

四分位數(shù)間距越大,數(shù)據(jù)分布的變異度越大;反之,變異度越小。與中位數(shù)一起描述偏態(tài)分布資料的分布特征。作為描述數(shù)據(jù)分布離散程度的指標(biāo),比極差穩(wěn)定,但仍未考慮到每個(gè)數(shù)據(jù)的大小,未考慮全部觀察值的變異度,在統(tǒng)計(jì)分析中應(yīng)用的不夠普遍。46.(三)方差(variance):

σ2(總體方差),S2(樣本方差)為了全面考慮每個(gè)觀察值的變異情況,克服極差和四分位數(shù)間距的缺點(diǎn),引入了“方差”均方差(meansquaredeviation,MS,均方),反映一組數(shù)據(jù)的平均離散水平。47.計(jì)算:48.自由度(degreeoffreedom)隨機(jī)變量能夠自由取值的個(gè)數(shù)符號(hào)為,讀作niu。如n=4的樣本受到的條件限制,可自由取值的數(shù)字只有3個(gè)。49.方差的特點(diǎn)適用條件:對(duì)稱分布資料,特別是正態(tài)分布或近似正態(tài)分布資料。意義:方差越大,數(shù)據(jù)間的變異越大優(yōu)點(diǎn):利用了每個(gè)數(shù)據(jù)的信息,是常用的描述數(shù)據(jù)分布離散程度指標(biāo)不足:度量衡單位發(fā)生了改變,不便于實(shí)際應(yīng)用。為此,更常用的是標(biāo)準(zhǔn)差。50.(四)標(biāo)準(zhǔn)差(standarddeviation,SD)將方差開(kāi)方,恢復(fù)成原度量單位,得總體標(biāo)準(zhǔn)差σ和樣本標(biāo)準(zhǔn)差S計(jì)算:直接法:

加權(quán)法:51.(四)標(biāo)準(zhǔn)差

(StandardDeviation)

例如對(duì)于例9-2,經(jīng)計(jì)算有

52.標(biāo)準(zhǔn)差的應(yīng)用(1)適用條件同方差,表示觀察值的變異程度(離散程度):在兩組(或幾組)資料均數(shù)相近、度量單位相同的條件下,標(biāo)準(zhǔn)差大,表示觀察值的變異度大,即各觀察值離均數(shù)較遠(yuǎn),均數(shù)的代表性較差。(2)用于計(jì)算變異系數(shù);(3)結(jié)合樣本含量n計(jì)算標(biāo)準(zhǔn)誤(4)結(jié)合均數(shù)完整地描述正態(tài)分布的特征和估計(jì)醫(yī)學(xué)參考值范圍。。53.問(wèn)題的引入例2-13:某地40名 7歲男童的身高均數(shù)為121.48cm,標(biāo)準(zhǔn)差為4.65cm;體重均數(shù)為22.18kg,標(biāo)準(zhǔn)差為2.35kg。試比較其變異程度的大?。?4.變異系數(shù)(coefficientofvariation,CV)定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,它描述了相對(duì)于算術(shù)均數(shù)而言,標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對(duì)于其平均水平來(lái)說(shuō)是大還是小。計(jì)算公式

55.適用條件:常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異度。意義:CV大則說(shuō)明變異較大56.57.描述性統(tǒng)計(jì)量歸納反映資料的集中趨勢(shì)的指標(biāo)反映資料的離散情況指標(biāo)適用的資料類型1.算術(shù)平均數(shù)方差及標(biāo)準(zhǔn)差對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布資料。2.幾何平均數(shù)幾何標(biāo)準(zhǔn)差適用于對(duì)數(shù)正態(tài)或近似對(duì)數(shù)正態(tài)分布資料\等比資料3.中位數(shù)四分位數(shù)間距或百分位數(shù)分布不規(guī)則的資料,分散程度大的資料58.59.第二節(jié)正態(tài)分布和醫(yī)學(xué)參考值范圍一、正態(tài)分布(normaldistribution)60.圖9-2頻數(shù)分布逐漸向正態(tài)分布接近表9-2140名健康成年男性血清尿素氮濃度(mmol/L)頻數(shù)表尿素氮濃度(mmol/L)頻數(shù)頻率%2.00~21.432.40~75.002.80~139.293.20~1410.003.60~1510.714.00~1913.514.40~1812.864.80~1611.435.20~1410.005.60~139.296.00~64.286.40~6.8032.14合計(jì)140100.0061.(一)正態(tài)分布的圖形可以設(shè)想,如果觀察例數(shù)逐漸增多,組段數(shù)也不斷增多,就會(huì)形成一條光滑曲線[圖9-2(3)]。稱為正態(tài)分布曲線。這條正態(tài)分布曲線的特點(diǎn)為:①高峰位于中央均數(shù)所在處、兩側(cè)逐漸降低;②左右對(duì)稱;③曲線在無(wú)窮遠(yuǎn)處與橫軸相交。把服從正態(tài)分布的變量表示為:X~N(μ,σ2)正態(tài)分布曲線由兩個(gè)參數(shù)確定:①平均數(shù)μ,稱位置參數(shù),決定平均數(shù)所在的位置;②方差σ2,稱形狀參數(shù),決定曲線的高低寬窄。62.橫坐標(biāo)用變量X表示,第i組的組距和人數(shù)分別用△Xi和fi表示,n為總觀察例數(shù),那么在[X,X+△Xi)區(qū)間內(nèi)每單位尿毒氮濃度的頻率為

f(x)稱作密度函數(shù)。將圖2.1表示人數(shù)的縱坐標(biāo)換成f(x)后可以得到下圖。63.雖然兩個(gè)圖的縱坐標(biāo)含義各異,但圖的形狀卻完全相同。任意矩形的面積的特殊意義:

矩形的面積恰好等于尿素氮濃度在這一區(qū)間內(nèi)出現(xiàn)的頻率f(x)*△Xi=fi/n,所有矩形面積的總和,即為累計(jì)頻率,應(yīng)當(dāng)為1。

64.服從正態(tài)分布的變量X的概率密度函數(shù)f(X)為式中,μ為總體均數(shù);σ為總體標(biāo)準(zhǔn)差;π=3.14159為圓周率;e為自然對(duì)數(shù)的底(e≈2.71828),X為變量。表示為:u~N(0,1),即平均值為0、方差為1的正態(tài)分布。為實(shí)際應(yīng)用方便,將一般正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。轉(zhuǎn)換公式為:

u=(X-μ)/σ,u稱為標(biāo)準(zhǔn)正態(tài)變量。服從標(biāo)準(zhǔn)正態(tài)分布的變量u的概率密度函數(shù)f(u)為σ65.A.正態(tài)分布B.標(biāo)準(zhǔn)正態(tài)分布圖9-3正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布的面積與縱高按式(9-16),根據(jù)X的不同取值,繪出正態(tài)分布(normaldistribution)的圖形(圖9-3A)。按式(9-16),根據(jù)u的不同取值,繪出標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)的圖形(圖9-3B)。Xu66.參數(shù)μ和σ參數(shù)μ:即正態(tài)總體的均數(shù),它描述了正態(tài)分布的集中趨勢(shì)位置,決定了分布曲線在橫軸的位置。是位置參數(shù)。參數(shù)σ:是正態(tài)總體的標(biāo)準(zhǔn)差,它描述正態(tài)分布的離散程度,決定分布曲線的形態(tài)。是變異參數(shù)。σ越小,數(shù)據(jù)分布越集中,曲線的形狀越“瘦高”;σ越大,數(shù)據(jù)分布越離散,曲線的形狀越“肥胖”。已知μ、σ和變量值x,就能按公式繪出正態(tài)曲線的圖形。67.正態(tài)分布參數(shù)位置變化示意圖68.正態(tài)分布變異度不同變化示意圖69.正態(tài)分布曲線:高峰位于中央,兩側(cè)逐漸下降、低平,左右完全對(duì)稱、兩端不與橫軸相交的鐘型曲線。正態(tài)分布:以均數(shù)為中心,中間多,兩側(cè)呈對(duì)稱性逐漸減少的鐘型分布。70.二、正態(tài)分布的特征和曲線下面積分布規(guī)律1)正態(tài)曲線在橫軸上方,鐘形,且均數(shù)所在處最高;即當(dāng)X=時(shí),有最大值

2)正態(tài)分布以均數(shù)為中心,左右對(duì)稱;對(duì)稱軸為直線X=,x取值范圍理論上沒(méi)有邊界(-∞<X<+∞)x離均數(shù)越遠(yuǎn),函數(shù)f(x)值越接近于0,但不會(huì)等于0

71.3)(課本第4點(diǎn))正態(tài)分布有兩個(gè)參數(shù),即均數(shù)與標(biāo)準(zhǔn)差(,),標(biāo)準(zhǔn)正態(tài)分布的均數(shù)和標(biāo)準(zhǔn)差分別為(0,1);

72.4、正態(tài)分布曲線下面積分布規(guī)律

1)曲線下面積集中在以均值為中心的部分;越遠(yuǎn)離中心,曲線越接近x軸,曲線下面積越小,超過(guò)一定范圍以外的面積(概率)可以忽略。73.4、正態(tài)分布曲線下面積分布規(guī)律2)正態(tài)曲線下面積的分布有一定的規(guī)律,即所有的正態(tài)分布曲線,在左右的相同倍數(shù)的標(biāo)準(zhǔn)差范圍內(nèi)面積相同;一些特殊情況:3)無(wú)論μ,取什么值,正態(tài)曲線與橫軸間的面積總等于1。74.二、標(biāo)準(zhǔn)正態(tài)分布

(StandardNormalDistribution)

對(duì)任何參數(shù)的正態(tài)分布,都可以通過(guò)一個(gè)簡(jiǎn)單的變量變換化成和的標(biāo)準(zhǔn)正態(tài)分布。通常,可以利用標(biāo)準(zhǔn)正態(tài)分布表求出與原始變量X有關(guān)的概率值。

圖3-5標(biāo)準(zhǔn)正態(tài)分布及曲線下面積

參見(jiàn)書(shū)中計(jì)算實(shí)例……75.

圖3-5標(biāo)準(zhǔn)正態(tài)分布及曲線下面積

標(biāo)準(zhǔn)正態(tài)分布曲線下,左側(cè)任意區(qū)間的面積可以通過(guò)對(duì)下式積分求得,即表示從X1到X2值范圍內(nèi)X分布面積二、標(biāo)準(zhǔn)正態(tài)分布76.標(biāo)準(zhǔn)正態(tài)分布:若X服從正態(tài)分布N(μ,σ),則u就服從均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,這種正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布(或u分布,z分布),這種轉(zhuǎn)換叫做標(biāo)準(zhǔn)化變換(或u變換,z變換)。77.圖9-4正態(tài)曲線與標(biāo)準(zhǔn)正態(tài)曲線的面積分布二、正態(tài)曲線下面積的分布規(guī)律:用積分法求得。表9-6正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布曲線下面積(概率)分布規(guī)律對(duì)照正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布面積(概率)%左側(cè)界值~右側(cè)界值左側(cè)界值~右側(cè)界值中間部份兩側(cè)尾部和μ-1.0σ~μ+1.0σ-1.0~+1.068.2731.73μ-1.96σ~μ+1.96σ-1.96~+1.9695.005.00μ-2.58σ~μ+2.58σ-2.58~+2.5899.001.0078.三、正態(tài)分布的應(yīng)用(一)估計(jì)變量值的頻數(shù)分布(二)制定參考值范圍(三)質(zhì)量控制(四)正態(tài)分布是很多統(tǒng)計(jì)方法的基礎(chǔ)79.(一)估計(jì)變量值的頻數(shù)分布對(duì)于非標(biāo)準(zhǔn)正態(tài)分布,求曲線下任意(-∞,x)或(x1,x2)范圍內(nèi)的面積。步驟:1、先作標(biāo)準(zhǔn)正態(tài)變換2、再查標(biāo)準(zhǔn)正態(tài)分布表求得面積80.1、非標(biāo)準(zhǔn)正態(tài)分布,求曲線下任意(-∞,x)范圍內(nèi)的面積(概率)。例:成年男子的紅細(xì)胞數(shù)近似服從正態(tài)分布,假設(shè)均值為4.78×1012/L,標(biāo)準(zhǔn)差為0.38×1012/L,請(qǐng)問(wèn)紅細(xì)胞數(shù)在4.00×1012/L以下所占的比例是多少?81.可以先將x=4變換為相應(yīng)的u值,即于是,問(wèn)題轉(zhuǎn)化成了求標(biāo)準(zhǔn)正態(tài)分布u<-2.05的概率。查表得表明成年男子的紅細(xì)胞數(shù)低于4的人約占總體的2%。82.2、非標(biāo)準(zhǔn)正態(tài)分布:求曲線下任意(x1,x2)范圍內(nèi)的面積D。83.請(qǐng)問(wèn)紅細(xì)胞數(shù)在4.0×1012/L~5.5×1012/L范圍內(nèi)所占的比例是多少?84.二、制定參考值范圍參考值范圍(referenceranges)是指正常人體(或動(dòng)物)的各種解剖、生理、生化、免疫指標(biāo)或體液、排泄物中各種代謝產(chǎn)物含量等數(shù)據(jù)是否正常的參考值。由于存在個(gè)體變異,各種數(shù)據(jù)不僅因人而異,而且同一個(gè)人還會(huì)隨機(jī)體內(nèi)外環(huán)境的改變而改變,因而需要確定其波動(dòng)的范圍,即醫(yī)學(xué)參考值范圍,亦稱醫(yī)學(xué)正常值范圍。85.二、醫(yī)學(xué)參考值范圍的制定方法

(一)從正常人的總體中進(jìn)行隨機(jī)抽樣

1、“正常人”的標(biāo)準(zhǔn)應(yīng)有明確的界定2、要有足夠的樣本含量,不能少于100例3、抽樣遵循隨機(jī)化的原則4、根據(jù)指標(biāo)的性質(zhì)確定是否要分組(二)對(duì)選定的正常人進(jìn)行準(zhǔn)確的測(cè)定(三)確定取單側(cè)范圍還是雙側(cè)范圍值(四)選擇適當(dāng)?shù)陌俜址秶ㄎ澹└鶕?jù)資料的分布類型選用恰當(dāng)?shù)慕缰倒烙?jì)方法。

86.“正常人”不是指機(jī)體任何器官、組織的形態(tài)和功能都正常的人,而是指符合特定健康水平的人,排除了可能影響所研究指標(biāo)的疾病或因素的人;絕對(duì)健康是不存在的,在每個(gè)人身上都可能存在著某種程度的病理狀態(tài),在使用或制定臨床參考值范圍時(shí),“正常人”的健康水平應(yīng)有明確的界定。

87.

選擇參照樣本必須要考慮可能影響所要制定參考值范圍指標(biāo)的各種疾病及干擾因素,將這些人排除在外。例如:在制定血清谷-丙轉(zhuǎn)氨酶活性正常值范圍時(shí),選取正常人的條件為肝、腎、心、腦、肌肉等無(wú)器質(zhì)性疾患,近期無(wú)特殊用藥史等。88.2、要有足夠的樣本含量樣本含量的確定沒(méi)有統(tǒng)一的規(guī)則:它與總體分布有關(guān),如果接近正態(tài)分布,變異度又不是很大,需要的樣本含量就可以少一些;反之,如果明顯偏態(tài)或數(shù)據(jù)比較分散,需要的樣本含量就相應(yīng)地多一些。一般認(rèn)為至少n>1003、抽樣遵循隨機(jī)化的原則89.4、根據(jù)指標(biāo)的性質(zhì)確定是否要分組:由于有些醫(yī)學(xué)指標(biāo)在不同的人群如男女間或年齡間有所不同,所以在制定醫(yī)學(xué)參考值范圍時(shí),應(yīng)首先確定指標(biāo)是否存在不同,如果有不同,則應(yīng)分為不同的組分別制定醫(yī)學(xué)參考值范圍。如考慮性別、年齡、民族、地理位置等因素并加以區(qū)分,對(duì)不同人群分組制定參考值范圍,例如,紅細(xì)胞數(shù)及血紅蛋白含量,男女各異,高原居民與平原不同,在這種情況下,應(yīng)分組并保證每組有足夠的例數(shù)。90.(二)對(duì)選定的參照樣本進(jìn)行準(zhǔn)確的測(cè)定

1、為保證原始數(shù)據(jù)可靠,要嚴(yán)格控制檢測(cè)誤差:包括分析儀器的靈敏度、試劑的純度、操作技術(shù)及標(biāo)準(zhǔn)的掌握等。2、必須對(duì)測(cè)量條件做出統(tǒng)一的規(guī)定和說(shuō)明。如臨床化驗(yàn)參考值范圍的制定,應(yīng)對(duì)收集樣本時(shí)的環(huán)境和生理?xiàng)l件(溫度、季節(jié)、體育活動(dòng)強(qiáng)度、飲食、妊娠等),收集、轉(zhuǎn)運(yùn)和儲(chǔ)藏樣品的方法及時(shí)間有明確的規(guī)定。91.

有些指標(biāo)如白細(xì)胞數(shù)過(guò)高或過(guò)低均屬異常(a),故其參考值范圍需要分別確定下限和上限,稱作雙側(cè)。有些指標(biāo)如24小時(shí)尿糖含量?jī)H在過(guò)高(b)、肺活量?jī)H在過(guò)低時(shí)為異常(c),只需確定其上限或下限,稱作單側(cè)參考值范圍。(a)白細(xì)胞數(shù)參考值范圍(b)24小時(shí)尿糖參考值范圍(c)肺活量參考值范圍(三)決定取單側(cè)范圍還是雙側(cè)范圍值92.(四)選擇適當(dāng)?shù)陌俜址秶?/p>

參考值的百分范圍應(yīng)根據(jù)資料的性質(zhì)和研究目的選擇,它與診斷閾值有確定的關(guān)系。百分范圍的不同將導(dǎo)致不同的假陽(yáng)性率和假陰性率。圖3-6正常人和病人數(shù)據(jù)分布重疊93.daozhelile94.實(shí)際中最好結(jié)合正常人和病人的數(shù)據(jù)分布特點(diǎn),權(quán)衡假陽(yáng)性和假陰性的比例,選擇一個(gè)適當(dāng)?shù)陌俜址秶?。若?yīng)用是主要目的在于減少假陽(yáng)性(如確診病人),則參考值范圍的百分?jǐn)?shù)范圍要取大一些(如95%或99%);反之,若主要目的在于減少假陰性(如初篩病人),百分?jǐn)?shù)范圍可適當(dāng)小一些(如90%或80%)。95.(五)根據(jù)資料的分布類型選用恰當(dāng)?shù)慕缰倒烙?jì)方法正態(tài)分布資料---正態(tài)分布法對(duì)數(shù)正態(tài)分布資料---對(duì)數(shù)正態(tài)分布法偏態(tài)分布資料---百分位數(shù)法96.表9-7三種參考值估計(jì)方法的適用對(duì)象和95%參考值范圍的計(jì)算資料類型統(tǒng)計(jì)方法雙側(cè)界限值單側(cè)上界值單側(cè)下界值正態(tài)或近似正態(tài)分布正態(tài)分布法

對(duì)數(shù)正態(tài)或近似對(duì)數(shù)正態(tài)分布對(duì)數(shù)正態(tài)分布法不規(guī)則分布百分位數(shù)法

例9-11,表9-2。X=4.41(mmol/L),S=1.07(mmol/L).用正態(tài)分布法雙側(cè)95%的參考值范圍的上下界限值為:下限:4.41-1.96×1.07=2.31(mmol/L),上限:4.41+1.96×1.07=6.51(mmol/L)即該地正常成年男性血清尿素氮濃度95%參考值范圍:2.31~6.51

(mmol/L)97.例9-12,例9-7表9-5,308名6歲以下兒童尿鉛值資料。用百分位數(shù)法計(jì)算單側(cè)95%參考值范圍的上界值。即X95%尿鉛值(mmol/L)人數(shù)f累計(jì)頻數(shù)Σf累計(jì)頻率(%)(1)(2)(3)(4)=(3)/n0~27278.7725~548126.3050~9517657.1475~5523175.00100~3927087.66125~2129194.48150~1230398.38175~5308100.00合計(jì)308L=150:95%組段下限值ΣfL=291:小于L的累計(jì)頻數(shù)i=25:95%組的組距f95%:=12:95%組頻數(shù)故6歲以下兒童尿鉛值單側(cè)95%參考值范圍為:<153.33(mmol/L)98.小節(jié)資料類型描述性統(tǒng)計(jì)量95%參考值范圍的計(jì)算對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布資料算術(shù)平均數(shù)方差及標(biāo)準(zhǔn)差正態(tài)分布法:根據(jù)正態(tài)分布規(guī)律雙側(cè):?jiǎn)蝹?cè)上界:?jiǎn)蝹?cè)下界:適用于對(duì)數(shù)正態(tài)或近似對(duì)數(shù)正態(tài)分布資料幾何平均數(shù)幾何標(biāo)準(zhǔn)差對(duì)數(shù)正態(tài)分布法:雙側(cè):?jiǎn)蝹?cè)上界:?jiǎn)蝹?cè)下界:分布不規(guī)則的資料,分散程度大的資料中位數(shù)四分位數(shù)間距或百分位數(shù)百分位數(shù)法:按排序的位置清點(diǎn)位次雙側(cè):P2.5~P97.5單側(cè)上界:P95.0單側(cè)下界:P5.099.

第九章第一講《練習(xí)題》實(shí)習(xí)九

數(shù)值變量資料的統(tǒng)計(jì)分析(1)pp.379-382[內(nèi)容](一)

選擇題:1,2,3,9,10。(二)

思考題:1,2,6。(三)應(yīng)用題:1,2,3。100.u.00.01.02.03.04.05.06.07.08.09-3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010-2.9.0019.0018.0018.0017.0016.0016.0015.0015.0014.0014-2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019-2.7.0035.0034.0033.0032.0031.0030.0029.0028.0027.0026-2.6.0047.0045.0144.0043.0041.0040.0039.0038.0037.0036-2.5.00

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論