




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章數(shù)值變量的描述性統(tǒng)計
對于數(shù)值變量資料,一般從集中趨勢、離散趨勢兩個方面進行統(tǒng)計描述。而集中趨勢和離散趨勢又各有許多統(tǒng)計指標(biāo)。研究資料的頻數(shù)分布類型是選擇合適的統(tǒng)計指標(biāo)進行統(tǒng)計描述的基礎(chǔ)。第一節(jié)頻數(shù)分布一、頻數(shù)分布表對一個變量進行重復(fù)觀察,其中在某取值下出現(xiàn)的次數(shù)稱作頻數(shù)(frequency),頻數(shù)在總的觀察例數(shù)中所占的比例稱作相對頻數(shù)(relativefrequency)。若將頻數(shù)累積,得到累積頻數(shù)(cumulativefrequency),再計算它在總例數(shù)中的比例,即可得到相對累積頻數(shù)(relativecumulativefrequency)。
頻數(shù)分布表(frequencydistributiontable)常用來反映各變量取值及其相應(yīng)頻數(shù)之間的關(guān)系。下面以例2-1的數(shù)據(jù)說明頻數(shù)分布表的制作步驟和上述幾個頻數(shù)指標(biāo)的計算。例2-l測得130健康成年男子脈搏資料(次/分)如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876制作頻數(shù)表的步驟為:1.計算極差觀察值中的最大值和最小值之差稱為極差或全距(range),常用R表示。本例中最大值為84(次/分),最小值為57(次/分),極差R=84-57=27(次/分)。2.決定組數(shù)、組段和組距根據(jù)研究目的及觀察例數(shù)確定組段數(shù)。若為計算用,組數(shù)可適當(dāng)增多,以減少計算誤差;若為顯示分布特征,則組段數(shù)不宜太多或太少。相鄰兩組段下限值之差稱為組距(classinterval)。一般都用等距,且用“極差/組段數(shù)”之商最接近的整數(shù)值作為組距。本例若分10個組段,則組距=極差/組段數(shù),即組距為27/10==2.7(次/分),取整數(shù)為3,該樣本可分為10組。第一個組段的下限應(yīng)略小于最小值,即取56,最末組的上限要略大于最大值,即取85。3.列表劃記組段確定后,將原始數(shù)據(jù)用劃記法或計算機計算頻數(shù),得到各個組段的頻數(shù),見表2-l。通過對頻數(shù)分布表的觀察,可以看出頻數(shù)的分布有兩個重要的特征:其一為集中趨勢(centraltendency),脈搏的測量值雖然高低不等,但向中間集中,脈搏次數(shù)為中等的人數(shù)最多,所占的比例較大;其二為離散趨勢(tendencyofdispersion)或變異性(variability),即隨著脈搏次數(shù)逐漸變大或變小,人數(shù)越來越少,所占的比例越來越小。利用頻數(shù)分布表可以全面地了解所研究事物的分布情況。表2-1130名健康成年男子脈搏(次/分)的頻數(shù)分布表脈搏組段頻數(shù)相對頻數(shù)(%)累積頻數(shù)累積相對頻數(shù)(%)(1)(2)(3)=(2)/N(4)=(2)(5)=(4)/N56~21.5421.5459~53.8575.3862~129.231914.6265~1511.543426.1568~2519.235945.3871~2620.008265.3874~1914.6210480.0077~1511.5411991.5480~107.6912999.2383~8510.77130100.00合計130二、頻數(shù)分布圖如果將表2-l的資料繪制成頻數(shù)分布圖(frequencydistributiondiagram)(圖2-1),可以看出,圖形中間的直條最高(高峰在中央),兩邊對稱(或基本對稱)地逐漸減少,統(tǒng)計學(xué)上稱之為正態(tài)分布或近似正態(tài)分布。若集中的位置偏向左側(cè),則被稱為正偏態(tài)分布(skewedpositivelydistribution),如研究有害化學(xué)物質(zhì)在正常人體內(nèi)的分布,可以觀察到數(shù)值偏小的為多數(shù);若集中的位置偏向右側(cè),為負偏態(tài)分布(skewednegativelydistribution),如高血壓患者的年齡分布,年齡偏大者為多數(shù)。進行統(tǒng)計描述時,需要根據(jù)數(shù)值的分布形態(tài)選擇適當(dāng)?shù)慕y(tǒng)計指標(biāo)。頻數(shù)分布類型對稱分布(大多為正態(tài)分布)偏態(tài)分布(正偏態(tài)、負偏態(tài))其他分布第二節(jié)集中趨勢平均數(shù)(average)是一類用于描述數(shù)值變量資料集中趨勢的指標(biāo)。這類指標(biāo)不但能給人一個簡明概括的印象,而且還便于進行事物間的分析比較。統(tǒng)計上的平均數(shù)一般包括5種,即算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)以及調(diào)和均數(shù)。在醫(yī)學(xué)研究上較常用的一般為前3種。通常是根據(jù)資料的分布類型選擇某種指標(biāo)反映資料的集中趨勢。下面分別介紹常用的集中趨勢指標(biāo)、適用條件和計算方法。
一、算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean)一般簡稱為均數(shù),它是一組已知性質(zhì)相同的數(shù)值之和除以數(shù)值個數(shù)所得的商??傮w均數(shù)用希臘字母μ(讀作/mju:/)表示,樣本均數(shù)用表示。適用于呈正態(tài)或近似正態(tài)分布的資料。大多數(shù)正常人的生理、生化指標(biāo),如身高、體重、胸圍、血紅蛋白、白細胞數(shù)等,都適宜用均數(shù)表達其集中趨勢。均數(shù)的計算方法有直接法、加權(quán)法和簡捷法三種。由于計算機的普及,多采用直接法計算。下面僅介紹前兩種方法。1.直接法當(dāng)觀察例數(shù)不多(如樣本含量n小于30)時,或觀察例數(shù)雖然很多,但有計算機及統(tǒng)計軟件,均可選擇直接法。公式為:式(2-1)中Σ(讀作sigma)為求和的符號,Xi為各觀察值,n為總例數(shù)。例2-2從例2-1數(shù)據(jù)中隨機抽取一行,計算均數(shù)。若抽取的數(shù)據(jù)為第6行,數(shù)值為:81706675716377747668657769,均數(shù)為:=(81+70+66+75+71+63+77+74+76+68+65+77+69)/13=932/13=71.69
2.加權(quán)法(weightedmethod)適用于頻數(shù)表資料。當(dāng)觀察例數(shù)很多又缺乏計算機及統(tǒng)計軟件時,若用直接法很容易出錯,可以用加權(quán)法處理。加權(quán)法計算均數(shù)的步驟是:首先將數(shù)據(jù)編制成頻數(shù)表,得出每組的頻數(shù)人,求出各組的組中值(classmid-value)Xi
,由每個組段的下限與相鄰較大組的下限之和除以2得到,然后將組中值Xi和頻數(shù)fi代入式(2-2),得到均數(shù)。公式為將表2-2中fiXi和fi數(shù)據(jù)代人式(2-2),得
用加權(quán)法計算的均數(shù)71.12(次/分),若用直接法計算,均數(shù)值為71.32(次/分),兩者非常接近??梢?,加權(quán)法計算的均數(shù)是近似值。式(2-2)中各組段的頻數(shù)fi(又稱作權(quán)數(shù))與組中值的積,近似地等于該組變量值的和;各組中值與相應(yīng)頻數(shù)乘積的總和,視為全部觀察值的總和;這個總和除以總頻數(shù)的商,就作為全部觀察值的均數(shù)。各組的頻數(shù)越大,頻數(shù)與組中值乘積越大,對均數(shù)的影響也越大;頻數(shù)小,影響越小,這就是該法被稱為加權(quán)法的衫礎(chǔ)均數(shù)容易理解,在醫(yī)學(xué)研究中使用頻率很高。若數(shù)據(jù)的分布服從正態(tài)分布,均數(shù)是分布曲線的最高處所對應(yīng)的橫軸上的數(shù)值。表2-2130名健康成年男子脈搏(次/分)的均數(shù)、標(biāo)準(zhǔn)差計算表脈搏組段i組中值(Xi)頻數(shù)(fi)fiXifiXi256~572114649859~6053001800062~63127564762865~66159906534068~6925172511902571~7226187213478474~7519142510687577~781511709126080~81108106561083~85841847056合計1309246662076二、中位數(shù)中位數(shù)(median)用符號M表示。把一組變量值按大小順序排列,位置居中的那個數(shù)值(若n為奇數(shù))被稱作中位數(shù)。中位數(shù)是一個位置指標(biāo),以中位數(shù)為界,將變量值分為左右兩半。資料若呈明顯的偏態(tài)分布(正偏態(tài)或負偏態(tài)分布),或者資料的分布情況不明,采用中位數(shù)反映一群數(shù)值變量資料在位次上的集中趨勢或平均水平。例如,某些傳染病或食物中毒的潛伏期、人體的某些測定指標(biāo)(如發(fā)汞、尿鉛),其平均水平可用中位數(shù)來表示。中位數(shù)的計算方法有直接法和頻數(shù)表法兩種。
l.直接計算法當(dāng)樣本含量不大時使用。將觀察值按大小順序排列,當(dāng)樣本含量n為奇數(shù)時,位置居中的那個數(shù)值(X(n+l)/2)就是M;當(dāng)n為偶數(shù)時,位置居中的兩個數(shù)值的平均數(shù)((Xn/2+X(n/2)+1)/2)就是M。例2-3有9名中學(xué)生甲型肝炎的潛伏期(天):12,13,14,14,15,15,15,17,19,試求中位數(shù)。對數(shù)值進行從小到大排序,位置居中的數(shù)值X(9+1)/2=X5,第5個數(shù)值(15)為中位數(shù),M=15。若僅有前8名中學(xué)生的潛伏期,正中間有2個數(shù)據(jù),二者的均數(shù)(X8/2+X(8/2)+l)/2=(X4+X5)/2=(14+15)/2=14.5為中位數(shù),M=14.5。2.頻數(shù)表計算法當(dāng)觀察例數(shù)較多時采用。計算中位數(shù)之前先將觀察值編制成頻數(shù)分布表,按所分組段由小到大計算累計頻數(shù)和累計相對頻數(shù),找出中位數(shù)所在組(如表2-3中M所在組是累計相對頻數(shù)含50%的組段),將該組段的下限(L)。組距(i)、頻數(shù)(fM)和小于L的各組段累計頻數(shù)(ΣfL)代入式(2-3)即可求出中位數(shù)M。
例2-4測定了107例正常人的尿鉛含量,見表2-3,試根據(jù)分布計算集中趨勢指標(biāo)。從表2-3可以看出,該數(shù)據(jù)服從正偏態(tài)分布。因此選擇中位數(shù)作為反映集中趨勢的指標(biāo)。在表中求出累積頻數(shù),累積相對頻數(shù),找出中位數(shù)所在組(即累積相對頻數(shù)50%所在組,為第3組)。將中位數(shù)所在組的下限(L=8)、組距(i=4)、頻數(shù)(fM=29)、總例數(shù)(n=107)和小于L的各組段累計頻數(shù)(∑fL=36)代入式(2-3),得
M=10.41(μg/L)
用頻數(shù)表法計算的中位數(shù)為10.41。表2-3107正常人的尿鉛含量(μg/L)的中位數(shù)計算表尿鉛含量(組段)頻數(shù)累積頻數(shù)↓
相對頻數(shù)(%)累積相對頻數(shù)(%)(j)(fj)Σfjfj/nΣfj/n0~141413.0813.084~(P25所在組)223620.5633.648~(M所在組)296527.1060.7512~(P75所在組)188316.8277.5716~159814.0291.5920~61045.6197.2024~11050.9398.1328~21071.87100.00合計107100.00對于偏態(tài)分布的資料,中位數(shù)代表性好,也相對穩(wěn)定,不受兩端其它數(shù)值的影響,只受居中的一個或兩個變量值的影響。對于分布的末端無確切數(shù)值的資料,只有計算中位數(shù)。對于正態(tài)分布或?qū)ΨQ分布的資料,理論上中位數(shù)等于均數(shù)。但中位數(shù)沒有充分利用觀察到的每個變量值的信息。三、幾何均數(shù)幾何均數(shù)(geometricmean)用C表示,是將n個觀察值X的乘積再開n次方所得的根。若對各觀察值X取對數(shù),對數(shù)值均值的反對數(shù)即為G。其適用對象是:①當(dāng)一組觀察值不呈正態(tài)分布、且其差距較大時,若用均數(shù)表示其平均水平會受少數(shù)特大或特小值的影響;②數(shù)值按大小順序排列后,各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系;③對數(shù)正態(tài)分布資料。如抗體的滴度、藥物的效價等。其計算方法有兩種:l.直接計算法當(dāng)觀察例數(shù)不多(如樣本含量n小于30)時采用,公式為
例2-5有8份血清的抗體效價分別為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價。將各抗體效價的倒數(shù)代入式(2-4),得
G=lg-1[(lg5+lg10+lg20+…+lg640)/8]=lg-1(1.752575)=56.57
血清的抗體平均效價為1:56.57。2.頻數(shù)表法當(dāng)觀察例數(shù)很多時采用,公式為:
例2-6有50人的血清抗體效價,分別為:5人1:10,9人1:20,20人1:40,10人1:80,6人1:160,求平均抗體效價。將抗體效價的倒數(shù)直接代入式(25),得
G=14.7050人的血清平均抗體效價為1:41.70。因為無法對0和負數(shù)求對數(shù),因此,計算幾何均數(shù)的觀察值不能小于或等于0。同一組數(shù)據(jù)若服從正態(tài)分布,均數(shù)與中位數(shù)幾乎相等,但幾何均數(shù)小于均數(shù)。四、眾數(shù)眾數(shù)(mode)是一組觀察值中出現(xiàn)頻率最高的那個觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個組段。例2-7有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)。對這16例的發(fā)病年齡不分組,那么出現(xiàn)頻數(shù)最多的那個數(shù)值為58,則眾數(shù)為58。58歲是高血壓的高發(fā)年齡。另外,眾數(shù)也沒有充分利用樣本觀察值的全部信息。例2-8若采用例24中的數(shù)據(jù)(見表2-3),則出現(xiàn)頻率最高(27.10%)的組段為8~12,眾數(shù)組段則為8~12。眾數(shù)作為反映集中趨勢的指標(biāo),從概念上容易理解,如反映疾病的高發(fā)年齡或年齡段。眾數(shù)的使用也有很好的普遍性,還可用于非連續(xù)性資料。缺點是若數(shù)據(jù)出現(xiàn)若干個相同的頻率的數(shù)據(jù)或組段,眾數(shù)難以確定。另外,眾數(shù)也沒有充分利用樣本觀察值的全部信息。第三節(jié)離散趨勢
平均數(shù)僅描述了一組數(shù)據(jù)的集中趨勢,可以作為總體的一個代表值。由于變異的客觀存在,需要一類指標(biāo)描述資料的離散趨勢。兩者結(jié)合使用才能對數(shù)據(jù)進行全面的統(tǒng)計學(xué)描述。兩組數(shù)據(jù):甲組:98,99,100,101,102乙組:80,90,100,110,120兩組數(shù)據(jù)的均數(shù)相同,但兩組數(shù)據(jù)的離散(變異)度不同,顯然甲組數(shù)據(jù)較乙組更集中。甲:乙:準(zhǔn)確性相等,穩(wěn)定性不同一、全距全距(range)又稱為極差,是一組觀察值中最大值與最小值之差,用R表示。全距作為反映離散趨勢的指標(biāo)便于理解和計算,故被廣泛應(yīng)用。但全距有這樣幾個弱點:①一組觀察數(shù)據(jù)中從小到大排列后,全距僅利用兩端的數(shù)值,未利用全部觀察值的信息。增加或減少極端值時,全距也會相應(yīng)地發(fā)生改變,故其穩(wěn)定性差。若增加或減少中間水平的觀察值時,全距不會發(fā)生改變,不能靈敏地反映數(shù)值的變動。②若觀察的樣本含量越大,數(shù)值波動的范圍越大,全距就越大,故樣本含量相差懸殊時,不能通過比較全距來比較離散趨勢。③若一組觀察值的一端或兩端有不確切的數(shù)值(如大于或小于某數(shù)值),全距難以計算。鑒于全距的以上弱點,通常將全距和反映離散趨勢的其它指標(biāo)結(jié)合使用。二、百分位數(shù)百分位數(shù)(percentile)是把一組數(shù)據(jù)從小到大排列,分割成100等份,每等份含1%的觀察值,分割界限上的值就是百分位數(shù),用符號Px表示。又將數(shù)據(jù)分成兩部分,有(100-x)%的數(shù)值大于Px,有x%的數(shù)值小于Px。中位數(shù)是第50百分位數(shù),用P50表示。第5、第25、第75、第95百分位數(shù)分別記為P5、P25、P75、P95。這些百分位數(shù)也可以作為反映離散趨勢的指標(biāo)使用,如P5與P95之間的距離或P25與P75之間的距離。百分位數(shù)的計算通常采用頻數(shù)表法,其公式為:公式中符號的意義同中位數(shù)。例2-9利用表2-3中的數(shù)據(jù),計算P25與P75。找出第25和第75百分位數(shù)所在組分別為第二組和第四組。P25所在組的L=4,i=4,fx=22,∑fL=14,代入式(2-6)得:
P25=6.32(μg/L)P75所在組的L=12,i=4,fx=18,∑fL=65,代入公式(2-6)得:
P75=15.39(μg/L)三、四分位數(shù)間距四分位數(shù)間距(quartileinterval)用Q表示,是上四分位數(shù)QU(P75)和下四分位數(shù)QL(P25)之差。其值越大,說明變異程度越大。常用于描述偏態(tài)分布資料的離散程度。該指標(biāo)比全距稍穩(wěn)定,但仍未考慮每個觀察值。
Q=QU-QL=P75-P25(2-7)
例2-10利用表2-3的資料計算四分位數(shù)間距Q。
在例2-9中已經(jīng)計算出P75與P25,故Q=15.39-6.32=9.07(μg/L)。四、方差若要克服極差和四分位數(shù)間距不能反映每個觀察值之間的離散情況的缺點,就必須全面考慮到每一個觀察值。先就總體而言,離散情況能否用總體中每個觀察值Xi與總體均數(shù)μ之差的總和(稱為離均差總和)反映資料的離散程度呢?可以明顯地看出若計算離均差平方和
結(jié)果則不為0,但又受觀察例數(shù)多少的影響,為了消除這一影響,可取離均差平方和的均數(shù),簡稱方差(variance)或均方(meanofsquares)??傮w方差用σ2表示,樣本方差用S2表示,公式分別為
方差的大小反映一組資料的離散趨勢大小。但由于其意義相當(dāng)于離均差平方和的均值,度量單位也是單位的平方,故難以解釋,在科技報道中很少使用。五、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviation)是方差的平方根。由于每一個離均差都經(jīng)過平方,使原來觀察值的度量單位(如cm,mmHg等)也都變?yōu)槠椒絾挝涣耍瑢?dǎo)致計算結(jié)果難以解釋。為了還原成為原來的度量單位,將方差開平方,得到標(biāo)準(zhǔn)差??傮w標(biāo)準(zhǔn)差用。,樣本標(biāo)準(zhǔn)差用S或SD表示,即
在此需要說明:式(2-11)中等式最右邊的式子是經(jīng)過推導(dǎo)出來的,以使運算方便;式(2-12)用于分組資料加權(quán)法計算標(biāo)準(zhǔn)差,其中Xi為各組的組中值。式(2-11)中的n-l和式(2-12)中的∑fi-1為自由度(degreeoffreedom)。由于用樣本資料計算的標(biāo)準(zhǔn)差常常小于總體標(biāo)準(zhǔn)差,英國統(tǒng)計學(xué)家W.S.Gosset提出用樣本例數(shù)減去1(n-l或∑fi-1)代替n,使得樣本標(biāo)準(zhǔn)差成為總體標(biāo)準(zhǔn)差的無偏估計值。例2-11從例2-1上抽出的10個數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,試用直接法計算標(biāo)準(zhǔn)差。n=10,代入式(2-11),得:S=5.41(次/分)例2-l2利用表2-2中的數(shù)據(jù)和頻數(shù)表法計算標(biāo)準(zhǔn)差。從表2-2計算得出:代入式(2-12)得:S=5.89(次/分)標(biāo)準(zhǔn)差的意義和用途有四:其一是說明資料的離散趨勢(或變異程度),標(biāo)準(zhǔn)差的值越大,說明變異程度越大。由于標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時用來描述資料的集中和離散趨勢。標(biāo)準(zhǔn)差愈小,說明觀察值的離散程度愈小,均數(shù)的代表性也就愈好。若比較的樣本單位相同,均數(shù)接近,標(biāo)準(zhǔn)差小的,說明離散趨勢??;其二是用于計算變異系數(shù);其三是用于計算標(biāo)準(zhǔn)誤(見第四章);其四是結(jié)合均值與正態(tài)分布的現(xiàn)律估計參考值的范圍(見第五節(jié))。六、變異系數(shù)變異系數(shù)(coefficientOfvariation)用CV表示。CV實際上是標(biāo)準(zhǔn)差的另一種表示方式,即將標(biāo)準(zhǔn)差轉(zhuǎn)化為均數(shù)的倍數(shù),以百分?jǐn)?shù)的形式表示。CV常常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。公式為
例如,對例2-l資料用加權(quán)法計算出脈搏=71.12(次/分),S=5.89(次/分),則其變異系數(shù)為:脈搏CV=8.28%
另測得該人群的紅細胞數(shù)的=4.7075(102/L),S=0.5662(102/L),其變異系數(shù)為:紅細胞CV=12.03%
可見該人群的紅細胞數(shù)的變異程度稍大于脈搏的變異程度。第四節(jié)正態(tài)分布一、正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的概念正態(tài)分布(normaldistribution)是一種重要的連續(xù)型分布。我們從第一節(jié)圖2-l中可見頻數(shù)分布以均數(shù)為中心,左右兩側(cè)基本對稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠,頻數(shù)愈少,形成一個中間多、兩側(cè)逐漸減少、基本對稱的分布。當(dāng)將樣本含量擴大,將組段分細,圖中直條將變窄,就會表現(xiàn)出中間高、兩側(cè)逐漸降低,并完全對稱的特點(如圖2-2(a)、(b)所示),將頻數(shù)分布圖各直條頂端的中點連線,就接近于一條光滑的曲線(如圖2-2(c)所示),這條曲線被稱作正態(tài)分布曲線,用N(μ,σ)表示,其位置與均數(shù)有關(guān),形狀與標(biāo)準(zhǔn)差有關(guān)。標(biāo)準(zhǔn)差大,離散程度大,正態(tài)分布曲線則“胖”,反之,則“瘦”。醫(yī)學(xué)研究中許多正常人生理、生化指標(biāo)的分布呈正態(tài)或近似正態(tài)分布。許多非正態(tài)分布的資料,當(dāng)觀察例數(shù)足夠多時,其均數(shù)也呈正態(tài)分布。正態(tài)分布是數(shù)理統(tǒng)計中最基礎(chǔ)的一種分布,很多統(tǒng)計推斷都是在正態(tài)分布條件下進行的。其概率密度函數(shù)(probabilitydensityfunction),為:式(2-14)中f(X)稱密度函數(shù),是與X對應(yīng)的正態(tài)曲線的縱坐標(biāo)高度,μ與σ分別為總體均數(shù)和標(biāo)準(zhǔn)差,π為圓周率(π=3.14159),e為自然對數(shù)的底,即2.71828。因此,已知μ、σ和變量值X,就能按式(2-14)繪出正態(tài)曲線的圖形,如圖2-3a所示。為了應(yīng)用方便,對于任何一個均數(shù)和標(biāo)準(zhǔn)差分別為μ與σ的正態(tài)分布,都可以通過變量的標(biāo)準(zhǔn)正態(tài)變換(),使之成為標(biāo)準(zhǔn)正態(tài)分布(standardizednormaldistribution),用N(0,1)表示,即均數(shù)為0,標(biāo)準(zhǔn)差為1。也就是將圖2-3a的坐標(biāo)原點移到0的位置,并使新坐標(biāo)的橫軸尺度以σ為單位。N(0,l)的概率密度函數(shù)為:式中為標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù),即縱坐標(biāo)高度,根據(jù)u的不同取值,就可按式(2-15)繪出標(biāo)準(zhǔn)正態(tài)分布的圖形,如圖2-3b。二、正態(tài)分布的特征和曲線下面積分布規(guī)律正態(tài)分布有五個方面的特征:①正態(tài)曲線(normalcurve)在橫軸上方,且均數(shù)μ所在處曲線最高;②正態(tài)分布以均數(shù)為中心,左右對稱;③正態(tài)分布有兩個參數(shù),即均數(shù)與標(biāo)準(zhǔn)差(μ與σ),均數(shù)μ為位置參數(shù),決定正態(tài)分布曲線所在的位置,標(biāo)準(zhǔn)差σ為形狀參數(shù),決定正態(tài)分布曲線的“胖”和“瘦”,
σ大,曲線為“矮胖型”,反之,為“高瘦型”,標(biāo)準(zhǔn)正態(tài)分布的均數(shù)和標(biāo)準(zhǔn)差分別為0和1;④正態(tài)曲線在±1σ,標(biāo)準(zhǔn)正態(tài)分布在±l處各有一個拐點(見圖2-4);⑤正態(tài)分布的面積分布有一定的規(guī)律性。正態(tài)分布和標(biāo)準(zhǔn)正態(tài)分布的面積可借助高等數(shù)學(xué)中微積分的方法分別對式(2-14),(2-15)求積分而求得,從-∞到X或u的面積F(X)或Ф(u)見圖2-3。統(tǒng)計學(xué)家已經(jīng)根據(jù)式(2-15)求出了標(biāo)準(zhǔn)正態(tài)分布從一∞到Ф(-u)的面積(見附表2-l)。實際工作中經(jīng)常要用的面積分布規(guī)律見表2-4及圖2-4。三、對數(shù)正態(tài)分布有時也將一些非正態(tài)分布資料轉(zhuǎn)化為正態(tài)分布資料來處理。若資料呈明顯的正偏態(tài)分布,可將各觀察值直接取自然對數(shù)(lnX)或取以10為底的對數(shù)(lgX);若資料呈負偏態(tài)分布,需要通過嘗試找出一個合適的常數(shù)K(可用一個略大于最大值的數(shù)值),用常數(shù)K減去各觀察值,然后取對數(shù)(lg(K-X)或ln(K-X),若對數(shù)值經(jīng)觀察或假檢驗呈正態(tài)分布,該分布被稱作對數(shù)正態(tài)分布(logarithmicnormaldistribution)。對數(shù)正態(tài)分布曲線下橫軸上的面積規(guī)律同正態(tài)分布,該規(guī)律可用于醫(yī)學(xué)參考值的估計。第五節(jié)醫(yī)學(xué)參考值的估計醫(yī)學(xué)參考值是指正常人的各種生理、生化數(shù)據(jù),組織或排泄物中各種成分的含量。同是一批正常人,由于個體差異的客觀存在,“某一生理或生化指標(biāo)的測定結(jié)果有大有小,即使是同一個體,其生理、生化測定數(shù)據(jù)也會隨著機體內(nèi)外環(huán)境的變化而相應(yīng)地波動。因此,需要估計正常人測定值的波動范圍,該范圍稱為參考值范圍(referenceranges),參考值范圍在診斷方面可用于劃分正常與異常。隨著新設(shè)備。儀器、試劑、測試方法的不斷推出及對不同時代正常人某些變量測定值的比較,都需要進行醫(yī)學(xué)參考值的研究。一、制定參考值的基本步驟1.從正常人總體中抽樣所謂正常人,不是一點小病都沒有的人,而是指排除了影響被研究指標(biāo)的疾病或因素的人。例如,研究某市成人血鉛的參考值范圍,是以留住該市一年以上。無明顯肝腎疾病、無鉛作業(yè)或接觸史的成人作為被研究的正常人總體。按隨機化方法進行抽樣研究。抽取樣本含量要足夠大,因參考值范圍是根據(jù)樣本數(shù)據(jù)估計的,樣本分布愈接近總體分布,所得結(jié)果愈可靠。因此,樣本含量不能過少,一般認為,估計每個人群組參考值范圍(如男性或女性紅細胞參考值范圍)的樣本含量一般應(yīng)在100例以上。如果被研究指標(biāo)的影響因素較多,數(shù)據(jù)變異大,樣本含量應(yīng)該相對多些,以能取得一個分布較為穩(wěn)定的樣本為原則。2.控制測量誤差測量的方法、儀器、試劑、精密度、操作熟練程度都要統(tǒng)一,以便將測量誤差控制在一定的范圍內(nèi)。3.判定是否需要分組確定參考值范圍原則上,組與組之間差別明顯,且差別有實際意義則應(yīng)分開,否則應(yīng)當(dāng)合并確定。考察組間差別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 武漢工貿(mào)職業(yè)學(xué)院《證券投資學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北省泊頭市教研室重點達標(biāo)名校2024-2025學(xué)年語文試題基地校初三畢業(yè)班總復(fù)習(xí)平面向量、復(fù)數(shù)形成性測試卷語文試題試卷含解析
- 山東專卷博雅聞道2024-2025學(xué)年高三普通高中畢業(yè)班綜合測試(一模)物理試題試卷含解析
- 保潔P G外包策略
- 液壓技術(shù)的綠色制造與環(huán)保理念考核試卷
- 電力設(shè)備運行維護中的能效分析與改進措施考核試卷
- 新風(fēng)系統(tǒng)在健康家居領(lǐng)域的應(yīng)用探討與前景分析考核試卷
- 電氣機械設(shè)計與用戶體驗考核試卷
- 漁業(yè)機械產(chǎn)業(yè)鏈的風(fēng)險評估與管理策略考核試卷
- 石棉在電力工程中的應(yīng)用與管理考核試卷
- 長陽區(qū)域構(gòu)造
- 公路水運工程施工企業(yè)(主要負責(zé)人和安全生產(chǎn)管理人員)考核大綱及模擬題庫
- 計算機在材料學(xué)中綜合作業(yè)
- 建設(shè)項目辦理用地預(yù)審與選址意見書技術(shù)方案
- 2019年遼寧省普通高考志愿填報表(一)
- x-y數(shù)控工作臺機電系統(tǒng)設(shè)計
- 北京中醫(yī)藥大學(xué)個人自薦信
- 工程交付使用表
- 電子物證專業(yè)考試復(fù)習(xí)題庫(含答案)
- 欣賞 牧童短笛
- (完整版)BrownBear繪本附配音課件
評論
0/150
提交評論