![數(shù)值變量資料的統(tǒng)計描述_第1頁](http://file4.renrendoc.com/view/2e1e1c0467d39c202dfdb30a254de38f/2e1e1c0467d39c202dfdb30a254de38f1.gif)
![數(shù)值變量資料的統(tǒng)計描述_第2頁](http://file4.renrendoc.com/view/2e1e1c0467d39c202dfdb30a254de38f/2e1e1c0467d39c202dfdb30a254de38f2.gif)
![數(shù)值變量資料的統(tǒng)計描述_第3頁](http://file4.renrendoc.com/view/2e1e1c0467d39c202dfdb30a254de38f/2e1e1c0467d39c202dfdb30a254de38f3.gif)
![數(shù)值變量資料的統(tǒng)計描述_第4頁](http://file4.renrendoc.com/view/2e1e1c0467d39c202dfdb30a254de38f/2e1e1c0467d39c202dfdb30a254de38f4.gif)
![數(shù)值變量資料的統(tǒng)計描述_第5頁](http://file4.renrendoc.com/view/2e1e1c0467d39c202dfdb30a254de38f/2e1e1c0467d39c202dfdb30a254de38f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一章數(shù)值變量資料的統(tǒng)計描述統(tǒng)計描述(statisticaldescription)即利用原始數(shù)據(jù),選擇適宜的統(tǒng)計指標(biāo)及統(tǒng)計圖表,簡明準(zhǔn)確地探察數(shù)據(jù)的分布類型和數(shù)量特征,以便研究者根據(jù)樣本信息,正確地推論其總體規(guī)律的統(tǒng)計分析方法。統(tǒng)計指標(biāo)(statisticalindex)是表示數(shù)據(jù)分布特征的一個或一組數(shù)值,是統(tǒng)計分析的基本依據(jù).第一節(jié)頻數(shù)分布的概念與應(yīng)用對獲取的數(shù)據(jù)進行統(tǒng)計學(xué)分析之前,了解數(shù)據(jù)的分布特征是至關(guān)重要的。因為很多參數(shù)分析方法都要求樣本數(shù)據(jù)來自某種已知分布的總體,否則,就應(yīng)對數(shù)據(jù)實施合適的數(shù)據(jù)轉(zhuǎn)換,或者采用非參數(shù)分析方法。對頻數(shù)表及頻數(shù)圖進行分析是描述性統(tǒng)計學(xué)分析的基本內(nèi)容,也是表達或探索數(shù)據(jù)分布特征的基本手段.一、 頻數(shù)分布頻數(shù)分布(frequencydistribution)的概念頻數(shù)(frequency)是相同觀察值或觀察結(jié)果出現(xiàn)的次數(shù);分布(distribution)指隨著隨機變量取值的變化,其相應(yīng)的概率變化的規(guī)律性。頻數(shù)分布即觀察值(變量值)按大小分組,各個組段內(nèi)觀察值個數(shù)(頻數(shù))的分布它是了解數(shù)據(jù)分布形態(tài)特征與規(guī)律的基礎(chǔ).頻數(shù)分布的特征(1)集中趨勢(centraltendency):指一組變量值的集中傾向或中心位置.(2)離散趨勢(tendencyofdispersion):指一組變量值的分散傾向。頻數(shù)分布的類型⑴對稱分布:指集中位置居中、左右兩側(cè)的頻數(shù)分布基本對稱的頻數(shù)分布。又可分為正態(tài)分布(normaldistribution)和非正態(tài)分布(non-normaldistribution).⑵偏態(tài)分布:是集中位置偏倚、兩側(cè)頻數(shù)的分布不對稱的頻數(shù)分布,可分為兩類:①正偏態(tài):亦稱右偏態(tài),特點是峰偏左,此時均數(shù)與眾數(shù)之差為正值,長尾向右側(cè)(即觀察值較大一端)伸延;②負(fù)偏態(tài):亦稱左偏態(tài),特點為峰偏右,此時均數(shù)與眾數(shù)之差為負(fù)值,長尾向左側(cè)(即觀察值較小一端)伸延。二、 頻數(shù)表和頻數(shù)圖頻數(shù)表(frequencytable):是頻數(shù)分布表的簡稱,指觀察值及其相應(yīng)的頻數(shù)按一定順序排列的表格。頻數(shù)圖(frequencygraph):是在頻數(shù)表的基礎(chǔ)上,以直方的面積大小表示頻數(shù)的多少、以直方面積在總面積中的比例表示頻率大小的圖形。數(shù)值變量資料頻數(shù)表的編制例1-1隨機抽取某地120例正常人,測得血清銅的含量如表1-1,試編制頻數(shù)表。⑴找極值即找出最大值(Xmax)與最小值(X"Q.本例Xmax=19.84,xmin=9o23⑵求全距R本例R=19.8*^9.23=10.61 "「 牌、 "’「⑶定組數(shù)k k一般取8-—15,本例k定為11。R1061⑷求組距II= = =1o06181K-111-1⑸劃分組段下限(L)即某一組段的起點。上限(U)是某一組段的終點。為計算方便,第一組段的L一般取略小于最小值的方便數(shù),其余各組段依次累加i即可」但最后一個組段必須包含最大值,參見表1—2第1列。(6) 記頻數(shù)通常以劃記的方式歸組,得出各組的頻數(shù),參見表1-2第⑵、⑶列。(7) 計算累計頻數(shù)(fp與累計頻率(Pc)fc與Pc均為由上向下累加運算而得?fc指小于該組段上限的數(shù)據(jù)個數(shù)。某一組段的fc=該組的f+上一組段的fc,見表1—2的第(5)列。Pc表示小于該組段上限的數(shù)據(jù)個數(shù)占總樣本數(shù)的比例.某一組段的Pc=該組段的P+上一組段的Pc,或Pc=該組段的fc/n,見表1—2的第(6)列。表1-1某地120名正常人血清銅含量(umol/L)
13.8412。5313.7014.8917.5313。1918。8210.1514。5611。2314。7317.4413.9014.1012。2912.6114。7814.409。9315.1814。5914.7118.6219.0410.9513.8110。5318。0616.1815。6013。5611.4813。0716。8817.0417。9812.6710。6216。4314。2611。039。2315。0414。0915.9011.4814.6417。2415。4313.3713。6414.3915。7413.9911。3117.6116。2611.3217。8816.7813。5311.6813。2511.8814.2115。2115.2916.6312。8715.9313.7014。4511.2319.8413.1115.1511。7015。3712.3514。5114。0918.2214。3415。4811.9816.5412。9512。0616.6717.0916。8513。2016。4812.2912。0914。8315.6614。5016。4315。5712。8112。8917。3416。0413.4117.1312.329。2918。4214。1714.3516.1915.7313。7414.9417。2815。1911。9215.4715。33表1—2某地120名正常成年人血漿銅含量(Rmol/L)頻數(shù)表組段⑴劃記⑵頻數(shù)f⑶頻率P(%)⑷累積頻數(shù)fC⑸累積頻率Pc(%)⑹C9。00?下32.532.510。00?止43。375.811。00~正正T1210。01915.812。00~正正下1310.83226.613。00~正正正T1714.24940.814.00?正正正正T2218。37159。115。00?正正正下1815.08974。116.00?正正下1310。810284.917.00~正正一119。211394.118。00?正54.211898.319.00~T21。7120100.0合計120100。02.數(shù)值變量資料頻數(shù)圖的編制等距分組以橫軸表示變量,以縱軸表示頻數(shù)。由表1-2的資料繪制頻數(shù)圖(圖3—1)。不等距分組以橫軸表示變量,但縱軸是每個橫軸單位的頻數(shù)。由表1—3的資料繪制頻數(shù)圖(圖3—2)。表1-3某市某年暑溫患者年齡分布年齡(歲)病人數(shù)每歲病人數(shù)年齡(歲)病人數(shù)每歲病人數(shù)年齡(歲)病人數(shù)每歲病人數(shù)0?335?222210?363.61?336?111120~131.32?997?141430?111.13?11118?8840?40.44?23239?6650?6010。1
圖3-1某地圖3-1某地L2D例正常成年人血漿酮含呈某市某年目溫患者年散分布第二節(jié)數(shù)值變量資料集中趨勢的描述集中趨勢(centraltendency)是度量由變異導(dǎo)致變量值多樣性的數(shù)量指標(biāo),其代表值為平均數(shù)。平均數(shù)是一組描述或反映一組數(shù)值變量平均水平的統(tǒng)計指標(biāo)。根據(jù)計算或確定方法的不同,平均數(shù)可分為算術(shù)平均數(shù)(arithmeticmean)、幾何平均數(shù)(geometricmean)、中位數(shù)(median)、調(diào)和平均數(shù)(harmonicmean)和眾數(shù)(mode)。一、算術(shù)平均數(shù)定義算術(shù)平均數(shù)簡稱為均數(shù),是一組觀察值之和與觀察值個數(shù)之商。是數(shù)量上的平均。統(tǒng)計符號r。應(yīng)用條件要求資料服從正態(tài)或近似正態(tài)分布。如生理指標(biāo).計算方法⑴直接法用于觀察值例數(shù)不多的資料。計算公式見公式1—1.⑵加權(quán)法用于觀察值例數(shù)較多或觀察值中相同數(shù)據(jù)較多的資料。計算公式見公式1—2。(公式1-1)(公式1-2)式中希臘字母,為求和的符號。例1—212例腎虛失鈉型哮喘病人甲皺微循環(huán)的管祥長度(^m)分別為125。0、125。0、125。0、187.5、187。5、187。5、187。5、250。0、250。0、250.0、312.5、312.5,求其均數(shù).代入公式1-1得:X=25。0+125.0+125.0+187。5+187。5+187.5+187。5+250。0+250。0+250.0+312。5+312.5)/12=2500/12=208.3(頃)例1—3計算表1—2資料的均數(shù)。(1)列計算表見表1一4。表1—4某地120名正常成年人血漿銅含量(口mol/L)的均數(shù)、標(biāo)準(zhǔn)差計算表血漿銅含量(|imol/L)⑴組中值X⑵頻數(shù)f⑶fx(4)=⑵⑶fx2(5)=⑵⑷9。00?9.50828。50270。7510.00?10。51442.00441.0011.00~11。5012138。001587。0012。00?12.5013162。502031。2513.00?13。5017229。503098。25
14。00?14。5022819。004625。5015。00?15.5018279.004324。5016。00?16.5013214.503539。2517.00?17。5011192.503368.7518。00?18。50592.501711。2519.00?19。50239。00760。501201737。0025758。00合計(Zf)(Zfx)(Zfx2)注:表中第⑵欄x為組中值,組中值=(本組段下限十本組段上限)/2,如“9。00~”組段的組中值為(9.00十10。00)/2=9.5,余類推。(2)計算均數(shù)將表1-4第⑶、⑷欄合計數(shù)代入公式1—2得:亍=1737。00/120=14。48(|Jmol/L)二、幾何均數(shù)定義幾何均數(shù)是n個數(shù)值連乘積的n次方根。是比例或倍數(shù)上的平均。統(tǒng)計符號G。應(yīng)用條件等比數(shù)列資料。如抗體滴度。計算方法⑴直接法用于觀察值例數(shù)不多的資料。計算公式見公式1—3.⑵加權(quán)法用于觀察值例數(shù)較多或觀察值中相同數(shù)據(jù)較多的資料。計算公式見公式1-4。G=nHx (公式1—3)注:式中希臘字母n為求積的符號。*flogxG=log—1—*f— (公式1—4)例1-4某醫(yī)院測得8例脾虛納呆患兒的尿液淀粉酶含量(U/10ml)為4,4,8,8,8,16,16,32,試求其均數(shù)。代入公式1-3,得:G=84x4x8x8x8x16x16x32=9.5例1—5某地46例暑溫病人的血凝抑制抗體滴度如表3—8第⑴、⑵欄,試求其平均數(shù)。(1)列計算表見表1-5。表1-5 46例暑溫病人的血凝抑制抗體滴度抗體滴度⑴例數(shù)f⑵滴度的倒數(shù)x⑶logx⑷flogx(5)=⑵⑷f(logx)2(6)=⑵⑷21:201201.30101。30101。69261:405401.60218。010512。83361:8010801。903119。031036.21791:160101602.204122。041048。58071:320113202.505127。556169.03081:64066402。806216.837247.24861:1280112803。10723。10729。65471:2560225603。40826.816423.2317合計46104。7004248。4906數(shù)值變量資料的統(tǒng)計描述(If) (Aflogx) (,f(logx)(2)計算幾何均數(shù)將表1—5第⑵、⑸欄合計數(shù)代入公式1—4,得:G=log—i(104.7004/46)=log-i2.2761=189三、中位數(shù)定義將一組觀察值按由小到大的順序排列,位次居中的數(shù)值即中位數(shù)。是位次上的平均。統(tǒng)計符號M。應(yīng)用條件不拘分布或分布類型不明的資料;一端或兩端無界的資料.如潛伏期、治愈時間和發(fā)病年齡。計算方法⑴直接法用于觀察值例數(shù)不多的資料。若觀察值為偶數(shù):m=x(+1)/2。若觀察值為偶數(shù),位次居中的兩個觀察值的均數(shù)即中位數(shù)。M=(X”2+X(n/2+1))⑵頻數(shù)表法用于觀察值例數(shù)較*的資'料。計算公式見公式1—5.M=L+L[立-Ef] (公式1-5)fI2勺m式中L為M所在組段的下限;i為該組段的組距;七為該組段的f;If為總例數(shù)(f之和);IfL為小于L的各組段fcO用該式求中位數(shù)時,需先編制頻數(shù)表。 L例1-6某醫(yī)院用大黃粉治療胃熱血瘀型血證病人9例,其大便轉(zhuǎn)陰天數(shù)分別為1,1,2,2,3,4,5,7,10,試求其中位數(shù)。本例觀察值的個數(shù)為奇數(shù),將9個觀察值按從小到大的順序排列后,位次居中的第五個觀察值“3天”即其中位數(shù)。如果觀察值為10個,第10個數(shù)值為16天,則位次居中的兩個觀察值“3"和“4"的算術(shù)均數(shù)3.5即為M。例1—7某醫(yī)院905例男性銀屑病患者的發(fā)病年齡資料見表1—6第⑴、⑵欄,試求其M。M的累計頻率應(yīng)為50%.由表1—6第(4)欄可知,“20~”組段的累計頻率已大于50%,故M應(yīng)位于該組段內(nèi)。代入公式1—5,得:M=20+(10/346)(905/2—306)=24。23(歲)表1-6 905例男性銀屑病病人的發(fā)病年齡年齡(歲)⑴頻數(shù)f⑵累計頻數(shù)fc⑶累計頻率pc(%)⑷<1054545。9710?252306(IfL)33.8120?(L)346f652L72.0430~12878086。1940?8486495。4750~2989398。6760?589899.23N707905(If)100。00第三節(jié)數(shù)值變量資料的離散趨勢描述離散趨勢指標(biāo)亦稱變異性指標(biāo),它們是在整體上描述一組同質(zhì)觀察值的變異程度大小的綜合指標(biāo),常用的變異性指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。為了全面描述研究總體的特征,需要在計算集中性指標(biāo)的同時計算離散性指標(biāo).如表1—7的兩組數(shù)據(jù),
數(shù)值變量資料的統(tǒng)計描述A與B兩個學(xué)生五門課程成績的均數(shù)都是80,但各科成績分布情況卻不相同。A較集中,變異較?。欢蛰^分散,變異較大。表1-7變異指標(biāo)示意(兩個學(xué)生五門成績分布)學(xué)生-12科目345X-變異指標(biāo)RS2 SCVA78798081828042。5 1.581.98B607080901008040250 15。8119.76一、極差(range)極差亦稱全距(R),其計算公式見公式1-2。R與變異程度成正比。其特點是意義明確、計算簡便,但靈敏性和穩(wěn)定性較差。二、百分位數(shù)(percentile)和四分位數(shù)間距(quartilerange)概念百分位數(shù)是把一組觀察值從小到大排列,分為100等份,與x%位次所對應(yīng)的數(shù)值即為第百分之x位數(shù),以符號Px表示。如稱居于全部觀察值個數(shù)百分之五位置的點值為第百分之五位數(shù),以符號P5表示。一個Px將全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100—x)%的觀察值比它大:故百分位數(shù)是一種位置指標(biāo)。中位數(shù)即P5Q.TOC\o"1-5"\h\z四分位數(shù)間距是上四分位數(shù)Qu(P:;)與下四分位數(shù)七(P25)之差,符號為QR。它是中間50%觀察值的極差。 ° 75 ' 25Px==L+-^(nx%~EfL)
fmQR=QPx==L+-^(nx%~EfL)
fmQR=Q—Q=P—P仍以例1—7資料為例,求其P25、P75和涼?!?75 25首先按Pc(%)找出P25所在的組段。。據(jù)表1-6可知,“10?”組段的Pc已達33.81%,可見P25應(yīng)在該組(公式1—6)(公式1-7)內(nèi)。用公式3—7,得:P2:=10+(10/252)X(905X0.25—54)=16.84(歲) *同理,“30~”組段的S:已達86.19%,可見P75應(yīng)在該組內(nèi)。P75=30+(10/128)X(905X0.75—652)=32.09(歲) ° 75 75QR=P75—P25=32.09—16.84=15.25(歲)主要用途25⑴與中位數(shù)一起描述偏態(tài)分布資料的分布特征由于四分位數(shù)間距較極差穩(wěn)定,與中位數(shù)一起描述偏態(tài)分布資料的分布特征時,簡寫為M(QR)。⑵表示參考值范圍百分位數(shù)的另一個重要用途是表示偏態(tài)分布資料的參考值范圍。三、方差定義方差(variance)即離均差平方和(sumofsquaresofdeviationsfrommean,SS)的均值.總體方差的符號為。2,樣本方差的符號為S2。特點由于SS利用了每個個體觀察值的信息,因而S2反映一批數(shù)據(jù)的變異程度時優(yōu)于極差和四分位數(shù)間距,穩(wěn)定性和精確性較好,故能綜合反映一組觀察值的變異情況。但是,由于在運算時需將各個離均差平方,使得觀察值的原度量單位變成平方單位,不便于進行比較,故主要用于假設(shè)檢驗中的方差分析。應(yīng)用條件要求資料服從正態(tài)或近似正態(tài)分布。計算方法見公式1-8。S2=eG二x力 (公式1-8)式中£°-元?為離均差平方和(SS);n-1為自由度,符號為V。由于方差近似等于SS的算術(shù)均數(shù),亦稱均方(meansquare,MS)。四、標(biāo)準(zhǔn)差(standarddeviation)1.定義標(biāo)準(zhǔn)差即方差的平方根??傮w標(biāo)準(zhǔn)差的符號為。,樣本標(biāo)準(zhǔn)差的符號為s;英文縮寫為SD。定義公式見公式1—9。s=乙偵* (公式1—9)\n-1特點標(biāo)準(zhǔn)差除了具有方差的優(yōu)點外,還克服了度量單位被平方的不足,運用較方便,是常用的離散性指標(biāo).它與觀察值的變異程度正比,即標(biāo)準(zhǔn)差越大,表示各觀察值的變異程度越大,其均數(shù)的代表性較差。應(yīng)用條件要求資料服從正態(tài)或近似正態(tài)分布。計算方法⑴直接法用于小樣本資料(nV30=,計算公式見公式1-10.Lx2 s=| 」 (公式1—10)|:n-1例1-8測得7例外感風(fēng)寒女性病人的體溫值(°C)為37。8,38。0,38。1,38.2,38.3,38.5,39.4。試求其標(biāo)準(zhǔn)差。本例n=7;Zx=37o8十38.0十38。1十38。2十38。3十38。5十39。4=268。33x2=37.82十38。02十38.12十38。22十38。32十38。52十39。42=10285。19代入公式1—10得:■10285.19-268^S=?「 7_7-1(公式1一11)(公式1一11)S\ ZfT例1-9求表1-4資料的標(biāo)準(zhǔn)差。由該表第⑶、⑷、⑸欄合計:,f=120,3fx=1737.00,3fx2=25758.00,代入公式1-11,得:〔25758.00-竺膽s= 120—=2.27(頃。1/1_)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人雇傭合同模板
- 2025年國際信貸合同(三)
- 中外合資生產(chǎn)制造合同(有限責(zé)任)
- 個人經(jīng)營性借款合同范例
- 中外勞務(wù)派遣合同樣式參考
- 二手房交易合同終止合同書
- 個人墓地購置合同細(xì)則
- 事業(yè)單位臨時工勞動合同條款
- 委托貸款借款協(xié)議書年
- IT行業(yè)合同聘用細(xì)則及范本
- 2024年廣州金融控股集團有限公司招聘筆試沖刺題(帶答案解析)
- 中國食物成分表2018年(標(biāo)準(zhǔn)版)第6版
- 九三學(xué)社申請入社人員簡歷表
- 卓有成效的管理者讀后感3000字
- 七年級下冊-備戰(zhàn)2024年中考?xì)v史總復(fù)習(xí)核心考點與重難點練習(xí)(統(tǒng)部編版)
- 巖土工程勘察服務(wù)投標(biāo)方案(技術(shù)方案)
- 實驗室儀器設(shè)備驗收單
- 新修訂藥品GMP中藥飲片附錄解讀課件
- 蒙特利爾認(rèn)知評估量表北京版
- 領(lǐng)導(dǎo)干部個人有關(guān)事項報告表(模板)
- GB/T 7631.18-2017潤滑劑、工業(yè)用油和有關(guān)產(chǎn)品(L類)的分類第18部分:Y組(其他應(yīng)用)
評論
0/150
提交評論