版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章數(shù)據(jù)的整理與統(tǒng)計描述12199410199886420血壓心率TTTGPT第二章數(shù)據(jù)的整理與統(tǒng)計描述統(tǒng)計數(shù)據(jù)的整理第一節(jié):數(shù)據(jù)分布特征的統(tǒng)計描述第二節(jié):第一節(jié):統(tǒng)計數(shù)據(jù)的整理統(tǒng)計表與統(tǒng)計圖一、定性數(shù)據(jù)的整理二、定量數(shù)據(jù)的整理三、統(tǒng)計表-結(jié)構(gòu)縱標(biāo)目:列在表的上端說明橫標(biāo)目各統(tǒng)計指標(biāo)內(nèi)容,并注明計算單位標(biāo)題:要簡明扼要、準確地說明表的內(nèi)容,位于表的上部表號表題(包括何時、何地、何事)總橫標(biāo)目(或空白)總標(biāo)目列橫標(biāo)目:縱標(biāo)目1縱標(biāo)目2……在表的左側(cè),橫標(biāo)目1×××××.××……用以表示被說明事物的橫標(biāo)目2×××.××………………主要標(biāo)志合計×××××.××一律用阿拉伯?dāng)?shù)字,數(shù)字數(shù)字:以小數(shù)點對齊,小數(shù)位數(shù)一致,無數(shù)字的用“─”表示表的上下兩條邊線略粗,縱、橫線條:標(biāo)目間及合計用細線分開,表的左右邊線可省去,表的左上角一般不用斜線統(tǒng)計表-的分類表1某藥物療效的頻數(shù)表(1)簡單表只按一種標(biāo)志分組治療結(jié)果頻數(shù)頻率(%)治愈6543.3有效4530.3無效2516.7惡化1510.0合計150100.0圖2某地城鄉(xiāng)居民乙型肝炎病毒抗原攜帶率(2)組合表是將兩種或兩種以上標(biāo)志結(jié)合起來分組城市年齡組檢查數(shù)陽性數(shù)陽性率(‰)<30423842746.4630~146142209314.3235~74629129917.41≥402119327312.88748303865411.56合計統(tǒng)計圖-結(jié)構(gòu)甲乙丙圖例100刻度(尺度)8060點線條面40接種率(%)注:橫軸由左至右、20縱軸由下而上,數(shù)值由小到大;圖形長寬比例約7:5Y軸標(biāo)題0標(biāo)目卡介苗脊灰炎苗百白破苗麻疹疫苗X軸標(biāo)題疫苗標(biāo)題:圖12000年三大城市四苗接種率(%)位于表的下方統(tǒng)計圖-種類-1、條圖條圖:用等寬的直條長度表示事物的數(shù)量,用于比較相互獨立的統(tǒng)計指標(biāo)兩種。復(fù)式條圖,。常用的有單式條圖12101994各條的寬度要一致,1998條間的空隙要相等86直條圖的縱軸尺度4起點必須為020血壓心率TTTGPT圖2某工廠職工1994年、1998年四項生理指標(biāo)異常檢出率統(tǒng)計圖-種類-2、圓圖圓圖:是以圓形總面積作為100%,將其分割成若干個扇面,它用于表示事物內(nèi)部。事物內(nèi)部各構(gòu)成部分所占的比例表示的構(gòu)成情況。一般從時鐘12時或9時處開始,順各扇形要注明簡要的文字和百分比,還可用不同顏色或其它36.4%高熱、抽風(fēng)27.8%時針方向排列線條表示傳染病圓內(nèi)各部分按事物自然順序或百分比中耳炎16.9%12.4%的大小順序排列圖3某地1560例后天性聾啞病因構(gòu)成圖統(tǒng)計圖-種類-3、線圖發(fā)病率、死亡率或均數(shù))隨另一線圖:用線段的升降表達一事物(事物(時間、年齡)數(shù)量變化的趨勢,最常用于描述統(tǒng)計量隨時間變化而變化的趨勢。表3某地1950-1966傷寒與結(jié)核病死亡率(1/10萬)時間傷寒結(jié)核病19503618019522516021140195416125195619585103196037819621.56819640.85219660.338200傷寒結(jié)核病150死亡率100500時間195019521954195619581960196219641966普通線圖:橫軸和縱軸都是算術(shù)尺度。反映不同指標(biāo)變化的幅度。2.5傷寒2結(jié)核病1.51死亡率0.50時間-0.5-1195019521954195619581960196219641966半對數(shù)線圖:橫軸是算術(shù)尺度,縱軸是對數(shù)尺度。反映不同指標(biāo)變化的速度。統(tǒng)計圖-種類-4、直方圖直方圖:用各矩形(寬度為組距)的面積表示各組段的頻數(shù)或頻率,用于表示連續(xù)變量的頻數(shù)分布。25矩形間不人數(shù)2015留空隙橫軸表示變量被觀1050測指標(biāo)(分組)141720232629323538414447縱軸表示頻率或頻血清轉(zhuǎn)氨酶(mmol/L)數(shù)115名正常成年女子血清轉(zhuǎn)氨酶的頻數(shù)分布統(tǒng)計圖-種類-5、散點圖散點圖:兩指標(biāo)或兩變量間的用點的密集程度和散布趨勢表示相關(guān)關(guān)系。100959085807570656055縱軸代表變量Y以橫軸代表變量X5101520253035圖410例成人血硒與發(fā)硒的相關(guān)分析返回二、定性數(shù)據(jù)的整理,其數(shù)據(jù)本身就是對事物的對于定性數(shù)據(jù)主要作分類整理一種分類或類別排序,進行數(shù)據(jù)整理時,只需按不同數(shù)據(jù)(類別)進行分組,算出各組的頻數(shù)或頻率、百分比或累積百分比,列出頻數(shù)分布表,再用統(tǒng)計圖顯示其整理結(jié)果。例1.1人口按受教育程度分組形成的頻數(shù)分布表:根據(jù)2000年我國人口普查數(shù)據(jù)得到的我國6周歲以上受教育程度文盲半文小學(xué)初中高中及中大專及以合計盲專上人數(shù)(萬人)百分比(%)1109345191429891410945711179539.4%38.3%36.4%12.0%3.9%100.0%二、定性數(shù)據(jù)的整理50000451914298940000人數(shù)(萬)300002000011093141091000045710受教育程度文盲半文盲圖52000小學(xué)年我國6周歲以上人口受教育程度條形圖初中討論1:該組數(shù)據(jù)的主討論2:用EXCEL演示定要規(guī)律是什么?高中及中專性數(shù)據(jù)的整理大專及以上返回三、定量數(shù)據(jù)的整理對于定量數(shù)據(jù)(數(shù)值數(shù)據(jù))主要作分組整理-組距式分組法定量數(shù)據(jù)統(tǒng)計整理的目的并根據(jù)分布類型選用的統(tǒng)計指標(biāo)描述集中趨勢、離散程度及形。狀等統(tǒng)計指標(biāo)。是了解定量數(shù)據(jù)的分布規(guī)律和類型,例2-1某藥師用表2-1某藥100片的含藥量(mg)隨機抽樣方法檢查了某藥100片,測量其含藥量,檢測結(jié)果如表2-1。50.147.750.955.547.145.854.642.844.052.757.442.446.245.352.357.544.748.651.444.350.049.950.843.343.449.745.947.355.445.942.949.246.650.446.437.647.743.956.751.854.048.549.056.452.445.348.043.751.949.853.462.247.556.753.341.149.559.951.345.043.156.750.954.453.160.953.842.750.749.142.957.647.549.448.051.739.450.247.854.546.547.649.650.954.150.353.945.449.248.855.449.837.350.855.150.850.251.147.352.2試編制頻數(shù)表和頻數(shù)圖。(1)求全距,又稱極差(range)極差(range):極差也稱全距,即最大值和最小值之差,記作R。本例R=62.2?37.3=24.9(mg)(2)確定組數(shù)組數(shù)(numberofclasses)一般根據(jù)樣本容量的大小考慮到對資料要求的精確度8~15組,本例暫定為10組。來確定,同時計算是否方便以及進一步。通常取(3)確定組距img==≈極差組數(shù)=/24.9/102.493()(4)確定組限和組中值組限classlimit()各組的最大值與最小值,最小值為下限,最大值為上限.最小一組的下限必須小于資料中的最小值(37.3),最大一組的上限必須大于資料中的最大值(62.2);臨界值可就高組不就低組(但excel中就低組不就高組)。組中值(classmid-value)是兩個組限的中間值。組限37--4040--4343--4646--4949--5252--5555--5858--6161--64中值38.541.544.547.550.553.556.559.562.5(5)歸組歸組,即按原始資料中各觀測值的次序,將各個數(shù)值歸于各組.表某藥100片的含藥量頻數(shù)分布表組限組中值歸組次數(shù)頻率累積頻率計算各組的觀測數(shù)次,、數(shù)、頻率累積頻率制成一個次數(shù)分布表。37~38.541.540~43~46~47.550.549~53.552~56.555~59.558~62.561~30.030.0360.060.0944.5150.150.24………………180.180.42300.30.72討論1:該組數(shù)據(jù)的主要14110.140.86規(guī)律是什么?0.110.97討論2:EXCEL演示定量210.020.99資料的整理。0.011繪制直方圖橫坐標(biāo)——指標(biāo)(藥片含藥量)縱坐標(biāo)——頻數(shù)密度即頻數(shù)/組距或頻數(shù)(等組距頻數(shù)表)頻30數(shù)25201510討論:EXCEL演示50定量數(shù)據(jù)的整理。37404346495255586164含藥量(mg)圖6100片藥片含藥量的直方圖頻數(shù)表與頻數(shù)分布圖的用途1、作為陳述資料的形式:簡單明了或直觀形象,便于進一步作統(tǒng)計分析。2、揭示計量資料的分布特征(1)對稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對稱(總體則完全對稱),就認為該資料是對稱分布。(2)偏態(tài)分布:負偏態(tài)分布、正偏態(tài)分布左偏分布對稱分布右偏分布頻數(shù)表與頻數(shù)分布圖的用途3、描述資料的集中趨勢與離散趨勢變異的范圍在302520151037~64(mg)之間有明顯的統(tǒng)計分布規(guī)律,數(shù)據(jù)主要集中在43~58(mg)之間,且上下組段數(shù)的頻數(shù)分布基本對稱。5037404346495255586164含藥量(mg)圖7100片藥片含藥量的直方圖第二節(jié):數(shù)據(jù)分布特征的統(tǒng)計描述403530變量的分布具有兩種明顯的基本特征:集中性和離散性。25頻率2015105040455055606570758085其他接收(centrality)是集中性變量在趨勢上有著向某一中心聚集,或者說以某一數(shù)值為中心而分布的性質(zhì)。離散性(discreteness)是變量有著離中分散變異的性質(zhì)。集中性平均數(shù)表示資料中觀測數(shù)的中心位置,并且可作為資料的代表與另一組相比較,以確定二者的差異情況。平均數(shù)均幾中四數(shù)何位分眾數(shù)平數(shù)位均數(shù)數(shù)一、均數(shù)(mean)意義:用于反映一組呈對稱性分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。應(yīng)用:對稱性分布,尤其是正態(tài)分布符號:總體,樣本μXxxx12+++...N1Nμ==NNxii=1xxx12+++...n1nxx==nnii=1均數(shù)的性質(zhì):平均數(shù)①樣本各個觀察值與平均數(shù)之差的和為零,即離均差為零;之和n(xi?x)=0,簡記為(x?x)=0i=1②樣本各觀察值與平均數(shù)之差的平方和為最小,即離均)證明差的平方和最小。(nn22()()()xxii?x?≠aax常數(shù)ii==1122簡記為):(xxxa?()?平均數(shù)nn22證:因()()()xii?=?+?axxxa為nii==1122=?+??+?()2()()()xxxxxaxaii=?+??+?()2()()()xxxxxaxaii=?+??+?()2()()()xxxaxxnxaii=?+?()()xxnxaii=1nnn22iii===111nn22ii==11n22i=1nn22所以()()xii?<?xxaii==11平均數(shù)均數(shù)的計算方法與作用n的非頻數(shù)資料1)對計算-直接法xxx+++...xifxiifxx==121ni=knn時,2)計算頻數(shù)資料可用下式-加權(quán)法x為組值(組中值);x==i=1kfnf為頻數(shù);ii=13)在EXCEL中計算均值的函數(shù)為:AVERAGE(number1,number2,...)對稱分布中心位置,標(biāo)志著(1)指出一組數(shù)據(jù)()內(nèi)變量的資料所代表性狀的數(shù)量水平和質(zhì)量水平。(2)作為樣本或資料的代表數(shù)與其他資料進行比較。(3)通過平均數(shù)提供計算樣本變異數(shù)的基本數(shù)據(jù)。討論:隨機變量X的平均數(shù)(數(shù)學(xué)期望)(P53)kfxiikfii=1對于頻數(shù)資料的樣本平均數(shù)x==nnxii=1隨著n的充分增加,平均數(shù)穩(wěn)定于總體平均數(shù)μμX=pxx()=EX()xX所謂X或數(shù)學(xué)期望的函數(shù)的平均數(shù)(理論平均數(shù)),即它們的。E(C)=C(1)設(shè)C是常數(shù),則。(2)若k是常數(shù),則E(kX)=kE(X)(3)(4)設(shè)X、Y相互獨立,則有E(XY)=E(X)E(Y)。E(XX)E(X)E(X)1212+=+二、幾何均數(shù)(geometricmean)GXXX=n12n應(yīng)用:常用于等比資料對數(shù)正態(tài)分布資料用于,主要用于血清學(xué)和微生物學(xué)中;(原始數(shù)據(jù)不對稱,但各變量值取對數(shù)后呈對稱分布的資料);觀察值不能有0;觀察值不能同時有正值和負值。幾何均數(shù)的計算:GXXX=n12nG==lg??11()llglglgXXX12+++ng()lgXnn例2-2測得10個人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。?1lg2+lg2+lg4+lg4+lg8+lg8+lg8+lg8+lg32+lg32G=lg≈710三、中位數(shù)(median)平均數(shù)定義:資料中所有觀測數(shù)依大小順序排列,居于中間位置的觀測數(shù)稱為中位數(shù)或中數(shù)。M用途:偏態(tài)分布資料;一端或兩端無確切數(shù)值的資料(開口資料);分布不明的資料。中位數(shù)的計算1、直接計算法(小樣本時)1)當(dāng)觀測值個數(shù)n為奇數(shù)時Mx=(1)/2n+2)當(dāng)觀測值個數(shù)n為偶數(shù)時,即:xxnn/2(/21)++M=22、頻數(shù)表法(大樣本)LM,iM,fM分別為M所在組段的下限、組距和頻inMM=+?LM()fL數(shù),ΣfL為M所在組段之fM2前各組段的累積頻數(shù)。3、在EXCEL中計算中位數(shù)的函數(shù)為:MEDIAN(number1,number2,...)例2-3某地119名正常女性發(fā)汞值資料如下表所示,試計算其中位數(shù)。發(fā)汞值(μg/g)頻數(shù)累積頻數(shù)累積頻率(1)(2)(3)(4)0.3~0.7~1.1~1.5~1.9~2.3~2.7~3.1~3.5~3.9~121210.08354739.50327966.392510487.40M711193.28411596.64311899.16011899.16011899.161119100.00iMn0.4119M=?ggLML+f()22f=+×?=1.1471.26(/)32μM即該地119名正常女性平均發(fā)汞值為1.26(μg/g)四、百分位數(shù)(percentile)百分位數(shù)是一種位置指標(biāo),用來表示。PX一個百分位數(shù)是將全部變量值分為兩部分,有的變量PXX%值比它小,有變量值比它大。(100)%?X百分位數(shù)的應(yīng)用某百分位置的水平用于描述樣本或總體觀察值序列用于確定偏態(tài)分布資料的參考值范圍用于描述偏態(tài)資料的變異程度。(指百分位數(shù)間距)。。百分位數(shù)計算LX,iX,fX分別為PX的下所在組段iXfXPLnXfXXL=+?Σ(%)限、組距和頻數(shù),ΣfL為PX所在組段之前各組段的累積頻數(shù)。計算百分位數(shù)時關(guān)鍵是找出百分位數(shù)所在的組段,可由頻數(shù)表計算累計頻數(shù)或累計頻率,累計頻數(shù)略大于nx%或累計頻率略大于x%的組段即為百分位數(shù)Px所在的組段。3.1~011899.16發(fā)汞值(mg/g)0.3~121210.080.7~354739.51.1~327966.391.5~2510487.41.9~711193.282.3~411596.642.7~311899.16頻數(shù)累積頻數(shù)累積頻率PP75P9025P75P903.5~011899.163.9~1119100百分位數(shù)計算0.4(μg/g)P25=+××?=0.711925%120.90()350.4(μg/g)P75=+××?=1.511975%791.66()250.4(μg/g)P90=+××?=1.911990%1042.08()7在EXCEL中計算函數(shù)為:quart函數(shù)QUARTILE返回最小值第一個四分位數(shù)(第25個百分點值)中分位數(shù)(第50個百分點值)第三個四分位數(shù)(第75個百分點值)最大值QUARTILE(array,quart)Array數(shù)字單元格區(qū)域Quart返回哪一個四分位值01234返回眾數(shù)、中位數(shù)和均值的關(guān)系均值中位數(shù)眾數(shù)均值=中位數(shù)=眾數(shù)眾數(shù)中位數(shù)均值左偏分布對稱分布右偏分布結(jié)合課本P16常用平均數(shù)的意義及應(yīng)用場合平均數(shù)意義應(yīng)用場合均數(shù)平均數(shù)量水平應(yīng)用甚廣,最適用于對稱分布,特別是正態(tài)分布等比資料;對數(shù)正態(tài)分布幾何均平均增(減)倍數(shù)數(shù)資料偏態(tài)分布;分布不明;分中位數(shù)位次居中的觀察值水平描述觀察序列在布末端無確定值可用于確定醫(yī)學(xué)參考值范百分位數(shù)某百分位置的水圍,適用于任何分布平本節(jié)描述離散趨勢的特征數(shù)離散性變異指標(biāo):描述一組變量值的變異程度或離散趨勢的指標(biāo).變異數(shù)極四方變差分差異不同的分布使用不同的位數(shù)間距或系標(biāo)數(shù)準變異指標(biāo)差變異數(shù)(一)極差(全距)極差(range)是樣本變量值最大值和最小值之差,用R表示。它是資料中各觀測值變異程度大小的最簡便的統(tǒng)計量。R=max{x1,x2,……,xn}-min{x1,x2,……,xn}適用范圍:任何計量資料,是參考變異指標(biāo)缺點除了最大、最小值,不能反映組內(nèi)其他數(shù)據(jù)的變異。用途只能在研究樣本的波動時使用。變異數(shù)(二)四分位數(shù)間距:四分位間距Q=P75-100%80%P100(max)P75P(中位數(shù))P25P(min)P25反映了中間50%數(shù)據(jù)的離散程度,越小數(shù)值越集中,反之?dāng)?shù)據(jù)越分散。60%40%20%50P25P(min)0%0:(與中位數(shù)配適用范圍0套用)偏態(tài)分布資料;一端或兩端無確切數(shù)值的資料(開口資料);分布不明的資料。Q=P?P=1.66?0.90=0.76(μg/g)7525說明有50%女性的發(fā)汞值0.90和1.66之間,其四分位數(shù)間距為0.76(μg/g)(三)方差(Variance)與標(biāo)準差變異數(shù)2()xx?()x?x()xx?離均差可以反映出一離均差之和為零。平方和(SS),不個觀測值偏離平均數(shù)的性質(zhì)和程度。能反映平均差異2均方(meansquare,MS)()x?x2()x?x方差(variance)n?1n自由度(degreeoffreedom)即自由取值的個數(shù)對于一個具有n個觀察值的樣本,每個x與其平均數(shù)比較時,雖然具有n個離均差,但因受到離均差之和等于0的限制,所以只能有n-1個是自由的。(三)方差(Variance)與標(biāo)準差(standard)deviation,Sd變異數(shù)樣本方差(samplevariance)總體方差(populationvariance)n2N2()xi?x()xi?μS2=i=1σ2=i=1n-1N樣本標(biāo)準差不以樣本容量n而以n-1作為除數(shù)。這是因為通常我們只能掌握樣本資料,不知道總體平均數(shù)的數(shù)值,不得不用樣本平均數(shù)代替總體平均數(shù)。但由于離均差平方和最小,即()()xxx?<?μ22將分母用n-1,可以避免偏小的弊病,可以做到對總體標(biāo)準差的較好的估計。(三)方差(Variance)與標(biāo)準差變異數(shù)由于樣本方差帶有原觀對方差標(biāo)準差(standarddeviation,測單位的平方單位,在應(yīng)用時有時沒有實際意義。開方Sd)樣本方差的平方根:22特性S=S2=()xx?()()xx???cc=n?1n?1①標(biāo)準差的大小,受多個觀測數(shù)影響,如果觀測數(shù)與觀測數(shù)間差異較大,則離均差也大,因而標(biāo)準差也大,反之則小。②各觀測數(shù)加上或減去一個常數(shù),其標(biāo)準差不變;用加權(quán)法計算例2-1資料的標(biāo)準差變異數(shù)含藥量(mg)fXfXfX
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 走進小學(xué)活動方案樣本(3篇)
- 二零二五年度二手房交易稅費計算合同樣本3篇
- 二零二五年度辦公大樓智能化系統(tǒng)運維合同2篇
- 2025年度涂料涂料工程招標(biāo)代理服務(wù)合同范本3篇
- 2025年三年級上學(xué)期英語教師工作總結(jié)范文(2篇)
- 煤礦綜掘綜合防塵管理制度(3篇)
- 自學(xué)書法系統(tǒng)課程設(shè)計
- 輪形課程設(shè)計
- 二零二五年度個人住房裝修貸款保證合同3篇
- 2025年高一班級工作計劃(二篇)
- 東風(fēng)集團新能源汽車培訓(xùn)
- 2024-2030年中國廣電技術(shù)行業(yè)現(xiàn)狀分析及未來發(fā)展趨勢預(yù)測報告
- 鋼構(gòu)樓板合同范例
- 造影劑過敏的護理
- 蘇教版六年級上冊分數(shù)四則混合運算100題帶答案
- 潛水員潛水作業(yè)安全2024
- 以案促改心得體會
- 2024年公文寫作基礎(chǔ)知識競賽試題庫及答案(共130題)
- 2023-2024學(xué)年浙江省麗水市蓮都區(qū)教科版三年級上冊期末考試科學(xué)試卷
- 失禁性皮炎病例護理查房課件
- 期末復(fù)習(xí)試題 (試卷)-2024-2025學(xué)年四年級上冊數(shù)學(xué)人教版
評論
0/150
提交評論