第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-一、二、三課件_第1頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-一、二、三課件_第2頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-一、二、三課件_第3頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-一、二、三課件_第4頁
第二節(jié) 數(shù)值變量資料的統(tǒng)計分析-一、二、三課件_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二節(jié)數(shù)值變量資料的統(tǒng)計分析

統(tǒng)計描述第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三一數(shù)值變量資料的頻數(shù)表二集中趨勢三離散趨勢四正態(tài)分布五抽樣誤差與參數(shù)估計六假設(shè)檢驗本節(jié)結(jié)構(gòu)

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三數(shù)值變量資料的描述方法:1、頻數(shù)表與頻數(shù)分布2、統(tǒng)計指標

⑴、集中趨勢指標:平均指標(算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù)、調(diào)和均數(shù))

⑵、離散趨勢指標:變異指標(極差、四分位間距、方差、標準差、變異系數(shù))3、統(tǒng)計表、統(tǒng)計圖第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三一數(shù)值資料的頻數(shù)分布

frequencydistribution(一)、頻數(shù)分布表頻數(shù)分布:指觀察值在某組段出現(xiàn)的次數(shù);頻數(shù)表:為了解一組同質(zhì)觀察值的分布規(guī)律,在觀察值個數(shù)(即樣本含量,n)較多時,可編制頻數(shù)分布表,簡稱頻數(shù)表。

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三[例7-1]某校診斷學(xué)基礎(chǔ)教研室為研究健康成年女性體溫正常值,隨機抽取102名健康(非排卵期)女大學(xué)生測試其體溫,下列是測試午飯后休息一小時口腔溫度(℃)的結(jié)果,試編制頻數(shù)分布表。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三

例7-1120名健康成年女性的口腔溫度測定結(jié)果(℃)編號口腔溫度編號口腔溫度137.0……236.96136.5337.2……437.19736.6537.09836.9636.89936.9736.810036.9……10136.74137.510236.8第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三1.頻數(shù)表的編制步驟(1)求全距(range):即最大值與最小值之差,又稱為極差。本例極差:R=37.5-36.5=1.0(℃)(2)確定組距和組限:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1.0/10=0.1。列出組限,即組界限。每個組段的起點稱下限,終點稱上限。第一組段的必須包含最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(3)列表歸組:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三組段(1)劃記(2)頻數(shù),f(3)組中值,X(4)

fX(5)=(3)×(4)fx2

(6)=(3)×(4)236.5~一136.5536.551335.902536.6~336.65109.954029.667536.7~正536.75183.756752.812536.8~正正1236.8511.0516295.070036.9~正正正1736.95442.2023210.142537.0~正正正正正2537.05926.2534317.562537.1~正正正一1637.15594.4022081.960037.2~正正一1137.25409.7515263.187537.3~正737.35261.459765.157537.4~437.45149.805610.010037.5~37.6一137.5537.551410.0025合計---102---3779.80140071.4750第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(二)、頻數(shù)分布圖(直方圖)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(三)頻數(shù)分布特征①集中趨勢(centraltendency):變量值集中位置。本例在組段“37.0~”。平均水平指標②離散趨勢(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠,頻數(shù)越小;且圍繞“中心”左右對稱。變異水平指標從不同角度說明被研究的事物。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(四)頻數(shù)分布類型

①正態(tài)分布:集中位置在正中,左右兩側(cè)基本對稱。②

偏態(tài)分布:集中位置偏向一側(cè),頻數(shù)分布不對稱。

正偏態(tài)分布負偏態(tài)分布分布類型不同,采用的統(tǒng)計方法不同。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三正態(tài)分布:中間高、兩邊低、左右對稱正偏態(tài)分布:長尾向右延伸負偏態(tài)分布:長尾向左延伸第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(五)、頻數(shù)分布表的用途1、揭示資料的分布類型;2、顯示頻數(shù)分布的兩個重要特征;

集中趨勢(Centraltendency)

離散趨勢(Tendencyofdispersion)3、根據(jù)頻數(shù)分布的不同類型,選擇適當?shù)慕y(tǒng)計方法,進行計算與分析;4、利于發(fā)現(xiàn)某些特大或特小的可疑值。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三二、

集中趨勢指標1、算術(shù)均數(shù)2、幾何均數(shù)3、中位數(shù)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三平均數(shù)(average)

描述一組性質(zhì)相同的變量值的集中趨勢或者集中水平的指標稱為平均數(shù),它是樣本變量值或者總體變量值的代表值。根據(jù)資料的頻數(shù)分布不同,可分別計算算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(一)算術(shù)均數(shù)

(arithmeticmean)

算術(shù)均數(shù)是最常用的集中趨勢指標,簡稱為均數(shù)(mean),是描述一組正態(tài)分布或者近似正態(tài)分布資料集中趨勢的指標。樣本均數(shù)以x表示,總體均數(shù)以μ表示。

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三樣本均數(shù)的計算方法1.小樣本不分組資料(直接法)2.大樣本分組資料(加權(quán)法)(weightingmethod)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三

均數(shù)的特性各觀察值與均數(shù)之差(離均差)的總和等于零即各觀察值的離均差平方和最小,即

以上兩個特性表明均數(shù)是一組觀察值最理想的代表值。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三均數(shù)的應(yīng)用1、均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作為樣本的代表值與其他樣本進行比較。2、均數(shù)適用于描述單峰對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的集中趨勢。3、均數(shù)在描述正態(tài)分布特征方面具有重要意義。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(二)幾何均數(shù)

(geometricmean)

當變量值的變化呈等比級數(shù)關(guān)系,特別是變量值的頻數(shù)分布呈偏態(tài)分布,但經(jīng)過對數(shù)轉(zhuǎn)換后呈正態(tài)分布,即對數(shù)正態(tài)分布資料,適合于用幾何均數(shù)描述其集中趨勢,以符號G表示。

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三幾何均數(shù)的計算方法1.小樣本不分組資料(直接法)或2.大樣本分組資料(加權(quán)法)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三應(yīng)用幾何均數(shù)注意事項

1、幾何均數(shù)常用于等比級數(shù)資料,如抗體平均滴度和藥物平均效價、衛(wèi)生事業(yè)平均發(fā)展速度、人口的幾何增長等,或用于對數(shù)正態(tài)分布資料;2、觀察值不能有0,因為0不能取對數(shù),不能與任何其它數(shù)呈倍數(shù)關(guān)系;3、觀察值不能同時有正值和負值。若全是負值,計算時可把負號去掉,得出結(jié)果后再加上負號。4、同一資料,幾何均數(shù)<均數(shù)。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三

血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(三)中位數(shù)(median)

把n個變量值由小到大順序排列,位次居中的變量值稱為中位數(shù)。適用于描述偏態(tài)分布資料和資料分布的末端無確切數(shù)據(jù)的開口資料的集中趨勢,用符號M表示。中位數(shù)是一個特定的百分位數(shù)P50。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三中位數(shù)的計算方法1.小樣本不分組資料

當n為偶數(shù)時:

當n為奇數(shù)時:2.大樣本分組資料(頻數(shù)表法)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三中位數(shù)的應(yīng)用

當數(shù)據(jù)分布對稱時,理論上中位數(shù)等于算術(shù)均數(shù),當數(shù)據(jù)經(jīng)對數(shù)轉(zhuǎn)換后分布對稱時,理論上中位數(shù)等于幾何均數(shù)。因此,中位數(shù)可用于任何分布的定量資料。此外,中位數(shù)還可用于所謂“開口資料”(即數(shù)據(jù)分布末端無確切數(shù)據(jù)的資料),也不受兩端特大或特小值的影響。但對于能用算術(shù)均數(shù)或幾何均數(shù)描述集中趨勢的資料,應(yīng)盡量使用算術(shù)均數(shù)或幾何均數(shù)。

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三附:百分位數(shù)(percentile)

把n個變量值由小到大順序排列,第x百分位次相對應(yīng)的變量值稱為第x百分位數(shù),常用以描述一組偏態(tài)分布資料在某百分位置上的水平,以符號Px表示。一個百分位數(shù)將總體或樣本的全部變量值分為兩部分,理論上有x%的變量值比它小,有(100-x)%的變量值比它大。注意:樣本含量過少,計算的百分位數(shù)誤差較大,不穩(wěn)定,宜慎用。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三百分位數(shù)的計算百分位數(shù)常用以描述一組偏態(tài)分布資料在某個百分位置上的水平。

計算公式:第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三百分位數(shù)的應(yīng)用

1、確定醫(yī)學(xué)參考值范圍,(referencerange):可用于任何分布類型的資料。如雙側(cè)95%參考值范圍=P2.5-P97.5;表示有95%正常個體的測量值在此范圍內(nèi)。

2、中位數(shù)M與四分位數(shù)間距Q一起使用,描述偏態(tài)分布資料的基本特征。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三運用平均數(shù)的注意事項:平均數(shù)是描述一群同質(zhì)變量值集中位置的特征值,用來說明某現(xiàn)象或事物數(shù)量的中等水平。1.同質(zhì)的事物或現(xiàn)象才能求平均數(shù)有人研究某藥物的利尿作用,觀察了二條狗、三頭兔子用藥前后的排尿滴數(shù),曾將狗與兔子的排尿滴數(shù)加在一起求平均數(shù)。由于狗體大,排尿滴數(shù)較兔子的多,得到的平均數(shù)對狗來說似嫌少,而對兔子來說又顯得太多,這是虛構(gòu)平均數(shù)。2.用組平均數(shù)補充總平均數(shù)如病人平均住院天數(shù)。3.根據(jù)資料的分布選用適當?shù)钠骄鶖?shù)計量資料如是單峰對稱分布,宜用均數(shù),亦可用中位數(shù)。若是偏態(tài)分布則中位數(shù)的代表性常較均數(shù)為好。某些傳染病的潛伏期、抗體滴度、細菌計數(shù)、率或比的變化速度及某些物質(zhì)濃度等,其頻數(shù)分布明顯偏態(tài),但經(jīng)對數(shù)代換后近于正態(tài)分布的,應(yīng)計算幾何均數(shù)以描述其中等水平。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三三、離散趨勢指標反映數(shù)據(jù)的離散度(Dispersion)。即個體觀察值的變異程度。常用的指標有:

(一).極差(Range)(全距)

(二).四分位數(shù)間距

Quartilerange

(三).方差

Variance

(四).標準差StandardDeviation

(五).變異系數(shù)

CoefficientofVariation第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(一)、全距(range)(1).符號:R(2).計算:R=最大值-最小值(3).優(yōu)點:簡單明了(4).缺點:不能反映組內(nèi)所有數(shù)據(jù)的變異度,并易受個別特大或特小值的影響。樣本含量越大,其抽樣誤差越大。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(二)、四分位數(shù)間距

(quartileinterval)(1).適用資料:⑴偏態(tài)分布資料,⑵資料分布的末端無確切數(shù)據(jù)的開口資料(2).符號:Q,(3).計算:Q=P75-P25,Qu上四分位數(shù),QL下四分位數(shù)(4).意義:其間包含了50%的變量值。此間距越大,變量值的離散趨勢越大。(5).優(yōu)缺點:比極差穩(wěn)定,但仍未考慮到每個觀察值的變異度。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(三)、方差(variance)(1).適用資料:正態(tài)分布或近似正態(tài)分布資料。(2).符號:樣本S2,總體σ2。(3).意義:當兩組或多組資料進行比較時,若各組均數(shù)相近,度量衡單位相同的條件下,方差小,說明變量值圍繞在均數(shù)的周圍,變異度?。环粗?,方差大,說明變量值遠離均數(shù),變異度大。(4).計算:⑴直接法⑵加權(quán)法第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三樣本方差為什么要除以(n-1)?自由度(degreeoffreedom,簡記為DF)(1)定義:隨機變量能自由取值的個數(shù)(2)計算公式:υ=n-限制條件個數(shù)例:有一四個(n=4)數(shù)據(jù)樣本,受到的條件限制,在自由確定4,2,5三個數(shù)據(jù)后,第四個數(shù)只能是9,因而υ=n-1=3。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(四)、標準差

(standarddeviation)

(1).適用資料:正態(tài)分布或近似正態(tài)分布資料。(2).符號:樣本S,總體σ。(3).意義:當兩組或多組資料進行比較時,若各組均數(shù)相近,度量衡單位相同的條件下,標準差小,說明變量值圍繞在均數(shù)的周圍,變異度?。环粗?,標準差大,說明變量值遠離均數(shù),變異度大。(4).計算:⑴直接法⑵加權(quán)法

第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三標準差的計算因方差的度量單位是原度量單位的平方,故將方差開方,恢復(fù)成原度量單位,得總體標準差σ和樣本標準差S。

總體標準差

樣本標準差第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三樣本標準差的計算方法1.小樣本不分組資料2.大樣本分組資料(加權(quán)法)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三

標準差的應(yīng)用1、描述正態(tài)分布資料的變異程度;2、衡量樣本均數(shù)的代表性:單位相同,均數(shù)相近的條件下,標準差大,表示變量值離均數(shù)較遠,均數(shù)的代表性差。文獻中表示為:X±S或X±SD;3、結(jié)合均數(shù)描述正態(tài)分布的基本特征,可以概括地估計變量值的頻數(shù)分布;標準差與均數(shù)相結(jié)合,按照正態(tài)分布的規(guī)律性,制定醫(yī)學(xué)參考值范圍;4、計算變異系數(shù)和標準誤。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三(五)、變異系數(shù)

(coefficientofvariation)

是描述一組正態(tài)分布或近似正態(tài)分布資料的離散趨勢或變異程度(相對變異程度)的指標,以CV(%)=S/x×100%表示。適用于變量值單位不同或均數(shù)相差懸殊時,來比較兩組或多組資料的變異程度大小。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三變異指標小結(jié)1.極差較粗,適合于任何分布2.標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標和變異指標分別反映資料的不同特征,常配套使用。如正態(tài)分布資料:均數(shù)±標準差;偏態(tài)分布資料:中位數(shù)(四分位數(shù)間距)。第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三

正態(tài)分布偏態(tài)分布對數(shù)正態(tài)分布

或開口資料集中趨勢均數(shù)中位數(shù)幾何均數(shù)

離散趨勢標準差四分位數(shù)間距對數(shù)標準差變異系數(shù)數(shù)值變量資料的描述指標總結(jié)第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三復(fù)習(xí)思考題各平均數(shù)的適用條件標準差的應(yīng)用第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三反映計量資料集中趨勢的指標是:A.平均數(shù)B.標準差C.標準誤D.頻率E.全距在列頻數(shù)表時,分的組段數(shù)一般為:A.5~10個B.10~15個C.10~30個D.15~20個E.>20個AB第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三計算抗體滴度的平均滴度習(xí)慣上用:A.中位數(shù)B.幾何均數(shù)C.眾數(shù)D.算術(shù)均數(shù)E.百分位數(shù)計算平均潛伏期宜用:A.算術(shù)均數(shù)B.全距C.離均差積和D.中位數(shù)E.變異系數(shù)BD第二節(jié)數(shù)值變量資料的統(tǒng)計分析-一、二、三表示一組觀察值分布的離散程度大小最常用的指標是:A.全距B.離均差C.方差D.標準差E.離均差平方和計量資料的標準差這個指標:A.不會比均數(shù)大B.不會比均數(shù)小C.要比標準誤小D.不決定于均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論