版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二講定量資料的統(tǒng)計(jì)描述第二章定量資料的統(tǒng)計(jì)描述主要內(nèi)容1、頻數(shù)分布表的編制和用途頻數(shù)分布的特征和類(lèi)型2、集中趨勢(shì)指標(biāo)均數(shù)、幾何均數(shù)、中位數(shù)3、離散趨勢(shì)指標(biāo)極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)百分位數(shù)第二章定量資料的統(tǒng)計(jì)描述(一)、頻數(shù)分布表的編制
第二章定量資料的統(tǒng)計(jì)描述某地兒研所測(cè)得該地150名12歲健康男童體重(kg)原始數(shù)據(jù)如下,試編制頻數(shù)表。25.234.934.338.141.327.833.837.728.433.547.334.830.536.251.038.043.840.937.536.633.447.436.441.436.542.533.729.339.637.539.633.232.129.943.733.835.137.832.438.528.236.523.435.834.127.642.623.137.144.035.644.546.535.031.836.436.247.938.720.537.129.238.241.136.243.532.836.331.830.638.539.628.733.735.142.920.135.426.542.039.638.735.451.231.434.125.329.638.243.733.824.529.245.932.523.536.827.234.034.744.441.235.342.634.130.031.440.827.348.635.829.745.641.833.028.333.335.140.638.237.625.537.337.541.538.444.243.231.540.234.537.437.833.432.233.432.432.836.845.741.240.936.547.935.739.342.235.330.127.2
第二章定量資料的統(tǒng)計(jì)描述1.找出最大值和最小值,計(jì)算極差。最大值為51.2kg,最小值為20.1kg,極差R=51.2-20.1=31.1kg。極差(R)也叫全距,它是一組變量值中最大值與最小值之差。第二章定量資料的統(tǒng)計(jì)描述2.按極差大小決定組段數(shù)、組段和組距。
確定組段數(shù):組段數(shù)的多少一般根據(jù)觀察單位的多少來(lái)確定,過(guò)多或過(guò)少均不能更好地反映資料的分布特征,以能夠反映頻數(shù)分布的特點(diǎn)為宜,一般分為8~15組,觀察單位少時(shí)可相對(duì)少些,觀察單位較多時(shí)組段數(shù)可酌情多些。本例初步確定為10個(gè)組。確定組距:相鄰組段下限值之差稱(chēng)為組距,一般分組時(shí)取組距相等。組距=極差/組數(shù),常取整數(shù)作組距,取整只是為了方便資料的整理匯總。本例組距=30.1/10=3.11≈3。第二章定量資料的統(tǒng)計(jì)描述劃分組段:各組段應(yīng)有明確的界限,便于匯總,每個(gè)組段的起點(diǎn)稱(chēng)“下限”,終點(diǎn)稱(chēng)“上限”。第一組段必須包括最小值,一般取略小于最小值的整數(shù)作為第一組的下限,但是第一組的下限值不能等于最小值。各組段即不重疊,也不能留空隙,所以每一組段均為半開(kāi)閉區(qū)間,后一組的下限就是前一組的上限。
組段中的橫線~不能省略,它表示連續(xù)型資料。
最后一個(gè)組段應(yīng)該包括最大值,并且封口,但最后一個(gè)組段的上限不能等于最大值。第二章定量資料的統(tǒng)計(jì)描述本例最小值為20.1,故取20為第一組的下限。第二組下限即20+3=23,余類(lèi)推。
最后一個(gè)組段為50~53,包括最大值51.2。3.列表劃記,統(tǒng)計(jì)各組段頻數(shù)。4.計(jì)算頻率與累計(jì)頻率第二章定量資料的統(tǒng)計(jì)描述第二章定量資料的統(tǒng)計(jì)描述頻數(shù)分布的兩個(gè)特征體重雖有輕有重,但都向35~組段集中,數(shù)據(jù)大多數(shù)集中在32~38組段,共83人,占總?cè)藬?shù)的55%,這種趨勢(shì)稱(chēng)為集中趨勢(shì)。另一方面,隨體重逐漸變大或變小,仍有小部分變量值存在,稱(chēng)這種特征為離散趨勢(shì),其變異程度是可以測(cè)定得。集中趨勢(shì)和離散趨勢(shì)是頻數(shù)分布的兩個(gè)重要特征,測(cè)定其集中趨勢(shì)和離散趨勢(shì)就可較全面地分析所研究的事物。第二章定量資料的統(tǒng)計(jì)描述頻數(shù)分布的類(lèi)型
頻數(shù)分布分為對(duì)稱(chēng)分布和偏態(tài)分布兩種類(lèi)型。對(duì)稱(chēng)分布是指集中位置在正中,左右兩側(cè)頻數(shù)分布大體對(duì)稱(chēng),如上表所示。若將其繪制成頻數(shù)分布直方圖,則更清楚。直方圖是以x(本例為體重)為橫坐標(biāo),頻數(shù)或百分?jǐn)?shù)為縱坐標(biāo),用矩形面積大小表示頻數(shù)多少。第二章定量資料的統(tǒng)計(jì)描述
某地150名12歲男童體重頻數(shù)分布圖第二章定量資料的統(tǒng)計(jì)描述頻數(shù)分布的類(lèi)型偏態(tài)分布指集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱(chēng)。一些以?xún)和癁橹鞯膫魅静。颊叩哪挲g分布,集中位置偏于年齡小的一側(cè),頻數(shù)尾部向右側(cè)延伸,稱(chēng)為正偏態(tài)(峰)分布,如圖第二章定量資料的統(tǒng)計(jì)描述120例鏈球菌感染咽炎患者潛伏期分布圖(正偏峰分布)
第二章定量資料的統(tǒng)計(jì)描述一些慢性病患者的年齡分布,其集中位置偏向年齡大的一側(cè),頻數(shù)尾部向左側(cè)延伸,稱(chēng)為負(fù)偏態(tài)(峰)分布,如圖第二章定量資料的統(tǒng)計(jì)描述207例某惡性腫瘤患者年齡分布(負(fù)偏峰分布)
第二章定量資料的統(tǒng)計(jì)描述頻數(shù)表的用途
作為統(tǒng)計(jì)資料描述的一種表達(dá)方式,可以揭示資料分布類(lèi)型與特征。便于計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)一步分析處理。便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時(shí)經(jīng)檢驗(yàn)后舍去。正態(tài)性判斷的圖示法,為用正態(tài)近似法確定參考值范圍打基礎(chǔ)。第二章定量資料的統(tǒng)計(jì)描述(二)、集中趨勢(shì)指標(biāo)
平均數(shù)是統(tǒng)計(jì)學(xué)中最重要、應(yīng)用最廣泛的一個(gè)指標(biāo)體系。用來(lái)描述一組變量的集中趨勢(shì)、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡(jiǎn)明概括的印象,又便于組間的比較。平均數(shù)的計(jì)算和應(yīng)用必須具備同質(zhì)基礎(chǔ)。常用的平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。第二章定量資料的統(tǒng)計(jì)描述1、均數(shù)(mean)均數(shù)是算術(shù)均數(shù)的簡(jiǎn)稱(chēng),它反映了一組觀察值在數(shù)量上的平均水平??傮w均數(shù)用希臘字母μ表示,樣本均數(shù)用表示。均數(shù)的計(jì)算均數(shù)的計(jì)算方法有直接法和加權(quán)法,計(jì)算機(jī)運(yùn)算中多采用直接法。第二章定量資料的統(tǒng)計(jì)描述均數(shù)的計(jì)算直接法是將所有性質(zhì)相同的觀察值x1,x2,x3…xn,直接相加再除以觀察值的個(gè)數(shù)n。例:10名12歲健康男童體重(kg)分別為39.6,33.2,32.1,29.9,43.7,33.8,35.1,37.8,32.4,38.5,求平均體重。第二章定量資料的統(tǒng)計(jì)描述均數(shù)的計(jì)算加權(quán)法
當(dāng)資料中相同觀察值較多時(shí),可將相同觀察值的個(gè)數(shù),即頻數(shù)f乘以該觀察值x,以代替相同觀察值逐個(gè)相加。對(duì)于頻數(shù)表資料,可用各組段的頻數(shù)為f,以相應(yīng)的組中值為x,代入公式計(jì)算均數(shù)。從該公式中可以看出,某一變量值x的頻數(shù)越大,則該變量值對(duì)均數(shù)的影響越大,因此頻數(shù)也叫權(quán)數(shù),這樣計(jì)算出來(lái)的均數(shù)又叫加權(quán)均數(shù)。權(quán)越大,該變量值對(duì)均數(shù)的影響也越大,故稱(chēng)加權(quán)法。第二章定量資料的統(tǒng)計(jì)描述均數(shù)的計(jì)算第二章定量資料的統(tǒng)計(jì)描述均數(shù)的兩個(gè)重要特征
離均差的總和等于零,即各變量值與均數(shù)之差的代數(shù)和等于零。證明:
各離均差的平方和小于各觀察值X與任何數(shù)a之差的平方(α≠)。第二章定量資料的統(tǒng)計(jì)描述均數(shù)的應(yīng)用
用途:用來(lái)描述一組變量值的平均水平,具有代表性,因此變量值必須是同質(zhì)的。應(yīng)用條件:適用于呈對(duì)稱(chēng)分布的資料,特別是正態(tài)分布或者近似正態(tài)分布的資料,因?yàn)檫@時(shí)均數(shù)位于分布的中心,最能反映分布的集中趨勢(shì)。第二章定量資料的統(tǒng)計(jì)描述2、幾何均數(shù)(geometricmean,G)有些醫(yī)學(xué)資料,如抗體的滴度、細(xì)菌計(jì)數(shù)、傳染病的潛伏期等,其頻數(shù)分布明顯偏態(tài),各觀察值之間呈倍數(shù)變化,這時(shí)應(yīng)該用幾何均數(shù)反映其平均增(減)倍數(shù)。幾何均數(shù)的計(jì)算直接法:是將n個(gè)觀察值x1,x2,x3…xn的乘積開(kāi)n次方所得的根。加權(quán)法:第二章定量資料的統(tǒng)計(jì)描述幾何均數(shù)的應(yīng)用用于等比級(jí)數(shù)資料和對(duì)數(shù)正態(tài)分布資料,如:某些傳染病的潛伏期、抗體滴度、細(xì)菌計(jì)數(shù)等。同一組資料的幾何均數(shù)小于算術(shù)均數(shù)。觀察值不能為0。因?yàn)?不能取對(duì)數(shù),也不能與任何其它數(shù)呈對(duì)數(shù)關(guān)系。可以把所有的變量值均加上一個(gè)較小的常數(shù),如加1。觀察值不能同時(shí)有正值和負(fù)值。若全是負(fù)值,計(jì)算是可把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。第二章定量資料的統(tǒng)計(jì)描述3、中位數(shù)(M)和百分位數(shù)(P)中位數(shù)(median,M)是將一組觀察值從小到大按順序排列,位次居中的數(shù)值對(duì)應(yīng)的觀察值就是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的觀察值的個(gè)數(shù)相等。百分位數(shù)(percentile,P)是指把一組資料的全部觀測(cè)值分為兩部分,理論上講,有x%的觀測(cè)值比Px小,有(100-x)%的觀測(cè)值比Px大。中位數(shù)是特定的百分位數(shù),即P50,它是表示一組資料集中位置的指標(biāo)。第二章定量資料的統(tǒng)計(jì)描述直接法計(jì)算中位數(shù)
將原始觀察值按大小順序排列:n為奇數(shù)時(shí),n為偶數(shù)時(shí),例:臨床觀察7名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,求其平均潛伏天數(shù)。M=5臨床觀察8名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,20求其平均潛伏天數(shù)。M=(5+6)/2=5.5第二章定量資料的統(tǒng)計(jì)描述頻數(shù)表法
M=P50Lx:第x百分位數(shù)所在組段的下限;fx:第x百分位數(shù)所在組段的頻數(shù);ix:第x百分位數(shù)所在組段的組距;ΣfL:小于L各組段的累計(jì)頻數(shù)。第二章定量資料的統(tǒng)計(jì)描述中位數(shù)和百分位數(shù)的應(yīng)用
中位數(shù)不是由全部觀察值的數(shù)量值綜合計(jì)算出來(lái)的,只受居中變量值波動(dòng)的影響,不受兩端特小值和特大值的影響,僅僅反映了位次居中的觀察值的水平,因此中位數(shù)常用于描述偏態(tài)分布或末端無(wú)確定數(shù)據(jù)時(shí)資料的集中位置。百分位數(shù)用于描述樣本或總體觀察值序列在某百分位置水平,多個(gè)百分位數(shù)結(jié)合應(yīng)用時(shí),可更全面地描述總體或樣本的分布特征,可用來(lái)確定醫(yī)學(xué)參考值范圍。由于位于中部的百分位數(shù)比較穩(wěn)定,所以最常用的百分位數(shù)是中位數(shù),它有較好的代表性。第二章定量資料的統(tǒng)計(jì)描述(三)、離散程度指標(biāo)三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。甲組2628303234X甲=30kg乙組2427303336X乙=30kg丙組2629303134X丙=30kg哪一組數(shù)值的代表性好?第二章定量資料的統(tǒng)計(jì)描述離散趨勢(shì)即個(gè)體值之間的變異程度,數(shù)據(jù)越分散,變異程度越高。極差四分位數(shù)間距方差標(biāo)準(zhǔn)差變異系數(shù)第二章定量資料的統(tǒng)計(jì)描述1、極差(range,R)極差也叫全距,表示一組觀察值中最大值與最小值之差,反映個(gè)體差異的范圍。極差大,說(shuō)明變異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。缺點(diǎn):由于計(jì)算極差時(shí)只采用了最大值和最小值,未考慮組內(nèi)其它數(shù)據(jù)的變異程度,因此用極差反映變異度不夠全面,穩(wěn)定性也差;另外,當(dāng)樣本例數(shù)增大時(shí),得到較大或較小觀察值的機(jī)會(huì)可能會(huì)變大,所以極差也可能更大。第二章定量資料的統(tǒng)計(jì)描述2、四分位數(shù)間距(quartilerange,QR)QR=QU-QL=P75–P25四分位數(shù)間距包含一半的觀測(cè)值,其值越大,變異程度越大;其值越小,變異程度越小。優(yōu)點(diǎn):采用四分位數(shù)間距來(lái)反映一組資料的變異程度,比極差穩(wěn)定。一般來(lái)說(shuō),樣本例數(shù)越多,四分位間距越穩(wěn)定。實(shí)際工作中,常與中位數(shù)結(jié)合使用,描述偏態(tài)分布資料的分布特征。缺點(diǎn):不能全面地反映所有觀察值的變異程度。第二章定量資料的統(tǒng)計(jì)描述極差R四分位數(shù)間距QR離均差(x-μ)離均差總和
(x
)=0離均差絕對(duì)值和
|x
|離均差平方和
(x
)2
均方(方差)σ2=
(x
)2/N
標(biāo)準(zhǔn)差3、方差與標(biāo)準(zhǔn)差第二章定量資料的統(tǒng)計(jì)描述但是在實(shí)際工作中,總體方差往往是未知的,常用樣本方差s2來(lái)估計(jì)。在公式中,用代替
,用n代替N,這時(shí)計(jì)算的結(jié)果往往比總體方差σ2要小,所以分母用n-1來(lái)代替N,即公式變?yōu)椋?/p>
這時(shí)樣本方差s2是總體方差σ2的無(wú)偏估計(jì)。N-1:自由度,常用ν或df表示,是指隨機(jī)樣本研究中,可獨(dú)立地隨機(jī)選擇變動(dòng)的觀測(cè)值的個(gè)數(shù)。第二章定量資料的統(tǒng)計(jì)描述三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。甲組2628303234X甲=30kgR=8S=3.16乙組2427303336X乙=30kgR=12S=4.74丙組2629303134X丙=30kgR=8S=2.91丙組數(shù)值的代表性好。第二章定量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)差是反映數(shù)據(jù)變異程度的指標(biāo),其大小受每一個(gè)觀察值的影響
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《大學(xué)計(jì)算機(jī)基礎(chǔ)》課件-第5章 電子表格處理軟件
- 填報(bào)志愿 合同
- 《正向間接血凝試驗(yàn)》課件
- 2025年吐魯番道路貨運(yùn)駕駛員從業(yè)資格考試題庫(kù)
- 2025年湖北貨運(yùn)從業(yè)資格證考試模擬考試題目
- 2025年長(zhǎng)沙貨運(yùn)從業(yè)資格證考試題目和答案
- 2025年張掖駕??荚囏涍\(yùn)從業(yè)資格證模擬考試
- 2025年河源考貨運(yùn)資格證考試內(nèi)容
- 工業(yè)用地交易中介合同樣本
- 水利工程機(jī)械施工安全協(xié)議
- 《推拿治療小兒腹瀉》精品PPT
- 大學(xué)英語(yǔ)四級(jí)必背詞匯表21853
- 結(jié)構(gòu)設(shè)計(jì)面試題(答案)
- 升壓站、變電站架構(gòu)安裝方案
- 赤峰高鐵廣場(chǎng)商鋪?zhàn)赓U合同(樣本)
- 郭頂—水星記—歌詞
- 英文版?zhèn)€人簡(jiǎn)歷自薦信
- 其他專(zhuān)技、管理服務(wù)崗位聘期考核表
- 四年級(jí)上學(xué)期勞動(dòng)技術(shù)測(cè)試卷帶答案
- 關(guān)于學(xué)習(xí)考察應(yīng)急管理工作情況報(bào)告.doc
- TX-1C單片機(jī)實(shí)驗(yàn)板使用手冊(cè)
評(píng)論
0/150
提交評(píng)論