




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章定量數(shù)據(jù)的統(tǒng)計(jì)描述Chapter2Descriptionsofquantitativedata頻數(shù)分布集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)變異程度的統(tǒng)計(jì)指標(biāo)
第一節(jié)頻數(shù)分布
Frequence
distribution
例2-1
某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測(cè)結(jié)果如表所示:
如何有效地組織、整理和表達(dá)數(shù)據(jù)的信息?
4.765.02……4.634.524.785.054.944.444.714.975.245.504.635.274.405.044.934.814.705.344.474.735.004.884.774.274.925.184.314.574.465.955.615.264.76由實(shí)驗(yàn)或臨床觀察等各種方式得到的原始數(shù)據(jù),如果是定量資料并且觀察的例數(shù)較多,為了能夠顯示數(shù)據(jù)的分布規(guī)律,可以對(duì)數(shù)據(jù)進(jìn)行分組,然后制作頻數(shù)表或繪制直方圖。一、頻數(shù)表頻數(shù)表:同時(shí)列出觀察指標(biāo)的可能取值區(qū)間及其在各區(qū)間內(nèi)出現(xiàn)的頻數(shù)。1.確定組數(shù)k:通常選擇在8~15之間2.確定組距:參考組距為R/k,R為全距3.確定組限:應(yīng)符合專業(yè)習(xí)慣
4.確定頻數(shù):可由軟件完成frequencytable54.422.9324.60~
100.0-140合計(jì)100.00.715.80~6.0099.41.425.60~
98.02.945.40~
95.19.3135.20~
85.812.1175.00~
73.719.3274.80~
31.517.9254.40~
13.67.9114.20~
5.74.364.00~
1.41.423.80~
累積頻率(%)頻率(%)頻數(shù)紅細(xì)胞數(shù)
表2-2某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表
frequencytable直方圖:直觀、形象地表示頻數(shù)分布的形態(tài)和特征
圖2-1140名正常男子紅細(xì)胞計(jì)數(shù)的直方圖
二、直方圖Histogram三、頻數(shù)表的用途Useoffrequencytable
1.作為陳述資料的形式2.便于觀察數(shù)據(jù)的分布類型3.便于發(fā)現(xiàn)資料中含有的異常值4.可用各組段的頻率作為概率的估計(jì)值
正偏態(tài)分布負(fù)偏態(tài)分布正態(tài)分布三、頻數(shù)表的用途Useoffrequencytable
1.作為陳述資料的形式2.便于觀察數(shù)據(jù)的分布類型3.便于發(fā)現(xiàn)資料中含有的異常值4.可用各組段的頻率作為概率的估計(jì)值
平均數(shù)(Average)描述一組觀察值集中位置或平均水平的統(tǒng)計(jì)指標(biāo)。Averageincommonuse:
Mean算數(shù)均數(shù)
Geometricmean幾何均數(shù)
Median中位數(shù)第二節(jié)集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)
Descriptionofcentraltendency
一、算術(shù)均數(shù)(arithmeticmean)
應(yīng)用:主要適用于對(duì)稱分布或偏斜度不大的資料,尤其適合正態(tài)分布資料。
直接法計(jì)算:加權(quán)法:表2-2數(shù)據(jù)優(yōu)點(diǎn):意義很容易理解,而且結(jié)果也比較穩(wěn)定,因而應(yīng)用廣泛。但它主要應(yīng)用于對(duì)稱分布或斜度不大的資料,尤其是正態(tài)分布資料。缺點(diǎn):對(duì)極端值太敏感。在這種情形下,它不能代表樣本點(diǎn)的絕大多數(shù)。在極端情形下,有時(shí)可出現(xiàn)只有一個(gè)觀察值是在均數(shù)的一邊。均數(shù)的應(yīng)用二、幾何均數(shù)
----適用對(duì)數(shù)對(duì)稱分布例2-2
測(cè)得10個(gè)人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度Geometricmean例2-3
(頻數(shù)表資料)應(yīng)用:原始數(shù)據(jù)分布不對(duì)稱(一般呈正偏態(tài)),經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料,主要用于血清學(xué)和微生物學(xué)中
三、中位數(shù)和百分位數(shù)(一)中位數(shù)
(median,M
)將一組觀察值從小到大按順序排列,居中心位置的數(shù)值即為中位數(shù)。
1.原始資料如測(cè)得5個(gè)人的VLDL中的apo_B的含量(mmol/L)為0.0095,0.0322,0.0617,0.0970,0.1085,則
M=0.0617(mmol/L)
若測(cè)量結(jié)果:0.0095,0.0322,0.0617,0.097,則M=(0.0322+0.0617)/2=0.0470(mmol/L)
2.頻數(shù)表資料(例2-4)表2-4某地630名正常女性血清甘油三脂含量(mmol/L)--630合計(jì)100.0
63013.10~99.862932.80~99.462642.50~98.7622142.20~96.5608281.90~92.1580421.60~85.4538811.30~72.5457941.00~57.6M3631670.70~31.11961690.40~4.327270.10~累積頻率(%)累積頻數(shù)頻數(shù)甘油三脂MedianL、iM、fM分別為M所在組段的下限、組距和頻數(shù),fL為M所在組段之前各組段的累積頻數(shù)。Median(二)百分位數(shù)(Percentile)L:
組段的下限;iM:
組距;fx:
頻數(shù);
fL:Px所在組段之前的累積頻數(shù)。例2-5計(jì)算例2.4的百分位數(shù)P25
、P75
、P90。(三)中位數(shù)和百分位數(shù)的應(yīng)用
1.中位數(shù)是百分位數(shù)的特例。其特點(diǎn)是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無(wú)確定數(shù)值數(shù)據(jù)的平均水平。2.描述數(shù)據(jù)序列在某百分位置的水平。多個(gè)百分位數(shù)結(jié)合使用如P25和P75可以描述數(shù)據(jù)的分散程度,用P2.5和P97.5計(jì)算醫(yī)學(xué)95%的參考值范圍等。
Percentile
第三節(jié)變異程度的統(tǒng)計(jì)指標(biāo)例2-6對(duì)甲乙兩名高血壓患者連續(xù)觀察5天,測(cè)得的收縮壓(mmHg)結(jié)果如下:
兩患者收縮壓的均數(shù)十分接近,但甲患者的血壓波動(dòng)較大,而乙患者相對(duì)穩(wěn)定。通常,描述一組觀察值,除需要表示其平均水平外,還要說(shuō)明它的離散或變異的情況。
患者第1天第2天第3天第4天第5天均數(shù)甲患者162145178142186162.6乙患者164160163159166162.4一、極差
極差(range
)也稱作全距,即觀察值中最大值和最小值之差,用符號(hào)R表示。如前例甲乙兩患者收縮壓的極差分別為該法簡(jiǎn)單明了、容易使用,如用于說(shuō)明傳染病、食物中毒等的最短、最長(zhǎng)潛伏期等;缺點(diǎn)是結(jié)果不穩(wěn)定。極差的特點(diǎn)(1)簡(jiǎn)單明了:最簡(jiǎn)單。意義:R↑↓→離散程度↑↓。(2)穩(wěn)定性差:只受極端值影響。
且n↑↓→R↑↓
(3)不全面:未考慮極端值之外數(shù)值的影響→粗略指標(biāo)。二、四分位數(shù)間距若算出,50歲~60歲正常女性血清甘油三脂含量的百分位數(shù)P25和P75的位置分別為0.632mmol/L和1.357mmol/L,則四分位數(shù)間距(quartile)受極端值的影響小,主要用于衡量明顯偏態(tài)分布資料的變異程度。三、方差方差(
variance
)是將離均差平方和再取平均,即,
注意:對(duì)于樣本資料,分母用的是n-1,稱為自由度(degreeoffreedom,df)。方差的特點(diǎn):便于數(shù)學(xué)上的處理,但由于有平方項(xiàng),度量衡發(fā)生變化,不便于實(shí)際應(yīng)用。
四、標(biāo)準(zhǔn)差將方差取平方根,還原成與原始觀察值單位相同的變異量度即為標(biāo)準(zhǔn)差(standarddeviation):
例如對(duì)于例3.1經(jīng)計(jì)算有甲患者:,,同理乙患者:KarlPearson
標(biāo)準(zhǔn)差的特點(diǎn)能利用所有數(shù)據(jù)的信息受極端值的影響大,常用于正態(tài)分布或近似正態(tài)分布資料。五、變異系數(shù)
變異系數(shù)(coefficientofvariation):用于對(duì)均數(shù)相差較大或單位不同的幾組觀察值的變異程度進(jìn)行比較。
某地不同年齡組男童身高(cm)
年齡組SCV%1-2月56.32.13.735-6月66.52.23.313-3.5歲96.13.13.225-5.5歲107.83.33.06結(jié)論:隨著年齡增加,身高的變異變小。
均數(shù)差別較大的變量間變異程度的比較
1.運(yùn)用頻數(shù)表、直方圖和統(tǒng)計(jì)指標(biāo)技巧能夠有效地組織、整理和表達(dá)計(jì)量資料的信息。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東大學(xué)《中國(guó)古代文學(xué)(二)》2023-2024學(xué)年第二學(xué)期期末試卷
- 四川工業(yè)科技學(xué)院《籃球4》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣州美術(shù)學(xué)院《俄語(yǔ)II(第二外語(yǔ))》2023-2024學(xué)年第二學(xué)期期末試卷
- 專業(yè)工種勞務(wù)承包合同
- 建施工合同知識(shí)點(diǎn)
- 建筑材料采購(gòu)合同書(shū)
- 勞務(wù)分包合同內(nèi)容包括
- 人工費(fèi)勞務(wù)分包合同
- 崗位聘用合同書(shū)
- 藥理練習(xí)試卷附答案
- 學(xué)習(xí)《中華人民共和國(guó)安全生產(chǎn)法》
- 餐廳托盤使用培訓(xùn)課件
- 中學(xué)生國(guó)家安全法
- 【MOOC】《電路分析基礎(chǔ)》(北京理工大學(xué))章節(jié)作業(yè)中國(guó)大學(xué)慕課答案
- 長(zhǎng)距離供熱管道工程設(shè)計(jì)方案
- 廣東中考英語(yǔ)2020-2024年5年真題匯編-學(xué)生版-專題07 閱讀理解之說(shuō)明文
- 智能懸架系統(tǒng)集成開(kāi)發(fā)關(guān)鍵技術(shù)與實(shí)踐-2024-12-技術(shù)資料
- 形勢(shì)與政策(沈陽(yáng)職業(yè)技術(shù)學(xué)院)知到智慧樹(shù)答案
- 企業(yè)工會(huì)會(huì)員代表大會(huì)與職工代表大會(huì)合并召開(kāi)
- 新科瑞C500系列變頻器使用說(shuō)明書(shū)
- 2024年中國(guó)丙烯酰胺市場(chǎng)調(diào)查研究報(bào)告
評(píng)論
0/150
提交評(píng)論