醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)方法

一、基本概念和基本步驟

統(tǒng)計(jì)學(xué)的幾個基本概念

總體與樣本

總體(population):根據(jù)研究目的確定的同質(zhì)的研究對象,其某項(xiàng)變量值的全體。

某省2000年14歲男孩的身高

總體

141m蛔

(某部用工癇的療效)

抽樣(sampling):從研究總體中隨機(jī)抽取一部分有代表性的個體的方法。

樣本(sample):從研究總體中隨機(jī)抽取的一部分有代表性的個體(其某項(xiàng)變量值的全體)。

統(tǒng)計(jì)推斷(inference):利用樣本信息推斷總體特征。

同質(zhì)與變異

同質(zhì)(homogeneity):除了試驗(yàn)因素外,影響被研究指標(biāo)的非實(shí)驗(yàn)因素相同被稱為同質(zhì)。一個總體中

有許多個體大同小異,存在共性,這些個體處于同一總體。

某省2000年14歲男孩的身高

變異(variation):在同質(zhì)基礎(chǔ)上個體間的差異。

主鼻性是統(tǒng)計(jì)學(xué)的根本需要

誤差

誤差觀察值與實(shí)際值的差別為誤差。觀察過程中由于不認(rèn)真仔細(xì),造成錯誤地判斷、記錄或錄入計(jì)算

機(jī)所致的觀察值與實(shí)際值之差為一過失誤差;儀器若未經(jīng)校準(zhǔn),使觀察值統(tǒng)?地都偏低或偏高則為系統(tǒng)誤

羞;由于偶然的因素使同一個樣品的測定值在不同的觀察者之間或者相同觀察者的若干次觀察值之間不完

全相同,則被稱作隨機(jī)測覺誤差;從同一總體中抽樣.得到某變量值的統(tǒng)計(jì)量之間或與總體參數(shù)之間的差別,

被稱為抽樣誤差。

抽樣誤差(samplingerror)

定義:由個體變異產(chǎn)生,由抽樣引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計(jì)量)以及樣本指標(biāo)之間的

差異

特點(diǎn):不可避免

目的:減小抽樣誤差

方法:減小個體間的差異;增大樣本含量

參數(shù)與統(tǒng)計(jì)量

參數(shù)(parameter):是由總體中個體值計(jì)算出來的用于描述總體特征的指標(biāo)。

其大小是客觀存在的,然而往往是未知的。

統(tǒng)計(jì)量(statistic):是由樣本中個體值計(jì)算出來的用于描述樣本特征的指標(biāo)。

統(tǒng)計(jì)學(xué)關(guān)心的常常是總體參數(shù)的大小,其依據(jù)卻是統(tǒng)計(jì)量及其性質(zhì)。

概率(Probability)

定義:描述隨機(jī)事件發(fā)生可能性大小的數(shù)值(0

取值范圍:不可能事件必然事件

估計(jì)方法:當(dāng)〃足夠大時,用頻率估計(jì)概率

小概率事件:某隨機(jī)事件發(fā)生可能性很小

含義:在一次試驗(yàn)或觀察中某隨機(jī)事件發(fā)生可能性很小

資料類型

變量:根據(jù)研究目的,對研究對象的某個或某些特征(研究指標(biāo)或項(xiàng)目)實(shí)施觀測,這些特征(指標(biāo)或

項(xiàng)目)稱為變量(variable)

資料(數(shù)據(jù)):變量的取值(變量值)

計(jì)曾

/定量資料(身高:怵窗-特點(diǎn),有葷位;

資料

二分奘(性別》

類型

f無序

I宸性濟(jì)相弟分臾1+型:A.B.O.AB)

育序(板流給果〉-?+,++?+++)

計(jì)教

醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟

mom透m”江及?L條叁佗

【例題】下面的變量中,屬于分類變量的是

A.脈搏

B.血型

C.肺活量

D.紅細(xì)胞計(jì)數(shù)

E.血壓

[正確答案JB

二、定量資料的統(tǒng)計(jì)描述

rlB+att

IMI

峰a-

s*mE,______

-----—|aw

統(tǒng)計(jì)描述:利用統(tǒng)計(jì)表、圖以及統(tǒng)計(jì)指標(biāo)描述資料的數(shù)量特征及其分布規(guī)律

,

*

as,一?一集崛一囂*分

?

cmn_mm.'Mm

描述數(shù)值變量資料的集中趨勢指標(biāo)——平均數(shù)

平均數(shù):它是一類指標(biāo),統(tǒng)計(jì)中常用的平均數(shù)包括:算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)。

平均數(shù)的選取:根據(jù)資料的分布類型

(-)算術(shù)平均數(shù)

算術(shù)平均數(shù)簡稱均數(shù),總體均數(shù)一4,樣本均數(shù)一2

1.適用條件:對稱分布,特別適用于正態(tài)或近似正態(tài)分布資料

2.計(jì)算方法:

(1)直接法一觀察單位較少

公式:MM

某市10名4歲女孩的身高(cm)分別為:112.9,108.0,99.8,102.5,116.3,105.6,100.7,103.2,

104.9,98.9,試求其均數(shù)。

廣空*三空=金305128ca

(2)頻表法一觀察單位較多時

工四十,與4■…4■仙

就:

人+片…+八

5x1405+..+4x2345

5+...+4

(二)幾何均數(shù)

兒何均數(shù)(geometricmean)用G表示。

1.適用條件:觀察值呈倍數(shù)關(guān)系或?qū)?shù)正態(tài)分或多用于描述抗體的平均滴度等。

2.計(jì)算方法:

(-)直接法一觀察單位較少

公式:

(7=¥勺叼…0

電日=叱-4-Q_阿,+W上++H/_£也%

MJUM

,Tlgjqa

M

例題某地5例微絲蝴血癥患者治療7年后用間接熒光抗體試驗(yàn)測得其抗體滴度分別為1:10,1:20,

1:40,1:40,1:160,求抗體的平均滴度。

解:平均指標(biāo)選用幾何均數(shù)(觀察值呈倍數(shù)關(guān)系)

首先取觀察值的倒數(shù)

.一1sT(lg10+320+3煙+340+3160)_48

5份血清抗體效價的平均滴度為1:34.8

(2)加權(quán)法一頻數(shù)表資料

公式:

Q-+工1g匕+…+/+。)_也~<(二

例題:69例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCATgG抗體滴度的分布如下,求其平均抗體滴度。

某醫(yī)院預(yù)防保健科用流腦疫苗為75名兒童進(jìn)行免疫接種,1個月后測定其抗體滴度如下表所示,試求

其平均滴度。

75名兒童的平均抗體滴度計(jì)算表

抗體滴度滴度倒數(shù)XIgX頻數(shù)fflgX

1:440.602142.4084

1:880.903198.1279

1:16161.20412125.2861

1:32321.50512030.1020

1:64641.80621221.6744

1:1281282.1072510.5360

1:2562562.408249.6328

合計(jì)一—75107.7676

.yyigXI1077676

O=(能第M35

J』八

(三)中位數(shù)

中位數(shù)(median)用M表示,是一組觀察侑按山小到大的順序排列后,位于中間位置上的那個數(shù)值。

1.適用條件:

(1)變量值中出現(xiàn)個別特小或特大的數(shù)值

(2)資料的分布呈明顯的偏態(tài)

(3)變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值(〈90)。

(4)資料的分布不清

2.計(jì)算方法:

(1)當(dāng)樣本含量為奇數(shù)時,1f

1,8,2,4,12—1,2,4,8,12

M==4?.=&=4

(2)當(dāng)樣本含量為偶數(shù)時,

1,8,2,4,12,3—1,2,3,4,8,12

_(&+式)_(

M=—i-2—31)_?5

222

(四)百分位數(shù)

百分位數(shù)(percentile)用匕(第x百分位數(shù))表示,也是一種位置指標(biāo),觀察值按由小到大的順序

排列后,?個百分位數(shù)P*將全部變量值分為兩部分,其中有x%的變量值比它小,(100-x)%變量值比它大。

P50=M

適用條件同中位數(shù)

頻數(shù)表法:

L:第X百分位數(shù)所在組段的組下限

i:組距

6:第x百分位數(shù)所在組段對應(yīng)的頻數(shù)

江:為小于L的各組段的累計(jì)頻數(shù)

例題測得某地200名正常人發(fā)汞值(Ug/g),試計(jì)算其平均水平及是百分位數(shù)。

某地200名正常人發(fā)汞值頻數(shù)分布

組段(Ug/g)頻數(shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)(5)

0.3?2010.02010.0

0.7?5025.07035.0

1.1?4623.011658.0

1.5?3015.014673.0

1.9?2512.517185.5

2.3-168.018793.5

2.7?63.019396.5

3.1?42.019798.5

3.5?21.019999.5

3.9?4.310.5200100.0

合計(jì)200100.0——

?島-

=1.14-^-(200x5Q?-7U)

=1如3心

Ja

=1.94-^(200x75K-l4Q

=1.964(MMQ//£)

三、定量資料的離散趨勢

(變異程度)指標(biāo)

離散趨勢

(-)極差(全距)

1.定義:也羞(R)=最大值-最小值極差越大變異程度越大。

例:甲乙兩組球員身高資料如下:

甲組:184,186,188,190,192

7=188mq=192—184=8cm

乙組:180,184,188,192,196

。=188CM&=1%-180=1金融

甲乙兩組的集中趨勢相同(有相同的平均水平),但離散程度不同(乙組大于甲組)。也就是說,即

考慮集中趨勢,又要考慮離散趨勢,這樣才能全面對數(shù)值變量資料進(jìn)行描述。

2.應(yīng)用范圍:適用于任何分布類型的資料,描述偏態(tài)分布資料。

3.優(yōu)缺點(diǎn)

優(yōu)點(diǎn):計(jì)算簡單、概念清晰。

缺點(diǎn):

(1)只考慮了最大值與最小值,容易受個別極端值的影響,且不能反應(yīng)組內(nèi)其它變量值的變異情況。

(2)受樣本含量影響,不穩(wěn)定(一般樣本含量越大越有機(jī)會觀察到偏小或偏大的數(shù)據(jù))。

(-)四分位數(shù)間距

1.定義:Q=/-0

2.應(yīng)用范圍:適用于任何分布類型的資料,主要利中位數(shù)一起描述偏態(tài)分布資料。

3.優(yōu)缺點(diǎn)

優(yōu)點(diǎn):要比極差穩(wěn)定

缺點(diǎn):仍未考慮到全部觀察值的變異程度

(三)方差

0r■華田總|防差票.芝&本方差

NM-1

公式的由來

(四)標(biāo)準(zhǔn)差

.J工(A蠟

由于方差的單位是原單位的平方,因此為了應(yīng)用方便,對方差進(jìn)行開方得到1"-I,該公式

就是樣本的標(biāo)準(zhǔn)差。

標(biāo)準(zhǔn)差的簡化公式

方差和標(biāo)準(zhǔn)差主要應(yīng)用于正態(tài)分布

(五)變異系數(shù)

1.應(yīng)用條件:反映資料的相對變異程度。常用于比較度量衡單位不同或均數(shù)相差懸殊的兩組(或多組)

資料的變異度。

cr=-Kitm

2.公式:x

例比較單位不同的幾組資料的離散程度

某年某市城區(qū)120名5歲女孩身高均數(shù)為110.15cm,標(biāo)準(zhǔn)差為5.86cm,體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差

為1.44kg,比較其離散程度。

步高CT--IOOK-5.32%

UOLIS

144

體重CK—二一XL00K-&13%

17.71

例比較均數(shù)相差懸殊的幾組資料的離散程度

某年某市城區(qū)120名5歲女孩體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,同年該地120名5個月女孩體

重均數(shù)為7.37kg,標(biāo)準(zhǔn)差為0.77kg,比較其離散程度。

xi(n%-&i3K

IT71

4月妞itttcr■要x10儂■10L48%

737

?<NH?

【例題】正態(tài)分布資料宜用()來描述其集中趨勢

A.算術(shù)平均數(shù)

B.標(biāo)準(zhǔn)差

C.幾何均數(shù)

D.變異系數(shù)

E.四分位數(shù)間距

「正確答案』A

【例題】變異系數(shù)越大說明

A.標(biāo)準(zhǔn)差越大

B.標(biāo)準(zhǔn)差越小

C.均數(shù)越大

D.均數(shù)越小

E.以均數(shù)為準(zhǔn)變異程度大

『正確答案』E

【例題】數(shù)列8,-3,5,0,1,4,-1的中位數(shù)是

A.2

B.0

C.2.5

D.0.5

E.1

r正確答案』E

【例題】原始數(shù)據(jù)呈倍數(shù)關(guān)系的資料,宜用()描述其分布的集中趨勢

A.算數(shù)均數(shù)

B.幾何均數(shù)

C.極差

D.中位數(shù)

E.百分位數(shù)

「正確答案』B

【例題】離散程度指標(biāo)中,最容易受極端值影響的是

A.極差

B.標(biāo)準(zhǔn)差

C.變異系數(shù)

I).方差

E.四分位數(shù)間距

[正確答案』A

正態(tài)分布

正態(tài)分布是醫(yī)學(xué)和生物學(xué)中最常見,也是最重要的?種連續(xù)性分布,如正常人的身高,體重,紅細(xì)胞

數(shù),血紅蛋白等。我們可以從頻數(shù)表和頻數(shù)圖對正態(tài)分布進(jìn)行研究。

120名正常成年男子紅細(xì)胞計(jì)數(shù)的頻數(shù)表(X107D

組段頻數(shù)頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)(5)

3.20?21.721.7

3.50?54.275.9

3.80?108.31714.2

4.10-1915.83630.0

4.40?2319.25949.2

4.70?2420.08369.2

5.00-2117.510486.7

5.30?119.211595.9

5.60?43.311999.2

5.90-6.2010.8120100.0

合計(jì)120100.0——

頻數(shù)分布以均數(shù)為中心,向兩側(cè)逐漸減少,并且基本對稱

長方形的面積等于頻率

0.T

&8

as

利用正態(tài)分布曲線特點(diǎn)來描述正態(tài)分布的特征

(-)正態(tài)分布的概念和特征

1.概念

如果隨機(jī)變量x的分布服從概率密度函數(shù)則稱x服從正

態(tài)分布,記作*~M3?0,U為X的總體均數(shù),。為總體標(biāo)準(zhǔn)差。

2.正態(tài)分布的特征

(1)在直角坐標(biāo)的橫軸上方呈鐘形曲線,兩端與x軸永不相交,且以x=u為對稱軸,左右完全對稱。

fkA=-

(2)在x=u處,f(x)取最大值,其值為叮*/并且*越遠(yuǎn)離u,f(x值越小。

(3)正態(tài)分布有兩個參數(shù):一個為位置參數(shù)u,一個為形態(tài)參數(shù)。。

3.正態(tài)分布曲線下的面積分布規(guī)律

3-G/+G-?68.27%

口-1&5《"+1儀勸

(^-I96o;/f+I96a)->95?

@-2.謝/+2580)->99%

-2.680-1,990-4|i。1?90。2?58。-2.68-l,?-1Q1L9S2.S8

3+L96O;#+258<7)F?

(-)標(biāo)準(zhǔn)正態(tài)分布

正態(tài)分布是一個分布組族,對應(yīng)于不同的參數(shù)口和。會產(chǎn)生不同位置、不同形狀的正態(tài)分布,為了應(yīng)

用方便,我們將正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。

“=--

'懈場域14~陽0.1)

由于我們實(shí)際面對的大多是正態(tài)分布,因此可采用如下的方法求其曲線下面積:

*x——姑聲—

正態(tài)分布的應(yīng)用

例:調(diào)查某單位101名正常成年女子的血清總膽固醉,得其均數(shù)£=406E??Z,

標(biāo)準(zhǔn)差s=0.654?MW//£O試估計(jì)該單位正常女子血清總膽固醇在4.00mmol/L以下者及5.OOmmol/L

以下者各占正常女子總?cè)藬?shù)的百分比。

K-/XX-X

CTS

X4.00-4.06…

—=--------------=-0.09

0.654

工00-4.06—

Uj——-------------------------------=1.44

0.654

【例題】下列關(guān)于正態(tài)分布描述錯誤的是

A.是醫(yī)學(xué)和生物學(xué)中常見的一種連續(xù)型分布

B.正態(tài)分布曲線的對稱軸是尸〃這條直線

C.正態(tài)分布曲線有兩個參數(shù),〃為形態(tài)參數(shù),”為位置參數(shù)

D.正態(tài)分布曲線是一簇曲線

E.正態(tài)分布曲線下的總面積為1

『正確答案』C

【例題】在正態(tài)曲線下,區(qū)間S+L%5-+2586所包含的面積為

A.1%

B.1.5%

C.97%

I).2%

E.95%

「正確答案』D

【例題】下列關(guān)于標(biāo)準(zhǔn)正態(tài)分布的說法中錯誤的是

A.標(biāo)準(zhǔn)正態(tài)分布曲線下總面積為1

B.標(biāo)準(zhǔn)正態(tài)分布是總體均數(shù)為0,總體標(biāo)準(zhǔn)差為1的正態(tài)分布

C.標(biāo)準(zhǔn)正態(tài)分布的曲線是一簇曲線

D.標(biāo)準(zhǔn)正態(tài)分布是對稱分布

E.不同的正態(tài)分布都可以通過變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布

『正確答案』C

四、定量資料的統(tǒng)計(jì)推斷-總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

計(jì)量資料

總體均數(shù)的參數(shù)估計(jì):

一%

m總觸詩

假設(shè)檢驗(yàn):

(四)假設(shè)檢驗(yàn)的原理和步驟

(五)t檢驗(yàn)

(-)均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤(衡量抽樣誤差大小的指標(biāo))

例若某市1999年18歲男生身高服從均數(shù)〃、標(biāo)準(zhǔn)差”的正態(tài)分布。從該正態(tài)分布"(167.7,5.32)

總體中隨機(jī)抽樣,共抽了100次,每次樣本含量e=10人,得到每個樣本均數(shù)及標(biāo)準(zhǔn)差如下圖

1999年某市18歲男生身高167.7,5.32)的抽樣示意

X?-X~N50;)

其中為了與反映觀察值離散程度的標(biāo)準(zhǔn)差b相區(qū)別,統(tǒng)計(jì)學(xué)中把樣本均數(shù)的標(biāo)準(zhǔn)差/稱為樣本均數(shù)的

標(biāo)準(zhǔn)誤,簡稱為標(biāo)準(zhǔn)誤(standarderror)o

標(biāo)準(zhǔn)誤是描述均數(shù)的抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。

拍檜讖塞<------>標(biāo)僧微

£T八£

可證明均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式為

b3

/二忑”忑

公式估計(jì)*就*公式

與樣本含2¥方《皿眥.

均數(shù)標(biāo)準(zhǔn)誤的用途

1.可用來衡量樣本均數(shù)的可靠性

標(biāo)準(zhǔn)誤一抽樣誤差一均數(shù)間的差異(樣本和總體)一樣本均數(shù)估計(jì)總體均數(shù)

小小小可靠

2.與樣本均數(shù)結(jié)合,可用于估計(jì)總體均數(shù)的置信區(qū)間

3.可用于進(jìn)行均數(shù)的假設(shè)檢驗(yàn)

(二)t分布

1.£分布的概念

正態(tài)分布

實(shí)際工作中,由于胃未知,用4代替,這樣U不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從t分布,即

X旦岸包

1={"=.,%」="—1y為自由度(degreeoffreedon)

S.Sfwt

統(tǒng)計(jì)量力的分布稱為t分布。力分布與自由度有關(guān),不同的自由度對應(yīng)著不同的t分布曲線。

2.f分布的圖形與特征

力分布的圖形:6分布是一簇曲線,自由度不同,曲線的形狀不同,力分布的圖形與自由度有關(guān)。當(dāng)v

,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布,但當(dāng)自由度較小時,t分布與標(biāo)準(zhǔn)正態(tài)分布的差異較大。其圖形如下圖

不日自由度下的粉布圖

t分布特征:

(1)單峰分布,以0為中心,左右對稱

(2)自由度v越小,峰部越矮,而尾翹得越高

(3)當(dāng)v-8,“,分布逼近u分布(標(biāo)準(zhǔn)正態(tài)分布),將標(biāo)準(zhǔn)正態(tài)分布看做t分布的特例。

不同自由度下的吩布圖

力界值表簡介:

橫標(biāo)目為自由度,縱標(biāo)目為概率月表中數(shù)字表示自由度為認(rèn)―為a(單側(cè)或雙側(cè)概率)時,力的界值,

單側(cè)常記為Q,雙側(cè)常記為《兒。

由于t分布是以o為中心的對稱分布,表中只列出正值,查表示不管t正負(fù)都用絕對值。

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

11.0003.0786.31412.70631.82163.657127.321318.309636.619

20.8161.8862.9204.3036.9659.92514.08922.32731.599

30.7651.6382.3533.1824.5415.8417.45310.21512.924

40.7411.5332.1322.7763.7474.6045.5987.1738.610

50.7271.4762.0152.5713.3654.0324.7735.8936.869

60.7181.4401.9432.4473.1433.7074.3175.2085.959

70.7111.4151.8952.3652.9983.4994.0294.7855.408

80.7061.3971.8602.3062.8963.3553.8334.5015.041

90.7031.3831.8332.2622.8213.2503.6904.2974.781

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

100.7001.3721.8122.2282.7643.1693.5814.1444.587

110.6971.3631.7962.2012.7183.1063.4974.0254.437

120.6951.3561.7822.1792.6813.0553.4283.9304.318

130.6941.3501.7712.1602.6503.0123.3723.8524.221

1466921.3451.7612.1452.6242.9773.3263.7874.140

150.6911.3411.7532.1312.6022.9473.2863.7334.073

160.6901.3371.7462.1202.5832.9213.2523.6864.015

17).689.3331.7402.1102.5672.8983.2223.6463.965

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

180.6881.3301.7342.1012.5522.8783.1973.6103.922

190.6881.3281.7292.0932.5392.8613.1743.5793.883

200.6871.3251.7252.0862.5282.8453.1533.5523.850

210.6861.3231.7212.0802.5182.8313.1353.5273.819

220.6861.3211.7172.0742.5082.8193.1193.5053.792

230.6851.3191.7142.0692.5002.8073.1043.4853.768

240.6851.3181.7112.0642.4922.7973.0913.4673.745

250.6841.3161.7082.0602.4852.7873.0783.4503.725

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

260.6841.3151.7062.0562.4792.7793.0673.4353.707

270.6841.3141.7032.0522.4732.7713.0573.4213.690

280.6831.3131.7012.0482.4672.7633.0473.4083.674

290.6831.3111.6992.0452.4622.7563.0383.3963.659

300.6831.3101.6972.0422.4572.7503.0303.3853.646

310.6821.3091.6962.0402.4532.7443.0223.3753.633

320.6821.3091.6942.0372.4492.7383.0153.3653.622

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

330.6821.3081.6922.0352.4452.7333.0083.3563.611

340.6821.3071.6912.0322.4412.7283.0023.3483.601

350.6821.3061.6902.0302.4382.7242.9963.3403.591

360.6811.3061.6882.0282.4342.7192.9903.3333.582

370.6811.3051.6872.0262.4312.7152.9853.3263.574

380.6811.3041.6862.0242.4292.7122.9803.3193.566

390.6811.3041.6852.0232.4262.7082.9763.3133.558

400.6811.3031.6842.0212.4232.7042.9713.3073.551

500.6791.2991.6762.0092.4032.6782.9373.2613.496

600.6791.2961.6712.0002.3902.6602.9153.2323.460

曝率

自由度單尾).250.10.050.0250.010.0050.0025C).0010.0005

雙尾).50.20.10.050.020.010.005C).0020.001

700.6781.2941.6671.9942.3812.6482.8993.2113.435

800.6781.2921.6641.9902.3742.6392.8873.1953.416

900.6771.2911.6621.9872.3682.6322.8783.1833.402

1000.6771.2901.6601.9842.3642.6262.8713.1743.390

5000.6751.2831.6481.9652.3342.5862.8203.1073.310

10000.6751.2821.6461.9622.3302.5812.8133.0983.300

oo0.67451.28161.64491.962.32632.57582.8073.09023.2905

ADJQSJB=L6S6

^aOS/2.38=2.024

陰影以外面積(概率)雙側(cè),一般表達(dá)式為:

式Tg<tO5J=\-a

FC-2024<t<2024)=0.95

(三)總體均數(shù)的置信區(qū)間估計(jì)

京T"

'-■m*C

參數(shù)估計(jì):用樣本指標(biāo)(統(tǒng)計(jì)量)去估計(jì)總體指標(biāo)(參數(shù))

參數(shù)估計(jì)有兩種方法:點(diǎn)值估計(jì)和區(qū)間估計(jì)。

(1)點(diǎn)值估計(jì)(pointestimation):直接用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)。

總體均數(shù)的點(diǎn)值估計(jì)就是直接用樣本均數(shù)去估計(jì)總體均數(shù)(就是把樣本均數(shù)看作是總體均數(shù))。

缺點(diǎn):沒有考慮到抽樣誤差

(2)區(qū)間估計(jì)(intervalestimation):結(jié)合樣本統(tǒng)計(jì)量和標(biāo)準(zhǔn)誤可以確定一個具有較大概率(可

信度)的包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1-。可信區(qū)間。

預(yù)先給定的概率稱為可信度用1-。表示,常用的可信度為95%或99虬如沒有特別說明,一般取雙側(cè)

95%o

區(qū)間估計(jì)的計(jì)算方法(根據(jù)資料的條件選用不同的方法):

(1)總體標(biāo)準(zhǔn)差。未知,且樣本含量較少時(〃<50)。一般按照力分布的原理用下式作區(qū)間估計(jì)

總體均數(shù)的1-a置信區(qū)間為(京

例隨機(jī)抽查某地30名20歲青年男性,測得其心率均數(shù)為73次/分,標(biāo)準(zhǔn)差為7次/分,試估計(jì)該地

20歲青年男性心率總體均數(shù)的95%置信區(qū)間?

加.*=30j=--1=30-1=29,a=0.0涵

=20451fs^.£+401111f

77

(73-2.045百.73+2045京)=(7047工0

估計(jì)該人群用此批號結(jié)核菌素,該地20歲青年男性心率總體均數(shù)的95%置信區(qū)間為(70.4,75.6)次/

分。

(2)。未知,但樣本例數(shù)〃足夠大,按正態(tài)分布原理。

總體均數(shù)的95%可信區(qū)間分別為:

(3-

和”.相當(dāng)于s>?詼四|1K同

雙3=1.96=雙眈闔》

HLa1141m;HHt3

雙儡%iin=258

wr9。枷,眄("j

例隨機(jī)抽取某地200名40歲以上正常成人,測定其空腹血糖值,求得x=4.91mmol/L,S=0.72mmol/L,

試估計(jì)該地40歲以上正常成人空腹血糖值的總體均數(shù)的95%置信區(qū)間。

本例,x=20Qt=49L8=0.72.a=Q05,由于〃較大,且總體標(biāo)準(zhǔn)差。未知,因此選用公式

a5其中~,代入數(shù)據(jù)可得:

(491-1.9632r.491+1.96=r〉=(4.8L5.01)

J200y200

可信區(qū)間的確切含義(95%)-(套圈游戲)

意味著從正態(tài)總體中隨機(jī)抽取100個樣本,可算得100個樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個均數(shù)的

可信區(qū)間。在這100個可信區(qū)間中,有95個可信區(qū)間包含了總體均數(shù),另外5個沒有包含總體均數(shù)。但在

實(shí)際工作中,我們只抽一次樣,獲得一個樣本,也就算得一個可信區(qū)間,如由一個樣本算得的某地成年男

子紅細(xì)胞均數(shù)的95%可信區(qū)間為5.31~5.45x10°/£根據(jù)小概率事件不太可能在一次試驗(yàn)中發(fā)生的原理,

我們就認(rèn)為該區(qū)間包含了總體均數(shù),但是該結(jié)論會冒5%犯錯誤風(fēng)險。

可信區(qū)間的兩個要素

準(zhǔn)確度:反映在可信度上,可信度越大,準(zhǔn)確度越高。

精密度:精密度反映在可信區(qū)間的寬度上,寬度越小,精密度越高。

在樣本含量固定的情況下,增加可信度(1—a),a變小,t變大,可信區(qū)間變大——不能同時增加

準(zhǔn)確度和精密度。

但是在可信度(1—a)固定的情況下,增加樣本含量,可縮小可信區(qū)間,提高精密度。

(四)假設(shè)檢驗(yàn)

例據(jù)大量調(diào)查得知,健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機(jī)調(diào)查了25名健康成年男

子,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分,能否認(rèn)為該山區(qū)成年男子的脈搏高于一般人群?

題意分析見下圖:

Afi估計(jì)

"耒知——酢為叫估計(jì)他

?■t----??川?-------'

假設(shè)檢驗(yàn)的基本思想:

先提出假設(shè),然后在某假設(shè)成立的前提下看實(shí)際抽到的樣本是否屬于小概率事件,若屬于小概率事件,

則拒絕該假設(shè),若不屬于小概率事件,則不拒絕該假設(shè)。

如何提出假設(shè)?可根據(jù)了二口?的兩種可能性(互相對立的):

第一個假設(shè):設(shè)"=外(只是由于抽樣誤差使得用),我們把〃=外這個假設(shè)稱為檢驗(yàn)假設(shè)或無

效假設(shè),"?用(hypothese)表示。具體表示方法為"一嗎

第二個假設(shè):設(shè)/W%(不只是由于抽樣誤差使得外,主要原因是兩者本來就不同),我們把

為這個假設(shè)稱為備擇假設(shè),用片表示。

具體表示方法為名”外

假設(shè)檢驗(yàn)的基本步驟:

1.(選擇檢驗(yàn)方法)建立假設(shè),確定檢驗(yàn)水準(zhǔn)。

選擇檢驗(yàn)方法:根據(jù)資料的類型和分析目的選擇適當(dāng)?shù)臋z驗(yàn)方法

iEMRtt%;,=%

SMRft牘*外

檢驗(yàn)水準(zhǔn)a=0.05(單側(cè)或雙側(cè))

2.計(jì)算統(tǒng)計(jì)量-決定第3步的產(chǎn)值

由選定的檢驗(yàn)方法根據(jù)樣本數(shù)據(jù)計(jì)算相應(yīng)的統(tǒng)計(jì)量。

3.確定P值,做出統(tǒng)計(jì)推斷

通過第2步計(jì)算的統(tǒng)計(jì)量獲得。

(五)f檢驗(yàn)

力檢驗(yàn)的應(yīng)用條件:資料類型一計(jì)量資料;比較的指標(biāo)一均數(shù)。樣本含量較?。ū热鏽<50),樣本來

自正態(tài)總體,在做兩個樣本均數(shù)比較時,還要求兩樣本相應(yīng)的總體方差相等(小樣本、正態(tài)性和方差齊)。

)樣本均數(shù)與總體均數(shù)的比較

二)配對t檢驗(yàn)

三)兩個獨(dú)立樣本均數(shù)的比較

-)單樣本t檢驗(yàn)(未知總體與已知總體)

例據(jù)大量調(diào)查得知,健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機(jī)調(diào)查了25名健康成年

男子,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分,能否認(rèn)為該山區(qū)成年男子的脈搏高于一般人群?

題意分析見下圖:

檢驗(yàn)方法的選擇:

1.資料類型:脈搏-計(jì)量資料

2.比較的指標(biāo):均數(shù)

3.脈搏服從正態(tài)分布

4.未知總體與已知總體比

假設(shè)檢驗(yàn)

1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)。

檢驗(yàn)水準(zhǔn)a=0.Q5(單側(cè))

2.計(jì)算統(tǒng)計(jì)量

74.2-72.0

=1.692ittOngdA

6.5/岳

v=M-1=25—1=24

3.確定尸值,做出統(tǒng)計(jì)推斷

見下圖:

按。=0.05水準(zhǔn),不拒絕/%,差異無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為該山區(qū)健康成年男子的脈搏均數(shù)高于一般

健康成年男子的脈搏均數(shù)。

二)配對t檢驗(yàn)

配對t檢驗(yàn)適用于配對設(shè)計(jì)的計(jì)量資料(數(shù)值變量資料)。

①配對的兩個受試對象分別接受兩種處理之后的數(shù)據(jù);

②同一樣品用兩種方法(或儀器等)檢驗(yàn)的結(jié)果;

③同一受試對象兩個部位的數(shù)據(jù)。

配對t檢驗(yàn)要求差值服從正態(tài)分布,其目的是推斷兩種處理(或方法)的結(jié)果是否有差別。

例對24名兒童接種卡介苗,按同年齡、同性別配成12對,每對中的2名兒童分別接種兩種結(jié)核菌素,

一種為標(biāo)準(zhǔn)品,另一種為新制品,分別注射在兒童的前臂,72小時后記錄兩種結(jié)核菌素的皮膚反應(yīng)平均直

徑,見下表,問兒童皮膚對兩種不同結(jié)核菌素的反應(yīng)性是否有差別?

123456789101112

對子號

AB;ABABABABABABABABABABAB

隨機(jī)數(shù)字92641075031112

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論