假設(shè)檢驗課件_第1頁
假設(shè)檢驗課件_第2頁
假設(shè)檢驗課件_第3頁
假設(shè)檢驗課件_第4頁
假設(shè)檢驗課件_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計學(xué)假設(shè)檢驗HypothesisTest6-假設(shè)檢驗第五章假設(shè)檢驗6-假設(shè)檢驗Question總體Α是100例正常成年男子的紅細胞數(shù)(1012/L,以下省略),從中隨機抽取樣本a1

和樣本a2

;總體B是另外100例正常成年男子的紅細胞數(shù),從中隨機抽取樣本b

;三個樣本的含量均為10例,有關(guān)數(shù)值如下:μσa1/b1a2A5.000.435.1354.949B5.500.455.4426-假設(shè)檢驗Question在已知A和B總體參數(shù)時a1-a2抽樣誤差a1-b1本質(zhì)差別6-假設(shè)檢驗Question假如事先不知道A和B是不是同一個總體a1-b1抽樣誤差本質(zhì)差別?A≠BA=B6-假設(shè)檢驗一、假設(shè)檢驗的意義紅細胞數(shù)(1012/L)。甲:n=10,=5.442,測自高原地區(qū)正常成年男子;乙:n=10,=5.135,測自平原地區(qū)正常成年男子?,F(xiàn)在問題是:從以上結(jié)果能否認為高原地區(qū)正常成年男子的紅細胞數(shù)高于平原地區(qū)?6-假設(shè)檢驗假設(shè)檢驗的意義a1-a2抽樣誤差a1-b1本質(zhì)差別6-假設(shè)檢驗假設(shè)檢驗的意義假設(shè)檢驗的基本意義就是分辨兩個樣本是否分別屬于兩個或多個不同的總體,并對總體作出適當(dāng)?shù)慕Y(jié)論。兩個樣本的概念也可以擴展為兩個以上的樣本。分辨一個樣本是否屬于某特定總體。

6-假設(shè)檢驗二、假設(shè)檢驗的基本思想[例]為研究某山區(qū)成年男子的脈搏均數(shù)是否不同于一般成年男子的脈搏均數(shù)。某醫(yī)生在一山區(qū)隨機抽查了25名健康成年男子,求得其均數(shù)為74.2次/分,標準差為6.5次/分。根據(jù)大量調(diào)查,已知健康成年男子脈搏均數(shù)為72次/分,能否據(jù)此認為該山區(qū)成年男子的脈搏均數(shù)不同于一般成年男子的脈搏均數(shù)?6-假設(shè)檢驗假設(shè)檢驗的基本思想μ=μ0抽樣誤差μ≠μ0本質(zhì)差別問題本質(zhì):是否μ≠μ0

假設(shè)μ=μ0,反證法6-假設(shè)檢驗假設(shè)檢驗的基本思想提出一個假設(shè):同一總體,差別由抽樣誤差造成如果假設(shè)成立,求出由于抽樣誤差得到現(xiàn)有樣本的可能性可能性很小(小概率事件),在一次試驗中本不該得到,居然得到了,說明我們的假設(shè)有問題,拒絕之。有可能得到手頭的結(jié)果,故根據(jù)現(xiàn)有的樣本無法拒絕事先的假設(shè)(沒理由)6-假設(shè)檢驗假設(shè)檢驗的基本思想以確立的假設(shè)總體為依據(jù),求出從假設(shè)總體中獲得手頭樣本(含與總體參數(shù)偏離更大的樣本)之概率,通過對此概率的界定來作出結(jié)論。6-假設(shè)檢驗假設(shè)檢驗的基本思想假設(shè)抽樣誤差的可能性可能性很小可能性較大拒絕原假設(shè)不拒絕原假設(shè)6-假設(shè)檢驗三、假設(shè)檢驗的一般步驟[例]正常人脈搏72次/分。從某病患者中隨機抽取81人,其樣本均數(shù)74.8次/分,標準差8.7次/分。那么該病是否會影響脈搏?6-假設(shè)檢驗假設(shè)檢驗的一般步驟從資料提供的信息來看,樣本均數(shù)74.8與總體均數(shù)72并不相等,其原因可有以下兩個方面:樣本對應(yīng)的總體均數(shù)等于72,差別僅僅是由于抽樣誤差所致;除抽樣誤差外,病人與正常人存在本質(zhì)上的差異,即該病會影響血壓。兩種情況只有一個是正確的,且二者必居其一,需要我們作出推斷。

6-假設(shè)檢驗假設(shè)檢驗的一般步驟步驟1:建立假設(shè)在假設(shè)的前提下有規(guī)律可尋零假設(shè)(nullhypothesis),記為H0,表示目前的差異是由于抽樣誤差引起的。備擇假設(shè)(alternativehypothesis),記為H1,表示目前的差異是由于本質(zhì)上的差別引起的6-假設(shè)檢驗常見的H0和H1假設(shè)形式H0:

1

2

H1:

1≠

2

H0:

1=

2=

3……

H1:

1、

2、

3……之間全不相等或不全相等H0:

0

H1:

06-假設(shè)檢驗假設(shè)檢驗的一般步驟H0:

=72,病人與正常人的平均脈搏相等;H1:≠72,病人與正常人的平均脈搏不等。H0假設(shè)比較單純、明確,且在該假設(shè)的前提下有規(guī)律可尋。而H1假設(shè)包含的情況比較復(fù)雜。假設(shè)檢驗是針對H0的。6-假設(shè)檢驗假設(shè)檢驗的一般步驟步驟2:確立檢驗水準α(小概率標準)用于確定當(dāng)檢驗統(tǒng)計量在什么范圍內(nèi)拒絕H0

。即此時樣本統(tǒng)計量與參數(shù)的差別不是僅僅由抽樣誤差所能解釋的。檢驗水準有單雙側(cè)之分。選擇要有專業(yè)背景。檢驗水準大小的選擇要慎重。6-假設(shè)檢驗單雙側(cè)檢驗假設(shè)的變化均數(shù)μ與已知總體均數(shù)μ0的比較

目的H0H1雙側(cè)檢驗是否μ≠μ0μ=μ0μ≠μ0單側(cè)檢驗是否μ>μ0是否μ<μ0μ=μ0μ=μ0μ>μ0μ<μ06-假設(shè)檢驗單雙側(cè)檢驗假設(shè)的變化均數(shù)μ1與μ2的比較

目的H0H1雙側(cè)檢驗是否μ1≠μ2μ1=μ2μ1≠μ2單側(cè)檢驗是否μ1>μ2是否μ1<μ2μ1=μ2μ1=μ2μ1>μ2μ1<μ26-假設(shè)檢驗單雙側(cè)檢驗注意點雙側(cè)檢驗拒絕H0,單側(cè)檢驗一定拒絕H0

單側(cè)檢驗不拒絕H0

,雙側(cè)檢驗一定不拒絕H0

探討性的研究多采用雙側(cè)檢驗,證實性的研究多采用單側(cè)檢驗。6-假設(shè)檢驗GuiltyorInnocent?對于謀殺案的嫌疑人,要細心地尋找蛛絲馬跡,需要尺度比較嚴,因為讓兇手逍遙法外是極度危險的;對于一般的小偷小摸,尺度就比較松;在假設(shè)檢驗時,如果錯誤地不拒絕零假設(shè)的后果很嚴重,就需要嚴格尺度,即選擇一個較大的α;否則要選擇稍小的α;一般選擇α=0.05。6-假設(shè)檢驗假設(shè)檢驗的一般步驟步驟3:計算檢驗統(tǒng)計量并求P值即計算樣本與所假設(shè)總體的偏離;根據(jù)分析目的、設(shè)計類型,選用適當(dāng)?shù)臋z驗方法,計算相應(yīng)的統(tǒng)計量;根據(jù)檢驗統(tǒng)計量的分布求P值。P值就是指在H0所規(guī)定的總體中隨機抽樣,獲得大于等于(或小于等于)現(xiàn)有樣本統(tǒng)計量的概率。6-假設(shè)檢驗假設(shè)檢驗的一般步驟例題中,H0假設(shè)前提下,樣本均數(shù)與總體均數(shù)

0

間的差別可以用統(tǒng)計量t來表示:

6-假設(shè)檢驗假設(shè)檢驗的一般步驟統(tǒng)計量t:在標準誤的尺度下,樣本均數(shù)與總體均數(shù)

0的偏離。根據(jù)抽樣誤差理論,在H0的假設(shè)前提下,統(tǒng)計量t服從自由度為n-1的t分布。t值在0的附近的可能性大,遠離0的可能性小。而若t值落在檢驗水準所對應(yīng)的界值之外,則認為從H0所規(guī)定的總體中得到現(xiàn)有的樣本是小概率事件。則拒絕H0。6-假設(shè)檢驗假設(shè)檢驗的一般步驟0拒絕域6-假設(shè)檢驗本例中已知n=81,=74.8(次/分),s=8.7(次/分),

0=72(次/分),則檢驗統(tǒng)計量t:

6-假設(shè)檢驗假設(shè)檢驗的一般步驟求與統(tǒng)計量t值對應(yīng)的概率;即在H0成立的前提下,獲得現(xiàn)有這么大的t值以及更大t值(|t|≥2.90)的可能性;查自由度為80的t界值表

P=P(|t|≥1.99)=0.05P=P(|t|≥2.90)<0.05

6-假設(shè)檢驗步驟4:界定P值并作結(jié)論根據(jù)小概率原理作出推斷(與檢驗水準比較);若P≤

=0.05),根據(jù)抽樣分布規(guī)律,在H0成立的前提下出現(xiàn)現(xiàn)有差別或更大差別的可能性P小于等于0.05,是小概率事件,根據(jù)小概率原理,是不可能發(fā)生的。然而不可能發(fā)生的事件在一次獨立試驗中居然發(fā)生了,即現(xiàn)有樣本信息不支持H0。因此,拒絕H0,接受H1。6-假設(shè)檢驗若P>

,說明在H0成立的前提下出現(xiàn)現(xiàn)有差別或更大差別的可能性P不是小概率事件,因此,沒有理由拒絕H0??梢?,抉擇的標準為:當(dāng)P≤

時,拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義;當(dāng)P>

時,不拒絕H0,差異無統(tǒng)計學(xué)意義。6-假設(shè)檢驗本例P<0.05,按

=0.05的水準,拒絕H0,接受H1,差別有統(tǒng)計學(xué)意義。認為該病患者的脈搏次數(shù)高于正常人。即該病會影響脈搏。6-假設(shè)檢驗假設(shè)檢驗獨特的思維假設(shè)檢驗獨特的思維:先根據(jù)研究目的建立一個假設(shè),再分析樣本提供的信息是否支持這種假設(shè),從而作出推斷結(jié)論。6-假設(shè)檢驗四、假設(shè)檢驗的正確應(yīng)用6-假設(shè)檢驗1、實施假設(shè)檢驗的前提確認指標或數(shù)據(jù)分布的意義。金標準、等級劃分標準

確認樣本的隨機化。6-假設(shè)檢驗2、正確理解P值P值的涵義:在H0所規(guī)定的總體中隨機抽樣,獲得大于等于(或小于等于)現(xiàn)有樣本統(tǒng)計量的概率。拒絕H0時:P值小,風(fēng)險小,誤差??;P值大,風(fēng)險大,誤差大。

6-假設(shè)檢驗3、Significant

的本義傳統(tǒng)表述:“拒絕H0,接受H1”習(xí)慣上稱為“顯著”,英文“significant”

;“不拒絕H0”稱為“不顯著”,英文“non-significant”。Significant的本義:“有意義的”、“非偶然的”

6-假設(shè)檢驗錯誤理解把“顯著”理解為差別很大,甚至理解為在醫(yī)學(xué)實踐中有重要的價值;把“不顯著”理解為差別不大或一定相等。建議:用“有、無統(tǒng)計學(xué)意義”來取代“顯著與不顯著”P≤

,拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義;P

,不拒絕H0,差異尚無統(tǒng)計學(xué)意義。6-假設(shè)檢驗4、

水準在結(jié)論中的意義按不超過多大的誤差為條件而作結(jié)論:

=0.05,得P≤

,按誤差不超過5%的條件拒絕H0接受H1;

=0.01,得P≤

,按誤差不超過1%的條件拒絕H0接受H1;采用更小的

水準,當(dāng)P值小于此水準時,說明所作結(jié)論的誤差更小,所冒的風(fēng)險更小。6-假設(shè)檢驗常見錯誤結(jié)論用語當(dāng)

=0.05,P≤

,認為H1有“顯著差異”;當(dāng)

=0.01,P≤

,認為H1有“非常顯著差異”;當(dāng)

=0.001,P≤

,認為H1有“極顯著差異”;導(dǎo)致

水準的大小與結(jié)論具體內(nèi)容緊密聯(lián)系導(dǎo)致“P值越小,差異越大”的錯誤觀念

6-假設(shè)檢驗五、假設(shè)檢驗的相關(guān)問題6-假設(shè)檢驗一、結(jié)論的概率性H0條件下出現(xiàn)等于大于(或等于小于)現(xiàn)有統(tǒng)計量的概率雖小,但實際上是有可能出現(xiàn)的,所以在下結(jié)論的時候,雖然拒絕H0

,但不能認為H0肯定不成立;相反,不拒絕H0

,也不能認為H0肯定成立。假設(shè)檢驗的結(jié)論建立在小概率原理的基礎(chǔ)之上,結(jié)論本身具有一定的概率性,無論拒絕H0或不拒絕H0

,都有可能發(fā)生錯誤,都冒了一定概率的風(fēng)險。6-假設(shè)檢驗二、兩類錯誤當(dāng)H0是真實的,拒絕H0是錯誤的,不拒絕H0則是正確的。當(dāng)H0是不真實的,拒絕H0是正確的,不拒絕H0則是錯誤的。

存在二種正確推斷和二種錯誤推斷。6-假設(shè)檢驗兩類錯誤為區(qū)別這兩種錯誤,統(tǒng)計學(xué)上規(guī)定:Ⅰ型錯誤(TypeIError)拒絕了實際上是成立的H0——“棄真”

Ⅱ型錯誤(TypeIIError)不拒絕實際上是不成立的H0——“存?zhèn)巍?/p>

6-假設(shè)檢驗兩類錯誤如果把H0視作陰性事件,而把H1視作陽性事件,則二種錯誤的意義如下:Ⅰ型錯誤——拒絕真實的H0

——假陽性Ⅱ型錯誤——拒絕真實的H1

——假陰性6-假設(shè)檢驗兩類錯誤健康人與肝病病人的肝大指數(shù)分布(所擬合的兩個正態(tài)曲線各按100%面積繪制)6.17.08.4肝大指數(shù)健康人H0肝病病人H1第一類錯誤

=誤診率(假陽性率)第二類錯誤

=漏診率(假陰性率)5689101146-假設(shè)檢驗1、Ⅰ型錯誤

當(dāng)樣本來自于健康人,相當(dāng)于H0成立,由于抽樣的偶然性,得到較大的檢驗統(tǒng)計量,于是按檢驗水準

拒絕H0

,接受H1,認為該樣本來自于肝病病人,此推斷顯然是錯誤的。犯Ⅰ型錯誤的概率常用

表示。一般假設(shè)檢驗取檢驗水準

=0.05,理論上平均每100次抽樣就有5次發(fā)生這樣的錯誤。6-假設(shè)檢驗2、Ⅱ型錯誤

相反,當(dāng)樣本來自肝病病人,即H0實際上不成立,由于抽樣的偶然性,得到較小的檢驗統(tǒng)計量,因此按檢驗水準

不拒絕H0,認為該樣本來自于健康人,此推斷當(dāng)然也是錯誤的。

Ⅱ型錯誤發(fā)生的概率用

表示,通常當(dāng)n固定時,

越小,

越大;反之,

越大,

越小。6-假設(shè)檢驗兩類錯誤在實際工作中,可根據(jù)研究要求適當(dāng)控制

。若重點在于減少

,一般取

=0.01;若重點在于減小

,一般取

=0.05;若要同時減小

的唯一方法就是增加樣本含量。

6-假設(shè)檢驗兩類錯誤當(dāng)P≤

而拒絕H0接受H1,要注意第一類錯誤出現(xiàn);當(dāng)P

而不拒絕H0,要注意第二類錯誤的出現(xiàn)。第二類錯誤率

表示失去對真實H1作出肯定結(jié)論的概率,1-

就是對真實的H1作出肯定結(jié)論的概率,常被用來表達某假設(shè)檢驗方法的檢驗的功效。6-假設(shè)檢驗兩類錯誤1-

稱為檢驗效能(powerofatest)統(tǒng)計學(xué)意義為:若兩總體確實存在差別,按

水準能發(fā)現(xiàn)其差別的能力。例如1-

=0.9的理論含義是若兩總體確實有差別,平均每100次抽樣有90次能得出有差別的結(jié)論。檢驗效能越大,按檢驗水準拒絕H0,推斷兩總體均數(shù)確實有差別的把握就越大,所以檢驗效能又稱把握度。6-假設(shè)檢驗兩類錯誤

拒絕H0,接受H1不拒絕H0H0真實Ⅰ型錯誤(

)推斷正確(1-

)H0不真實推斷正確(1-

)Ⅱ型錯誤(

)6-假設(shè)檢驗三、單雙側(cè)檢驗的實際問題1、如何選用單、雙側(cè)檢驗若要分出甲、乙兩種方法的優(yōu)劣,包含了甲優(yōu)于乙或者乙優(yōu)于甲兩種可能的結(jié)果,應(yīng)選用雙側(cè)檢驗。若甲是從乙改進而得,已知改進可能有效,也可能無效,但不可能改進后反不如前,應(yīng)選用單側(cè)檢驗。當(dāng)遇情況比較復(fù)雜時,還是應(yīng)選用雙側(cè)檢驗為好。6-假設(shè)檢驗2、單、雙側(cè)檢驗的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論