多重比較和決策單調(diào)性控制_第1頁(yè)
多重比較和決策單調(diào)性控制_第2頁(yè)
多重比較和決策單調(diào)性控制_第3頁(yè)
多重比較和決策單調(diào)性控制_第4頁(yè)
多重比較和決策單調(diào)性控制_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/1多重比較和決策單調(diào)性控制第一部分多重比較問(wèn)題概述 2第二部分決策單調(diào)性控制原理 4第三部分謝菲檢驗(yàn)法 7第四部分Hochberg檢驗(yàn)法 10第五部分Holm檢驗(yàn)法 13第六部分多重比較的樣本量計(jì)算 16第七部分單調(diào)性控制下錯(cuò)誤率控制方式 20第八部分多重比較軟件工具 24

第一部分多重比較問(wèn)題概述多重比較問(wèn)題概述

引言

在統(tǒng)計(jì)推斷中,多重比較是涉及對(duì)多個(gè)假設(shè)進(jìn)行推斷的常見(jiàn)問(wèn)題。當(dāng)研究人員同時(shí)測(cè)試多個(gè)假設(shè)時(shí),出現(xiàn)錯(cuò)誤拒絕真實(shí)零假設(shè)(即第一類錯(cuò)誤)的風(fēng)險(xiǎn)會(huì)增加。多重比較問(wèn)題由此產(chǎn)生,目的是控制這種風(fēng)險(xiǎn)并確保推斷結(jié)果的有效性。

多重比較的種類

根據(jù)比較的數(shù)量和假設(shè)的類型,可以對(duì)多重比較問(wèn)題進(jìn)行分類:

*成對(duì)比較:比較兩個(gè)假設(shè)之間的差異。

*全局比較:比較多個(gè)假設(shè)之間的差異,而無(wú)需指定成對(duì)比較。

*計(jì)劃比較:在數(shù)據(jù)收集之前指定要進(jìn)行的特定比較,通?;陬A(yù)先存在的假設(shè)或理論。

*事后比較:在數(shù)據(jù)收集之后進(jìn)行的比較,通常是為了探索性目的。

類型I錯(cuò)誤的累積

當(dāng)同時(shí)進(jìn)行多個(gè)假設(shè)檢驗(yàn)時(shí),第一類錯(cuò)誤(拒絕真實(shí)零假設(shè))發(fā)生的概率會(huì)累積。例如,如果在0.05的顯著性水平下進(jìn)行10個(gè)獨(dú)立的比較,則至少進(jìn)行一次錯(cuò)誤拒絕的概率為1-(1-0.05)^10≈0.40。這意味著在給定的10個(gè)比較中,大約有40%的可能性出現(xiàn)誤報(bào)。

控制類型I錯(cuò)誤率

為了控制多重比較中的類型I錯(cuò)誤率,開(kāi)發(fā)了多種方法。這些方法旨在限制在所有進(jìn)行的比較中錯(cuò)誤拒絕真實(shí)零假設(shè)的概率,同時(shí)仍然保留檢驗(yàn)假設(shè)的能力。

多重比較調(diào)整方法

常用的多重比較調(diào)整方法包括:

*鮑弗尼法:一種通用的調(diào)整方法,用于任何數(shù)量的比較。

*圖基法:一種成對(duì)比較的調(diào)整方法,控制所有可能成對(duì)比較的類型I錯(cuò)誤率。

*謝弗法:一種計(jì)劃比較的調(diào)整方法,僅控制預(yù)先指定的比較的類型I錯(cuò)誤率。

*霍姆-邦弗羅尼法:一種全局比較的調(diào)整方法,控制所有比較的共同類型I錯(cuò)誤率。

決策單調(diào)性

決策單調(diào)性是多重比較中一個(gè)重要的概念,它表明調(diào)整方法保持了比較結(jié)果的順序。換句話說(shuō),如果在未調(diào)整的情況下,某個(gè)假設(shè)的顯著性水平低于另一個(gè)假設(shè),則假設(shè)的順序在調(diào)整后仍然保持不變。

重要性

多重比較和決策單調(diào)性控制對(duì)于統(tǒng)計(jì)推斷非常重要,因?yàn)樗?/p>

*防止過(guò)度自信地拒絕真實(shí)零假設(shè)。

*確保統(tǒng)計(jì)結(jié)果的可靠性和有效性。

*允許研究人員在控制錯(cuò)誤拒絕風(fēng)險(xiǎn)的同時(shí)進(jìn)行多項(xiàng)比較。

*提供了選擇最適當(dāng)?shù)亩嘀乇容^調(diào)整方法的指南,以滿足研究目標(biāo)。

結(jié)論

多重比較問(wèn)題是統(tǒng)計(jì)推斷中必須解決的基本問(wèn)題。通過(guò)實(shí)施多重比較調(diào)整方法和考慮決策單調(diào)性,研究人員可以提高推斷的準(zhǔn)確性和可信度。這在解釋研究結(jié)果和做出基于證據(jù)的決策時(shí)至關(guān)重要。第二部分決策單調(diào)性控制原理關(guān)鍵詞關(guān)鍵要點(diǎn)【多重比較和決策單調(diào)性控制原理】

【決策單調(diào)性控制原理】

1.單調(diào)性:決策函數(shù)對(duì)自變量單調(diào)變化,即自變量增加或減小,決策結(jié)果也會(huì)相應(yīng)增加或減小。

2.前綴單調(diào)性:決策函數(shù)對(duì)某些自變量的順序不變,即自變量的前綴改變不會(huì)影響決策結(jié)果。

3.后綴單調(diào)性:決策函數(shù)對(duì)某些自變量的順序不變,即自變量的后綴改變不會(huì)影響決策結(jié)果。

單調(diào)性與決策

1.單調(diào)決策:滿足單調(diào)性的決策函數(shù),能夠確保在自變量增加或減小時(shí),決策結(jié)果也隨之增加或減小,從而保證了決策的一致性和可預(yù)測(cè)性。

2.單調(diào)約束:在某些情況下,決策函數(shù)需要滿足單調(diào)性約束,以確保決策結(jié)果符合特定規(guī)則或道德準(zhǔn)則。

3.單調(diào)優(yōu)化:利用單調(diào)性原理,可以設(shè)計(jì)高效的優(yōu)化算法,在約束條件下搜索滿足單調(diào)性條件的最佳決策。

前綴單調(diào)性與決策

1.前綴無(wú)關(guān)決策:對(duì)于滿足前綴單調(diào)性的決策函數(shù),自變量的前綴部分不會(huì)影響決策結(jié)果,這使得決策過(guò)程可以簡(jiǎn)化和分解。

2.分步?jīng)Q策:前綴單調(diào)性原理可以用于設(shè)計(jì)分步?jīng)Q策算法,將復(fù)雜問(wèn)題分解成一系列較小的子問(wèn)題依次解決。

3.動(dòng)態(tài)規(guī)劃:前綴單調(diào)性是動(dòng)態(tài)規(guī)劃算法的基礎(chǔ)之一,通過(guò)存儲(chǔ)子問(wèn)題的決策結(jié)果,可以高效地解決具有重疊子問(wèn)題的優(yōu)化問(wèn)題。

后綴單調(diào)性與決策

1.后綴無(wú)關(guān)決策:對(duì)于滿足后綴單調(diào)性的決策函數(shù),自變量的后綴部分不會(huì)影響決策結(jié)果,這使得決策過(guò)程可以從后向前進(jìn)行。

2.回溯決策:后綴單調(diào)性原理可以用于設(shè)計(jì)回溯決策算法,通過(guò)逐層回溯和剪枝,高效地搜索所有可能的決策組合。

3.近似算法:后綴單調(diào)性可以幫助設(shè)計(jì)近似算法,通過(guò)舍棄變量的后綴部分,構(gòu)造近似解并控制近似誤差。決策單調(diào)性控制原理

決策單調(diào)性控制原理是一種多重比較方法,用于控制多個(gè)統(tǒng)計(jì)檢驗(yàn)中的假陽(yáng)性率(即,錯(cuò)誤拒絕零假設(shè)的概率)。該原理基于這樣一個(gè)直觀的想法:如果一個(gè)給定的統(tǒng)計(jì)檢驗(yàn)對(duì)于一個(gè)特定的替代假設(shè)不顯著,那么對(duì)于該假設(shè)的所有更極端的替代假設(shè)也不應(yīng)該顯著。

原理表述

形式上,決策單調(diào)性控制原理規(guī)定:

*如果檢驗(yàn)統(tǒng)計(jì)量\(T_1\)對(duì)于假設(shè)\(H_1\)不顯著,則對(duì)于任何\(H_1\)的替代假設(shè)\(H_a(a\ge1)\),檢驗(yàn)統(tǒng)計(jì)量\(T_a\)也不應(yīng)顯著。

推論

決策單調(diào)性控制原理有兩個(gè)重要推論:

1.遞減檢驗(yàn)序貫:如果檢驗(yàn)對(duì)于一個(gè)假設(shè)不顯著,則對(duì)于所有其他更極端的假設(shè)也不應(yīng)顯著。

2.使用較低序數(shù)檢驗(yàn):如果一個(gè)更低序數(shù)的檢驗(yàn)(例如,卡方檢驗(yàn))對(duì)于一個(gè)假設(shè)不顯著,則更高序數(shù)的檢驗(yàn)(例如,t檢驗(yàn))也不應(yīng)顯著。

控制假陽(yáng)性率

決策單調(diào)性控制原理可以通過(guò)限制檢驗(yàn)的臨界值來(lái)控制假陽(yáng)性率。方法如下:

1.對(duì)于最極端的替代假設(shè)\(H_m\)計(jì)算臨界值\(c_m\)。

2.對(duì)于所有其他假設(shè)\(H_a(a<m)\),使用臨界值\(c_a=c_m\)進(jìn)行檢驗(yàn)。

這種方法確保對(duì)于所有替代假設(shè)的假陽(yáng)性率都等于或小于對(duì)于最極端假設(shè)的假陽(yáng)性率。

優(yōu)勢(shì)

與其他多重比較方法相比,決策單調(diào)性控制原理具有以下優(yōu)勢(shì):

*控制力更強(qiáng):它提供了對(duì)假陽(yáng)性率更嚴(yán)格的控制。

*更易于解釋:該原理基于一個(gè)直觀的概念,易于理解和解釋。

*不需要調(diào)整:它無(wú)需對(duì)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行任何調(diào)整,從而簡(jiǎn)化了實(shí)現(xiàn)。

局限性

決策單調(diào)性控制原理也有一些局限性:

*可能過(guò)于保守:它可能會(huì)導(dǎo)致對(duì)于替代假設(shè)的檢測(cè)能力降低,尤其是在替代假設(shè)與零假設(shè)相差較小時(shí)。

*依賴于檢驗(yàn)統(tǒng)計(jì)量的單調(diào)性:該原理僅適用于檢驗(yàn)統(tǒng)計(jì)量隨著替代假設(shè)的極端性單調(diào)增加或減少的情況。

應(yīng)用

決策單調(diào)性控制原理廣泛應(yīng)用于多個(gè)統(tǒng)計(jì)領(lǐng)域,包括:

*多重假設(shè)檢驗(yàn)

*比較組間差異

*探索性數(shù)據(jù)分析

*回歸分析

舉例

假設(shè)我們進(jìn)行三個(gè)組之間的卡方檢驗(yàn)。假設(shè)\(T_1\)是組1和組2之間的檢驗(yàn)統(tǒng)計(jì)量,\(T_2\)是組1和組3之間的檢驗(yàn)統(tǒng)計(jì)量。如果\(T_1\)不顯著,則根據(jù)決策單調(diào)性控制原理,\(T_2\)也不應(yīng)顯著。這意味著,如果組1和組2之間沒(méi)有顯著差異,則組1和組3之間也不應(yīng)有顯著差異。第三部分謝菲檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【謝菲檢驗(yàn)法】

1.謝菲檢驗(yàn)法是一種多重比較方法,用于控制家族錯(cuò)誤率(FWER)。

2.其原理是將多個(gè)假設(shè)檢驗(yàn)按p值大小順序排列,僅拒絕p值低于某個(gè)臨界值的假設(shè)。

3.臨界值由FWER和所檢驗(yàn)假設(shè)的個(gè)數(shù)決定。

【單步程序】

謝菲檢驗(yàn)法

引言

多重比較問(wèn)題是指在統(tǒng)計(jì)推論中,對(duì)多個(gè)假設(shè)同時(shí)進(jìn)行檢驗(yàn)的情況。為了控制錯(cuò)誤發(fā)現(xiàn)率和保證假設(shè)檢驗(yàn)的有效性,需要采用多重比較方法。謝菲檢驗(yàn)法是一種常用的多重比較方法,因其簡(jiǎn)單易用性和保守性而被廣泛應(yīng)用。

檢驗(yàn)步驟

謝菲檢驗(yàn)法的具體步驟如下:

1.計(jì)算P值:分別計(jì)算每個(gè)假設(shè)的P值。

2.排序P值:將P值從最小到最大排序。

3.確定臨界值:根據(jù)預(yù)設(shè)的顯著性水平α和檢驗(yàn)的假設(shè)數(shù)量k,計(jì)算臨界值:

```

c=α/(2*k)

```

4.與臨界值比較:依次將排序后的P值與臨界值c進(jìn)行比較。如果某P值小于c,則拒絕對(duì)應(yīng)的假設(shè);否則,接受該假設(shè)。

性質(zhì)和特點(diǎn)

謝菲檢驗(yàn)法具有以下性質(zhì)和特點(diǎn):

*強(qiáng)控制性:謝菲檢驗(yàn)法嚴(yán)格控制了總體第I類錯(cuò)誤率在α以下。也就是說(shuō),它保證了在所有可能的檢驗(yàn)情景中,錯(cuò)誤地拒絕真假設(shè)的概率不會(huì)超過(guò)α。

*保守性:謝菲檢驗(yàn)法通常被認(rèn)為過(guò)于保守,因?yàn)樗鶗?huì)拒絕一些實(shí)際存在的差異。這種保守性是由檢驗(yàn)的強(qiáng)控制性造成的。

*簡(jiǎn)單易用:謝菲檢驗(yàn)法是多重比較方法中最簡(jiǎn)單易用的方法之一。其步驟清晰明確,無(wú)需復(fù)雜的計(jì)算或軟件支持。

*適用性:謝菲檢驗(yàn)法適用于各種多重比較情景,包括成對(duì)比較、總體比較和多個(gè)處理組之間的比較。

應(yīng)用場(chǎng)景

謝菲檢驗(yàn)法廣泛應(yīng)用于以下場(chǎng)景:

*生物醫(yī)學(xué)研究:比較多個(gè)治療組的效果或生物標(biāo)記物的差異。

*社會(huì)科學(xué)研究:比較多個(gè)群體之間的平均值或比例。

*工業(yè)和制造:比較多個(gè)產(chǎn)品的質(zhì)量或性能。

*金融和經(jīng)濟(jì)學(xué):比較多個(gè)投資組合的收益或風(fēng)險(xiǎn)。

優(yōu)缺點(diǎn)

優(yōu)點(diǎn):

*強(qiáng)控制性

*簡(jiǎn)單易用

*適用于各種場(chǎng)景

缺點(diǎn):

*保守性較高

*忽略了假設(shè)之間的相關(guān)性

*不能控制每個(gè)假設(shè)的錯(cuò)誤率

與其他方法的比較

與其他多重比較方法(如Tukey檢驗(yàn)法和Bonferroni檢驗(yàn)法)相比,謝菲檢驗(yàn)法的優(yōu)勢(shì)在于其簡(jiǎn)單性和強(qiáng)控制性。然而,其保守性較高,這可能導(dǎo)致一些實(shí)際存在的差異未能被檢測(cè)到。因此,在選擇多重比較方法時(shí),需要根據(jù)具體的研究目標(biāo)和假設(shè)之間的相關(guān)性進(jìn)行權(quán)衡。

結(jié)論

謝菲檢驗(yàn)法是一種常用的多重比較方法,以其簡(jiǎn)單易用和強(qiáng)控制性而著稱。它適用于各種多重比較情景,但其保守性較高,忽略了假設(shè)之間的相關(guān)性。在選擇多重比較方法時(shí),應(yīng)根據(jù)研究目標(biāo)和假設(shè)的性質(zhì)進(jìn)行綜合考慮。第四部分Hochberg檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)Hochberg檢驗(yàn)法

1.逐級(jí)檢驗(yàn)程序:Hochberg檢驗(yàn)法采用逐級(jí)檢驗(yàn)程序,從具有最小p值的假設(shè)檢驗(yàn)開(kāi)始檢驗(yàn),如果假設(shè)檢驗(yàn)不顯著,則停止檢驗(yàn);如果假設(shè)檢驗(yàn)顯著,則繼續(xù)檢驗(yàn)下一個(gè)具有次小p值的假設(shè)檢驗(yàn)。

2.嚴(yán)格控制整體錯(cuò)誤率:該檢驗(yàn)法保證了對(duì)預(yù)先指定的整體錯(cuò)誤率(FWER)進(jìn)行嚴(yán)格控制,即使對(duì)多個(gè)假設(shè)進(jìn)行多重比較,也能控制錯(cuò)誤率不超過(guò)FWER。

3.基于封鎖的比較:Hochberg檢驗(yàn)法將假設(shè)檢驗(yàn)劃分為多個(gè)封鎖,每個(gè)封鎖包含具有類似p值的假設(shè)檢驗(yàn)。在每個(gè)封鎖內(nèi),僅檢驗(yàn)具有最小p值的假設(shè)檢驗(yàn),從而減少了比較次數(shù)。

Hochberg檢驗(yàn)法的優(yōu)點(diǎn)

1.控制錯(cuò)誤率嚴(yán)格:Hochberg檢驗(yàn)法對(duì)整體錯(cuò)誤率的控制非常嚴(yán)格,即使進(jìn)行多次比較,也能保證FWER不超過(guò)預(yù)先設(shè)定的水平。

2.計(jì)算簡(jiǎn)單:該檢驗(yàn)法易于理解和實(shí)施,計(jì)算過(guò)程相對(duì)簡(jiǎn)單,不需要復(fù)雜的公式或軟件。

3.適用于不同類型的數(shù)據(jù):Hochberg檢驗(yàn)法適用于連續(xù)和離散變量,可以用于各種類型的多元數(shù)據(jù)分析。

Hochberg檢驗(yàn)法的缺點(diǎn)

1.檢驗(yàn)順序影響:檢驗(yàn)的順序可能會(huì)影響Hochberg檢驗(yàn)法的結(jié)果,因此需要仔細(xì)考慮假設(shè)檢驗(yàn)的順序。

2.比較次數(shù)限制:該檢驗(yàn)法需要限制比較次數(shù),以保持嚴(yán)格的錯(cuò)誤率控制,這可能會(huì)影響對(duì)所有假設(shè)檢驗(yàn)的全面評(píng)估。

3.靈活性較低:Hochberg檢驗(yàn)法缺乏靈活性,不能對(duì)不同的假設(shè)檢驗(yàn)施加不同的重要性權(quán)重?;艉詹駲z驗(yàn)法

在多重比較中,控制總體意義水平(FWER)是一種常見(jiàn)的策略,它可以保證在所有可能比較中,至少有一個(gè)真正的差異被錯(cuò)誤地聲明為顯著的可能性不超過(guò)預(yù)先設(shè)定的α值?;艉詹駲z驗(yàn)法是一種步驟化的多重比較方法,用于控制FWER。

原理

霍赫伯格檢驗(yàn)法基于秩變換原理,即根據(jù)變量的秩值,將多個(gè)比較轉(zhuǎn)化為一個(gè)針對(duì)總體秩序的單一比較。具體步驟如下:

1.計(jì)算秩值:對(duì)于每個(gè)比較,計(jì)算組內(nèi)觀測(cè)值的秩值。

2.確定最小秩值:找到所有比較中的最小秩值。

3.應(yīng)用臨界值:使用最小秩值和預(yù)先設(shè)定的α值,查表或計(jì)算出臨界值。

4.比較秩值與臨界值:如果最小秩值大于或等于臨界值,則拒絕所有比較中的零假設(shè)(即聲明至少存在一個(gè)顯著差異)。

步驟

具體實(shí)施霍赫伯格檢驗(yàn)法的步驟如下:

1.計(jì)算秩值:對(duì)于每個(gè)比較,將兩組數(shù)據(jù)中的觀測(cè)值合并,并根據(jù)其值從小到大排序。為每個(gè)觀測(cè)值分配一個(gè)秩值,最小的觀測(cè)值分配為1,最大的觀測(cè)值分配為n(n為所有觀測(cè)值的總數(shù))。

2.確定最小秩值:找到所有比較中秩值最小的觀測(cè)值。

3.查表或計(jì)算臨界值:使用最小秩值和預(yù)先設(shè)定的α值,查表或計(jì)算臨界值。臨界值的表通??梢栽诮y(tǒng)計(jì)軟件或在線資源中找到。

4.比較秩值與臨界值:如果最小秩值大于或等于臨界值,則拒絕所有比較中的零假設(shè)。否則,接受所有零假設(shè)(即聲明不存在顯著差異)。

舉例

假設(shè)我們有以下三個(gè)比較:

*比較1:組A與組B

*比較2:組A與組C

*比較3:組B與組C

秩值如下:

|組|觀測(cè)值|秩值|

||||

|A|2|1|

|B|3|2|

|C|5|3|

|B|6|4|

|A|8|5|

|C|9|6|

最小秩值為1,α值為0.05。查表得到臨界值為3。由于最小秩值(1)小于臨界值(3),因此我們接受所有零假設(shè),即聲明所有比較中不存在顯著差異。

優(yōu)點(diǎn)

*FWER控制:霍赫伯格檢驗(yàn)法保證FWER不超過(guò)預(yù)先設(shè)定的α值。

*簡(jiǎn)單易行:該方法的實(shí)施相對(duì)簡(jiǎn)單,只需要計(jì)算秩值和查表或計(jì)算臨界值。

缺點(diǎn)

*秩變換:該方法依賴于秩變換,這可能會(huì)導(dǎo)致信息丟失。

*保守性:霍赫伯格檢驗(yàn)法可能過(guò)于保守,特別是當(dāng)比較數(shù)量較多時(shí)。

適用范圍

霍赫伯格檢驗(yàn)法適用于以下情況:

*獨(dú)立的比較

*數(shù)據(jù)滿足正態(tài)分布或秩變換假設(shè)

*需要控制FWER第五部分Holm檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【Holm檢驗(yàn)法】

1.Holm檢驗(yàn)法是進(jìn)行多重比較的一種方法,用于控制家庭誤差率(FWER),即所有比較的錯(cuò)誤拒絕率。它的基本原理是依次執(zhí)行一系列單邊檢驗(yàn),從拒絕最嚴(yán)格的零假設(shè)開(kāi)始。

2.具體的步驟如下:首先計(jì)算每一個(gè)零假設(shè)的p值,然后從最小的p值開(kāi)始,依次與預(yù)先設(shè)定的顯著性水平α比較。如果p值小于α,則拒絕相應(yīng)零假設(shè);否則,停止檢驗(yàn)。

3.Holm檢驗(yàn)法的優(yōu)點(diǎn)在于其對(duì)控制FWER提供了強(qiáng)有力的保證,且具有較高的統(tǒng)計(jì)功效。

【決策單調(diào)性控制】

Holm檢驗(yàn)法

Holm檢驗(yàn)法是一種逐步校正后的多重比較方法,用于在多重假設(shè)檢驗(yàn)中控制家族錯(cuò)誤率(FWER)。FWER是指犯下至少一個(gè)錯(cuò)誤的概率,該錯(cuò)誤概率在所有可能結(jié)果中取最大值。

步驟:

Holm檢驗(yàn)法包括以下步驟:

1.對(duì)檢驗(yàn)結(jié)果進(jìn)行排序:將p值從最小到最大排序。

2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平:對(duì)于p值p_i,計(jì)算其臨界alpha水平α_i=α/(m-i+1),其中α是預(yù)設(shè)的整體FWER,m是檢驗(yàn)的總次數(shù)。

3.逐個(gè)假設(shè)檢驗(yàn):從p值最小的假設(shè)檢驗(yàn)開(kāi)始,依次檢驗(yàn)每個(gè)假設(shè)。

4.拒絕假設(shè):如果p值≤α_i,則拒絕該假設(shè)。如果p值>α_i,則接受該假設(shè)。

5.終止檢驗(yàn):一旦遇到第一個(gè)未被拒絕的假設(shè),則停止檢驗(yàn)剩余的假設(shè)。

原理:

Holm檢驗(yàn)法基于以下原理:

*假設(shè)檢驗(yàn)的個(gè)數(shù)越多,犯錯(cuò)的可能性就越大。

*通過(guò)對(duì)p值進(jìn)行排序并使用逐個(gè)檢驗(yàn)的策略,該方法可以控制犯下至少一個(gè)錯(cuò)誤的概率。

優(yōu)點(diǎn):

*控制FWER,與Bonferroni檢驗(yàn)相比,在多個(gè)真陽(yáng)性假設(shè)的情況下具有更高的功效。

*直觀且易于實(shí)施。

缺點(diǎn):

*在多個(gè)假陽(yáng)性假設(shè)的情況下,功效可能較低。

*不能控制偽陽(yáng)性發(fā)生率(FPR)。

應(yīng)用:

Holm檢驗(yàn)法廣泛應(yīng)用于多種統(tǒng)計(jì)測(cè)試中,包括:

*多組均值比較

*相關(guān)性檢驗(yàn)

*卡方檢驗(yàn)

示例:

考慮以下示例,其中我們進(jìn)行三個(gè)假設(shè)檢驗(yàn):

*H0,1:μ1=μ2

*H0,2:μ1=μ3

*H0,3:μ2=μ3

我們使用Holm檢驗(yàn)法,α=0.05。

1.對(duì)p值進(jìn)行排序:假設(shè)p值分別為0.01、0.02、0.04。

2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平:α1=0.05/(3-1+1)=0.025,α2=0.05/(3-2+1)=0.025,α3=0.05/(3-3+1)=0.05。

3.逐個(gè)假設(shè)檢驗(yàn):

*由于p1=0.01<α1=0.025,因此拒絕H0,1。

*由于p2=0.02<α2=0.025,因此拒絕H0,2。

*由于p3=0.04>α3=0.05,因此接受H0,3。

4.終止檢驗(yàn):由于第一個(gè)未被拒絕的假設(shè)是H0,3,因此我們停止檢驗(yàn)。

結(jié)論:

使用Holm檢驗(yàn)法,我們拒絕H0,1和H0,2,接受H0,3。這意味著我們有證據(jù)認(rèn)為μ1與μ2不同,μ1與μ3不同,而μ2與μ3沒(méi)有差異。第六部分多重比較的樣本量計(jì)算關(guān)鍵詞關(guān)鍵要點(diǎn)主題名稱:樣本量計(jì)算的原則

1.multiplecomparisons(MC)檢驗(yàn)控制的是家庭錯(cuò)誤率(FWER)或錯(cuò)誤發(fā)現(xiàn)率(FDR)。

2.樣本量計(jì)算的目標(biāo)是確保MC檢驗(yàn)達(dá)到預(yù)定的統(tǒng)計(jì)功效。

3.樣本量計(jì)算方法依賴于MC檢驗(yàn)的類型、顯著性水平、功效水平、組數(shù)和組內(nèi)效應(yīng)大小。

主題名稱:連續(xù)性檢驗(yàn)的樣本量計(jì)算

多重比較的樣本量計(jì)算

在多重比較中,確定適當(dāng)?shù)臉颖玖繉?duì)于確保統(tǒng)計(jì)檢驗(yàn)的有效性和控制錯(cuò)誤率至關(guān)重要。以下介紹了用于計(jì)算樣本量的方法:

1.統(tǒng)計(jì)功效

統(tǒng)計(jì)功效(又稱檢驗(yàn)效能)表示檢測(cè)到真拒絕假設(shè)或拒絕真零假設(shè)的概率。對(duì)于多重比較,功效是指檢測(cè)到至少一個(gè)對(duì)照組與對(duì)照組之間存在統(tǒng)計(jì)學(xué)差異的概率。

2.控制錯(cuò)誤率

錯(cuò)誤率與多重比較的類型相關(guān):

*家族錯(cuò)誤率(FWER):在所有測(cè)試中犯I類錯(cuò)誤(錯(cuò)誤拒絕零假設(shè))的概率。

*局部錯(cuò)誤率(LER):對(duì)于任何特定的比較,犯I類錯(cuò)誤的概率。

*控制假陽(yáng)性率(FPR):期望假陽(yáng)性測(cè)試數(shù)量的概率。

3.假設(shè)檢驗(yàn)類型

*單側(cè)檢驗(yàn):假設(shè)處理組的平均值大于(或小于)對(duì)照組。

*雙側(cè)檢驗(yàn):假設(shè)處理組的平均值與對(duì)照組不同。

4.檢驗(yàn)方法

*總體均值比較:Studentt檢驗(yàn)、方差分析(ANOVA)

*比例比較:卡方檢驗(yàn)、Fisher精確檢驗(yàn)

*生存時(shí)間比較:對(duì)數(shù)秩檢驗(yàn)、Cox回歸

樣本量計(jì)算公式

根據(jù)所選的假設(shè)檢驗(yàn)類型、檢驗(yàn)方法、錯(cuò)誤率和功效值,可以使用以下公式計(jì)算樣本量:

1.單側(cè)t檢驗(yàn)

```

n=(t_α/2+t_β)^2*(σ^2/(μ_1-μ_0)^2)

```

其中:

*n:每個(gè)組所需的樣本量

*t_α/2:α/2水平的臨界值

*t_β:β水平的臨界值

*σ^2:總體方差

*μ_1:處理組均值

*μ_0:對(duì)照組均值

2.雙側(cè)t檢驗(yàn)

```

n=(t_α+t_β)^2*(σ^2/(μ_1-μ_0)^2)

```

其中:

*t_α:α水平的臨界值

3.變異數(shù)分析(ANOVA)

```

n=(F_α/2+F_β)^2*(σ^2/(μ_1-μ_0)^2)*(k-1)

```

其中:

*k:組數(shù)

*F_α/2:α/2水平的F分布臨界值

*F_β:β水平的F分布臨界值

4.卡方檢驗(yàn)

```

n=((z_α/2+z_β)^2*p_0*(1-p_0))/((p_1-p_0)^2)

```

其中:

*z_α/2:α/2水平的z分布臨界值

*z_β:β水平的z分布臨界值

*p_0:對(duì)照組的比例

*p_1:處理組的比例

5.Fisher精確檢驗(yàn)

```

n=(2*(z_α/2+z_β)^2*(p_0*(1-p_0)*p_1*(1-p_1)))/((p_1-p_0)^2)

```

6.對(duì)數(shù)秩檢驗(yàn)

```

n=(z_α/2+z_β)^2*(n_1+n_2)*((p_1-p_0)^2)

```

其中:

*n_1:處理組的樣本量

*n_2:對(duì)照組的樣本量

7.Cox回歸

```

n=(exp(B_α/2+B_β)-1)^2*(V/(exp(HR)-1)^2)

```

其中:

*B_α/2:α/2水平的Wald統(tǒng)計(jì)量的臨界值

*B_β:β水平的Wald統(tǒng)計(jì)量的臨界值

*V:協(xié)變量方差-協(xié)方差矩陣

*HR:風(fēng)險(xiǎn)比

注意事項(xiàng)

*這些公式基于正態(tài)分布或二項(xiàng)式分布的假設(shè)。

*對(duì)于非正態(tài)分布或離散數(shù)據(jù),應(yīng)使用非參數(shù)檢驗(yàn)方法。

*應(yīng)使用適當(dāng)?shù)姆椒▉?lái)調(diào)整多重比較,例如Bonferroni校正或Holm-Sidak校正。

*樣本量計(jì)算可能需要假設(shè)參數(shù),例如總體方差或差異大小。如果這些參數(shù)未知,則可以估計(jì)值或使用保守估計(jì)值。第七部分單調(diào)性控制下錯(cuò)誤率控制方式關(guān)鍵詞關(guān)鍵要點(diǎn)【單調(diào)性控制下錯(cuò)誤率控制方式】

【單步過(guò)程控制】

1.保證錯(cuò)誤率在每個(gè)步驟中都得到控制,即步進(jìn)式的錯(cuò)誤率控制。

2.適用于單調(diào)性函數(shù),即測(cè)試統(tǒng)計(jì)量隨著假設(shè)的偏差增大而增大。

3.要求對(duì)檢驗(yàn)統(tǒng)計(jì)量和零假設(shè)下對(duì)應(yīng)的分布有充分的了解。

【整體過(guò)程控制】

單調(diào)性控制下錯(cuò)誤率控制方式

在多重比較中,當(dāng)原假設(shè)順序單調(diào)時(shí)(如序貫全排序問(wèn)題),可以利用單調(diào)性來(lái)控制錯(cuò)誤率。單調(diào)性控制下錯(cuò)誤率控制方式主要有以下幾種:

1.單步法

單步法是一種簡(jiǎn)單的錯(cuò)誤率控制方法,它根據(jù)檢驗(yàn)統(tǒng)計(jì)量在整體拒絕域的相對(duì)位置來(lái)確定被拒絕的原假設(shè)。其具體步驟如下:

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。

3.計(jì)算整體拒絕域的臨界值。

4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。

5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。

單步法簡(jiǎn)單易行,但其缺點(diǎn)是控制錯(cuò)誤率的精確度較低,在原假設(shè)數(shù)量較多時(shí),實(shí)際錯(cuò)誤率可能高于目標(biāo)錯(cuò)誤率。

2.步驟法

步驟法是一種更精確的錯(cuò)誤率控制方法,它將整體拒絕域劃分為多個(gè)步驟,并在每個(gè)步驟中控制局部錯(cuò)誤率。其具體步驟如下:

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。

3.確定整體拒絕域的大小α。

4.將α均勻分配到每個(gè)步驟中,得到局部錯(cuò)誤率α*。

5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。

6.在每個(gè)步驟中,計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。

7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。

步驟法控制錯(cuò)誤率的精確度更高,但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí),步驟法的計(jì)算量可能成為一個(gè)限制因素。

3.威爾士(Wales)法

威爾士法是一種改進(jìn)的單步法,它通過(guò)調(diào)整臨界值來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下:

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。

3.計(jì)算整體拒絕域的臨界值。

4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從右(大)至左(小)依次檢驗(yàn)原假設(shè)。

5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值,且其相應(yīng)的局部拒絕域臨界值大于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。

威爾士法在控制錯(cuò)誤率的精確度和計(jì)算量之間取得了較好的平衡,在實(shí)際應(yīng)用中廣泛使用。

4.霍姆(Holm)法

霍姆法是一種改進(jìn)的步驟法,它通過(guò)調(diào)整局部錯(cuò)誤率來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下:

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。

3.確定整體拒絕域的大小α。

4.將α均勻分配到每個(gè)步驟中,得到局部錯(cuò)誤率α*。

5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(小)至右(大)依次檢驗(yàn)原假設(shè)。

6.在每個(gè)步驟中,計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。

7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值,且其相應(yīng)的整體拒絕域臨界值小于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的局部拒絕域臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。

霍姆法在控制錯(cuò)誤率的精確度上優(yōu)于威爾士法,但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí),霍姆法的計(jì)算量可能成為一個(gè)限制因素。

5.西達(dá)克(Sidak)法

西達(dá)克法是一種非單步的錯(cuò)誤率控制方法,它通過(guò)使用總體檢驗(yàn)統(tǒng)計(jì)量來(lái)控制整體錯(cuò)誤率。其具體步驟如下:

1.計(jì)算檢驗(yàn)統(tǒng)計(jì)量合計(jì)統(tǒng)計(jì)量。

2.將合計(jì)統(tǒng)計(jì)量與臨界值進(jìn)行比較。

3.當(dāng)合計(jì)統(tǒng)計(jì)量超過(guò)臨界值時(shí),拒絕所有的原假設(shè);否則,接受所有的原假設(shè)。

西達(dá)克法簡(jiǎn)單易行,但其缺點(diǎn)是控制整體錯(cuò)誤率的精確度較低,在原假設(shè)數(shù)量較多時(shí),實(shí)際錯(cuò)誤率可能遠(yuǎn)高于目標(biāo)錯(cuò)誤率。

選擇錯(cuò)誤率控制方式

在單調(diào)性控制下選擇錯(cuò)誤率控制方式時(shí),需要考慮以下因素

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論