多重比較和決策單調(diào)性控制

上傳人：I*** IP屬地：江蘇上傳時(shí)間：2024-06-06 格式：DOCX 頁(yè)數(shù)：27 大小：41.15KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩22頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1/1多重比較和決策單調(diào)性控制第一部分多重比較問(wèn)題概述 2第二部分決策單調(diào)性控制原理 4第三部分謝菲檢驗(yàn)法 7第四部分Hochberg檢驗(yàn)法 10第五部分Holm檢驗(yàn)法 13第六部分多重比較的樣本量計(jì)算 16第七部分單調(diào)性控制下錯(cuò)誤率控制方式 20第八部分多重比較軟件工具 24

第一部分多重比較問(wèn)題概述多重比較問(wèn)題概述

引言

在統(tǒng)計(jì)推斷中，多重比較是涉及對(duì)多個(gè)假設(shè)進(jìn)行推斷的常見(jiàn)問(wèn)題。當(dāng)研究人員同時(shí)測(cè)試多個(gè)假設(shè)時(shí)，出現(xiàn)錯(cuò)誤拒絕真實(shí)零假設(shè)（即第一類錯(cuò)誤）的風(fēng)險(xiǎn)會(huì)增加。多重比較問(wèn)題由此產(chǎn)生，目的是控制這種風(fēng)險(xiǎn)并確保推斷結(jié)果的有效性。

多重比較的種類

根據(jù)比較的數(shù)量和假設(shè)的類型，可以對(duì)多重比較問(wèn)題進(jìn)行分類：

*成對(duì)比較：比較兩個(gè)假設(shè)之間的差異。

*全局比較：比較多個(gè)假設(shè)之間的差異，而無(wú)需指定成對(duì)比較。

*計(jì)劃比較：在數(shù)據(jù)收集之前指定要進(jìn)行的特定比較，通?；陬A(yù)先存在的假設(shè)或理論。

*事后比較：在數(shù)據(jù)收集之后進(jìn)行的比較，通常是為了探索性目的。

類型I錯(cuò)誤的累積

當(dāng)同時(shí)進(jìn)行多個(gè)假設(shè)檢驗(yàn)時(shí)，第一類錯(cuò)誤（拒絕真實(shí)零假設(shè)）發(fā)生的概率會(huì)累積。例如，如果在0.05的顯著性水平下進(jìn)行10個(gè)獨(dú)立的比較，則至少進(jìn)行一次錯(cuò)誤拒絕的概率為1-(1-0.05)^10≈0.40。這意味著在給定的10個(gè)比較中，大約有40%的可能性出現(xiàn)誤報(bào)。

控制類型I錯(cuò)誤率

為了控制多重比較中的類型I錯(cuò)誤率，開(kāi)發(fā)了多種方法。這些方法旨在限制在所有進(jìn)行的比較中錯(cuò)誤拒絕真實(shí)零假設(shè)的概率，同時(shí)仍然保留檢驗(yàn)假設(shè)的能力。

多重比較調(diào)整方法

常用的多重比較調(diào)整方法包括：

*鮑弗尼法：一種通用的調(diào)整方法，用于任何數(shù)量的比較。

*圖基法：一種成對(duì)比較的調(diào)整方法，控制所有可能成對(duì)比較的類型I錯(cuò)誤率。

*謝弗法：一種計(jì)劃比較的調(diào)整方法，僅控制預(yù)先指定的比較的類型I錯(cuò)誤率。

*霍姆-邦弗羅尼法：一種全局比較的調(diào)整方法，控制所有比較的共同類型I錯(cuò)誤率。

決策單調(diào)性

決策單調(diào)性是多重比較中一個(gè)重要的概念，它表明調(diào)整方法保持了比較結(jié)果的順序。換句話說(shuō)，如果在未調(diào)整的情況下，某個(gè)假設(shè)的顯著性水平低于另一個(gè)假設(shè)，則假設(shè)的順序在調(diào)整后仍然保持不變。

重要性

多重比較和決策單調(diào)性控制對(duì)于統(tǒng)計(jì)推斷非常重要，因?yàn)樗?/p>

*防止過(guò)度自信地拒絕真實(shí)零假設(shè)。

*確保統(tǒng)計(jì)結(jié)果的可靠性和有效性。

*允許研究人員在控制錯(cuò)誤拒絕風(fēng)險(xiǎn)的同時(shí)進(jìn)行多項(xiàng)比較。

*提供了選擇最適當(dāng)?shù)亩嘀乇容^調(diào)整方法的指南，以滿足研究目標(biāo)。

結(jié)論

多重比較問(wèn)題是統(tǒng)計(jì)推斷中必須解決的基本問(wèn)題。通過(guò)實(shí)施多重比較調(diào)整方法和考慮決策單調(diào)性，研究人員可以提高推斷的準(zhǔn)確性和可信度。這在解釋研究結(jié)果和做出基于證據(jù)的決策時(shí)至關(guān)重要。第二部分決策單調(diào)性控制原理關(guān)鍵詞關(guān)鍵要點(diǎn)【多重比較和決策單調(diào)性控制原理】

【決策單調(diào)性控制原理】

1.單調(diào)性：決策函數(shù)對(duì)自變量單調(diào)變化，即自變量增加或減小，決策結(jié)果也會(huì)相應(yīng)增加或減小。

2.前綴單調(diào)性：決策函數(shù)對(duì)某些自變量的順序不變，即自變量的前綴改變不會(huì)影響決策結(jié)果。

3.后綴單調(diào)性：決策函數(shù)對(duì)某些自變量的順序不變，即自變量的后綴改變不會(huì)影響決策結(jié)果。

單調(diào)性與決策

1.單調(diào)決策：滿足單調(diào)性的決策函數(shù)，能夠確保在自變量增加或減小時(shí)，決策結(jié)果也隨之增加或減小，從而保證了決策的一致性和可預(yù)測(cè)性。

2.單調(diào)約束：在某些情況下，決策函數(shù)需要滿足單調(diào)性約束，以確保決策結(jié)果符合特定規(guī)則或道德準(zhǔn)則。

3.單調(diào)優(yōu)化：利用單調(diào)性原理，可以設(shè)計(jì)高效的優(yōu)化算法，在約束條件下搜索滿足單調(diào)性條件的最佳決策。

前綴單調(diào)性與決策

1.前綴無(wú)關(guān)決策：對(duì)于滿足前綴單調(diào)性的決策函數(shù)，自變量的前綴部分不會(huì)影響決策結(jié)果，這使得決策過(guò)程可以簡(jiǎn)化和分解。

2.分步?jīng)Q策：前綴單調(diào)性原理可以用于設(shè)計(jì)分步?jīng)Q策算法，將復(fù)雜問(wèn)題分解成一系列較小的子問(wèn)題依次解決。

3.動(dòng)態(tài)規(guī)劃：前綴單調(diào)性是動(dòng)態(tài)規(guī)劃算法的基礎(chǔ)之一，通過(guò)存儲(chǔ)子問(wèn)題的決策結(jié)果，可以高效地解決具有重疊子問(wèn)題的優(yōu)化問(wèn)題。

后綴單調(diào)性與決策

1.后綴無(wú)關(guān)決策：對(duì)于滿足后綴單調(diào)性的決策函數(shù)，自變量的后綴部分不會(huì)影響決策結(jié)果，這使得決策過(guò)程可以從后向前進(jìn)行。

2.回溯決策：后綴單調(diào)性原理可以用于設(shè)計(jì)回溯決策算法，通過(guò)逐層回溯和剪枝，高效地搜索所有可能的決策組合。

3.近似算法：后綴單調(diào)性可以幫助設(shè)計(jì)近似算法，通過(guò)舍棄變量的后綴部分，構(gòu)造近似解并控制近似誤差。決策單調(diào)性控制原理

決策單調(diào)性控制原理是一種多重比較方法，用于控制多個(gè)統(tǒng)計(jì)檢驗(yàn)中的假陽(yáng)性率（即，錯(cuò)誤拒絕零假設(shè)的概率）。該原理基于這樣一個(gè)直觀的想法：如果一個(gè)給定的統(tǒng)計(jì)檢驗(yàn)對(duì)于一個(gè)特定的替代假設(shè)不顯著，那么對(duì)于該假設(shè)的所有更極端的替代假設(shè)也不應(yīng)該顯著。

原理表述

形式上，決策單調(diào)性控制原理規(guī)定：

*如果檢驗(yàn)統(tǒng)計(jì)量\(T_1\)對(duì)于假設(shè)\(H_1\)不顯著，則對(duì)于任何\(H_1\)的替代假設(shè)\(H_a(a\ge1)\)，檢驗(yàn)統(tǒng)計(jì)量\(T_a\)也不應(yīng)顯著。

推論

決策單調(diào)性控制原理有兩個(gè)重要推論：

1.遞減檢驗(yàn)序貫：如果檢驗(yàn)對(duì)于一個(gè)假設(shè)不顯著，則對(duì)于所有其他更極端的假設(shè)也不應(yīng)顯著。

2.使用較低序數(shù)檢驗(yàn)：如果一個(gè)更低序數(shù)的檢驗(yàn)（例如，卡方檢驗(yàn)）對(duì)于一個(gè)假設(shè)不顯著，則更高序數(shù)的檢驗(yàn)（例如，t檢驗(yàn)）也不應(yīng)顯著。

控制假陽(yáng)性率

決策單調(diào)性控制原理可以通過(guò)限制檢驗(yàn)的臨界值來(lái)控制假陽(yáng)性率。方法如下：

1.對(duì)于最極端的替代假設(shè)\(H_m\)計(jì)算臨界值\(c_m\)。

2.對(duì)于所有其他假設(shè)\(H_a(a<m)\)，使用臨界值\(c_a=c_m\)進(jìn)行檢驗(yàn)。

這種方法確保對(duì)于所有替代假設(shè)的假陽(yáng)性率都等于或小于對(duì)于最極端假設(shè)的假陽(yáng)性率。

優(yōu)勢(shì)

與其他多重比較方法相比，決策單調(diào)性控制原理具有以下優(yōu)勢(shì)：

*控制力更強(qiáng)：它提供了對(duì)假陽(yáng)性率更嚴(yán)格的控制。

*更易于解釋：該原理基于一個(gè)直觀的概念，易于理解和解釋。

*不需要調(diào)整：它無(wú)需對(duì)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行任何調(diào)整，從而簡(jiǎn)化了實(shí)現(xiàn)。

局限性

決策單調(diào)性控制原理也有一些局限性：

*可能過(guò)于保守：它可能會(huì)導(dǎo)致對(duì)于替代假設(shè)的檢測(cè)能力降低，尤其是在替代假設(shè)與零假設(shè)相差較小時(shí)。

*依賴于檢驗(yàn)統(tǒng)計(jì)量的單調(diào)性：該原理僅適用于檢驗(yàn)統(tǒng)計(jì)量隨著替代假設(shè)的極端性單調(diào)增加或減少的情況。

應(yīng)用

決策單調(diào)性控制原理廣泛應(yīng)用于多個(gè)統(tǒng)計(jì)領(lǐng)域，包括：

*多重假設(shè)檢驗(yàn)

*比較組間差異

*探索性數(shù)據(jù)分析

*回歸分析

舉例

假設(shè)我們進(jìn)行三個(gè)組之間的卡方檢驗(yàn)。假設(shè)\(T_1\)是組1和組2之間的檢驗(yàn)統(tǒng)計(jì)量，\(T_2\)是組1和組3之間的檢驗(yàn)統(tǒng)計(jì)量。如果\(T_1\)不顯著，則根據(jù)決策單調(diào)性控制原理，\(T_2\)也不應(yīng)顯著。這意味著，如果組1和組2之間沒(méi)有顯著差異，則組1和組3之間也不應(yīng)有顯著差異。第三部分謝菲檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【謝菲檢驗(yàn)法】

1.謝菲檢驗(yàn)法是一種多重比較方法，用于控制家族錯(cuò)誤率（FWER）。

2.其原理是將多個(gè)假設(shè)檢驗(yàn)按p值大小順序排列，僅拒絕p值低于某個(gè)臨界值的假設(shè)。

3.臨界值由FWER和所檢驗(yàn)假設(shè)的個(gè)數(shù)決定。

【單步程序】

謝菲檢驗(yàn)法

引言

多重比較問(wèn)題是指在統(tǒng)計(jì)推論中，對(duì)多個(gè)假設(shè)同時(shí)進(jìn)行檢驗(yàn)的情況。為了控制錯(cuò)誤發(fā)現(xiàn)率和保證假設(shè)檢驗(yàn)的有效性，需要采用多重比較方法。謝菲檢驗(yàn)法是一種常用的多重比較方法，因其簡(jiǎn)單易用性和保守性而被廣泛應(yīng)用。

檢驗(yàn)步驟

謝菲檢驗(yàn)法的具體步驟如下：

1.計(jì)算P值：分別計(jì)算每個(gè)假設(shè)的P值。

2.排序P值：將P值從最小到最大排序。

3.確定臨界值：根據(jù)預(yù)設(shè)的顯著性水平α和檢驗(yàn)的假設(shè)數(shù)量k，計(jì)算臨界值：

```

c=α/(2*k)

```

4.與臨界值比較：依次將排序后的P值與臨界值c進(jìn)行比較。如果某P值小于c，則拒絕對(duì)應(yīng)的假設(shè)；否則，接受該假設(shè)。

性質(zhì)和特點(diǎn)

謝菲檢驗(yàn)法具有以下性質(zhì)和特點(diǎn)：

*強(qiáng)控制性：謝菲檢驗(yàn)法嚴(yán)格控制了總體第I類錯(cuò)誤率在α以下。也就是說(shuō)，它保證了在所有可能的檢驗(yàn)情景中，錯(cuò)誤地拒絕真假設(shè)的概率不會(huì)超過(guò)α。

*保守性：謝菲檢驗(yàn)法通常被認(rèn)為過(guò)于保守，因?yàn)樗鶗?huì)拒絕一些實(shí)際存在的差異。這種保守性是由檢驗(yàn)的強(qiáng)控制性造成的。

*簡(jiǎn)單易用：謝菲檢驗(yàn)法是多重比較方法中最簡(jiǎn)單易用的方法之一。其步驟清晰明確，無(wú)需復(fù)雜的計(jì)算或軟件支持。

*適用性：謝菲檢驗(yàn)法適用于各種多重比較情景，包括成對(duì)比較、總體比較和多個(gè)處理組之間的比較。

應(yīng)用場(chǎng)景

謝菲檢驗(yàn)法廣泛應(yīng)用于以下場(chǎng)景：

*生物醫(yī)學(xué)研究：比較多個(gè)治療組的效果或生物標(biāo)記物的差異。

*社會(huì)科學(xué)研究：比較多個(gè)群體之間的平均值或比例。

*工業(yè)和制造：比較多個(gè)產(chǎn)品的質(zhì)量或性能。

*金融和經(jīng)濟(jì)學(xué)：比較多個(gè)投資組合的收益或風(fēng)險(xiǎn)。

優(yōu)缺點(diǎn)

優(yōu)點(diǎn)：

*強(qiáng)控制性

*簡(jiǎn)單易用

*適用于各種場(chǎng)景

缺點(diǎn)：

*保守性較高

*忽略了假設(shè)之間的相關(guān)性

*不能控制每個(gè)假設(shè)的錯(cuò)誤率

與其他方法的比較

與其他多重比較方法（如Tukey檢驗(yàn)法和Bonferroni檢驗(yàn)法）相比，謝菲檢驗(yàn)法的優(yōu)勢(shì)在于其簡(jiǎn)單性和強(qiáng)控制性。然而，其保守性較高，這可能導(dǎo)致一些實(shí)際存在的差異未能被檢測(cè)到。因此，在選擇多重比較方法時(shí)，需要根據(jù)具體的研究目標(biāo)和假設(shè)之間的相關(guān)性進(jìn)行權(quán)衡。

結(jié)論

謝菲檢驗(yàn)法是一種常用的多重比較方法，以其簡(jiǎn)單易用和強(qiáng)控制性而著稱。它適用于各種多重比較情景，但其保守性較高，忽略了假設(shè)之間的相關(guān)性。在選擇多重比較方法時(shí)，應(yīng)根據(jù)研究目標(biāo)和假設(shè)的性質(zhì)進(jìn)行綜合考慮。第四部分Hochberg檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)Hochberg檢驗(yàn)法

1.逐級(jí)檢驗(yàn)程序：Hochberg檢驗(yàn)法采用逐級(jí)檢驗(yàn)程序，從具有最小p值的假設(shè)檢驗(yàn)開(kāi)始檢驗(yàn)，如果假設(shè)檢驗(yàn)不顯著，則停止檢驗(yàn)；如果假設(shè)檢驗(yàn)顯著，則繼續(xù)檢驗(yàn)下一個(gè)具有次小p值的假設(shè)檢驗(yàn)。

2.嚴(yán)格控制整體錯(cuò)誤率：該檢驗(yàn)法保證了對(duì)預(yù)先指定的整體錯(cuò)誤率（FWER）進(jìn)行嚴(yán)格控制，即使對(duì)多個(gè)假設(shè)進(jìn)行多重比較，也能控制錯(cuò)誤率不超過(guò)FWER。

3.基于封鎖的比較：Hochberg檢驗(yàn)法將假設(shè)檢驗(yàn)劃分為多個(gè)封鎖，每個(gè)封鎖包含具有類似p值的假設(shè)檢驗(yàn)。在每個(gè)封鎖內(nèi)，僅檢驗(yàn)具有最小p值的假設(shè)檢驗(yàn)，從而減少了比較次數(shù)。

Hochberg檢驗(yàn)法的優(yōu)點(diǎn)

1.控制錯(cuò)誤率嚴(yán)格：Hochberg檢驗(yàn)法對(duì)整體錯(cuò)誤率的控制非常嚴(yán)格，即使進(jìn)行多次比較，也能保證FWER不超過(guò)預(yù)先設(shè)定的水平。

2.計(jì)算簡(jiǎn)單：該檢驗(yàn)法易于理解和實(shí)施，計(jì)算過(guò)程相對(duì)簡(jiǎn)單，不需要復(fù)雜的公式或軟件。

3.適用于不同類型的數(shù)據(jù)：Hochberg檢驗(yàn)法適用于連續(xù)和離散變量，可以用于各種類型的多元數(shù)據(jù)分析。

Hochberg檢驗(yàn)法的缺點(diǎn)

1.檢驗(yàn)順序影響：檢驗(yàn)的順序可能會(huì)影響Hochberg檢驗(yàn)法的結(jié)果，因此需要仔細(xì)考慮假設(shè)檢驗(yàn)的順序。

2.比較次數(shù)限制：該檢驗(yàn)法需要限制比較次數(shù)，以保持嚴(yán)格的錯(cuò)誤率控制，這可能會(huì)影響對(duì)所有假設(shè)檢驗(yàn)的全面評(píng)估。

3.靈活性較低：Hochberg檢驗(yàn)法缺乏靈活性，不能對(duì)不同的假設(shè)檢驗(yàn)施加不同的重要性權(quán)重?；艉詹駲z驗(yàn)法

在多重比較中，控制總體意義水平（FWER）是一種常見(jiàn)的策略，它可以保證在所有可能比較中，至少有一個(gè)真正的差異被錯(cuò)誤地聲明為顯著的可能性不超過(guò)預(yù)先設(shè)定的α值?；艉詹駲z驗(yàn)法是一種步驟化的多重比較方法，用于控制FWER。

原理

霍赫伯格檢驗(yàn)法基于秩變換原理，即根據(jù)變量的秩值，將多個(gè)比較轉(zhuǎn)化為一個(gè)針對(duì)總體秩序的單一比較。具體步驟如下：

1.計(jì)算秩值：對(duì)于每個(gè)比較，計(jì)算組內(nèi)觀測(cè)值的秩值。

2.確定最小秩值：找到所有比較中的最小秩值。

3.應(yīng)用臨界值：使用最小秩值和預(yù)先設(shè)定的α值，查表或計(jì)算出臨界值。

4.比較秩值與臨界值：如果最小秩值大于或等于臨界值，則拒絕所有比較中的零假設(shè)（即聲明至少存在一個(gè)顯著差異）。

步驟

具體實(shí)施霍赫伯格檢驗(yàn)法的步驟如下：

1.計(jì)算秩值：對(duì)于每個(gè)比較，將兩組數(shù)據(jù)中的觀測(cè)值合并，并根據(jù)其值從小到大排序。為每個(gè)觀測(cè)值分配一個(gè)秩值，最小的觀測(cè)值分配為1，最大的觀測(cè)值分配為n（n為所有觀測(cè)值的總數(shù)）。

2.確定最小秩值：找到所有比較中秩值最小的觀測(cè)值。

3.查表或計(jì)算臨界值：使用最小秩值和預(yù)先設(shè)定的α值，查表或計(jì)算臨界值。臨界值的表通?？梢栽诮y(tǒng)計(jì)軟件或在線資源中找到。

4.比較秩值與臨界值：如果最小秩值大于或等于臨界值，則拒絕所有比較中的零假設(shè)。否則，接受所有零假設(shè)（即聲明不存在顯著差異）。

舉例

假設(shè)我們有以下三個(gè)比較：

*比較1：組A與組B

*比較2：組A與組C

*比較3：組B與組C

秩值如下：

|組|觀測(cè)值|秩值|

||||

|A|2|1|

|B|3|2|

|C|5|3|

|B|6|4|

|A|8|5|

|C|9|6|

最小秩值為1，α值為0.05。查表得到臨界值為3。由于最小秩值(1)小于臨界值(3)，因此我們接受所有零假設(shè)，即聲明所有比較中不存在顯著差異。

優(yōu)點(diǎn)

*FWER控制：霍赫伯格檢驗(yàn)法保證FWER不超過(guò)預(yù)先設(shè)定的α值。

*簡(jiǎn)單易行：該方法的實(shí)施相對(duì)簡(jiǎn)單，只需要計(jì)算秩值和查表或計(jì)算臨界值。

缺點(diǎn)

*秩變換：該方法依賴于秩變換，這可能會(huì)導(dǎo)致信息丟失。

*保守性：霍赫伯格檢驗(yàn)法可能過(guò)于保守，特別是當(dāng)比較數(shù)量較多時(shí)。

適用范圍

霍赫伯格檢驗(yàn)法適用于以下情況：

*獨(dú)立的比較

*數(shù)據(jù)滿足正態(tài)分布或秩變換假設(shè)

*需要控制FWER第五部分Holm檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【Holm檢驗(yàn)法】

1.Holm檢驗(yàn)法是進(jìn)行多重比較的一種方法，用于控制家庭誤差率（FWER），即所有比較的錯(cuò)誤拒絕率。它的基本原理是依次執(zhí)行一系列單邊檢驗(yàn)，從拒絕最嚴(yán)格的零假設(shè)開(kāi)始。

2.具體的步驟如下：首先計(jì)算每一個(gè)零假設(shè)的p值，然后從最小的p值開(kāi)始，依次與預(yù)先設(shè)定的顯著性水平α比較。如果p值小于α，則拒絕相應(yīng)零假設(shè)；否則，停止檢驗(yàn)。

3.Holm檢驗(yàn)法的優(yōu)點(diǎn)在于其對(duì)控制FWER提供了強(qiáng)有力的保證，且具有較高的統(tǒng)計(jì)功效。

【決策單調(diào)性控制】

Holm檢驗(yàn)法

Holm檢驗(yàn)法是一種逐步校正后的多重比較方法，用于在多重假設(shè)檢驗(yàn)中控制家族錯(cuò)誤率（FWER）。FWER是指犯下至少一個(gè)錯(cuò)誤的概率，該錯(cuò)誤概率在所有可能結(jié)果中取最大值。

步驟：

Holm檢驗(yàn)法包括以下步驟：

1.對(duì)檢驗(yàn)結(jié)果進(jìn)行排序：將p值從最小到最大排序。

2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平：對(duì)于p值p_i，計(jì)算其臨界alpha水平α_i=α/(m-i+1)，其中α是預(yù)設(shè)的整體FWER，m是檢驗(yàn)的總次數(shù)。

3.逐個(gè)假設(shè)檢驗(yàn)：從p值最小的假設(shè)檢驗(yàn)開(kāi)始，依次檢驗(yàn)每個(gè)假設(shè)。

4.拒絕假設(shè)：如果p值≤α_i，則拒絕該假設(shè)。如果p值>α_i，則接受該假設(shè)。

5.終止檢驗(yàn)：一旦遇到第一個(gè)未被拒絕的假設(shè)，則停止檢驗(yàn)剩余的假設(shè)。

原理：

Holm檢驗(yàn)法基于以下原理：

*假設(shè)檢驗(yàn)的個(gè)數(shù)越多，犯錯(cuò)的可能性就越大。

*通過(guò)對(duì)p值進(jìn)行排序并使用逐個(gè)檢驗(yàn)的策略，該方法可以控制犯下至少一個(gè)錯(cuò)誤的概率。

優(yōu)點(diǎn)：

*控制FWER，與Bonferroni檢驗(yàn)相比，在多個(gè)真陽(yáng)性假設(shè)的情況下具有更高的功效。

*直觀且易于實(shí)施。

缺點(diǎn)：

*在多個(gè)假陽(yáng)性假設(shè)的情況下，功效可能較低。

*不能控制偽陽(yáng)性發(fā)生率（FPR）。

應(yīng)用：

Holm檢驗(yàn)法廣泛應(yīng)用于多種統(tǒng)計(jì)測(cè)試中，包括：

*多組均值比較

*相關(guān)性檢驗(yàn)

*卡方檢驗(yàn)

示例：

考慮以下示例，其中我們進(jìn)行三個(gè)假設(shè)檢驗(yàn)：

*H0,1:μ1=μ2

*H0,2:μ1=μ3

*H0,3:μ2=μ3

我們使用Holm檢驗(yàn)法，α=0.05。

1.對(duì)p值進(jìn)行排序：假設(shè)p值分別為0.01、0.02、0.04。

2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平：α1=0.05/(3-1+1)=0.025，α2=0.05/(3-2+1)=0.025，α3=0.05/(3-3+1)=0.05。

3.逐個(gè)假設(shè)檢驗(yàn)：

*由于p1=0.01<α1=0.025，因此拒絕H0,1。

*由于p2=0.02<α2=0.025，因此拒絕H0,2。

*由于p3=0.04>α3=0.05，因此接受H0,3。

4.終止檢驗(yàn)：由于第一個(gè)未被拒絕的假設(shè)是H0,3，因此我們停止檢驗(yàn)。

結(jié)論：

使用Holm檢驗(yàn)法，我們拒絕H0,1和H0,2，接受H0,3。這意味著我們有證據(jù)認(rèn)為μ1與μ2不同，μ1與μ3不同，而μ2與μ3沒(méi)有差異。第六部分多重比較的樣本量計(jì)算關(guān)鍵詞關(guān)鍵要點(diǎn)主題名稱：樣本量計(jì)算的原則

1.multiplecomparisons(MC)檢驗(yàn)控制的是家庭錯(cuò)誤率(FWER)或錯(cuò)誤發(fā)現(xiàn)率(FDR)。

2.樣本量計(jì)算的目標(biāo)是確保MC檢驗(yàn)達(dá)到預(yù)定的統(tǒng)計(jì)功效。

3.樣本量計(jì)算方法依賴于MC檢驗(yàn)的類型、顯著性水平、功效水平、組數(shù)和組內(nèi)效應(yīng)大小。

主題名稱：連續(xù)性檢驗(yàn)的樣本量計(jì)算

多重比較的樣本量計(jì)算

在多重比較中，確定適當(dāng)?shù)臉颖玖繉?duì)于確保統(tǒng)計(jì)檢驗(yàn)的有效性和控制錯(cuò)誤率至關(guān)重要。以下介紹了用于計(jì)算樣本量的方法：

1.統(tǒng)計(jì)功效

統(tǒng)計(jì)功效（又稱檢驗(yàn)效能）表示檢測(cè)到真拒絕假設(shè)或拒絕真零假設(shè)的概率。對(duì)于多重比較，功效是指檢測(cè)到至少一個(gè)對(duì)照組與對(duì)照組之間存在統(tǒng)計(jì)學(xué)差異的概率。

2.控制錯(cuò)誤率

錯(cuò)誤率與多重比較的類型相關(guān)：

*家族錯(cuò)誤率（FWER）：在所有測(cè)試中犯I類錯(cuò)誤（錯(cuò)誤拒絕零假設(shè)）的概率。

*局部錯(cuò)誤率（LER）：對(duì)于任何特定的比較，犯I類錯(cuò)誤的概率。

*控制假陽(yáng)性率（FPR）：期望假陽(yáng)性測(cè)試數(shù)量的概率。

3.假設(shè)檢驗(yàn)類型

*單側(cè)檢驗(yàn)：假設(shè)處理組的平均值大于（或小于）對(duì)照組。

*雙側(cè)檢驗(yàn)：假設(shè)處理組的平均值與對(duì)照組不同。

4.檢驗(yàn)方法

*總體均值比較：Studentt檢驗(yàn)、方差分析（ANOVA）

*比例比較：卡方檢驗(yàn)、Fisher精確檢驗(yàn)

*生存時(shí)間比較：對(duì)數(shù)秩檢驗(yàn)、Cox回歸

樣本量計(jì)算公式

根據(jù)所選的假設(shè)檢驗(yàn)類型、檢驗(yàn)方法、錯(cuò)誤率和功效值，可以使用以下公式計(jì)算樣本量：

1.單側(cè)t檢驗(yàn)

```

n=(t_α/2+t_β)^2*(σ^2/(μ_1-μ_0)^2)

```

其中：

*n：每個(gè)組所需的樣本量

*t_α/2：α/2水平的臨界值

*t_β：β水平的臨界值

*σ^2：總體方差

*μ_1：處理組均值

*μ_0：對(duì)照組均值

2.雙側(cè)t檢驗(yàn)

```

n=(t_α+t_β)^2*(σ^2/(μ_1-μ_0)^2)

```

其中：

*t_α：α水平的臨界值

3.變異數(shù)分析（ANOVA）

```

n=(F_α/2+F_β)^2*(σ^2/(μ_1-μ_0)^2)*(k-1)

```

其中：

*k：組數(shù)

*F_α/2：α/2水平的F分布臨界值

*F_β：β水平的F分布臨界值

4.卡方檢驗(yàn)

```

n=((z_α/2+z_β)^2*p_0*(1-p_0))/((p_1-p_0)^2)

```

其中：

*z_α/2：α/2水平的z分布臨界值

*z_β：β水平的z分布臨界值

*p_0：對(duì)照組的比例

*p_1：處理組的比例

5.Fisher精確檢驗(yàn)

```

n=(2*(z_α/2+z_β)^2*(p_0*(1-p_0)*p_1*(1-p_1)))/((p_1-p_0)^2)

```

6.對(duì)數(shù)秩檢驗(yàn)

```

n=(z_α/2+z_β)^2*(n_1+n_2)*((p_1-p_0)^2)

```

其中：

*n_1：處理組的樣本量

*n_2：對(duì)照組的樣本量

7.Cox回歸

```

n=(exp(B_α/2+B_β)-1)^2*(V/(exp(HR)-1)^2)

```

其中：

*B_α/2：α/2水平的Wald統(tǒng)計(jì)量的臨界值

*B_β：β水平的Wald統(tǒng)計(jì)量的臨界值

*V：協(xié)變量方差-協(xié)方差矩陣

*HR：風(fēng)險(xiǎn)比

注意事項(xiàng)

*這些公式基于正態(tài)分布或二項(xiàng)式分布的假設(shè)。

*對(duì)于非正態(tài)分布或離散數(shù)據(jù)，應(yīng)使用非參數(shù)檢驗(yàn)方法。

*應(yīng)使用適當(dāng)?shù)姆椒▉?lái)調(diào)整多重比較，例如Bonferroni校正或Holm-Sidak校正。

*樣本量計(jì)算可能需要假設(shè)參數(shù)，例如總體方差或差異大小。如果這些參數(shù)未知，則可以估計(jì)值或使用保守估計(jì)值。第七部分單調(diào)性控制下錯(cuò)誤率控制方式關(guān)鍵詞關(guān)鍵要點(diǎn)【單調(diào)性控制下錯(cuò)誤率控制方式】

【單步過(guò)程控制】

1.保證錯(cuò)誤率在每個(gè)步驟中都得到控制，即步進(jìn)式的錯(cuò)誤率控制。

2.適用于單調(diào)性函數(shù)，即測(cè)試統(tǒng)計(jì)量隨著假設(shè)的偏差增大而增大。

3.要求對(duì)檢驗(yàn)統(tǒng)計(jì)量和零假設(shè)下對(duì)應(yīng)的分布有充分的了解。

【整體過(guò)程控制】

單調(diào)性控制下錯(cuò)誤率控制方式

在多重比較中，當(dāng)原假設(shè)順序單調(diào)時(shí)（如序貫全排序問(wèn)題），可以利用單調(diào)性來(lái)控制錯(cuò)誤率。單調(diào)性控制下錯(cuò)誤率控制方式主要有以下幾種：

1.單步法

單步法是一種簡(jiǎn)單的錯(cuò)誤率控制方法，它根據(jù)檢驗(yàn)統(tǒng)計(jì)量在整體拒絕域的相對(duì)位置來(lái)確定被拒絕的原假設(shè)。其具體步驟如下：

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn)，確保其滿足單調(diào)性假設(shè)。

3.計(jì)算整體拒絕域的臨界值。

4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中，從左（?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。

5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值時(shí)，拒絕對(duì)應(yīng)的原假設(shè)；否則，接受原假設(shè)。

單步法簡(jiǎn)單易行，但其缺點(diǎn)是控制錯(cuò)誤率的精確度較低，在原假設(shè)數(shù)量較多時(shí)，實(shí)際錯(cuò)誤率可能高于目標(biāo)錯(cuò)誤率。

2.步驟法

步驟法是一種更精確的錯(cuò)誤率控制方法，它將整體拒絕域劃分為多個(gè)步驟，并在每個(gè)步驟中控制局部錯(cuò)誤率。其具體步驟如下：

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn)，確保其滿足單調(diào)性假設(shè)。

3.確定整體拒絕域的大小α。

4.將α均勻分配到每個(gè)步驟中，得到局部錯(cuò)誤率α*。

5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中，從左（?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。

6.在每個(gè)步驟中，計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。

7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值時(shí)，拒絕對(duì)應(yīng)的原假設(shè)；否則，接受原假設(shè)。

步驟法控制錯(cuò)誤率的精確度更高，但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí)，步驟法的計(jì)算量可能成為一個(gè)限制因素。

3.威爾士（Wales）法

威爾士法是一種改進(jìn)的單步法，它通過(guò)調(diào)整臨界值來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下：

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn)，確保其滿足單調(diào)性假設(shè)。

3.計(jì)算整體拒絕域的臨界值。

4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中，從右（大）至左（小）依次檢驗(yàn)原假設(shè)。

5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值，且其相應(yīng)的局部拒絕域臨界值大于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的臨界值時(shí)，拒絕對(duì)應(yīng)的原假設(shè)；否則，接受原假設(shè)。

威爾士法在控制錯(cuò)誤率的精確度和計(jì)算量之間取得了較好的平衡，在實(shí)際應(yīng)用中廣泛使用。

4.霍姆（Holm）法

霍姆法是一種改進(jìn)的步驟法，它通過(guò)調(diào)整局部錯(cuò)誤率來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下：

1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。

2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn)，確保其滿足單調(diào)性假設(shè)。

3.確定整體拒絕域的大小α。

4.將α均勻分配到每個(gè)步驟中，得到局部錯(cuò)誤率α*。

5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中，從左（小）至右（大）依次檢驗(yàn)原假設(shè)。

6.在每個(gè)步驟中，計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。

7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值，且其相應(yīng)的整體拒絕域臨界值小于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的局部拒絕域臨界值時(shí)，拒絕對(duì)應(yīng)的原假設(shè)；否則，接受原假設(shè)。

霍姆法在控制錯(cuò)誤率的精確度上優(yōu)于威爾士法，但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí)，霍姆法的計(jì)算量可能成為一個(gè)限制因素。

5.西達(dá)克（Sidak）法

西達(dá)克法是一種非單步的錯(cuò)誤率控制方法，它通過(guò)使用總體檢驗(yàn)統(tǒng)計(jì)量來(lái)控制整體錯(cuò)誤率。其具體步驟如下：

1.計(jì)算檢驗(yàn)統(tǒng)計(jì)量合計(jì)統(tǒng)計(jì)量。

2.將合計(jì)統(tǒng)計(jì)量與臨界值進(jìn)行比較。

3.當(dāng)合計(jì)統(tǒng)計(jì)量超過(guò)臨界值時(shí)，拒絕所有的原假設(shè)；否則，接受所有的原假設(shè)。

西達(dá)克法簡(jiǎn)單易行，但其缺點(diǎn)是控制整體錯(cuò)誤率的精確度較低，在原假設(shè)數(shù)量較多時(shí)，實(shí)際錯(cuò)誤率可能遠(yuǎn)高于目標(biāo)錯(cuò)誤率。

選擇錯(cuò)誤率控制方式

在單調(diào)性控制下選擇錯(cuò)誤率控制方式時(shí)，需要考慮以下因素

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多重比較和決策單調(diào)性控制

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多重比較和決策單調(diào)性控制

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔