




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1/1多重比較和決策單調(diào)性控制第一部分多重比較問(wèn)題概述 2第二部分決策單調(diào)性控制原理 4第三部分謝菲檢驗(yàn)法 7第四部分Hochberg檢驗(yàn)法 10第五部分Holm檢驗(yàn)法 13第六部分多重比較的樣本量計(jì)算 16第七部分單調(diào)性控制下錯(cuò)誤率控制方式 20第八部分多重比較軟件工具 24
第一部分多重比較問(wèn)題概述多重比較問(wèn)題概述
引言
在統(tǒng)計(jì)推斷中,多重比較是涉及對(duì)多個(gè)假設(shè)進(jìn)行推斷的常見(jiàn)問(wèn)題。當(dāng)研究人員同時(shí)測(cè)試多個(gè)假設(shè)時(shí),出現(xiàn)錯(cuò)誤拒絕真實(shí)零假設(shè)(即第一類錯(cuò)誤)的風(fēng)險(xiǎn)會(huì)增加。多重比較問(wèn)題由此產(chǎn)生,目的是控制這種風(fēng)險(xiǎn)并確保推斷結(jié)果的有效性。
多重比較的種類
根據(jù)比較的數(shù)量和假設(shè)的類型,可以對(duì)多重比較問(wèn)題進(jìn)行分類:
*成對(duì)比較:比較兩個(gè)假設(shè)之間的差異。
*全局比較:比較多個(gè)假設(shè)之間的差異,而無(wú)需指定成對(duì)比較。
*計(jì)劃比較:在數(shù)據(jù)收集之前指定要進(jìn)行的特定比較,通?;陬A(yù)先存在的假設(shè)或理論。
*事后比較:在數(shù)據(jù)收集之后進(jìn)行的比較,通常是為了探索性目的。
類型I錯(cuò)誤的累積
當(dāng)同時(shí)進(jìn)行多個(gè)假設(shè)檢驗(yàn)時(shí),第一類錯(cuò)誤(拒絕真實(shí)零假設(shè))發(fā)生的概率會(huì)累積。例如,如果在0.05的顯著性水平下進(jìn)行10個(gè)獨(dú)立的比較,則至少進(jìn)行一次錯(cuò)誤拒絕的概率為1-(1-0.05)^10≈0.40。這意味著在給定的10個(gè)比較中,大約有40%的可能性出現(xiàn)誤報(bào)。
控制類型I錯(cuò)誤率
為了控制多重比較中的類型I錯(cuò)誤率,開(kāi)發(fā)了多種方法。這些方法旨在限制在所有進(jìn)行的比較中錯(cuò)誤拒絕真實(shí)零假設(shè)的概率,同時(shí)仍然保留檢驗(yàn)假設(shè)的能力。
多重比較調(diào)整方法
常用的多重比較調(diào)整方法包括:
*鮑弗尼法:一種通用的調(diào)整方法,用于任何數(shù)量的比較。
*圖基法:一種成對(duì)比較的調(diào)整方法,控制所有可能成對(duì)比較的類型I錯(cuò)誤率。
*謝弗法:一種計(jì)劃比較的調(diào)整方法,僅控制預(yù)先指定的比較的類型I錯(cuò)誤率。
*霍姆-邦弗羅尼法:一種全局比較的調(diào)整方法,控制所有比較的共同類型I錯(cuò)誤率。
決策單調(diào)性
決策單調(diào)性是多重比較中一個(gè)重要的概念,它表明調(diào)整方法保持了比較結(jié)果的順序。換句話說(shuō),如果在未調(diào)整的情況下,某個(gè)假設(shè)的顯著性水平低于另一個(gè)假設(shè),則假設(shè)的順序在調(diào)整后仍然保持不變。
重要性
多重比較和決策單調(diào)性控制對(duì)于統(tǒng)計(jì)推斷非常重要,因?yàn)樗?/p>
*防止過(guò)度自信地拒絕真實(shí)零假設(shè)。
*確保統(tǒng)計(jì)結(jié)果的可靠性和有效性。
*允許研究人員在控制錯(cuò)誤拒絕風(fēng)險(xiǎn)的同時(shí)進(jìn)行多項(xiàng)比較。
*提供了選擇最適當(dāng)?shù)亩嘀乇容^調(diào)整方法的指南,以滿足研究目標(biāo)。
結(jié)論
多重比較問(wèn)題是統(tǒng)計(jì)推斷中必須解決的基本問(wèn)題。通過(guò)實(shí)施多重比較調(diào)整方法和考慮決策單調(diào)性,研究人員可以提高推斷的準(zhǔn)確性和可信度。這在解釋研究結(jié)果和做出基于證據(jù)的決策時(shí)至關(guān)重要。第二部分決策單調(diào)性控制原理關(guān)鍵詞關(guān)鍵要點(diǎn)【多重比較和決策單調(diào)性控制原理】
【決策單調(diào)性控制原理】
1.單調(diào)性:決策函數(shù)對(duì)自變量單調(diào)變化,即自變量增加或減小,決策結(jié)果也會(huì)相應(yīng)增加或減小。
2.前綴單調(diào)性:決策函數(shù)對(duì)某些自變量的順序不變,即自變量的前綴改變不會(huì)影響決策結(jié)果。
3.后綴單調(diào)性:決策函數(shù)對(duì)某些自變量的順序不變,即自變量的后綴改變不會(huì)影響決策結(jié)果。
單調(diào)性與決策
1.單調(diào)決策:滿足單調(diào)性的決策函數(shù),能夠確保在自變量增加或減小時(shí),決策結(jié)果也隨之增加或減小,從而保證了決策的一致性和可預(yù)測(cè)性。
2.單調(diào)約束:在某些情況下,決策函數(shù)需要滿足單調(diào)性約束,以確保決策結(jié)果符合特定規(guī)則或道德準(zhǔn)則。
3.單調(diào)優(yōu)化:利用單調(diào)性原理,可以設(shè)計(jì)高效的優(yōu)化算法,在約束條件下搜索滿足單調(diào)性條件的最佳決策。
前綴單調(diào)性與決策
1.前綴無(wú)關(guān)決策:對(duì)于滿足前綴單調(diào)性的決策函數(shù),自變量的前綴部分不會(huì)影響決策結(jié)果,這使得決策過(guò)程可以簡(jiǎn)化和分解。
2.分步?jīng)Q策:前綴單調(diào)性原理可以用于設(shè)計(jì)分步?jīng)Q策算法,將復(fù)雜問(wèn)題分解成一系列較小的子問(wèn)題依次解決。
3.動(dòng)態(tài)規(guī)劃:前綴單調(diào)性是動(dòng)態(tài)規(guī)劃算法的基礎(chǔ)之一,通過(guò)存儲(chǔ)子問(wèn)題的決策結(jié)果,可以高效地解決具有重疊子問(wèn)題的優(yōu)化問(wèn)題。
后綴單調(diào)性與決策
1.后綴無(wú)關(guān)決策:對(duì)于滿足后綴單調(diào)性的決策函數(shù),自變量的后綴部分不會(huì)影響決策結(jié)果,這使得決策過(guò)程可以從后向前進(jìn)行。
2.回溯決策:后綴單調(diào)性原理可以用于設(shè)計(jì)回溯決策算法,通過(guò)逐層回溯和剪枝,高效地搜索所有可能的決策組合。
3.近似算法:后綴單調(diào)性可以幫助設(shè)計(jì)近似算法,通過(guò)舍棄變量的后綴部分,構(gòu)造近似解并控制近似誤差。決策單調(diào)性控制原理
決策單調(diào)性控制原理是一種多重比較方法,用于控制多個(gè)統(tǒng)計(jì)檢驗(yàn)中的假陽(yáng)性率(即,錯(cuò)誤拒絕零假設(shè)的概率)。該原理基于這樣一個(gè)直觀的想法:如果一個(gè)給定的統(tǒng)計(jì)檢驗(yàn)對(duì)于一個(gè)特定的替代假設(shè)不顯著,那么對(duì)于該假設(shè)的所有更極端的替代假設(shè)也不應(yīng)該顯著。
原理表述
形式上,決策單調(diào)性控制原理規(guī)定:
*如果檢驗(yàn)統(tǒng)計(jì)量\(T_1\)對(duì)于假設(shè)\(H_1\)不顯著,則對(duì)于任何\(H_1\)的替代假設(shè)\(H_a(a\ge1)\),檢驗(yàn)統(tǒng)計(jì)量\(T_a\)也不應(yīng)顯著。
推論
決策單調(diào)性控制原理有兩個(gè)重要推論:
1.遞減檢驗(yàn)序貫:如果檢驗(yàn)對(duì)于一個(gè)假設(shè)不顯著,則對(duì)于所有其他更極端的假設(shè)也不應(yīng)顯著。
2.使用較低序數(shù)檢驗(yàn):如果一個(gè)更低序數(shù)的檢驗(yàn)(例如,卡方檢驗(yàn))對(duì)于一個(gè)假設(shè)不顯著,則更高序數(shù)的檢驗(yàn)(例如,t檢驗(yàn))也不應(yīng)顯著。
控制假陽(yáng)性率
決策單調(diào)性控制原理可以通過(guò)限制檢驗(yàn)的臨界值來(lái)控制假陽(yáng)性率。方法如下:
1.對(duì)于最極端的替代假設(shè)\(H_m\)計(jì)算臨界值\(c_m\)。
2.對(duì)于所有其他假設(shè)\(H_a(a<m)\),使用臨界值\(c_a=c_m\)進(jìn)行檢驗(yàn)。
這種方法確保對(duì)于所有替代假設(shè)的假陽(yáng)性率都等于或小于對(duì)于最極端假設(shè)的假陽(yáng)性率。
優(yōu)勢(shì)
與其他多重比較方法相比,決策單調(diào)性控制原理具有以下優(yōu)勢(shì):
*控制力更強(qiáng):它提供了對(duì)假陽(yáng)性率更嚴(yán)格的控制。
*更易于解釋:該原理基于一個(gè)直觀的概念,易于理解和解釋。
*不需要調(diào)整:它無(wú)需對(duì)檢驗(yàn)統(tǒng)計(jì)量進(jìn)行任何調(diào)整,從而簡(jiǎn)化了實(shí)現(xiàn)。
局限性
決策單調(diào)性控制原理也有一些局限性:
*可能過(guò)于保守:它可能會(huì)導(dǎo)致對(duì)于替代假設(shè)的檢測(cè)能力降低,尤其是在替代假設(shè)與零假設(shè)相差較小時(shí)。
*依賴于檢驗(yàn)統(tǒng)計(jì)量的單調(diào)性:該原理僅適用于檢驗(yàn)統(tǒng)計(jì)量隨著替代假設(shè)的極端性單調(diào)增加或減少的情況。
應(yīng)用
決策單調(diào)性控制原理廣泛應(yīng)用于多個(gè)統(tǒng)計(jì)領(lǐng)域,包括:
*多重假設(shè)檢驗(yàn)
*比較組間差異
*探索性數(shù)據(jù)分析
*回歸分析
舉例
假設(shè)我們進(jìn)行三個(gè)組之間的卡方檢驗(yàn)。假設(shè)\(T_1\)是組1和組2之間的檢驗(yàn)統(tǒng)計(jì)量,\(T_2\)是組1和組3之間的檢驗(yàn)統(tǒng)計(jì)量。如果\(T_1\)不顯著,則根據(jù)決策單調(diào)性控制原理,\(T_2\)也不應(yīng)顯著。這意味著,如果組1和組2之間沒(méi)有顯著差異,則組1和組3之間也不應(yīng)有顯著差異。第三部分謝菲檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【謝菲檢驗(yàn)法】
1.謝菲檢驗(yàn)法是一種多重比較方法,用于控制家族錯(cuò)誤率(FWER)。
2.其原理是將多個(gè)假設(shè)檢驗(yàn)按p值大小順序排列,僅拒絕p值低于某個(gè)臨界值的假設(shè)。
3.臨界值由FWER和所檢驗(yàn)假設(shè)的個(gè)數(shù)決定。
【單步程序】
謝菲檢驗(yàn)法
引言
多重比較問(wèn)題是指在統(tǒng)計(jì)推論中,對(duì)多個(gè)假設(shè)同時(shí)進(jìn)行檢驗(yàn)的情況。為了控制錯(cuò)誤發(fā)現(xiàn)率和保證假設(shè)檢驗(yàn)的有效性,需要采用多重比較方法。謝菲檢驗(yàn)法是一種常用的多重比較方法,因其簡(jiǎn)單易用性和保守性而被廣泛應(yīng)用。
檢驗(yàn)步驟
謝菲檢驗(yàn)法的具體步驟如下:
1.計(jì)算P值:分別計(jì)算每個(gè)假設(shè)的P值。
2.排序P值:將P值從最小到最大排序。
3.確定臨界值:根據(jù)預(yù)設(shè)的顯著性水平α和檢驗(yàn)的假設(shè)數(shù)量k,計(jì)算臨界值:
```
c=α/(2*k)
```
4.與臨界值比較:依次將排序后的P值與臨界值c進(jìn)行比較。如果某P值小于c,則拒絕對(duì)應(yīng)的假設(shè);否則,接受該假設(shè)。
性質(zhì)和特點(diǎn)
謝菲檢驗(yàn)法具有以下性質(zhì)和特點(diǎn):
*強(qiáng)控制性:謝菲檢驗(yàn)法嚴(yán)格控制了總體第I類錯(cuò)誤率在α以下。也就是說(shuō),它保證了在所有可能的檢驗(yàn)情景中,錯(cuò)誤地拒絕真假設(shè)的概率不會(huì)超過(guò)α。
*保守性:謝菲檢驗(yàn)法通常被認(rèn)為過(guò)于保守,因?yàn)樗鶗?huì)拒絕一些實(shí)際存在的差異。這種保守性是由檢驗(yàn)的強(qiáng)控制性造成的。
*簡(jiǎn)單易用:謝菲檢驗(yàn)法是多重比較方法中最簡(jiǎn)單易用的方法之一。其步驟清晰明確,無(wú)需復(fù)雜的計(jì)算或軟件支持。
*適用性:謝菲檢驗(yàn)法適用于各種多重比較情景,包括成對(duì)比較、總體比較和多個(gè)處理組之間的比較。
應(yīng)用場(chǎng)景
謝菲檢驗(yàn)法廣泛應(yīng)用于以下場(chǎng)景:
*生物醫(yī)學(xué)研究:比較多個(gè)治療組的效果或生物標(biāo)記物的差異。
*社會(huì)科學(xué)研究:比較多個(gè)群體之間的平均值或比例。
*工業(yè)和制造:比較多個(gè)產(chǎn)品的質(zhì)量或性能。
*金融和經(jīng)濟(jì)學(xué):比較多個(gè)投資組合的收益或風(fēng)險(xiǎn)。
優(yōu)缺點(diǎn)
優(yōu)點(diǎn):
*強(qiáng)控制性
*簡(jiǎn)單易用
*適用于各種場(chǎng)景
缺點(diǎn):
*保守性較高
*忽略了假設(shè)之間的相關(guān)性
*不能控制每個(gè)假設(shè)的錯(cuò)誤率
與其他方法的比較
與其他多重比較方法(如Tukey檢驗(yàn)法和Bonferroni檢驗(yàn)法)相比,謝菲檢驗(yàn)法的優(yōu)勢(shì)在于其簡(jiǎn)單性和強(qiáng)控制性。然而,其保守性較高,這可能導(dǎo)致一些實(shí)際存在的差異未能被檢測(cè)到。因此,在選擇多重比較方法時(shí),需要根據(jù)具體的研究目標(biāo)和假設(shè)之間的相關(guān)性進(jìn)行權(quán)衡。
結(jié)論
謝菲檢驗(yàn)法是一種常用的多重比較方法,以其簡(jiǎn)單易用和強(qiáng)控制性而著稱。它適用于各種多重比較情景,但其保守性較高,忽略了假設(shè)之間的相關(guān)性。在選擇多重比較方法時(shí),應(yīng)根據(jù)研究目標(biāo)和假設(shè)的性質(zhì)進(jìn)行綜合考慮。第四部分Hochberg檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)Hochberg檢驗(yàn)法
1.逐級(jí)檢驗(yàn)程序:Hochberg檢驗(yàn)法采用逐級(jí)檢驗(yàn)程序,從具有最小p值的假設(shè)檢驗(yàn)開(kāi)始檢驗(yàn),如果假設(shè)檢驗(yàn)不顯著,則停止檢驗(yàn);如果假設(shè)檢驗(yàn)顯著,則繼續(xù)檢驗(yàn)下一個(gè)具有次小p值的假設(shè)檢驗(yàn)。
2.嚴(yán)格控制整體錯(cuò)誤率:該檢驗(yàn)法保證了對(duì)預(yù)先指定的整體錯(cuò)誤率(FWER)進(jìn)行嚴(yán)格控制,即使對(duì)多個(gè)假設(shè)進(jìn)行多重比較,也能控制錯(cuò)誤率不超過(guò)FWER。
3.基于封鎖的比較:Hochberg檢驗(yàn)法將假設(shè)檢驗(yàn)劃分為多個(gè)封鎖,每個(gè)封鎖包含具有類似p值的假設(shè)檢驗(yàn)。在每個(gè)封鎖內(nèi),僅檢驗(yàn)具有最小p值的假設(shè)檢驗(yàn),從而減少了比較次數(shù)。
Hochberg檢驗(yàn)法的優(yōu)點(diǎn)
1.控制錯(cuò)誤率嚴(yán)格:Hochberg檢驗(yàn)法對(duì)整體錯(cuò)誤率的控制非常嚴(yán)格,即使進(jìn)行多次比較,也能保證FWER不超過(guò)預(yù)先設(shè)定的水平。
2.計(jì)算簡(jiǎn)單:該檢驗(yàn)法易于理解和實(shí)施,計(jì)算過(guò)程相對(duì)簡(jiǎn)單,不需要復(fù)雜的公式或軟件。
3.適用于不同類型的數(shù)據(jù):Hochberg檢驗(yàn)法適用于連續(xù)和離散變量,可以用于各種類型的多元數(shù)據(jù)分析。
Hochberg檢驗(yàn)法的缺點(diǎn)
1.檢驗(yàn)順序影響:檢驗(yàn)的順序可能會(huì)影響Hochberg檢驗(yàn)法的結(jié)果,因此需要仔細(xì)考慮假設(shè)檢驗(yàn)的順序。
2.比較次數(shù)限制:該檢驗(yàn)法需要限制比較次數(shù),以保持嚴(yán)格的錯(cuò)誤率控制,這可能會(huì)影響對(duì)所有假設(shè)檢驗(yàn)的全面評(píng)估。
3.靈活性較低:Hochberg檢驗(yàn)法缺乏靈活性,不能對(duì)不同的假設(shè)檢驗(yàn)施加不同的重要性權(quán)重?;艉詹駲z驗(yàn)法
在多重比較中,控制總體意義水平(FWER)是一種常見(jiàn)的策略,它可以保證在所有可能比較中,至少有一個(gè)真正的差異被錯(cuò)誤地聲明為顯著的可能性不超過(guò)預(yù)先設(shè)定的α值?;艉詹駲z驗(yàn)法是一種步驟化的多重比較方法,用于控制FWER。
原理
霍赫伯格檢驗(yàn)法基于秩變換原理,即根據(jù)變量的秩值,將多個(gè)比較轉(zhuǎn)化為一個(gè)針對(duì)總體秩序的單一比較。具體步驟如下:
1.計(jì)算秩值:對(duì)于每個(gè)比較,計(jì)算組內(nèi)觀測(cè)值的秩值。
2.確定最小秩值:找到所有比較中的最小秩值。
3.應(yīng)用臨界值:使用最小秩值和預(yù)先設(shè)定的α值,查表或計(jì)算出臨界值。
4.比較秩值與臨界值:如果最小秩值大于或等于臨界值,則拒絕所有比較中的零假設(shè)(即聲明至少存在一個(gè)顯著差異)。
步驟
具體實(shí)施霍赫伯格檢驗(yàn)法的步驟如下:
1.計(jì)算秩值:對(duì)于每個(gè)比較,將兩組數(shù)據(jù)中的觀測(cè)值合并,并根據(jù)其值從小到大排序。為每個(gè)觀測(cè)值分配一個(gè)秩值,最小的觀測(cè)值分配為1,最大的觀測(cè)值分配為n(n為所有觀測(cè)值的總數(shù))。
2.確定最小秩值:找到所有比較中秩值最小的觀測(cè)值。
3.查表或計(jì)算臨界值:使用最小秩值和預(yù)先設(shè)定的α值,查表或計(jì)算臨界值。臨界值的表通??梢栽诮y(tǒng)計(jì)軟件或在線資源中找到。
4.比較秩值與臨界值:如果最小秩值大于或等于臨界值,則拒絕所有比較中的零假設(shè)。否則,接受所有零假設(shè)(即聲明不存在顯著差異)。
舉例
假設(shè)我們有以下三個(gè)比較:
*比較1:組A與組B
*比較2:組A與組C
*比較3:組B與組C
秩值如下:
|組|觀測(cè)值|秩值|
||||
|A|2|1|
|B|3|2|
|C|5|3|
|B|6|4|
|A|8|5|
|C|9|6|
最小秩值為1,α值為0.05。查表得到臨界值為3。由于最小秩值(1)小于臨界值(3),因此我們接受所有零假設(shè),即聲明所有比較中不存在顯著差異。
優(yōu)點(diǎn)
*FWER控制:霍赫伯格檢驗(yàn)法保證FWER不超過(guò)預(yù)先設(shè)定的α值。
*簡(jiǎn)單易行:該方法的實(shí)施相對(duì)簡(jiǎn)單,只需要計(jì)算秩值和查表或計(jì)算臨界值。
缺點(diǎn)
*秩變換:該方法依賴于秩變換,這可能會(huì)導(dǎo)致信息丟失。
*保守性:霍赫伯格檢驗(yàn)法可能過(guò)于保守,特別是當(dāng)比較數(shù)量較多時(shí)。
適用范圍
霍赫伯格檢驗(yàn)法適用于以下情況:
*獨(dú)立的比較
*數(shù)據(jù)滿足正態(tài)分布或秩變換假設(shè)
*需要控制FWER第五部分Holm檢驗(yàn)法關(guān)鍵詞關(guān)鍵要點(diǎn)【Holm檢驗(yàn)法】
1.Holm檢驗(yàn)法是進(jìn)行多重比較的一種方法,用于控制家庭誤差率(FWER),即所有比較的錯(cuò)誤拒絕率。它的基本原理是依次執(zhí)行一系列單邊檢驗(yàn),從拒絕最嚴(yán)格的零假設(shè)開(kāi)始。
2.具體的步驟如下:首先計(jì)算每一個(gè)零假設(shè)的p值,然后從最小的p值開(kāi)始,依次與預(yù)先設(shè)定的顯著性水平α比較。如果p值小于α,則拒絕相應(yīng)零假設(shè);否則,停止檢驗(yàn)。
3.Holm檢驗(yàn)法的優(yōu)點(diǎn)在于其對(duì)控制FWER提供了強(qiáng)有力的保證,且具有較高的統(tǒng)計(jì)功效。
【決策單調(diào)性控制】
Holm檢驗(yàn)法
Holm檢驗(yàn)法是一種逐步校正后的多重比較方法,用于在多重假設(shè)檢驗(yàn)中控制家族錯(cuò)誤率(FWER)。FWER是指犯下至少一個(gè)錯(cuò)誤的概率,該錯(cuò)誤概率在所有可能結(jié)果中取最大值。
步驟:
Holm檢驗(yàn)法包括以下步驟:
1.對(duì)檢驗(yàn)結(jié)果進(jìn)行排序:將p值從最小到最大排序。
2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平:對(duì)于p值p_i,計(jì)算其臨界alpha水平α_i=α/(m-i+1),其中α是預(yù)設(shè)的整體FWER,m是檢驗(yàn)的總次數(shù)。
3.逐個(gè)假設(shè)檢驗(yàn):從p值最小的假設(shè)檢驗(yàn)開(kāi)始,依次檢驗(yàn)每個(gè)假設(shè)。
4.拒絕假設(shè):如果p值≤α_i,則拒絕該假設(shè)。如果p值>α_i,則接受該假設(shè)。
5.終止檢驗(yàn):一旦遇到第一個(gè)未被拒絕的假設(shè),則停止檢驗(yàn)剩余的假設(shè)。
原理:
Holm檢驗(yàn)法基于以下原理:
*假設(shè)檢驗(yàn)的個(gè)數(shù)越多,犯錯(cuò)的可能性就越大。
*通過(guò)對(duì)p值進(jìn)行排序并使用逐個(gè)檢驗(yàn)的策略,該方法可以控制犯下至少一個(gè)錯(cuò)誤的概率。
優(yōu)點(diǎn):
*控制FWER,與Bonferroni檢驗(yàn)相比,在多個(gè)真陽(yáng)性假設(shè)的情況下具有更高的功效。
*直觀且易于實(shí)施。
缺點(diǎn):
*在多個(gè)假陽(yáng)性假設(shè)的情況下,功效可能較低。
*不能控制偽陽(yáng)性發(fā)生率(FPR)。
應(yīng)用:
Holm檢驗(yàn)法廣泛應(yīng)用于多種統(tǒng)計(jì)測(cè)試中,包括:
*多組均值比較
*相關(guān)性檢驗(yàn)
*卡方檢驗(yàn)
示例:
考慮以下示例,其中我們進(jìn)行三個(gè)假設(shè)檢驗(yàn):
*H0,1:μ1=μ2
*H0,2:μ1=μ3
*H0,3:μ2=μ3
我們使用Holm檢驗(yàn)法,α=0.05。
1.對(duì)p值進(jìn)行排序:假設(shè)p值分別為0.01、0.02、0.04。
2.確定對(duì)應(yīng)每個(gè)p值的臨界alpha水平:α1=0.05/(3-1+1)=0.025,α2=0.05/(3-2+1)=0.025,α3=0.05/(3-3+1)=0.05。
3.逐個(gè)假設(shè)檢驗(yàn):
*由于p1=0.01<α1=0.025,因此拒絕H0,1。
*由于p2=0.02<α2=0.025,因此拒絕H0,2。
*由于p3=0.04>α3=0.05,因此接受H0,3。
4.終止檢驗(yàn):由于第一個(gè)未被拒絕的假設(shè)是H0,3,因此我們停止檢驗(yàn)。
結(jié)論:
使用Holm檢驗(yàn)法,我們拒絕H0,1和H0,2,接受H0,3。這意味著我們有證據(jù)認(rèn)為μ1與μ2不同,μ1與μ3不同,而μ2與μ3沒(méi)有差異。第六部分多重比較的樣本量計(jì)算關(guān)鍵詞關(guān)鍵要點(diǎn)主題名稱:樣本量計(jì)算的原則
1.multiplecomparisons(MC)檢驗(yàn)控制的是家庭錯(cuò)誤率(FWER)或錯(cuò)誤發(fā)現(xiàn)率(FDR)。
2.樣本量計(jì)算的目標(biāo)是確保MC檢驗(yàn)達(dá)到預(yù)定的統(tǒng)計(jì)功效。
3.樣本量計(jì)算方法依賴于MC檢驗(yàn)的類型、顯著性水平、功效水平、組數(shù)和組內(nèi)效應(yīng)大小。
主題名稱:連續(xù)性檢驗(yàn)的樣本量計(jì)算
多重比較的樣本量計(jì)算
在多重比較中,確定適當(dāng)?shù)臉颖玖繉?duì)于確保統(tǒng)計(jì)檢驗(yàn)的有效性和控制錯(cuò)誤率至關(guān)重要。以下介紹了用于計(jì)算樣本量的方法:
1.統(tǒng)計(jì)功效
統(tǒng)計(jì)功效(又稱檢驗(yàn)效能)表示檢測(cè)到真拒絕假設(shè)或拒絕真零假設(shè)的概率。對(duì)于多重比較,功效是指檢測(cè)到至少一個(gè)對(duì)照組與對(duì)照組之間存在統(tǒng)計(jì)學(xué)差異的概率。
2.控制錯(cuò)誤率
錯(cuò)誤率與多重比較的類型相關(guān):
*家族錯(cuò)誤率(FWER):在所有測(cè)試中犯I類錯(cuò)誤(錯(cuò)誤拒絕零假設(shè))的概率。
*局部錯(cuò)誤率(LER):對(duì)于任何特定的比較,犯I類錯(cuò)誤的概率。
*控制假陽(yáng)性率(FPR):期望假陽(yáng)性測(cè)試數(shù)量的概率。
3.假設(shè)檢驗(yàn)類型
*單側(cè)檢驗(yàn):假設(shè)處理組的平均值大于(或小于)對(duì)照組。
*雙側(cè)檢驗(yàn):假設(shè)處理組的平均值與對(duì)照組不同。
4.檢驗(yàn)方法
*總體均值比較:Studentt檢驗(yàn)、方差分析(ANOVA)
*比例比較:卡方檢驗(yàn)、Fisher精確檢驗(yàn)
*生存時(shí)間比較:對(duì)數(shù)秩檢驗(yàn)、Cox回歸
樣本量計(jì)算公式
根據(jù)所選的假設(shè)檢驗(yàn)類型、檢驗(yàn)方法、錯(cuò)誤率和功效值,可以使用以下公式計(jì)算樣本量:
1.單側(cè)t檢驗(yàn)
```
n=(t_α/2+t_β)^2*(σ^2/(μ_1-μ_0)^2)
```
其中:
*n:每個(gè)組所需的樣本量
*t_α/2:α/2水平的臨界值
*t_β:β水平的臨界值
*σ^2:總體方差
*μ_1:處理組均值
*μ_0:對(duì)照組均值
2.雙側(cè)t檢驗(yàn)
```
n=(t_α+t_β)^2*(σ^2/(μ_1-μ_0)^2)
```
其中:
*t_α:α水平的臨界值
3.變異數(shù)分析(ANOVA)
```
n=(F_α/2+F_β)^2*(σ^2/(μ_1-μ_0)^2)*(k-1)
```
其中:
*k:組數(shù)
*F_α/2:α/2水平的F分布臨界值
*F_β:β水平的F分布臨界值
4.卡方檢驗(yàn)
```
n=((z_α/2+z_β)^2*p_0*(1-p_0))/((p_1-p_0)^2)
```
其中:
*z_α/2:α/2水平的z分布臨界值
*z_β:β水平的z分布臨界值
*p_0:對(duì)照組的比例
*p_1:處理組的比例
5.Fisher精確檢驗(yàn)
```
n=(2*(z_α/2+z_β)^2*(p_0*(1-p_0)*p_1*(1-p_1)))/((p_1-p_0)^2)
```
6.對(duì)數(shù)秩檢驗(yàn)
```
n=(z_α/2+z_β)^2*(n_1+n_2)*((p_1-p_0)^2)
```
其中:
*n_1:處理組的樣本量
*n_2:對(duì)照組的樣本量
7.Cox回歸
```
n=(exp(B_α/2+B_β)-1)^2*(V/(exp(HR)-1)^2)
```
其中:
*B_α/2:α/2水平的Wald統(tǒng)計(jì)量的臨界值
*B_β:β水平的Wald統(tǒng)計(jì)量的臨界值
*V:協(xié)變量方差-協(xié)方差矩陣
*HR:風(fēng)險(xiǎn)比
注意事項(xiàng)
*這些公式基于正態(tài)分布或二項(xiàng)式分布的假設(shè)。
*對(duì)于非正態(tài)分布或離散數(shù)據(jù),應(yīng)使用非參數(shù)檢驗(yàn)方法。
*應(yīng)使用適當(dāng)?shù)姆椒▉?lái)調(diào)整多重比較,例如Bonferroni校正或Holm-Sidak校正。
*樣本量計(jì)算可能需要假設(shè)參數(shù),例如總體方差或差異大小。如果這些參數(shù)未知,則可以估計(jì)值或使用保守估計(jì)值。第七部分單調(diào)性控制下錯(cuò)誤率控制方式關(guān)鍵詞關(guān)鍵要點(diǎn)【單調(diào)性控制下錯(cuò)誤率控制方式】
【單步過(guò)程控制】
1.保證錯(cuò)誤率在每個(gè)步驟中都得到控制,即步進(jìn)式的錯(cuò)誤率控制。
2.適用于單調(diào)性函數(shù),即測(cè)試統(tǒng)計(jì)量隨著假設(shè)的偏差增大而增大。
3.要求對(duì)檢驗(yàn)統(tǒng)計(jì)量和零假設(shè)下對(duì)應(yīng)的分布有充分的了解。
【整體過(guò)程控制】
單調(diào)性控制下錯(cuò)誤率控制方式
在多重比較中,當(dāng)原假設(shè)順序單調(diào)時(shí)(如序貫全排序問(wèn)題),可以利用單調(diào)性來(lái)控制錯(cuò)誤率。單調(diào)性控制下錯(cuò)誤率控制方式主要有以下幾種:
1.單步法
單步法是一種簡(jiǎn)單的錯(cuò)誤率控制方法,它根據(jù)檢驗(yàn)統(tǒng)計(jì)量在整體拒絕域的相對(duì)位置來(lái)確定被拒絕的原假設(shè)。其具體步驟如下:
1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。
2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。
3.計(jì)算整體拒絕域的臨界值。
4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。
5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。
單步法簡(jiǎn)單易行,但其缺點(diǎn)是控制錯(cuò)誤率的精確度較低,在原假設(shè)數(shù)量較多時(shí),實(shí)際錯(cuò)誤率可能高于目標(biāo)錯(cuò)誤率。
2.步驟法
步驟法是一種更精確的錯(cuò)誤率控制方法,它將整體拒絕域劃分為多個(gè)步驟,并在每個(gè)步驟中控制局部錯(cuò)誤率。其具體步驟如下:
1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。
2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。
3.確定整體拒絕域的大小α。
4.將α均勻分配到每個(gè)步驟中,得到局部錯(cuò)誤率α*。
5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(?。┲劣遥ù螅┮来螜z驗(yàn)原假設(shè)。
6.在每個(gè)步驟中,計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。
7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。
步驟法控制錯(cuò)誤率的精確度更高,但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí),步驟法的計(jì)算量可能成為一個(gè)限制因素。
3.威爾士(Wales)法
威爾士法是一種改進(jìn)的單步法,它通過(guò)調(diào)整臨界值來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下:
1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。
2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。
3.計(jì)算整體拒絕域的臨界值。
4.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從右(大)至左(小)依次檢驗(yàn)原假設(shè)。
5.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)臨界值,且其相應(yīng)的局部拒絕域臨界值大于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。
威爾士法在控制錯(cuò)誤率的精確度和計(jì)算量之間取得了較好的平衡,在實(shí)際應(yīng)用中廣泛使用。
4.霍姆(Holm)法
霍姆法是一種改進(jìn)的步驟法,它通過(guò)調(diào)整局部錯(cuò)誤率來(lái)提高錯(cuò)誤率控制的精確度。其具體步驟如下:
1.將檢驗(yàn)統(tǒng)計(jì)量從小到大排序。
2.對(duì)排序后的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行單調(diào)性檢驗(yàn),確保其滿足單調(diào)性假設(shè)。
3.確定整體拒絕域的大小α。
4.將α均勻分配到每個(gè)步驟中,得到局部錯(cuò)誤率α*。
5.從排序后的檢驗(yàn)統(tǒng)計(jì)量中,從左(小)至右(大)依次檢驗(yàn)原假設(shè)。
6.在每個(gè)步驟中,計(jì)算對(duì)應(yīng)的局部拒絕域臨界值。
7.當(dāng)檢驗(yàn)統(tǒng)計(jì)量超過(guò)局部拒絕域臨界值,且其相應(yīng)的整體拒絕域臨界值小于前一個(gè)檢驗(yàn)統(tǒng)計(jì)量的局部拒絕域臨界值時(shí),拒絕對(duì)應(yīng)的原假設(shè);否則,接受原假設(shè)。
霍姆法在控制錯(cuò)誤率的精確度上優(yōu)于威爾士法,但其計(jì)算量也更大。在原假設(shè)數(shù)量較多時(shí),霍姆法的計(jì)算量可能成為一個(gè)限制因素。
5.西達(dá)克(Sidak)法
西達(dá)克法是一種非單步的錯(cuò)誤率控制方法,它通過(guò)使用總體檢驗(yàn)統(tǒng)計(jì)量來(lái)控制整體錯(cuò)誤率。其具體步驟如下:
1.計(jì)算檢驗(yàn)統(tǒng)計(jì)量合計(jì)統(tǒng)計(jì)量。
2.將合計(jì)統(tǒng)計(jì)量與臨界值進(jìn)行比較。
3.當(dāng)合計(jì)統(tǒng)計(jì)量超過(guò)臨界值時(shí),拒絕所有的原假設(shè);否則,接受所有的原假設(shè)。
西達(dá)克法簡(jiǎn)單易行,但其缺點(diǎn)是控制整體錯(cuò)誤率的精確度較低,在原假設(shè)數(shù)量較多時(shí),實(shí)際錯(cuò)誤率可能遠(yuǎn)高于目標(biāo)錯(cuò)誤率。
選擇錯(cuò)誤率控制方式
在單調(diào)性控制下選擇錯(cuò)誤率控制方式時(shí),需要考慮以下因素
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 投資理財(cái)服務(wù)合同范文
- 常年法律顧問(wèn)合同細(xì)則
- 購(gòu)房合同定金簡(jiǎn)易協(xié)議
- 江西豐城勞動(dòng)合同范本
- 智能通風(fēng)電器具產(chǎn)業(yè)發(fā)展挑戰(zhàn)與對(duì)策考核試卷
- 機(jī)織服裝生產(chǎn)中的生產(chǎn)流程標(biāo)準(zhǔn)化考核試卷
- 塑料加工中的耐沖擊與抗跌落技術(shù)考核試卷
- 期貨市場(chǎng)投資者行為分析服務(wù)考核試卷
- 抽紗刺繡工藝的數(shù)字化營(yíng)銷策略考核試卷
- 基于云計(jì)算的智能制造服務(wù)考核試卷
- 智慧教育與個(gè)性化學(xué)習(xí)理論與實(shí)踐研究
- 全國(guó)高中教師數(shù)學(xué)優(yōu)質(zhì)課比賽一等獎(jiǎng)《基本不等式》課件
- Mob研究院識(shí)具-2024年文創(chuàng)行業(yè)報(bào)告
- 房地產(chǎn)估價(jià)方法-比較法及其運(yùn)用
- “德能勤績(jī)廉”考核測(cè)評(píng)表
- 新概念英語(yǔ)青少版入門 A-Unit-1課件(共37張)
- 陜西各市(精確到縣區(qū))地圖PPT課件(可編輯版)
- 酒店住宿水單標(biāo)準(zhǔn)模板
- 尺寸鏈的計(jì)算表格
- 夏玉米套種辣椒技術(shù)
- 學(xué)術(shù)規(guī)范與寫(xiě)作課件
評(píng)論
0/150
提交評(píng)論