數(shù)學(xué)方差分析_第1頁
數(shù)學(xué)方差分析_第2頁
數(shù)學(xué)方差分析_第3頁
數(shù)學(xué)方差分析_第4頁
數(shù)學(xué)方差分析_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、方差分析analysis of variance 一方差分析的意義1.意義H0:1=2=3可靠度成為 (1-0.05)3=0.857H0:1=2=3=4四均數(shù)比較作6次 (1-0.05)6=0.735五均數(shù)比較作10次 (1-0.05)10=0.599六均數(shù)比較作15次 (1-0.05)15=0.463鑒于以上的原因,對(duì)多組均數(shù)的比較問題我們采用方差分析(analysis of variance),簡(jiǎn)稱ANOVA。方差分析采用F檢驗(yàn)統(tǒng)計(jì)量,也稱F檢驗(yàn)。2優(yōu)點(diǎn) 不受比較的組數(shù)限制。 可同時(shí)分析多個(gè)因素的作用。 可分析因素間的交互作用。3應(yīng)用條件 各樣本是相互獨(dú)立的隨機(jī)樣本 各樣本來自正態(tài)總體 各

2、組總體方差相等,即方差齊二成組設(shè)計(jì)的多個(gè)樣本均數(shù)比較1基本思想先講述幾個(gè)記號(hào):xij表示第i組第j個(gè)樣本觀察值, 表示第i組的均數(shù)(= ), 表示總平均(= )例1 某克山病區(qū)測(cè)得11例克山病患者與13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同?患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.8724名患者與健康人的血磷值大小不等,稱這種變異為總變異。

3、可以用總離均差平方和 SST= 及N來反映,總自由度 T=N-1。2個(gè)組各組內(nèi)部血磷值也不等,這種變異稱為組內(nèi)變異,其大小可用2組組內(nèi)離均差平方和及各組例數(shù)ni來反映,自由度E=N-k(k是組數(shù)),它反映了隨機(jī)誤差。2組樣本均數(shù)也不等,這種變異稱為組間變異,反映了克山病對(duì)血磷值的影響和隨機(jī)誤差2三者關(guān)系SST=SSA+SSET=A+E3直觀意義檢驗(yàn)統(tǒng)計(jì)量 F統(tǒng)計(jì)量具2個(gè)自由度: 1, 2如果兩組樣本來自同一總體,即克山病患者與健康人血磷值相同,則理論上F應(yīng)等于1,因?yàn)閮煞N變異都只反映隨機(jī)誤差。由于抽樣誤差的影響,F(xiàn)值未必是1,但應(yīng)在1附近。若F較小,我們斷定2組均數(shù)相同,或者說來自同一總體,F(xiàn)

4、較大,推斷不是來自同一總體。例2 某社區(qū)隨機(jī)抽取了30名糖尿病患者、IGT異常和正常人進(jìn)行載脂蛋白(mg/dL)測(cè)定,結(jié)果如下,問三種人的載脂蛋白有無差別?85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合計(jì)xij1160921.512283309.5(x)ni1191030(N)均數(shù)105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xi

5、j2123509.5296045.35153420372974.87(x2)85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.95.3110.0123.0110.095.2127.0100.099.0121.0125.6120.0159.0111.0115.0合計(jì)xij1160921.512283309.5(x)ni1191030(N)均數(shù)105.45102.39122.80110.32()糖尿病IGT正常人xij106.5xij2123509.5296045.35153420372974.87(x2)所有

6、人的載脂蛋白的變異可分解為兩部分:組內(nèi)變異,反映載脂蛋白測(cè)定值的隨機(jī)誤差和個(gè)體差異; 組間變異,反映隨機(jī)誤差和不同的生理病理狀態(tài)對(duì)載脂蛋白的影響。(1) 建立假設(shè)和確定檢驗(yàn)水平H0: 三種人載脂蛋白的總體均數(shù)相等, 1=2=3H1: 三組總體均數(shù)不相等=0.05(2)計(jì)算C=(x) 2/N=(3309.5) 2/30=365093SST=x2-C=372974.87-365093=7881.87SSE=SST-SSA=7881.87-2384.026=5497.84T=N-1=29 A=k-1=2 E=N-k=30-3=27 MSA=SSA/A =1192.01 MSE=SSE/E =203.

7、62F=MSA/MSE=5.8540得到方差分析表,查表確定P值:(3) 作出推斷結(jié)論按=0.05水平拒絕H0,接受H1,認(rèn)為三種人載脂蛋白的總體均數(shù)不同。三隨機(jī)區(qū)組設(shè)計(jì)的方差分析隨機(jī)區(qū)組設(shè)計(jì)又稱配伍組設(shè)計(jì)(Random Block Design)。起源:農(nóng)業(yè)在醫(yī)學(xué)研究中,也存在區(qū)組因素,比如動(dòng)物試驗(yàn)中動(dòng)物的窩別、年齡、性別、地區(qū)的差異等。例3 對(duì)小白鼠喂以A、B、C三種不同的營(yíng)養(yǎng)素,目的是了解不同營(yíng)養(yǎng)素增重的效果,采用隨機(jī)區(qū)組設(shè)計(jì)方法,以窩別作為劃分區(qū)組的特征,以消除遺傳因素對(duì)體重增長(zhǎng)的影響。現(xiàn)將同品系同體重的24只小白鼠分為8個(gè)區(qū)組,每個(gè)區(qū)組3只小白鼠。三周后體重增量結(jié)果(克)如下,問小白

8、鼠經(jīng)三種不同營(yíng)養(yǎng)素喂養(yǎng)后所增體重有無差別?本例的總變異中除了不同營(yíng)養(yǎng)素的變異(處理差異)、隨機(jī)誤差外,還存在著區(qū)組之間的變異,是由小白鼠的遺傳特征不同所致。xij表示第i個(gè)處理組第j個(gè)區(qū)組樣本觀察值, 表示第i個(gè)處理組的均數(shù)(= ), 表示第j個(gè)區(qū)組的均數(shù)(= ), 表示總平均=SS總=SS處理+SS區(qū)組+SS誤差 =總=處理+區(qū)組+誤差 (T=A+B+E) 總=N-1=bk-1 處理=k-1 區(qū)組=b-1 誤差=(k-1)(b-1)(1) 建立假設(shè)和確定檢驗(yàn)水準(zhǔn)H0: 1=2=3H1: 三組總體均數(shù)不相等=0.05(2) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量C=(x)2/N=(1335.9)2/24=74359.

9、53SST=xij 2-C=2681.84 T=23(3)查表確定p值和作出推斷結(jié)論按=0.05水平不拒絕H0,認(rèn)為小白鼠經(jīng)三種不同營(yíng)養(yǎng)素喂養(yǎng)后所增體重?zé)o差別。注:作方差分析時(shí)同樣可以檢驗(yàn)區(qū)組效應(yīng),本例區(qū)組效應(yīng)顯著,即不同窩別的小白鼠的增重不全相等。要區(qū)別完全隨機(jī)化設(shè)計(jì)和隨機(jī)區(qū)組設(shè)計(jì)例 某湖水不同季節(jié)的氯化物含量測(cè)定值如下,問在不同季節(jié)該湖水中氯化物含量有無差別?某湖水中不同季節(jié)氯化物含量測(cè)定值(mg/L)春夏秋冬22.619.118.919.022.822.813.616.921.024.517.217.616.918.015.114.820.015.216.613.121.918.414.

10、216.921.520.116.716.221.221.219.614.8某湖水中不同季節(jié)氯化物含量測(cè)定值(mg/L)采樣點(diǎn)春夏秋冬122.619.118.919.0222.822.813.616.9321.024.517.217.6416.918.015.114.8520.015.216.613.1621.918.414.216.9721.520.116.716.2821.221.219.614.8方法不當(dāng)會(huì)影響統(tǒng)計(jì)結(jié)果例 某醫(yī)師為研究脾切除手術(shù)過程中門靜脈壓力kPa的變化,測(cè)得以下數(shù)據(jù),試作分析。脾切除手術(shù)中不同時(shí)期的門靜脈壓力kPa病例號(hào)切脾后賁門周圍斷流后胃底斷流后13.923.533

11、.5321.861.671.7733.923.924.2145.295.495.6853.533.243.9263.923.924.3173.534.214.3183.533.924.21結(jié)論:Analysis of Variance Procedure Sum of MeanSource DF Squares Square F Value Pr FGROUP 2 0.4281 0.2141 3.99 0.0425block 7 21.6556 3.0937 57.68 0.0001Error 14 0.7509 0.0536Corrected Total 23 22.8346Analysis

12、 of Variance Procedure Sum of MeanSource DF Squares Square F Value Pr FGROUP 2 0.4281 0.2141 0.20 0.8198Error 21 22.4065 1.0670Corrected Total 23 22.8346四.多個(gè)樣本均數(shù)間的兩兩比較(又稱多重比較)1多個(gè)樣本均數(shù)間每?jī)蓚€(gè)均數(shù)的比較適用于:在研究設(shè)計(jì)階段未預(yù)先考慮或未預(yù)料到,經(jīng)數(shù)據(jù)結(jié)果的提示后,才決定的多個(gè)均數(shù)間的兩兩比較,常見于探索性研究。常用方法是q檢驗(yàn)(又稱Student-Newman-Keuls法,簡(jiǎn)稱SNK法)檢驗(yàn)統(tǒng)計(jì)量 q檢驗(yàn)界值表見

13、表4,它有兩個(gè)自由度,一個(gè)是=E,另一個(gè)是a,a指將方差分析中的幾組樣本均數(shù)按從小到大順序排列后要比較的A、B兩組所包含的組數(shù)(包含A、B兩組本身)。例(續(xù)例3)對(duì)三個(gè)人群的載脂蛋白作兩兩比較。H0: 任2個(gè)人群的載脂蛋白的總體均數(shù)相等,即A=BH1: AB將3組樣本均數(shù)從小到大(或從大到?。╉樞蚺帕?,并編上組次組次 1 2 3均數(shù) 102.39 105.45 122.80組別 IGT異常 糖尿病患者 正常人 三組均數(shù)比較的q檢驗(yàn)從p值一欄中可以推斷出結(jié)論,即IGT異常與正常人的載脂蛋白有差別, 糖尿病患者與正常人的載脂蛋白有差別。2多個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)間的兩兩比較有是并不要將幾組均數(shù)都

14、一一作比較,而只須將對(duì)照組與幾個(gè)實(shí)驗(yàn)組作比較。常用的方法有:(1)最小顯著差數(shù)法(LSD法),側(cè)重于減少第二類錯(cuò)誤,此法精度較差,易把不該判斷為顯著的差異錯(cuò)判為顯著。例(續(xù)例2) IGT異常與糖尿病患者的比較H0:1=2 H1: 12 =0.05p0.05, 認(rèn)為二者無差別 IGT異常與正常人的比較H0:2=3 H1: 23 =0.05 =270.002p0.005, 認(rèn)為二者有差別(3)Dunnett-t檢驗(yàn)Dunnett-t檢驗(yàn)界值表見表5除了以上介紹的三種方法以外,還有:Duncan法、Scheffe法等等。五多個(gè)方差的齊性檢驗(yàn)方差分析中要求各總體的方差相等,所以在作方差分析前,應(yīng)作多個(gè)

15、方差的齊性檢驗(yàn),通常用Bartlett法,檢驗(yàn)統(tǒng)計(jì)量為:ni為各組樣本例數(shù),k為組數(shù) N=ni si2 為各組方差, sc2為合并方差?;舅枷耄杭僭O(shè)各總體方差相等,均等于合并方差(各組方差的加權(quán)平均),則各si2與sc2相差不會(huì)很大,出現(xiàn)大的x2值的概率P小, 若P,拒絕方差相等的假設(shè), P值可查 P208的x2界值表。方差不齊時(shí)不宜作方差分析,解決方法有:(1)變量變換,使方差齊 (2) 秩和檢驗(yàn) (3)近似F檢驗(yàn) 六變量變換 方差分析和t檢驗(yàn)要求:方差齊性、正態(tài)分布。有時(shí)并不能滿足,上節(jié)已介紹了3種不同的方法。通過變量變換來改變?cè)瓟?shù)據(jù)分布形式,使之滿足上述條件,經(jīng)過變換,雖然分布形式已改

16、變,但數(shù)據(jù)之間的相對(duì)關(guān)系仍保留,可以用變換后的數(shù)據(jù)作統(tǒng)計(jì)分析。1平方根變換 y= 適用于各組方差與其均數(shù)之間有某種比例關(guān)系的資料,尤其適用于總體呈Poisson分布的資料,如放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù)等表現(xiàn)為稀有現(xiàn)象的計(jì)數(shù)資料。2.對(duì)數(shù)變換 y=lg x適用于各組標(biāo)準(zhǔn)差與其均數(shù)之間有某種比例關(guān)系的資料,如研究動(dòng)物的體重等資料,尤其是關(guān)于生長(zhǎng)率的資料。當(dāng)數(shù)據(jù)中有0或較小值時(shí),也可y=lg(x+1)某實(shí)驗(yàn)室用三種不同抗原對(duì)惡性虐原蟲陽性患者間接熒光抗體的測(cè)定結(jié)果如下,問三種抗原測(cè)定結(jié)果之間的差別有無顯著性意義?A 1:160 1:160 1:320 1:320 1:640 1:640 1:640 1:640 1:640 1:1280B 1:80 1:160 1:160 1:160 1:160 1:320 1:320 1:320 1:320 1:640C 1:40 1:80 1:80 1:80 1:160 1:160 1:160 1:160 1:320 1:3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論