版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多變量統(tǒng)計描述均數(shù)向量與離差矩陣均數(shù)向量與離差矩陣協(xié)方差矩陣相關(guān)矩陣多元正態(tài)分布及檢驗 多元正態(tài)分布 在許多醫(yī)學問題中,當作均值的假設(shè)檢驗時所依據(jù)的指標可能不止一個。例如,當比較兩組風濕性與類風濕性關(guān)節(jié)炎患者的病情程度時,就不能僅只用一個指標,如采用血沉、抗“O”、白細胞計數(shù)三個指標,則數(shù)據(jù)呈下列格式: 編號血沉(X1) 抗“O”(X2) 白細胞數(shù)(X3)A123N1 B123N2 這三項指標都是測得值越高病情越重,如果采用t檢驗法對每個指標作檢驗,則只有出現(xiàn)下列情況之一時,才能作出明確判斷:1兩組間三指標均有差異,且大小趨勢一致。2兩組間各指標均無差別,且P較大于0.05。 反之,如果出現(xiàn)下
2、列情況之一,就難以得出結(jié)論:1兩組指標雖有顯著差別,但趨勢不一?;驘o顯著差別,但P接近0.05。2 兩組間有些指標有顯著差別,有些卻無顯著差別。 多元正態(tài)分布 定義 P維正態(tài)分布定義:對隨機變量X=(X1,X2,XP) 的密度函數(shù)是 稱之為多元正態(tài)分布,簡記為 下面以二維正態(tài)分布介紹 協(xié)方差陣與逆陣 樣本協(xié)方差陣與逆陣二維正態(tài)分布密度函數(shù)可寫成: 圖1: 兩個二元正態(tài)分布 多元正態(tài)分布的性質(zhì) 1有限個多元正態(tài)的線性組合為多元正態(tài)分布。2一個多元正態(tài)分布的所有子集分布有一個多元正態(tài)分布。3零協(xié)方差意味著相應的隨機變量是獨立的。4 分量的條件分布是正態(tài)分布。 多元正態(tài)性的判定 通常對多元正態(tài)分布的
3、判斷采用對邊緣分布的判斷,即:若對多元變量X而言它所有的一元分布都是正態(tài)分布的話,就認為X是多元正態(tài)分布,此時很少出現(xiàn)非正態(tài)的多元數(shù)據(jù)集。 多元正態(tài)均值檢驗 : 至少存在,使 : 統(tǒng)計量的構(gòu)造 組間協(xié)方差陣:組內(nèi)協(xié)方差陣:總協(xié)方差陣: 維爾克斯(Wilks)統(tǒng)計量(分布) 兩兩比較的統(tǒng)計量 一組資料(單樣本) 對于單變量且服從正態(tài)分布資料的樣本與總體的比較, 變形 當為多元資料時,此公式推廣為Hoteling 其中 為樣本均數(shù)向量, 為樣本協(xié)方差陣, 總體均數(shù)向量。當 成立時例1:如隨機抽取某單位5名有冠心病的成年男性,測量其甘油三脂(mmol/L),總膽固醇(mmol/L),和高密度脂蛋白膽
4、固醇(mmol/L)含量,已知某單位正常成年男性的甘油三脂、總膽固醇、和高密度脂蛋白膽固醇的均數(shù)是1.02 mmol/L、2.73 mmol/L和2.04mmol/L。問該單位冠心病成年男性的血脂與正常成年男性有無差別? 樣本號甘油三脂總膽固醇高密度脂蛋白膽固醇123451.780.670.560.660.210.830.960.831.120.16-1.01-0.84-0.39-1.03-0.40計算: 兩組比較 對于單變量且服從正態(tài)分布資料的兩樣本的比較變形 當為多元資料時,此公式推廣為Hoteling 其中 為樣本均數(shù)向量, 為樣本協(xié)方差陣, 為合并樣本協(xié)方差陣。 當 較大時,F(xiàn)近似服從
5、自由度為m的 分布。 編號實驗組編號對照組體重(kg)身長(cm)體重(kg)身長(cm)1234563.054.103.503.643.604.00505053505255789101112133.203.003.003.352.603.153.5550464547505052例2: 計算: SAS計算程序: proc glm;class gr; model y1 y2=gr;contrast gr1 vs gr2 gr 1 -1 0;contrast gr1 vs gr3 gr 1 0 -1;contrast gr2 vs gr3 gr 0 1 -1;anova h=gr;run;協(xié)方差分
6、析 以前介紹的方差分析可用于兩組或多組均數(shù)間的比較,其處理因素一般是可以控制的。方差分析要求各比較組除了所施加的處理因素不同外,其他對觀察指標有影響得因素齊同或均衡,即要求控制對觀察指標有影響的其它因素。在實際工作中,有時有些因素無法加以控制,或由于實驗設(shè)計的疏忽、實驗條件的限制等原因,造成對觀察指標有影響的個別因素未加控制或難以控制。此時用方差分析不合適,應考慮用協(xié)方差分析。 實例為研究三種飼料(A1,A2,A3)對豬催肥效果,用每種飼料喂養(yǎng)8頭豬,實驗用豬的初始體重未控制。喂養(yǎng)一段時間后觀察小豬的增重,所得資料如下表,試分析三種飼料對豬催肥效果是否相同。 三組小豬的初始體重與增重 (kg)
7、 A1 A2 A3 x1 y1 x2 y2 x3 y3 15 85 17 97 22 89 13 83 16 90 24 91 11 65 18 100 20 83 12 76 18 95 23 95 12 80 21 103 25 100 16 91 22 106 27 102 14 84 19 99 30 105 17 90 18 94 32 110 協(xié)方差分析中稱需比較的因素為因子稱影響觀察指標,需排除其影響的數(shù)量因素為協(xié)變量。 按方差分析的不同設(shè)計類型,相應地有不同的協(xié)方差分析,協(xié)變量也可是一個或多個。以下我們主要介紹最簡單的協(xié)方差分析,完全隨機設(shè)計且只有一個協(xié)變量的協(xié)方差分析。 基本
8、思想: 是將線性回歸與方差分析相結(jié)合的一種方法。將那些定量變量X(未加控制或難以控制的因素)對Y的影響看做協(xié)變量,建立應變量Y隨協(xié)變量X變化的線性回歸關(guān)系,并利用這種回歸關(guān)系把X值化為相等后,再進行各組Y修正均數(shù)間比較地假設(shè)檢驗,其實質(zhì)就是從Y的總離差平方和中扣除協(xié)變量X對Y的回歸平方和,對殘差平方和作進一步分解后在進行方差分析,以更好地評價各種處理的效應。 三種檢驗(1)檢驗飼料A與初始體重x間是否存在交互作用。、因為若兩者有交互作用,則意味著在x的不同取值下A對觀察值的作用不同,即可能對x的某些取值,A1的效果最好,而對x的另一些取值,A2的效果最好,因而撇開x談A的主效應無多大意義。相應
9、的檢驗假設(shè)是A與x的交互效應為0。 三種檢驗 (2)若A與x間無交互作用,則進一步檢驗初始體重x與增重y間是否存在線性關(guān)系。若不存在線性關(guān)系,則不能用協(xié)方差分析比較三組均數(shù)間的差別。因為協(xié)方差分析是利用協(xié)變量x與觀察指標y間的線性回歸扣除x對y的影響。相應的檢驗假設(shè)為x與y間的回歸系數(shù)為0。 三種檢驗(3)若x與y間存在線性關(guān)系,則進一步在扣除x對y影響的條件下,檢驗三組均數(shù)差別是否有顯著性。相應的檢驗假設(shè)為三個總體均數(shù)相等。 這三個檢驗中,第一、第二個檢驗不屬于協(xié)方差分析范圍,若已知因子A與協(xié)變量x無交互作用,則第一個檢驗可以不作,若已知x與y間有線性關(guān)系,則第二個檢驗也可不作,第三個檢驗真
10、正屬協(xié)方差分析范疇,是必不可少的。 (4)若三組均數(shù)差別有統(tǒng)計意義,則需進一步估計修正均數(shù)。所謂修正均數(shù),是指若三組的協(xié)變量相等(即扣除協(xié)變量影響后),相應的y的均數(shù)。修正均數(shù)Y的計算公式為: 其中:為第i組的修正均數(shù) 為第i組y的均數(shù) 為第i組x的均數(shù) x為所有x的總均數(shù) b為y與x的回歸系數(shù)模型 其中:;是y的總均數(shù); 描述因子A的第i水平的作用 描述協(xié)變量x與觀察變量y間關(guān)系的回歸系數(shù); 是誤差項,服從;總: 組內(nèi): 公共: 總變異: v=N-1總剩余誤差: v=N-2 組內(nèi)剩余誤差: (消除X的影響) v=N-2k公共剩余誤差: v=N-k-1修勻均數(shù): v=k-1SAS計算程序: p
11、roc glm;class gr;model inw=weight gr weight*gr /ss3;run;proc glm;class gr;model inw=weight gr / solution ss3;lsmeans gr /stderr pdiff;run;應用條件注意事項例1:某實驗鼠體重(g)與增加體重(g)的測定值見下表,問如何分析兩組增加體重是否有差異? ABC體重(g)增加體重(g)體重(g)增加體重(g)體重(g)增加體重(g)15.0013.0011.0012.0012.0016.0014.0017.0085.0078.0064.0080.0048.0072.0
12、085.0085.0017.0016.0018.0018.0021.0022.0019.0018.0090.0090.00100.0095.00103.00106.0069.0094.0022.0024.0020.0023.0025.0027.0030.0032.0089.0091.0092.0095.00100.00102.00105.00110.00例2:某地20歲男性運動員及大學生的身高X(cm)與肺活量Y(cm3)的測定值見下表,問如何分析兩組肺活量是否有差異? 運動員大學生身高X(cm)肺活量Y(cm3)身高X(cm)肺活量Y(cm3)184.90167.90171.00171.00188.00179.00177.00179.50187.00187.004300.0038
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教研成果成果轉(zhuǎn)化
- 裝修設(shè)計師的工作總結(jié)
- 房地產(chǎn)行業(yè)設(shè)計師工作總結(jié)
- 2024年爬山安全教案
- 2024年計算機應屆生簡歷
- 農(nóng)田租賃協(xié)議書(2篇)
- 2024年苯噻草胺項目營銷方案
- 《贛州市國家稅務局》課件
- 烏魯木齊市實驗學校2023-2024學年高三上學期1月月考政治試題(解析版)
- 甘肅省部分學校2025屆高三上學期第一次聯(lián)考(期末)歷史試卷(含答案解析)
- 人教版四年級上冊數(shù)學 第五單元《平行四邊形和梯形》單元專項訓練 作圖題(含答案)
- 物業(yè)品質(zhì)督導述職報告
- 2024年山東濟南軌道交通集團有限公司招聘筆試參考題庫含答案解析
- 療愈行業(yè)現(xiàn)狀分析
- 北京海淀區(qū)2023-2024學年六年級上學期期末數(shù)學數(shù)學試卷
- 2023年安全總監(jiān)年終工作總結(jié)
- 浙江省杭州拱墅區(qū)2023-2024學年六年級上學期期末語文試題
- 以消費者為中心:提升營銷效果的技巧
- 部編版四年級道德與法治上冊期末復習計劃
- 獸用疫苗管理制度
- 2023瑞幸員工合同協(xié)議書
評論
0/150
提交評論