版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第31章一般線性模型統(tǒng)計程序PROC PROCGLM程序概 統(tǒng)計模 如何撰寫PROCGLM程 用PROCGLM執(zhí)行回歸分 用PROCGLM執(zhí)行單變量變異數(shù)分 用PROCGLM程序執(zhí)行多變量變異數(shù)分 注意事 第32章離差平方和(SS)的四種類型及其函 四類型的SS是什 在變異數(shù)分析里哪些線性函數(shù)是可估計 第六部一般線性模型與四型離差31章一般線性模型統(tǒng)計程序PROCPROCGLM程序GLM是一般線性模型(GeneralLinearModel)的簡稱其推算參數(shù)的理論基礎(chǔ)是最小誤差平方法(TheLeastSquaresMethod)最適用于不平衡的實驗設(shè)計亦即各組(或各細格)的觀察體個數(shù)不等若你的實驗是一個平衡的實驗設(shè)計則你應(yīng)該用ANOVA程序(見第26章)來執(zhí)行變異數(shù)分析以節(jié)省計算的時間與電腦的空間PROCGLM可以被應(yīng)用在多種不同的統(tǒng)計分析上如共變量分析 ysisof重復(fù)觀察的變異數(shù)分析(又稱Split-PlotFactorial(Weighted本章的重點在于介紹PROCGLM內(nèi)有關(guān)變異數(shù)分析的指令(亦即上述a到d的用法)至于GLM程序在回歸分析上的應(yīng)用上述e到j(luò)的用途則與PROCREG的基本語法類似請參閱第18章的內(nèi)容或本章第31.4節(jié)2626.226.3節(jié)PROCGLM若以ABC等字母代表實驗設(shè)計的自變量Y代表因變量 X1X2與X3代表連續(xù)變量則PROCGLM可處理的幾種變異數(shù)分析之模型及其SAS指令如下 SAS指一因子的變異數(shù)分析MODELY MODELY=AB MODELY=AB MODELY=B(A)C(B極多變量變異數(shù)分析MODELY1Y2=A MODELY=A MODELY=A NODELY=AX1如何撰寫PROCGLM程PROCGLM含十七道指令其中只有PROCGLM和MODEL是必要的不可省略其他十五道指令則可有可無但當(dāng)實驗設(shè)計內(nèi)含一個以上的自變量時讀者必須用CLASS指令標(biāo)明下面請讀者特別注意各指令出現(xiàn)的次序PROC 因變量串=PROC 因變量串=實驗效果/選項串 效果名稱串/選項串CONTRAST比較式的名字'各組效果的系數(shù)/選ESTIMATE'估計值的名字'各組效果的LSMEANS/選項串MANOVAH=效果名稱E=效果名M=變量的轉(zhuǎn)換PREFIX=新變量的名稱代 效果名稱串/選項串REPEATED重復(fù)變量的名稱串組數(shù)(組名)/選項 H=效果名稱E=效果名稱/選項串 必須放在MODEL指令之后必須放在MODEL指令之后一處RUN指令之前PROCGLMPROC 界定一個輸出資料文件使其包含預(yù)測值與預(yù) 檢定某些實驗效果時界定檢定的分子 將資料文件分成幾個部分分別對其執(zhí)行統(tǒng) 與FREQ作用類似旨在標(biāo)明數(shù)據(jù)的#1PROCGLM指明對那一個SAS資料文件執(zhí)行分析若省略此選項則SAS會自動找出在此程序前最后形成的SAS資料文件并對它執(zhí)行分析ORDER=FREQ或ORDER=DATA或ORDERINTERNAL或(界定自變量內(nèi)組別的次序這個選項和CONTRAST及ESTIMATE指令是息息ORDER=FREQ時觀察體個數(shù)最多的那一組就是第一組以下類推ORDER=DATA時組別是按照輸入資料文件中各組第一次出現(xiàn)的次序而決當(dāng)ORDER=INTERNAL時組別按其代號由小到大(如1 等)排列或按各組名稱的英文字母順序排列(如FEMALE在MALE之前)ORDER=FORMATTED時則組別的順序以外部的格式(ExternalFormat)而決定這也是本選項的內(nèi)設(shè)值5PROCGLM(InteractiveMode)要求PROCGLM在必要情況下重讀輸入資料文件內(nèi)的數(shù)據(jù)由于這個選項會占用極多的空間同時耗時很多除非必要讀者可以省略此選項)(SS)FMANOVA指令中的CANONICAL選項但未界定M=的選項則典型相關(guān)分析的結(jié)果也會納入此輸出要求PROCGLM抑止分析結(jié)果在報表上的打印除非讀者只想制造某些輸出資料文件而不太想看到分析的結(jié)果否則這個選項不太有用2CLASSCLASSES計模型的自變量這些自變量可以是數(shù)值的或文字的若是文字變量則其長度不可超過十指令#3MODEL因變量串實驗效果選項刪除號(/)之前的部分(因變量串實驗效果)要求你必須先決定何種統(tǒng)計模型適用于你現(xiàn)在要分析的數(shù)據(jù)然后根據(jù)26章(ANOVA)第26.3節(jié)的原則將它寫出(/) 與截距的界定有關(guān)有兩個選GLM(常數(shù))INTGLM 與報表的打印有關(guān)有三個選要求GLM程序印出常態(tài)公式的解(亦即一般線性模型中參數(shù)的估計 當(dāng)省CLASS指令時GLM印出量其定義是1-R2在此R2=復(fù)相關(guān)系數(shù)的平方有關(guān)量的詳細解釋請見第17章第17.4節(jié) 與虛無假設(shè)的檢定有關(guān)有九個選EGLM(EstimableFunctions)要求GLM程序只印出每一效果的第一型可估計函數(shù)值(Type 要求GLM程序只印出每一效果的第二型可估計函數(shù)值(Type 要求GLM程序只印出每一效果的第三型可估計函數(shù)值(Type 要求GLM程序只印出每一效果的第四型可估計函數(shù)值(Type 要求GLM程序只印出每一效果的第一型離差平方的總和(Type Sumof要求GLM程序只印出每一效果的第二型離差平方的總和(Type Sumof要求GLM程序只印出每一效果的第三型離差平方的總和(Type Sumof要求GLM程序只印出每一效果的第四型離差平方的總和(TypeSumofSquares)若讀者已選用E1E2E3或E4則GLM會自動印出與其相對應(yīng)的SS1SS2SS3SS4這一類選項的內(nèi)設(shè)值是E1E3或SS1SS3 (X'X)INVERSE要求印出(X'X)的反矩陣或(X'X)之通用式反矩陣(GeneralizedInverse第五類選項可用來調(diào)整統(tǒng)計的精確性有一個選項ZETA=ZETA內(nèi)設(shè)值是10的-8次方這個內(nèi)設(shè)值足以應(yīng)付大多數(shù)的模型檢定7指令#4MEANS效果名稱串選項(刪除號之前)GLM(和其交互作用或鑲嵌作用)中各組(各細格)的平均數(shù)比方說SEX表示(下分男女)RACE表示種族(下分黑白)則我們可用下列的SAS指令算出資料文件中女人白人男男白人女及女白人在因變量年薪(SALARY)上的平均PROCPROCCLASSSEXMODELSALARY=SEXMEANSSEXRACE(/)MEANS指令中所列的主效果執(zhí)行不同的顯著性考驗以前例而言MEANS指令會比較男與女及與白人之間的年薪差異后十個選項則與統(tǒng)計檢定的各項事宜有關(guān)執(zhí)行顯著性t檢定其理論基礎(chǔ)是班的不等律(Bonferroni這個選項界定唐那氏的兩組平均數(shù)之雙尾檢定唐那氏(Dunnett)的檢定依據(jù)t分配而且必須是實驗組與控制組平均數(shù)的比較因此括號內(nèi)必須指明控制組的組別MEANSMEANSA/DUNNETTACONTROL組就是控制組若控制組的組別是以數(shù)字來表示的(如2)則不必再加單引號如MEANSMEANSA/DUNNETT(內(nèi)設(shè)值)若控制組不只一組時讀者可同時在括號內(nèi)提及如MEANSMEANSABC/DUNNETT('FIRST''SECOND'根據(jù)上述指令的語法A效果的控制組是第FIRSTB效果的控制組是第SECOND組CTHIRD這個選項界定唐那氏的兩組平均數(shù)之單尾檢定而且預(yù)期的差異必須是負值(亦 因此臨界值定在t分配的下端(3)DUNNETT 而且預(yù)期的差異必須是正值( 因此臨界值定在t分配的上端有關(guān)控制組的內(nèi)設(shè)值以及撰寫語法請參見上面(3)DUNNETT的說明Ryan-Einot-Gabriel-WelschFRyan-Einot-Gabriel-WelschtSidaktSMM(12)Sidakt檢定當(dāng)兩組人數(shù)不等時此法也就是哈氏GT2執(zhí)行紐曼-庫爾 -Keuls)的兩組樣本平均數(shù)差的t檢T(15)t檢定因為GLM費契爾的最小顯著差(LSD)的檢定結(jié)果不一定完全相同HSDWaller-DuncanK-ratiot界定統(tǒng)計檢定的顯著程度內(nèi)設(shè)值是.05 當(dāng)此選項與前述選項(2)DUNCAN并用時ALPHA的值必須是.10 及.01三者之一將讀者選用的顯著性檢定的分析結(jié)果(亦即各平均數(shù))做由大到小的排列若某一對平均數(shù)之間無顯著的差異則SAS將它們印在同一行上并以虛線將它們與其他有顯著差異的平均數(shù)分開當(dāng)讀者選用DUNCANREGWFREGWQSNK或WALLER等顯著性檢定(或當(dāng)實驗設(shè)計是平衡或當(dāng)實驗設(shè)計只含兩細格時)此選項會自動包括在分析過程內(nèi)否則讀者必須另外附加再者此選項最適用于平衡的實驗設(shè)計若細格內(nèi)的人數(shù)不等GLM程序會先計算出各細格人數(shù)的調(diào)和平均數(shù)(HarmonicMean) 然而若各細格內(nèi)的人數(shù)差異太大時某些比較的顯著結(jié)果會過于樂觀將 GABRIEL SIDHK GT2TLSD或TUKEY 9CLDIFF選項會自動包括在分析過程內(nèi)當(dāng)讀者選用DUNCAN SNK或WALLER時則必須另外附加此選項將MEANS指令中所提到的效果之各組平均數(shù)以信賴區(qū)間的方式表示此選項必須與BON T以及LSD等聯(lián)用CLDIFFCLM此選項界定上述各顯著性檢定的分母)要求GLM程序只印出因變量的平均數(shù)若省略此選項則GLM程序會印出資料ETYPE=1(或 或 或界定F檢定中分母矩陣的均方(MeanSquare)類型內(nèi)設(shè)值是分析檢定中最高HTYPE=1(或 或 或與前述WALLER選項并用此選規(guī)界定F檢定中分子矩陣的平均方類型內(nèi)與WALLER選項聯(lián)用這個比例(第一類型錯誤第二類型錯誤)的值若訂 100與 則大約與ALPHA值 .05與.01相對應(yīng)這個選項的指令#5 比較式的名字各組效果的系數(shù)選項請讀者仔細閱讀下頁幾個示范的例子以便了解這個指令的格式首先我們假設(shè)有一個二因子的主效果實驗設(shè)計A分為五組B分為兩組MODELMODELY=ACONTRAST'ALINEAR&A-2-101A2-1-2-12;CONTRAST'CONTROLVSOTHERS'A-1.25.25.25CONTRAST'ONEVSTWO'B-1比較式的名字必須放在單引號內(nèi)名字的長度以二十個字母為限命名的方式不拘但不可夾帶分號( MODEL現(xiàn)過的如上例中我們不能比較A*B的交互效果因為MODEL指令中無此效果這些系數(shù)的總和必須是0而且只能是整數(shù)或小數(shù)(SAS不接受任何分數(shù)作為系數(shù))各系數(shù)之間要以空格隔開若同一個CONTRAST指令內(nèi)含一個以上的比較式則以逗號將系數(shù)串(/)E印出線性函數(shù)的向量E=ECONTRASTF檢定的分母(MS 或 或E=SINGULAR=(這個選項用來檢定CONTRAST指令所導(dǎo)出的線性函數(shù)是否為可估計的 iL線性函數(shù)之矩陣)H=(X'X)-如果下式成立LiSAS若Li= 而且ABS[Li-(LH)i]>極小的正實數(shù)(如或適當(dāng) 而且ABS[Li-(LH)i]>ABS(Li)*極小的正實數(shù)(如10-4指令 估計值的名字各組效果的系數(shù)選項這個指令與上述的CONTRAST指令類似它們遵循同樣的原則但除此之外ESTIMATE指令還可印出t檢定的值t檢定的分母(即平均誤差的值) MODELMODELY=ESTIMATE'A1VSA2'A1-ESTIMATE'1/3(A1+A2)-2/3A3'A11-2/DIVISOR=ESTIMATE'1/3(A1+A2)-2/3A3'A.33333.33333-(/)DIVISOR=E印出線性函數(shù)的向量SINGULAR=以此數(shù)為標(biāo)準檢定ESTIMATE指令所導(dǎo)出的線性函數(shù)是否為可估計的(Estimable)其檢定標(biāo)準與前述CONTRAST指令中同一選項完全一致故不再贅述內(nèi)設(shè)值也等于10的-4次方指令#7LSMEANS效果名稱串選項LSMEANS是以最小誤差平方法所估計之平均數(shù)的代稱(英文稱LeastSquares 下頁示范LSMEANS的語法PROCPROCCLASSAMODELABLSMEANSA上面的程序指示SAS以最小誤差平方法估計A及A*B兩效果內(nèi)各組(或各細格)的矯正平均數(shù)好似整個實驗設(shè)計是一個平衡的設(shè)計請注意LSMEANS指令里所提的效果必須是MODEL指令里已經(jīng)提過的效果(/)后的選項有十個分述如下E印出最小誤差平方平均數(shù)計算過程中所用到的可估計函數(shù)值有關(guān)E的定義在下一章(第32章)內(nèi)有詳細的說明印出t檢定 LSM=0)的分母與其顯著程t(2)STDERRE=須與上述STDERRTDIFF及PDIFF等選項合用作用在于指定某一個效果的平均方做為t檢定的分母若讀者選用STDERRTDIFF及PDIFF選項但省略此選項則GLM自動以誤差的平均方(MSError)為t檢定的分母ETYPE=1(或 或 或E=以此數(shù)為標(biāo)準檢定LSMEANS指令所導(dǎo)出的線性函數(shù)是否為可估計的(Estimable)其檢定標(biāo)準與前述CONTRAST指令中同一選項完全一致故不再贅述內(nèi)設(shè)值也等于10的-4次方OUT=界定一個輸出資料文件內(nèi)含LSMEANS指令所導(dǎo)出的矯正平均數(shù)平均數(shù)的標(biāo)準誤差以及平均數(shù)間的共變異數(shù)(如果讀者同時界定下一個選項COV)要求將矯正平均數(shù)之間的共變異數(shù)納入上述OUT=輸出資料文件內(nèi)此選項必須與OUT=選項聯(lián)用而且LSMEANS的效果必須只有一個GLMLSMEANS指令的目的只是為了產(chǎn)生一個OUT=的輸出資料文件則此選項會十分有用指令 MANOVAH效果名稱E效果名MPREFIX新變量的名稱代號MNAMES新變量的名稱串選項此指令要求多變量變異數(shù)分析(MANOVA) 法下面分別介紹此指令的各部分H=(_ALL_界定多變量變異數(shù)分析所檢驗的假設(shè)矩陣H=的效果必須已被包含在MODEL指令里當(dāng)讀者有意通盤地對MODEL指令中所提到的所有效果執(zhí)行多變量變異數(shù)分析時則可用H=_ALL_表示在GLM程序中這些效果將經(jīng)由四種方法進行多變量變異數(shù)分析亦即Holing-LawleyTracePillai'sTraceWilks'Criterion和Roy's umRootCriterion這四種分析的結(jié)果仍依據(jù)F分配來判斷其顯著程度當(dāng)H=INTERCEPT時表示讀者有意對模型中的截距或總平均數(shù)(GrandMean)作統(tǒng)計的檢定E=界定F檢定的分母若省略此選項則余差的平均方(MSResidual)就自動成為分MODELY1-Y5=AMODELY1-Y5=AB(A);MANOVAH=AE=B(A)M=Y1-Y2,Y2-Y3,Y3-Y4,Y4-M=轉(zhuǎn)換變量{±轉(zhuǎn)換變 此處的轉(zhuǎn)換變量可以是原始變量或常數(shù)乘以原因變量{}中的部分可有可無若含一個以上的轉(zhuǎn)換式則以逗點()相隔在上面的例子中由于有PREFIX=DIEF這個選項因此新變量將被命名為DIFF1DIFF2DIFF3及DIFF4請注意這個名稱代號必須是八個字母以內(nèi)的名字數(shù)字12等分別與轉(zhuǎn)換式12等對應(yīng)PREFIXM=中轉(zhuǎn)換12等相連名稱之(/)后的選項F(即假設(shè)矩陣FHTYPE=1(或 或 或界定假設(shè)矩陣的變異數(shù)平方值的型態(tài)(可等于1234)內(nèi)設(shè)值是分析過ETYPE=1(或 或 或界定F檢定中分母矩陣的變異數(shù)平方值的型態(tài)(可等于123或4)內(nèi)設(shè)要求轉(zhuǎn)換式(在選項M=中所形成的新變量)先經(jīng)過標(biāo)準化正交(Orthonormali-zation)的處理對F檢定中的分子與分母矩陣進行典型分 此分析的結(jié)果與另一統(tǒng)計程印出每一因變量的變異數(shù)分析表若曾選用選項M=則變異數(shù)分析表PROCCLASSPROCCLASSAMODELY1-Y5=AMANOVAH=AE=B(A)/PRINTHPRINTEHTYPE=1ETYPE=1;MANOVAH=AE=B(A)MODEL指令中我們看到有五個因變量(Y1Y5)故可采用多變量變異數(shù)分析MANOVA指令中FA效果矩陣B(A)效果矩MANOVAMANOVA指令中沒有規(guī)定分母的矩陣GLM(MS E=的內(nèi)設(shè)值)F第三個MANOVA指令請讀者注意M=選項原因變量經(jīng)過轉(zhuǎn)換后由于未使用PREFIX=或MNAMES=選項因此GLM程序自動稱這兩個轉(zhuǎn)換過的新變量為MVAR1及MVAR2這些新變量與A效果之間的關(guān)系是由這個MANOVA指令所檢驗的PROCCLASSPROCCLASSMODELDOSE1-DOSE4=GROUP;MANOVAH=GROUPMNAMES=LINEARQUADRATIC此例中原因變量經(jīng)過選項M=做線性轉(zhuǎn)換拋物線轉(zhuǎn)換及三次方曲線轉(zhuǎn)換然后新因變量經(jīng)NNAMES=選項命名為線性拋物線性及三次曲線值選項PRINTE指示SAS印出F檢定的分母矩陣(在此例中由于無E=選項故分母矩陣即是余差的矩陣)9OUTPUTOUT輸出資料文件名稱關(guān)鍵字本指令包括兩個部分OUT=與關(guān)鍵字這個資料文件含原輸入資料文件的所有變量以及本指令中所提到的關(guān)鍵字(如 RESIDUAL等)PREDICTEDP)=RESIDUALR)=L95M=95%U95M=95% 95% 95%STDP=KSTDR=STDI=STUDENT=COOKD=庫格 Xi(X'X)-==指令#10RANDOM效果名稱串選項這個指令可用來MODEL指令所含的各項效果中哪個(些)是隨機效果從這個界定中GLM讀者可在MODEL指令之后多次界定RANDOM指令若省略RANDOM指令則GLM程序視MODEL指令中所有的效果為固定效果(FixedEffects)(/)Q要求GLM程序?qū)ANDOM指令中所提的各式隨機效果執(zhí)行適當(dāng)?shù)腇檢定并且F檢定的分母完全根據(jù)各效果變異數(shù)均方的期望值(ExpectedMeanSquares) 唯一值得注意的是若A B兩主效果被成隨機效果這并不代表A*B一定被SAS視為隨機效果因此下頁兩個RANDOM指令所得的F檢定RANDOMRANDOMARANDOMAB指令 REPEATED重復(fù)變量的名稱串組數(shù)(組名)變量的轉(zhuǎn)換選項假設(shè)有三種實驗各種控制在四個不同的時間進行則每一個被試有十二個分數(shù)假如這十二個分數(shù)分別以Y1 Y12表示則下面的指令可代表這十二個分數(shù)的統(tǒng)計分析REPEATEDREPEATEDTRIAL3(ABC),TIME4(T1T2T3Y1TRIAL的11122223333TIME上例中的TRIAL及 重復(fù)變量必須與因變量有關(guān)重復(fù)變量的名稱不可界定上述重復(fù)變量的組數(shù)若該變量的組數(shù)為1則可以省略此選項從上面的例子中我們可看出重復(fù)變量TRIAL有三組而TIME有四組所以其排列組合共產(chǎn)生了十二個分數(shù)(以Y1Y12表示)這個選項的值必須包含在括號內(nèi)括號內(nèi)的值用來標(biāo)明各分組其個數(shù)須與組數(shù)吻合如TRIAL這個重復(fù)變量有三組即AB與C組名與組名之間以空格分隔TIME變量則有四組分別以T1T2T3T4等表示下面的(1)(2)變量轉(zhuǎn)換均屬于正交的轉(zhuǎn)換其余則屬非正交的轉(zhuǎn)換每一轉(zhuǎn)換數(shù)的平均數(shù)比較(Contrast)有1度的自由度產(chǎn)生多項式的正交比較如直線式拋物線式TRIAL中比較A組平均數(shù)及BC兩組平均數(shù)的平均讀者先選定變量中的某一組為參考組然后其他各組依序與此參考組做比較如CONTRAST(A)A是參考組所以A與BA與C的平均數(shù)作比較參考組組別的內(nèi)設(shè)值是最后一組這是內(nèi)設(shè)的轉(zhuǎn)換方法組平均數(shù)的平均參考組組別的內(nèi)設(shè)值是最后一組如MEAN表示TRIAL變量中的C是參考組(因為C組是最后一組)因此比較A組平均數(shù)與BC兩組平均數(shù)的平均但不比較C組平均數(shù)與AB兩組平均數(shù)的平均請讀者注意指令中若含一個以上的重復(fù)變量則以逗點分隔這些變量每一變量內(nèi)的資料如名稱組數(shù)據(jù)(組別)變量的轉(zhuǎn)換應(yīng)當(dāng)以空格分隔若讀者同時界定CONTRAST與TEST指令則REPEATED指令必須在這兩個指令之后與上述選項相反不印出單變量變異數(shù)分析的結(jié)果只印出多變量變異數(shù)分析的結(jié)M矩陣的轉(zhuǎn)置矩陣亦即M'行球形假設(shè)(Sphericity)的檢定針對因變量所導(dǎo)出的H與E矩陣進行典型分析其分析結(jié)果應(yīng)與PROCCANDISC程序的分析結(jié)果相似HTYPE=1(或 或 或界定F檢定中分子矩陣的變異數(shù)平方值的型態(tài)(可等于1 3或4) 指令#12TESTH效果名稱串E效果名稱選項一般而言GLM程序以MODEL指令中的各項效果為分子以余差的平均方(MSResidual)為分母執(zhí)行F檢定但讀者可利用TEST指令自行指定其他效果的平均方(MeanSquares或MS)為分母進行額外的F檢定這種情形在重復(fù)觀察的實驗設(shè)計里最但是讀者必須注意在不平衡的實驗設(shè)計里各項效果的平均方不一定彼此獨立所以即使虛無假設(shè)成立各效果平均方的期望值(ExpectedValue)不一定是各組(或各細格)在母群中的變異數(shù)(2)如此所形成的F檢定則的F值SAS對讀者所自選的H與E效果名稱(即F檢定的分子分母)不負任何責(zé)任因此讀者事前應(yīng)多參閱統(tǒng)計書籍或利用RANDOM指令來預(yù)測效果的期望值FMODEL界定F檢定的分母個數(shù)只限一個同樣的此效果必須是在MODEL指令中出(/)HTYPE=1(或 或 或界定被測效果(即F檢定的分子)的MS型態(tài)這四種型態(tài)的定義在第32章ETYPE=1(或 或 或FMS型態(tài)同樣地32PROCCLASSAPROCCLASSABCMODELY=AB(A)CA*CB*C(A);TESTH=AE=B(A)/HTYPE=1ETYPE=1;TESTH=CA*CE=B*C(A)/HTYPE=1#13ABSORB假若一個自變量下有許多組而且這個自變量與其他自變量之間沒有任何交互作用若讀者在此指令中提出一個以上的自變量則GLM程序自動假設(shè)右邊的變量是鑲另外有兩點請讀者在選用ABSORB—輸入資料文件內(nèi)的數(shù)據(jù)必須依照ABSORB指令中列舉的變量做由小到大的重新排列這個步驟可藉PROCSORT達成二若選用ABSORB指令則OUTPUT指令無效GLM程序無法產(chǎn)生輸出資料ABSORB31.8#14BYSAS依據(jù)此指令所列舉的變量將資料文件分成幾個小的資料文件然后對每一個小的資料文件分別執(zhí)行GLM分析當(dāng)讀者選用此指令時資料文件內(nèi)的數(shù)據(jù)必須先依照BY變量串的值做由小到大的重新排列這個步驟可藉PROCSORT達成#15FREQ1時這些觀察體的數(shù)據(jù)便被排除在分析之外若這個值不是一個整數(shù)(如5.8)則SAS自動取其整數(shù)的部分(即5)#16ID#17WEIGHT這個指令的作用是將因變量做不等的調(diào)整調(diào)整的幅度視WEIGHT變量的值而數(shù)間的比較會受影響對參數(shù)的估計則由下式導(dǎo)出=(X'WX)-在此式中W代 值的大小亦即WEIGHT變量的有一種值會導(dǎo)致最佳線性不偏估計值英文簡稱B.L.U.E即BestLinearUnbiasedEstimates)這種值即等于各組內(nèi)余差變異數(shù)的倒數(shù)PROCGLM執(zhí)行回歸分若讀者想利用GLM程序執(zhí)行(單/復(fù))回歸分析則你只需考慮PROCGLMMODELOUTPUTABSORBBYFREQIDWEIGHT等指令的撰寫18PROCREGPROCGLM執(zhí)行單變量變異數(shù)分若讀者只想利用PROCGLM執(zhí)行單變量的變異數(shù)分析則可省略MANOVA指令的撰寫其余的指令仍然有效關(guān)于GLM程序在單變量變異數(shù)分析上的應(yīng)用讀者可PROCGLM程序執(zhí)行多變量變異數(shù)GLM程序中所有的十七道指令所以是最復(fù)雜的分析方法關(guān)于GLM程序在多變量變異數(shù)上的應(yīng)用讀者可參考本章范例的例五 本資料文件(PLANTS)的數(shù)據(jù)來自Stenstrom(1940)的實驗該實驗的目的在比較草在七種土壤(TYPE)里生長的情形每一種土壤中種三盆草(BLOCK)這個實驗是一個平衡的設(shè)計現(xiàn)在我們利用此資料文件來示范GLM程序在SAS程序里由于并沒有在MODEL指令中指定變異數(shù)平方的類型故GLM程序按內(nèi)設(shè)值自動印出第一和第三型的變異數(shù)平方因為這是一個平衡的設(shè)計故這兩型變在第二個GLM程序中選用了ORDER=INPUT選項因此在CONTRAST指令串中平均數(shù)比較的順序是根據(jù)輸入資料文件內(nèi)各組數(shù)據(jù)第一次出現(xiàn)的順序而定的另外MODELSOLUTION選項要求GLM程序列出所有參數(shù)的估計值MEANS程DATADATAINPUTTYPE$;PROCGLMORDER=DATA;CLASSTYPEPROCGLMORDER=DATA;CLASSTYPEBLOCK;MODELSTEMLENG=TYPEBLOCK;MEANSTYPE/SNK; 'COMPOSTVS----6--1'RIVERSOILS----05-1-4--00-1'GLACIALVS-01100-1'CLARIONVS-000001'KNOXVS001-000DOBLOCK=1TODOBLOCK=1TOINPUTSTEMLENG@;OUTPUT; 分析的結(jié)果顯 草的生長情形隨七種土壤以及三種盆栽之不同而改 利用SNK的事后檢定以及CONTRAST指令我們可以下結(jié)論說WABASH的土壤最優(yōu)COMPOST的土壤最劣KNOX與O'NEILL兩種不分軒輊CLARION與WEBSTER兩種土壤間亦無顯著的差異31.1平衡的塊試驗設(shè)計與平均數(shù)的比GeneralLinearModelsProcedureClassLevelInformation7CLARIONCLINTONKNOXO'NEILLCOMPOSTWABASH312Numberofobservationsindataset=DependentVariable:SumofMeanFPr>R-8RootSTEMLENGCorrectedTypeIMeanFPr>62TypeIIIMeanFPr>62Student--Keulstestforvariable:NOTE:ThistestcontrolsthetypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullAlpha=0.05df=12MSE=Numberof234567CriticalRangeMeanswiththesameletterarenotsignificantlySNKGrou AA3BA3BABAC3BCBDC3DCDC3DD3DD3DependentVariable: Contrast Mean F Pr>COMPOSTVS1RIVERSOILS2GLACIALVS1CLARIONVS1KNOXVS 例二非平衡型的實驗設(shè)計(A)Kutner(1974)所提供其出處是AfifiAzen(1972)合著的書以電腦為工具的統(tǒng)計分析兩個自變量分別是DRUG和DISEASE請讀者注意在MODEL指令中程序要求四型變異數(shù)平方值的打印DATAINPUTDATAINPUTDRUGDISEASEDOI=1TOINPUTY;PROCCLASSDRUGMODELY=DRUGDISEASEDRUG*DISEASE/SS1SS2SS3112..3313-32521.4222.34.23326431.129.32.971-3321.934124922-2422712-512結(jié)由于本實驗屬非平衡型的實驗設(shè)計因此第一與第二型離差平方和的結(jié)果不盡相同結(jié)論說DRUG的效果達顯著水準(p<.0001) 然而DISEASE(p=.1709)或兩者間的交互作用(p=.3764)均未達顯著水準31.2非平衡型的實驗設(shè)計二因子的單變量變異數(shù)分GeneralLinearModelsProcedureClassLevelInformation 123 12Numberofobservationsindataset=NOTE:Duetomissingvalues,only58observationscanbeusedin DependentVariable:SumofMeanFPr>R-RootYTypeIMeanFPr>326TypeIIMeanFPr>326DependentVariable:TypeIIIMeanFPr>326TypeIVMeanFPr>326例三共變量分析本資料文件(DRUGTEST)的數(shù)據(jù)由Snedecor與Cochran P.422)所提DRUG(AD)十位被分配到DRUG自變量下的各組癲瘋病菌的數(shù)量是由每一身體上六個部位病菌的程度而定的治療后的病菌數(shù)量(Y)是這個實驗的因變量治療前癲瘋病菌的數(shù)量(X)則是Y的共變量PROCCLASSDRUG;MODELPROCCLASSDRUG;MODELY=DRUGX;LSMEANSDRUG/STDERRDATAINPUT$XA6A80AA64AA30D60D62DD84DD9FFFFF5F;結(jié)利用共變量分析法分析這組資料結(jié)果顯示治療后的癲瘋病菌數(shù)量明顯地受治療前癲瘋病菌的數(shù)量所影響(F=20.21P=0.0005)然而這兩種抗生素的效果與控制組(未接受治療)不分上下(F=0.84P=0.4516)請注意在共變量分析法中實驗效果的檢定是根31.3共變量分GeneralLinearModelsProcedureClassLevelInformation ADFSumofMeanFPr>SumofMeanFPr>R-3RootY TypeIMeanFPr>2X1TypeIIIMeanFPr>2X1StdErrPrA1D2F3Pr>|T|H0:1231.2.3.NOTE:Toensureoverallprotectionlevel,onlyprobabilitiesassociatedwithpre-plannedcomparisonsshouldbeused.本資料文件(ONE)的數(shù)據(jù)由Cochran與Cox(1957 P.176)所提供這個實驗探討電擊對萎縮肌肉的影響各項效果的代號如下 電流通過的時間(一到四級時間單位) 電流的強度(一到四級) 每天受電擊的次數(shù)(一到三次) 每一位受試者接受兩次電擊但電流通過肌肉的時間電流的強度與每天接受的次數(shù)則因人而異這個例子的程序主在示范CONTRAST指令的寫法第一個CONTRAST指令是針對TIME的主效果(三度自由度因此三個平均數(shù)比較)CURRENT在每一TIME組內(nèi)的簡單主效果(SimpleMainEffect)而撰寫的DATADOREP=1TO2;DOTIME=1TO4;DOCURRENT=1DATADOREP=1TO2;DOTIME=1TO4;DOCURRENT=1TODONUMBER=1TOINPUTINPUTY;100-00000000100-010-00000000010-001-00000000001-PROCCLASSREPCURRENTTIMEMODELPROCCLASSREPCURRENTTIMEMODELY=REPCURRENT|TIME|NUMBER;CONTRAST'TIMEINCURRENT3'CONTRAST'CURR1VS.CURR2'CURRENT1-結(jié) CONTRASTTIME的主效果以及CURRENTTIME組內(nèi)的簡單主效果做平均數(shù)比較時其檢定的結(jié)果均未達顯著水準最后CONTRAST指令比較電流第一組與第二組的平均數(shù)差異結(jié)果顯示這兩組間的差異未達統(tǒng)計上顯著的程度因此我們可以推測電流效果可能存在于一三四組間或二三四組間或三四組間31.4三因子的單變量變異數(shù)分析與平均數(shù)的比GeneralLinearModelsProcedureClassLevelInformation 2141234123312Numberofobservationsindataset=DependentVariable:SumR-FPr>RootYCorrectedTypeIMeanFPr>1339266TypeIIIMeanFPr>1339266ContrastMeanFPr>TIMEINCURRENT3CURR1VS.CURR1本資料文件(SKULL)由奧勒岡大學(xué)的教授A.Anderson提供旨在決定對四種反應(yīng) ZYGOMAT與POSTORB)的效 程DATAINPUTSEX$LENGTHBASILARZYGOMATPOSTORB@@;MMMMMMMMMMMMMMMMMMMMMMFFFFFFFFFFFFFFFFFF;PROCCLASSMODELLENGTHBASILARZYGOMATPOSTORB=SEX;MANOVAH=SEX/PRINTEPRINTH;TITLE YSISOF結(jié)F值后大小均完全一致(亦即F=0.8018P=0.5323)這個結(jié)果與單變量變異數(shù)分析的結(jié)果是完全相同的(F值介于0.00與1.02間)所以我們可下結(jié)論說男女在這四種反應(yīng)上的結(jié)31.5極多變量變異MULTIVARIATEYSISOFGeneralLinearModelsProcedureClassLevelInformation FNumberofobservationsindataset=DependentVariable:SumofFPr>R-1RootLENGTHCorrectedTypeIMeanFPr>1TypeIIIMeanFPr>1DependentVariable:SumofFPr>R-1RootCorrectedlTypeIMeanFPr>1TypeIIIMeanFPr>1DependentVariable:SumofFPr>R-1RootZYGOMATCorrected
TypeI TypeIII
MeanSquare
FF
Pr>FPr>FDependentVariable:SumofFPr>R-1RootPOSTORBCorrectedTypeIMeanFPr>1TypeIIIMeanFPr>1E=ErrorSS&CP PartialCorrelationCoefficientsfromtheErrorSS&CPMatrix/Prob>DF=H=TypeIIISS&CPMatrixfor --------CharacteristicRootsandVectorsof:EInverse*H,whereH=TypeIIISS&CPMatrixforSEXE=ErrorSS&CPMatrix CharacteristicVector - - -- --ManovaTestCriteriaandExactFStatisticsfortheHypothesisofnoOverallSEXEffectH=TypeIIISS&CPMatrixforSEXE=ErrorSS&CPFNumDenPr>Wilks'4Pillai's4 ling-4Roy'sGreatest 本資料文件(DOGS)的數(shù)據(jù)由Cole與Grizzle(1966)所提供實驗的目的在研究兩個自變量(藥物與狗身體內(nèi)胺基酸的分泌作用)與一個因變量(狗血液中胺基酸的濃度)的關(guān)系第一個自變量藥物(DRUG)下分兩組 或C6H9NO3第二個自變量胺基酸的分泌作用(DEPL)下也分兩組健康的與的十六對狗(有一對資料不全故分析時將其剔除)經(jīng)歷四次測量注射藥物后0分鐘1分鐘3分鐘及5分鐘(分別以HIST0 HIST5代表) 這些數(shù)據(jù)經(jīng)過對數(shù)的轉(zhuǎn)換后成為此分析的GLM程序中選項NOUNI抑止了單變量變異數(shù)的分析這是因為重復(fù)觀察值代表整體的數(shù)據(jù)若將它們分開則會失去彼此在時間上的關(guān)系另外指令REPEATED中POLYNOMIAL選項規(guī)定將重復(fù)觀察值作多項式的正交轉(zhuǎn)換DATAINPUTDATAINPUTDRUG$DEPL$HIST0HIST1HIST3HIST5;LHIST0=LOG(HIST0);LHIST1=LOG(HIST1);LHIST3=LOG(HIST3);LHIST5=LOG(HIST5);NNNNYY.YYNNNNYYYY;PROCCLASSDRUGMODELLHIST0LHIST1LHIST3LHIST5=DRUGDEPLDRUG*DEPL/NOUNI;REPEATEDTIME4(0135)POLYNOMIAL/SHORTSUMMARY;結(jié)經(jīng)過對數(shù)轉(zhuǎn)換后的時間效果達顯著水準(F=24.0326P=0.0001)轉(zhuǎn)換后的時間與藥物間的交互效果亦達顯著水準(F=5.7832P=0.0175)轉(zhuǎn)換后的時間與分泌作用間的交互效果達顯著水準(F=21.3112P=0.0002)最后時間藥物與分泌作用的三因子交互效果也達到統(tǒng)計上的顯著水準(F=12.4775P=0.0015)利用REPEATED指令檢定對數(shù)轉(zhuǎn)換的時間之函數(shù)(包括線性的拋物線的以及三次曲線的)結(jié)果顯示藥物分泌作用以及兩者間的交互效果在時間的線性以及拋物線值上均達顯著水準(P<0.05)然而時間經(jīng)過三次曲線轉(zhuǎn)換后只有分泌作用的效果達統(tǒng)計的顯著水準(P<0.0001)31.6重復(fù)觀察的變異GeneralLinearModelsProcedureClassLevelInformation2MORPHINE2NNumberofobservationsindataset=NOTE:ObservationswithmissingvalueswillnotbeincludedinthisThus,only11observationscanbeusedinthisRepeatedMeasuresysisofVarianceRepeatedMeasuresLevelInformationDependent LHIST0LHIST1LHIST3Levelof ManovaTestCriteriaandExactFStatisticsfortheHypothesisofnoTIMEEffectH=TypeIIISS&CPMatrixfor E=ErrorSS&CPFNumDenPr>Wilks'35Pillai's35 ling-Lawley35Roy'sGreatest35ManovaTestCriteriaandExactFStatisticsfortheHypothesisofnoTIME*DRUGEffectH=TypeIIISS&CPMatrixforTIME*DRUGE=ErrorSS&CPFNumDenPr>Wilks'35Pillai's35 ling-Lawley35Roy'sGreatest35ManovaTestCriteriaandExactFStatisticsfortheHypothesisofnoTIME*DEPLEffectH=TypeIIISS&CPMatrixforTIME*DEPLE=ErrorSS&CPFNumDenPr>Wilks'35Pillai's35 ling-Lawley35Roy'sGreatest35ManovaTestCriteriaandExactFStatisticsfortheHypothesisofnoTIME*DRUG*DEPLEffectH=TypeIIISS&CPMatrixforTIME*DRUG*DEPLE=ErrorSS&CP FNumDenPr>Wilks'35Pillai's35 ling-Lawley35Roy'sGreatest35TestsofHypothesesforBetweenSubjects DFTypeIIISSMeanSquareF Pr>1117UnivariateTestsofHypothesesforWithinSubjectSource:TypeIIISSFValuePr>FG-GH-Pr>FSource:Pr>TypeIIIMeanFPr>G-H-3Source:
Pr>F TypeIIISSMean F Pr> G- H-3Pr>TypeIIIMeanFPr>G-H-3Source:TypeIIIMeanGreenhouse-GeisserEpsilonHuynh-FeldtEpsilonTIME.NrepresentsthenthdegreepolynomialcontrastforContrastVariableTIME.1(線性TypeIIIMeanFPr>11117ContrastVariable:TIME.2(拋物線TypeIIIMeanFPr>11117ContrastVariable:TIME.3(三次曲線TypeIIIMeanFPr>11117ABSORB指令及其使用方法ABSORPTION驗設(shè)計的變異數(shù)分析(BlockDesign)HERD1(ABSORB指令PROCPROCABSORBHERD;CLASSAB;MODELY=AB2ABSORB指令PROCPROCCLASSHERDAMODELY=HERDAB在例1中當(dāng)ABSORB指令被用在塊試變量HERD上時GLM程序只計算第一型的離差平方和因此節(jié)省了第二三及四型離差平方和的計算所以例的分析會比例更有效率另外讀者也可在ABSORB指令中同時包含好幾個效果請看下面的三個例子(例與例的統(tǒng)計模型事實上完全相同)3ABSORB指令PROCPROCCLASSHERDCOWABMODELY=HERDCOW(HERD)AB例4將ABSORB指令用在 COW變量串上PROCPROCABSORBHERDCOW;CLASSAB;MODELY=AB例5(將ABSORB指令用在 B變量串上PROCPROCABSORBAB;CLASSHERDCOW;MODELY=HERD例5的程序所導(dǎo)出的效果有四即A HERD與COW(HERD) 兩項亦即HERD與COW(HERD)和ABSORB的變量AB或A*B完全無關(guān)ABSORB指令會節(jié)省計算的時間與空間?ABSORB的效果必從自變量的矩陣(亦即X'X)中剔除如此X'X的行列數(shù)減少其反矩陣的計下面的實例顯示使用ABSORB指令后的益處這個實驗總共有六千八百七十五個自由度第一種處理法不用ABSORB指令第二種處理法則使用了ABSORB指令A(yù)BSORB指令DATADATADOHERD=1TO40; DOCOW=1TON;DOTRTMENT=1TO3;DOREP=1TO2;DROPN;PROCCLASSHERDCOWMODELY=HERDCOW(HERD)這個分析將會占用6Megabytes的電腦空間而第二種處理法則會分析(ABSORB指令PROCPROCABSORBHERDCLASSMODELMODEL因為使用ABSORB指令因此可將自變量矩陣減至4*4的正方矩陣其所占用的電腦空間將大大減少分析的結(jié)果見報表31.731.7ABSORB令的示GeneralLinearModelsProcedureClassLevelInformation 123DependentVariable:
Numberofobservationsindataset=SumFPr>CorrectedR-RootYTypeIMeanFPr>2TypeIIIMeanFPr>2重復(fù)觀察的實驗設(shè)計所收集的數(shù)據(jù)可用單變量或多變量的變異數(shù)分析法處理此處討論這兩種方法在SAS程序里的異同首先讓我們假設(shè)有一資料文件稱作"OLD" 利用單變量變異數(shù)分析的SAS程PROCPROCGLMCLASSGROUPSUBJMODELY=GROUPSUBJ(GROUP)TIMETESTH=GROUP然而另有一種處理觀察體的方法將更節(jié)省打字時間首先同樣的數(shù)據(jù)以另一種排列方式呈現(xiàn)稱此資料文件為NEW PROCGLMPROCGLMDATA=NEW;CLASSGROUP;MODELY1-REPEATED"OLD"資料文件PROCPROCSORTDATA=OLD;BYGROUPDATANEW(KEEP=Y1-Y3GROUP);ARRAYYY{3}Y1-Y3;DOI=1TO3;SETOLD;BYGROUPSUBJ;IFLAST.SUBJTHENPROCSORTDATA=OLD;BYGROUPSUBJ;PROCTRANSPOSEOUT=NEW(RENAME=(_1=Y1_2=Y2_3=Y3));BYGROUPSUBJ;IDPROCSORTDATA=OLD;BYGROUPSUBJ;PROCTRANSPOSEOUT=NEW(RENAME=(_1=Y1_2=Y2_3=Y3));BYGROUPSUBJ;ID以下介紹指令REPEATED里所包含的五種線性轉(zhuǎn)換方式這些線性轉(zhuǎn)換PROCMODELD1-REPEATEDDRUG5CONTRAST是這五種選項的內(nèi)設(shè)值最適用于控制組與一個或一個以上實驗組的比較比方說五組動物接受不同的藥物治療其中第一組是控制組接受糖水其他四組是實驗組接受試驗中的"PROCMODELD1-REPEATEDDRUG5CONTRAST-1100M -1010-1001-1000HELMERT這個線性轉(zhuǎn)換適用于一組與其它組平均數(shù)的比較經(jīng)此線性轉(zhuǎn)換后讀者就容易找出重復(fù)觀察值中的臨界點(亦即平均數(shù)開始穩(wěn)定的點)下面的例子比較男女受試PROCPROCCLASSMODELRESP1-RESP4=SEX/NOUNI;REPEATEDTRTMENT4HELMERT/CANON;11M01001MEANMEAN選項的功用與CONTRAST選項十分類似唯一不同的是所謂的控制組在此(M)略有不同本例的數(shù)據(jù)與CONTRAST選項的例子相同五組動物接受不同的藥PROCPROCMODELD1-REPEATEDDRUG5
M 若讀者有意從比較中省略一組則可將其組別放在括號內(nèi)置于MEAN選項之后如MEAN(5) 如此第五組將從平均數(shù)的比較中省略PROFILE這個線性轉(zhuǎn)換最適用于不同性質(zhì)的重復(fù)觀察值假若有四種不同的教學(xué)法分別試用于幾所公立學(xué)校由于教學(xué)法之間有質(zhì)與量的差別PROFILE選項可提供兩兩教學(xué)法的比較請看下面的示范PROCPROCCLASSMODELT1-T4=SCHOOL/NOUNI;REPEATEDMETHOD4PROFILE;100M010001如此相鄰兩組(前后兩種教學(xué)法)可做比較新的變量(即相鄰兩組的平均數(shù)差)將以METHOD.1METHOD.2 與METHOD.3來代表若欲找出平均數(shù)的臨界點則讀者需檢驗標(biāo)準系數(shù)這些標(biāo)準系數(shù)可由選項CANON得出當(dāng)這些標(biāo)準系數(shù)在某一個重復(fù)觀察點之后突然變得極小則這個點就是所謂的臨界點這類型的轉(zhuǎn)換最適用于等量(或等值)的重復(fù)觀察實驗假使實驗設(shè)計不符合此條件則讀者必須將不等的值包含在括號里在一些使用藥物的實驗或時間序列的連續(xù)觀察體這個選項十分有用本章第31.7節(jié)的例六與下面的示范就是很好的例子假如重復(fù)變量DOSE下分五組1 10和20公克這些不等的藥量分別給不同的GROUP 則選項POLYNOMIAL的使用自動導(dǎo)出直線性拋物線性三次以及四次式曲線的趨勢分析(Trend PROCPROCCLASSMODELR1-R5=GROUP/NOUNI;REPEATEDDOSE5(1251020)MDOSE.1DOSE.2DOSE.3DOSE.4代表如上所述其幾何的意義分別是直線性拋物線性三次式或四次式曲線的分析在單變量變異數(shù)分析或者含MANOVA REPEATED指令的多變量變異數(shù)分析中若觀察體在任何一個自變量或因變量上有遺漏數(shù)據(jù)則GLM程序會將此觀察體排除在MANOVAREPEATED的因變量上有遺漏數(shù)據(jù)PROCGLM仍會將它包括在分析內(nèi)32章離差平方和(SS)四類型的SS本章介紹SAS變異數(shù)分析程序中最的概念即四種類型的離差平方和(SumofSquares)其定義與統(tǒng)計的檢定在SAS的變異數(shù)分析程序里(如GLM PANOVA)每一種實驗效果的離差平方和都被歸納成第一型第二型第三型第四型這種分類是便于統(tǒng)計分析的檢定而非統(tǒng)計學(xué)上公認的分類方式若讀者對這四型的離差平方和有可參考FreundLitl及Spector1986合著的SASSystemforLinearModels在變異數(shù)分析里哪些線性函數(shù)是可估計Y= 由此導(dǎo)出E(Y)=X因為殘差(或作余差即上式中的)之平均數(shù)等于0變異數(shù)分析的最終目的就是估計矩陣的元素或是這些元素的線性組合如L到底那一種線型組合(或線性函數(shù))才是可估計的(Estimable)?這個問題的答案有其充份且必要的條件現(xiàn)簡述如下 KY由于E(KY)=E(KX 因此L的導(dǎo)出是根據(jù)X矩陣中橫列的線性組合而來的只要這個線性組合存在則L就是可估計的參數(shù)線性函數(shù)進一步說由于X=[X(X'X)-1(X'X)] 因此L也可以由(X'X)或(X'X)-1(X'X)等矩當(dāng)L的可估計性被建立后則 的估計就十分簡單了根據(jù)最小平方誤差的理論可用下式估計=b=(X'X)-所以Lb也就是L 的最小平方誤差的估計值若將Lb以統(tǒng)計檢定的觀念來處理則下列的虛無假設(shè)可用F檢定來考驗H0: F檢定的分子是由Lb的離差平方和決定的亦即SS(Lb)=(Lb)'[L(X'X)-1L']-F一因子的變異數(shù)假一個一因子的變異數(shù)分析(自變量下分為三組)其線性模型如Y=+Ai+Ei=12另外假定此實驗中有六名被試X與110011001010=101010011001根據(jù)這些定義X矩陣的每一橫列都可演繹成一個可估計的線性函數(shù)L由于X的橫列間有重復(fù)的現(xiàn)象我們可使之簡化然后定義一個X*矩陣1101100101010011001010-001-X*XL1001010-001-到底這三個矩陣之間的關(guān)系如何?這個問題的答案可從它們各自對應(yīng)的L函數(shù)看出首先讓我們定義L1L2與L3為三個非零的實數(shù)(也就是說這三個值不可同時等于0)則它們所導(dǎo)出的可估計之L函數(shù)如下X*L=L1*(1100)+L2*(1010)+L3*(100 X** 從上面的例子中我們或許對所謂的L函數(shù)有一個粗淺的認識從X*和X**矩陣所導(dǎo)出的L函數(shù)其第一個元素是另外其他元素的總和這是因為在變異數(shù)分析里各實驗效果(TreatmentEffects)加起來等于0 所以主效果的自由度是組數(shù)減1 一個函數(shù)若符合上述的條件則此函數(shù)就是一個L函數(shù)然而并非所有的L函數(shù)都是最簡潔的那么到底那一種函數(shù)才是最好的呢?SAS的系統(tǒng)里最簡潔的L(X'X)-1(X'X)L計其數(shù)學(xué)模型是 +Ai 這個模型的可估計函數(shù) 等于 于是L=(L1 而參數(shù)(見本節(jié)初的 矩陣)中只有A1 A3對我們最有意義由于L1=0(即 對應(yīng)的系數(shù)必須是0) 其余L2與L3則可輪流以非零的實數(shù)代入鑒于L函數(shù)只有兩個自由度因此首先可用L2=1 L3=0帶入然后再以L2=0 L3=1帶入如此L成了一個2*4的矩陣如下010-001-這個L矩陣 (從 所計算出來的平均方值(MS)則成為F檢定的分 其自由度是2(與L010-01- L*與上述的L有兩點雷同之處第一兩個矩陣的橫列都是彼此線性獨立的第二第一直行的元素必須都是0(因我們不需要估計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度產(chǎn)品責(zé)任賠償協(xié)議模板下載4篇
- 2025年中國撬桿輪扳手市場調(diào)查研究報告
- 二零二四年物流配送應(yīng)收賬款質(zhì)押融資協(xié)議3篇
- 二零二五年度贍養(yǎng)協(xié)議書:父母生活費用補貼合同
- 二零二五年度足療行業(yè)特色療法研發(fā)與應(yīng)用權(quán)轉(zhuǎn)讓協(xié)議
- 二零二五年度跨境電商股權(quán)交易及回購合作協(xié)議
- 二零二五年度輪胎保修與輪胎品牌售后服務(wù)全程跟蹤協(xié)議
- 二零二五年度退定金協(xié)議:健身俱樂部會員退訂協(xié)議
- 二零二五年度零星用工協(xié)議范本(旅游行業(yè))
- 二零二五年度非婚生子撫養(yǎng)協(xié)議關(guān)愛成長計劃
- 2024年新北師大版八年級上冊物理全冊教學(xué)課件(新版教材)
- 人教版數(shù)學(xué)四年級下冊核心素養(yǎng)目標(biāo)全冊教學(xué)設(shè)計
- JJG 692-2010無創(chuàng)自動測量血壓計
- 三年級下冊口算天天100題(A4打印版)
- 徐州市2023-2024學(xué)年八年級上學(xué)期期末地理試卷(含答案解析)
- CSSD職業(yè)暴露與防護
- 飲料對人體的危害1
- 數(shù)字經(jīng)濟學(xué)導(dǎo)論-全套課件
- 移動商務(wù)內(nèi)容運營(吳洪貴)項目三 移動商務(wù)運營內(nèi)容的策劃和生產(chǎn)
- 中考記敘文閱讀
- 產(chǎn)科溝通模板
評論
0/150
提交評論