




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、醫(yī)用SAS統(tǒng)計(jì)分析第三講一、分類(lèi)變量的統(tǒng)計(jì)推斷一、分類(lèi)變量的統(tǒng)計(jì)推斷卡方檢驗(yàn)卡方檢驗(yàn) 在SAS系統(tǒng)中,對(duì)分類(lèi)變量資料的基本統(tǒng)計(jì)分析方法主要通過(guò)FREQ過(guò)程實(shí)現(xiàn)的。FREQ過(guò)程的主要功能有: 1.產(chǎn)生一維或多維頻數(shù)表; 2.計(jì)算各種表中格子的理論頻數(shù)、構(gòu)成比和各種率; 3.對(duì)分類(lèi)變量資料作相應(yīng)的假設(shè)檢驗(yàn)。q FREQ過(guò)程的語(yǔ)句及說(shuō)明 主要格式: PROC FREQ 選擇項(xiàng); TABLES 表達(dá)式/ 選擇項(xiàng); WEIGHT ; 說(shuō)明: vPROC過(guò)程選擇項(xiàng) data=數(shù)據(jù)集; 規(guī)定PROC FREQ語(yǔ)句使用的數(shù)據(jù)集。 formchar(1,2,7)=|-+; 規(guī)定用來(lái)構(gòu)造列聯(lián)表單元的輪廓線(xiàn)和分隔線(xiàn)
2、的字符(只有三個(gè)字符)。1為垂線(xiàn),2為水平線(xiàn),7為水平與垂直的交叉線(xiàn)。vTABLES語(yǔ)句 PROC FREQ過(guò)程中可有多條TABLES語(yǔ)句,TABLES語(yǔ)句后可接多個(gè)表格表達(dá)式,每個(gè)表達(dá)式可包含任何數(shù)量的變量,從而得到所需的表格。 如果TABLES語(yǔ)句缺省,則FREQ過(guò)程對(duì)數(shù)據(jù)集中的所有變量都給出相應(yīng)的一維頻數(shù)表。不規(guī)定任何選項(xiàng)時(shí),若需某變量的一維頻數(shù),F(xiàn)REQ給出該變量每一水平的頻數(shù)(freqency)、累積頻數(shù)(cumulative freqency)、頻數(shù)的百分比(percent)和累積百分比(cumulative percent);若需二維頻數(shù)表,F(xiàn)REQ產(chǎn)生交叉分組列表,即包括各格的
3、頻數(shù)、總頻數(shù)的格百分?jǐn)?shù)、行頻數(shù)的格百分?jǐn)?shù)和列頻數(shù)的格百分?jǐn)?shù)。 TABLES語(yǔ)句的表達(dá)式 表達(dá)式是要求FREQ過(guò)程分析處理的一維或多維表的清單。一維表有一個(gè)變量名表示,二維表由星號(hào)“*”聯(lián)接兩個(gè)變量名表示,如a*b表示變量a與b的二維表。三維表的形式為a*b*c。TABLES語(yǔ)句的選擇項(xiàng)1.普通選項(xiàng)out數(shù)據(jù)集 建立一個(gè)包含變量值和頻數(shù)計(jì)數(shù)的輸出數(shù)據(jù)集。如果TABLES語(yǔ)句中不止一個(gè)表達(dá)式,數(shù)據(jù)集的內(nèi)容相應(yīng)于TABLES語(yǔ)句中最后一個(gè)表達(dá)式的表格。2.統(tǒng)計(jì)分析主要選項(xiàng)chisq 對(duì)每層作2檢驗(yàn),包括Pearson 2 、似然比2 和Mantel-Haenszel 2 。此外還給出與2 檢驗(yàn)有關(guān)的
4、關(guān)聯(lián)指標(biāo)包括Phi系數(shù)、列聯(lián)系數(shù)和Cramers V。對(duì)于22表,給出Fisher精確概率。 agree 進(jìn)行配對(duì)2 檢驗(yàn)(McNemars檢驗(yàn)); 一致性檢驗(yàn)的Kappa值。exactexact 對(duì)大于22的列聯(lián)表計(jì)算Fisher精確概率。同時(shí)也給出CHISQ選項(xiàng)的全部統(tǒng)計(jì)量。 cmhcmh 給出Cochran-Mantel-Haenszel統(tǒng)計(jì)量,主要用于行列表的統(tǒng)計(jì)分析。對(duì)于分層22表,cmh過(guò)程給出總體相對(duì)危險(xiǎn)度估計(jì)及其可信區(qū)間,還給出各層關(guān)聯(lián)度指標(biāo)是否齊性的Breslow檢驗(yàn)。measures 對(duì)每層的二維表計(jì)算一系列關(guān)聯(lián)指標(biāo)及相應(yīng)的標(biāo)準(zhǔn)誤,包括Pearson和Spearman相關(guān)系
5、數(shù),以及Gamma和Kendall系數(shù)等。對(duì)于22表,還給出常用的危險(xiǎn)度指標(biāo)及其可信區(qū)間。all 給出chisq,measures,cmh所請(qǐng)求的全部統(tǒng)計(jì)量。Alpha= 給出檢驗(yàn)水準(zhǔn)。缺省為0.05.expected 給出期望頻數(shù)。3.禁止輸出選項(xiàng)nofreq 不給出列聯(lián)表中的格頻數(shù) nopct 不給出列聯(lián)表中的格百分?jǐn)?shù) norow 不給出列聯(lián)表中各格的行百分?jǐn)?shù) nocol 不給出列聯(lián)表中各格的列百分?jǐn)?shù) nocum 不給出頻數(shù)表的累積頻數(shù)和累積百分?jǐn)?shù) noprint 不給出表格,但給出CHISQ、CMH等語(yǔ)句所指定的統(tǒng)計(jì)量。vWEIGHT語(yǔ)句 指明該變量為頻數(shù)。只能使用一個(gè)WEIGHT語(yǔ)句,
6、且該語(yǔ)句作用于所有的表。 q 四格表資料的卡方檢驗(yàn)書(shū)中例10-1data chisq1; do r=1 to 2; do c=1 to 2; input f ; output; end; end;cards;63 17 31 68;proc freqFormchar(1,2,7)=|-+;weight f;tables r*c/chisq;run; 卡方檢驗(yàn)結(jié)果 TABLE OF R BY C R C Frequency|二維表每個(gè)格子的頻數(shù) Percent |每個(gè)格子的頻數(shù)在總頻數(shù)中的百分比。 Row Pct |行百分?jǐn)?shù),每格子頻數(shù)占該行合計(jì)頻數(shù)的百分比。 Col Pct | * 1| 2|
7、 Total -+-+-+ 1 | 63 | 17 | 80 | 35.20 | 9.50 | 44.69 | 78.75 | 21.25 | *列百分?jǐn)?shù),每格子頻數(shù)占 | 67.02 | 20.00 | 該列合計(jì)頻數(shù)的百分比。 -+-+-+ 2 | 31 | 68 | 99 | 17.32 | 37.99 | 55.31 | 31.31 | 68.69 | | 32.98 | 80.00 | -+-+-+ Total 94 85 179 52.51 47.49 100.00 STATISTICS FOR TABLE OF R BY CStatistic DF Value Prob-Chi-S
8、quare 1 39.927 0.001Likelihood Ratio Chi-Square 1 41.860 0.001Continuity Adj. Chi-Square 1 38.047 0.001Mantel-Haenszel Chi-Square 1 39.704 0.001Fishers Exact Test (Left) 1.000 (Right) 1.44E-10 (2-Tail) 1.64E-10Phi Coefficient 0.472Contingency Coefficient 0.427Cramers V 0.472Sample Size = 1792值; 似然比2
9、值; 連續(xù)性校正2值; M-H 2值; Fishers 精確概率值; Phi 系數(shù); 列聯(lián)系數(shù); 可萊姆的V值q 四格表2 值的校正 例 王潔貞主編醫(yī)學(xué)統(tǒng)計(jì)學(xué)例6.4 表6-3 2種藥物治療白色葡萄球菌敗血癥結(jié)果處 理 有 效 無(wú) 效 合 計(jì) 甲 藥 乙 藥 合 計(jì) 33(31.02) 6( 7.98) 2(3.98) 3(1.02) 35 9 39 5 44本例有兩個(gè)格的1T40,故對(duì)2值進(jìn)行校正。程序data chi; do r=1 to 2; do c=1 to 2; input f ; output; end; end;cards; 33 2 6 3 ;proc freq formch
10、ar(1,2,7)=|-+; weight f; tables r*c/chisq expected nocol norow nopct;run; R C Frequency | Expected | 1| 2| Total -+-+-+ 1 | 33 | 2 | 35 | 31.023 | 3.9773 | -+-+-+ 2 | 6 | 3 | 9 | 7.9773 | 1.0227 | -+-+-+ Total 39 5 44 STATISTICS FOR TABLE OF R BY CStatistic DF Value Prob-Chi-Square 1 5.422 0.020Like
11、lihood Ratio Chi-Square 1 4.367 0.037Continuity Adj. Chi-Square 1 3.026 0.082Mantel-Haenszel Chi-Square 1 5.299 0.021Fishers Exact Test (Left) 0.996 (Right) 0.050 (2-Tail) 0.050Phi Coefficient 0.351Contingency Coefficient 0.331Cramers V 0.351Sample Size = 44WARNING: 50% of the cells have expected co
12、unts less than 5. Chi-Square may not be a valid test.q 配對(duì)四格表資料的卡方檢驗(yàn) 配對(duì)四格表資料屬于2 2列聯(lián)表。根據(jù)分析的目的可分為關(guān)聯(lián)性檢驗(yàn)和差別性檢驗(yàn)。 如醫(yī)學(xué)統(tǒng)計(jì)學(xué)王潔貞主編例6.8 某研究者用甲、乙2種試劑檢驗(yàn)132種血清,結(jié)果見(jiàn)表6-7,問(wèn)2種試劑的檢驗(yàn)結(jié)果有無(wú)關(guān)系以及有無(wú)差別?v關(guān)聯(lián)性檢驗(yàn)(獨(dú)立性檢驗(yàn)) 應(yīng)用一般的2檢驗(yàn)H0:甲、乙兩試劑的檢驗(yàn)結(jié)果無(wú)關(guān)系。 tables語(yǔ)句選擇 chisq; 如2檢驗(yàn)有統(tǒng)計(jì)學(xué)意義,通過(guò)列聯(lián)系數(shù)(Contingency Coefficient)說(shuō)明兩者的關(guān)聯(lián)性。v差別性檢驗(yàn)(一致性檢驗(yàn)) 應(yīng)用M
13、cNemars Test H0:兩總體的B=C,即兩試劑陽(yáng)性率無(wú)差別。TTA22)(當(dāng)b+c0.05說(shuō)明總體方向是一致的,P0.05說(shuō)明總體方向是不一致的。如方向一致可以用總的OR值表示,否則不能用總的OR值表示。v 多層的行列表 程序10-6data chisq2;do hospital=1 to 2; do trt=1 to 2; do effect=1 to 3; input f ; output; end; end;end;cards;23 7 2 20 13 518 6 2 13 13 2;proc freq formchar(1,2,7)=|-+;weight f;tables h
14、ospital*trt*effect/cmh nopct nocol;run;二、二、 二項(xiàng)分布與二項(xiàng)分布與Poisson分布分布q 二項(xiàng)分布v二項(xiàng)分布的統(tǒng)計(jì)說(shuō)明二項(xiàng)分布的應(yīng)用條件 1.兩分類(lèi)對(duì)立結(jié)果資料; 2。試驗(yàn)結(jié)果是相互獨(dú)立,互不影響的。 二項(xiàng)分布的概率函數(shù)X=0,1,2,n 。 二項(xiàng)分布的分布函數(shù)至多有x例陽(yáng)性的概率為,即下側(cè)累積概率:至少有x例陽(yáng)性的概率為,即上側(cè)累積概率:XnxxnnCXP)1 ()(xXnXPxXP0)()(nxXnXPxXP)()(vSAS中二項(xiàng)分布函數(shù)SAS中二項(xiàng)分布函數(shù)表達(dá)式為:probbnml(, n, x);式中 為事件發(fā)生的概率,n為樣本含量,x為陽(yáng)性
15、事件個(gè)數(shù)。表達(dá)式計(jì)算的結(jié)果為發(fā)生陽(yáng)性事件數(shù)x的概率。例12-1data jin;p=probbnml(0.5,4,2);q=1-p;proc print;run;結(jié)果OBS P Q 1 0.6875 0.3125表明死亡2 的概率(0+1+2的概率)為0.6875;死亡2的概率(3+4的概率)為0.3124。v用二項(xiàng)分布檢驗(yàn)治療效果 例12-3 根據(jù)以往的經(jīng)驗(yàn)用一般療法治療某病,其病死率為40%,治愈率為60%。今用某種新藥治療該病人5名,這5名均治愈了。問(wèn)該項(xiàng)新藥是否比一般療法為優(yōu)。 當(dāng)實(shí)際率大于理論率時(shí),計(jì)算上則累積概率。本例應(yīng)計(jì)算: p=probbnml(0.6,5,5)-probbnm
16、l(0.6,5,4)程序12-3data binom2;p=probbnml(0.6,5,5)-probbnml(0.6,5,4);proc print;run; OBS P 1 0.07776假如 10名病人,結(jié)果1名死亡,9名治愈,則應(yīng)計(jì)算P(x9)的概率。程序12-4data binom3;p=probbnml(0.6,10,10)-probbnml(0.6,10,8);Proc print;Run; OBS P 1 0.046357v求二項(xiàng)分布的概率分布 例12-5 設(shè) =0.5,n=4,求x=0,1,2,3,4的概率data binom4;do r=0 to 4;p=probbnml
17、(0.5,4,r);q=1-p;if r=0 then d=p; elsed=probbnml(0.5,4,r)-probbnml(0.5,4,r-1);output;end;proc print;run;OBS R P Q D 1 0 0.0625 0.9375 0.0625 2 1 0.3125 0.6875 0.2500 3 2 0.6875 0.3125 0.3750 4 3 0.9375 0.0625 0.2500 5 4 1.0000 0.0000 0.0625q Poisson分布v Poisson分布的統(tǒng)計(jì)說(shuō)明Poisson分布的應(yīng)用條件 同二項(xiàng)分布,Poisson分布是二項(xiàng)分
18、布的特例, 當(dāng)很小,n很大時(shí),Poisson分布非常接近二項(xiàng)分布。 Poisson分布概率函數(shù)(X=0,1,2,) =n Poisson分布的分布函數(shù) 下側(cè)累積概率: 上側(cè)累積概率:eXXPX!)(XXPXP) 1()(xXXeXxXP0!)(nxXXeXxXP!)(vSAS中Poisson分布函數(shù)SAS中Poisson分布函數(shù)表達(dá)式為:poisson( x);式中為均數(shù)( =n),x為事件發(fā)生個(gè)數(shù)。表達(dá)式計(jì)算的結(jié)果為發(fā)生事件數(shù)x的概率。 例12-6 有人觀察紅細(xì)胞計(jì)數(shù)池中400個(gè)小格,數(shù)出每小格中紅細(xì)胞數(shù),其均數(shù)為3.6175,試計(jì)算每格中恰有細(xì)胞數(shù)5個(gè)的概率及小格數(shù)。data poisso
19、n1;p=poisson(3.6175,5)-poisson(3.6175,4)d=p*400;proc print;run;OBS P D 1 0.13861 55.4448v樣本計(jì)數(shù)與總體均數(shù)差別的統(tǒng)計(jì)意義檢驗(yàn) 例12-8 已知在一培養(yǎng)液中,有細(xì)菌數(shù)為每毫升3個(gè),今采集放在5冰箱的1ml培養(yǎng)液的細(xì)菌數(shù)5個(gè),能否說(shuō)明培養(yǎng)液中細(xì)菌數(shù)有增加? 本例=3,x=5 3,計(jì)算x5的上則累積概率。 可計(jì)算 p=1-p(n4)的概率。Data poisson3;P=1-poisson(3,4);Proc print;Run; OBS P 1 0.18474因 P0.05,尚不能認(rèn)為培養(yǎng)液中細(xì)菌數(shù)有增長(zhǎng)。
20、例 某地區(qū)以往胃癌發(fā)病率為萬(wàn)分之一?,F(xiàn)調(diào)查10萬(wàn)人,發(fā)現(xiàn)3例胃癌病人。試分析該地區(qū)現(xiàn)在的胃癌發(fā)病率是否低于以往的發(fā)病率。 本例=0.001,n=100000,x=3,=1000000.0001=10,現(xiàn)X ,應(yīng)計(jì)算x的下則累積概率。data a;p=poisson(10,3);proc print;run; OBS P 1 0.010336因P0.05,可以認(rèn)為該地區(qū)現(xiàn)在的胃癌發(fā)病率低于以往的發(fā)病率。 在SAS中,非參數(shù)統(tǒng)計(jì)主要由univariate過(guò)程和npar1way過(guò)程來(lái)實(shí)現(xiàn),前者在前面的第一講中已經(jīng)介紹,它 可以進(jìn)行配對(duì)設(shè)計(jì)差值的符號(hào)秩和檢驗(yàn)(Wilcoxon配對(duì)法);后者是一個(gè)單因素
21、的非參數(shù)方差分析過(guò)程,可進(jìn)行成組設(shè)計(jì)的兩樣本( Wilcoxon 法)或多樣本比(Kruskal-Wallis法 即H檢驗(yàn))的秩和檢驗(yàn)。 注意:npar1way過(guò)程不能處理按頻數(shù)輸入的資料。對(duì)單項(xiàng)有序資料的頻數(shù)表,可用前面講到的cmh過(guò)程的 Row Mean Scores Differ(行平均分不同)來(lái)檢驗(yàn)。 SAS不提供非參檢驗(yàn)兩兩比較的方法,其余統(tǒng)計(jì)軟件里也只有PEMS提供這一功能。 npar1way含意:“npar”是“非參”的英文縮寫(xiě),“1way”代表一個(gè)因素,合起來(lái)就是“單因素的非參數(shù)檢驗(yàn)”。千萬(wàn)不要寫(xiě)成“NPAPLWAY”!qNPAP1WAY 過(guò)程的語(yǔ)法格式過(guò)程的語(yǔ)法格式PROC
22、NPAR1WAY DATA= 選項(xiàng) ;CLASS ; 必需必需,指定要分析的分組變量EXACT ; 要求程序在必要時(shí)計(jì)算確切概率OUTPUT ;指定統(tǒng)計(jì)結(jié)果的輸出數(shù)據(jù)集VAR ; 指定要分析的因變量BY ; 統(tǒng)計(jì)按指定的變量分組進(jìn)行,要求已排序。PROC過(guò)程的選項(xiàng)MISSING 將缺失值也用于統(tǒng)計(jì)分析 ANOVA 同時(shí)進(jìn)行方差分析 MEDIAN 要求進(jìn)行中位數(shù)檢驗(yàn) NOPRINT 禁止統(tǒng)計(jì)結(jié)果在OUTPUT視窗內(nèi)輸出 SAVAGE 要求對(duì)樣本進(jìn)行SAVAGE得分分析 WILCOXON 要求進(jìn)行WILCOXON秩和檢驗(yàn), 通常必選。 在省略所有選項(xiàng)的情況下,SAS系統(tǒng)默認(rèn)輸出所有的統(tǒng)計(jì)結(jié)果,這恰
23、恰說(shuō)明了非參數(shù)檢驗(yàn)方法的不完善。 q 配對(duì)資料的符號(hào)秩和檢驗(yàn) 和配對(duì)t檢驗(yàn)過(guò)程一樣,用Proc univariate過(guò)程,結(jié)果觀察Sgn Rank (即T值)Pr=|s| (即P值)。如例13-1 T值=-8.5,P=0.3594。(SAS程序略)q 兩樣本成組比較程序13-2data npar1;do c=1 to 2;input n;do I=1 to n;input x ; output;end; end;cards;12134 146 104 119 124 161 107 83 113 129 97 123770 118 101 85 107 132 94;proc npar1way
24、 wilcoxon;class c;Var x; run; N P A R 1 W A Y P R O C E D U R E Wilcoxon Scores (Rank Sums) for Variable X Classified by Variable C Sum of Expected Std Dev MeanC N Scores Under H0 Under H0 Score 樣本量 各組的秩和 各組的期望秩和 秩和的標(biāo)準(zhǔn)差 各組的平均秩和1 12 140.500000 120.0 11.8269689 11.70833332 7 49.500000 70.0 11.8269689 7.0714286 Average Scores Were Used for Ties Wilcoxon 2-Sample Test (Normal Approximation) (with Continuity Correction of .5) S = 49.5000 Z = -1.69105 Prob |Z| = 0.0908 (按正態(tài)近似法作秩和檢驗(yàn),較小樣本秩和=49.5,z=-1.69105,P=0.0908) T-Test Approx. Significance = 0.1081
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京鏈家購(gòu)房合同范本
- 產(chǎn)品攝影廣告合同范例
- 劇目買(mǎi)斷合同范本
- 融資收費(fèi)合同范本
- 勞動(dòng)合同范本解除
- 單位車(chē)輛外包服務(wù)合同范本
- 分期出租房合同范本
- 醫(yī)療服務(wù)協(xié)議合同范本
- 單位招聘保安合同范本
- 分項(xiàng)付款合同范本
- PySide學(xué)習(xí)教程
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:chapter1 Introduction
- 人教三年級(jí)數(shù)學(xué)下冊(cè)表格式全冊(cè)
- 事業(yè)單位綜合基礎(chǔ)知識(shí)考試題庫(kù) 綜合基礎(chǔ)知識(shí)考試題庫(kù).doc
- 優(yōu)秀教研組評(píng)比制度及實(shí)施細(xì)則
- 譯林初中英語(yǔ)教材目錄
- 物業(yè)交付后工程維修工作機(jī)制
- 農(nóng)作物病蟲(chóng)害專(zhuān)業(yè)化統(tǒng)防統(tǒng)治管理辦法
- JJF 1752-2019全自動(dòng)封閉型發(fā)光免疫分析儀校準(zhǔn)規(guī)范(高清版)
- GB 1886.300-2018 食品安全國(guó)家標(biāo)準(zhǔn) 食品添加劑 離子交換樹(shù)脂(高清版)
- 食品經(jīng)營(yíng)單位經(jīng)營(yíng)場(chǎng)所和設(shè)備布局、操作流程示意圖模板
評(píng)論
0/150
提交評(píng)論