SAS學(xué)習(xí)系列15 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)Ⅱ_第1頁
SAS學(xué)習(xí)系列15 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)Ⅱ_第2頁
SAS學(xué)習(xí)系列15 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)Ⅱ_第3頁
SAS學(xué)習(xí)系列15 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)Ⅱ_第4頁
SAS學(xué)習(xí)系列15 統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)Ⅱ_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

15.統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)II—統(tǒng)計(jì)表,統(tǒng)計(jì)圖(七)統(tǒng)計(jì)表統(tǒng)計(jì)表和統(tǒng)計(jì)圖都是表達(dá)統(tǒng)計(jì)資料的重要工具。統(tǒng)計(jì)表,表達(dá)統(tǒng)計(jì)資料具體、明確,可以用來表達(dá)定性資料、定量資料、混合型資料;統(tǒng)計(jì)圖,表達(dá)統(tǒng)計(jì)資料形象、生動(dòng),但只能要么表達(dá)定性資料、要么表達(dá)定量資料。一、表達(dá)定性資料的統(tǒng)計(jì)表1.二維2X2表列聯(lián)表(2個(gè)定性指標(biāo))(1)完全隨機(jī)設(shè)計(jì)從全體對(duì)象中隨機(jī)抽取n個(gè)個(gè)體,然后按屬性A、B的兩個(gè)分類進(jìn)行兩兩組合分成四格,得到相應(yīng)的2X2的頻數(shù)表。寰3.Ll完全隨機(jī)設(shè)計(jì)2X2表格式屬性例數(shù)A屬性恥Bsbe合計(jì)A,Abe—Cdf合計(jì)ghrtHC:A,B兩屬性獨(dú)立兩屬性不獨(dú)立若把全體研究對(duì)象按因素A(是否接觸某危險(xiǎn)因素)分為兩組(接觸組、非接觸組),再對(duì)每組的個(gè)體進(jìn)行跟蹤觀察,并按因素B(是否患?。┓殖蓛山M(患病組、未患病組),得到的2X2表。*3.1-3隊(duì)到研究設(shè)計(jì)2X2^格式(臼因素吳)是否接觸某例數(shù)危險(xiǎn)因素追蹤結(jié)果;發(fā)病未發(fā)病舍計(jì)接觸abe非接觸亡df合計(jì)ghnHs接觸組與非接觸炬的發(fā)病率相等節(jié)接觸組與非接觸組的發(fā)病率不季(3)病例-對(duì)照研究設(shè)計(jì)若把全體研究對(duì)象按因素B(是否患某?。┓殖蓛山M(病例組、對(duì)照組),再對(duì)每組中的個(gè)體進(jìn)行回顧性調(diào)查,并按因素A(是否接觸某危險(xiǎn)因素)分成兩組,得到的2X2表。?3^14病例-對(duì)照研究設(shè)計(jì)2X2衰格式〔由果索因〕叵顧接觸某危例數(shù)險(xiǎn)因素的歷史事前狀態(tài):病例對(duì)照合計(jì)接雌到be非接觸cdr合計(jì)ghnHs病例組與時(shí)照粗接艇某危險(xiǎn)因素的比例相同.Hu病例蛆與對(duì)照組接觸某危陶因素的比例不同(4)配對(duì)研究設(shè)計(jì)n個(gè)受試對(duì)象(或一組樣品)分別用甲乙兩種檢測方法進(jìn)行檢測,并按測定結(jié)果(陽性+,陰性-)分類計(jì)數(shù),即按“都為陽性,一陽一陰,一陰一陽,都為陰性”四種情況分別計(jì)數(shù),得到的2X2表。2配對(duì)設(shè)計(jì)2X2衰指式mth例數(shù)乙法:合計(jì)abeCdf合計(jì)ghn=甲'乙法指甲,乙法溯定的結(jié)果2X2列聯(lián)表,都可以作相關(guān)分析(兩屬性是否有相關(guān)關(guān)系)、獨(dú)立性檢驗(yàn)(或兩總體率之間差異的顯著性檢驗(yàn),用Fisher精確檢驗(yàn));2X2隊(duì)列研究設(shè)計(jì),常需要先計(jì)算相對(duì)危險(xiǎn)度RR(=af/ce),并做假設(shè)檢驗(yàn):H0:RR=1;H1:RR=0.做該檢驗(yàn)需要用Mantel-Haenszel2統(tǒng)計(jì)量(U統(tǒng)計(jì)量)。2X2隊(duì)列研究設(shè)計(jì)和2X2病例-對(duì)照研究設(shè)計(jì),可由經(jīng)驗(yàn)Logistic變換公式計(jì)算Zi統(tǒng)計(jì)量,進(jìn)而做U檢驗(yàn)。2X2配對(duì)研究設(shè)計(jì),檢驗(yàn)兩種檢測方法之間有無顯著性差別。2.二維RXC列聯(lián)表(R,CN2)(1)雙向無序RXC表

表3.2.1某地6(1舛入按2料血型劃分的姑果較3.A2心律失常神姿與心肌梗寒邯檢的類裱ABO血型人數(shù)綴慢心尊失常攫塞例數(shù)MN血型:MNMN合計(jì)部位;下壁前壁A后壁』1>內(nèi)膜下含計(jì)O4314909021823竇性迎緩B721擂A3884103001598被動(dòng)心律1100;B4%商9502032房室阻滯631111AE137179325641束支阻常1161。15合計(jì)14511瀚;29776094合計(jì)Ifi274249魅幼心律的全秋為%動(dòng)性交界性心律單向有序RXC表_233種新物療效的觀察結(jié)果表3.N4患者痰液中舍■與霸型的關(guān)系例散*例數(shù)療效細(xì)魔藥物:ABC合計(jì)病型:A型B型C型D型合計(jì)治窸154J20-035311顯效4991573+25751&好轉(zhuǎn)31504512BH953320無效5型2451卅622010合計(jì)1。。&585270合計(jì)1715171160SE代相唁費(fèi)地胞雙向有序?qū)傩圆煌琑XC表■3.盆5眼品找怖混濁曜與年前之關(guān)系表3.此感肺門費(fèi)度與矽肺期權(quán)之關(guān)栗品狀傳混濁程度眼數(shù)肺門磨度級(jí)別患者例散3。?40—合計(jì)矽師期次;[期】期,期合計(jì)T密3311我m+43165QH671C1128296H1睇辨17擁1卅44$313:239卅147255]41合計(jì)赫2954081029合計(jì)24515978m雙向有序?qū)傩韵嗤琑XC表as.2.#學(xué)生文化課與悼膏課成■之美矗*X7兩法松有盍璧收席返動(dòng)的符合情況文化課字生人數(shù)府比法冠心病息者數(shù)成績體育:不及格及格鼠好優(yōu)秀合計(jì)測定結(jié)果核素法』正常喊弱異常合計(jì)不及格47A322正常5S23的及格556.7415150弱142750良好103212$1718?常81734優(yōu)秀6_.七13A36臺(tái)汁6T5327U7合—計(jì)_251.0412343舞5適用的分析、檢驗(yàn)方法:W*列聯(lián)哀的分糞及其適用的蜒計(jì)分析方法變量的統(tǒng)汁性質(zhì)及其專業(yè)屬性列聯(lián)表分類列聯(lián)表的編號(hào)適用的垸計(jì)分析方法—X.Y皆為》義變量且屬性不同雙向無序喪表3.2.Cb2)X*檢驗(yàn).Finher精嘛檢融X.Y之一名義變量且展性不同單向有.序霞由.4(3>4)軼和檢也CPD分析X.Y皆為有序變居且屬性不同戲向有序表表土2,〔5?相關(guān)分析,線性著髀檢驗(yàn)X、Y皆為有序委it且屑性相同雙向有屋靠表以C7j8)“致性物驗(yàn).待珠模型分析各伸利聯(lián)表資料幾平都叮逐用對(duì)敢能性模型利logistic回歸模型來分析雙向無序RXC表,所選用的統(tǒng)計(jì)方法應(yīng)當(dāng)與分組變量各水平的先后順序或取值大小無關(guān),僅與表中總頻數(shù)、各行的合計(jì)、各列的合計(jì)有關(guān)。符合這些要求的方法有Pearson的擬合優(yōu)度檢驗(yàn)X2檢驗(yàn)、基于似然函數(shù)(或熵的分解)導(dǎo)出的似然比X2檢驗(yàn)、對(duì)數(shù)線性模型、SAS的FREQ過程步進(jìn)行Fisher精確檢驗(yàn)。單向有序RXC表,所選用的統(tǒng)計(jì)方法應(yīng)當(dāng)與有序的那個(gè)分組變量各水平的先后順序或取值大小有關(guān)。顯然,通常的X2檢驗(yàn)已無能為力,應(yīng)考慮把有序變量當(dāng)作半定量指標(biāo)在計(jì)算中加以考慮的方法:秩和檢驗(yàn)、Ridit檢驗(yàn)、CPD分析、有序變量的Logistic回歸模型、有序變量的對(duì)數(shù)線性模型。雙向有序?qū)傩圆煌琑XC表,當(dāng)把兩個(gè)屬性看成地位平等的相互關(guān)系時(shí),常需要考慮它們之間是否存在線性關(guān)系,即需要對(duì)資料進(jìn)行相關(guān)分析(Spearman秩相關(guān)分析、典型相關(guān)分析);若把一個(gè)屬性當(dāng)成自變量,另一個(gè)屬性當(dāng)成因變量,常需要考察它們之間是否存在直線變化趨勢,即需要對(duì)資料進(jìn)行線性趨勢檢驗(yàn)(U檢驗(yàn)、X2檢驗(yàn)“利用回歸思想產(chǎn)生的與線性回歸有關(guān)的X2分量和偏離線性回歸的X2分量”)。雙向有序?qū)傩韵嗤琑XC表,兩個(gè)分組變量都是“測定結(jié)果”,且檔次劃分也相同(有序)。對(duì)這種資料,研究者關(guān)心的不是兩變量之間是否存在相關(guān)性或線性趨勢,而是這兩種測定結(jié)果的一致性如何。適合采用一致性檢驗(yàn):Kappa檢驗(yàn)。特別地,如表3.2.8,研究者可能更關(guān)心:文化課成績與體育鍛煉達(dá)標(biāo)的等級(jí)之間是否呈現(xiàn)某種特殊的變化趨勢(直線趨勢模型,即主對(duì)角線上的頻數(shù)占大多數(shù),之外的頻數(shù)之和趨于0),可以用前面線性趨勢檢驗(yàn)、或一些特殊模型:對(duì)稱模型、條件對(duì)稱模型、對(duì)角線模型。注:有時(shí)候若想要更多的挖掘RXC表的統(tǒng)計(jì)信息,還可以對(duì)RXC表進(jìn)行分割,得到若干2X2表做進(jìn)一步研究。高維列聯(lián)表(變量個(gè)數(shù)N3)例如,下面是三維列聯(lián)表:*331收航壓血中膽固S?與心曜病之關(guān)系是否患有冠心?。╒)擔(dān)固辭含量Cmranl/lJ數(shù)〔A)<B1;<127127-L47~合計(jì)有<5.ISQ334125.18-3203g5.70—8116631孑6.73712111141無<5.18'11712147Z23Q75.18?85拐43205.70-1192095843虛家,?3679933245合計(jì)4085552241421329處理高維列聯(lián)表資料的方法,借助統(tǒng)計(jì)軟件有Logistic回歸模型(只能分析自變量對(duì)因變量的影響)、對(duì)數(shù)線性模型(可分析全部變量及其交互作用對(duì)列聯(lián)表中格網(wǎng)格上理論頻數(shù)之對(duì)數(shù)的影響);也可以將高維列聯(lián)表壓縮為二維列聯(lián)表再進(jìn)行處理。具有重復(fù)測量設(shè)計(jì)的定性資料(做方差分析)(1)單因素重復(fù)測量資料:表心室早捕病人在用藥前后的心率括人導(dǎo)ISMA(01:用裕前3=AS3:C指4:3蟄M&e甲方和13>44>0673197i>.£C2S914%■5752<595523358凌51373?33174697329774?2£221274S259717228471.002D430S676S747227S6S>.5019374674113072J0275.50228527S7751067434285.50299068技曲76§928571去2D60599Q7482S0SI.502670。718.00GQL。。7U.D0614^9Z&657虬786L337S.67ASL3374.03平方和58J3tfB0041海網(wǎng)058175.DO43752.00藥物水平數(shù)嚀4每址觀察例數(shù)心*觀察值尊個(gè)數(shù)A-axw=36方差分析的總思想:將總變異分解為:個(gè)體間(betweensubjects)變異與個(gè)體內(nèi)的變異。其中個(gè)體內(nèi)變異是與重復(fù)因素有關(guān)的變量。

(2)雙因素重復(fù)測量資料服藥后測%時(shí)間服藥后測%時(shí)間(j)(Ok1(頃膠建型=1/-9.7354.(51膠建型=1/-9.7354.(51SQ.877.9623,432.3718.652.3755.2432.088.34132.1L805.4055.9146.8179.9062.3756.0076.0593.3565.4773,4576.27102.097.8385.8。73.9547.56214.5255.03255.6745,15195.6423O.P762.37278.8060.23248.5392.83433.1。60.14227.09Ti.44「57372,38627/1554,75484112083.42片制型14.660.840.582,142.306.172.451.5829.0025,0017.3453.4025.85片制型14.660.840.582,142.306.172.451.5829.0025,0017.3453.4025.8544.0048.S853.8064,5669.7773.8345.8058.8。30.3052.2444,2561.6066.6562.0053.2557.8070.2031.5532,3855.8054,4357.3147.9567.06176.43155.27199.9S207,0924S.S4179.02243.45213.14f3。血:ZSL99445.744"994J.7."16W4.22行7§.396壯371073.聲1。2%7490L793707否4E=(9.73尸+(54-61廠+…+(30.3OF+17O.")'=233Dl左38方差分析總思想:將總變異分解為:對(duì)象間(betweensubjects)變異與對(duì)象內(nèi)(withinsubject)變異,其中對(duì)象內(nèi)變異是與重復(fù)因素有關(guān)的變量。二、定量資料的統(tǒng)計(jì)表1.隨機(jī)區(qū)組設(shè)計(jì)一元定量資料表2不同藥物作用后小白鼠肉瘤重量。區(qū)組肉瘤重量藥物:A藥B藥C藥10,820.650,5120.730.540.2330.430340.2840.410210.3150.680.430.24

適合做方差分析,事先需要檢驗(yàn)正態(tài)性和方差齊性(若不滿足則要數(shù)據(jù)變換和非參數(shù)檢驗(yàn))。2.含一個(gè)協(xié)變量的隨機(jī)區(qū)組設(shè)計(jì)一元定量資料表26.1牡蠣在不同溫度和位置上的生長數(shù)據(jù).位置+重.域數(shù),華怎為初始體重.y為最后?體重)一-23-4-Xpyq丁1(入口底部)#27.2,32.6-32.036.633.0.37.7.26.8-31。一2(入口頂部)『28.6.33.8一26.&31.7-26.530.7.26.8-30.43(出口底部).28.6.35.2-22.4,291.23.2-289244302、4(出口頂部)*293.35.0-21.8.27.0-30,&36424,3.30孔5(附近中部)?204.24.6-19.&23.4-25.L30.3.18.L2L&.初始體重x是協(xié)變量,適合做一元協(xié)方差分析(若含有多個(gè)協(xié)變量,則要做多元協(xié)方差分析)。3.拉丁方設(shè)計(jì)一元定量資料4X4拉丁方設(shè)計(jì):表1不同中藥組測得的血凝時(shí)間魄編號(hào)試如序號(hào):1中藥代號(hào)(血凝時(shí)間2341C(85)D(102)A(90)B(100)20(108)A(88)B(llO)C(80)3A(95)B(98)C(82)D(110)4B(105)C(78)0(104)A(92)注:拉丁方要求分組數(shù)和處理數(shù)相同,在每行每列各種處理都出現(xiàn)且僅出現(xiàn)一次。既要控制系統(tǒng)誤差且試驗(yàn)動(dòng)物的數(shù)量又較少,則常采用拉丁方設(shè)計(jì)(處理數(shù)不能太多,一般以4?10個(gè)為宜)?;疽螅海?)必須是三個(gè)因素(分組、處理、結(jié)果)的實(shí)驗(yàn),且三個(gè)因素的水平數(shù)相等(若三因素的水平數(shù)略有不同,應(yīng)以主要處理因素的水平數(shù)為主,其它兩因素的水平數(shù)可進(jìn)行適當(dāng)調(diào)整);(2)三因素間是相互獨(dú)立的,均無交互作用;(3)各行、列、字母所得實(shí)驗(yàn)數(shù)據(jù)的方差齊。4.配對(duì)交叉設(shè)計(jì)一元定量資料示例:兩階段交叉設(shè)計(jì)表4A,B兩種瓠撕下的體蝦降量施組別受試者號(hào)-體礦降量財(cái)受試者號(hào)-體重下降量姆前4周后倜前倜后4周AB16.129-0.454BA34,4492.043214970.90854,9441.816443130.45470,4540.13615402.72490,2271.2711.4981.135101,5891.271118J721.313120.1361.589當(dāng)試驗(yàn)中涉及到一個(gè)具有2水平的試驗(yàn)因素,這兩個(gè)水平要先后作用于同一個(gè)受試對(duì)象,并且這兩個(gè)水平要么在條件相近的同一對(duì)受試者中交叉實(shí)施,就稱為配對(duì)二階段交叉設(shè)計(jì);要么在兩組受試者中交叉實(shí)施,就稱為成組二階段交叉設(shè)計(jì)??梢钥疾煲粋€(gè)具有兩水平的試驗(yàn)因素和兩個(gè)受試對(duì)象組因素(即個(gè)體差異、測定順序)對(duì)觀測結(jié)果的影響;試驗(yàn)因素的兩個(gè)水平在兩組受試對(duì)象中施加的順序呈交叉狀;對(duì)于每一個(gè)受試者而言,均有一個(gè)“洗脫期”,從而消除“攜帶效應(yīng)”的影響。另外,還有三階段交叉設(shè)計(jì)、3X3交叉設(shè)計(jì)(將三種處理或藥物分三個(gè)時(shí)期先后給予同一個(gè)受試者,觀察受試者接受每種處理后的反應(yīng);處理A、B、C施加的順序共有6種排列方式,即ABC、ACB、BAC、BCA、CAB、CBA,故至少要將受試者分為6個(gè)組,每組中至少要有一位受試者)。析因設(shè)計(jì)析因設(shè)計(jì)(factorialdesign)是一種多因素的交叉分組設(shè)計(jì)。它不僅可檢驗(yàn)每個(gè)因素各水平間的差異,而且可檢驗(yàn)各因素間的交互作用。兩個(gè)或多個(gè)因素如存在交互作用,表示各因素不是各自獨(dú)立的,而是一個(gè)因素的水平有改變時(shí),另一個(gè)或幾個(gè)因素的效應(yīng)也相應(yīng)有所改變;反之,如不存在交互作用,表示各因素具有獨(dú)立性,一個(gè)因素的水平有所改變時(shí)不影響其他因素的效應(yīng)。2X2X2析因設(shè)計(jì)ABi日2SC2ClA】A)B]C]A]B]CgA]B?CiA-^2?2^22X2X2=8種處理

表3.9不同飼料喂養(yǎng)豬的平均日增重量(kg)A]BiC“A]Bi%A[B?CiAiB^C?A】BiCiA^HiCzAaB^C]合計(jì)0.550.770.510480730.840.670.420.540.600,570,610,700.620.600.600.740.580,680,590,590.670.630.640.710.740.660.620.610.660.660.4S0620.610.430.490.690.760.610.550.580.570J00.490.540730570.480.560.720.580.520.700.630.670.540.?10.790,650,4?0,610.610.71(149T4.S15.384.584295.175.525.124.2039.0:82.9m3.67642.676S2.3257■3.3729■—3.85403.29142.24L024.3785,1裂區(qū)試驗(yàn)設(shè)計(jì)先將每一區(qū)組按第一因素的處理數(shù)劃分小區(qū)(稱為主區(qū)),在主區(qū)里隨機(jī)安排主處理,然后在每個(gè)主處理里按第二因素的處理數(shù)再劃分小區(qū)(稱為副區(qū)),在副區(qū)里隨機(jī)排列副處理。.主迎理A制業(yè)樣B區(qū)組:nIB%292S32b2373231100B;1.8L+1749如1716154S10130952S6A:Bl28292582B,3128298S氐1313103613121237858276243B:30272CS3為312S3190國1514M40&41615134419284SI25727B256252■3r=786注:有時(shí)候在表中使用“無S”或“M(Q1?Q3)”簡化形式表示數(shù)據(jù)。(八)統(tǒng)計(jì)圖一、定量變量的統(tǒng)計(jì)圖形1.直方圖(histogram)對(duì)于數(shù)值型變量,常用直方圖來展示某個(gè)變量取值的分布。將變量取值的范圍分成若干區(qū)間,在等間隔區(qū)間的情況,每個(gè)區(qū)間的長度稱為組距??疾鞌?shù)據(jù)落入每一區(qū)間的頻數(shù)與頻率,在每個(gè)區(qū)間上畫一個(gè)矩形,它的寬度是組距,它的高度可以是頻數(shù)、頻率或密度(頻率/組距),在高度是密度的情況,每一矩形的面積恰是數(shù)據(jù)落入?yún)^(qū)間的頻率。這種直方圖可以估計(jì)總體的概率密度。2.盒形圖(boxplot)盒形圖(也稱箱圖、箱線圖、盒子圖)是用更為簡潔的方法表現(xiàn)數(shù)據(jù)在數(shù)軸上的分布及其特點(diǎn)的圖形。例如,下圖是分地區(qū)情況對(duì)家庭收入所繪的盒形圖:

3.散點(diǎn)圖(ScatterPDot通常得到的數(shù)據(jù)可能有兩個(gè)變量,比如家庭收入和家庭支出。希望通過圖形了解家庭收入和家庭支出的關(guān)系,這時(shí)可以用一個(gè)變量為橫坐標(biāo)(如家庭收入),另一個(gè)為縱坐標(biāo)(如家庭支出)對(duì)數(shù)據(jù)進(jìn)行描點(diǎn)來作圖。這種圖稱為散點(diǎn)圖。例如,4.線圖(LinePlot)將散點(diǎn)進(jìn)一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論