版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
試驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析教程則要求兩個變量均為隨機(jī)變量且服從正態(tài)分布,也就是說只有H型回歸分析資料才能進(jìn)行直線相關(guān)分析(Spearman秩相關(guān)分析可分析定量資料與定性資料的相關(guān)性)。③統(tǒng)計(jì)量量綱單位不同相關(guān)系數(shù)是無量綱的統(tǒng)計(jì)量,而斜率卻是有量綱的統(tǒng)計(jì)量,其量綱為“響應(yīng)變量量綱自變量量綱”,截距的量綱與響應(yīng)變量量綱相同史。2,相關(guān)和回歸分析的相同點(diǎn)①方向一致對某資料同時計(jì)算直線相關(guān)系數(shù)和直線回歸系數(shù),可發(fā)現(xiàn)它們的正負(fù)號一致。②假設(shè)檢驗(yàn)等價對同一樣本,對其直線相關(guān)系數(shù)和直線回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)所得到的值是相同的。3,直線相關(guān)與回歸分析的關(guān)鍵點(diǎn)(繪制散布圖)將(X,Y)的n對數(shù)值繪在直角坐標(biāo)系內(nèi),得到X與Y變化趨勢的散布圖,如果n個點(diǎn)形成的散布圖呈一條明顯的曲線趨勢時,宜擬合一條曲線回歸方程;如果n個點(diǎn)在一條不太寬的長帶內(nèi)隨機(jī)地分布著,此“長帶”不與X軸平行,也不與Y軸垂直,10/29且各散點(diǎn)的分布情況不存在明顯的曲線趨勢,可考慮進(jìn)行直線相關(guān)和回歸分析;如果n個點(diǎn)形成的散布圖近似于一個圓盤,則說明X與Y之間無確定的變化趨勢,幾乎是互相獨(dú)立的,不能硬把他們捏合在一起分析。4,直線相關(guān)與回歸分析要點(diǎn)總結(jié)①必須有專業(yè)知識為依據(jù);②必須繪制散布圖,并正確分析散布圖;③計(jì)算關(guān)鍵的統(tǒng)計(jì)量(如r、a、b),并進(jìn)行假設(shè)檢驗(yàn);④結(jié)合專業(yè)和統(tǒng)計(jì)學(xué)知識判斷所作的統(tǒng)計(jì)分析是否有實(shí)用價值。若是直線相關(guān)分析,就是要結(jié)合s的數(shù)值大?。ㄒ话銘?yīng)「2>0.5),給出較為明確的專業(yè)結(jié)論;若是直線回歸分析,就是要看所擬合的直線回歸方程與全部散點(diǎn)的吻合程度,對直線回歸方程中的2個參數(shù)(總體截距、總體斜率)的假設(shè)檢驗(yàn)是否都具有統(tǒng)計(jì)學(xué)意義,其正負(fù)號是否符合專業(yè)上的含義,整個直線回歸方程的剩余標(biāo)準(zhǔn)差是否較小,將各X值代入直線回歸方程后,其對應(yīng)的Y的預(yù)測值在專業(yè)上是否都成立。二、一元多因素回歸分析方法當(dāng)結(jié)果變量(常稱為應(yīng)變量)依賴于原因變量(常稱為自變量)變化時,研究應(yīng)變量隨多個自變量變化的規(guī)律所對應(yīng)的統(tǒng)計(jì)分析11/29方法,稱為多重回歸分析。進(jìn)行多重回歸分析時應(yīng)把握的要領(lǐng)如下①當(dāng)應(yīng)變量為近似服從正態(tài)分布的隨機(jī)變量時,常選用多重線性回歸分析。②當(dāng)應(yīng)變量分別為二值變量、多值有序變量或多值名義變量時,應(yīng)分別采用一般的多重logistic回歸分析、有序變量的多重logistic回歸分析和擴(kuò)展的多重logistic回歸分析。備注:可用Grubbs法檢驗(yàn)?zāi)承翱梢芍怠笔欠駷楫惓V怠!?-6:定性資料的統(tǒng)計(jì)分析一、定性資料與列聯(lián)表定性資料(如治愈、未愈),一般不以個體為計(jì)量單位,而是以處理組為計(jì)量單位,換句話說,資料以分組且用表格的形式呈現(xiàn)出來,這種表通稱為“列聯(lián)表一般來說,一個列聯(lián)表中只有一個結(jié)果變量,其他都是原因變量,但也有少數(shù)列聯(lián)表中的變量不包含結(jié)果變量,此時只能考察全部定性變量全部水平組合下的頻數(shù)分布情況。定性資料有些屬于原因、有些屬于結(jié)果,若將定性變量的具體取值一一列出,則不便看出資料之間內(nèi)在的聯(lián)系,故人們常以表格的形式對資料進(jìn)行整理或歸納,這種表格被稱為列聯(lián)表。只含有兩個定性變量,因而叫做二維列聯(lián)表,表中的原始頻數(shù)只有兩行兩列12/29,簡稱為2x2表或四格表;而表中的原始頻數(shù)占3行4列,故簡稱為3x4表,一般被簡稱為RxC表;表中含有3個定性變量,故被稱為三維列聯(lián)表,當(dāng)列聯(lián)表中定性變量的個數(shù)大于等于3時,一般被統(tǒng)稱為高維列聯(lián)表。二、定性資料分析步驟正確地實(shí)現(xiàn)定性資料的統(tǒng)計(jì)分析,關(guān)鍵是三點(diǎn)。其一,給定性資料所對應(yīng)的列聯(lián)表命名;其二,弄清統(tǒng)計(jì)分析的目的;其三,檢查定性資料是否具備某些特定分析方法所要求的前提條件。每次只分析兩個定性變量時,可將資料整理為2x2表、2xk和RxX表的形式。常用的統(tǒng)計(jì)分析方法有Pearson次檢驗(yàn)、校正%2檢驗(yàn)、配對計(jì)數(shù)資料的MxNemarx%2檢驗(yàn)、Fisher的精確檢驗(yàn)、秩和檢驗(yàn)、Rid讓分析、等級相關(guān)分析、典型相關(guān)分析、一般趨勢和線性趨勢檢驗(yàn)、Kappa檢驗(yàn)等;若需要同時分析的定性變量的個數(shù)N3時,常用的統(tǒng)計(jì)分析方法有加權(quán)%2檢驗(yàn)、Mantel-haenszel總檢驗(yàn)、logisMx回歸模型和對數(shù)線性模型等。一般浮檢驗(yàn)與變量的有序性沒有聯(lián)系,用一般浮檢驗(yàn)進(jìn)行分析,得到的結(jié)論是兩組的頻數(shù)分布是否相同,而不能得出兩組療效之間的差別是否具有顯著意義的結(jié)論。一般%2檢驗(yàn)只能用來考察列聯(lián)表資料的行變量與列變量之間是否獨(dú)立。分析定性資料的相關(guān)分析方法,如:Spearman秩相關(guān)分析,Kendall秩相關(guān)分析或典型相關(guān)分析。13/29三、2x2表資料的分析方法1,2x2表資料分析方法概述關(guān)于2x2表資料的統(tǒng)計(jì)分析方法的合理選擇:2x2表資料的統(tǒng)計(jì)分析方法取決于其設(shè)計(jì)類型,即橫斷面研究設(shè)計(jì)、隊(duì)列研究設(shè)計(jì)、病例對照研究設(shè)計(jì)和配對設(shè)計(jì)四種類型,每種類型又需考慮一些具體情況,方可選擇較為合適的統(tǒng)計(jì)分析方法處理資料。常用的方法有:一般總檢驗(yàn)、校正%2檢驗(yàn)、Fisher的精確檢驗(yàn);計(jì)算相對危險度(RR)、計(jì)算比數(shù)比(OR)、檢驗(yàn)總體RR(或OR)與1之間的差別是否具有統(tǒng)計(jì)學(xué)意義的%2MH檢驗(yàn);配對設(shè)計(jì)定性資料的McNemar為2檢驗(yàn)。一般認(rèn)為,2x2表資料采用Fisher精確檢驗(yàn)法結(jié)果比較可靠,若用統(tǒng)計(jì)軟件實(shí)現(xiàn)統(tǒng)計(jì)計(jì)算,均可選用Fisher精確檢驗(yàn)計(jì)算的結(jié)果。對于二維列聯(lián)表而言,一般可分為以下4類:第1類:雙向無序的二維列聯(lián)表。當(dāng)表中小于5的理論頻數(shù)的個數(shù)小于總格子數(shù)的1/5時,需要選用Fisher的精確檢驗(yàn),否則,可以選用建檢驗(yàn)。若是2x2表(或稱四格表),應(yīng)根據(jù)實(shí)驗(yàn)設(shè)計(jì)類型,選擇相應(yīng)的統(tǒng)計(jì)分析方法:若屬橫斷面研究設(shè)計(jì),當(dāng)缺乏統(tǒng)計(jì)軟件進(jìn)行Fisher精確計(jì)算時,還可考慮用校正的%2檢驗(yàn);若屬隊(duì)列研究設(shè)計(jì)或病例對照研究設(shè)計(jì),先將其視為橫斷面14/29研究設(shè)計(jì)資料處理,當(dāng)?shù)玫絇v0.05時,在求出相對危險度RR(隊(duì)列研究設(shè)計(jì)時用)或比數(shù)比OR(病例2對照研究設(shè)計(jì)時用)后,用%2MH計(jì)算公式檢驗(yàn)RR(或OR)是否等于1。第2類:結(jié)果變量為有序變量的二維列聯(lián)表。此時,所選用的統(tǒng)計(jì)分析方法必須與結(jié)果變量的有序性有聯(lián)系,可供選用的統(tǒng)計(jì)分析方法有“秩和檢驗(yàn)'Ridt分析嗚“有序變量的Logistic回歸分析”。第3類:雙向有序且屬性不同的二維列聯(lián)表。此時,根據(jù)實(shí)際情況可能提出四個不同的分析目的,將對應(yīng)四套分析方法:目的一:僅關(guān)心結(jié)果變量的有序性,可將其視為前面介紹的“第2類列聯(lián)表”,選擇相應(yīng)的統(tǒng)計(jì)分析方法;目的二:希望研究兩有序變量之間的相關(guān)性的高低,此時宜選用定性資料的相關(guān)分析,如Spearman秩相關(guān)分析或典型相關(guān)分析;目的三:希望研究兩有序變量之間是否存在線性變化趨勢,可以選用線性趨勢檢驗(yàn);目的四:希望研究各實(shí)驗(yàn)分組中的頻數(shù)分布是否相同,此時可選用一般水檢驗(yàn)或Fisher精確檢驗(yàn)(注意:此時的結(jié)論不應(yīng)該是“行變量與列變量之間呈正相關(guān)或負(fù)相關(guān)關(guān)系o第4類:雙向有序且屬性相同的二維列聯(lián)表。這種表一般都是考察用兩種類似的檢測方法檢測同-一批樣品,看檢測結(jié)果是否一致,故需要做一致性檢驗(yàn)或稱Kappa檢驗(yàn)。若是2x2表時,通常稱為配對設(shè)計(jì)的四格表,此時,常檢驗(yàn)不一致部分相差是否具有統(tǒng)計(jì)學(xué)意義,用McNemar%215/29檢驗(yàn);當(dāng)然,也可做一致性檢驗(yàn)。但這兩種檢驗(yàn)的目的和對檢驗(yàn)結(jié)果的解釋是不同的。2,3種分析2x2表資料的方法的注意事項(xiàng)①一般的%2檢驗(yàn);②連續(xù)性校正的浮檢驗(yàn);③Fisher的精確檢驗(yàn)。選擇條件:當(dāng)總樣本含量n240,且理論頻數(shù)T均大于5時,選用方法①;當(dāng)總樣本含量n>40,但有理論頻數(shù)滿足仁Tv5時,選用方法②;當(dāng)總樣本含量n<40或有理論頻數(shù)小于1時,選用方法③。樣本較小的定性資料的統(tǒng)計(jì)分析,一般不宜采用工2檢驗(yàn),而應(yīng)選用Fisher的精確檢驗(yàn)來處理。配對研究設(shè)計(jì)的2x2表資料,對于隱含金標(biāo)準(zhǔn)和特設(shè)金標(biāo)準(zhǔn)的2x2表資料,可有2種統(tǒng)計(jì)分析方法:①檢驗(yàn)2種方法檢測結(jié)果不一致部分差異是否具有統(tǒng)計(jì)學(xué)意義,可用McNemar%2檢驗(yàn)公式計(jì)算;②檢驗(yàn)2種檢測方法檢測結(jié)果是否具有一致性,可用Kappa檢驗(yàn)(即一致性檢驗(yàn))法。比較兩種檢測方法的檢測結(jié)果是否一致,原本屬于配對設(shè)計(jì)問題,但人們在收集資料時常按成組設(shè)計(jì)形式列表,這樣就將配對設(shè)計(jì)問題人為地轉(zhuǎn)化為成組設(shè)計(jì)的問題了,通常都會降低檢驗(yàn)的功效16/29不:格,靴長?修改行的形式)1720- IS2J0合格 4、公路 frit21198什格 ? 1 3不介解 c 4 17一H 建 1 20裊ianttm力處理前篇檢鹿第唳(&?修改后的形式)去3餌墳甘祈3處理花行療介知T(&I戒3,理論頻數(shù)的計(jì)算方法?1兩一為■WRMW/制?現(xiàn)?告累?一; 2敷 /泊一 -it
ffWA M<a) ”(b) 40(e)一拘H Ug49M so⑺?H 41《■》 59(■) 1U0(“與各原始頻數(shù)對應(yīng)的理論頻數(shù)的計(jì)算方法為:與特定格對應(yīng)的行合計(jì)與列合計(jì)相乘后除以n。例如,與觀察頻數(shù)“針對應(yīng)的理論頻數(shù)=(exg)/no四、RxC表資料的分析方法xC表資料的統(tǒng)計(jì)分析方法取決于表中兩定性變量的性質(zhì)和分析B的,按性質(zhì)可將此類列聯(lián)表分為以下四類:即“雙向無序的RxC表”、“結(jié)果變量為有序變量的單向有序的RxC君,“雙向有序且屬性不同的RxC表”和“雙向有序且屬性相同的RxC表”。對于RxC表資料,還需結(jié)合資料所具備的條件或分析目的,選用合適的統(tǒng)計(jì)分析方法,他們是:一般貯檢驗(yàn)、Fisher的精確檢驗(yàn);秩和檢驗(yàn)、Ridit分析、有序變量的Logistic回歸分析;秩相關(guān)分析或典型相關(guān)分析;線性趨勢檢驗(yàn);一致性(或叫Kappa)檢驗(yàn)或特殊模型分析。1,雙向無序的RxC表資料17/29顧名思義,就是表中2個定性變量都是名義變量,表中沒有小于5的理論頻數(shù),可以選用一般的總檢驗(yàn)公式計(jì)算。表中小于5的理論頻數(shù)的格子數(shù)若過了總格子數(shù)的1/5,若仍選用一般的%2檢驗(yàn)公式計(jì)算,將會增大犯假陽性錯誤的概率,故應(yīng)改用Fisher的精確檢驗(yàn)法。2,單向有序的RxC表資料“結(jié)果變量為有序變量的單向有序RxC列聯(lián)表”,可以選用的統(tǒng)計(jì)分析方法有秩和檢驗(yàn)、Ridit分析和有序變量的logistic回歸分析;原因變量為有序變量的單向有序RxC列聯(lián)表C列聯(lián)表”,應(yīng)被視為“雙向無序的RxC列聯(lián)表”,因列聯(lián)表內(nèi)小于5的理論頻數(shù)的格子數(shù)超過了總格子數(shù)的1/5,故宜選用Fisher的精確檢驗(yàn)法。3,雙性有序且屬性不同的RxC資料RxC列聯(lián)表中的2個定性變量都是有序變量,且它們的屬性(如一個變量為年齡,而另一個變量為療效,顯然它們反映了事物的不同方面,稱為屬性)不同,此時,稱這樣的列聯(lián)表資料為雙向有序且屬性不同的RxC列聯(lián)表資料。一般來說,有以下4個可能的分析目的。⑴只關(guān)心各年齡組患患者治療結(jié)果之間的差異是否具有統(tǒng)計(jì)學(xué)18/29意義,此時,年齡的有序性就變得無關(guān)緊要了,可將此時的“雙向有序RxC列聯(lián)表資料”視為“結(jié)果變量為有序變量的單向有序RxC列聯(lián)表資料”,可以選用的統(tǒng)計(jì)分析方法有秩和檢驗(yàn)、Ridit分析和有序變量的logistical歸分析。⑵若希望考察年齡與療效之間是否存在線性相關(guān)關(guān)系,此時,需要選用處理定性資料的相關(guān)分析方法,通常采用Spearman秩相關(guān)分析方法。⑶若2個有序變量之間的相關(guān)關(guān)系具有統(tǒng)計(jì)學(xué)意義,研究者希望進(jìn)一步了解這2個有序變量之間的變化關(guān)系是呈直線關(guān)系還是呈某種曲線關(guān)系,此時宜選用線性趨勢檢驗(yàn)。⑷若希望考察列聯(lián)表中各行上的頻數(shù)分布是否相同,宜選用一般%2檢驗(yàn)或Fisher的精確檢驗(yàn)(若列聯(lián)表內(nèi)小于5的理論頻數(shù)的格子數(shù)超過了總格子數(shù)的1/5)。當(dāng)RxC列聯(lián)表中的2個定性變量都是有序變量,且它們的屬性相同,則稱這樣的列聯(lián)表資料為雙向有序且屬性相同的RxC列聯(lián)表資料,這樣的資料被稱為雙向有序且屬性相同的“方形”列聯(lián)表資料,簡稱為“方表這樣的資料實(shí)際上就是配對設(shè)計(jì)2x2列聯(lián)表資料的“擴(kuò)大”,只不過在處理配對設(shè)計(jì)2x2列聯(lián)表資料時,人們更關(guān)心的是219/29第一章:數(shù)據(jù)分析基本方法與步驟?殘部公類)寶量受樣味寶擋受樣(統(tǒng)計(jì)資料一般分為定量資料和定性資料兩大類。定量資料測定每個觀察單位某項(xiàng)指標(biāo)量的大小,所得的資料稱為定量資料定量資料又可細(xì)分為計(jì)量資料(可帶度量單位和小數(shù)點(diǎn),如:某人身高為1.173m)和計(jì)數(shù)資料(一般只帶度量單位,但不可帶小數(shù)點(diǎn),如:某人脈搏為73次/min)。①計(jì)量資料在定量資料中,若指標(biāo)的取值可以帶度量衡單位,甚至可以帶小數(shù)標(biāo)志測量的精度的定量資料,就叫“計(jì)量資料例如測得正常成年男子身高、體重、血紅蛋白、總鐵結(jié)合力等所得的資料。②計(jì)數(shù)資料在定量資料中,若指標(biāo)的取值可以帶度量衡單位,但不可以帶小數(shù)即只能取整數(shù),通常為正整數(shù)的定量資料,就叫“計(jì)數(shù)資料”。例如測得正常成年男子脈搏數(shù)次、引體向上的次數(shù)次。2/29種檢測方法檢測的結(jié)果不一致部分的數(shù)量之間的差異是否具有統(tǒng)計(jì)學(xué)意義,而在處理“方表”資料時,人們更關(guān)心的是2種檢測方法檢測的結(jié)果之間是否具有一致性,故常用的統(tǒng)計(jì)分析方法叫做一致性檢驗(yàn)或稱為Kappa檢驗(yàn)。五、高維列聯(lián)表資料的分析方法高維表資料的統(tǒng)計(jì)分析方法取決于表中定性變量是否能分出“原因和結(jié)果變量”,若分不出原因和結(jié)果變量,一般需要選用對數(shù)線性模型分析法。若分得出原因和結(jié)果變量,則可分為以下3種情形:即結(jié)果變量為二值變量的高維表、結(jié)果變量為多值有序變量的高維表和結(jié)果變量為多值名義變量的高維表。結(jié)果變量為二值變量的高維列聯(lián)表。可以選用多元Logistic回歸分析或?qū)?shù)線性模型分析,某些特殊情況下還可選用加權(quán)為2檢驗(yàn)。第2類:結(jié)果變量為多值有序變量的高維列聯(lián)表??梢赃x用有序變量的多元Logistic回歸分析。第3類:結(jié)果變量為多值名義變量(如血型)的高維列聯(lián)表??梢赃x用對數(shù)線性模型分析或擴(kuò)展的多元Logistic回歸分析。多(五)維列聯(lián)表資料,處理這種資料可供選用的統(tǒng)計(jì)分析方法有兩種,其一,對數(shù)線性模型,用此法是比較復(fù)雜的,要想尋找到最佳的模型,非下大功夫不可。其二,采用多元Logistic回歸分析模型,用此法也需要下點(diǎn)功夫方可獲得較為理想的計(jì)算結(jié)果,不僅考察了多個定性的原因變量、還同時考察了多個交互作用20/29項(xiàng)對觀測結(jié)果變量的影響.§1-7:圖表及其他一、相對數(shù)“比與率,,有時較難分清,因此,人們在使用中經(jīng)常混淆。它們的共同點(diǎn)在于求率與比時所用公式的基本形式是完全相同的,都是由兩個絕對數(shù)之商乘以100%。它們的不同點(diǎn)在于率反映某種事物或現(xiàn)象發(fā)生的強(qiáng)度,而比則反映“部分與整體”或“某一部分與另一部分”之間的關(guān)系。率是強(qiáng)度相對數(shù),表示在一定范圍和時間內(nèi),某現(xiàn)象的發(fā)生次數(shù)與該現(xiàn)象可能發(fā)生的總次數(shù)之比,說明該現(xiàn)象發(fā)生的強(qiáng)度。構(gòu)成比它表示僅具有屬性的那一部分個體數(shù)目占全部個體總數(shù)的比重。構(gòu)成比的一個明顯特點(diǎn)是屬于同一整體的各項(xiàng)之和必須是100%。相對比它是兩個有關(guān)指標(biāo)數(shù)值之比,說明兩者的對比水平:用來反映發(fā)展速度時,定基比與環(huán)比分別為定基比各時間點(diǎn)上的統(tǒng)計(jì)指標(biāo)都以第個時間點(diǎn)上的統(tǒng)計(jì)指標(biāo)為分母求得環(huán)比各時間點(diǎn)上的統(tǒng)計(jì)指標(biāo)都以它前面的那個時間點(diǎn)上的統(tǒng)計(jì)指標(biāo)為分母求得。用來反映增長速度時,定基比與環(huán)比分別為定基比各時間點(diǎn)上定基比發(fā)展速度減一,環(huán)比各時間點(diǎn)上環(huán)比發(fā)展速度減一。21/29二、圖表復(fù)式條圖適合表達(dá)具有一個統(tǒng)計(jì)指標(biāo),兩個分組因素的資料,橫軸上先安排其中的一個分組因素,在其不同水平處再安排另一個因素。通常這兩個因素都是名義變量,不能表達(dá)連續(xù)變量(如濃度、時間變化等)。線圖適合表達(dá)觀察指標(biāo)隨時間變化的趨勢,名義變量,不適合用普通線圖來表達(dá)。第二章:SPSS統(tǒng)計(jì)軟件應(yīng)用§1-1:關(guān)鍵功能項(xiàng)的用法22/291,正交設(shè)計(jì)Data-orthogonaldesign2,數(shù)據(jù)處理有時需要對變量進(jìn)行分層分析,例如對性別中的男女分別分析,需要進(jìn)行數(shù)據(jù)拆分,命令為:Data-splitfiles三、模塊Analyze(一)亞模塊:Descriptivestatistics,基本數(shù)據(jù)統(tǒng)計(jì)分析Analyze-Descriptivestatistics,用于了解數(shù)據(jù)的基本特征,為統(tǒng)計(jì)分析做準(zhǔn)備。主要包括:1,頻數(shù)分析Frequencies:Analyze-DescriptiveStatistics-Frequencies一般用于分析頻數(shù)資料(定量資料里的計(jì)數(shù)資料),包括集中趨勢、離散趨勢、頻數(shù)分布(峰度、偏度)。2,描述性統(tǒng)計(jì)分析Des分ptives:Analyze-Descriptivestatistics-Descriptives,一般用于描述一個變量的數(shù)據(jù)分布情況,和頻數(shù)分析的功能類似,區(qū)別在于該部分有一個對分析變量進(jìn)行標(biāo)準(zhǔn)化處理的選項(xiàng)Z=(X-X')/Sii3,探索分析Explore:Analyze-Descriptivestatistics-Explore主要目的:①對數(shù)據(jù)進(jìn)行初步檢查,判斷有無離群點(diǎn)(outliers)和極端值(extremevalues);②對前提條件假定進(jìn)行檢驗(yàn),如正態(tài)性和方差齊性檢驗(yàn),不滿足正態(tài)分布和方差齊性時,提示數(shù)據(jù)轉(zhuǎn)換的方式,最后決定使用參23/29數(shù)檢驗(yàn)還是非參數(shù)檢驗(yàn)進(jìn)行數(shù)據(jù)分析。給出基本統(tǒng)計(jì)量、正態(tài)性檢驗(yàn)和描述性統(tǒng)計(jì)圖(莖葉圖、直方圖和箱絲圖)。Spreadvs.LevelwithleveneTest:Levebe方差齊性測驗(yàn),首先選擇untransformed,對原始數(shù)據(jù)進(jìn)行齊性檢驗(yàn),如果滿足齊性,則到此為止。如果不滿足齊性,應(yīng)該選擇powerestimation選項(xiàng),確定事轉(zhuǎn)換方法,在6種基變化方法中嘗試尋找滿足齊性的方法。這6種方法分別為:Naturallog(自然對數(shù)變換系統(tǒng)默認(rèn))、1/squareroot平方根倒數(shù)變換、Reciprocal倒數(shù)變換、squareroot平方根變換、square平方變換、cube立方變換。正態(tài)性檢驗(yàn):Analyze-descriptivestatistics-explore-plots-normalityplotswithtestsSig(significancelevel)即P值越大,越支持資料服從正態(tài)分布;正態(tài)性檢驗(yàn)Q-Q圖,散點(diǎn)的分布接近于一條直線,則資料服從正態(tài)分布。4,crosstabs列聯(lián)表資料分析用于二維及高維列聯(lián)表、定性資料分析工具,有22種檢驗(yàn)和相關(guān)性度量方法。該分析方法往往需要將數(shù)據(jù)說明為頻數(shù)數(shù)據(jù),方法,Data-weightcases-weightcaseby■選擇相應(yīng)的變量進(jìn)行指定。24/29★Statistics:統(tǒng)計(jì)W.擊Statistics按鈕.彈出Statistics(統(tǒng)計(jì)量)對話和(M5-17),Chi-square檢驗(yàn):對于四格表資料,用輸出Pearsonx?檢驗(yàn)、似然比k2檢驗(yàn)(Likelihoodratio)?注續(xù)性校正x?履驗(yàn)(ContinuityCorrecUon)及Fisher精確概率冷驗(yàn)(FisherSExactlest)的結(jié)果,說明:PearsonChi-square:非校正乂’檢驗(yàn),適于RXC表資料0ContinuityCorrection:校正乂?檢驗(yàn),僅用于四格表資料,LikelihoodRatio:似然比x?檢驗(yàn),適于RXC表資料,F(xiàn)ishefsExactTest:Fisher精謝概率檢的,僅用于四格表資料.Linear-by-LincarAssociation:線性相關(guān)性檢驗(yàn).兩貨量均為等級變量,目均從小到大排列晡方有意義,其他情況可忽略C配對計(jì)數(shù)費(fèi)科的x?檢驗(yàn)(McNemar檢驗(yàn)Correlations:計(jì)奇Pearson和Spearman相關(guān)系數(shù).用以說明打變量和列變出的相關(guān)程度,?Nominal:兩分類變址的關(guān)聯(lián)發(fā)(AsMK,ialion)測量.口ContingencyCoefficient:列聯(lián)系數(shù).C=V(x2/(x24-N)),這里,N為總例數(shù).C取值在。至1之間,其值越大,表示關(guān)聯(lián)性越強(qiáng),PhiandCramcfsV6H〃x,/N):Cramur列聯(lián)系數(shù).V二x7N(k-[))).這里,k為行數(shù)和列數(shù)中較小的一個數(shù).對于四格表資料,4>=V.兩者取值均在0至1之間.其值越大,表示關(guān)聯(lián)悴越怪口Lambda:減少預(yù)測誤差率,取值在。乍I之間,】表小弦測效果最好,0表示雄差.Uncertainlycoetllcieni:不定系虬25/29oOrdinal:兩懺序分類變里(等級變城)的X聯(lián)度測量.Gamma:測量兩個等級變垃之間關(guān)聯(lián)度的統(tǒng)計(jì)殳.YMP-Q)/(P4Q),這里,P為和諧對f數(shù)(Concordantpairs).Q為非和諧時子數(shù)?Discordantpairs).丫取值在一】干+1之間,+1我小完全正關(guān)聯(lián)(Perfectpositiverelationship)*—I表示完全女美聯(lián)(Perfectnegativerelationship).U表示無關(guān)聯(lián)."Somersd:該統(tǒng)計(jì)量為Gamma統(tǒng)“星的非對稱形式的擴(kuò)展,與Gamma統(tǒng)計(jì)呈恪一小同的是,分母部分加I.中性對子數(shù)(Tiedpairs).其取值危困及母義與Gamma相同.二Kendallstau-b:計(jì)算式為:】/(P-Q"V((P+Q-?Tx)X(P+Q+Ty)).這里.Tx為第1個變量的中性數(shù).丁丫為第2個變量的中性數(shù).門Kendall'stau-c:匹算式為:tc=2nMP-Q)/(N?<m-I)),這里,m為打數(shù)和列數(shù)中較小的數(shù),N為樣本總例數(shù).ONominalbyInterval:一個定性變域和?個定量變量間的關(guān)聯(lián)度??贓U:關(guān)聯(lián)度統(tǒng)計(jì)紀(jì).Kappa:k系數(shù),為吻合度測量(Measureofagreement)系數(shù).用以測俄兩觀測者或兩觀測設(shè)得之間的吻合程度,取值一I至+12何,其值越大,說明吻合程度越高.Risk:危險度分析,只適于四格衣資料,可綸出相對危險度和比數(shù)比(Odds皿沁)?□McNcman配對計(jì)數(shù)灸科的x?檢驗(yàn).□Cochran'sandMantel-Haenszelstatistics:Mamel-Haenszd公共OR值檢驗(yàn),用以檢驗(yàn)在協(xié)變依(分層變量)存在條件卜,兩個二分類變量是否獨(dú)立?選此項(xiàng)后,Testcommonoddsratioequeals:[\_\被激活,悵內(nèi)】為系統(tǒng)默認(rèn),即檢驗(yàn)公大OR值與1有無顯著性茅異.分層變量(男女-吸煙與否?患病情況)經(jīng)Risk分析,得出or值(不包括1說明說明是致病因素),若檢驗(yàn)顯著,不需要再觀察Mantel-haenszel計(jì)算的公共OR值。?注意:經(jīng)一致性檢驗(yàn)各層的OR值之間有顯著差異時,不宜計(jì)算公共OR值。(二)亞模塊:comparemeans均數(shù)比較Analyze-comparemeans用于定量資料的分析,有18種統(tǒng)計(jì)量。1,單樣本T測驗(yàn)Analyze-comparemeans-onesampleTtests用于已知樣本均數(shù)和總體均數(shù)的比較,需在testvalue處輸入總體均值。Confidenceinterval95%,是樣本均數(shù)與總體均數(shù)之差的95%置信區(qū)間估計(jì),如果有顯著差異,區(qū)間應(yīng)不包含0.26/292,配對樣本T測驗(yàn),Analyze-comparemeans-PairedsamplesTtest:用于配對定量資料的比較,檢驗(yàn)配對樣本差值的總體均數(shù)與。的差異有無顯著性意義,以及配對樣本是否相關(guān)。獨(dú)立樣本T測驗(yàn),Analyze-comparemeans-independentsamplesTtest:也稱兩樣本T測驗(yàn),用來檢驗(yàn)兩個獨(dú)立樣本的總體均數(shù)是否有顯著差異。單向方差分析,Analyze-comparemeans-onewayanova用于完全隨機(jī)資料(定量)的多個樣本均數(shù)的比較和樣本均數(shù)間的多重比較,亦可進(jìn)行多個處理組與一個對照組的比較。(備注:一般這些處理都屬于一個因素的多個水平)Dependentlist:因變量,可以是1個也可以是多個Factor:因素(自變量),只能是一個Posthocmultiplecomparisons(多重比較)27/29?EqualVariancesAssumed:滿足方差齊性要求。滿足方K齊性要求共有14種方法可供選抨,常用的方法有LSD法(LeastrignificaniDifference?域小顯蓍差值法),Scheft'e法,SNK法(Student-Neuman-Keuls),Tukey法.Duncan法,Bonferroni法等,H*IJ?LSD法最敏感,Scheffe法較不敏感,SNK法應(yīng)用較多a多重比較一般在方笨分析顯著的情況下應(yīng)用,芥方差分析不顯著.無論多禾比較的結(jié)果如何,都不應(yīng)采納?!鮀unnett:Dunnctt法,用T?多個處理組和一個對照組的比較。選擇此項(xiàng),可激活ControlCategories欄中設(shè)定第1糾(First)或最1組(Last)為對照組供選擇.Test欄中確定單、雙例檢驗(yàn)。02-side:雙側(cè)檢驗(yàn),為系統(tǒng)默認(rèn)方式.OControl:單側(cè)檢驗(yàn).比較組均數(shù)大于對照組均數(shù).O<Control:單側(cè)檢驗(yàn).比較糾均數(shù)小于對照蛆均數(shù).OEqualVariancesnotAssumed:不滿足方差齊性要求時,以下方法M供選擇:Tambane'sT2Dunnett'sT3Games-HowellDunnett'sC★Contrasts...:有序分組(類)的多重比較。此略。(三)亞模塊:Generallinearmodels廣義線性模型分析,Analyze-Generallinearmodels,用于定量資料的分析,有18種統(tǒng)計(jì)量。主菜單Analy2的GeneralLinearModels《廣義線性模型)過程含有4個子模塊,即Univariate(單變量方若分析八RepealedMeasures(簟復(fù)淵量方差分析)、Muhivaiiate(多變量方差分析)和VarianeComponenS(方差分量分析),本章僅介紹前兩個模塊的內(nèi)容.這兩個模塊包含了一般的方某分析內(nèi)容,如完仝隨機(jī)設(shè)計(jì)資料的方差分析(One.wayANOVA).班機(jī)單位處設(shè)計(jì)資料的方差分析(Two-wayANOVA).拉丁方設(shè)計(jì)資料的方差分析(ThreewayANOVA)、析因分析(Factorialanalysis)、交叉設(shè)計(jì)(Cross-overdesign)?正交設(shè)計(jì)(Orthogonaldesign)、裂區(qū)設(shè)計(jì)(Split-plotdesign)資料的方差分析、協(xié)方差分析、收貪史世數(shù)據(jù)的方差分析,等等.廣義線性模型分析過程既可分析各個囚索對一個反應(yīng)變■的主效應(yīng),亦可分析各因素之間的交互效應(yīng):既可用于平衡設(shè)計(jì)資料,亦可用于季平衡設(shè)計(jì)資料:既可用于完整數(shù)據(jù)的較料,辦可用于缺失數(shù)據(jù)的資料:該過程還可用于回白分析.(四)亞模塊:correlate相關(guān)分析,Analyze-correlate1,雙變量相關(guān)分析:Analyze-correlate-bivariate雙變量正態(tài)分布資料可選擇積矩相關(guān)系數(shù)(pearson相關(guān)系數(shù)),非雙變量正態(tài)分布資料,可選擇等級相關(guān)系數(shù)(spearman相關(guān)系28/29數(shù))或kendall相關(guān)系數(shù)等非參數(shù)方法分析。(五)亞模塊:Regression回歸分析,Analyze-Regression1,線性回歸分析Analyze-Regression-linear用于一個或多個自變量和一個因變量之間的線性數(shù)量關(guān)系。Method:「Enter司:回歸分析方法,有5忡方法可供選界.Enter:強(qiáng)迫引入法.即普通回歸分析,所選自變量仝部進(jìn)入方程,為系統(tǒng)默認(rèn)方式.Stepwise:逐步回歸法.根據(jù)在Options對話M中設(shè)定的標(biāo)準(zhǔn)在”算過程中逐步加入有顯著性意義的變出和典除無拈著性意義的變量,立到所建立的方程式中不再有可加入和可副除的變量為止.Remove:強(qiáng)迫別除法.根據(jù)設(shè)定的條件然.除自變時,Backward:向后逐步法.所選自變量令部走入方程,限處Options對語機(jī)中設(shè)定的標(biāo)不在計(jì)a過程中逐個的除變量,直到所建立的方程式中不再含有m制珍的變狀為止.Forward:向前逐力法.根執(zhí)Options對話框中設(shè)定的標(biāo)準(zhǔn)在計(jì)第過程中逐個加入單個丈量,通到所建。的方桎式中不再有可加入的交付為止,29/29定性資料觀測每個觀察單位某項(xiàng)指標(biāo)的狀況,所得的資料稱為定性資料。定性資料又可細(xì)分為名義資料(如血型分為:A、B、AB、。型)和有序資料(如療效分為:治愈、顯效、好轉(zhuǎn)、無效、死亡)。①名義資料在定性資料中,若指標(biāo)的不同狀況之間在本質(zhì)上無數(shù)量大小或先后順序之分的定性資料,就叫“名義資料”。例如某單位全體員工按血型系統(tǒng)型、型、型、型來記錄每個人的情況所得的資料;又例如某市全體員工按職業(yè)分為工人、農(nóng)民、知識分子、軍人等來記錄每個人的情況所得的資料。②有序資料在定性資料中,若指標(biāo)質(zhì)的不同狀況之間在本質(zhì)上有數(shù)量大小或有先后順序之分的定性資料,就叫“有序資料例如某病患者按治療后的療效治愈、顯效、好轉(zhuǎn)、無效、死亡來劃分所得的資料;又例如矽肺病患者按肺門密度級別來劃分所得的資料。判斷資料性質(zhì)的關(guān)鍵是把資料還原為基本觀察單位的具體取值形式,而不要被資料的表現(xiàn)所迷惑。關(guān)鍵是要看每一個具體的取值是由“觀察單位個數(shù)”計(jì)算得到的,還是由每一個觀察單位自身的觀測結(jié)果計(jì)算得到的。若屬于前者,就應(yīng)叫定性資料飛若屬于后者,就應(yīng)叫定量資料?!?-2:重復(fù)取樣、重復(fù)測量、重復(fù)試驗(yàn)重復(fù)原則的概念重復(fù)通常有三層含義,即“重復(fù)取樣”、“重復(fù)測量”和“重復(fù)試驗(yàn)”O(jiān)1,重復(fù)取樣:從同一個樣品中多次取樣,隨著時間的推移,測量某定量指標(biāo)的數(shù)值,稱為“重復(fù)取樣”O(jiān)隨著時間的推移,2,重復(fù)測量:對接受某種處理的個體,3/29對其進(jìn)行多次觀測,稱為“重復(fù)測量”O(jiān)3,重復(fù)試驗(yàn):試驗(yàn)設(shè)計(jì)中所講的重復(fù)原則指的是“重復(fù)試驗(yàn)”,即在相同的試驗(yàn)條件下,做兩次或兩次以上的獨(dú)立試驗(yàn)。這里的“獨(dú)立”是指要用不同的個體或樣品做試驗(yàn),而不是在同一個體或樣品上做多次試驗(yàn)。整個試驗(yàn)設(shè)計(jì)所包括的各組內(nèi)重復(fù)試驗(yàn)次數(shù)之和,稱為樣本大小或樣本含量(n)。相同的試驗(yàn)條件下,對不同的受試對象(或樣品)進(jìn)行觀測稱為n次獨(dú)立的重復(fù)試驗(yàn)。在不同的試驗(yàn)條件下(通常為不同時間),對同一受試對象進(jìn)行反復(fù)觀測,稱為重復(fù)測量。重復(fù)測量數(shù)據(jù)之間并不滿足獨(dú)立性的要求。相同試驗(yàn)條件下的試驗(yàn)次數(shù)稱為樣本含量n,n<3,當(dāng)指標(biāo)的變異度較大時,很難呈現(xiàn)出數(shù)據(jù)之間的規(guī)律性。對照組的形式有多種,即自身對照(處理前、后對照)、完全隨機(jī)對照(空白對照、相互對照、試驗(yàn)對照、標(biāo)準(zhǔn)對照)、中外或歷史對照。在實(shí)際應(yīng)用中,往往是多種對照形式同時運(yùn)用。§1-3:試驗(yàn)設(shè)計(jì)的基本類型試驗(yàn)設(shè)計(jì)類型有幾十種,其中常見的有:配對設(shè)計(jì)、成組設(shè)計(jì)、單因素K水平設(shè)計(jì)-(K>3).配伍組設(shè)計(jì)、拉丁方設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)、正交設(shè)計(jì)和具有重復(fù)測量的設(shè)計(jì)。從是否便于考察因素之間交互作用的角度看,前六種設(shè)計(jì)都不便考察交互作用,后三種設(shè)計(jì)是可以考察交互作用的。從同時考察4/29因素的個數(shù)多少角度看,前三種設(shè)計(jì)都屬于單因素設(shè)計(jì),配伍組設(shè)計(jì)屬于二因素設(shè)計(jì),拉丁方設(shè)計(jì)、交叉設(shè)計(jì)都屬于三因素設(shè)計(jì),而后三種設(shè)計(jì)即可以用于二因素設(shè)計(jì),又可以用于多因素設(shè)計(jì)。由于配伍組設(shè)計(jì)、拉丁方設(shè)計(jì)和交叉設(shè)計(jì)都不便考察交互作用,故最適合用于安排只含一個處理因素,含一個或二個區(qū)組因素的試驗(yàn)研究場合。如果試驗(yàn)中同時涉及二個或二個以上處理因素,因素之間的交互作用往往又是不可忽視的,此時,就應(yīng)當(dāng)選用析因設(shè)計(jì)或正交設(shè)計(jì)。如果希望觀察接受不同處理的幾組受試對象某些定量觀測指標(biāo)隨時間推移的動態(tài)變化趨勢,需要在不同時間點(diǎn)上從同一個受試對象身上進(jìn)行多次觀測,這就是所謂的重復(fù)測量設(shè)計(jì)?!?-4:定量資料的分析程序一、定量資料分析的步驟①若數(shù)據(jù)服從正態(tài)分布,且滿足方差齊性(即兩組或多組總體方差相等),一般優(yōu)先選用參數(shù)檢驗(yàn)法,如t檢驗(yàn)、U檢驗(yàn)、方差分析(亦稱F檢驗(yàn))等;②若數(shù)據(jù)的分布類型不明確,或不滿足參數(shù)檢驗(yàn)的前提條件,可選用非參數(shù)檢驗(yàn)法,如符號檢驗(yàn),秩和檢驗(yàn)等;③若資料經(jīng)某種變量變換后已滿足參數(shù)檢驗(yàn)的前提條件,仍可對變換后的數(shù)據(jù)進(jìn)行參數(shù)檢驗(yàn);④若只有一個試驗(yàn)因素,稱為單因素,當(dāng)它只有兩個水平時,可選用t檢驗(yàn);當(dāng)兩組樣本含量都很大時,可用U檢驗(yàn)取代t檢驗(yàn);⑤若屬單因素k5/29水平設(shè)計(jì)(G3)或兩個及兩個以上因素的各種試驗(yàn)設(shè)計(jì)時,都必須選用F檢驗(yàn);⑥若觀察的效應(yīng)指標(biāo)(即研究者關(guān)心的定量觀測指標(biāo))只有一個,可選擇上述特定設(shè)計(jì)類型下的一元分析;⑦若效應(yīng)指標(biāo)有兩個或兩個以上,且在專業(yè)上需同時考察,則應(yīng)選擇多元分析方法。二、定量資料分析誤區(qū)1,t測驗(yàn)適用范圍及應(yīng)用誤區(qū)t檢驗(yàn)的前提條件:用于比較均值的t檢驗(yàn)可以分成3類。第一類是針對單組設(shè)計(jì)定量資料的;第二類是針對配對設(shè)計(jì)定量資料的;第三類則是針對成組設(shè)計(jì)定量資料的。后兩種設(shè)計(jì)類型的區(qū)別在于事先是否將兩組研究對象按照某一個或幾個方面特征相似配成對子。無論哪種類型的t檢驗(yàn),都必須在滿足特定的前提條件下應(yīng)用才是合理的。t測驗(yàn)進(jìn)行均值比較對應(yīng)的試驗(yàn)設(shè)計(jì)類型較少,只有單組設(shè)計(jì)、配對設(shè)計(jì)和成組設(shè)計(jì)3種,t測驗(yàn)處理前2種設(shè)計(jì)類型的定量資料時,資料應(yīng)滿足正態(tài)分布的要求,處理成組資料時,應(yīng)滿足方差齊性和正態(tài)分布的要求。t檢驗(yàn)每次只能比較二個平均數(shù),因此,它僅適用于單因素一、二水平的實(shí)驗(yàn)設(shè)計(jì)類型。t檢驗(yàn)僅適合分析單組、配對及成組設(shè)計(jì)的定量資料,并不適合6/29分析單因素k(G3)水平設(shè)計(jì)定量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 聚脲防腐施工方案
- 浙江透氣塑膠跑道施工方案
- 路基填筑利用土方施工方案
- 連鎖餐飲審計(jì)方案
- 2025年儀用電源項(xiàng)目可行性分析報告
- 科技產(chǎn)業(yè)園項(xiàng)目可行性研究報告
- 中國機(jī)車制動軟管項(xiàng)目投資可行性研究報告
- 廣告項(xiàng)目合作達(dá)成居間
- 個性工作室室內(nèi)設(shè)計(jì)協(xié)議
- 商業(yè)綜合體棄土運(yùn)輸合同
- 2024年安徽省合肥市瑤海區(qū)中考語文一模試卷
- 單位車輛變更名稱的委托書
- 粉塵外協(xié)單位清理協(xié)議書
- 2023年12月首都醫(yī)科大學(xué)附屬北京中醫(yī)醫(yī)院面向應(yīng)屆生招考聘用筆試近6年高頻考題難、易錯點(diǎn)薈萃答案帶詳解附后
- 茶室經(jīng)營方案
- 軍隊(duì)文職崗位述職報告
- 小學(xué)數(shù)學(xué)六年級解方程練習(xí)300題及答案
- 電抗器噪聲控制與減振技術(shù)
- 中醫(yī)健康宣教手冊
- 2024年江蘇揚(yáng)州市高郵市國有企業(yè)招聘筆試參考題庫附帶答案詳解
- 消費(fèi)醫(yī)療行業(yè)報告
評論
0/150
提交評論