統(tǒng)計方法的分類與選擇_第1頁
統(tǒng)計方法的分類與選擇_第2頁
統(tǒng)計方法的分類與選擇_第3頁
統(tǒng)計方法的分類與選擇_第4頁
統(tǒng)計方法的分類與選擇_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學(xué)方法的分類與選擇根據(jù)研究設(shè)計類型選擇分析方法(一)、成組比較的設(shè)計在成組比較設(shè)計中,若是兩組比較需要應(yīng)用t檢驗或X2檢驗。多組比較需應(yīng)用方差分析、行×列表X2檢驗或分級的分析方法。(二)、配對(自身實驗前后)設(shè)計這種類型的設(shè)計需要按照配比的t檢驗,X2檢驗及配對的病例對照研究方法進行數(shù)據(jù)分析。

(三)、重復(fù)測量的設(shè)計這類設(shè)計方法是在給定一個處理因素后在不同的時間重復(fù)測量某一效應(yīng)變量的改變情況。如欲評價生物制品接種后的免疫學(xué)效果,在接種后的2周、4周、6周和8周測定抗體滴度,即為此類設(shè)計類型。對于這種設(shè)計類型的數(shù)據(jù)需應(yīng)用重復(fù)測量的方差分析方法進行數(shù)據(jù)的分析。(四)、多因素設(shè)計若在研究設(shè)計中有多個自變量,則可根據(jù)因變量的性質(zhì)選擇合適的多因素分析方法。如果自變量是數(shù)值變量,則可考慮應(yīng)用多元回歸分析方法、協(xié)方差分析方法。如果是分類變量,則可選擇logistic回歸分析方法、判別分析方法及聚類分析方法等。

根據(jù)變量的類型選擇分析方法區(qū)別與明確研究的因變量和自變量具有重要的流行病學(xué)與生物統(tǒng)計學(xué)意義,首先它有助于選擇擬研究的變量,對調(diào)查表的設(shè)計具有指導(dǎo)作用。其次數(shù)據(jù)分析階段可以指導(dǎo)數(shù)據(jù)分析方法的選擇及模型的建立。若因變量是分類變量,則常考慮應(yīng)用分類變量的分析方法,如卡方檢驗,logistic回歸分析等。如果因變量是數(shù)值變量,則考慮應(yīng)用數(shù)值變量的分析方法如t檢驗、方差分析,協(xié)方差分析、多元回歸等。同時明確自變量與因變量可以建立正確的統(tǒng)計學(xué)分析模型。因變量應(yīng)該放在模型的左側(cè),自變量則放在模型的右側(cè)。例如欲評價不同治療方法(口服藥物、注射胰島素及膳食控制)對糖尿病人的治療效果(血糖水平),在分析時要求調(diào)整病人的性別、年齡和病程的影響。對本例的處理需要進行協(xié)方差分析,在應(yīng)用SAS進行分析時,要將血糖水平(因變量)放在模型的左則,而治療方法或其它協(xié)變量(covariate)即性別、年齡和病程放在模型的右側(cè)。又如分析脂蛋白(a)與冠心病發(fā)生的關(guān)系,則冠心病是否發(fā)生為因變量,脂蛋白(a)則為自變量,不可顛倒這種關(guān)系。不同變量類型的數(shù)據(jù)分析方法選擇因變量自變量數(shù)值變量分類變量有序變量數(shù)值變量相關(guān)分析,多元回歸分析t檢驗,方差分析,協(xié)方差分析,多元回歸分析相關(guān)分析,多元回歸分析分類變量t檢驗,方差分析,logistic回歸分析,判別分析,聚類分析c2檢驗,logistic回歸分析c2檢驗有序變量方差分析,logistic回歸分析,判別分析,聚類分析c2檢驗,logistic回歸分析相關(guān)分析,c2檢驗生存時間

生存分析

不同研究設(shè)計和數(shù)據(jù)類型的數(shù)據(jù)分析方法選擇

研究設(shè)計類型變量類型兩組比較兩組以上比較實驗前后比較重復(fù)測量兩變量間的聯(lián)系

重復(fù)測量的方差分析線性回歸,Pearson相關(guān)系數(shù)

數(shù)值變量t檢驗方差分析配對t檢驗

分類變量c2檢驗c2檢驗配對c2檢驗

列聯(lián)表相關(guān)系數(shù)

有序變量Mann-Whitney秩和檢驗Kruskal-Wallis分析Wilcoxon符號秩和檢驗

Spearman相關(guān)系數(shù)

生存時間生存分析

數(shù)據(jù)的分析程序數(shù)據(jù)的轉(zhuǎn)換1)非正態(tài)數(shù)據(jù)的變量轉(zhuǎn)換多數(shù)的統(tǒng)計學(xué)分析方法是建立在數(shù)據(jù)正態(tài)分布的基礎(chǔ)上的,若數(shù)據(jù)不符合正態(tài)分布,則不能夠應(yīng)用參數(shù)檢驗(parametrictest)的方法,只能應(yīng)用非參數(shù)檢驗(non-parametrictest)的方法,而非參數(shù)的方法不是對原始數(shù)據(jù)的檢驗,如秩和檢驗就是非參數(shù)檢驗方法之一,它是對原始數(shù)據(jù)的秩次(rank)進行檢驗,這樣可能損失數(shù)據(jù)信息,降低檢驗效率

在對數(shù)值變量進行分析時,需首先根據(jù)統(tǒng)計分析方法/統(tǒng)計分析公式的限制性使用條件對數(shù)據(jù)進行“條件”檢驗,如正態(tài)性檢驗和方差齊性檢驗等。很多統(tǒng)計學(xué)軟件具有方便的正態(tài)性檢驗、方差齊性檢驗功能如SAS軟件等.若經(jīng)過檢驗數(shù)據(jù)不符合使用條件,就需要進行數(shù)據(jù)的變量變換,變換后符合條件就可以應(yīng)用參數(shù)檢驗的方法,否則,只有應(yīng)用非參數(shù)檢驗的方法。數(shù)據(jù)變量轉(zhuǎn)換的方法很多,可以根據(jù)數(shù)據(jù)的分布特征,選擇合適的數(shù)據(jù)轉(zhuǎn)換方法。常用的方法有對數(shù)變換,平方根變換或倒數(shù)變換等。2)分類變量轉(zhuǎn)換成啞變量若分類變量是二分類尺度及順序尺度,則可直接應(yīng)用其原有的數(shù)量化數(shù)值,但對于名義尺度因為各類別間沒有順序關(guān)系,在進行不同分析(包括多元分析、logistic回歸、Cox回歸等)時,不能使用原始的計算機錄入數(shù)值,必經(jīng)進行變量轉(zhuǎn)換。即將該變量轉(zhuǎn)換成(水平數(shù)-1)個啞變量,再將這些新轉(zhuǎn)換的變量放入多因素模型中。t檢驗的應(yīng)用條件兩組數(shù)據(jù)的比較1樣本量比較小(n<50);2樣本來自正態(tài)總體;3兩樣本總體方差齊同;當兩樣本方差不齊時可以采用t’檢驗,變量變換,或者秩和檢驗。u檢驗

兩組數(shù)據(jù)的比較1樣本量足夠大(n>50)2樣本來自正態(tài)總體3兩樣本總體方差齊同當兩樣本方差不齊時可以采用t’檢驗,變量變換,或者秩和檢驗。方差分析的應(yīng)用條件兩組以上數(shù)據(jù)的比較1各樣本是相互獨立的隨機樣本;2各樣本要來自正態(tài)總體;3要求各個樣本的總體方差齊同。多個樣本均數(shù)間的兩兩比較Newman-Keuls檢驗,亦稱Student-Newman-Keuls(SNK)檢驗,簡稱q檢驗。最小顯著性差距(LSD)t檢驗。協(xié)方差分析定量分析中,進行兩個樣本或者多個樣本的均數(shù)比較時,不僅需要使用假設(shè)檢驗判斷其差異是否具有統(tǒng)計學(xué)差異,還應(yīng)該考慮他們之間是否存在混雜因素(協(xié)變量)的影響。若存在協(xié)變量,則應(yīng)該通過協(xié)方差分析進行校正。協(xié)方差分析是定量變量分析中控制混雜因素的重要手段

影響觀察指標的其他非研究性因素(混雜因素)在統(tǒng)計分析中又稱之為協(xié)變量;考慮協(xié)變量影響的方差分析即為協(xié)方差分析。協(xié)方差分析是解決以上問題的分析方法,它將線性回歸與方差分析結(jié)合起來,檢驗2個或者多個修正均數(shù)之間有無差別的假設(shè)檢驗方法。一般是先用直線回歸的方法找出各組因變量與協(xié)變量之間的數(shù)量關(guān)系,求得修假定協(xié)變量相等時的修正系數(shù),然后用方差分析比較修正均數(shù)間的差別。協(xié)方差分析的條件1各個樣本來自方差齊同的正態(tài)總體2各組的總體直線回歸系數(shù)相同,且都不為0。協(xié)方差分析的判別步驟:

1正態(tài)性和方差齊性檢驗;2判斷協(xié)變量與因變量有無線性關(guān)系;3判斷各組回歸直線是否平行。直線回歸與相關(guān)的區(qū)別與聯(lián)系區(qū)別直線相關(guān)直線回歸變量地位變量x變量y處于平等的地位,彼此相關(guān)關(guān)系變量y稱為因變量,處在被解釋的地位,x

稱為自變量,用于預(yù)測因變量的變化變量性質(zhì)所涉及的變量x

和y都是隨機變量,要求兩個變量服從雙變量正態(tài)分布因變量y是隨機變量,自變量x

可以是隨機變量,也可以是非隨機的確定變量實際作用主要是描述兩個變量之間線性關(guān)系的密切程度(相關(guān)系數(shù)無單位)揭示變量x

對變量y的影響大?。ɑ貧w系數(shù)有單位),還可以由回歸方程進行預(yù)測和控制多元線性回歸的基本概念

事物間的相互聯(lián)系往往是多方面的,在很多情況下對應(yīng)變量y發(fā)生影響的自變量往往不止一個。多元線性回歸的目的就是用一個多元線性回歸方程表示多個自變量和1個應(yīng)變量間的關(guān)系。標準偏回歸系數(shù)表示其他自變量固定的情況下,xi改變一個單位,y平均改變bi個單位。多元線性回歸的應(yīng)用條件:

1.獨立性:各觀察對象間相互獨立。2.線性:自變量與應(yīng)變量間的關(guān)系為線性。3.正態(tài)性:自變量取不同值時,應(yīng)變量的分布為正態(tài)。4.方差齊性:自變量取不同值時,應(yīng)變量的總體方差相等。5.當不符合條件時,可對自變量進行變換。如:要比較各個自變量對于應(yīng)變量的作用大小,不能用偏回歸系數(shù),因為各偏回歸系數(shù)的單位不同。必須把偏回歸系數(shù)標準化,化成沒有單位的標準偏回歸系數(shù).消除不同單位的影響后,標準偏回歸系數(shù)的絕對值越大,該自變量對于應(yīng)變量的作用越大,但該差別是否有統(tǒng)計意義,也必須經(jīng)過檢驗。(2)對各偏回歸系數(shù)的顯著性檢驗:

F檢驗與t檢驗

1.計算截距和各偏回歸系數(shù)。2.多元回歸方程的顯著性檢驗:(1)整個方程的顯著性檢驗:用方差分析。STEPWISEREGRESSION一.逐步回歸分析的基本概念逐步回歸分析的目的是建立“最優(yōu)”回歸方程。“最優(yōu)”回歸方程是指包含所有對y有顯著作用的自變量,而不包含對y作用不顯著的自變量的方程。

逐步回歸分析的計算方法

在供選的自變量Xi中,按其對y的作用大小,由大到小地把自變量逐個引入方程,每引入一個自變量就對它作顯著性檢驗,顯著時才引入,而當新的自變量進入方程后,對方程中原有的自變量也要作檢驗,并把作用最小且退化為不顯著的自變量逐個剔出方程。因此,逐步回歸的每一步(引入一個變量或剔除一個變量都稱為一步)前后都要作顯著性檢驗,以保證每次引入新變量前方程中只包含作用顯著的自變量。這樣一步步進行下去,直至方程中所含自變量都顯著而又沒有新的作用顯著的自變量可引入方程為止。逐步回歸分析在醫(yī)學(xué)研究中的應(yīng)用及需要注意的幾個問題1方程“最優(yōu)”問題,實際是精選自變量以求得擬和效果最好的多元回歸方程。最優(yōu)子集回歸是選擇一種使回歸方程擬和最好的自變量,而逐步回歸則選擇對因變量作用有意義的自變量。要根據(jù)研究目的選用適合方法。2逐步回歸主要在醫(yī)學(xué)中用于病因探索,臨床療效分析及控制等。3線性回歸模型要注意正態(tài)性,方差齊性和獨立性,因變量必須是隨機變量等。4入選變量如果明顯地與實際問題的專業(yè)理論不一致時,首先檢查數(shù)據(jù)是否有異常點,自變量間有無共線性存在,數(shù)據(jù)輸入是否有誤等,要結(jié)合專業(yè)知識作出合理的解釋。5逐步回歸在對大量因素進行分析時,可以先進行聚類分析,然后進行逐步回歸。通常,觀察單位取變量值的5~10倍為宜。Logistic回歸分析的基本思想回憶:線性回歸分析對因變量的要求因變量y

連續(xù)型服從正態(tài)分布膽固醇含量自變量x數(shù)值型與Y呈線性關(guān)系年齡舒張壓醫(yī)學(xué)研究中經(jīng)常遇到分類型變量,例如:二分類變量:生存與死亡有病與無病有效與無效感染與未感染多分類有序變量:疾病程度(輕度、中度、重度)治愈效果(治愈、顯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論