版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
統(tǒng)計軟件概論主講人陶育純7學時:402006.10.10103預防統(tǒng)計軟件概論7第七講課程名稱:統(tǒng)計軟件主要教材:
?SPSSforWindowsVer.11.5在醫(yī)學統(tǒng)計中的應用?
馬斌榮編著科學出版社年級、專業(yè):2003級預防醫(yī)學專業(yè)授課時間:2006年12月21日授課時數(shù):2h2006.10.10203預防統(tǒng)計軟件概論7目錄第十章相關(guān)與回歸一、一元線性相關(guān)與回歸二、多元相關(guān)分析第十一章Logistic回歸(介紹)三、多元線性回歸(包括多元逐步回歸)2006.10.10303預防統(tǒng)計軟件概論7第十章相關(guān)與回歸
一、一元線性相關(guān)與回歸㈠使用命令
SPSS通過Analyze→Correlate
→Bivariate…分析完成對某資料的直線相關(guān)分析。SPSS通過Analyze→Regression
→Linear…分析完成對某資料的直線回歸分析。注意:一元線性相關(guān)又稱直線相關(guān),一元線性回歸又稱直線回歸。㈡例題及分析過程2006.10.10403預防統(tǒng)計軟件概論7
下面通過對教材第149頁例10.1的資料做直線相關(guān)與回歸分析來講述操作步驟及結(jié)果的判讀。1.建立數(shù)據(jù)文件(見exp10.1.sav)
2.正態(tài)性檢驗及繪制散點圖利用One-SampleKolmogorov-SmirnovTest分別對發(fā)硒變量(hairsi)和血硒變量(bloodsi)做正態(tài)性檢驗,其結(jié)果見表10.2。結(jié)果表明兩變量均服從正態(tài)分布。使用Graphs→Scatter/Dot…→選擇SimpleScatter→Define→打開SimpleScatterplot對話框,將bloodsi變量調(diào)入YAxis:欄中,將hairsi變量調(diào)入XAxis:欄中,→
OK完成散點圖的繪制。從圖10.1a上可以看出發(fā)硒與血硒存在2006.10.10503預防統(tǒng)計軟件概論7直線變化趨勢。
3.直線相關(guān)Analyze→Correlate
→Bivariate…打開BivariateCorrelations對話框,將雙變量hairsi和bloodsi調(diào)入
Variables:欄中,→
OK完成。4.結(jié)果判讀
輸出結(jié)果見表10.3。表中顯示了發(fā)硒與血硒的相關(guān)系數(shù)r=0.880,P<0.001。說明發(fā)硒與血硒存在直線相關(guān)關(guān)系。5.直線回歸
Analyze→Regression
→Linear…打開Linear
2006.10.10603預防統(tǒng)計軟件概論7Regression對話框,將bloodsi變量調(diào)入Dependent:欄中,將hairsi變量調(diào)入Independent(s):欄中,→
OK完成。6.結(jié)果判讀
輸出結(jié)果見表10.4~10.7。
表10.4中顯示了回歸采取的方法。本例采取的是Enter法,即所有自變量都進行分析。
表10.5顯示了用方差分析對回歸方程做的假設(shè)檢驗。本例F=34.156,P<0.001。說明回歸方程有意義。
表10.6顯示了回歸方程中的系數(shù)及針對該系數(shù)所做的假設(shè)檢驗。本例截距(又稱常數(shù)項)a=-6.943,hairsi變量的系數(shù)(即直線回歸系數(shù))b=0.239,則直線回歸方程為:2006.10.10703預防統(tǒng)計軟件概論7
表10.7顯示了回歸分析的一些其它統(tǒng)計信息(相關(guān)系數(shù)R、決定系數(shù)R2等)。本例R2=0.774(雙側(cè))。關(guān)于教材第154頁的“三、頻數(shù)表資料的相關(guān)與回歸”的內(nèi)容自學。
二、多元相關(guān)分析
教材第161頁第二節(jié)中所求得的多個變量之間的相關(guān)分析實質(zhì)就是直線相關(guān)分析(雙變量)的簡單擴展。2006.10.10803預防統(tǒng)計軟件概論7多個變量之間的相關(guān)分析得出的某兩個變量之間相關(guān)系數(shù)只能反映單獨某個變量a與單獨某個變量b的密切聯(lián)系程度,而不能考慮其它變量(c、d、…)對某個變量(a或b)的影響效應。若要扣除其它變量的影響后再求某兩個變量之間相關(guān)系數(shù),則稱此相關(guān)系數(shù)為偏相關(guān)系數(shù)(partialcorrelationcoefficient),SPSS可以使用Analyze→Correlate
→Partial…完成偏相關(guān)分析。教材第161頁例10.3的資料,若只做簡單相關(guān)分析,操作步驟與直線相關(guān)分析幾乎完全相同,唯一的區(qū)別就是把兩個變量換成了六個變量(X1~X6)。分析結(jié)果見表10.19。2006.10.10903預防統(tǒng)計軟件概論7其中體重(X1)與上臂圍(X4)的Pearson相關(guān)系數(shù)r=0.866,P<0.001。說明二者相關(guān)。但如果求二者的偏相關(guān)系數(shù)=0.540,P=0.167>0.05(見表10.19a)。說明在控制身高、胸圍、三頭肌和肩胛下角四個變量下,體重與上臂圍二者實際是不相關(guān)的。造成二者簡單相關(guān)有意義的原因在于三頭肌與上臂圍是相關(guān)的,因為二者的Pearson’sr=0.681,
P=0.015<0.05,見表10.19。
建議在進行多個變量之間的相關(guān)分析時,要把簡單相關(guān)分析和偏相關(guān)分析結(jié)合起來。2006.10.101003預防統(tǒng)計軟件概論7多元線性回歸是研究一個因變量(Dependent)和多個自變量(Independent)之間線性依存關(guān)系的統(tǒng)計方法。其模型表達式(常稱多元線性回歸方程)見下:其中bj為自變量Xj的偏回歸系數(shù)(partialregressioncoefficient)。根據(jù)最小二乘法(leastsquaremethod)可以求出系數(shù)bj的大小。
SPSS通過Analyze→Regression
→Linear…分析完成對某資料的多元線性回歸分析。
三、多元線性回歸(包括多元逐步回歸)2006.10.101103預防統(tǒng)計軟件概論7下面通過對教材第166頁例10.4的資料做多元線性回歸分析來講述操作步驟及結(jié)果的判讀。1.建立數(shù)據(jù)文件(見exp10.4.sav)
2.適用條件判斷略。3.多元線性回歸分析(Enter)
Analyze→Regression
→Linear…打開LinearRegression對話框,將y變量(血紅蛋白)調(diào)入Dependent:欄中,將x1、x2、x3變量(鈣、鐵、錳)調(diào)入Independent(s):欄中,→
OK完成。4.結(jié)果判讀2006.10.101203預防統(tǒng)計軟件概論7
輸出結(jié)果見表10.22~10.25。
表10.22顯示了多元回歸采取Enter的方法。
表10.23顯示了復相關(guān)系數(shù)R=0.802。
表10.24顯示了用方差分析對多元回歸方程做的假設(shè)檢驗。本例F=9.627,P=0.001<0.01。說明多元回歸方程有意義。
表10.25顯示了多元回歸方程中的系數(shù)及針對每個系數(shù)所做的假設(shè)檢驗。本例x2變量(P<0.001)有統(tǒng)計學意義,
x1變量(P=0.053>0.05)和
x3變量(P=0.647>0.05)均無統(tǒng)計學意義。5.多元線性回歸分析(調(diào)整)2006.10.101303預防統(tǒng)計軟件概論7
由于出現(xiàn)兩個沒有統(tǒng)計學意義的自變量(x1與x3),因此在調(diào)整自變量的組成時,最佳策略是首先把最沒意義的變量(x3)去掉,由其余變量(x1與x2)再重做多元線性回歸分析。
具體操作步驟參見3.。6.結(jié)果判讀
輸出結(jié)果見表10.26~10.29。
表10.26顯示了多元回歸仍采取Enter的方法。
表10.27顯示了復相關(guān)系數(shù)R=0.799。
表10.28顯示了調(diào)整后的多元回歸方程的假設(shè)檢驗。本例F=15.023,P<0.001。說明調(diào)整后的多元回歸方程仍有2006.10.101403預防統(tǒng)計軟件概論7意義。
表10.29顯示了調(diào)整后的多元回歸方程中的系數(shù)及針對每個系數(shù)所做的假設(shè)檢驗。本例
x1變量(P=0.047<0.05)和
x2變量(P<0.001)均有統(tǒng)計學意義。本例最后得到的優(yōu)化的多元回歸方程為:注意:在比較x1與x2的系數(shù)(0.053與0.032)對因變量的作用時,不能直接比,而應該選用標準化系數(shù)(StandardizedCoefficient
)進行比較。x1與x2的標準化系數(shù)分別為0.323和0.821,說明x2對因變量的作用要大于x1。2006.10.101503預防統(tǒng)計軟件概論7
由于多元線性回歸分析是研究一個因變量和多個自變量之間線性依存關(guān)系,而在多個自變量中,不一定每一個變量對因變量的影響都有統(tǒng)計學意義,因此需要通過某種方法尋找出一個最優(yōu)化的多元回歸方程,即能夠使方程中的每一個自變量對因變量的影響都有統(tǒng)計學意義。多元逐步回歸就是一個利用逐步(stepwise)選擇有統(tǒng)計學意義的自變量的過程來獲得最優(yōu)化的多元回歸方程的統(tǒng)計學方法。SPSS實現(xiàn)多元逐步回歸的方法是在Analyze→多元逐步回歸2006.10.101603預防統(tǒng)計軟件概論7Regression
→Linear…打開LinearRegression對話框,
通過在Method:下拉框中點擊選擇stepwise來完成。下面通過對教材第166頁例10.4的資料做多元逐步回歸分析來講述操作步驟及結(jié)果的判讀。1.打開數(shù)據(jù)文件(見exp10.4.sav)2.多元逐步回歸分析(Stepwise)
Analyze→Regression
→Linear…打開LinearRegression對話框,將y變量(血紅蛋白)調(diào)入Dependent:欄中,將x1、x2、x3變量(鈣、鐵、錳)調(diào)入Independent(s):欄中,在Method:下拉框中點擊選擇stepwise,→OK完成。2006.10.101703預防統(tǒng)計軟件概論73.結(jié)果判讀
輸出結(jié)果見表10.30~10.34。
表10.30中顯示了多元逐步回歸的步驟。第一步引進自變量x2,第二步引進自變量x1。二者使用的準則(Criteria)都是:引進的概率P≤0.050,剔除的概率P≥0.100。
表10.31顯示了第一步引進自變量x2,R2=0.542;第二步引進自變量x2和
x1,R2=0.639。
表10.32顯示了第一步引進自變量x2后的回歸方程有意義(F=21.265,P<0.001);第二步引進自變量x2和
x1后的回歸方程也有意義(F=15.023,P<0.001)。
表10.33顯示了第一步引進自變量x2后的回歸方程中相2006.10.101803預防統(tǒng)計軟件概論7應系數(shù)的大小及其假設(shè)檢驗的結(jié)果(x2的系數(shù)b2=0.029,P<0.001;常數(shù)項(Constant)的系數(shù)
b0=-0.242,P=0.927);第二步引進自變量x2和
x1后的回歸方程中相應系數(shù)的大小及其假設(shè)檢驗的結(jié)果(x2的系數(shù)b2=0.032,P<0.001;x1的系數(shù)b1=-0.053,P=0.047;常數(shù)項的系數(shù)
b0=1.567,P=0.542)。故本例題的回歸方程為:
表10.34顯示了多元逐步回歸分析中每步未進入方程的自變量的情況。2006.10.101903預防統(tǒng)計軟件概論7第十一章Logistic回歸(介紹)
前述的多元線性回歸分析是研究一個因變量和多個自變量之間線性依存關(guān)系,但它要求因變量和自變量都為定量數(shù)據(jù),當因變量和自變量出現(xiàn)分類數(shù)據(jù)時,多元線性回歸分析就不適用了。
Logistic回歸是一個分析某個二分類(或多分類)因變量與多個自變量(包括分類變量、等級變量和數(shù)值變量)關(guān)系的有力工具。它常用于流行病學中研究疾病發(fā)生與危險因素間的關(guān)系,還可用于病因?qū)W的隊列研究、病例-對照研究、臨床診斷的判別模型、治療效果評價等。2006.10.102003預防統(tǒng)計軟件概論7
SPSS通過Analyze→Regression
→BinaryLogistic…命令完成二分類的因變量的Logistic回歸。SPSS通過Analyze→Regression
→MultinomialLogistic…命令完成多分類的因變量的Logistic回歸。
SPSS提供了六種篩選自變量的方法:forwardconditional,forwardLR,forwardWald,backwardconditional,backwardLR,orbackwardWald。其作用都差不多,但建議少用Wald檢驗。教材第189頁例11.1的資料,作者采用先單因素分析對自變量進行篩選,再把篩選出有統(tǒng)計學意義的自變量引入Logistic回歸中,選擇Enter的方法是不合理的。因為單因2006.10.102103預防統(tǒng)計軟件概論7素分析不能考慮變量之間的交互效應以及變量之間的相關(guān)性對因變量的影響。合理的步驟應該是:直接把所有研究者關(guān)心的變量列入Logistic回歸分析的自變量列表里,選擇一個合理的篩選變量的方法(如Forward:LR)進行分析。單因素分析的結(jié)果只能作為一個輔助分析的參考。對于例11.1的資料,作者先采取對定性變量(性別sex、手術(shù)方式pt、疾病部位da、手術(shù)中輸血次數(shù)bn)分別和感染與否infect變量進行χ2檢驗來找出有統(tǒng)計學意義的變量,對定量變量(年齡age、紅細胞壓積hct、手術(shù)持續(xù)時間time、手術(shù)中失血量lb、手術(shù)中輸血量bc)分別以感染與否infect變量分組進行t
檢驗來找出有統(tǒng)計學意義的變量,2006.10.102203預防統(tǒng)計軟件概論7結(jié)果得到影響感染與否的自變量有:手術(shù)中輸血量bc、疾病部位da和手術(shù)中輸血次數(shù)bn。
注意的是:這里的分析沒有考慮到的變量手術(shù)中輸血次數(shù)bn與手術(shù)中輸血量bc的專業(yè)相關(guān)性,這就會為以后的分析留下隱患。作者接著對上述三個變量進行Logistic回歸分析,并選擇Enter的方法。分析結(jié)果顯示三個變量的Wald檢驗概率大小,手術(shù)中輸血量bc的Wald檢驗概率P=0.977最大,因此接下來剔除bc再作了一次Logistic回歸,結(jié)果顯示最后剩下的兩個變量:手術(shù)中輸血次數(shù)bn和疾病部位da的Wald檢驗概率P均小于0.05,至此找到了影響感染與否的有統(tǒng)計2006.10.102303預防統(tǒng)計軟件概論7學意義的自變量。若直接把上述作者涉及到的所有自變量列入Logistic回歸的自變量列表里,選擇一個合理的篩選變量的方法進行分析。操作步驟如下:
1.打開數(shù)據(jù)文件(見exp2.1.sav)2.Logistic回歸分析(Forward:LR)
Analyze→Regression
→BinaryLogistic…打開LogisticRegression對話框,將因變量(infect)調(diào)入Dependent:欄中,將自變量sex、age、hct、pt、da、time、lb、bn、bc調(diào)入Covariates:欄中,在Method:下拉框中點擊選擇Forward:LR,→OK完成。2006.10.102403預防統(tǒng)計軟件概論73.結(jié)果判讀
輸出主要結(jié)果見表11.25~11.28。
表11.25顯示了Block0區(qū)引入常數(shù)項的統(tǒng)計結(jié)果。本例常數(shù)項有統(tǒng)計學意義(Wald值=18.669,P<0.001)。
表10.26顯示了Block0區(qū)未引入的所有自變量的得分檢驗(ScoreTest)結(jié)果。實質(zhì)就是單因素分析結(jié)果。本例從結(jié)果中可以看出bc、da和bn均有統(tǒng)計學意義,結(jié)論與作者相同。
表10.27顯示了Block1區(qū)也就是采取逐步向前似然比檢驗法[ForwardStepwise(LikelihoodRatio)]對所有自變量的篩選結(jié)果。最后一步(Step2)的輸出結(jié)果是Logistic回歸2006.10.102503預防統(tǒng)計軟件概論7分析最重要的,因為它提供了優(yōu)化后的最終回歸方程的相關(guān)信息。有最終篩選出的自變量、變量系數(shù)(B)、標準誤(S.E.)、Wald卡方值(Wald)、自由度(df)、P值(Sig.)以及Exp(B)(即OR值)。本例最終篩選出的自變量是da和bc。
表10.28顯示了Block1區(qū)每步未引入的所有自變量的得分檢驗(ScoreTest)結(jié)果。上述結(jié)果與作者的做法截然不同。原因在于手術(shù)中輸血次數(shù)bn與手術(shù)中輸血量bc在專業(yè)上是相關(guān)的,而選擇bc要比bn要科學合理。關(guān)于多分類的Logistic回歸分析的實現(xiàn)方法請參見2006.10.102603預防統(tǒng)計軟件概論7思考題
1.
為什么在做直線相關(guān)與回歸分析時,必須先繪制散點圖(Scatterplot)?
2.一元線性相關(guān)與回歸、多元線性相關(guān)與回歸和Logistic回歸分析的區(qū)別。SPSS的相關(guān)參考書。C2006.10.102703預防統(tǒng)計軟件概論72006.10.102803預防統(tǒng)計軟件概論7輸出結(jié)果表10.22006.10.102903預防統(tǒng)計軟件概論72006.10.103003預防統(tǒng)計軟件概論7圖10.1a2006.10.103103預防統(tǒng)計軟件概論7此項作用為在相關(guān)系數(shù)上用符號標記顯著性水平。注意:PearsonCorrelationCoefficient就是直線相關(guān)系數(shù)r。2006.10.103203預防統(tǒng)計軟件概論7輸出結(jié)果表10.3發(fā)硒與血硒的r
=0.880,P<0.01。注意:只有選擇了FlagSignificantCorrelations選項才有。2006.10.103303預防統(tǒng)計軟件概論72006.10.103403預防統(tǒng)計軟件概論7輸出結(jié)果表10.4表10.5F=34.156,P<0.001。說明回歸方程有意義。2006.10.103503預防統(tǒng)計軟件概論7輸出結(jié)果表10.6表10.7R=0.880,R2=0.774。2006.10.103603預防統(tǒng)計軟件概論7表10.19輸出結(jié)果體重(X1)與上臂圍(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 審計總價合同范例
- 工程合同范例單價合同
- 海鮮冷庫經(jīng)銷合同范例
- 婚后買房合同范例
- 中考數(shù)學一輪考點復習精講精練專題08 平面直角坐標系與函數(shù)概念【考點鞏固】(解析版)
- 紡織雇傭合同范例
- 固定兼職合同范例
- 手機訂貨購銷合同范例
- 企業(yè)聯(lián)盟合同范例
- 手機貨物買賣合同范例
- 安全生產(chǎn)培訓課件
- 養(yǎng)老院安全巡查記錄制度
- 2025年建筑公司年度工作總結(jié)及2025年計劃
- 母嬰安全培訓課件
- 2024年度三方新能源汽車充電樁運營股權(quán)轉(zhuǎn)讓協(xié)議3篇
- 《人力資源招聘體系》課件
- 模擬集成電路設(shè)計知到智慧樹章節(jié)測試課后答案2024年秋廣東工業(yè)大學
- 2024年國家工作人員學法用法考試題庫及參考答案
- 中國成人心肌炎臨床診斷與治療指南2024解讀
- 期末(試題)-2024-2025學年人教PEP版英語六年級上冊
- 創(chuàng)新創(chuàng)業(yè)創(chuàng)造:職場競爭力密鑰智慧樹知到期末考試答案章節(jié)答案2024年上海對外經(jīng)貿(mào)大學
評論
0/150
提交評論