淺顯易懂邏輯回歸分析PPT精品文檔_第1頁
淺顯易懂邏輯回歸分析PPT精品文檔_第2頁
淺顯易懂邏輯回歸分析PPT精品文檔_第3頁
淺顯易懂邏輯回歸分析PPT精品文檔_第4頁
淺顯易懂邏輯回歸分析PPT精品文檔_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Logistic 回歸分析,SPSS操作實(shí)例,3,Logistic回歸分析的用途,1,2,結(jié)果分析,4,Logistic回歸分析的意義,1.邏輯回歸(logistic regression)是用來做什么,估計(jì)某事物的可能性 例:比如某一套衣服今天能否賣出去?或者某一個(gè)廣告能否被用戶點(diǎn)擊?我們希望得到這個(gè)數(shù)值來幫助決策衣服上不上架,以及廣告展不展示。 適用于流行病學(xué)資料的危險(xiǎn)因素分析 例:比如吸煙、年齡、性別是否為肺癌的危險(xiǎn)因素或是保護(hù)因素? 比如哪些因素導(dǎo)致了人群中有的人患胃癌而有的人不患胃癌,2.什么是邏輯回歸(logistic regression),簡(jiǎn)單的來說它是線性回歸的一種,事實(shí)上它

2、是一個(gè)被logistic方程歸一化后的線性回歸。在許多實(shí)際問題中,比如流行病學(xué)常研究的二分類因變量(患病與未患病、陽性與陰性等)與一組(x1x2.xn)自變量的關(guān)系這類問題時(shí),我們需要回歸產(chǎn)生一個(gè)類似概率值( 0-1 )之間的數(shù)值來進(jìn)行預(yù)測(cè)。這種情況下這個(gè)數(shù)值必須是01之間,而線性回歸就顯得無能為力了,因此人們引入了Logistic 方程來做歸一化。使得因變量的取值框定在了01之間。這種變換方法我們就稱之為邏輯回歸,3. SPSS實(shí)例 本次以廣泛使用的二分類logistic回歸為例為大家介紹 SPSS的操作過程。 例:為研究急性腎功能衰退(ARF)患者的危險(xiǎn)因素, 獲得了422名住院患者的臨床

3、資料,本資料共涉及29個(gè)變量 分別為:sex、age、社會(huì)支持、慢性病、手術(shù)、糖尿病、瘤 黃疸、透析方式、死亡等,其中透析方式為多分類變量,有 4個(gè)水平。 (邏輯回歸方程運(yùn)算具體是怎么做的并不重要,對(duì)使用者來說,我們就把它當(dāng)成一條程序命令就好。邏輯回歸方程推導(dǎo),求解方法可詳見衛(wèi)生統(tǒng)計(jì)學(xué),1)操作過程如下(見數(shù)據(jù)文件“l(fā)ogistics-1.sav”,一般過程 菜單選擇 分析 回歸 二元logistic 彈出邏輯回 歸主對(duì)話框,邏輯回歸主對(duì)話框如下圖所示,有進(jìn)入法、前進(jìn)法和后退法三大類,三類之下又有細(xì)分,分類”鈕:如果你的自變量是多分類的(如血型等),你必須要將它用啞變量的方式來分析,那么就要用

4、該按鈕將該變量指定為分類變量,如果有必要,可用里面的選擇按鈕進(jìn)行詳細(xì)的定義,如以哪個(gè)取值作為基礎(chǔ)水平各水平間比較的方法是什么等。當(dāng)然,如果你弄不明白,不改也可以,默認(rèn)的是以最大取值為基礎(chǔ)水平,用“指示符”(每一類與參照類進(jìn)行比較)做比較,保存”鈕:起到將中間結(jié)果存儲(chǔ)起來供后續(xù)分析的作用,如右圖所示,共有預(yù)測(cè)值、影響強(qiáng)度因子和殘差三大類,選項(xiàng)”鈕:這一部分非常重要,在這里我們可以對(duì)模型作精確定義,還可以選擇模型預(yù)測(cè)情況的描述方式,如“統(tǒng)計(jì)量和圖”中的“分類圖”就是非常重要的模型預(yù)測(cè)工具,“估計(jì)值的相關(guān)性”則是重要的模型診斷工具,“迭代歷史記錄”可以看到迭代的具體情況,從而得知你的模型是否在迭代時(shí)

5、存在病態(tài),下方則可以確定進(jìn)入和排除的概率標(biāo)準(zhǔn),這在逐步回歸中是非常有用的,選項(xiàng)”框:這一部分我們可以對(duì)模型作精確定義,還可以選擇模型預(yù)測(cè)情況的描述方式。 “輸出”框:系統(tǒng)默認(rèn)為輸出每一步驟的統(tǒng)計(jì)圖、統(tǒng)計(jì)表及統(tǒng)計(jì)量。 “步進(jìn)概率”是逐步篩選變量的概率水準(zhǔn),本例的具體的分析操作如下: 1.分析=回歸=二元logistics. 2.因變量框:選入“死亡” 3.協(xié)變量框:選入sex/age/感染 4.方法:進(jìn)入 5.“分類”鈕: 分類協(xié)變量:透析方式(指示符(第一)) 6.“保存”鈕: 預(yù)測(cè)值:概率、組成員 7.“選項(xiàng)”鈕: 統(tǒng)計(jì)量和圖:分類圖、迭代記錄、優(yōu)勢(shì)比(OR)的95%可信區(qū)間 輸出:在最后一

6、個(gè)步驟中 在模型中包括常數(shù) 8. “確定”鈕:?jiǎn)螕?4.結(jié)果分析,左表為記錄處理情況匯總,即有多少例記錄被納入了下面的分析,可見此處因不存在缺失值,422條記錄均納入了分析,主要結(jié)果解釋,二分類變量,本例為變量“死亡”,有兩個(gè)水平,變量標(biāo)記為:0=“N”(未死亡);1=“Y”(死亡,此處已經(jīng)開始了擬合,塊0擬合的是只有常數(shù)的無效模型,上表為分類預(yù)測(cè)表,可見在259例觀察值為N的記錄中,共有259例被預(yù)測(cè)為N,163例Y也都被預(yù)測(cè)為N,總預(yù)測(cè)準(zhǔn)確率為61.4%,這是不納入任何解釋變量時(shí)的預(yù)測(cè)準(zhǔn)確率,相當(dāng)于比較基線,塊 0: 起始?jí)K,左表為在塊 0處尚未納入分析方程的侯選變量,所作的檢驗(yàn),表示如果

7、分別將他們納入方程,則方程的改變是否會(huì)有顯著意義可見如果將“age,社會(huì)支持、手術(shù)、糖尿病等(sig.0.05)變量”納入方程,則方程的改變是有顯著意義的,塊 1: 方法 = 輸入,第一個(gè)表為全局檢驗(yàn)的最后一步,作的步驟、塊和模型的檢驗(yàn),可見3個(gè)檢驗(yàn)都是有意義的。 第二個(gè)表為分類表,它表示了每一步的預(yù)測(cè)情況匯總,展示了對(duì)疾病結(jié)局是否死亡進(jìn)行判別分類,以預(yù)測(cè)概率0.5為判別分界點(diǎn)(cut value),可見準(zhǔn)確率由“塊 0”的61.4%上升到了91%,效果不錯(cuò),1對(duì)于死亡有顯著影響的變量(p0.05)有“腫瘤、CR、昏迷”。 2 B為偏回歸系數(shù)。 3 SE為偏回歸系數(shù)的標(biāo)準(zhǔn)誤。 4 wald統(tǒng)計(jì)量用于檢驗(yàn)總體偏回歸系數(shù)與0的差別有無統(tǒng)計(jì)學(xué)意義。 5 Exp(B)為優(yōu)勢(shì)比,或比數(shù)比(OR) 其中,腫瘤、昏迷是危險(xiǎn)因素,判別分類圖,對(duì)死亡(“N”(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論