多元統(tǒng)計方法2(ppt 81)_第1頁
多元統(tǒng)計方法2(ppt 81)_第2頁
多元統(tǒng)計方法2(ppt 81)_第3頁
多元統(tǒng)計方法2(ppt 81)_第4頁
多元統(tǒng)計方法2(ppt 81)_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、我們要討論的是我們要討論的是多元統(tǒng)計方法多元統(tǒng)計方法建立方程的計算量很大,一般需軟件完成。前人手工計算這兩種回歸(借助科學(xué)計算器),精神可嘉80 年代,一個Logistic回歸即使用計算機(jī),計算的時間也以天計。調(diào)整或控制調(diào)整或控制單因素分析有意義,多因素沒有意義的解釋單因素分析有意義,多因素沒有意義的解釋指標(biāo)多,難以理解。在計算自動化時代,這是回歸的難點(diǎn),我們不懂如何判斷我們的模型的好壞回歸的實(shí)際應(yīng)用回歸的實(shí)際應(yīng)用SPSS菜單菜單(1)自變量為連續(xù)型變量 :必要時作變換(2)自變量為有序變量:依次賦值,如療效好中差,可分別賦值3、2、1(3)自變量為二分類:如令男1,女0(4)自變量為名義分類

2、:需要采用啞變量(dummy variables)進(jìn)行編碼 假如職業(yè)分類為工、農(nóng)、商、學(xué)、兵5類,則可定義比分類數(shù)少1個,即4個啞變量。編碼方法如下:數(shù)據(jù)格式數(shù)據(jù)格式回歸的一些定義回歸的一些定義yi=b0+b1x1i+b2x2i+bnxni回歸方程的建立回歸方程的建立將回歸方程中的所有自變量作為一個整體來檢驗(yàn)他們于應(yīng)變量之間是否具有線性關(guān)系,P0.05,說明所擬合的方程具有統(tǒng)計學(xué)意義,但并不說明模型擬合的好壞各自變量的假設(shè)檢驗(yàn)與評價,檢驗(yàn)各自變量和應(yīng)變量是否有線性關(guān)系,P(可放寬)說明有線性關(guān)系,同樣t值不說明線性關(guān)系的強(qiáng)弱,這樣,一個回歸方程就建立了,回歸方程的建立就是如此easy。線性與擬

3、合優(yōu)度線性與擬合優(yōu)度全局擇優(yōu)法的模型為最佳接近提出年殘殘殘殘1)p()2()()(1()2()()(MallowsCL1964pmpmppCpnMSMSpnpnMSSSCCp準(zhǔn)則的計算公式準(zhǔn)則的計算公式準(zhǔn)則的計算公式越小越好最小二乘法年由日本學(xué)者赤池提出AICpSnpnnAICpy)(2/ )ln(1973212.自變量到底如何選擇自變量到底如何選擇不同準(zhǔn)則、方法得出的“最優(yōu)”方程不同;不同的引入、剔除標(biāo)準(zhǔn)獲得的“最優(yōu)”方程不同;方程還受數(shù)據(jù)的正確性、共線性影響強(qiáng)影響點(diǎn),記錄的選擇強(qiáng)影響點(diǎn),記錄的選擇變量記錄強(qiáng)影響點(diǎn),記錄的選擇強(qiáng)影響點(diǎn),記錄的選擇判斷強(qiáng)影響點(diǎn)的指標(biāo)判斷強(qiáng)影響點(diǎn)的指標(biāo)判斷強(qiáng)影響

4、點(diǎn)的指標(biāo)(判斷強(qiáng)影響點(diǎn)的指標(biāo)(2)距1越遠(yuǎn),越是強(qiáng)影響點(diǎn)其余指標(biāo)絕對值越大越是強(qiáng)影響點(diǎn) 自變量間存在著線性關(guān)系,使一個或幾個自變量可以由另外的自變量線性表示時,稱為該變量與另外的自變量間存在有共線性(collinearity)。容易出現(xiàn):回歸系數(shù)的符號與由專業(yè)知識不符變量的重要性與專業(yè)不符整個方程決定系數(shù)R2高,但各自變量對應(yīng)的回歸系數(shù)均不顯著。多重共線性的診斷多重共線性的診斷Spss的實(shí)現(xiàn)與結(jié)果的實(shí)現(xiàn)與結(jié)果實(shí)例實(shí)例從第四個特征根看,特征根小,條件指數(shù)大,從變量的方差比例來看,SBP和DBP在其中貢獻(xiàn)最大,可以說兩者有近似共線性不過兩者的共線性對方程的影響并不大容許度越近于0共線性越大,等于0

5、,完全共線復(fù)制的BMI根本無法進(jìn)入方程后面討論交互作用的時候我們還要提到共線性影響因素分析,控制混雜因素預(yù)測:由自變量值推出應(yīng)變量Y的值控制:指定應(yīng)變量Y的值查看自變量的改變量在醫(yī)學(xué)研究中最為長用,個人認(rèn)為在醫(yī)學(xué)研究中最為長用,個人認(rèn)為對模型擬合要求較低,特別在對模型擬合要求較低,特別在控制混雜的控制模式中控制混雜的控制模式中后兩種用途對模型要求嚴(yán)格回歸系數(shù)符號反常與主要變量選不進(jìn)方程回歸系數(shù)符號反常與主要變量選不進(jìn)方程的原因分析的原因分析線性回歸的注意事項(xiàng)線性回歸的注意事項(xiàng)共線性很大回歸的發(fā)展回歸的發(fā)展Logistic回歸回歸二、 Logistic回歸模型26例冠心病病人和例冠心病病人和28

6、例對照者進(jìn)行例對照者進(jìn)行病例病例 對照研究(變量賦值表)對照研究(變量賦值表) 有統(tǒng)計學(xué)家持反對意見認(rèn)為損失信息26例冠心病病人和例冠心病病人和28例對照者進(jìn)行例對照者進(jìn)行病例病例 對照研究(數(shù)據(jù)格式)對照研究(數(shù)據(jù)格式) Logistic回歸方程的建立回歸方程的建立建立方程就是求解b0,b1bp參數(shù)意義參數(shù)意義回歸系數(shù)的意義iibbus()ibibuse參數(shù)估計參數(shù)估計似然函數(shù)計算方法最大似然法迭代法1. 初始值2. 迭代次數(shù)3. 人為精度4. 可能不收斂5. 總體來說,解比6. 較穩(wěn)定。SPSS的實(shí)現(xiàn)的實(shí)現(xiàn)analyze-regression-binary logistic-option模

7、型擬合優(yōu)度指標(biāo),2值越小,P值越大表明模型越好迭代過程,可以監(jiān)察方程計算的過程參數(shù)估計的相關(guān)矩陣,每步各協(xié)變量的零級相關(guān)系數(shù)(簡單相關(guān)系數(shù))均?。?說明 Logistic方程總體有意義,借用線性的 解釋來說將回歸方程中的所有自變量作為一個整體來檢驗(yàn)他們于應(yīng)變量之間是否具有關(guān)系,P0.05,說明所擬合的方程具有統(tǒng)計學(xué)意義,但并不說明模型擬合的好壞:真正的模型擬合一般要把其提高到0.20或0.10而非0.05。結(jié)果結(jié)果3結(jié)果結(jié)果4參數(shù)估計的相關(guān)矩陣,每步各協(xié)變量的零級相關(guān)系數(shù)(簡單相關(guān)系數(shù))均?。?.80),提示各協(xié)變量間相互獨(dú)立至此,一個最簡單logistic方程建立和檢驗(yàn)告一段落,下面涉及和自

8、變量的篩選自變量的篩選全局擇優(yōu)指標(biāo)全局擇優(yōu)指標(biāo)逐步選擇法三種向前法,協(xié)變量引入檢驗(yàn)均基于score統(tǒng)計量刪除變量基于條件估計的似然比刪除變量基于最大偏似然估計似然比刪除變量基于Wald統(tǒng)計量似然比檢驗(yàn)(likehood ratio test)iibbu =siibbus由于軟件的計算相對容易,可以多種方法比較,結(jié)果多數(shù)一致,如果不一致,也均發(fā)生在臨近界值的變量上,這些變量在方程中本身對應(yīng)變量的影響就不大,在實(shí)際中對研究的影響也較小。尋找強(qiáng)影響點(diǎn),記錄的選擇尋找強(qiáng)影響點(diǎn),記錄的選擇分類自變量的啞變量編碼 為了便于解釋,對二項(xiàng)分類變量一般按0、1編碼,一般以0表示陰性或較輕情況,而1表示陽性或較嚴(yán)

9、重情況。如果對二項(xiàng)分類變量按+1與-1編碼,那么所得的, 容易造成錯誤的解釋。 )2exp(OR西、中西、中三種療法啞變量化西、中西、中三種療法啞變量化其它中西其它西012011XX原資料原資料啞變量化啞變量化00100121中中西西療法XXSpss中亞變量的設(shè)置中亞變量的設(shè)置亞變量的亞變量的SPSS處理菜單處理菜單亞變量的亞變量的SPSS處理菜單(二)處理菜單(二)亞變量設(shè)置(亞變量設(shè)置(Spss)參照分類為0,其余為1,即各分類與參照分類比較除第一類分類外,各分類與其之前平均分類效應(yīng)比較亞變量設(shè)置亞變量設(shè)置(2)Sas統(tǒng)計軟件所得的結(jié)果解釋與spss相似七、條件Logistic回歸i1 12 2logit P=bkkbxb xb x1 12 2logit P=bk k

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論