腎炎診斷的數(shù)學(xué)模型含程序_第1頁
腎炎診斷的數(shù)學(xué)模型含程序_第2頁
腎炎診斷的數(shù)學(xué)模型含程序_第3頁
腎炎診斷的數(shù)學(xué)模型含程序_第4頁
腎炎診斷的數(shù)學(xué)模型含程序_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、 腎炎診斷的數(shù)學(xué)模型摘要本題討論的問題是關(guān)于腎炎監(jiān)測指標(biāo)的分析,我們首先對數(shù)據(jù)從整體上用求單項均值的方法進行了預(yù)處理,隨后建立起以下三種模型。針對問題一,我們共用了兩種模型。首先建立起B(yǎng)inary Logistic回歸模型,得到回歸方程(見5.1.2式子 ),并得出該表達(dá)式的相關(guān)系數(shù)R=0.82378902。在假設(shè)檢驗中利用Excel經(jīng)過F檢測得出檢驗的臨界值為,該值遠(yuǎn)小于顯著水平0.05,從而驗證了該方法的正確性,最后用回代法得出正確率為93.33%。我們的第二種模型是費希爾判別模型,該模型得出的正確率也為93.33%。兩種模型正確率相同,均可以作為判別屬于患者或健康人的方法。針對問題二,我

2、們利用問題一中兩種模型得出的公式將待測30組數(shù)據(jù)代入,得出結(jié)果均為:15個為腎炎患者,15個為健康人。(詳細(xì)結(jié)果見附錄三)針對問題三,我們也建立了兩種模型。首先建立多元線性回歸模型,利用Excel的6SQ軟件,得出了各項元素的顯著性水平。根據(jù)顯著性依次剔除了式子中的部分元素并用回代法進行了相關(guān)性檢驗。最終得出結(jié)論為剔除Na、Zn、K時所得模型最優(yōu),得到回歸方程(見7.1.2式子),并求出回歸系數(shù)R=0.809870029,標(biāo)準(zhǔn)誤差為0.306346745,回代后準(zhǔn)確率為93.33%,誤判為第32,33,38,60號。同時用主成分分析法結(jié)合費希爾判別模型得出誤判結(jié)果相同。針對問題四,我們利用問題

3、三中兩種方法得出的公式分別將待測30組數(shù)據(jù)代入,得出結(jié)果: 線性回歸法有14個腎炎患者,16個健康人。成分分析法有13個腎炎患者,17個健康人。(詳細(xì)結(jié)果見附錄四)針對問題五,我們將問題二和四的結(jié)果進行比較發(fā)現(xiàn)差別在于68,71,77號。無論是何種模型和方法最終分析得出結(jié)論:由于診斷準(zhǔn)確率基本不變,減少了三種元素Na、Zn、K的檢測,則診斷效率大大提高而且為病人節(jié)約了成本和時間,所以問題二方法比問題四方法更優(yōu)。關(guān)鍵詞:多元線性回歸 主成分分析法 logistic回歸模型 費希爾判別模型1問題重述1.1問題背景隨著我國人口老齡化問題的日益顯現(xiàn),腎炎已經(jīng)成為一種在中老年人群中比較流行的疾病。能否及

4、時診斷出腎炎,對于該病的治療起著至關(guān)重要的作用。因此,對于“如何對腎炎進行診斷”問題的研究,引起了相關(guān)方面的高度重視。努力讓每一個腎炎患者都能“早發(fā)現(xiàn),早治療,早康復(fù)”是每一個醫(yī)院的職責(zé)。其中,對化驗結(jié)果的檢測分析是診斷該病的最直接途徑。建立相關(guān)的數(shù)學(xué)模型來研究“如何用最少的化驗指標(biāo)來確診腎炎患者”已經(jīng)成為解決該問題的主流方法。1.2需要解決的問題人們到醫(yī)院就診時,通常要化驗一些指標(biāo)來協(xié)助醫(yī)生的診斷。診斷就診人員是否患腎炎時通常要化驗人體內(nèi)各種元素含量。表B.1是確診病例的化驗結(jié)果,其中130號病例是已經(jīng)確診為腎炎病人的化驗結(jié)果;3160號病例是已經(jīng)確診為健康人的結(jié)果。表B.2是就診人員的化驗

5、結(jié)果。我們的問題是:1.根據(jù)表B.1中的數(shù)據(jù),提出一種或多種簡便的判別方法,判別屬于患者或健康人的方法,并檢驗?zāi)闾岢龇椒ǖ恼_性。2.按照1提出的方法,判斷表B.2中的30名就診人員的化驗結(jié)果進行判別,判定他(她)們是腎炎病人還是健康人。3.能否根據(jù)表B.1的數(shù)據(jù)特征,確定哪些指標(biāo)是影響人們患腎炎的關(guān)鍵或主要因素,以便減少化驗的指標(biāo)。4.根據(jù)3的結(jié)果,重復(fù)2的工作。5對2和4的結(jié)果作進一步的分析。2模型的假設(shè)及符號說明2.1模型假設(shè)假設(shè)1:假設(shè)題目中所給的60組數(shù)據(jù)時隨機抽取的,數(shù)據(jù)之間是互相獨立的假設(shè)2:假設(shè)所給病人都只患腎炎一種病,而不患其它病假設(shè)3:假設(shè)題目中所給的7中元素在人體內(nèi)含量是

6、互相獨立的,互相之間沒有影響假設(shè)4:假設(shè)題目中所給的數(shù)據(jù)都是真實可靠的,化驗沒有錯誤假設(shè)5:假設(shè)所給的7中元素在不同健康人體內(nèi)部含量基本相同,體重的影響可以忽略不計假設(shè)6:假設(shè)我們通過7中元素在人體含量就可以確診,其它因素可以忽略2.2符號說明符號說明i=1,2,3,4,5,6,7分別表示Zn、Cu、Fe、Ca、Mg、K、Na的含量i=0,1,2,3,4,5,6,7,8表示回歸方程的系數(shù)y=0表示健康人;y=1表示患者i=1,2,3,4,5,6,7;j=0,1.表示第i中元素在健康和患者體內(nèi)平均含量j=0表示健康人;j=1表示患者回歸平方和殘差平方和總離差平方和統(tǒng)計量Logistic變換3問題

7、分析此題研究的是醫(yī)院關(guān)于腎炎確診的數(shù)學(xué)建模問題。要求我們通過建立合理的數(shù)學(xué)模型,研究不同元素在人體含量,確定人體是否患病。通過對題目中所給的30組健康人和30組患者人體7中元素含量分析我們發(fā)現(xiàn),就診者是否患腎炎可能取決于人體內(nèi)某些元素的含量增減或各元素占總元素比例變化。因此,我們可以建立相應(yīng)的回歸方程來研究,患病與否與人體元素含量的關(guān)系。在運用相關(guān)性檢驗我們的假設(shè)。針對問題一:由于logistic回歸分析,主要在流行病學(xué)中應(yīng)用較多,比較常用的情形是探索某疾病的危險因素,根據(jù)危險因素預(yù)測某疾病發(fā)生的概率等等。因此,問題一我們建立logistic回歸模型,研究患腎炎與否與人體相關(guān)元素含量的關(guān)系。再

8、通過假設(shè)檢驗驗證我們建立模型的合理性、正確性。運用我們建立的模型對題目所給的60組病例驗證其準(zhǔn)確率。針對問題二:我們運用問題一中建立的模型,對B.2中所給的30個就診人員是否患病進行判定,求出對應(yīng)的p值和0.5比較,對于0.5表示患病,小于0.5表示健康,求解結(jié)果以表格呈現(xiàn)。針對問題三:問題一中我們已經(jīng)求出對應(yīng)的回歸方程,以及標(biāo)準(zhǔn)差等,知道元素的顯著關(guān)系由強到弱關(guān)系為Ca,Cu,Fe,Mg,Na,Zn,K。對于顯著關(guān)系較強的·Ca,Cu,Fe不予剔除,逐步考慮剔除4種,3種,2種,1種元素。每剔除一次,計算剔除后的模型準(zhǔn)確率。在準(zhǔn)確率基本不變的情況下,剔除元素越多越好。這樣我們保留了

9、重要因素,又不影響模型合理性。針對問題四:我們運用問題三中剔除相關(guān)元素后的模型對對B.2中所給的30個就診人員是否患病進行判定,求出對應(yīng)的p值和0.5比較,對于0.5表示患病,小于0.5表示健康,求解結(jié)果以表格呈現(xiàn)。針對問題五:對問題二和問題四的結(jié)果先進行定量分析,找出求解結(jié)果差異的本質(zhì)原因,再考慮其他因素對模型結(jié)果的影響,最后從經(jīng)濟層面分析,模型的優(yōu)劣。4數(shù)據(jù)分析與處理我們通過分析所給的60組數(shù)據(jù),繪制各種元素在健康人與患者體內(nèi)含量對比健康的與患病的人體內(nèi)相關(guān)元素平均值繪制表格如下:表1ZnCuFeCaMgKNa患者體內(nèi)每種元素的平均值143.112.3323.07698.17113.392

10、01.13526.83健康人體內(nèi)每種元素的平均值186.621.9262.012511.13295.1490.37367.21繪制成對比圖如下分析圖可知:患者與健康人Ca的含量差距較大。5問題一的解答我們共建立了兩種模型:Binary logistic 回歸模型和費希爾判別模型5.11模型一Binary logistic 回歸模型的建立從上面的分析可知,我們建立模型求解結(jié)果只有患病和健康兩種。由于logistic回歸,主要在流行病學(xué)中應(yīng)用較多,比較常用的情形是探索某疾病的危險因素,根據(jù)危險因素預(yù)測某疾病發(fā)生的概率。由此,我們考慮運用Logistic回歸模型。Binary Logistic回歸模

11、型因變量只能取兩個值1和0(虛擬因變量),我們采用多種方法對取值為0和1的因變量進行分析。以y表示事件發(fā)生的概率(事件未發(fā)生的概率為1-p),并吧y看作自變量Xi的線性函數(shù)p的值在0,1變化,由于當(dāng)p接近0或1時,自變量即使有很大變化,p值也不可能有很大變化,所以上式直接用普通的最小二乘法是行不通的。我們引入p的logistic變換其中p/(1-p),logit(p)是因變量Y=1的差異比,可得 綜上所述,我們建立Binary Logistic回歸模型5.1.2模型一Binary logistic 回歸模型的求解我們假設(shè)各元素的含量與是否患病之間滿足線性相關(guān)關(guān)系。定義y=1表示患??;y=0表示

12、健康。我們將題目中所給的數(shù)據(jù)導(dǎo)入Excel中,利用Excel中的回歸函數(shù),選擇95%的置信度,得到回歸統(tǒng)計量、方差分析、回歸方程?;貧w統(tǒng)計量:回歸系數(shù)R0.823778902回歸系數(shù)R平方0.678611679調(diào)整了的R平方0.642228095標(biāo)準(zhǔn)誤差0.304480163截距0.891130318觀測值60其中R為相關(guān)系數(shù),可以衡量X與Y之間的相關(guān)性大小。本題求得R=0.82378902表示X與Y之間高度正相關(guān),即有:患病與否與人體各種元素含量高度相關(guān)?;貧w參數(shù)表系數(shù)標(biāo)準(zhǔn)誤差t統(tǒng)計量t臨界值p值置信區(qū)間下限置信區(qū)間上限截距0.8911303180.1828742174.8729139282

13、.0066467611.07256E-050.5241663631.258094273X1-0.000332760.000998095-0.333398472.0066467610.740174162-0.002335590.001670061X20.016659170.0041218634.0416607572.0066467610.00017590.0083880480.024930292X3-0.001624360.000859017-1.890954492.0066467610.064207521-0.003348119.93816E-05X4-0.00030096.25484E-05

14、-4.810659582.0066467611.3308E-05-0.00042641-0.00017539X5-0.000957560.00059758-1.602388812.0066467610.115127573-0.002156690.000241577X6-6.607E-050.000307255-0.215034392.0066467610.830581651-0.000682620.000550483X70.0003031910.000219611.3805846662.0066467610.173312468-0.000137490.000743871由上表可知:b0=0.8

15、91130318,b1=-0.00033276,b2=0.01665917,b3=-0.00162436,b4=-0.0003009,b5=-0.00095756,b6=-6.607E-05,b7=0.000303191回歸方程為:5.1.3假設(shè)檢驗(方差分析和F檢驗)因自變量與自變量是否存在上述求出的回歸表達(dá)式所示的線性關(guān)系是需要檢驗的,顯然,如果所有的的都很小,與的線性關(guān)系就不明顯,所以可令原假設(shè)為當(dāng)成立時滿足在顯著水平下有上分位數(shù),若,則接受;否則,拒絕。經(jīng)代入數(shù)據(jù)計算得到結(jié)果如下表所示:自由度平方和平均平方和F統(tǒng)計量F臨界值p值回歸710.179175181.45416788315.6

16、85434082.1916260277.36569E-11剩余524.820824820.09270817總計5915有F檢驗,在顯著水平下F的臨界值為7.36569E-11遠(yuǎn)小于顯著水平0.05,并且F統(tǒng)計量>F(1,5)=6.61說明我們求解得到的回歸方程回歸效果明顯,多元線性回歸擬合得很好。所以,我們接受各元素的含量與是否患病之間滿足線性相關(guān)關(guān)系這一假設(shè)。所以,我們建立的模型是合理可靠的。5.1.5模型一Binary logistic 回歸模型結(jié)果及分析我們運用所建立的Binary logistic 回歸模型對題目題目中所給的60組數(shù)據(jù)進行驗證,發(fā)現(xiàn)60組數(shù)據(jù)中只有4組數(shù)據(jù)得出的結(jié)

17、果與實際不同。分別是第32,38,39,60(具體數(shù)據(jù)見附錄一)。驗證后我們發(fā)現(xiàn)準(zhǔn)確率達(dá)到了93.33%。相關(guān)程序見附錄二5.21模型二費希爾判別模型的建立基本思想:從兩個總體中抽取具有個指標(biāo)的樣品觀測數(shù)據(jù),借助方差分析的思想造一個判別函數(shù)或稱判別式:其中系數(shù)確定的原則是使兩組的區(qū)別最大,而使每個組內(nèi)的離差最小。有了判別式后,對于一個新的樣品,將它的個指標(biāo)值代入判別式中求出值,然后與判別臨界值進行比較,就可以判別它應(yīng)屬于哪一個總體。確定判別函數(shù):此時最優(yōu)的線性判別函數(shù)為:兩組間離差平方和越大越好,兩個組內(nèi)的離差平方和越小越好。記為兩組間離差平方和。為兩組內(nèi)的離差平方和。即就是要求越大越好。則利

18、用微積分求極值的必要條件可求出使達(dá)到最大值的從而求得判別函數(shù)為綜上我們建立的費希爾判別模型為5.22模型二費希爾判別模型的求解我們采用統(tǒng)計軟件SPSS中的判別分析,對已確診的60例做出判別,將判別結(jié)果與準(zhǔn)確結(jié)果對比,檢驗此方法的正確性,其結(jié)果見附錄二從表中可以發(fā)現(xiàn),用費希爾判別法對已確診的60例重新作出判別時,1-30號完全正確,31-60號中有4例判別錯誤,分別是32,38,39,60,正確率為93.33%。5.3 Binary logistic 回歸模型和費希爾判別模型的比較綜述以上三種判別方法,可以得到它們各自的正確率,如下表Binary logistic費希爾判別法30病人正判率100

19、%100%30健康正判率86.67%86.67%總?cè)藬?shù)正判率93.33%93.33%從表中的結(jié)果可以明顯看出費希爾判別法的正確率Binary logistic相同。費希爾判別法和Binary logistic均可以作為判別屬于患者或健康人的方法。6問題二的解答6.1問題二Binary logistic 回歸模型的建立借用問題一中Binary logistic回歸模型得到以下模型6.1.2 Binary logistic 回歸模型的求解建立系數(shù)矩陣常數(shù)矩陣,數(shù)據(jù)矩陣則最終的判定矩陣我們運用上面建立的Binary logistic回歸模型對表B.2中的30名就診人員的化驗結(jié)果進行判別,判定他們是腎

20、炎病人還是健康人,其中15個為患者,15個健康人。檢驗結(jié)果為:腎炎患者為61,62,64,65,66,68,69,71,72,73,75,76,79,83,85號 健康人為63,67,70,74,77,78,80,81,82,84,86,87,88,89,90號 具體數(shù)據(jù)結(jié)果和求解程序見附錄三6.2費希爾判別模型的求解采用費希爾判別法,運用SPSS求解,判別結(jié)果如下表30名就診人員的判別結(jié)果病歷號判別結(jié)果病歷號判別結(jié)果61176162177063078064179165180066181067082068183169184070085171186072187073188074089075190

21、0檢驗結(jié)果為:腎炎患者:61,62,64,65,66,68,69,71,72,73,75,76,79,83,85號健康人:63,67,70,74,77,78,80,81,82,84,86,87,88,89,90號6.3 Binary logistic 回歸模型與費希爾判別模型的比較Binary logistic 回歸模型和費希爾判別模型的判別結(jié)果一致,兩種方法更加確定了診斷的準(zhǔn)確性。7問題三的解答我們建立了兩種模型:線性回歸模型和費希爾判別模型7.1.1線性回歸模型的建立我們運用Excel中6SQ中的回歸分析得到如下表格:元素p值顯著性Ca1.3308E-05顯著Cu0.0001759顯著Fe

22、0.064207521不顯著Mg0.115127573不顯著Na0.173312468不顯著Zn0.740174162不顯著K0.830581651不顯著P值越小表示顯著水平越高。七中元素的回歸系數(shù)顯著性水平由高到底順序為Ca,Cu,Fe,Mg,Na,Zn,K.所以我們有理由假設(shè)p值較大的幾中元素對是否患腎炎影響有限,可以忽略不計,基于這一思想我們建立相應(yīng)的模型,逐步剔除一些元素。對于顯著水平較高的Ca和Cu顯然我們不能剔除。綜上所述,我們建立多元線性回歸模型。7.1.2線性回歸模型的求解我們先剔除顯著性水平最低的4這種元素(Mg,Na,Zn,K),此時回歸系數(shù)R=0.801226082,標(biāo)準(zhǔn)

23、誤差0.309681619, 準(zhǔn)確率為91.67%。發(fā)生誤判的為第32,33,38,39,60。剔除顯著性水平最低的3種元素(Na,Zn,K),此時回歸系數(shù)R=0.809870029,標(biāo)準(zhǔn)誤差為0.306346745,準(zhǔn)確率為93.33%,發(fā)生誤判的為第32,33,38,60。剔除3種元素(Mg,Zn,K),此時回歸系數(shù)R=0.812314826,標(biāo)準(zhǔn)差為0.304576289,準(zhǔn)確率為91.67%,誤判的為第32,38,39,43,60剔除3種元素(Mg,Na,K),此時回歸系數(shù)R=0.805822072,標(biāo)準(zhǔn)差0.309244294,準(zhǔn)確率為91.67%,誤判的第32,33,38,39,6

24、0剔除3種元素(Mg,Na,Zn),此時回歸系數(shù)R=0.80791231,標(biāo)準(zhǔn)差0.30775331,準(zhǔn)確率為93.3%,誤判的為第32,38,39,60剔除顯著性水平最低的2中元素(Zn,K),此時回歸系數(shù)為R=0.823240824,標(biāo)準(zhǔn)誤差為0.29920012準(zhǔn)確率為93.33%,發(fā)生誤判的為第32,38,39,60最終結(jié)果為:剔除Na、Zn、K7.1.3線性回歸模型的結(jié)果及分析我們追求的目標(biāo)是在保證準(zhǔn)確率不會下降的情況下,剔除的元素越多越好,這樣可以減少醫(yī)院工作量,節(jié)約成本。分析上面我們的求解結(jié)果可知,當(dāng)剔除4中元素時準(zhǔn)確率下降了1.66%,剔除3種元素Na,Zn,K和Na,Zn,M

25、g時準(zhǔn)確率沒有發(fā)生變化,剔除3種元素Mg,Zn,K和Mg,Na,K時準(zhǔn)確率下降了1.66%,剔除2種元素時準(zhǔn)確率沒有發(fā)生變化。剔除的元素Na,Mg,Zn,KNa,Zn,KNa,Zn,MgMg,Zn,KMg,Na,K任意兩種準(zhǔn)確率變化下降1.66%無變化無變化下降1.66%下降1.66%無變化于是,我們應(yīng)選擇剔除3中元素,進一步分析剔除Na,Zn,K比剔除Mg,Na,Zn后的回歸系數(shù)大,而標(biāo)準(zhǔn)差小。說明剔除Na,Zn,K后相關(guān)度更高,誤差更小。所以,我們選擇剔除Na,Zn,K。7.2.1主成分分析法模型的建立在本問題中,設(shè)有個樣品,每個樣品觀測個指標(biāo),我們把這個指標(biāo)看做個隨機變量,記為。設(shè)隨機變

26、量的均值為,協(xié)方差矩陣為。主成分分析法就是要把這個指標(biāo)的問題,轉(zhuǎn)變?yōu)橛懻搨€指標(biāo)線性組合的問題。對進行線性變換,可以生成新的指標(biāo)即主成分,記為。則要想確定主成分就是要確定系數(shù),即就是原來變量在各個主成分上的載荷,經(jīng)過證明它們是相關(guān)矩陣的個較大的特征值所對應(yīng)的特征向量。綜上我們建立的模型是7.2.2主成分分析法模型的求解現(xiàn)在來確定系數(shù),因為是不相關(guān)的主成分,即。結(jié)合費希爾判別法定出Cu,Ca,Mg,K,Na五項指標(biāo),以這五項指標(biāo)對前60號病例進行費希爾判別。利用Matlab程序和SPSS軟件,得到結(jié)果如下:病例號準(zhǔn)確結(jié)果費希爾判別法病例號準(zhǔn)確結(jié)果費希爾判別法11131002113200311330

27、04113400511350061136007113700811380091139001011400011114100121142001311430014114400151145001611460017114700181048001911490020115000211151002211520023115300241154002511550026115600271157002811580029115900301160007.2.3主成分分析法模型的結(jié)果分析由結(jié)果得出用Cu,Ca,Mg,K,Na五項指標(biāo)采用費希爾判別得到的正確率為93.33%。費希爾判別法得到的結(jié)果正確率很高。7.3線性回歸模型和

28、模主成分分析法模型立比較Cu,Ca,Mg,K,Na五項指標(biāo)與Cu,F(xiàn)e,Ca,Mg,K五項指標(biāo)的公共指標(biāo)是Cu,Ca,Mg,K四項指標(biāo),這說明另外兩種指標(biāo)Na和Fe對判定結(jié)果影響不大,所以我們?nèi)∷鼈兊墓苍丶碈u,Ca,Mg,K四項指標(biāo)作為影響是否患病的主要指標(biāo)。8問題四的解答8.1.1建立多元回歸模型:我們運用建立的模型對所給的30組待測數(shù)據(jù)進行評估,8.1.2模型的求解建立系數(shù)矩陣常數(shù)矩陣,數(shù)據(jù)矩陣則最終的判定矩陣我們根據(jù)(3)中剔除的結(jié)果,將(1)中回歸方程剔除3個顯著度最小的變量后變量為4個。檢驗結(jié)果為:我們發(fā)現(xiàn)有14個患者,16個健康人患者:61,62,64,65,66,69,72

29、,73,75,76,77,79,83,85號健康人:63,67,68,70,71,74,78,80,81,82,84,86,87,88,89,90號具體數(shù)據(jù)相關(guān)程序見附錄四8.2.1費希爾判別法模型的求解30名就診人員的判別結(jié)果病例號費希爾判別法病例號費希爾判別法611761621770630780641791651800661810670820680831691840700851711860721870731880740890751900檢驗結(jié)果為:腎炎患者:61,62,64,65,69,71,72,73,75,76,79,83,85號健康人:63,67,68,70,74,77,78,80,

30、81,82,84,86,87,88,89,90號8.3費希爾判別法和多元回歸模型比較兩種模型區(qū)別在于77和71號但是希爾費希爾判別法準(zhǔn)確率更高,應(yīng)該選取該法。9問題五的解答9.1結(jié)果對比對比問題二和問題四的求解結(jié)果,不同之處主要如下問題二患者68、71問題四患者77問題二健康者77問題四健康者68、71分析可知問題二和問題四的求解結(jié)果不同之處主要體現(xiàn)在第68,71,77號上。為了便于分析我們從中取一些數(shù)據(jù)進行對比:病例號ZnCuFeCaMgKNa681704.169.32943260155680.8711888.2822.61208231131413727716213.219.81521166

31、36.2133患者均值143.1012.3323.07698.17113.39201.13526.83健康人均值186.6021.9262.012511.13295.1490.37367.21病例68,71與健康者比較,其Zn的含量正常,但是K和Na的含量嚴(yán)重超標(biāo),由于問題四中我們已經(jīng)剔除Na,K,Zn這3中元素含量對回歸方程值不再有影響,而問題二中,我們考慮了這3中元素后會使得求得的Y值偏大,從而得出68,71是患者這一結(jié)論。病例77與健康人比較Zn的含量稍微偏低,K和Na含量嚴(yán)重偏低,其它元素含量也偏低。忽略Na,K,Zn后,我們發(fā)現(xiàn)其它元素的含量與患者更為接近,因而,問題四得出77為患者

32、是預(yù)料之中的,考慮這3中元素后,我們根據(jù)回歸方程的系數(shù)符號及大小分析,Y值會偏小,故問題二會得出77為健康。用費希爾判別法(包含七項指標(biāo))和費希爾判別法(包含簡化后的四項指標(biāo)Cu,Ca,Mg,K)判別30名就診人員是否患病的結(jié)果中,只有75號不一致,其余結(jié)果均一致,一致率達(dá)到96.7%。9.2結(jié)果分析事實上我們在建立回歸方程時并沒有考慮某一單一元素在人體含量波動較大,比如K和Na。若某人在一天時間攝入大量含K和Na的食物,其體內(nèi)的K和Na含量也會嚴(yán)重超標(biāo)。若一段時間攝入較少,其含量也會嚴(yán)重偏低。我們在考慮某人是否患病時,要綜合各種元素考慮。最好,讓病人隔一段時間再測一次,這樣可以大大減小誤判。

33、我們在診斷時,當(dāng)然期望檢測更少的元素含量,但是診斷準(zhǔn)確率又不能下降太大。這樣醫(yī)院能大大提高工作效率,也為病人節(jié)約了成本和時間。基于這一點,我們剔除3中元素,并且準(zhǔn)確率并沒有因此下降。所以,我們剔除的做法是合理的。10.模型的評價、改進、推廣10.1模型的評價Binary logistic 回歸模型優(yōu)點:(1)模型簡潔易懂,我們運用logistic回歸模型,定量分析了元素含量與患病之間的關(guān)系,并且經(jīng)過主因素篩選法,進一步減小要測元素種類。(2)運用Excel中的6SQ統(tǒng)計工具,大大簡化了計算和編程難度(3)我們經(jīng)過假設(shè)檢驗驗證了回歸方程的合理性、正確性(4)建立的模型有實際數(shù)據(jù)的檢驗,準(zhǔn)確率達(dá)到

34、93.33%缺點:(1)我們所選擇的樣本容量有限,所給的數(shù)據(jù)代表性有限。(2)我們忽略了病人可能不止換一種病這種可能性,如果一個病人患有其他病也有可能會影響到相關(guān)元素的含量。費希爾判別法模型:優(yōu)點:判別函數(shù)是線性函數(shù),使用起來比較方便容易。缺點:在均值差別很小的情況下,容易產(chǎn)生誤判。10.2模型的改進我們可以查閱更多資料,收集更多數(shù)據(jù),從而使我們建立的模型更具有代表性。由于某些元素在人體含量波動較大,我們建議病例,隔一段時間再測一次,可以大大減少誤判。10.3模型的推廣我們建立的模型不僅可以用于腎炎這一疾病的診斷,也可以運用于流行病學(xué),比較常用的情形是探索某疾病的危險因素,根據(jù)危險因素預(yù)測某疾

35、病發(fā)生的概率,等等。參考文獻(xiàn)1數(shù)學(xué)建模導(dǎo)論 陳理榮 主編 北京郵電大學(xué)出版社1999年版 2數(shù)學(xué)建模簡明教材 張興永編著 中國礦業(yè)大學(xué)出版社3數(shù)學(xué)分析(第三版) 華東師大數(shù)學(xué)系編 高等教育出版社4數(shù)學(xué)建模方法及其應(yīng)用 韓中庚編著 高等教育出版社5數(shù)學(xué)建模案例精選 朱道元等編著 北京:科學(xué)出版社,2003.附錄附錄一其中“1”表示患病,“0”表示健康病例號ZnCuFeCaMgKNapLogit(p)-0.5檢驗結(jié)果116615.824.57001121795130.70790.38510218515.731.57011251844270.69560.3266031939.825.95411631

36、286420.69330.31540415914.239.789699.22397260.70060.350522616.223.860615270.32180.68580.2807061719.299.2930718745.52570.68510.27750720113.326.655110149.41410.68560.27960814714.5306591021546800.71810.4351091728.857.8655175.798.43180.69440.32101015611.532.56391071035520.69930.343801113215.917.757892.41

37、31413720.75950.650101218211.311.37671112646720.70050.34970131869.2637.1958233733470.62550.01290141628.2327.162510862.44650.68460.27520151506.63216271401796390.68490.276201615910.711.761219098.53900.67770.243101711716.17.0498895.51365720.70780.384701818110.14.0414371841015420.63220.041701914620.723.8

38、123212815010920.72640.476602042.310.39.762993.74398880.72990.494102128.212.453.137044.14548520.74590.576802215413.853.36211051607230.71190.404402317912.217.9113915045.22180.64160.082502413.53.3616.813532.651.61820.71010.39590251755.8424.980712355.61260.63710.06302611315.847.362653.61686270.7270.4792

39、02750.511.66.360858.958.91390.70190.356202878.614.69.742170.81334640.73690.5299029903.278.1762252.37708520.70540.37303017828.832.499211270.21690.71090.399903121319.136.22220249401680.555-0.278513217013.929.8128522647.93300.6250.011503316213.219.8152116636.21330.609-0.05371342031390.8154416298.93940.

40、595-0.114113516713.114.1227821246.31340.544-0.3213616412.918.6299319736.394.50.489-0.54171371671527205626064.62370.560-0.258413815814.437102510144.672.50.6530.132203913322.83116334011808990.6360.0617040156135322674710902288100.4309-0.77821411698308106899.1532890.5339-0.364314224717.38.65255424177.93

41、730.5478-0.30821431668.162.812332521346490.6093-0.05561442096.4386.92157288742190.4809-0.57631451826.4961.738704321433670.3458-1.137714623515.623.4180616668.81880.595-0.115114717319.117249729565.82870.5431-0.32714815119.764.220314031828740.5795-0.179314919165.43553613921376880.5178-0.428715022324.48

42、6360335397.74790.4502-0.699715122120.115531723681507390.4521-0.6921522172528.223433731104940.5671-0.230115316422.235.522122811535490.5916-0.12961541738.993616242161032570.5746-0.199415520218.617.737852253167.30.4425-0.73115618217.324.8307324650.71090.487-0.5521572112417383642873.53510.4331-0.7694158

43、24621.593.2211235471.71950.524-0.40415916416.138213515264.32400.5802-0.17641601792135156022647.93300.63080.03560附錄二費希爾判別法的正確性檢驗病例號準(zhǔn)確結(jié)果判別結(jié)果病例號準(zhǔn)確結(jié)果判別結(jié)果1113100211320131133004113400511350061136007113700811380191139011011400011114100121142001311430014114400151145001611460017114700181148001911490020115000

44、211151002211520023115300241154002511550026115600271157002811580029115900301160011-30組數(shù)據(jù) 的 求解程序A= 0.001 0.2130 0.0191 0.0362 2.2200 0.2490 0.0400 0.1680; 0.001 0.1700 0.0139 0.0298 1.2850 0.2260 0.0479 0.3300; 0.001 0.1620 0.0132 0.0198 1.5210 0.1660 0.0362 0.1330; 0.001 0.2030 0.0130 0.0908 1.5440 0

45、.1620 0.0989 0.3940; 0.001 0.1670 0.0131 0.0141 2.2780 0.2120 0.0463 0.1340; 0.001 0.1640 0.0129 0.0186 2.9930 0.1970 0.0363 0.0945; 0.001 0.1670 0.0150 0.0270 2.0560 0.2600 0.0646 0.2370; 0.001 0.1580 0.0144 0.0370 1.0250 0.1010 0.0446 0.0725; 0.001 0.1330 0.0228 0.0310 1.6330 0.4010 0.1800 0.8990;

46、 0.001 0.1560 0.1350 0.3220 6.7470 1.0900 0.2280 0.8100; 0.001 0.1690 0.0080 0.3080 1.0680 0.0991 0.0530 0.2890; 0.001 0.2470 0.0173 0.0086 2.5540 0.2410 0.0779 0.3730; 0.001 0.1660 0.0081 0.0628 1.2330 0.2520 0.1340 0.6490; 0.001 0.2090 0.0064 0.0869 2.1570 0.2880 0.0740 0.2190; 0.001 0.1820 0.0065 0.0617 3.8700 0.4320 0.1430 0.3670; 0.001 0.2350 0.0156 0.0234 1.8060 0.1660 0.0688 0.1880; 0.001 0.1730 0.0191 0.0170 2.4970 0.2950 0.0658 0.2870; 0.001 0.1510 0.0197 0.0642 2.0310 0.4030 0.1820 0.8740; 0.001 0.1910 0.06

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論