




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、我們仔細(xì)閱讀了中國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽的競(jìng)賽規(guī)則.我們完全明白,在競(jìng)賽開(kāi)始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng) 上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問(wèn)題。我們知道,抄襲別人的成果是違反競(jìng)賽規(guī)則的,如果引用別人的成果或其他公開(kāi)的 資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參 考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽規(guī) 則的行為,我們將受到嚴(yán)肅處理。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫):我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話):所屬學(xué)校(請(qǐng)?zhí)顚懲暾娜簠①?/p>
2、隊(duì)員(打印并簽名):1.指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人(打印并簽名):日期:2012年8月18日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2010高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽編號(hào)專用頁(yè)賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國(guó)統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國(guó)前編號(hào)):全國(guó)評(píng)閱編號(hào)(由全國(guó)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):疾病診斷問(wèn)題摘要隨著就醫(yī)壓力增加,在降低誤診率的前提下提高診斷效率是非常重要的,本文利用 確診樣本數(shù)據(jù)建立判別模型,并利用模型篩選出主要元素,對(duì)就診人員進(jìn)行診斷。針對(duì)問(wèn)題(1),利用確診數(shù)據(jù)建立Fisher判別模型、Logistic回
3、歸模型和BP神經(jīng) 網(wǎng)絡(luò)模型,運(yùn)用matlab、spss求解,定出判別標(biāo)準(zhǔn),并進(jìn)行顯著性檢驗(yàn)和回代檢驗(yàn), 判別模型的準(zhǔn)確率。結(jié)果顯示Fisher判別模型的準(zhǔn)確率為93.3%,Logistic回歸模型 和BP神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率均為100%,Logistic回歸模型相對(duì)簡(jiǎn)便。針對(duì)問(wèn)題(2),選擇問(wèn)題一中檢驗(yàn)準(zhǔn)確率為100%的Logistic回歸模型和BP神經(jīng)網(wǎng) 絡(luò)模型對(duì)40名就診人員進(jìn)行診斷,結(jié)果如下表:Logistic回歸模型BP神經(jīng)網(wǎng)絡(luò)模型健康者1821患、,內(nèi)者2219針對(duì)問(wèn)題(3),建立Logistic逐步回歸模型對(duì)元素進(jìn)行篩選,利用spss軟件求解, 確定Ca和Fe是影響人們患這種病的主要
4、因素,因此在建立診斷模型時(shí),其他元素不作 為參考指標(biāo)。針對(duì)問(wèn)題(4),篩選出主要影響因素后,將Ca和Fe作為指標(biāo)建立Logistic回歸 模型和BP神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)兩個(gè)模型的診斷結(jié)果一致,如下:健康者 患、,內(nèi)者10 19 20 22 23 25 26 27 28 29 30 31 32 33 34 36 37 38 39 401 2 3 4 5 6 7 8 9 11 12 13 14 15 16 17 18 21 24 35針對(duì)問(wèn)題(5),對(duì)比問(wèn)題二和問(wèn)題四結(jié)果,發(fā)現(xiàn)無(wú)關(guān)元素會(huì)影響模型進(jìn)行診斷的準(zhǔn) 確率。關(guān)鍵詞Fisher判別模型Logistic回歸模型BP神經(jīng)網(wǎng)絡(luò)模型逐步回歸模型一、問(wèn)題
5、重述人們到醫(yī)院就診的時(shí)候,通常通過(guò)化驗(yàn)一些指標(biāo)來(lái)協(xié)助醫(yī)生診斷。醫(yī)生根據(jù)化驗(yàn)所 得的元素含量,利用某種指標(biāo),判斷病人是否患病。本題給出了附錄1 (確診人數(shù)),和 附錄2(待診人數(shù)),其中附錄一中1至30號(hào)是確定患病的病人,而31至60號(hào)是沒(méi)有 患病的健康人,要求回答以下問(wèn)題:(1)、根據(jù)附件1中的數(shù)據(jù),提出一種或多種簡(jiǎn)便的方法,判斷屬于患病者或健康 人的方法,并檢驗(yàn)?zāi)闾岢龇椒ǖ恼_性。(2)、按照(1)提出的方法,對(duì)附件2中的40名就診人員的化驗(yàn)結(jié)果進(jìn)行判定他 (她)是患病者還是健康人。(3)、能否根據(jù)附件1的數(shù)據(jù)特征,確定哪些指標(biāo)是影響人們患這種病的關(guān)鍵或主 要因素,一邊減少化驗(yàn)的指標(biāo)。(4)
6、、根據(jù)(3)的結(jié)果,對(duì)附件2中的40名就診人員的化驗(yàn)結(jié)果進(jìn)行判別,判定 他(她)們是患病者還是健康人。(5)、對(duì)(2)和(4)的結(jié)果作進(jìn)一步分析。二、問(wèn)題分析隨著就醫(yī)壓力增大,簡(jiǎn)便的醫(yī)學(xué)化驗(yàn)標(biāo)準(zhǔn)和方法可以大大提高醫(yī)生診斷的效率。 依據(jù)已確診的病例數(shù)據(jù)特征,對(duì)就診病例進(jìn)行分類,協(xié)助醫(yī)生做出準(zhǔn)確的醫(yī)療判斷。針對(duì)問(wèn)題(1),要求利用附錄1已確診的病例數(shù)據(jù)找出一種或多種簡(jiǎn)便的方法,判 斷就診人員患病與否。依據(jù)附錄1中60位已確診病例,可從患病者與健康者體內(nèi)的7 種元素含量入手,即分析確診人員的體內(nèi)元素含量和患病與否的關(guān)系。因此,可構(gòu)造各 種判別分析法,同時(shí)對(duì)其進(jìn)行檢驗(yàn),再利用已知數(shù)據(jù)回代,分別計(jì)算不同
7、判別方法的準(zhǔn) 確率并進(jìn)行比較。針對(duì)問(wèn)題(2),基于問(wèn)題(1),可選擇準(zhǔn)確率最高的判定方法對(duì)附錄2的就診人員 進(jìn)行病例判診,診斷出就診人員是否健康。針對(duì)問(wèn)題(3),問(wèn)題二中兩個(gè)準(zhǔn)確的模型出現(xiàn)不同結(jié)果,所以可以確定存在干擾因 素,利用Logistic逐步回歸模型確定主要影響元素,提高診斷的準(zhǔn)確率與速度。針對(duì)問(wèn)題(4),排除無(wú)關(guān)元素,利用問(wèn)題(1)中確定的模型重新建立診斷函數(shù), 對(duì)40名就診人員重新進(jìn)行診斷。針對(duì)問(wèn)題(5),通過(guò)比較問(wèn)題(2)和問(wèn)題(4)元素和結(jié)果的改變,分析影響診斷結(jié) 果的因素是什么。三、模型假設(shè)(1)假設(shè)檢測(cè)數(shù)據(jù)準(zhǔn)確無(wú)誤。(2)假設(shè)確診人員中沒(méi)有誤診的情況出現(xiàn)。四、符號(hào)說(shuō)明符號(hào)符
8、號(hào)說(shuō)明Gi確診病例總體,i = 1,2W i總體Gi數(shù)據(jù)矩陣ci疾病判別函數(shù)的各系數(shù),i = 0,1,2,. ,7yiG,的判別值P判別模型的準(zhǔn)確率,即1-誤判率(Ai,Bi)網(wǎng)絡(luò)學(xué)習(xí)樣本,Ai為樣本輸入,Bi為期望輸出X 2i隱含層第i個(gè)神經(jīng)元的輸出w ij各層權(quán)系數(shù)9i閥值門BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率e輸出層輸出值與期望輸出值的誤差E (y)在自變量x的條件下y=1的期望或概率Score單元素的得分符號(hào)符號(hào)說(shuō)明Gi確診病例總體,i = 1,2Wi總體G i數(shù)據(jù)矩陣ci疾病判別函數(shù)的各系數(shù),i = 0,1,2,. ,7yiG,的判別值(Ai,Bi)網(wǎng)絡(luò)學(xué)習(xí)樣本五、模型的建立與求解5.1問(wèn)題一的求解
9、依據(jù)檢查結(jié)果,對(duì)就診人員進(jìn)行健康與否診斷的方法有多種,根據(jù)已知限制條件, 本文選擇其中三種判別分析模型:Fisher判別模型、二類logistic回歸判別模型以及 BP神經(jīng)網(wǎng)絡(luò)模型。同時(shí),為了檢驗(yàn)三種判別分析模型的準(zhǔn)確率,我們引入一個(gè)變量P 為準(zhǔn)確率。_判斷準(zhǔn)確的人數(shù)P 就診總?cè)藬?shù)Fisher判別模型Fisher判別模型的建立與求解將患病和健康為兩個(gè)總體:9、弓2,并且都以體內(nèi)檢測(cè)的7個(gè)元素作為其集合元 素。Fisher判別主要借助方差分析的思想,利用投影,將這兩個(gè)總體投影到一個(gè)方向, 建立線性判別函數(shù),并利用判別規(guī)則,通過(guò)計(jì)算后得出檢查結(jié)果屬于或G2。(1)確定原始數(shù)據(jù)矩陣以各元素為列向量,
10、以就診人員為行向量,構(gòu)造關(guān)于病患和健康者的兩個(gè)矩陣。Gi的數(shù)據(jù)矩陣為:166 15.8 . 513一185 15.7 . 427W1 -28.8 . 169G2的數(shù)據(jù)矩陣為:213 19.1 . 168一170 13.9 . 330W2 -21 . 330(2)計(jì)算兩組各元素?cái)?shù)據(jù)的平均值。矩陣W1, W2的列平均數(shù)分布為:就=(143.10,12.33,23.07,698.17,201.13,526.83)X 2 =(186.6,21.92,62.01,2511.13,298.14,90.37,367.21)(3)利用微分學(xué)的方法,計(jì)算系數(shù)ci,=1,2,3,4,5,6,7要體現(xiàn)出分組的兩個(gè)特
11、征:、組間差距越大越好;、組內(nèi)差距越小越好??傻?出以下公式:(%1 - %2)2Z(%1- %1)2+力(%2 -%;)2131對(duì)其求偏導(dǎo),得出。二ci。(4)確定判別函數(shù)+ c % + c % + c % + c %3 34 45 56 67 7(5)計(jì)算G1、G2代表的判別值一 了 二y =,c % 11i ii=1y = c % 22i ii=1得出判別值為:(6)上述計(jì)算過(guò)程,可由matlab編程實(shí)現(xiàn),代碼見(jiàn)附錄 得出結(jié)果如下:J = -0.000069% + 0.00346% - 0.000337x - 0.0000624% -0.000199x5 - 0.0000137%6 -
12、0.0000629%9( _ _ %=-.1075 y0,當(dāng)y y0時(shí),y的樣本屬于G1,即樣本屬于患病者。反之樣本屬于G2,即樣本屬于健康者。Fisher判別法的檢驗(yàn)利用F檢驗(yàn),設(shè)顯著性水平a =0.05.計(jì)算統(tǒng)計(jì)量如下:s -1 s +1 - p -1 y1 - y2s +1 p30 x30 30 + 30-7-1 x30 + 307x y 1 - y 2 =14.7F(7,52) F (7,50) F (7,52).說(shuō)明判別函數(shù)是有效的,從而可以用來(lái)做判別。Fisher判別回代檢驗(yàn)將已確診樣本數(shù)據(jù)回代判定函數(shù),得出患病者檢驗(yàn)值表5.1.1-K見(jiàn)附錄表5.1.1-1)和健康者檢驗(yàn)值如表5.
13、1.1-2:表5.1.1-2:健康者檢驗(yàn)值病例號(hào)檢驗(yàn)值病例號(hào)檢驗(yàn)值病例號(hào)檢驗(yàn)值31-0.1389023859341-0.1566953109451-0.2246818836632-0.0787391973242-0.1450712530452-0.1288583279033-0.0922783693243-0.0926614320653-0.1080153559534-0.1048084160144-0.200566-559754-0.1225218303135-0.1475102020545-0.3171631414655-0.2327619404936-0.1935060282146-0.
14、1050131208856-0.1956441999437-0.1347417354547-0.14896771679457-0.2407317081738-0.0537011573948-0.11832053095758-0.1649440808639-0.0683401315149-0.17006175389459-0.1177260065640-0.2425618333450-0.22626838387260-0.07374184224由表5.1.1-1和表5.1.1-2可知,患病者檢驗(yàn)準(zhǔn)確,而健康者被誤診為患病的個(gè)案有4 個(gè),分別為就診人員32、38、39和60,它們都大于0.0811
15、。因此,F(xiàn)isher判別模型的 準(zhǔn)確率P為:P =一 =93.333%.605.1.2 BP神經(jīng)網(wǎng)絡(luò)由K.T.Funahashi定理得出,以雙曲線正切函數(shù)為激活函數(shù)的三層BP神經(jīng)網(wǎng)絡(luò),可 以以任意精度逼近任意連續(xù)函數(shù)。并且,有導(dǎo)師學(xué)習(xí)的BP神經(jīng)網(wǎng)絡(luò)實(shí)質(zhì)是在對(duì)學(xué)習(xí)樣 本進(jìn)行學(xué)習(xí)的過(guò)程中,利用梯度下降法,不斷反饋修改權(quán)值,直到網(wǎng)絡(luò)輸出與期望值的 誤差小于給定標(biāo)準(zhǔn),結(jié)束學(xué)習(xí)訓(xùn)練,并固定聯(lián)結(jié)權(quán)值,輸入待測(cè)樣本就可給出適當(dāng)?shù)妮?出。因此,BP網(wǎng)絡(luò)對(duì)于解決判別就診人員健康與否的問(wèn)題非常實(shí)用、有效。5.1.2.1有導(dǎo)師學(xué)習(xí)的BP神經(jīng)網(wǎng)絡(luò)模型的建立確定學(xué)習(xí)樣本以樣本(A ,B )作為學(xué)習(xí)樣本,其中,輸入數(shù)據(jù)為
16、A (x ,x,,x ,1), B (j , j ,j )i ii 127i 12n為相應(yīng)的期望輸出值。當(dāng)i = 1,2,. ,30,A.表示已確診為患病的1-30號(hào)病例;當(dāng)i = 31,32,. ,60時(shí),A表示已確診為健康的31-60號(hào)病例。構(gòu)造前向三層網(wǎng)絡(luò)前向三層網(wǎng)絡(luò)含有輸入層、輸出層和隱含層,并依據(jù)R.P Lippmann研究:對(duì)于 任給k個(gè)實(shí)數(shù)值樣本,有2k+1個(gè)隱節(jié)點(diǎn)的三層網(wǎng)絡(luò)可以記憶它們,這個(gè)隱單元的激發(fā) 函數(shù)可以是任何漸近函數(shù),可設(shè)隱含層節(jié)點(diǎn)N=5,即能使網(wǎng)絡(luò)記憶全部樣本信息。其結(jié) 構(gòu)如圖5.1.2-1:(3)計(jì)算各層輸出X11輸出層 隱含層(節(jié)點(diǎn)數(shù)為5)輸出層圖5.1.2-1
17、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖對(duì)于隱含層的第,個(gè)神經(jīng)元的輸出土2,有:X n+1= 1,W(n+1)=-eriW X1,j=1X2 = f (u 2)ii其中,Sigmoid 函數(shù) f (u 2)=各層權(quán)系數(shù)七隨機(jī)初始化,而輸出層輸出值X3 e (0,1).(4)求各層的學(xué)習(xí)誤差輸出層誤差為d 3 =X3(1-x3)(x3 y),隱含層誤差為d;=干(1一干)叩3.(5)修正權(quán)系數(shù)W和閥值9 .,有:輸入層與隱含層的連接權(quán)重:七.( + 1) = ()-ndfX1,隱含層與輸出層的鏈接權(quán)重:W(t+2)=%(t)-nd3X2 .其中,t為學(xué)習(xí)次數(shù),門為學(xué)習(xí)效率,即步長(zhǎng),一般比較小。(6)判斷學(xué)習(xí)結(jié)束,檢驗(yàn)網(wǎng)絡(luò)
18、誤差給出誤差函數(shù)e = 2 (X3-y)的標(biāo)準(zhǔn),若滿足誤差要求,學(xué)習(xí)結(jié)束,固定權(quán)系數(shù),I并重新對(duì)樣本進(jìn)行檢驗(yàn),計(jì)算出網(wǎng)絡(luò)命中率;否則,一直循環(huán)至最大迭代次數(shù)n。(7)輸入待測(cè)病例樣本,對(duì)病例樣本進(jìn)行健康與否分類。5.1.2.2 BP神經(jīng)網(wǎng)絡(luò)模型的求解利用Mat lab編程,設(shè)置學(xué)習(xí)率門=0.09,最大迭代次數(shù)為50000次,誤差為e = 1E -10, 網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練固定權(quán)重后,再以學(xué)習(xí)樣本作為待測(cè)樣本進(jìn)入網(wǎng)絡(luò)進(jìn)行健康與否檢驗(yàn),分 類檢驗(yàn)結(jié)果如表5.1.2-1:表5.1.2-1:患病病例檢驗(yàn)值病例號(hào)檢驗(yàn)值病例號(hào)檢驗(yàn)值病例號(hào)檢驗(yàn)值11.00000000000111.00000000000211.0
19、000000000021.00000000000121.00000000000221.0000000000031.00000000000130.99998392503230.9999999561341.00000000000141.00000000000240.9999999999951.00000000000151.00000000000250.9999839250360.99999963667161.00000000000261.0000000000071.00000000000171.00000000000270.9999720992281.00000000000180.99999997
20、713281.0000000000091.00000000000191.00000000000291.00000000000101.00000000000200.99999997765301.00000000000由檢驗(yàn)結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)的檢驗(yàn)準(zhǔn)確率P=100%,無(wú)誤判情況出現(xiàn)。Logistic回歸分析模型Logistic回歸分析是對(duì)定向變量的回歸分析,而由于因變量分為兩類,取值只有1 (患病者)和0(健康者),因此不能用一般的回歸分析。此處可將只取0和1的因變量 離散值,改為連續(xù)的函數(shù),從而得到它與7種元素的關(guān)系,然后通過(guò)這種關(guān)系即可判斷 就診人員是否患病。5.1.3.1 Logisti
21、c回歸分析模型的建立與求解(1)設(shè)因變量為y,且有以下簡(jiǎn)單線性回歸方程:V =。+ P X + P X + P X + P X + P X + P X + P X01 12 23 34 45 56 67 7由于y取值是離散型的,記p = p(v = 11 x),1 - p = p(v = 01 x),即得到期望:E(V) = 0(1 - p) + 1x p = p則有:E ( v ) =。+。X +。X +。X +。X +。X +。X +。x = P01 12 23 34 45 56 67 7E(v)表示在自變量X的條件下y=1的期望或概率。即其logistic回歸方程為: ie p f (p
22、) = =1 + e pe(P +B x +B x +B x +B x +B x +B x +B x )-30 L 1 2 2 r3 3 r4 4 r5 5 r6 6 r7 71 + e (P +P X +P X +P X +P X +P X +P X +P X ) 011223344556677(2)由于f對(duì)x的變化緩慢,因此引入f(P)的logistic變換,即:g (P) = ln(f (P)1 - f (P)顯然,g(P)以ln( f (P) ) =0為中心對(duì)稱,且在f (p)=0和f (p)=1間變化幅度大,如圖: 1 - f (P)圖5.1.3-1: logistics回歸曲線顯示
23、根據(jù)所給的樣本值,進(jìn)行參數(shù)估計(jì),可利用spss求得logistic回歸方程系數(shù)估計(jì),得到g (P)方程:g(p) = ln( f (P) ) = 39.352 + 0.584x + 0.4x -1.771x -1.05x + 0.028x + 0.289x + 0.16x1 - f (P)1234567將g(P)回代,求出回歸方程f (P)_ exp(39.352 + 0.584x + 0.4x, - 1.771x -1.05x. + 0.028x + 0.289x, + 0.16x“) f P 1 + exp(39.352 + 0.584x + 0.4x -1.77lx -1.05; + 0
24、.028【+ 0.289 + 0.16:)1234567若f (p) e(0,0.5),則屬于健康人,記為0;反之屬于患病者,記為1。模型檢驗(yàn)?zāi)P蛥R總心對(duì)數(shù)似然值.Cox & Snell RNagelkerke R1,000a.7501.0G0a.因?yàn)橼嫘痰酵昝罃M合,所以估計(jì)在迭代次數(shù)2:4處終 止。這個(gè)落:不是唯一的-由上表得,-2對(duì)數(shù)似然值為0,說(shuō)明模型對(duì)數(shù)據(jù)達(dá)到完美擬合,且Cox &Snell R 方和Nagelkerke R方統(tǒng)計(jì)量分別為0.750和1,說(shuō)明由方程解釋的回歸變異比較大,擬 合效果很好。將60名已確診患病與否的就診人員檢測(cè)結(jié)果代入f (p),得到準(zhǔn)確率為:P= 60 =1
25、00%605.2問(wèn)題二的求解基于問(wèn)題一,F(xiàn)isher判別、BP神經(jīng)網(wǎng)絡(luò)以及l(fā)ogistic回歸模型的準(zhǔn)確率分別為 93.333%、100%、100%,在此處選擇BP神經(jīng)網(wǎng)絡(luò)和logistic回歸模型對(duì)40名就診人員 進(jìn)行健康與否判別,得出診斷結(jié)果如表5.2-1和表5.2-2:表5.2-1: BP神經(jīng)網(wǎng)絡(luò)對(duì)就診人員的分類診斷病例號(hào)測(cè)定值病例號(hào)測(cè)定值病例號(hào)測(cè)定值病例號(hào)測(cè)定值10.99999999968110.9999999999210.9999999996310.000000419520.99999999968120.9999999996220.0000053185320.000005318530
26、.99999999968130.9999999997230.0000053185330.999999999940.99999999998140.9999999996240.0005059846340.000005318550.99999999963150.9999999997250.0000061100350.999999999760.00000532784160.9999999999260.0000004195360.000005318570.00007056189170.9999999997270.0000004195370.999999999680.99999999968180.9999
27、999996280.0000053185380.000005318590.99999999963190.0000053185290.0000053185390.0000004195100.00000531848200.0000053185300.0000053185400.0000053186由上表可看出,健康者為病例號(hào) 6,7,10,19,20,22,23,24,25,26,27,28,29,30,31, 32,34,36,38,39,40,共 21 人;患病者為病例號(hào) 1,2,3,4,5,8,9,11,12,13,14,15,16,17, 18,21, 33,35,37,共 19 人。表5
28、.2-2: logistic回歸分析對(duì)就診人員的分類診斷待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值111112113102112122032031131230331411412413405115125035061161260360711712703718118128038091190290390100200300400由上表可看出,健康者為病例號(hào)10,19,20,22,23,25,26,27,28,29,30,31, 32,34,36,38,39,40,共 18 人;患病者為病例號(hào) 1,2,3,4,5,6,7,8,9,11,12,13,14,15, 16,17,18,21,24,33,3
29、5,37,共 22 人。BP神經(jīng)網(wǎng)絡(luò)和logistic回歸在6,7,24號(hào)病例就診時(shí)出現(xiàn)偏差,6,7,24號(hào)病例在 BP神經(jīng)網(wǎng)絡(luò)測(cè)試中分為健康者,而在logistic回歸中則為患病者。5.3問(wèn)題三的求解5.3.1二項(xiàng)logistic逐步回歸模型的建立與求解基于問(wèn)題一中二項(xiàng)logistic回歸模型,在SPSS數(shù)據(jù)分析選擇二元logistic回歸的 向前條件方法,經(jīng)多次試驗(yàn),取進(jìn)入步進(jìn)概率p 1=0.05,刪除步進(jìn)概率p2 =0.10,進(jìn)行 二項(xiàng)logistic逐步回歸過(guò)程。擬合起步前不包含檢驗(yàn)元素(常量)的logistic模型對(duì)單元素變量進(jìn)行卡方檢驗(yàn),| 0.05,進(jìn) Alogistic模型Si
30、g 0.05,不能進(jìn)入logistic模型假設(shè)已逐步到第i步,引入剔除變量對(duì)j個(gè)單元素的得分Score,自由度df以及Sig值,最為顯著的元素即Sig最小最先引入到logistic模型,若min(Sig)不止一個(gè),其中Score最大優(yōu)先選擇。得分公式為:月 x (七-y )2Score =wj y(1 -y)如-x)2i=1(3)利用以上公式,將數(shù)據(jù)輸入SPSS中。得到以下結(jié)果:模型系教的粽合槌驗(yàn)卡方dfSiq.步驟1 步驟66.4451.000塊66.4451.000模型66.4451.000步驟3 步驟16.7321.000塊03.1782.000模型83.1782.000模型匯總步駿對(duì)數(shù)
31、似皴值Cox & Snell R 方Nagelkerke R 方1167323.670.3932.000b7501.000a.因?yàn)閰?shù)估計(jì)的更改范圍小于.001 ,所以估計(jì)在迭從上表可以看出.,因所有的金羸都蹦,而拓越來(lái)越大 說(shuō)明越來(lái)越顯著。Iko這個(gè)解不是唯一的。-判別擬合效果。Hosmer和Lemeshow檢會(huì)的隨機(jī)性表VAR00009 = .00VAR000C9= 1.00總計(jì)已觀凋期望值已觀凋期望值6.0006.0005.9975.8544.4771.304.223.072.064.01215.0006.0006.0003.000.000.000.000.000.003.1461.52
32、34.6965.7775.9286.9364.98S.000.000.0003.0001.00026.000由Hosmer和Lemeshow檢驗(yàn)的隨機(jī)性表可觀察到觀測(cè)值與期望值接近,說(shuō)明模型擬 合得比較理想。妙果移去項(xiàng)則建模尋施模型對(duì)數(shù)似斌 件在心對(duì)數(shù)似然 中的爰改”市更改的易著性步驟1 Ca70.1101.000步驟N Fe-1956.077-331153.1.000Ca-15002.34030005.6301.600a.基于條件參數(shù)估計(jì)由上圖“如果移去項(xiàng)則建?!钡牟襟E1可以看出,移去Ca項(xiàng)時(shí),會(huì)引起70.110的 數(shù)值更改。只剩下常數(shù)項(xiàng)。在步驟2中,移去Fe項(xiàng)時(shí),會(huì)引起3912.153的數(shù)
33、值改變。只剩下Ca和常數(shù)項(xiàng)。步驟1和步驟2中,不管移除哪一項(xiàng),更改的顯著性都非常小,因此兩項(xiàng)都不能移 除。由此,可得出一個(gè)新的logistic回歸模型:g(p) = ln( f(P) = 977.954 - 0.556x -11.509x1 - f (P)12即:_ exp(g (p)exp(977.954 0.556x -11.509x )f (P)1 + exp( g (p)1 + exp(977.954 0.556X1 11.509x2)同第一問(wèn)中的logistic用法相同,當(dāng)f (p) e (0,0.5)時(shí),就診者屬于健康人,記為0;反之,屬于患病者,記為1.利用第一問(wèn)的數(shù)據(jù),驗(yàn)證上述
34、公式f (p)。得出結(jié)果與問(wèn)題一的結(jié)果相同,準(zhǔn)確率 為 P=100% 。5.4問(wèn)題四的求解利用問(wèn)題二的方法,根據(jù)問(wèn)題三得出的結(jié)論,利用Ca和Fe作為檢測(cè)指標(biāo),求解未 確診的40名就診人員。得到如下結(jié)果:表5.4-1利用Ca和Fe作為指標(biāo)的BP神經(jīng)網(wǎng)絡(luò)病例測(cè)定待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值10.999997885110.999999569210.999998286310.00000580920.999997809120.999998280220.000004136320.00000513330.999999803130.999998289230.000000357330.000
35、01083040.999999466140.999999370240.999999128340.00000299950.999998965150.999998140250.000000812350.99999799260.999999708160.999998866260.000005822360.00000580170.999999068170.999997786270.000004465370.00000122480.999999707180.999998355280.000000354380.00000041690.999997945190.000004854290.0000055113
36、90.000005766100.000004348200.000003980300.000005728400.000004774由上表可看出,健康者為病例號(hào) 10,19,20,22,23,25,26,27,28,29,30,31,32,34, 33,36,37,38,39,40,共 20 人;患病者為病例號(hào) 1,2,3,4,5,6,7,8,9,11,12,13,14,15, 16,17,18,21,24,35,共 20 人。表5.4-2利用Ca和Fe作為指標(biāo)的logistic模型病例測(cè)定待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值待檢驗(yàn)檢驗(yàn)值111112113102112122032031131230
37、330411412413405115125035161161260360711712703708118128038091190290390100200300400由上表可看出,健康者為病例號(hào) 10,19,20,22,23,25,26,27,28,29,30,31,32,34, 33,36,37,38,39,40,共 20 人;患病者為病例號(hào) 1,2,3,4,5,6,7,8,9,11,12,13,14,15, 16,17,18,21,24,35,共 20 人。5.5問(wèn)題五的求解Logistic模型和BP神經(jīng)網(wǎng)絡(luò)模型是以已確診樣本為基礎(chǔ)建立的,經(jīng)過(guò)檢驗(yàn)后兩個(gè) 模型的準(zhǔn)確率都是100%,而在問(wèn)題二中
38、對(duì)40名待診者進(jìn)行診斷出現(xiàn)不同結(jié)果,說(shuō)明兩 個(gè)模型在建立過(guò)程中,有干擾因素影響了模型的準(zhǔn)確性,在問(wèn)題三中篩選出主要影響元 素后,再對(duì)同樣的就診者進(jìn)行檢驗(yàn),出現(xiàn)的結(jié)果是完全一致的,說(shuō)明選取與疾病無(wú)關(guān)的 元素作為檢驗(yàn)指標(biāo)會(huì)影響模型的準(zhǔn)確性。在問(wèn)題四中進(jìn)一步說(shuō)明兩個(gè)模型都能夠比較準(zhǔn) 確的對(duì)患者進(jìn)行診斷。分析問(wèn)題二和問(wèn)題四中出現(xiàn)的結(jié)果,說(shuō)明在醫(yī)學(xué)檢驗(yàn)中,篩選主要因素不單單可以 提高檢驗(yàn)效率,更可以提高檢驗(yàn)?zāi)P偷臏?zhǔn)確率,避免誤診。六、模型評(píng)價(jià)模型的優(yōu)點(diǎn):1、Fisher判別模型的運(yùn)用簡(jiǎn)單,在模型建立以后,直接利用指標(biāo)值和線性判別函 數(shù)就可以進(jìn)行診斷。2、Logistic回歸模型可以直接利用建立的回歸方程
39、進(jìn)行診斷,且具有相當(dāng)?shù)臏?zhǔn)確 性。3、BP神經(jīng)網(wǎng)絡(luò)模型具有較高的準(zhǔn)確性,進(jìn)行診斷時(shí),具有相當(dāng)?shù)目煽啃?。模型的缺點(diǎn)1、Fisher判別模型缺乏準(zhǔn)確率,比較容易出現(xiàn)誤判的現(xiàn)象。2、BP神經(jīng)網(wǎng)絡(luò)模型在實(shí)際操作比較復(fù)雜,推廣性相對(duì)弱。3、在建立模型過(guò)程中,利用所有樣本數(shù)據(jù)進(jìn)行建模,進(jìn)行回代檢驗(yàn),缺乏一定的 客觀性。六、模型改進(jìn)建立模型過(guò)程中,因?yàn)閿?shù)據(jù)樣本量的限制,沒(méi)有將數(shù)據(jù)分為訓(xùn)練組和檢驗(yàn)組,這導(dǎo) 致模型的建立缺乏一定的客觀性。為了提高模型的客觀性和準(zhǔn)確性,對(duì)數(shù)據(jù)進(jìn)行收集, 在樣本量達(dá)到一定量的情況下將數(shù)據(jù)分為訓(xùn)練組和檢驗(yàn)組,使模型更具客觀性和準(zhǔn)確 性。一、參考文獻(xiàn)1張德豐.MATLAB模糊系統(tǒng)設(shè)計(jì),北京國(guó)防工業(yè)出版社,2009,4.2袁曾任.人工神經(jīng)網(wǎng)絡(luò)及其應(yīng)用,清華大學(xué)出版社,19993倪雪梅.SPSS統(tǒng)計(jì)分析,清華大學(xué)出版社,2010,34任康.Logistic回歸模型在判別分析中的應(yīng)用J,南京信息工程大學(xué), 2007,11(6):71-73.【附錄】Fisher判別代碼clear;clc;close all;w1=load(m.txt);%患病者總體數(shù)據(jù)w2=load(n.txt);%健康者總體數(shù)據(jù)xx=22616.223.8606 152 70.3218; % 待確診病人數(shù)據(jù)m1= mean(w1);
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2020-2021北京首都醫(yī)科大學(xué)附屬中學(xué)初中部小學(xué)三年級(jí)數(shù)學(xué)下期末一模試卷及答案
- 大修施工方案
- 2024年廣西地區(qū)中考滿分作文《給小廣的一封信》7
- 加強(qiáng)學(xué)生團(tuán)隊(duì)精神的培養(yǎng)計(jì)劃
- 建立臨床路徑的實(shí)施方案計(jì)劃
- 跌倒護(hù)理創(chuàng)新案例
- 年度創(chuàng)新項(xiàng)目管理與評(píng)估計(jì)劃
- 面部危險(xiǎn)與清潔護(hù)理
- 商場(chǎng)安全防范工作計(jì)劃
- 《金沙縣平壩尖山鐵礦有限公司金沙縣平壩鄉(xiāng)尖山鐵礦(延續(xù))礦產(chǎn)資源綠色開(kāi)發(fā)利用方案(三合一)》評(píng)審意見(jiàn)
- 2025年江西江銅集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 大學(xué)英語(yǔ)翻譯課件
- 薄膜電容項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 2023新修訂版《中華人民共和國(guó)公司法》學(xué)習(xí)解讀
- 2024年砂石洗沙廠廠安全生產(chǎn)管理制度及崗位責(zé)任(2篇)
- 教師師德師風(fēng)考核細(xì)則
- 聲帶腫物的護(hù)理教學(xué)查房
- 辦公場(chǎng)所修繕施工方案
- 物聯(lián)網(wǎng)在安全生產(chǎn)中的應(yīng)用
- 產(chǎn)科臨床診療指南及操作規(guī)范
- DB32T-網(wǎng)絡(luò)直播營(yíng)銷管理規(guī)范編制說(shuō)明
評(píng)論
0/150
提交評(píng)論