基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用_第1頁(yè)
基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用_第2頁(yè)
基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用_第3頁(yè)
基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用_第4頁(yè)
基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于模糊聚類的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法在初生兒體重預(yù)測(cè)中的應(yīng)用 閩南師范大學(xué) 畢業(yè)論文 基于模糊聚類的神經(jīng)網(wǎng)絡(luò)算法在出生兒體重預(yù)測(cè)中的應(yīng)用 Application of neural network algorithm based on fuzzy clustering prediction of birth weight children 姓 名: 朱寧 學(xué) 號(hào):系 別: 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 專 業(yè):數(shù)學(xué)與應(yīng)用數(shù)學(xué)(統(tǒng)計(jì)學(xué)) 年 級(jí): 2012級(jí) 指導(dǎo)教師: 林國(guó)平 2015年 月 日 摘要 出生兒的體重往往是其出生時(shí)身體素質(zhì)的直觀體現(xiàn),對(duì)于低體重初生兒,皮下脂肪少,保溫能力差,呼吸機(jī)能和代謝機(jī)能都比較

2、弱,特別容易感染疾病,死亡率比體重正常的新生兒要高得多。其智力發(fā)展也會(huì)受到一定的影響。而造成嬰兒出生體重較低的因素卻是有很多種,例如環(huán)境因素、產(chǎn)婦自身身體素質(zhì)等。因此在產(chǎn)婦生產(chǎn)之前對(duì)一系列影響因素的控制往往決定了出生兒的身體健康狀況。本文以模糊聚類與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,構(gòu)造了一種含判斷與預(yù)測(cè)為一體的模型,既能判斷出出生兒體重較低的因素,也能按照相關(guān)條件對(duì)出生兒的體重進(jìn)行預(yù)測(cè)。從而使得產(chǎn)婦可以提前做好相關(guān)準(zhǔn)備。實(shí)驗(yàn)表明,該模型較傳統(tǒng)Logistic回歸模型有更準(zhǔn)確的預(yù)測(cè)能力。 關(guān)鍵詞:模糊聚類,神經(jīng)網(wǎng)絡(luò),低體重初生兒預(yù)測(cè),Excel,SPSS Abstract(小三號(hào)Arial Black字體)

3、 Government,society and university are not only the three kinds of basic power in the procedure of higher education operation,but also three basic bodies of higher educational quality assurance.Compared with the quality assurance of government and that of universities.The society assurance is realiz

4、ed by the induction of market economy,the supervision of public opinion and the evaluation of social intermediary organization.In order to fully exert the function of the social participation in the higher educational quality assurance,the premise is the decentralization of the government and autono

5、my of universities; the perfection of the market and the advance of the culture is the key; the means is the conformity and conduction of the social forces. (小四號(hào) Times New Roman字體) Key words(小四號(hào)Arial Black字體): higher educational quality;quality assurance; society assurance (小四號(hào) Times New Roman字體) 目錄

6、 摘要 . (I) 引言: . (1) 1、模糊聚類分析與人工神經(jīng)網(wǎng)絡(luò) . (1) 1.1模糊聚類分析 . (1) 1.2人工神經(jīng)網(wǎng)絡(luò) . (2) 2、預(yù)測(cè)模型及算法介紹 . (2) 2.1模型介紹 . (2) 2.2模糊聚類 . (3) 2.2.1數(shù)據(jù)標(biāo)準(zhǔn)化 . (3) 2.2.2構(gòu)造模糊相似矩陣 . (3) 2.2.3求模糊等價(jià)矩陣 . (4) 2.2.4基于模糊等價(jià)關(guān)系的模糊聚類 . (4) 2.3人工神經(jīng)網(wǎng)絡(luò) . (4) 3、 預(yù)測(cè)模型的軟件實(shí)現(xiàn) . (4) 3.1模糊聚類分析的Excel實(shí)現(xiàn) . (4) 3.1.1數(shù)據(jù)標(biāo)準(zhǔn)化 . (4) 3.1.2求模糊d值矩陣 . (5) 3.1.

7、3建立模糊相似矩陣 . (6) 3.1.4求模糊等級(jí)矩陣 . (6) 3.1.5基于模糊等價(jià)矩陣的模糊聚類 . (6) 3.2人工神經(jīng)網(wǎng)絡(luò)的SPSS實(shí)現(xiàn) .(7) 4、實(shí)驗(yàn)結(jié)果及比較分析 . (8) 4.1實(shí)驗(yàn)結(jié)果 . (8) 4.2比較分析 . (8) 4.2.1 與Logistic回歸模型預(yù)測(cè)結(jié)果間的比較 . (8) 5、結(jié)論 . (10) 參考文獻(xiàn) . (11) 致謝 . (18) 引言: 隨著互聯(lián)網(wǎng)的高速發(fā)展以及人類科技的巨大進(jìn)步,人們已經(jīng)進(jìn)入了數(shù)據(jù)大爆炸的時(shí)代。數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)在20世紀(jì)早期就已確立,但直到計(jì)算機(jī)的出現(xiàn)才使得實(shí)際操作成為可能,并使得數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析實(shí)際上是

8、數(shù)學(xué)與計(jì)算機(jī)科學(xué)相結(jié)合的產(chǎn)物。而數(shù)據(jù)分析的方法論卻是與統(tǒng)計(jì)學(xué)息息相關(guān)的,一般的數(shù)據(jù)分析方法都是基于嚴(yán)格設(shè)計(jì)支持下的統(tǒng)計(jì)方法論,但是對(duì)于現(xiàn)實(shí)情況而言,很多因素都是隨機(jī)無(wú)法控制。所以對(duì)于貼近現(xiàn)實(shí)的數(shù)據(jù)我們往往更傾向于半實(shí)驗(yàn)研究支持下的統(tǒng)計(jì)方法論或偏智能化、自動(dòng)化的數(shù)據(jù)挖掘應(yīng)用方法論。 對(duì)于嚴(yán)格設(shè)計(jì)支持下的統(tǒng)計(jì)方法論的不足,最明顯的就是聚類分析。統(tǒng)計(jì)學(xué)中的“聚類分析”實(shí)質(zhì)上是一種“硬劃分”,即“非此即彼”,但在現(xiàn)實(shí)中,很多事物并沒有很嚴(yán)格的屬性劃分,即很多事物都處于“亦此亦彼”的狀態(tài),因此傳統(tǒng)的聚類分析方法明顯與現(xiàn)實(shí)的情況并不符合。由此而引出了模糊聚類分析的概念,所謂“模糊”指的便是模糊數(shù)學(xué)中的“模

9、糊邏輯”,將“模糊邏輯”與“聚類分析”相結(jié)合,以“隸屬函數(shù)”來(lái)表示某種事物屬于某一范圍的層度。由此可見,“模糊聚類分析”屬于“軟劃分”聚類,對(duì)于現(xiàn)實(shí)問題將比傳統(tǒng)的“聚類分析”更加貼近實(shí)際。 而對(duì)于偏智能化、自動(dòng)化的數(shù)據(jù)挖掘應(yīng)用方法論,則是近些年發(fā)展起來(lái)的,是建立在計(jì)算機(jī)技術(shù)高速發(fā)展的基礎(chǔ)上而形成的。是計(jì)算機(jī)人工智能、統(tǒng)計(jì)學(xué)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)交叉發(fā)展而產(chǎn)生的一種新方法體系。其中最具有代表性的便是人工神經(jīng)網(wǎng)絡(luò), 人工神經(jīng)網(wǎng)絡(luò)是在對(duì)人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)識(shí)理解基礎(chǔ)上,模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng),人工神經(jīng)網(wǎng)絡(luò)由大量處理單元互相連接組成的大規(guī)模、非線性、自適應(yīng)動(dòng)力學(xué)系統(tǒng),具有自組織、自適應(yīng)、自學(xué)

10、習(xí)的能力。前人對(duì)人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方向的研究表明,用人工神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)比傳統(tǒng)統(tǒng)計(jì)學(xué)方法的預(yù)測(cè)好很多。 1、模糊聚類分析與人工神經(jīng)網(wǎng)絡(luò) 1.1模糊聚類分析 所謂聚類,是指按照一定的要求和規(guī)律對(duì)事物進(jìn)行分類的過(guò)程,同一類的事物要具有相似性,不同類的事物要具有差別。傳統(tǒng)的聚類分析方法是一種“硬劃分”方法,它把需要分類的對(duì)象嚴(yán)格的劃到某一類別中,具有“非此即彼”的性質(zhì)。但在現(xiàn)實(shí)生活中,大部分的事物并沒有嚴(yán)格的屬性,即它們可以屬于這個(gè)類別,但是把他們分到另一個(gè)類別中也沒有錯(cuò),具有“亦此亦彼”的性質(zhì)。由此而產(chǎn)生了模糊聚類分析。模糊聚類分析有兩種基本方法:系統(tǒng)聚類法和逐步聚類法。本文所采用的是系統(tǒng)聚類法。

11、 系統(tǒng)聚類法是基于模糊等價(jià)關(guān)系的模糊聚類分析法。在經(jīng)典的聚類分析方法中可用經(jīng)典等價(jià)關(guān)系對(duì)樣本集X進(jìn)行聚類。設(shè)R是X上的經(jīng)典等價(jià)關(guān)系。對(duì)X中的兩個(gè)元素x和y,若(x,y)R,則將x和y并為一類,否則x和y不屬于同一類 相應(yīng)地,可用X上的模糊等價(jià)關(guān)系對(duì)樣本集X進(jìn)行模糊聚類。設(shè)R是X上的模糊等價(jià)關(guān)系,是R的隸屬函數(shù)。對(duì)于任何?0,1?,定義R的?截關(guān)系 S?是X上的經(jīng)典等價(jià)關(guān)系。根據(jù)S?得到X 的一種聚類,稱為在?水平上的聚類。 應(yīng)用這種方法,分類的結(jié)果與?的取值大小有關(guān)。?取值越大,分的類數(shù)越多。?小到某一值時(shí),X中的所有樣本歸并為一類。這種方法的優(yōu)點(diǎn)在于可按實(shí)際需要選取?的值,以便得到恰當(dāng)?shù)姆诸?/p>

12、。 1.2人工神經(jīng)網(wǎng)絡(luò) 隨著計(jì)算機(jī)技術(shù)的發(fā)展,人腦對(duì)數(shù)據(jù)的計(jì)算已經(jīng)無(wú)法滿足人們的需求。人們對(duì)計(jì)算機(jī)模擬人腦結(jié)構(gòu)的研究開始日益深入,由此產(chǎn)生了人工神經(jīng)網(wǎng)絡(luò)技術(shù)。具有分布式儲(chǔ)存,并行處理和自主學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)技術(shù)的日趨成熟,使得人工神經(jīng)網(wǎng)絡(luò)具有高度非線性信、良好的容錯(cuò)性,可以處理不精確、不完全的模糊信息,并且,人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性可有效的進(jìn)行分類與與預(yù)測(cè)。 如圖為一個(gè)典型的人工神經(jīng)網(wǎng) 絡(luò)模型。在結(jié)構(gòu)上,一個(gè)神經(jīng)網(wǎng)絡(luò)可 以劃分為:輸入層、隱含層、輸出層。 圖中一個(gè)圓代表一個(gè)神經(jīng)節(jié)點(diǎn),輸入 層負(fù)責(zé)將數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),輸入層 的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)自變量向量;輸出層 負(fù)責(zé)輸出預(yù)測(cè)結(jié)果,輸出層的節(jié)點(diǎn)對(duì) 應(yīng)目標(biāo)向

13、量,可以有多個(gè);輸入層與 輸出層之間是隱含層,隱含層的層數(shù) 和每層節(jié)點(diǎn)數(shù)決定了神經(jīng)網(wǎng)絡(luò)的復(fù) 雜程度。各個(gè)節(jié)點(diǎn)之間的連線代表各節(jié)點(diǎn)數(shù)據(jù)的輸出方向,同時(shí)也表示節(jié)點(diǎn)之間的連接權(quán)重值。學(xué)習(xí)和執(zhí)行是神經(jīng)網(wǎng)絡(luò)中最重要的兩個(gè)處理過(guò)程,通過(guò)學(xué)習(xí),可以把神經(jīng)網(wǎng)絡(luò)訓(xùn)練成識(shí)別某種模式的系統(tǒng);執(zhí)行可以利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)識(shí)別有關(guān)信息的特征,從而進(jìn)行預(yù)測(cè)。網(wǎng)絡(luò)開始學(xué)習(xí)之前,按給定的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行初始化,此時(shí)網(wǎng)絡(luò)中所有的鏈接權(quán)重都是在?0,1?取件內(nèi)的隨機(jī)值。已知信息從輸入層各節(jié)點(diǎn)輸入,通過(guò)加權(quán)求和、比較等過(guò)程,在進(jìn)行非線性運(yùn)算,最終得到結(jié)果。但由于連接權(quán)重是隨機(jī)取值,所以第一次的輸出結(jié)果實(shí)際上也是隨機(jī)的,可能并沒有意

14、義。而后該結(jié)果將和已知結(jié)果相比較,并將誤差一次反饋給個(gè)節(jié)點(diǎn)。若相應(yīng)連接權(quán)重得到的結(jié)果正確,則按約定的規(guī)則增大該權(quán)重值,一邊是網(wǎng)絡(luò)更傾向于做出正確判斷;若輸出結(jié)果錯(cuò)誤,則按規(guī)則降低權(quán)重值,以降低輸出錯(cuò)誤結(jié)論的可能性。當(dāng)網(wǎng)絡(luò)進(jìn)行若干次學(xué)習(xí),對(duì)權(quán)重值進(jìn)行多次修改后,便使得輸出的正確性大大提高。網(wǎng)絡(luò)把學(xué)習(xí)階段的各中信息保留在各個(gè)節(jié)點(diǎn)的連接權(quán)重值上,當(dāng)網(wǎng)絡(luò)再次遇到與已被學(xué)習(xí)相類似的數(shù)據(jù)時(shí),就能做出更加快速、準(zhǔn)確的判斷和預(yù)測(cè)。 2、預(yù)測(cè)模型及算法介紹 2.1模型介紹 輸出預(yù)測(cè)結(jié)果D1?輸入神經(jīng)網(wǎng)絡(luò)? D2? ?模糊聚類?D? . Da? ?a? ?a ?X11?X21我們?cè)O(shè)所獲得的數(shù)據(jù)為D可表示為n*m階

15、矩陣D?.?Xn1X12X22.Xn2X1m?.X2m?,D通過(guò)模糊.?.Xnm?. 聚類后,分類成a個(gè)新類別:D1,D2,D3.Da,每個(gè)類別中的樣本數(shù)均小于原D類中的樣本數(shù)n個(gè)。但變量數(shù)任是原類別D中的變量數(shù)m個(gè),而后將各個(gè)類別分別輸入到各自對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)通過(guò)對(duì)不同類別的數(shù)據(jù)的學(xué)習(xí),形成對(duì)不同類別進(jìn)行預(yù)測(cè)的規(guī)則。 2.2模糊聚類 2.2.1數(shù)據(jù)標(biāo)準(zhǔn)化 ?X11?X21由上設(shè)D?.?Xn1X12X22.Xn2X1m?.X2m?表示n個(gè)樣本,m個(gè)變量的數(shù)據(jù)。由于數(shù)據(jù)變量之間.?.Xnm?. 可能存在綱量影響、變量自身變異大小和數(shù)值大小影響,若直接使用原始數(shù)據(jù)計(jì)算,會(huì)導(dǎo)致數(shù)量級(jí)較大的

16、變量對(duì)樣本的影響程度放大,數(shù)量級(jí)較小的數(shù)據(jù)對(duì)樣本的影響程度縮小或直接被排除,從而導(dǎo)致無(wú)法正確衡量數(shù)據(jù)。所以要對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,是各個(gè)變量的取值統(tǒng)一于某一共同的數(shù)據(jù)特征范圍。這里我們采用Z標(biāo)準(zhǔn)化進(jìn)行標(biāo)準(zhǔn)化處理: '? XijXij?XjSj,(i?1,2,3.n;j?1,2,3.m) Xj表示第j個(gè)變量的平均值,Sj表示第j個(gè)變量的標(biāo)準(zhǔn)差。 2.2.2構(gòu)造模糊相似矩陣 模糊聚類方法都有一個(gè)共同點(diǎn),即依據(jù)原始矩陣構(gòu)造的模糊相似矩陣,聚類是否正確取決于模糊相似矩陣,二模糊相似矩陣的構(gòu)造方法并不唯一,依據(jù)構(gòu)造模糊矩陣的正確性原則、不變形原則、可區(qū)分性原則以及數(shù)據(jù)特點(diǎn),這里我們采

17、用歐式距離法構(gòu)造模糊相似矩陣: rij?1?c?(X k?1m'ik?X'jk)2 此處c是使得0?rij?1的常數(shù),i?1,2,3.n;j?1,2,3.m,經(jīng)過(guò)歐氏距離法構(gòu)造出來(lái)的模 ?r11r12.r1m?r?r.r21222m?糊相似矩陣我們?cè)O(shè)為R: R? ?.?rr.rnm?n1n2 2.2.3求模糊等價(jià)矩陣 一般情況下,模糊相似矩陣滿足自反性、對(duì)稱性但不具備可傳遞性,因而R不一定是 X上的模糊等價(jià)關(guān)系。要使R具有傳遞性,可以運(yùn)用合成運(yùn)算R?R?R,求出最接近相似關(guān)系R的模糊等價(jià)關(guān)系Rk?R2,此時(shí)Rk便是一個(gè)模糊等價(jià)關(guān)系t(R) 2.2.4基于模糊等價(jià)

18、關(guān)系的模糊聚類 在模糊等價(jià)矩陣t(R)中,取不同的?-截距矩陣(0?1)。?的取值不同,所分的類別也不相同。 k 2.3人工神經(jīng)網(wǎng)絡(luò) 以Da類為例,設(shè)Da中含有n*個(gè)樣本,則Da可表示為: ?X11?X21Da?.?X?n*1X12X22.X*.X1m?.X2m? .?.Xn*m?n2 對(duì)Da建立神經(jīng)網(wǎng)絡(luò)模型:這里我們采用由一個(gè)輸入層、一個(gè)隱藏層、一個(gè)輸出層組成的三層BP神經(jīng)網(wǎng)絡(luò)。由Da矩陣可知,Da中含有m個(gè)變量,設(shè)輸出層神經(jīng)元個(gè)數(shù)為c。由隱含層神經(jīng)元個(gè)數(shù)的經(jīng)驗(yàn)公式可知:隱含層神經(jīng)元個(gè)數(shù)=(輸入層神經(jīng)元個(gè)數(shù)*輸出層神經(jīng)元個(gè)數(shù))1/2,故隱含層神經(jīng)元個(gè)數(shù)=(m*c)1/2。由于網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程有

19、正向和反向傳播組成,正向過(guò)程輸入學(xué)習(xí)樣本信息,反向過(guò)程傳遞誤差及調(diào)整信息。激活函數(shù)我們選擇使用較為廣泛的Sigmoid函數(shù)。 3、預(yù)測(cè)模型的軟件實(shí)現(xiàn) 3.1模糊聚類分析的Excel實(shí)現(xiàn) 3.1.1數(shù)據(jù)標(biāo)準(zhǔn)化 數(shù)據(jù)中的變量包含分類變量、數(shù)值變量。這里我們只考慮數(shù)值變量,對(duì)數(shù)值變量進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。數(shù)據(jù)中的數(shù)值數(shù)據(jù)A1:E25,計(jì)算各變量的均值和標(biāo)準(zhǔn)差。均值和標(biāo)準(zhǔn)差分別用AVERAGE()和STDEV()函數(shù)求得。選取A26單元格,輸入公式=AVERAGE(A1:A25),得到第一列的均值,然后在A26:E26應(yīng)用數(shù)據(jù)填充求得其他列均值。選取A27單元格,輸入公式=STDEV(A1:A25),得到

20、第一列的標(biāo)準(zhǔn)差,用數(shù)據(jù)填充填充 A27: 選取 3.1.2求模糊d值矩陣 按公式rij?1?c?(X k?1m'ik?X'jk)2模糊相似矩陣。 選取A54單元格. 輸入公式=SQRT (A$29-A29)2+(B$29-B29)2+(C$29-C29)2+(D$29-D29)2+(E$29-E29)2) 求得d11。 取B54單元格 輸入公式=SQRT (A$30-A29)2+(B$30-B29)2+(C$30-C29)2+(D$30-D29)2+(E$30-E29)2) 求得d12。 分別在C54、D54、E54.Y54輸入公式,然后在A54:Y78用數(shù)據(jù)填

21、充得到d值矩陣。(見附表一) 3.1.3建立模糊相似矩陣 令c為d值矩陣中元素的最大值,即MAX($A54:$Y$78),即可將d值矩陣轉(zhuǎn)換為模糊相似矩陣。 選取A80單元格,輸入公式=1-A54/MAX($A$54:$Y$78),然后在A80:Y104用數(shù)據(jù)填充即可得到模糊相似矩陣。(見附表二) 3.1.4求模糊等級(jí)矩陣 取模糊相似矩陣,取單元格A26 輸入公式=MAX(MIN($A1,A$1),MIN($B1,A$2),MIN($C1,A$3),MIN($D1,A$4),MIN($E1, A$5),MIN($F1,A$6),MIN($G1,A$7),MIN($H1,A$8),MIN($I1

22、,A$9),MIN($J1, A$10),MIN($K1,A$11),MIN($L1,A$12),MIN($M1,A$13),MIN($N1,A$14),MIN($O1,A$15),MIN($P1,A$16),MIN($Q1,A$17),MIN($R1,A$18),MIN($S1,A$19),MIN($T1,A$20),MIN($U1,A$21),MIN($V1,A$22),MIN($W1,A$23),MIN($X1,A$24),MIN($Y1,A$25),然后在A26:Y50用數(shù)據(jù)填充得到矩陣R2,對(duì)求得的矩陣重復(fù)以上公式計(jì)算,即可得到R4、R8、R16.直到出現(xiàn)Rk?R2,此時(shí)Rk便是一個(gè)

23、模糊等價(jià)矩陣。在“出生兒體重?cái)?shù)據(jù)”中求得的模糊相似矩陣為R8。 (R2、R4、R8、R16見附表三) 3.1.5基于模糊等價(jià)矩陣的模糊聚類 在模糊等價(jià)矩陣t(R)中,取不同的?(0?1)的值,所分類別不同。,分類的結(jié)果與k?的取值大小有關(guān)。?取值越大,分的類數(shù)越多。?小到某一值時(shí),所有樣本歸并為一類。在該數(shù)據(jù)中,求得的模糊等價(jià)矩陣大部分取值在0.9以上,故取?=0.9,則可分成3類:?1,2,14,23,24,25?、3,4,5,6,7,8,9,10,11,12,13?、15,16,17,18,19,20,21,22?。具體分類結(jié)果見附表四。 3.2人工神經(jīng)網(wǎng)絡(luò)的SPSS實(shí)現(xiàn) 以分類后的某一類

24、Db為例。(見附表五) 將附表六導(dǎo)入SPSS,選擇“神經(jīng)網(wǎng)絡(luò)多層感知器” 在多層感知器窗口中將“低出生體重兒”變量選入“因變量窗口”;將“是否患有高血壓”、“種族”、“產(chǎn)婦是否吸煙”、“應(yīng)激性”四個(gè)變量選入“因子”窗口;將“產(chǎn)婦體重”、“早產(chǎn)次數(shù)”、“產(chǎn)婦年齡”、“隨訪次數(shù)”選入“協(xié)變量窗口”。然后設(shè)置體系結(jié)構(gòu),這里我們使用只含有一個(gè)隱含層,隱含層激活函數(shù)為雙曲正切激活函數(shù),輸出層激活函數(shù)為恒等函數(shù)的BP神經(jīng)網(wǎng)絡(luò)。而后在“培訓(xùn)”設(shè)置窗口設(shè)置優(yōu)化算法,這里我們選擇梯度下降算法;在“輸出”設(shè)置窗口設(shè)置我們所需要的輸出項(xiàng)目,這里我們選擇“累計(jì)增益圖”、“增益圖”兩個(gè)個(gè)輸出選項(xiàng)。建立的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如

25、下所示: 4、實(shí)驗(yàn)結(jié)果及比較分析 4.1實(shí)驗(yàn)結(jié)果 模型預(yù)測(cè)效果越好,圖中四個(gè)箱圖應(yīng)彼此上下錯(cuò)位。而重疊越多,預(yù)測(cè)效果越差。由上圖四個(gè)箱圖的分布可知,該模型具有較好的預(yù)測(cè)能力。 4.2比較分析 4.2.1 與Logistic回歸模型預(yù)測(cè)結(jié)果間的比較 該表是用Logistic回歸模型進(jìn)行預(yù)測(cè)的分類表,若引入不同自變量,按P>0.5判斷,雖然模型出現(xiàn)了變化,但所有案例的預(yù)測(cè)概率依舊低于0.5,因此依舊100%倍預(yù)測(cè)為正常兒童,總的正確率為:130/189=68.8% 模型摘要 訓(xùn)練 平方和錯(cuò)誤 不正確預(yù)測(cè)數(shù)百分比 已使用中止規(guī)則 21.902 26.7% 1 連續(xù)步驟(含錯(cuò)誤縮 減)a

26、 訓(xùn)練時(shí)間 Testing 平方和錯(cuò)誤 不正確預(yù)測(cè)數(shù)百分比 應(yīng)變數(shù):低出生體重兒 a. 錯(cuò)誤計(jì)算是以測(cè)試樣本為基礎(chǔ)。 0:00:00.02 8.950 27.7% 觀察值處理摘要 樣本 訓(xùn)練 Testing 有效 已排除 總計(jì) N 116 47 163 0 163 百分比 71.2% 28.8% 100.0% 而采用本文模型所得的結(jié)果如上,上表顯示該類數(shù)據(jù)中訓(xùn)練數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)按7:3進(jìn)行分配,其相對(duì)錯(cuò)誤率在26.7%27.7%之間,也就是說(shuō)其相對(duì)正確率在72.3%73.3%之間。相比Logistic回歸模型68.8%的預(yù)測(cè)準(zhǔn)確率明顯較好。 分類 預(yù)測(cè)值 樣本 訓(xùn)練 觀察值 正常 低出生體重 整

27、體百分比 Testing 正常 低出生體重 整體百分比 應(yīng)變數(shù):低出生體重兒 正常 67 21 75.9% 24 10 72.3% 低出生體重 10 18 24.1% 3 10 27.7% 正確百分比 87.0% 46.2% 73.3% 88.9% 50.0% 72.3% 上表是模型對(duì)樣本的預(yù)測(cè)分類結(jié)果,按默認(rèn)P值大于0.5判斷,訓(xùn)練集和驗(yàn)證集對(duì)出生兒體重的預(yù)測(cè)正確率分別為42%和50%,而采用Logistic回歸模型所算出的這一數(shù)值為20%。故由以上三組數(shù)據(jù)結(jié)論可知,該模型明顯優(yōu)于傳統(tǒng)Logistic回歸模型。雖然該模型預(yù)測(cè)準(zhǔn)確率比Logistic回歸模型準(zhǔn)確率高,但在神經(jīng)網(wǎng)絡(luò)中不存在類似于

28、Logistic模型中的似然比檢驗(yàn)法,因此無(wú)法判斷增加自編浪是否對(duì)模型具有改善價(jià)值。 5、結(jié)論 對(duì)出低體重出生兒的預(yù)測(cè),在現(xiàn)實(shí)生活中具有實(shí)際意義。對(duì)產(chǎn)婦而言,臨產(chǎn)期對(duì)各個(gè)影響因素的控制影響了出生兒的身體素質(zhì)。由所構(gòu)造出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型中,各輸入節(jié)點(diǎn)、隱含節(jié)點(diǎn)、輸出節(jié)點(diǎn)之間的連線的寬度級(jí)顏色,可以得出各因素對(duì)出生兒體重的影響,如:產(chǎn)婦體重對(duì)模型的貢獻(xiàn)率較大,且通過(guò)輸入層H(1:4)節(jié)點(diǎn)和輸入層Low=0節(jié)點(diǎn)由較強(qiáng)的權(quán)重,這說(shuō)明有較高體重的孕婦更容不易生出低體重兒。故產(chǎn)婦在臨產(chǎn)期間要控制自己的營(yíng)養(yǎng),防止自己體重低于平均標(biāo)準(zhǔn)從而對(duì)嬰兒造成影響。而產(chǎn)婦的高血壓情況(ht=1)的節(jié)點(diǎn)通過(guò)隱含層H(1:2)節(jié)點(diǎn)和輸出層Low=1節(jié)點(diǎn)有較強(qiáng)的連接權(quán)重,這說(shuō)明有高血壓的孕婦可能更容易生出低體重兒,從而提示產(chǎn)前孕婦需要注意的方面。 雖然該模型通過(guò)模糊聚類化簡(jiǎn)數(shù)據(jù)量,從而簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度,但我們這里的模糊聚類才用的是系統(tǒng)聚類中的基于模糊等價(jià)關(guān)系的聚類方法,所聚類的類別數(shù)是由?所決定,故有一定的主觀因素影響,并不能客觀的表現(xiàn)聚類結(jié)果。因此,在該模型的模糊聚類階段,可以采用更加精確的聚類方法提高分類精度。對(duì)于神經(jīng)網(wǎng)絡(luò)階段,這里我們所采用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是最典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),BP神經(jīng)網(wǎng)絡(luò)是按梯度下降法進(jìn)行尋優(yōu),因此很難保證收斂到全局最小,同時(shí)初始權(quán)值對(duì)收斂結(jié)果又很大影響,即BP神經(jīng)網(wǎng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論