




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于BP神經(jīng)網(wǎng)絡(luò)的葡萄酒品質(zhì)預(yù)測(cè)算法研究摘要紅酒的質(zhì)量檢測(cè)會(huì)受到評(píng)酒員的自身喜好和習(xí)慣等因素的影響,評(píng)測(cè)會(huì)有一定的主觀性和不確定性,這就會(huì)對(duì)紅酒的評(píng)級(jí)有著一定的影響,所以需要有一種客觀的方法給出紅酒的品質(zhì)。因此,本文提出了基于神經(jīng)網(wǎng)絡(luò)算法的紅葡萄酒品質(zhì)預(yù)測(cè),神經(jīng)網(wǎng)絡(luò)算法能排除人為的主觀性,客觀的給出紅酒的品質(zhì),從而能更準(zhǔn)確的給出紅酒的評(píng)級(jí),滿足大眾的需求,大眾能根據(jù)算法給出的品質(zhì),更客觀的選擇紅酒。首先,明確了11個(gè)理化指標(biāo)對(duì)紅酒的影響,通過(guò)相關(guān)分析確定了影響紅酒的11個(gè)理化指標(biāo)與紅酒品質(zhì)的關(guān)系是非線性的,并將各個(gè)理化指標(biāo)用最小二乘法擬合化;其次,在這11個(gè)理化指標(biāo)的基礎(chǔ)上,運(yùn)用6種神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)和比較,實(shí)現(xiàn)運(yùn)用紅酒的理化指標(biāo)對(duì)紅酒的品質(zhì)進(jìn)行預(yù)測(cè)的功能;最后對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,提高預(yù)測(cè)的準(zhǔn)確率,使算法的準(zhǔn)確率最終接近80%。在預(yù)測(cè)實(shí)驗(yàn)當(dāng)中發(fā)現(xiàn),RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果最好,預(yù)測(cè)準(zhǔn)確率達(dá)到了100%,BP神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)優(yōu)化后,在隱層節(jié)點(diǎn)數(shù)為8個(gè),隱層層數(shù)為6層的時(shí)候預(yù)測(cè)效果最好。最終得出,通過(guò)神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)對(duì)紅葡萄酒品質(zhì)進(jìn)行預(yù)測(cè)。關(guān)鍵詞:紅酒品質(zhì)預(yù)測(cè);神經(jīng)網(wǎng)絡(luò);最小二乘法;理化指標(biāo);目錄1緒論 51.1目的意義 51.2國(guó)內(nèi)外研究現(xiàn)狀 51.3研究?jī)?nèi)容 62紅葡萄酒的理化指標(biāo) 72.1理化指標(biāo)對(duì)紅葡萄酒的影響 72.2理化指標(biāo)與紅葡萄酒品質(zhì)的關(guān)系 83基于多種神經(jīng)網(wǎng)絡(luò)模型的建立及對(duì)紅葡萄酒的預(yù)測(cè) 123.1神經(jīng)網(wǎng)絡(luò)的輸入和輸出 123.26種神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 123.3紅葡萄酒品質(zhì)預(yù)測(cè)實(shí)驗(yàn)結(jié)果與分析 134BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)優(yōu)化 164.1樣本歸一化進(jìn)行優(yōu)化 164.2BP神經(jīng)網(wǎng)絡(luò)改變隱層節(jié)點(diǎn)進(jìn)行優(yōu)化 174.3BP神經(jīng)網(wǎng)絡(luò)改變隱層層數(shù)進(jìn)行優(yōu)化 204.4BP神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)優(yōu)化的結(jié)果 225結(jié)束語(yǔ) 235.1結(jié)論 23參考文獻(xiàn) 24附錄 271緒論1.1目的意義隨著國(guó)家的日益強(qiáng)大,人民的生活質(zhì)量有了明顯的提升,國(guó)民不僅僅只局限于白酒這一傳統(tǒng)酒類,紅酒也逐漸走進(jìn)大眾的視野,所以怎么樣評(píng)選紅酒的優(yōu)劣成為現(xiàn)在的一個(gè)熱門話題。一般來(lái)說(shuō),紅酒的優(yōu)劣是通過(guò)一些有評(píng)酒經(jīng)驗(yàn)的評(píng)酒員來(lái)對(duì)紅酒進(jìn)行評(píng)級(jí),每一位評(píng)酒員根據(jù)紅酒的味道,顏色,香味等指標(biāo)進(jìn)行打分,最后累加得到紅酒的總分,從而確定這款紅酒的品質(zhì)。由于受到評(píng)酒員的自身喜好和習(xí)慣等因素的影響,評(píng)測(cè)會(huì)有一定的主觀性和不確定性,這就會(huì)對(duì)紅酒的評(píng)級(jí)有著一定的影響。因此,我們可以通過(guò)神經(jīng)網(wǎng)絡(luò)算法進(jìn)行紅酒品質(zhì)的預(yù)測(cè),排除人為的主觀性。通過(guò)使用神經(jīng)網(wǎng)絡(luò)算法能夠客觀的給出紅酒的品質(zhì),滿足大眾的需求,大眾能根據(jù)神經(jīng)網(wǎng)絡(luò)算法給出的品質(zhì),更客觀的選擇紅酒。1.2國(guó)內(nèi)外研究現(xiàn)狀為了將紅酒質(zhì)量鑒定變得更加科學(xué)可靠,國(guó)外有非常多的研究人員運(yùn)用紅酒的理化指標(biāo)結(jié)合現(xiàn)代的知識(shí)理論對(duì)紅酒品質(zhì)進(jìn)行質(zhì)量預(yù)測(cè)。在1999年,Ebeler等人員對(duì)紅酒的各種理化的指標(biāo)進(jìn)行了評(píng)估并且運(yùn)用感官對(duì)紅酒進(jìn)行品質(zhì)鑒定[1]。2003年,Legin等設(shè)計(jì)出電子舌,進(jìn)行葡萄酒味覺的電子測(cè)定[2];通過(guò)技術(shù)的革新,人們能夠得到紅酒的指標(biāo)越來(lái)越多,同年,Diaz等人利用多元分析和人工神經(jīng)網(wǎng)絡(luò)對(duì)紅酒進(jìn)行了鑒別[3]。在2009年,Cortez等人員使用支持向量機(jī)的方法對(duì)紅酒的品質(zhì)進(jìn)行預(yù)測(cè),所用的樣本量越來(lái)越多,達(dá)到了1000多,理化指標(biāo)達(dá)到了10個(gè)[4]。2010年,Legin等人運(yùn)用電子舌獲得有機(jī)酸和酚類化合物信息,然后運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行種類的分辨[5]。在2011年,Kennison等通過(guò)對(duì)葡萄的煙味研究,采用統(tǒng)計(jì)的各種數(shù)據(jù)方法,評(píng)估煙昧與葡萄酒品質(zhì)之間的關(guān)系[6]。2014年,Hosu等人通過(guò)人工神經(jīng)網(wǎng)絡(luò)揭示了葡萄酒品種與抗氧化活性相關(guān)的總酚,類黃酮,花色苷和單寧含量的濃度之間的關(guān)系[7]。2018年,伊莎貝爾等人利用酶的參數(shù)和礦物含量在人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上對(duì)紅酒進(jìn)行了分類[8]。2021年,CosmeFernanda等人利用花青素譜中的單品種紅酒進(jìn)行鑒別,并運(yùn)用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),最后利用最小二乘法、決策樹分析比較[9]。相比于國(guó)外,我國(guó)對(duì)于紅酒品質(zhì)預(yù)測(cè)的相關(guān)研究起步比較晚,在2009年,李運(yùn)等人運(yùn)用統(tǒng)計(jì)的方法對(duì)紅酒的質(zhì)量進(jìn)行了評(píng)估[10]。在2010年,徐海濤提出改進(jìn)的近似支持向量機(jī)在紅酒質(zhì)量鑒定中的應(yīng)用,他對(duì)近似支持向量機(jī)算法進(jìn)行了改善,使運(yùn)算耗時(shí)相對(duì)較少且分類精度基本達(dá)到原始算法[11]。2012年,劉延玲提出新的Hopfield神經(jīng)網(wǎng)絡(luò)分類器在紅酒質(zhì)量評(píng)價(jià)中的應(yīng)用,她重新構(gòu)建了新的Hopfield神經(jīng)網(wǎng)絡(luò)分類器模型,通過(guò)紅酒的理化性質(zhì)指標(biāo)和感官的評(píng)價(jià)對(duì)紅酒進(jìn)行品質(zhì)分類,該模型的結(jié)構(gòu)相對(duì)來(lái)說(shuō)比較簡(jiǎn)單,分類所需要的時(shí)間比較短,能得到比較好的分類效果[12]。2014年,曾祥燕等人提出基于PCA和BP神經(jīng)網(wǎng)絡(luò)的紅酒品質(zhì)預(yù)測(cè)模型,他們運(yùn)用PCA將紅酒33個(gè)理化指標(biāo)減少為9個(gè),在運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu),使網(wǎng)絡(luò)收斂速度變得更快,誤差也能達(dá)到要求[13]。同在2014年,袁少州等人對(duì)葡萄酒影響因素進(jìn)行了分析,得出可以用理化指標(biāo)來(lái)葡萄酒的質(zhì)量進(jìn)行評(píng)價(jià)[14]。2015年,吳玉媱等人,利用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)紅葡萄酒的篩選[15]。2016年,李恩來(lái)提出基于支持向量機(jī)方法的紅酒質(zhì)量預(yù)測(cè)研究,他回顧了前人對(duì)紅酒預(yù)測(cè)的研究,認(rèn)為預(yù)測(cè)誤差太大滿足不了當(dāng)下市場(chǎng)需求,于是他對(duì)基于支持向量機(jī)方法這一方法的進(jìn)行了改進(jìn),經(jīng)過(guò)改進(jìn)后誤差僅僅在10%左右[16]。2017年,賈柳君利用近紅外光譜分析技術(shù)對(duì)紅葡萄酒釀造過(guò)程中關(guān)鍵參數(shù)進(jìn)行了研究[17]。2018年,于靜對(duì)葡萄酒質(zhì)量識(shí)別方法進(jìn)行了研究[18],同年,孫逸菲等人利用XGBoost算法對(duì)葡萄酒品質(zhì)進(jìn)行預(yù)測(cè)[19]。2019年,劉攀利用RBF神經(jīng)網(wǎng)絡(luò)和樸素貝葉斯分類相結(jié)合的機(jī)器學(xué)習(xí)理論構(gòu)建分類模型,實(shí)現(xiàn)紅葡萄酒質(zhì)量的有效分類[20]。1.3研究?jī)?nèi)容本文主要研究以下內(nèi)容:1、探究固定酸度、揮發(fā)酸度、檸檬酸、殘余糖分、氯化物、游離二氧化硫、總二氧化硫、密度、酸堿度、硫酸鹽、酒精這11種理化指標(biāo)對(duì)紅酒的品質(zhì)的影響。2、基于紅酒理化指標(biāo)對(duì)應(yīng)的感官品質(zhì)樣本,運(yùn)用不同的神經(jīng)網(wǎng)絡(luò)對(duì)紅酒品質(zhì)因素進(jìn)行預(yù)測(cè),并進(jìn)行比較。3、對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,探究在不同神經(jīng)節(jié)點(diǎn),不同隱層層數(shù),數(shù)據(jù)是否歸一化對(duì)誤差的影響,運(yùn)用ROC曲線進(jìn)行評(píng)價(jià)預(yù)測(cè)結(jié)果的好壞。2紅葡萄酒的理化指標(biāo)2.1理化指標(biāo)對(duì)紅葡萄酒的影響紅酒的理化因素對(duì)紅酒的味道,顏色,存儲(chǔ)時(shí)間有著不同的影響和作用,下面進(jìn)行理化指標(biāo)的一一介紹。固定酸度對(duì)于紅酒品質(zhì)的影響主要是在人口中的味道,在口腔中感知主要由舌頭兩側(cè)感知,促進(jìn)口中唾液的分泌,主要起到平衡口感的作用。在紅酒中,固定酸度主要是由酒石酸、檸檬酸和蘋果酸構(gòu)成。固定酸度不僅能提升紅酒本身的風(fēng)味,還可以抑制有害的微生物的繁殖,從而保護(hù)紅酒的風(fēng)味,并且增加紅酒儲(chǔ)存的時(shí)間。揮發(fā)酸度會(huì)影響人所聞到的紅酒的香味,香味是人通過(guò)嗅覺器官感受到舒適的氣味,氣味進(jìn)入鼻腔進(jìn)而影響人的甜度感知。揮發(fā)酸度主要是紅酒在乳酸菌發(fā)酵和酒精發(fā)酵過(guò)程中產(chǎn)生的少量產(chǎn)物,少量的揮發(fā)酸度能增加紅酒的香味與口感的層次。如果揮發(fā)酸度的濃度超過(guò)了一定的量,就會(huì)破壞紅酒的口感。揮發(fā)酸度主要是由醋酸菌產(chǎn)生,濃度過(guò)高說(shuō)明醋酸菌的數(shù)量比較多,會(huì)將紅酒中的酒精轉(zhuǎn)化成尖酸的醋酸。檸檬酸影響紅酒的香味與味道,能平衡口感,輔助熟成,紅酒中的酸味一部份來(lái)自于葡萄中的檸檬酸,一部份來(lái)自于發(fā)酵的乳酸,所以檸檬酸影響紅酒的酸度進(jìn)而影響紅酒品質(zhì)。紅酒中檸檬酸的含量過(guò)低,紅酒會(huì)變得渾濁且無(wú)味,檸檬酸的含量過(guò)高,會(huì)導(dǎo)致紅酒酸度過(guò)高,變得酸澀且難以下咽。合適的檸檬酸含量會(huì)喚醒味覺,讓人感覺清爽。殘余糖分對(duì)紅酒的味道影響十分的大,是紅酒風(fēng)味的重要組成部分,并且殘余糖分可以抑制部分微生物的活動(dòng),糖分的含量高,能使紅酒更好的保存。殘余糖分根據(jù)含量含糖量不同可以分為干型、半干型、半甜型和甜型。干型紅酒口感更加柔順,層次更加復(fù)雜,酒體更加強(qiáng)勁。半干型紅酒會(huì)有明顯的甜味,也會(huì)聞到明顯的果香味。半甜型紅酒的層次會(huì)少很多,且口感會(huì)多變。甜型紅酒具有甘甜,爽順的口味,擁有良好的酒香和果香。氯化物在紅酒中主要是以鉀鹽的形式所存在,能平衡紅酒中的各種風(fēng)味,讓紅酒的口感變得更加柔順。紅酒中的鉀鹽主要是葡萄中的有機(jī)酸酒石酸遇到葡萄中的鉀離子產(chǎn)生化學(xué)反應(yīng),就會(huì)產(chǎn)生酸性酒石酸鉀的一種鹽類物質(zhì)。游離二氧化硫能夠抑制氧化酶的活動(dòng),保持紅酒的口感??偠趸?qū)t酒有抗氧化作用,能防止紅酒中易氧化的物質(zhì)被氧化掉,從而保持紅酒的口感。在紅酒的釀造過(guò)程中,二氧化硫能夠高效的將有害細(xì)菌及非必要的酵母菌隔絕開來(lái),阻止紅酒與酒缸中的氧氣進(jìn)行接觸,抑制了與空氣中的化學(xué)反應(yīng),這就保持了紅酒風(fēng)味的新鮮度和純凈度。二氧化硫起到很好的保護(hù)的作用,若是沒有二氧化硫紅酒的保存時(shí)間就會(huì)大大的降低,風(fēng)味很容易就會(huì)發(fā)生變化并且發(fā)生醋化的幾率將會(huì)增加。在發(fā)酵的過(guò)程中,微生物將果糖轉(zhuǎn)化成酒精后密度會(huì)有所降低。酸堿度能保持紅酒的顏色和穩(wěn)定性,抑制細(xì)菌的繁殖和細(xì)菌的發(fā)酵,酸堿度合適,會(huì)給紅酒增添活力,能使紅酒的風(fēng)味更加突出,酸在人體口腔中有著直接明顯的感受。在紅酒當(dāng)中,適度的酸堿度能起到平衡口感的作用。如果酸度過(guò)高,紅酒在人的口中的感覺就會(huì)顯得過(guò)于尖酸。如果酸度過(guò)于低,紅酒就會(huì)讓人感覺松弛無(wú)力,毫無(wú)活力,缺少清爽的感覺。酸度過(guò)低的紅酒品嘗起來(lái)會(huì)感覺到十分的厚重,沒有魅力。硫酸鹽有著提取色素保持紅酒風(fēng)味的作用,能夠使紅酒的釀造和儲(chǔ)藏順利進(jìn)行,從而提高紅酒的質(zhì)量。硫酸鹽是紅酒發(fā)酵過(guò)程中的天然副產(chǎn)品,對(duì)于紅酒來(lái)說(shuō),是非常有利的。硫酸鹽防止了紅酒的氧化,保持了紅酒豐富的口感,另一方面,在紅酒發(fā)酵的過(guò)程當(dāng)中,硫酸鹽還是提取色素的角色,將葡萄中的色素提取出來(lái),使紅酒的顏色變得更加艷麗。硫酸亞在紅酒的貯藏和生產(chǎn)中有著無(wú)可比擬的地位,它有抗氧化、選擇、澄清、溶解的作用,正確利用硫酸鹽能提高紅酒的質(zhì)量。酒精影響紅酒的酒色和口感,酒精含量越高酒的顏色越重,果香味濃重;酒精含量越低,酒的顏色越淡,果香味沒那么濃重。葡萄的果肉在發(fā)酵的過(guò)程中,在酵母活動(dòng)的作用下,果肉中的糖分就會(huì)轉(zhuǎn)化為酒精,這是紅酒中酒精的重要來(lái)源。2.2理化指標(biāo)與紅葡萄酒品質(zhì)的關(guān)系通過(guò)品酒師給紅酒打分,將紅酒分為3,4,5,6,7,8這六個(gè)品質(zhì)等級(jí),品質(zhì)大于5的紅酒為好酒,品質(zhì)小于5的紅酒為差酒。為了了解理化指標(biāo)與品質(zhì)之間的關(guān)系,將樣本根據(jù)品質(zhì)等級(jí)分類,再將含量分為十個(gè)范圍,統(tǒng)計(jì)每個(gè)范圍內(nèi)樣本的數(shù)量,以樣本數(shù)量為Y軸,理化因素在紅酒中的含量范圍作為X軸,好酒和差酒分別作出兩條曲線。如圖2.1可知,隨著固定酸度濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以固定酸度與品質(zhì)的關(guān)系是非線性關(guān)系。為了確定固定酸度含量與品質(zhì)的線性關(guān)系,我們可以運(yùn)用最小二乘法將曲線擬合,觀察二者之間的關(guān)系,擬合圖如圖2.2所示,由圖可知,固定酸度與品質(zhì)是正相關(guān)關(guān)系,后文的理化指標(biāo)擬合圖放在附錄當(dāng)中。圖2.1固定酸度與品質(zhì)關(guān)系圖圖2.2固定酸度擬合圖如圖2.3可知,隨著揮發(fā)酸度濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以揮發(fā)酸度與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.1所示,由圖可知,揮發(fā)酸度與品質(zhì)是負(fù)相關(guān)關(guān)系。圖2.3揮發(fā)酸度與品質(zhì)關(guān)系圖圖2.4檸檬酸與品質(zhì)關(guān)系圖如圖2.4可知,隨著揮發(fā)酸度濃度的增加,好酒和差酒的樣本數(shù)量逐漸減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以檸檬酸與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.2所示,由圖可知,檸檬酸與品質(zhì)是正相關(guān)關(guān)系。如圖2.5可知,隨著殘余糖分濃度的增加,好酒和差酒的樣本數(shù)量都逐漸減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以殘余糖分與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.3所示,由圖可知,殘余糖分與品質(zhì)是正相關(guān)關(guān)系。圖2.5殘余糖分與品質(zhì)關(guān)系圖圖2.6氯化物與品質(zhì)關(guān)系圖如圖2.6可知,隨著氯化物濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以氯化物與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.4所示,由圖可知,氯化物與品質(zhì)是負(fù)相關(guān)關(guān)系。如圖2.7可知,隨著游離二氧化硫濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以游離二氧化硫與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.5所示,由圖可知,游離二氧化硫與品質(zhì)是負(fù)相關(guān)關(guān)系。圖2.7游離二氧化硫與品質(zhì)關(guān)系圖圖2.8總二氧化硫與品質(zhì)關(guān)系圖如圖2.8可知,隨著總二氧化硫濃度的增加,好酒和差酒的樣本數(shù)量逐漸減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以總二氧化硫與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.6所示,由圖可知,總二氧化硫與品質(zhì)是負(fù)相關(guān)關(guān)系。如圖2.9可知,隨著密度的增大,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以密度與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.7所示,由圖可知,密度與品質(zhì)是負(fù)相關(guān)關(guān)系。圖2.9密度與品質(zhì)關(guān)系圖圖2.10酸堿度與品質(zhì)關(guān)系圖如圖2.10可知,隨著酸堿度的增大,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以酸堿度與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.8所示,由圖可知,酸堿度與品質(zhì)是負(fù)相關(guān)關(guān)系。如圖2.11可知,隨著硫酸鹽濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以硫酸鹽與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.9所示,由圖可知,硫酸鹽與品質(zhì)是正相關(guān)關(guān)系。圖2.11硫酸鹽與品質(zhì)關(guān)系圖圖2.12酒精與品質(zhì)關(guān)系圖如圖2.12可知,隨著酒精濃度的增加,好酒和差酒的樣本數(shù)量先增加后減少,每一個(gè)含量范圍內(nèi)都出現(xiàn)好酒和差酒的樣本,所以酒精與品質(zhì)的關(guān)系是非線性關(guān)系。用最小二乘法將品質(zhì)與含量的曲線擬合,擬合圖附錄圖5.10所示,由圖可知,酒精與品質(zhì)是負(fù)相關(guān)關(guān)系。3基于多種神經(jīng)網(wǎng)絡(luò)模型的建立及對(duì)紅葡萄酒的預(yù)測(cè)3.1神經(jīng)網(wǎng)絡(luò)的輸入和輸出輸入層主要是數(shù)據(jù)的流入,神經(jīng)元接收大量非線性輸入信息,需要根據(jù)情況而進(jìn)行設(shè)定,輸入層的神經(jīng)元的數(shù)量會(huì)等于等待處理的數(shù)據(jù)中輸入變量的數(shù)量,一般會(huì)選擇主要影響結(jié)果的因素來(lái)作為輸入層的神經(jīng)節(jié)點(diǎn)。品酒師給紅酒打分,將紅酒分為3,4,5,6,7,8幾個(gè)品質(zhì),經(jīng)過(guò)研究發(fā)現(xiàn),固定酸度、揮發(fā)酸度、檸檬酸、殘余糖分、氯化物、游離二氧化硫、總二氧化硫、密度、酸堿度、硫酸鹽、酒精都是影響紅酒品質(zhì)的因素,所以我們將他們作為輸入層的神經(jīng)節(jié)點(diǎn),輸入層的神經(jīng)節(jié)點(diǎn)設(shè)置為11個(gè),每一個(gè)影響因素對(duì)應(yīng)一個(gè)神經(jīng)節(jié)點(diǎn)。輸出層的神經(jīng)節(jié)點(diǎn)的數(shù)量應(yīng)該等于每一個(gè)輸入量關(guān)聯(lián)的輸出的數(shù)量作為輸出。在本次預(yù)測(cè)中,我們將紅酒品質(zhì)大于5的作為好酒,小于5的作為差酒,紅酒的品質(zhì)是由11個(gè)因素共同影響,因此,11個(gè)輸入神經(jīng)節(jié)點(diǎn)只用對(duì)應(yīng)一個(gè)輸出神經(jīng)節(jié)點(diǎn)就能達(dá)到預(yù)測(cè)目的,所以輸出層神經(jīng)節(jié)點(diǎn)只用選取一個(gè)。經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè),輸出結(jié)果會(huì)有0和1兩個(gè)結(jié)果,0代表預(yù)測(cè)結(jié)果為差酒,1代表預(yù)測(cè)結(jié)果為好酒。3.26種神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)BP神經(jīng)網(wǎng)絡(luò)通過(guò)三個(gè)部分構(gòu)成,分別是輸出層、輸入層和隱層,在各部分之間存在著大量節(jié)點(diǎn),節(jié)點(diǎn)與節(jié)點(diǎn)連接就構(gòu)成了BP神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是一種多層數(shù)向前傳遞信息的網(wǎng)絡(luò)模型,最主要的特征是通過(guò)信號(hào)向下一個(gè)節(jié)點(diǎn)輸送信息,將實(shí)際的結(jié)果和預(yù)測(cè)的輸出作比較,若產(chǎn)生偏差,則偏差又會(huì)傳送回上一層。信號(hào)在向前傳送的過(guò)程中,會(huì)經(jīng)過(guò)輸入層,隱層和輸出層三個(gè)部分的處理。在這三個(gè)部分中,在同一層的神經(jīng)節(jié)點(diǎn)只會(huì)影響自己所連接的下一個(gè)神經(jīng)節(jié)點(diǎn)。RBF神經(jīng)網(wǎng)絡(luò)是三層神經(jīng)網(wǎng)絡(luò),由輸入層、隱層、輸出層構(gòu)成。輸入層和隱層的關(guān)系是非線性關(guān)系,隱層和輸出層的關(guān)系是線性關(guān)系。概率神經(jīng)網(wǎng)絡(luò)是四層神經(jīng)網(wǎng)絡(luò)。其中,輸入層接受的是輸入的數(shù)據(jù),神經(jīng)元的個(gè)數(shù)與輸入的樣本量相等,隱層是徑向基所構(gòu)成的,每一個(gè)神經(jīng)元都會(huì)對(duì)應(yīng)一個(gè)樣本數(shù)據(jù)。求和層中的神經(jīng)元只與隱含層中神經(jīng)元有連接,而與其他的神經(jīng)元是沒有連接。Elman神經(jīng)網(wǎng)絡(luò)是一種反饋型神經(jīng)網(wǎng)絡(luò),由輸入層、隱層、關(guān)聯(lián)層、,輸出層構(gòu)成。輸入層、輸出層和隱層的連接是對(duì)數(shù)據(jù)進(jìn)行前饋傳播。輸入層會(huì)把信號(hào)進(jìn)行傳輸,輸出層會(huì)對(duì)上層所傳來(lái)的數(shù)據(jù)進(jìn)行加權(quán)輸出。在隱含層中有兩種結(jié)構(gòu),一種是普通隱含層,一種是關(guān)聯(lián)層。關(guān)聯(lián)層的主要作用會(huì)對(duì)當(dāng)時(shí)的狀態(tài)進(jìn)行反饋。廣義回歸神經(jīng)網(wǎng)絡(luò)與RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似,由輸入層、隱含層、加和層、輸出層構(gòu)成。加和層的節(jié)點(diǎn)會(huì)有兩種類型,一種為會(huì)計(jì)算隱含層中節(jié)點(diǎn)的和,被稱為分母單元,另一種為隱含層節(jié)點(diǎn)的加權(quán)和,被稱為分子單元,加權(quán)的權(quán)值為在訓(xùn)練的過(guò)程中所期待的輸出數(shù)據(jù)。感知器神經(jīng)網(wǎng)絡(luò)是單層人工神經(jīng)網(wǎng)絡(luò),僅僅由輸入層和輸出層構(gòu)成,在神經(jīng)網(wǎng)絡(luò)當(dāng)中是最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)。3.3紅葡萄酒品質(zhì)預(yù)測(cè)實(shí)驗(yàn)結(jié)果與分析通過(guò)改變神經(jīng)網(wǎng)絡(luò)的類型,利用RBF神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)、Elman遞歸網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)、感知器網(wǎng)絡(luò)來(lái)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行誤差對(duì)比,統(tǒng)計(jì)好酒變?yōu)椴罹频臄?shù)量,差酒變?yōu)楹镁频臄?shù)量,好酒預(yù)測(cè)成好酒的數(shù)量,差酒預(yù)測(cè)成差酒的數(shù)量,預(yù)測(cè)正確的數(shù)量,誤差的總數(shù)及預(yù)測(cè)正確率作出表4。對(duì)于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果我們可以運(yùn)用ROC曲線來(lái)進(jìn)行模型性能的評(píng)估。ROC的全稱是“受試者工作特征”,可以用來(lái)評(píng)價(jià)分類分類效果的好壞。本次實(shí)驗(yàn)是預(yù)測(cè)紅酒的好壞,將紅酒分為好酒和差酒,所以可以運(yùn)用ROC曲線來(lái)進(jìn)行評(píng)價(jià)。ROC曲線最重要的兩個(gè)公式如下: (3-1) (3-1)在ROC曲線當(dāng)中,每一個(gè)點(diǎn)以為橫坐標(biāo),以為縱坐標(biāo)。在公式當(dāng)中,指的是將正例預(yù)測(cè)成正例,在本次實(shí)驗(yàn)中是指將好酒預(yù)測(cè)成好酒;指的是將正例錯(cuò)誤預(yù)測(cè)成負(fù)例,在本次實(shí)驗(yàn)中是指將好酒預(yù)測(cè)成差酒;指的是將負(fù)例錯(cuò)誤的預(yù)測(cè)為正例,在實(shí)驗(yàn)中是指將差酒預(yù)測(cè)成好酒;指的是將負(fù)例正確的預(yù)測(cè)為負(fù)例,在實(shí)驗(yàn)中是指將差酒預(yù)測(cè)成差酒。運(yùn)用公式(3-1)、公式(3-2)就可以將ROC曲線畫出,曲線與坐標(biāo)軸所圍成的不規(guī)則圖形的面積叫做AUC,AUC主要是用來(lái)衡量模型的泛化能力,AUC的值越接近于1越好,AUC能夠直觀的說(shuō)明性能的好壞。將表4中不同的神經(jīng)網(wǎng)絡(luò)作出ROC曲線如圖4.1并統(tǒng)計(jì)各曲線對(duì)應(yīng)的AUC的值。由表1和圖4.1可以看出,RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果最好,RBF神經(jīng)網(wǎng)絡(luò)能夠?qū)敵鰧?shí)現(xiàn)完全逼近,它在神經(jīng)網(wǎng)絡(luò)當(dāng)中是唯一具有最好逼近特性的神經(jīng)網(wǎng)絡(luò),并且不會(huì)出現(xiàn)在某處有極小問(wèn)題,預(yù)測(cè)正確率達(dá)到了100%,AUC的值也達(dá)到了0.9987,十分接近于1,所用的函數(shù)主要是為了設(shè)計(jì)快速和無(wú)誤差的徑向基網(wǎng)絡(luò)。RBF神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)相比有幾點(diǎn)不同,前者是對(duì)數(shù)據(jù)的某個(gè)部分進(jìn)行逼近而后者是總體上進(jìn)行逼近,RBF神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行計(jì)算的速度要比BP神經(jīng)網(wǎng)絡(luò)的速度要快,而且它們的網(wǎng)絡(luò)層次的數(shù)量不同,RBF神經(jīng)網(wǎng)絡(luò)只有3層,而BP神經(jīng)網(wǎng)絡(luò)對(duì)于層數(shù)沒有限制,二者之間神經(jīng)元類別也不同,RBF神經(jīng)網(wǎng)絡(luò)是徑向基函數(shù),BP神經(jīng)網(wǎng)絡(luò)則是Sigmoid函數(shù)。在幾種神經(jīng)網(wǎng)絡(luò)當(dāng)中,對(duì)紅酒預(yù)測(cè)預(yù)測(cè)正確率最低的是概率神經(jīng)網(wǎng)絡(luò),正確率只有53.47%,AUC的值為0.5570,這主要是樣本數(shù)據(jù)不夠而影響概率神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)正確率,在相同的樣本量的條件下,概率神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)正確率沒有其他神經(jīng)網(wǎng)絡(luò)的正確率高,如果樣本量充足,概率神經(jīng)網(wǎng)絡(luò)能夠收斂到貝葉斯分類器當(dāng)中,不會(huì)有BP神經(jīng)網(wǎng)絡(luò)的某部分出現(xiàn)極小值的問(wèn)題。Elman神經(jīng)網(wǎng)絡(luò)在本次預(yù)測(cè)中表現(xiàn)不是很好,預(yù)測(cè)正確率只有69.04%,AUC的值為0.6999,這主要是訓(xùn)練參數(shù)設(shè)置問(wèn)題,若將訓(xùn)練參數(shù)變小,預(yù)測(cè)正確率將會(huì)大幅度提升。Elman神經(jīng)網(wǎng)絡(luò)同BP神經(jīng)網(wǎng)絡(luò)一樣,算法都是基于梯度下降的方法,在訓(xùn)練參數(shù)設(shè)置過(guò)大的情況下,會(huì)出現(xiàn)訓(xùn)練時(shí)間增加和局部陷入極小點(diǎn)的現(xiàn)象,所以經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)也很難達(dá)到最優(yōu)。廣義回歸神經(jīng)網(wǎng)絡(luò)在本次預(yù)測(cè)中表現(xiàn)良好,預(yù)測(cè)正確率達(dá)到97.12%,AUC的值為0.9687,它對(duì)非線性數(shù)據(jù)會(huì)有很強(qiáng)的映射。在樣本數(shù)據(jù)比較少時(shí),它要比RBF神經(jīng)網(wǎng)絡(luò)的性能更優(yōu)秀。在本次實(shí)驗(yàn)中,廣義回歸神經(jīng)網(wǎng)絡(luò)表現(xiàn)沒有RBF神經(jīng)網(wǎng)絡(luò)表現(xiàn)好的原因主要是因?yàn)楸敬螌?shí)驗(yàn)樣本數(shù)據(jù)比較優(yōu)秀,如果數(shù)據(jù)的樣本的精確度比較差的話,廣義回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)表現(xiàn)就會(huì)比RBF神經(jīng)網(wǎng)絡(luò)的表現(xiàn)要好。在本次實(shí)驗(yàn)中,感知器神經(jīng)網(wǎng)絡(luò)表現(xiàn)也不是很好,預(yù)測(cè)正確率只有65.22%,AUC的值為0.6715,造成正確率比較低的原因主要是輸入的樣本存在奇異樣本,感知器神經(jīng)網(wǎng)絡(luò)需要花很長(zhǎng)的時(shí)間來(lái)處理這個(gè)奇異樣本,而且對(duì)輸出的結(jié)果也會(huì)造成一定程度的影響,所以本次實(shí)驗(yàn)中的預(yù)測(cè)正確率偏低。本次實(shí)驗(yàn)中,BP神經(jīng)網(wǎng)絡(luò)采用一層隱層,7個(gè)隱層節(jié)點(diǎn)進(jìn)行實(shí)驗(yàn),預(yù)測(cè)正確率只有74%,AUC的值為0.7832,達(dá)不到高正確率主要是因?yàn)锽P神經(jīng)網(wǎng)絡(luò)需要的參數(shù)比較多,沒有一種有效得出參數(shù)設(shè)置的方法,會(huì)導(dǎo)致算法不穩(wěn)定,而且該網(wǎng)絡(luò)對(duì)于樣本依賴性很強(qiáng),與樣本有一定的關(guān)系,因此BP神經(jīng)網(wǎng)絡(luò)達(dá)不到高預(yù)測(cè)正確率。表1不同神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng)誤差不同的神經(jīng)網(wǎng)絡(luò)將好酒錯(cuò)判為差酒的數(shù)量將差酒錯(cuò)判為好酒的數(shù)量將好酒判為好酒的數(shù)量將差酒判為差酒的數(shù)量預(yù)測(cè)正確的數(shù)量誤差的總數(shù)預(yù)測(cè)正確率AUCBP218182637562119940074..98%0.7832RBF0085574415990100%0.9987概率0744855085574453.47%0.5570Elman270225585519110449569.04%0.6999回歸252183072315534697.12%0.9687感知器117439738305104355665.22%0.6715圖3.1不同神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng)的ROC曲線圖4BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)優(yōu)化從6種神經(jīng)網(wǎng)絡(luò)對(duì)紅酒品質(zhì)的預(yù)測(cè)的結(jié)果可以得出,RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)正確率最高,但是在解決相同精度要求的問(wèn)題時(shí),BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)是要比RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)要簡(jiǎn)單,如果樣本數(shù)目不斷增多的話,RBF神經(jīng)網(wǎng)絡(luò)就會(huì)變得很復(fù)雜,運(yùn)算量也會(huì)變得大。因此,我們可以對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,從樣本,BP神經(jīng)網(wǎng)絡(luò)的隱層層數(shù),神經(jīng)節(jié)點(diǎn)入手,來(lái)提高BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)正確率。4.1樣本歸一化進(jìn)行優(yōu)化沒有處理過(guò)的數(shù)據(jù)經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算之后,預(yù)測(cè)誤差和實(shí)際還是有一定的差距,所以我們可以通過(guò)數(shù)據(jù)的歸一化提升神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的精準(zhǔn)度。數(shù)據(jù)歸一化的具體作用是將數(shù)據(jù)變成統(tǒng)一樣本的統(tǒng)計(jì)分布性。神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)是通過(guò)對(duì)樣本數(shù)據(jù)進(jìn)行統(tǒng)計(jì)概率進(jìn)行預(yù)測(cè)及對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練,并且sigmoid函數(shù)的取值范圍是在0到1之間的,神經(jīng)網(wǎng)絡(luò)的輸出值也會(huì)在0與1之間,因此需要對(duì)樣本的輸入進(jìn)行歸一化。歸一化的目的是統(tǒng)一在0-1之間統(tǒng)計(jì)樣本的概率分布,當(dāng)輸入的值都為正時(shí),與第一隱含層節(jié)點(diǎn)相連的權(quán)值就會(huì)同時(shí)發(fā)生改變,進(jìn)而導(dǎo)致學(xué)習(xí)的速度變慢。若在數(shù)據(jù)當(dāng)中經(jīng)常有奇異的樣本數(shù)據(jù),奇異的樣本數(shù)據(jù)會(huì)使神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)間變長(zhǎng),就會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)無(wú)法收斂。因此為了避免這個(gè)狀況以及為了數(shù)據(jù)處理的方便性,提高神經(jīng)網(wǎng)絡(luò)的處理數(shù)據(jù)的能力,可以將輸入信號(hào)通過(guò)歸一化處理,讓樣本的輸入信號(hào)的平均值接近于0或者和其均方差相比變得很小。相同的兩個(gè)樣本,一個(gè)經(jīng)過(guò)歸一化處理,一個(gè)未經(jīng)過(guò)歸一化處理,在隱層隱層層數(shù)為1,節(jié)點(diǎn)數(shù)都為7的條件下,通過(guò)Matlab仿真,統(tǒng)計(jì)好酒變?yōu)椴罹频臄?shù)量,差酒變?yōu)楹镁频臄?shù)量,預(yù)測(cè)正確的數(shù)量,誤差的總數(shù)作出表2,并畫出ROC圖,如圖5.1。由表可知,樣本是否進(jìn)行歸一化對(duì)實(shí)驗(yàn)結(jié)果還是具有一定的影響,進(jìn)行歸一化的樣本誤差的總數(shù)為384個(gè),未進(jìn)行歸一化的樣本誤差總數(shù)為390個(gè)。進(jìn)行歸一化的樣本進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的誤差要比沒有歸一化的誤差要小,這主要是因?yàn)闅w一化樣本消除了樣本數(shù)據(jù)中的奇異樣本,將樣本數(shù)據(jù)的大小都化為0到1之間,消除了奇異樣本數(shù)據(jù)所產(chǎn)生的不好的影響。將歸一化樣本和未處理樣本進(jìn)行訓(xùn)練時(shí)間對(duì)比,在隱層層數(shù)為兩層,神經(jīng)節(jié)點(diǎn)數(shù)為30的條件下,歸一化樣本訓(xùn)練時(shí)間為4s,未處理樣本訓(xùn)練時(shí)間為5s,歸一化樣本訓(xùn)練時(shí)間要比未處理樣本訓(xùn)練時(shí)間要少,歸一化后的訓(xùn)練速度要比未處理樣本的要快得多。表2數(shù)據(jù)是否歸一化誤差對(duì)比是否歸一化將好酒錯(cuò)判為差酒的數(shù)量將差酒錯(cuò)判為好酒的數(shù)量將好酒判為好酒的數(shù)量將差酒判為差酒的數(shù)量預(yù)測(cè)正確的數(shù)量誤差的總數(shù)正確率AUC是190194695550121538475.98%0.7588否225165660579120939075.60%0.7972圖4.1數(shù)據(jù)歸一化與不歸一化對(duì)應(yīng)的ROC曲線圖4.2BP神經(jīng)網(wǎng)絡(luò)改變隱層節(jié)點(diǎn)進(jìn)行優(yōu)化在神經(jīng)網(wǎng)絡(luò)當(dāng)中,數(shù)據(jù)需要進(jìn)行非線性的分離的時(shí)候需要有隱藏層,而且一層隱層就可以將任意的非線性的關(guān)系進(jìn)行映射,訓(xùn)練的時(shí)間相對(duì)于其他層數(shù)來(lái)說(shuō)會(huì)短,并且所要求的精度也會(huì)達(dá)到要求,所以選擇一層隱層。隱層的神經(jīng)元通常通過(guò)以下公式進(jìn)行計(jì)算: (4-1)公式中h表示隱層節(jié)點(diǎn)數(shù);n表示輸入層的節(jié)點(diǎn)數(shù);m表示輸出層的節(jié)點(diǎn)數(shù);a表示調(diào)節(jié)參數(shù),取值為1~10之間的任意值。通過(guò)改變a的值來(lái)不斷獲得隱層節(jié)點(diǎn)數(shù)h,再經(jīng)過(guò)相同的樣本訓(xùn)練,所獲得的數(shù)據(jù)誤差最小的就為最小網(wǎng)絡(luò)誤差隱層節(jié)點(diǎn)的數(shù)量。在隱層層數(shù)為一層且樣本輸入相同的條件下,通過(guò)常用公式(3)可以確定隱層節(jié)點(diǎn)數(shù)的選擇范圍在4到13,經(jīng)過(guò)Matlab仿真,統(tǒng)計(jì)好酒變?yōu)椴罹频臄?shù)量,差酒變?yōu)楹镁频臄?shù)量,預(yù)測(cè)正確的數(shù)量,誤差的總數(shù)作出表3,并畫出ROC曲線如圖5.3。由表3可知,在隱層節(jié)點(diǎn)數(shù)為8個(gè)的時(shí)候,預(yù)測(cè)效果最好,誤差的總數(shù)為332個(gè),將好酒預(yù)測(cè)成差酒的個(gè)數(shù)為160個(gè),將差酒預(yù)測(cè)成好酒的個(gè)數(shù)為172個(gè),好酒預(yù)測(cè)成好酒的個(gè)數(shù)為695個(gè),差酒預(yù)測(cè)成差酒的個(gè)數(shù)為572個(gè)。為了更直觀的看出誤差的變化趨勢(shì),以隱層節(jié)點(diǎn)數(shù)作為橫坐標(biāo),對(duì)應(yīng)的誤差總數(shù)作為縱坐標(biāo)作出不同隱層對(duì)應(yīng)的誤差變化圖,如圖5.2。由圖可知,隨著隱層節(jié)點(diǎn)數(shù)的不斷增加,誤差總數(shù)的是不斷波動(dòng)的,在4到7個(gè)隱層節(jié)點(diǎn)之間誤差上下波動(dòng),而在隱層節(jié)點(diǎn)數(shù)為8的時(shí)候,誤差總數(shù)最小,達(dá)到峰谷,之后在8到9節(jié)點(diǎn)之間誤差有一個(gè)大幅度上漲,誤差上漲到389個(gè),之后在節(jié)點(diǎn)數(shù)為9和11的時(shí)候有一定幅度的下降,到11個(gè)節(jié)點(diǎn)時(shí)誤差下降到350個(gè),在11到13個(gè)節(jié)點(diǎn)之間,誤差又有一定的上漲,最終誤差為378個(gè)。出現(xiàn)這樣的結(jié)果,主要是因?yàn)殡[層節(jié)點(diǎn)數(shù)對(duì)于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)來(lái)說(shuō)是一個(gè)十分重要的參數(shù),對(duì)于神經(jīng)網(wǎng)絡(luò)的性能影響非常的大。如果隱含層的節(jié)點(diǎn)數(shù)太少了,誤差的反向傳播過(guò)程和前向傳播過(guò)程都會(huì)有一定程度的影響,會(huì)讓神經(jīng)網(wǎng)絡(luò)無(wú)法學(xué)習(xí),如果隱層節(jié)點(diǎn)數(shù)太多,雖然會(huì)在一定程度上讓系統(tǒng)誤差變小,但是這樣會(huì)增加神經(jīng)網(wǎng)絡(luò)的進(jìn)行預(yù)測(cè)時(shí)間,會(huì)讓訓(xùn)練陷入局部而不進(jìn)行下一步,這是“過(guò)擬合”的重要原因。所以,只有選擇合適的隱層節(jié)點(diǎn)數(shù)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果和速度才會(huì)達(dá)到最好,在本次預(yù)測(cè)當(dāng)中,隱層節(jié)點(diǎn)數(shù)為8的時(shí)候最合適表3不同隱層節(jié)點(diǎn)數(shù)對(duì)應(yīng)的誤差隱層節(jié)點(diǎn)數(shù)將好酒錯(cuò)判為差酒的數(shù)量將差酒錯(cuò)判為好酒的數(shù)量將好酒判為好酒的數(shù)量將差酒判為差酒的數(shù)量預(yù)測(cè)正確的數(shù)量誤差的總數(shù)正確率AUC4236165619579119840174.92%0.75565178181677563124035977.54%0.77276224172631520120339675.23%0.75477220153635591122637376.67%0.76258160172695572126733279.23%0.78839221168634576121038975.67%0.756010204173651571122237776.42%0.763811200150655594124935078.11%0.781312183195672549122137876.36%0.759913199179656565122137876.36%0.7600圖4.2不同隱層節(jié)點(diǎn)對(duì)應(yīng)的誤差變化圖圖4.3不同隱層節(jié)點(diǎn)對(duì)應(yīng)的ROC曲線圖4.3BP神經(jīng)網(wǎng)絡(luò)改變隱層層數(shù)進(jìn)行優(yōu)化在隱層節(jié)點(diǎn)數(shù)都為7個(gè)且樣本輸入相同的條件下,通過(guò)更改隱層層數(shù),經(jīng)過(guò)Matlab仿真,統(tǒng)計(jì)好酒變?yōu)椴罹频臄?shù)量,差酒變?yōu)楹镁频臄?shù)量,好酒預(yù)測(cè)成好酒的數(shù)量,差酒預(yù)測(cè)成差酒的數(shù)量,預(yù)測(cè)正確的數(shù)量,誤差的總數(shù)作出表4,并畫出ROC曲線如圖5.5。為了更直觀的看誤差的變化趨勢(shì),以隱層數(shù)作為橫坐標(biāo),對(duì)應(yīng)的誤差總數(shù)作為縱坐標(biāo)作出不同隱層對(duì)應(yīng)的誤差變化圖,如圖5.4。由圖5.4和表4易知,在隱層層數(shù)為6層的條件下,誤差總數(shù)達(dá)到最小,為339個(gè)誤差。在達(dá)到誤差最小值對(duì)應(yīng)的層數(shù)之前,1層隱層到2層隱層之間的誤差是下降的,在2層隱層一直到5層隱層之間,誤差總數(shù)都是逐級(jí)遞增,誤差個(gè)數(shù)達(dá)到405個(gè),而到隱層數(shù)為6的時(shí)候,誤差個(gè)數(shù)急劇下降,到達(dá)峰谷,繼續(xù)增加隱層的層數(shù),誤差的總數(shù)會(huì)不斷的上漲,增加到10層隱層時(shí),誤差達(dá)到了408個(gè)。一般認(rèn)為,通過(guò)增加隱層的層數(shù)可以減少BP神經(jīng)網(wǎng)絡(luò)所產(chǎn)生的誤差,能夠提高預(yù)測(cè)的精確度,但是增加隱層層數(shù)會(huì)讓神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)變得復(fù)雜,訓(xùn)練時(shí)間就會(huì)變得更長(zhǎng)也會(huì)帶來(lái)“過(guò)擬合”的問(wèn)題。從本次的實(shí)驗(yàn)數(shù)據(jù)來(lái)看,一味的增加隱層的層數(shù)并不會(huì)使誤差的總數(shù)一直變小,它會(huì)出現(xiàn)很大的波動(dòng),所用的時(shí)間也會(huì)變長(zhǎng)。表4不同隱層層數(shù)對(duì)應(yīng)誤差隱層層數(shù)將好酒錯(cuò)判為差酒的數(shù)量將差酒錯(cuò)判為好酒的數(shù)量將好酒判為好酒的數(shù)量將差酒判為差酒的數(shù)量預(yù)測(cè)正確的數(shù)量誤差的總數(shù)正確率AUC1202170653574122737276.73%0.76342162186693558125134878.23%0.77813175177680567124735277.98%0.77994177203678541121938076.23%0.76255255150600594119440574.67%0.75016156183699561126033978.79%0.78797205180650564121438575.92%0.75878223184632560119240774.54%0.74759232162623582120539475.35%0.758910221187634557119140874.48%0.7474圖4.4不同隱層對(duì)應(yīng)的誤差變化圖圖4.5不同隱層層數(shù)對(duì)應(yīng)的ROC曲線圖4.4BP神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)優(yōu)化的結(jié)果經(jīng)過(guò)以上優(yōu)化實(shí)驗(yàn)可以看出,歸一化處理的樣本要比沒有進(jìn)行歸一化處理的樣本預(yù)測(cè)準(zhǔn)確率要高,隱層節(jié)點(diǎn)數(shù)選擇8個(gè)節(jié)點(diǎn),隱層層數(shù)選擇為6層的時(shí)候預(yù)測(cè)效果會(huì)變得更好。因此,將BP神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置為神經(jīng)節(jié)點(diǎn)為8個(gè),隱層層數(shù)為6層,用歸一化的樣本數(shù)據(jù)來(lái)進(jìn)行實(shí)驗(yàn),與沒有經(jīng)過(guò)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比作出表5,并且畫出ROC曲線圖,如圖5.6。由圖表可知,優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)有了明顯的提升,誤差數(shù)相較于未優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)少了68個(gè),預(yù)測(cè)正確率接近于80%,AUC也比未優(yōu)化的大0.0079。表5優(yōu)化前后誤差對(duì)比是否優(yōu)化將好酒判為差酒的數(shù)量將差酒判為好酒的數(shù)量將好酒判為好酒的數(shù)量將差酒判為差酒的數(shù)量預(yù)測(cè)正確的數(shù)量誤差的總數(shù)預(yù)測(cè)正確率AUC是159173696571126733279.23%0.7911否218182637562119940074.98%0.7832圖4.6BP神經(jīng)網(wǎng)絡(luò)優(yōu)化前后對(duì)應(yīng)的ROC曲線圖5結(jié)束語(yǔ)5.1結(jié)論通過(guò)以上研究我們可以得出結(jié)論,品質(zhì)不隨著理化指標(biāo)的含量增多而呈線性關(guān)系,11個(gè)紅酒的理化指標(biāo)和紅酒的品質(zhì)是非線性關(guān)系,因此能夠運(yùn)用神經(jīng)網(wǎng)絡(luò)對(duì)紅酒的品質(zhì)進(jìn)行預(yù)測(cè)。在利用11個(gè)理化指標(biāo)的基礎(chǔ)上,使用多種神經(jīng)網(wǎng)絡(luò)對(duì)紅酒品質(zhì)進(jìn)行預(yù)測(cè),其中RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果最優(yōu)。通過(guò)對(duì)樣本數(shù)據(jù)歸一化,改變隱層層數(shù)和神經(jīng)節(jié)點(diǎn)能夠優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,使BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果有了一定的提升,使最終的預(yù)測(cè)正確率接近80%。5.2展望本文主要通過(guò)運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)紅酒品質(zhì)進(jìn)行預(yù)測(cè),探究了隱層節(jié)點(diǎn)和隱層層數(shù)對(duì)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的影響,對(duì)比分析了各種神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,但是使用BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果不是很理想,誤差還是比較大,希望未來(lái)隨著算法研究的深入,提出BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置的簡(jiǎn)單有效的方法,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果會(huì)有很大的提升參考文獻(xiàn)Ebeler,S.E.LinkingFlavorChemistrytoSensoryAnalysisofWine[J].FlavorChemistry—ThirtyYearsofProgress,KluwerAcademicPublishers,Dordrecht,1999,409-422.ALegin,ARudnitskaya,LLuvova,eta1.EvaluationofItalianwinebytheelectronictongue:recognition,quantitativeanalysisandcorrelationwithhumansensoryperception[J].AnalyticaChimicaActa,2003,484(1):33—34.DiazC,CondeJE,EstevezD,OliveroSJP,TrujilloJPP.ApplicationofmultivariateanalysisandartificialneuralnetworksforthedifferentiationofredwinesfromtheCanaryIslandsaccordingtotheislandoforigin[J].JournalofAgriculturalandFoodChemistry,2003,51(15):5.CortezP,CerdeiraA,AlmeidaF,eta1.Modelingwinepreferencesbydataminingfromphysicoehemicalproperties[J].DecisionSupportSystems,2009,47(4):547—553.udnitskayaA,RochaSM,LeginA,eta1.Evaluationofthefeasibilityoftheelectronictongueasarapidanalyticaltoolforwineagepredictionandquantificationoftheorganicacidsandphenoliccom—pounds.Thecase—studyofMadeirawine[J].Analytieachimicaacta,2010,662(1):82.KRKennison,KLWilkinson,APPollnitz,eta1.Theefectofsmokeapplicationtofield—grownMerlotgrapevinesatkeyphenologicalgrowthstagesonwinesensoryandchemicalproperties[J].AustralianJournalofGra
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《藥品市場(chǎng)營(yíng)銷學(xué)》課程標(biāo)準(zhǔn)
- 農(nóng)莊轉(zhuǎn)讓帳篷合同范本
- 化肥區(qū)域授權(quán)合同范本
- 上海電子營(yíng)銷咨詢合同范例
- 余姚市房地產(chǎn)經(jīng)紀(jì)合同范本
- 接觸網(wǎng)中級(jí)工題庫(kù)與參考答案
- 化工總控工高級(jí)測(cè)試題及參考答案
- 道路交通安全模擬試題含參考答案
- 個(gè)人安全與社會(huì)責(zé)任心得體會(huì)
- 公司收購(gòu)資產(chǎn)合同范本
- 冠心病患者運(yùn)動(dòng)恐懼的現(xiàn)狀及影響因素分析
- 全國(guó)2018年10月自考00043經(jīng)濟(jì)法概論(財(cái)經(jīng)類)試題及答案
- 《又見平遙》課件
- 噴涂設(shè)備點(diǎn)檢表
- GB/T 2831-2009光學(xué)零件的面形偏差
- 廣東省佛山市《綜合基礎(chǔ)知識(shí)》事業(yè)單位國(guó)考真題
- 02 第2章 城市與城市化-城市管理學(xué)
- 六年級(jí)上冊(cè)英語(yǔ)教案-Culture 2 Going Green 第二課時(shí) 廣東開心英語(yǔ)
- 警察叔叔是怎樣破案的演示文稿課件
- 2019石景山初三一模語(yǔ)文試題及答案
- 09式 新擒敵拳 教學(xué)教案 教學(xué)法 圖解
評(píng)論
0/150
提交評(píng)論