




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于近紅外光譜技術(shù)構(gòu)建蘿卜硫苷組分定標(biāo)模型的研究一、引言1.1研究背景與意義蘿卜硫苷(Glucoraphanin)作為一種主要存在于西蘭花種子和芽苗等十字花科植物中的天然活性產(chǎn)物,具有極為重要的價(jià)值。在農(nóng)業(yè)領(lǐng)域,蘿卜硫苷相關(guān)研究有助于作物品質(zhì)改良。蘿卜硫苷經(jīng)黑芥子酶或腸道微生物作用后可轉(zhuǎn)化為蘿卜硫素,而蘿卜硫素具有抗菌等作用,這使得富含蘿卜硫苷的作物在生長過程中能更好地抵御病蟲害,減少農(nóng)藥使用,促進(jìn)綠色農(nóng)業(yè)發(fā)展。從農(nóng)作物的種植角度來看,通過培育富含蘿卜硫苷的品種,能提高作物的抗逆性,保障農(nóng)產(chǎn)品的產(chǎn)量與質(zhì)量。在醫(yī)學(xué)和保健領(lǐng)域,蘿卜硫苷展現(xiàn)出更為廣闊的應(yīng)用前景。蘿卜硫素是目前發(fā)現(xiàn)的Nrf2的最強(qiáng)激活劑之一,可通過激活Nrf2開啟解毒、抗氧化、抗炎等多種細(xì)胞保護(hù)作用。大量研究表明,蘿卜硫苷對多種疾病具有預(yù)防和改善作用。在癌癥預(yù)防方面,眾多細(xì)胞實(shí)驗(yàn)、動(dòng)物實(shí)驗(yàn)以及全球范圍內(nèi)開展的100多項(xiàng)相關(guān)臨床試驗(yàn)都支持了蘿卜硫苷能降低患癌風(fēng)險(xiǎn),包括乳腺癌、前列腺癌、肺癌等。在改善糖尿病方面,它能夠調(diào)節(jié)血糖水平、減輕氧化應(yīng)激和胰島素抵抗。對于神經(jīng)退行性疾病,如阿茲海默癥,蘿卜硫苷也表現(xiàn)出改善癥狀的潛力。蘿卜硫苷還能促進(jìn)有害物排出體外,減少紫外線對皮膚的損傷,抑制幽門螺旋桿菌感染,調(diào)節(jié)腸道菌群等。準(zhǔn)確測定蘿卜硫苷的含量在上述領(lǐng)域的研究和應(yīng)用中至關(guān)重要。傳統(tǒng)的化學(xué)分析方法,如高效液相色譜法,雖然準(zhǔn)確性較高,但存在操作繁瑣、分析時(shí)間長、需要使用大量化學(xué)試劑等缺點(diǎn),這不僅增加了檢測成本,還可能對環(huán)境造成污染。近紅外光譜技術(shù)(NIR)作為一種基于含氫基團(tuán)振動(dòng)的倍頻和合頻吸收的分析技術(shù),在成分分析中具有顯著優(yōu)勢。該技術(shù)可對大多數(shù)實(shí)驗(yàn)樣品直接進(jìn)行分析,無需復(fù)雜的預(yù)處理,能有效節(jié)省時(shí)間和人力成本。其所需樣品量較少,尤其適用于微量或痕量樣品分析,且在使用過程中不會產(chǎn)生污染,是一種綠色分析技術(shù)。近紅外光譜中的短波穿透性很好,不僅可用于分析常見的液體物質(zhì),也可用于測定膠體、半固體或膠體物質(zhì),能夠?qū)崿F(xiàn)各種形態(tài)的樣品分析。近紅外光譜分析儀操作簡單,對實(shí)驗(yàn)人員要求不高,大多數(shù)具有相關(guān)化學(xué)背景的人員只需簡單培訓(xùn)即可勝任操作。該技術(shù)分析時(shí)間短,在幾分鐘或十幾分鐘內(nèi)即可實(shí)現(xiàn)樣品多種性質(zhì)的同時(shí)分析,成本很低且分析效率高,適用于大量數(shù)據(jù)的檢測分析,具有較高的經(jīng)濟(jì)效益。憑借這些優(yōu)勢,近紅外光譜技術(shù)已在農(nóng)業(yè)、食品、制藥等多個(gè)領(lǐng)域得到廣泛應(yīng)用。在農(nóng)業(yè)領(lǐng)域,可用于谷物蛋白質(zhì)含量等農(nóng)作物成分的檢測;在食品領(lǐng)域,能對食品的品質(zhì)和成分進(jìn)行快速分析;在制藥領(lǐng)域,可用于藥物成分的定量分析和質(zhì)量控制等。構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型具有重要意義。通過該模型,能夠?qū)崿F(xiàn)對蘿卜硫苷含量的快速、準(zhǔn)確、無損檢測。在農(nóng)業(yè)生產(chǎn)中,可實(shí)時(shí)監(jiān)測農(nóng)作物中蘿卜硫苷的含量,為種植決策提供依據(jù),指導(dǎo)農(nóng)民科學(xué)種植,提高農(nóng)作物的品質(zhì)和產(chǎn)量。在醫(yī)藥研發(fā)和保健品生產(chǎn)過程中,能快速檢測原料和產(chǎn)品中蘿卜硫苷的含量,確保產(chǎn)品質(zhì)量的穩(wěn)定性和一致性,有助于提高生產(chǎn)效率,降低生產(chǎn)成本,推動(dòng)相關(guān)產(chǎn)業(yè)的發(fā)展。還能為進(jìn)一步深入研究蘿卜硫苷的生物活性和作用機(jī)制提供有效的檢測手段,促進(jìn)相關(guān)領(lǐng)域的科學(xué)研究。1.2國內(nèi)外研究現(xiàn)狀1.2.1蘿卜硫苷的研究現(xiàn)狀在國外,對蘿卜硫苷的研究起步較早且成果豐碩。1992年,美國國家科學(xué)院院士PaulTalalay教授發(fā)現(xiàn)蘿卜硫苷的防癌作用,這一發(fā)現(xiàn)不僅為癌癥預(yù)防研究開辟了新的方向,還被評為“20世紀(jì)100大科學(xué)發(fā)現(xiàn)”之一。此后,眾多研究圍繞蘿卜硫苷展開。大量細(xì)胞實(shí)驗(yàn)、動(dòng)物實(shí)驗(yàn)以及全球范圍內(nèi)開展的100多項(xiàng)相關(guān)臨床試驗(yàn)表明,蘿卜硫苷在降低患癌風(fēng)險(xiǎn)方面表現(xiàn)出色,對乳腺癌、前列腺癌、肺癌等多種癌癥均有預(yù)防作用。在改善糖尿病方面,Axelsson等學(xué)者的研究指出,蘿卜硫苷能調(diào)節(jié)血糖水平、減輕氧化應(yīng)激和胰島素抵抗。對于神經(jīng)退行性疾病,如阿茲海默癥,Kim等研究發(fā)現(xiàn)蘿卜硫苷具有改善癥狀的潛力。國內(nèi)對蘿卜硫苷的研究也在逐步深入。隨著人們對健康的關(guān)注度不斷提高,以及十字花科蔬菜在國內(nèi)廣泛種植,蘿卜硫苷的研究受到越來越多的重視。國內(nèi)學(xué)者在蘿卜硫苷的提取、分離和鑒定方面取得了一定成果,開發(fā)出多種提取方法,如超高效液相色譜串聯(lián)高分辨質(zhì)譜結(jié)合高效液相色譜串聯(lián)三重四極桿質(zhì)譜的方法,能夠更準(zhǔn)確地檢測蘿卜中硫苷組分。在蘿卜硫苷的生理功能研究方面,國內(nèi)研究也證實(shí)了其抗氧化、抗炎等作用,與國外研究結(jié)果相互印證。1.2.2近紅外光譜技術(shù)的應(yīng)用現(xiàn)狀近紅外光譜技術(shù)在國外的應(yīng)用極為廣泛。在農(nóng)業(yè)領(lǐng)域,它被用于農(nóng)產(chǎn)品品質(zhì)檢測,如谷物蛋白質(zhì)含量、水分含量的檢測,能夠快速、準(zhǔn)確地為農(nóng)產(chǎn)品質(zhì)量評估提供數(shù)據(jù)支持。在食品工業(yè)中,可對食品的成分、品質(zhì)和新鮮度進(jìn)行分析,如對水果的可溶性固形物含量、總酸度等指標(biāo)的檢測。在制藥行業(yè),近紅外光譜技術(shù)用于藥物成分的定量分析和質(zhì)量控制,確保藥品質(zhì)量的穩(wěn)定性和一致性,提高生產(chǎn)效率。在化工領(lǐng)域,可對化工原料和產(chǎn)品的成分進(jìn)行分析,實(shí)現(xiàn)生產(chǎn)過程的實(shí)時(shí)監(jiān)測和控制。在國內(nèi),近紅外光譜技術(shù)同樣得到了快速發(fā)展和應(yīng)用。在農(nóng)業(yè)領(lǐng)域,張敏等人開發(fā)出利用近紅外光譜技術(shù)的谷物蛋白質(zhì)含量在線檢測系統(tǒng),該系統(tǒng)融合GPS/北斗定位模塊,能在聯(lián)合收割機(jī)作業(yè)時(shí)實(shí)時(shí)檢測谷物蛋白質(zhì)含量并記錄地理位置信息。在食品領(lǐng)域,高升等人依托可見與近紅外漫反射技術(shù),打造出便攜式紅提葡萄多品質(zhì)參數(shù)無損檢測儀,可迅速測定紅提葡萄的多種品質(zhì)指標(biāo)。在制藥領(lǐng)域,近紅外光譜技術(shù)用于中藥成分分析和質(zhì)量控制,如對中藥粉末的分類識別和純度鑒定,以及對中藥萃取液濃度的定量分析。1.2.3研究現(xiàn)狀的不足與空白盡管國內(nèi)外在蘿卜硫苷和近紅外光譜技術(shù)方面都取得了不少成果,但仍存在一些不足與空白。在蘿卜硫苷研究方面,雖然對其生理功能有了較為深入的了解,但在蘿卜硫苷在不同環(huán)境條件下的穩(wěn)定性以及與其他物質(zhì)的相互作用研究還不夠充分。不同產(chǎn)地、種植條件下的十字花科植物中蘿卜硫苷含量差異較大,而目前對于這些因素如何影響蘿卜硫苷的合成和積累機(jī)制研究還不夠系統(tǒng)。在近紅外光譜技術(shù)應(yīng)用方面,雖然該技術(shù)在多個(gè)領(lǐng)域得到廣泛應(yīng)用,但針對蘿卜硫苷的近紅外定標(biāo)模型構(gòu)建研究相對較少。不同類型的樣品基質(zhì)對近紅外光譜的影響較為復(fù)雜,目前尚未有成熟的方法來消除這些影響,以提高蘿卜硫苷近紅外定標(biāo)模型的準(zhǔn)確性和通用性。在模型的驗(yàn)證和優(yōu)化方面,也缺乏全面、系統(tǒng)的研究,導(dǎo)致模型在實(shí)際應(yīng)用中的可靠性有待進(jìn)一步提高。1.3研究內(nèi)容與方法1.3.1研究內(nèi)容本研究旨在構(gòu)建準(zhǔn)確、可靠的蘿卜硫苷組分近紅外定標(biāo)模型,以實(shí)現(xiàn)對蘿卜硫苷含量的快速、無損檢測。具體研究內(nèi)容包括:樣品的采集與預(yù)處理:廣泛收集不同產(chǎn)地、品種的十字花科植物樣品,如西蘭花種子、芽苗等,確保樣品具有代表性。對采集到的樣品進(jìn)行清洗、干燥等預(yù)處理,以消除雜質(zhì)和水分對光譜測定的影響。近紅外光譜的采集:使用近紅外光譜儀對預(yù)處理后的樣品進(jìn)行光譜采集,優(yōu)化光譜采集條件,如掃描范圍、掃描次數(shù)、積分時(shí)間等,以獲取高質(zhì)量的近紅外光譜數(shù)據(jù)?;瘜W(xué)值的測定:采用高效液相色譜法(HPLC)等傳統(tǒng)化學(xué)分析方法,準(zhǔn)確測定樣品中蘿卜硫苷的含量,作為建立近紅外定標(biāo)模型的參考值。近紅外定標(biāo)模型的構(gòu)建:運(yùn)用偏最小二乘法(PLS)、主成分回歸(PCR)等化學(xué)計(jì)量學(xué)方法,結(jié)合近紅外光譜數(shù)據(jù)和化學(xué)值,建立蘿卜硫苷組分近紅外定標(biāo)模型。模型的驗(yàn)證與優(yōu)化:使用交叉驗(yàn)證、外部驗(yàn)證等方法對建立的模型進(jìn)行驗(yàn)證,評估模型的準(zhǔn)確性、重復(fù)性和預(yù)測能力。通過對光譜數(shù)據(jù)進(jìn)行預(yù)處理、選擇合適的建模參數(shù)等方式,對模型進(jìn)行優(yōu)化,提高模型的性能。模型的應(yīng)用與評價(jià):將優(yōu)化后的近紅外定標(biāo)模型應(yīng)用于實(shí)際樣品的檢測,與傳統(tǒng)化學(xué)分析方法的結(jié)果進(jìn)行對比,評價(jià)模型在實(shí)際應(yīng)用中的可行性和可靠性。1.3.2研究方法本研究綜合運(yùn)用實(shí)驗(yàn)研究、數(shù)據(jù)分析和模型構(gòu)建等方法,確保研究的科學(xué)性和可靠性。實(shí)驗(yàn)研究方法:在樣品采集環(huán)節(jié),遵循隨機(jī)抽樣原則,在不同地區(qū)的種植基地、農(nóng)貿(mào)市場等地采集十字花科植物樣品,保證樣品來源的多樣性。在近紅外光譜采集過程中,嚴(yán)格按照儀器操作規(guī)程進(jìn)行操作,對同一批樣品進(jìn)行多次重復(fù)測量,以減小測量誤差。化學(xué)值測定實(shí)驗(yàn)中,使用標(biāo)準(zhǔn)物質(zhì)進(jìn)行校準(zhǔn),確保測量結(jié)果的準(zhǔn)確性。數(shù)據(jù)分析方法:利用Origin、MATLAB等數(shù)據(jù)分析軟件,對采集到的近紅外光譜數(shù)據(jù)和化學(xué)值進(jìn)行處理和分析。通過繪制光譜圖、散點(diǎn)圖等,直觀地展示數(shù)據(jù)特征。采用相關(guān)性分析、主成分分析等方法,篩選出與蘿卜硫苷含量相關(guān)性較強(qiáng)的光譜波段,為模型構(gòu)建提供數(shù)據(jù)支持。模型構(gòu)建方法:運(yùn)用偏最小二乘法(PLS)構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型,通過調(diào)整主成分個(gè)數(shù)、回歸系數(shù)等參數(shù),優(yōu)化模型結(jié)構(gòu)。同時(shí),對比主成分回歸(PCR)等其他建模方法,選擇最優(yōu)的建模方法。在模型驗(yàn)證階段,采用留一法交叉驗(yàn)證、外部驗(yàn)證等方法,評估模型的預(yù)測能力和穩(wěn)定性。二、相關(guān)理論基礎(chǔ)2.1蘿卜硫苷概述2.1.1蘿卜硫苷的結(jié)構(gòu)與性質(zhì)蘿卜硫苷(Glucoraphanin),化學(xué)名稱為4-甲基亞磺?;』虼咸烟擒?,分子式為C_{12}H_{22}S_{3}NO_{10},分子量為436.5。其化學(xué)結(jié)構(gòu)由β-D-葡萄糖、磺酸鹽基團(tuán)以及4-甲基亞磺酰基丁基側(cè)鏈通過硫苷鍵連接而成。這種獨(dú)特的結(jié)構(gòu)賦予了蘿卜硫苷特定的理化性質(zhì)。蘿卜硫苷為白色至淺黃色粉末,可溶于水,不溶于石油醚。其在酸性條件下相對穩(wěn)定,但在堿性環(huán)境中,尤其是當(dāng)pH值大于7時(shí),穩(wěn)定性顯著下降,容易發(fā)生分解反應(yīng)。蘿卜硫苷對熱也較為敏感,當(dāng)溫度超過60℃時(shí),其結(jié)構(gòu)會逐漸發(fā)生變化,含量會有所降低。在光照條件下,蘿卜硫苷同樣會發(fā)生一定程度的降解,尤其是在紫外線照射下,降解速度會加快。在蘿卜的生長發(fā)育過程中,蘿卜硫苷發(fā)揮著至關(guān)重要的作用。蘿卜硫苷是蘿卜抵御外界生物脅迫的重要防御物質(zhì)。當(dāng)蘿卜受到病蟲害侵襲時(shí),體內(nèi)的蘿卜硫苷會在黑芥子酶的作用下迅速分解,產(chǎn)生具有抗菌、殺蟲活性的蘿卜硫素等物質(zhì),從而抑制病蟲害的生長和繁殖。研究表明,在遭受菜青蟲侵害時(shí),富含蘿卜硫苷的蘿卜品種能夠更有效地抵御蟲害,減少葉片的損傷程度。蘿卜硫苷還參與了蘿卜的生長調(diào)節(jié)過程。在蘿卜種子萌發(fā)階段,蘿卜硫苷及其代謝產(chǎn)物能夠調(diào)節(jié)種子內(nèi)部的激素平衡,促進(jìn)種子的萌發(fā)和幼苗的生長。在蘿卜的整個(gè)生長周期中,蘿卜硫苷的含量會隨著生長階段的不同而發(fā)生變化,這表明其在蘿卜的生長發(fā)育調(diào)控中具有重要的生理意義。2.1.2蘿卜硫苷的生理功能蘿卜硫苷在抗氧化、抗癌、調(diào)節(jié)代謝等方面展現(xiàn)出顯著的生理功能。在抗氧化方面,蘿卜硫苷本身具有一定的抗氧化能力,其結(jié)構(gòu)中的硫原子和羥基等基團(tuán)能夠捕捉自由基,抑制氧化反應(yīng)的發(fā)生。更為重要的是,蘿卜硫苷在黑芥子酶或腸道微生物的作用下轉(zhuǎn)化為蘿卜硫素,蘿卜硫素是一種強(qiáng)抗氧化劑。蘿卜硫素能夠激活細(xì)胞內(nèi)的抗氧化防御系統(tǒng),上調(diào)抗氧化酶如超氧化物歧化酶(SOD)、谷胱甘肽過氧化物酶(GSH-Px)等的表達(dá)和活性,從而有效地清除體內(nèi)過多的自由基,減少氧化應(yīng)激對細(xì)胞和組織的損傷。研究發(fā)現(xiàn),在氧化應(yīng)激模型小鼠中,給予蘿卜硫苷干預(yù)后,小鼠體內(nèi)的氧化產(chǎn)物丙二醛(MDA)含量顯著降低,而SOD和GSH-Px的活性明顯升高,表明蘿卜硫苷通過轉(zhuǎn)化為蘿卜硫素發(fā)揮了強(qiáng)大的抗氧化作用。在抗癌方面,蘿卜硫苷的抗癌機(jī)制是多途徑的。蘿卜硫素能夠調(diào)節(jié)細(xì)胞周期,誘導(dǎo)癌細(xì)胞發(fā)生凋亡。它可以通過抑制細(xì)胞周期蛋白依賴性激酶(CDK)的活性,使癌細(xì)胞停滯在G1期,無法進(jìn)入S期進(jìn)行DNA復(fù)制,從而抑制癌細(xì)胞的增殖。蘿卜硫素還能激活細(xì)胞內(nèi)的凋亡信號通路,上調(diào)促凋亡蛋白如Bax的表達(dá),下調(diào)抗凋亡蛋白Bcl-2的表達(dá),促使癌細(xì)胞發(fā)生凋亡。蘿卜硫苷能夠抑制腫瘤血管生成。腫瘤的生長和轉(zhuǎn)移依賴于充足的血液供應(yīng),而蘿卜硫素可以通過抑制血管內(nèi)皮生長因子(VEGF)及其受體的表達(dá)和活性,阻礙腫瘤血管的形成,切斷腫瘤的營養(yǎng)供應(yīng),從而抑制腫瘤的生長和轉(zhuǎn)移。眾多細(xì)胞實(shí)驗(yàn)和動(dòng)物實(shí)驗(yàn)都證實(shí)了蘿卜硫苷的抗癌功效。在乳腺癌細(xì)胞系中,蘿卜硫素能夠顯著抑制癌細(xì)胞的增殖和遷移能力;在肺癌小鼠模型中,給予蘿卜硫苷處理后,小鼠肺部腫瘤的體積和數(shù)量明顯減少。在調(diào)節(jié)代謝方面,蘿卜硫苷對血糖和血脂代謝具有積極的調(diào)節(jié)作用。對于糖尿病患者,蘿卜硫苷能夠通過激活胰島素信號通路,提高胰島素的敏感性,促進(jìn)細(xì)胞對葡萄糖的攝取和利用,從而降低血糖水平。蘿卜硫苷還能調(diào)節(jié)脂質(zhì)代謝相關(guān)酶的活性,抑制脂肪酸的合成,促進(jìn)脂肪酸的β-氧化,降低血脂水平。在高脂血癥小鼠模型中,給予蘿卜硫苷后,小鼠的血清總膽固醇、甘油三酯和低密度脂蛋白膽固醇水平顯著降低,高密度脂蛋白膽固醇水平有所升高,表明蘿卜硫苷對血脂代謝具有良好的調(diào)節(jié)作用。2.2近紅外光譜分析技術(shù)2.2.1近紅外光譜分析技術(shù)的原理近紅外光譜(NearInfraredSpectrum,NIRS)是介于可見光(VisibleLight,VL)和中紅外光(MidInfraredSpectrum,MIRS)之間的電磁波,波長范圍通常為780-2526nm。近紅外光譜的產(chǎn)生源于物質(zhì)分子的振動(dòng)和轉(zhuǎn)動(dòng)能級躍遷。在分子中,原子通過化學(xué)鍵相互連接,形成各種振動(dòng)模式。當(dāng)分子受到近紅外光照射時(shí),分子中的含氫基團(tuán)(如C-H、N-H、O-H等)會吸收特定波長的近紅外光,使得分子振動(dòng)能級從基態(tài)躍遷到激發(fā)態(tài)。這種吸收是由于分子振動(dòng)的非諧振性,導(dǎo)致分子振動(dòng)從基態(tài)向高能級躍遷時(shí)產(chǎn)生的倍頻和合頻吸收。不同的化學(xué)基團(tuán)具有不同的振動(dòng)頻率和能級結(jié)構(gòu),因此對近紅外光的吸收也具有特異性。甲基(-CH?)的C-H鍵在近紅外光譜區(qū)有特定的吸收峰,其倍頻和合頻吸收峰出現(xiàn)在特定波長位置。通過檢測樣品對近紅外光的吸收情況,獲得近紅外光譜圖,光譜圖中包含了樣品中各種化學(xué)基團(tuán)的信息。這些信息與樣品的成分和結(jié)構(gòu)密切相關(guān),例如,在分析農(nóng)產(chǎn)品時(shí),近紅外光譜可以反映出蛋白質(zhì)、脂肪、碳水化合物等成分中含氫基團(tuán)的特征吸收,從而用于確定農(nóng)產(chǎn)品的成分含量。在實(shí)際應(yīng)用中,近紅外光譜分析技術(shù)通常結(jié)合化學(xué)計(jì)量學(xué)方法來實(shí)現(xiàn)對樣品成分的定量分析。化學(xué)計(jì)量學(xué)是一門運(yùn)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等方法,對化學(xué)數(shù)據(jù)進(jìn)行處理和分析的學(xué)科。通過建立合適的數(shù)學(xué)模型,將近紅外光譜數(shù)據(jù)與樣品的化學(xué)值(如蘿卜硫苷的含量)相關(guān)聯(lián),從而實(shí)現(xiàn)對未知樣品中蘿卜硫苷含量的預(yù)測。偏最小二乘法(PLS)是一種常用的化學(xué)計(jì)量學(xué)方法,它通過對光譜數(shù)據(jù)和化學(xué)值進(jìn)行降維處理,提取出對預(yù)測目標(biāo)最有貢獻(xiàn)的信息,建立起兩者之間的定量關(guān)系模型。在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型時(shí),利用PLS方法可以有效地消除光譜數(shù)據(jù)中的噪聲和干擾信息,提高模型的準(zhǔn)確性和穩(wěn)定性。2.2.2近紅外光譜分析技術(shù)的特點(diǎn)近紅外光譜分析技術(shù)具有諸多顯著優(yōu)點(diǎn),使其在眾多領(lǐng)域得到廣泛應(yīng)用。該技術(shù)具有快速分析的特點(diǎn)。傳統(tǒng)的化學(xué)分析方法,如高效液相色譜法,通常需要復(fù)雜的樣品前處理過程,包括提取、分離、純化等步驟,分析時(shí)間較長,一般需要數(shù)小時(shí)甚至數(shù)天。而近紅外光譜分析技術(shù)只需將樣品放入光譜儀中,幾分鐘內(nèi)即可完成光譜采集和分析,大大提高了分析效率,尤其適用于需要大量樣品檢測的場合,如農(nóng)產(chǎn)品質(zhì)量檢測、食品生產(chǎn)過程中的質(zhì)量控制等。近紅外光譜分析技術(shù)具有無損檢測的優(yōu)勢。傳統(tǒng)化學(xué)分析方法往往需要對樣品進(jìn)行破壞性處理,如消解、萃取等,這不僅會消耗大量的樣品,還可能改變樣品的原有性質(zhì)。近紅外光譜分析技術(shù)只需對樣品進(jìn)行簡單的預(yù)處理,如粉碎、壓片等,即可直接進(jìn)行光譜測量,不會對樣品造成破壞,這對于珍貴樣品、活體樣品或需要保留樣品完整性的檢測具有重要意義。在對植物活體組織進(jìn)行成分分析時(shí),近紅外光譜技術(shù)可以在不損傷植物的前提下,快速獲取其內(nèi)部成分信息,為植物生長狀況的監(jiān)測和研究提供便利。該技術(shù)還能夠?qū)崿F(xiàn)多組分同時(shí)測定。近紅外光譜包含了樣品中多種化學(xué)基團(tuán)的信息,通過合適的化學(xué)計(jì)量學(xué)方法,可以同時(shí)對樣品中的多個(gè)成分進(jìn)行定量分析。在分析農(nóng)產(chǎn)品時(shí),可以同時(shí)測定其中的蛋白質(zhì)、脂肪、水分、淀粉等多種成分的含量,而無需分別對每個(gè)成分進(jìn)行單獨(dú)檢測,節(jié)省了時(shí)間和成本,提高了分析效率。近紅外光譜分析技術(shù)也存在一定的局限性。該技術(shù)的靈敏度相對較低。近紅外光的吸收強(qiáng)度較弱,與中紅外光譜相比,其吸收信號較弱,導(dǎo)致檢測靈敏度相對較低,對于低含量成分的檢測準(zhǔn)確性可能受到影響。當(dāng)樣品中蘿卜硫苷含量較低時(shí),近紅外光譜信號可能較弱,容易受到噪聲干擾,從而影響檢測的準(zhǔn)確性。近紅外光譜分析技術(shù)對樣品的要求較高。樣品的均勻性、顆粒大小、水分含量等因素都會對光譜測量結(jié)果產(chǎn)生影響。如果樣品不均勻,可能導(dǎo)致光譜測量結(jié)果的偏差;樣品顆粒大小不一致,會影響光的散射和吸收,從而影響光譜的準(zhǔn)確性;水分在近紅外光譜區(qū)有較強(qiáng)的吸收,樣品中水分含量的變化會干擾其他成分的光譜信號。在實(shí)際應(yīng)用中,需要對樣品進(jìn)行嚴(yán)格的預(yù)處理和質(zhì)量控制,以確保光譜測量的準(zhǔn)確性。近紅外光譜分析技術(shù)還依賴于建立準(zhǔn)確的定標(biāo)模型。定標(biāo)模型的準(zhǔn)確性直接影響到分析結(jié)果的可靠性,而建立準(zhǔn)確的定標(biāo)模型需要大量的標(biāo)準(zhǔn)樣品和準(zhǔn)確的化學(xué)值測定,這需要耗費(fèi)大量的時(shí)間和精力。定標(biāo)模型的適用范圍也受到一定限制,對于不同來源、不同性質(zhì)的樣品,可能需要重新建立定標(biāo)模型,以保證分析結(jié)果的準(zhǔn)確性。2.3化學(xué)計(jì)量學(xué)方法2.3.1光譜預(yù)處理方法光譜預(yù)處理是近紅外光譜分析中的關(guān)鍵步驟,其目的是消除或減少光譜數(shù)據(jù)中的噪聲、基線漂移、散射等干擾因素,提高光譜的質(zhì)量和穩(wěn)定性,從而為后續(xù)的定量分析提供更可靠的數(shù)據(jù)基礎(chǔ)。平滑是一種常用的光譜預(yù)處理方法,其主要作用是減少光譜中的隨機(jī)噪聲。在近紅外光譜采集過程中,由于儀器本身的噪聲、環(huán)境干擾等因素,光譜數(shù)據(jù)中不可避免地會存在一些隨機(jī)波動(dòng),這些噪聲會影響光譜的特征提取和模型的準(zhǔn)確性。Savitzky-Golay平滑算法是一種較為常用的平滑方法,該算法通過在一定窗口內(nèi)對光譜數(shù)據(jù)進(jìn)行多項(xiàng)式擬合,然后用擬合后的多項(xiàng)式來代替原始數(shù)據(jù),從而達(dá)到平滑的目的。在一個(gè)窗口大小為5,多項(xiàng)式階數(shù)為2的Savitzky-Golay平滑處理中,對于一段包含噪聲的近紅外光譜數(shù)據(jù),經(jīng)過平滑處理后,光譜曲線變得更加平滑,噪聲引起的隨機(jī)波動(dòng)明顯減少,能夠更清晰地展現(xiàn)光譜的特征?;€校正用于消除光譜中的基線漂移。在實(shí)際測量中,由于儀器的不穩(wěn)定性、樣品的不均勻性以及背景干擾等原因,光譜的基線可能會發(fā)生漂移,導(dǎo)致光譜的整體強(qiáng)度發(fā)生變化,從而影響對樣品成分的準(zhǔn)確分析。常用的基線校正方法包括多項(xiàng)式擬合、小波變換等。多項(xiàng)式擬合方法是通過選擇光譜中的非峰區(qū)域數(shù)據(jù)點(diǎn),擬合一個(gè)多項(xiàng)式來代表基線,然后將原始光譜減去擬合的基線,得到校正后的光譜。對于一組存在基線漂移的近紅外光譜數(shù)據(jù),通過多項(xiàng)式擬合方法進(jìn)行基線校正后,光譜的基線變得平穩(wěn),消除了基線漂移對光譜分析的影響,使得光譜中與樣品成分相關(guān)的特征峰更加突出,有利于后續(xù)的分析和建模。導(dǎo)數(shù)處理能夠增強(qiáng)光譜中微弱的特征,分離重疊峰,并消除基線漂移的影響。在近紅外光譜中,一些成分的吸收峰可能較弱,容易被其他強(qiáng)峰或噪聲掩蓋,導(dǎo)數(shù)處理可以通過計(jì)算光譜的一階導(dǎo)數(shù)或二階導(dǎo)數(shù),突出這些微弱的特征,提高對樣品成分的識別能力。對于兩個(gè)重疊的吸收峰,在原始光譜中可能難以區(qū)分,但通過計(jì)算一階導(dǎo)數(shù),兩個(gè)峰的特征更加明顯,能夠清晰地分辨出它們的位置和強(qiáng)度。導(dǎo)數(shù)處理還可以消除基線漂移,因?yàn)榛€漂移通常表現(xiàn)為光譜的緩慢變化,而導(dǎo)數(shù)能夠突出光譜的變化率,從而消除基線漂移的影響。2.3.2定量分析方法偏最小二乘法(PLS)是近紅外光譜定量分析中應(yīng)用最為廣泛的方法之一。該方法的基本原理是將光譜數(shù)據(jù)矩陣(X)和化學(xué)值矩陣(Y)進(jìn)行分解,提取出對預(yù)測目標(biāo)最有貢獻(xiàn)的成分,建立兩者之間的定量關(guān)系模型。PLS方法能夠有效地處理光譜數(shù)據(jù)中的高維性、多重共線性等問題,提高模型的準(zhǔn)確性和穩(wěn)定性。在PLS模型構(gòu)建過程中,首先對光譜數(shù)據(jù)矩陣X和化學(xué)值矩陣Y進(jìn)行標(biāo)準(zhǔn)化處理,消除數(shù)據(jù)量綱和尺度的影響。然后,通過迭代計(jì)算,提取出一系列的主成分(潛變量),這些主成分不僅包含了光譜數(shù)據(jù)中的主要信息,還與化學(xué)值之間具有較強(qiáng)的相關(guān)性。在每一次迭代中,計(jì)算主成分與X和Y的協(xié)方差,選擇協(xié)方差最大的方向作為新的主成分方向,直到提取出的主成分能夠充分解釋光譜數(shù)據(jù)和化學(xué)值之間的關(guān)系為止。以構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型為例,將采集到的近紅外光譜數(shù)據(jù)作為X矩陣,對應(yīng)的蘿卜硫苷含量化學(xué)值作為Y矩陣,運(yùn)用PLS方法進(jìn)行建模。通過交叉驗(yàn)證等方法確定主成分的個(gè)數(shù),使得模型在訓(xùn)練集和驗(yàn)證集上都具有較好的預(yù)測性能。最終建立的PLS模型可以根據(jù)未知樣品的近紅外光譜,準(zhǔn)確地預(yù)測其蘿卜硫苷含量。主成分回歸(PCR)也是一種常用的定量分析方法。PCR方法首先對光譜數(shù)據(jù)進(jìn)行主成分分析(PCA),將高維的光譜數(shù)據(jù)轉(zhuǎn)換為低維的主成分得分矩陣,然后以主成分得分作為自變量,化學(xué)值作為因變量,建立線性回歸模型。PCA的原理是通過對光譜數(shù)據(jù)矩陣進(jìn)行特征分解,找到數(shù)據(jù)中最大方差的方向,將原始數(shù)據(jù)投影到這些方向上,得到主成分得分。主成分之間相互正交,且按照方差大小排序,前幾個(gè)主成分能夠包含光譜數(shù)據(jù)中的大部分信息。在對近紅外光譜數(shù)據(jù)進(jìn)行PCA分析時(shí),可能前3-5個(gè)主成分就能夠解釋90%以上的光譜方差。將得到的主成分得分與化學(xué)值進(jìn)行線性回歸,建立PCR模型。在實(shí)際應(yīng)用中,PCR模型能夠有效地降低數(shù)據(jù)維度,減少噪聲和干擾的影響,但由于PCA過程中只考慮了光譜數(shù)據(jù)的方差信息,沒有直接考慮光譜與化學(xué)值之間的相關(guān)性,因此在某些情況下,其預(yù)測性能可能不如PLS模型。三、實(shí)驗(yàn)材料與方法3.1實(shí)驗(yàn)材料本實(shí)驗(yàn)選用了“綠雄90”西蘭花品種,該品種是由上海市農(nóng)業(yè)科學(xué)院園藝研究所選育的一代雜種,具有早熟、生長勢強(qiáng)等特點(diǎn),在眾多西蘭花品種中,其蘿卜硫苷含量相對較高且穩(wěn)定,這使得實(shí)驗(yàn)結(jié)果更具可靠性和代表性。西蘭花種子購自正規(guī)種子供應(yīng)商,供應(yīng)商具備多年的種子經(jīng)營經(jīng)驗(yàn),提供的種子經(jīng)過嚴(yán)格的質(zhì)量檢測,確保了種子的純度、發(fā)芽率和健康狀況。種子產(chǎn)地為氣候溫和、光照充足的地區(qū),適宜西蘭花生長,有助于積累較高含量的蘿卜硫苷。西蘭花種植于[具體種植地點(diǎn)]的實(shí)驗(yàn)田,該實(shí)驗(yàn)田土壤肥沃,pH值在6.5-7.5之間,呈中性至微酸性,符合西蘭花對土壤酸堿度的要求。土壤質(zhì)地為壤土,具有良好的保水保肥能力,能夠?yàn)槲魈m花生長提供充足的養(yǎng)分和水分。實(shí)驗(yàn)田周邊無工業(yè)污染,空氣質(zhì)量良好,灌溉水源為清潔的地下水,水質(zhì)符合農(nóng)業(yè)灌溉用水標(biāo)準(zhǔn),為西蘭花的優(yōu)質(zhì)生長創(chuàng)造了良好的環(huán)境條件。種植過程嚴(yán)格按照西蘭花的栽培技術(shù)規(guī)范進(jìn)行。播種前,對種子進(jìn)行消毒處理,以防止種子攜帶病菌,影響發(fā)芽和幼苗生長。采用穴盤育苗的方式,將種子播于裝滿育苗基質(zhì)的穴盤中,育苗基質(zhì)由草炭、蛭石和珍珠巖按一定比例混合而成,具有良好的透氣性和保水性,能夠?yàn)榉N子發(fā)芽和幼苗生長提供適宜的環(huán)境。育苗期間,控制溫度在20-25℃,保持充足的光照和適宜的濕度,定期澆水和施肥,確保幼苗茁壯成長。當(dāng)幼苗長至4-5片真葉時(shí),進(jìn)行移栽定植。移栽時(shí),按照一定的株行距進(jìn)行種植,保證植株之間有足夠的空間進(jìn)行光合作用和生長發(fā)育。在西蘭花生長過程中,加強(qiáng)田間管理。定期澆水,保持土壤濕潤,但避免積水,以免造成根部腐爛。根據(jù)西蘭花的生長階段,合理施肥,以有機(jī)肥為主,配合適量的化肥,提供充足的氮、磷、鉀等營養(yǎng)元素。及時(shí)進(jìn)行病蟲害防治,采用物理防治、生物防治和化學(xué)防治相結(jié)合的方法,確保西蘭花的健康生長。在西蘭花生長至適宜的成熟階段,及時(shí)進(jìn)行采樣,以獲取具有代表性的實(shí)驗(yàn)樣品。3.2實(shí)驗(yàn)儀器與設(shè)備本實(shí)驗(yàn)使用了德國布魯克公司生產(chǎn)的MPA傅里葉變換近紅外光譜儀,該儀器采用邁克爾遜干涉儀原理,具有高分辨率和高信噪比的特點(diǎn)。其光譜范圍為4000-12500cm?1,分辨率可達(dá)4cm?1,能夠提供詳細(xì)的光譜信息。儀器配備了積分球漫反射附件,適用于固體樣品的光譜采集,能夠有效提高光的收集效率,減少樣品表面散射對光譜的影響,確保采集到的近紅外光譜準(zhǔn)確可靠。在實(shí)驗(yàn)過程中,積分球漫反射附件能夠使光線均勻地照射在樣品表面,并收集反射光,從而獲得穩(wěn)定的光譜信號。高效液相色譜儀選用美國安捷倫公司的1260InfinityII型,該儀器具有高精度的輸液泵和高靈敏度的檢測器,能夠?qū)崿F(xiàn)對蘿卜硫苷的準(zhǔn)確分離和測定。輸液泵的流量范圍為0.001-10mL/min,流量精度可達(dá)±0.075%,能夠保證流動(dòng)相的穩(wěn)定輸送,確保色譜峰的分離效果。檢測器為二極管陣列檢測器(DAD),可在190-950nm波長范圍內(nèi)進(jìn)行全波長掃描,能夠同時(shí)檢測多個(gè)波長下的信號,提高檢測的靈敏度和準(zhǔn)確性。在測定蘿卜硫苷含量時(shí),DAD檢測器能夠?qū)μ}卜硫苷的特征吸收波長進(jìn)行監(jiān)測,準(zhǔn)確地確定其含量。為了對西蘭花樣品進(jìn)行預(yù)處理,實(shí)驗(yàn)使用了德國IKA公司的A11basic分析研磨儀,該研磨儀轉(zhuǎn)速范圍為10000-25000rpm,能夠快速將西蘭花樣品粉碎成均勻的粉末,確保樣品的一致性。在研磨過程中,高速旋轉(zhuǎn)的刀片能夠?qū)⑽魈m花組織破碎,使細(xì)胞內(nèi)的成分充分釋放,便于后續(xù)的分析。使用北京博醫(yī)康實(shí)驗(yàn)儀器有限公司的FD-1A-50型真空冷凍干燥機(jī)對西蘭花樣品進(jìn)行干燥處理。該干燥機(jī)的冷阱溫度可達(dá)-55℃,真空度可達(dá)10Pa以下,能夠在低溫、高真空環(huán)境下將樣品中的水分升華去除,最大限度地保留樣品中的活性成分,如蘿卜硫苷。真空冷凍干燥過程能夠避免高溫對蘿卜硫苷的破壞,確保樣品的質(zhì)量和穩(wěn)定性。在實(shí)驗(yàn)過程中,還使用了其他輔助設(shè)備,如梅特勒-托利多公司的AL204型電子天平,其精度為0.0001g,能夠準(zhǔn)確稱量樣品和試劑的質(zhì)量,確保實(shí)驗(yàn)的準(zhǔn)確性。使用上海申安醫(yī)療器械廠的LDZX-50KBS型立式壓力蒸汽滅菌器對實(shí)驗(yàn)器具進(jìn)行滅菌處理,保證實(shí)驗(yàn)環(huán)境的無菌狀態(tài),防止微生物污染對實(shí)驗(yàn)結(jié)果的影響。3.3實(shí)驗(yàn)方法3.3.1樣品制備將采集的西蘭花樣品置于流水下沖洗5分鐘,以徹底去除表面的泥土、灰塵和雜質(zhì),確保樣品的清潔度。使用潔凈的紗布輕輕吸干樣品表面的水分,避免水分殘留影響后續(xù)的干燥和分析過程。利用鋒利的刀片將西蘭花切成厚度約為3mm的薄片,保證切片厚度均勻,以促進(jìn)干燥過程的一致性。將切好的西蘭花薄片均勻地鋪在不銹鋼托盤上,薄片之間保持一定的間隙,避免相互重疊,以利于水分的散發(fā)。將托盤放入真空冷凍干燥機(jī)中,冷阱溫度設(shè)置為-55℃,真空度控制在10Pa以下,干燥時(shí)間設(shè)定為24小時(shí),使西蘭花樣品中的水分充分升華去除。干燥后的西蘭花樣品質(zhì)地酥脆,便于后續(xù)的研磨處理。使用分析研磨儀將干燥的西蘭花樣品研磨成粉末狀。設(shè)置研磨儀的轉(zhuǎn)速為15000rpm,研磨時(shí)間為3分鐘,使樣品充分粉碎,確保粉末的粒度均勻。將研磨好的西蘭花粉末過80目篩網(wǎng),去除較大顆粒,保證樣品的均一性。將過篩后的西蘭花粉末裝入密封袋中,標(biāo)注樣品名稱、采集時(shí)間和產(chǎn)地等信息,置于干燥器中保存,避免樣品受潮和氧化,確保樣品在后續(xù)實(shí)驗(yàn)中的穩(wěn)定性。3.3.2近紅外光譜采集在進(jìn)行近紅外光譜采集前,先對MPA傅里葉變換近紅外光譜儀進(jìn)行預(yù)熱,預(yù)熱時(shí)間為30分鐘,使儀器達(dá)到穩(wěn)定的工作狀態(tài),減少儀器漂移對光譜采集的影響。設(shè)置儀器的掃描范圍為4000-12500cm?1,該范圍能夠覆蓋蘿卜硫苷分子中含氫基團(tuán)的主要振動(dòng)吸收信息。將分辨率設(shè)定為8cm?1,在保證獲取足夠光譜細(xì)節(jié)的同時(shí),兼顧掃描速度和數(shù)據(jù)處理的效率。掃描次數(shù)設(shè)置為32次,通過多次掃描取平均值的方式,提高光譜的信噪比,降低噪聲干擾,確保采集到的光譜數(shù)據(jù)準(zhǔn)確可靠。將制備好的西蘭花粉末樣品放入樣品杯中,輕輕壓實(shí),使樣品表面平整,以保證光線能夠均勻地照射在樣品上,減少光散射的影響。將樣品杯放入積分球漫反射附件中,確保樣品杯放置穩(wěn)固,避免在掃描過程中發(fā)生晃動(dòng)。啟動(dòng)光譜儀,進(jìn)行近紅外光譜采集。在采集過程中,實(shí)時(shí)觀察光譜曲線的變化,確保光譜采集的穩(wěn)定性和準(zhǔn)確性。采集完成后,將光譜數(shù)據(jù)保存為特定格式,以便后續(xù)的數(shù)據(jù)處理和分析。對每個(gè)樣品進(jìn)行3次重復(fù)測量,取平均值作為該樣品的近紅外光譜數(shù)據(jù),進(jìn)一步提高數(shù)據(jù)的可靠性。3.3.3蘿卜硫苷組分測定采用高效液相色譜法(HPLC)測定西蘭花樣品中蘿卜硫苷的含量。準(zhǔn)確稱取蘿卜硫苷標(biāo)準(zhǔn)品5mg,置于50mL容量瓶中,用甲醇溶解并定容至刻度,配制成濃度為0.1mg/mL的標(biāo)準(zhǔn)儲備液。將標(biāo)準(zhǔn)儲備液用甲醇稀釋,分別配制成濃度為0.005mg/mL、0.01mg/mL、0.02mg/mL、0.05mg/mL、0.1mg/mL的標(biāo)準(zhǔn)工作溶液,用于繪制標(biāo)準(zhǔn)曲線。稱取0.5g西蘭花粉末樣品于50mL離心管中,加入20mL甲醇,渦旋振蕩30秒,使樣品與甲醇充分混合。將離心管置于超聲清洗器中,超聲提取30分鐘,超聲功率為400W,頻率為40kHz,以促進(jìn)蘿卜硫苷的溶解和提取。提取結(jié)束后,將離心管在8000rpm的轉(zhuǎn)速下離心10分鐘,使固體殘?jiān)恋恚∩锨逡簜溆?。將上清液通過0.45μm的微孔濾膜過濾,去除溶液中的微小顆粒雜質(zhì),得到供試品溶液。將制備好的標(biāo)準(zhǔn)工作溶液和供試品溶液分別注入高效液相色譜儀中進(jìn)行分析。色譜柱選用C18PAQ(4.6mm×250mm,5μm),該色譜柱對蘿卜硫苷具有良好的分離效果。流動(dòng)相為甲醇:0.1%磷酸,采用梯度洗脫程序:0-8min保持5%甲醇,8.1-13min由5%-95%甲醇,13.1-22min95%-5%甲醇。進(jìn)樣量為10μL,柱溫設(shè)置為30℃,流速為1mL/min。在上述色譜條件下,蘿卜硫苷能夠得到良好的分離和檢測。根據(jù)標(biāo)準(zhǔn)工作溶液的濃度和對應(yīng)的峰面積,繪制標(biāo)準(zhǔn)曲線。通過線性回歸分析,得到標(biāo)準(zhǔn)曲線的方程和相關(guān)系數(shù)。將供試品溶液的峰面積代入標(biāo)準(zhǔn)曲線方程,計(jì)算出西蘭花樣品中蘿卜硫苷的含量。在測定過程中,每分析10個(gè)樣品,插入一個(gè)標(biāo)準(zhǔn)品進(jìn)行校準(zhǔn),以確保測定結(jié)果的準(zhǔn)確性。同時(shí),對每個(gè)樣品進(jìn)行3次平行測定,取平均值作為樣品中蘿卜硫苷的含量,并計(jì)算相對標(biāo)準(zhǔn)偏差(RSD),以評估測定結(jié)果的精密度。3.3.4數(shù)據(jù)處理與分析運(yùn)用化學(xué)計(jì)量學(xué)軟件UnscramblerX10.4對采集到的近紅外光譜數(shù)據(jù)和蘿卜硫苷含量數(shù)據(jù)進(jìn)行處理和分析。首先對近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理,采用Savitzky-Golay平滑算法對光譜進(jìn)行平滑處理,窗口大小設(shè)置為7,多項(xiàng)式階數(shù)為2,以減少光譜中的噪聲干擾。使用基線校正方法,通過多項(xiàng)式擬合消除光譜的基線漂移,使光譜更加平穩(wěn)。對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)處理,增強(qiáng)光譜中微弱的特征峰,提高光譜的分辨率。采用偏最小二乘法(PLS)構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型。將預(yù)處理后的近紅外光譜數(shù)據(jù)作為自變量,對應(yīng)的蘿卜硫苷含量化學(xué)值作為因變量,利用軟件的PLS算法進(jìn)行建模。通過交叉驗(yàn)證的方法,確定模型的主成分個(gè)數(shù),使模型在訓(xùn)練集和驗(yàn)證集上都具有較好的預(yù)測性能。在交叉驗(yàn)證過程中,將樣品隨機(jī)分為若干組,每次取一組作為驗(yàn)證集,其余組作為訓(xùn)練集,反復(fù)訓(xùn)練和驗(yàn)證模型,評估模型的準(zhǔn)確性和穩(wěn)定性。計(jì)算模型的相關(guān)系數(shù)(R2)、均方根誤差(RMSE)等指標(biāo),用于評價(jià)模型的性能。R2越接近1,RMSE越小,表明模型的預(yù)測準(zhǔn)確性越高。使用外部驗(yàn)證集對建立的近紅外定標(biāo)模型進(jìn)行驗(yàn)證。將未參與建模的樣品的近紅外光譜數(shù)據(jù)輸入模型,預(yù)測其蘿卜硫苷含量,并與實(shí)際測定的化學(xué)值進(jìn)行比較。計(jì)算預(yù)測值與實(shí)際值之間的偏差,評估模型的預(yù)測能力和可靠性。根據(jù)驗(yàn)證結(jié)果,對模型進(jìn)行優(yōu)化和調(diào)整,如進(jìn)一步優(yōu)化光譜預(yù)處理方法、調(diào)整建模參數(shù)等,以提高模型的性能。通過不斷優(yōu)化和驗(yàn)證,建立準(zhǔn)確、可靠的蘿卜硫苷組分近紅外定標(biāo)模型,為實(shí)際樣品中蘿卜硫苷含量的快速、準(zhǔn)確檢測提供有力支持。四、蘿卜硫苷組分近紅外定標(biāo)模型的構(gòu)建4.1樣品集劃分為構(gòu)建可靠且具有良好泛化能力的蘿卜硫苷組分近紅外定標(biāo)模型,科學(xué)合理地劃分樣品集至關(guān)重要。本研究共收集了[X]個(gè)西蘭花樣品,涵蓋了不同生長階段、不同種植條件下的樣本,以確保樣品的多樣性和代表性。采用Kennard-Stone算法對這些樣品進(jìn)行劃分。該算法基于樣品間的歐氏距離,優(yōu)先選擇距離較遠(yuǎn)的樣品作為校正集樣本,從而使校正集能夠更好地覆蓋樣品的特征空間。在具體操作時(shí),首先計(jì)算所有樣品間的歐氏距離,構(gòu)建距離矩陣。然后,從距離矩陣中選擇距離最遠(yuǎn)的兩個(gè)樣品作為初始校正集樣本。接著,計(jì)算剩余樣品與已選校正集樣本的最小距離,并選擇最小距離最大的樣品加入校正集,重復(fù)此過程,直至校正集包含[X1]個(gè)樣品。將剩余的[X2]個(gè)樣品作為驗(yàn)證集。最終,確定了[X1]個(gè)樣品用于構(gòu)建校正集,占總樣品數(shù)的70%,[X2]個(gè)樣品用于驗(yàn)證集,占總樣品數(shù)的30%。通過這樣的劃分方式,校正集能夠充分代表樣品的各種特征,包括不同的蘿卜硫苷含量范圍、不同的光譜特征等。驗(yàn)證集則用于評估模型在未知樣品上的預(yù)測能力,確保模型具有良好的泛化性能。在劃分過程中,對樣品的蘿卜硫苷含量進(jìn)行了統(tǒng)計(jì)分析,確保校正集和驗(yàn)證集的蘿卜硫苷含量分布相似,避免因含量分布差異導(dǎo)致模型的偏差。通過這種科學(xué)的樣品集劃分方法,為后續(xù)構(gòu)建準(zhǔn)確、可靠的蘿卜硫苷組分近紅外定標(biāo)模型奠定了堅(jiān)實(shí)的基礎(chǔ)。4.2光譜預(yù)處理近紅外光譜在采集過程中,不可避免地會受到儀器噪聲、樣品不均勻性、光散射等多種因素的干擾,這些干擾會降低光譜的質(zhì)量,影響后續(xù)定標(biāo)模型的準(zhǔn)確性和可靠性。因此,對原始光譜進(jìn)行預(yù)處理至關(guān)重要,通過合適的預(yù)處理方法能夠有效消除或減弱這些干擾,提高光譜的信噪比和穩(wěn)定性,為構(gòu)建高精度的蘿卜硫苷組分近紅外定標(biāo)模型奠定基礎(chǔ)。為了對比不同預(yù)處理方法對光譜的影響并選擇最優(yōu)預(yù)處理方式,本研究采用了多種常見的預(yù)處理方法,包括平滑、基線校正和導(dǎo)數(shù)處理。平滑處理旨在減少光譜中的隨機(jī)噪聲,使光譜曲線更加平滑,突出主要的光譜特征。本研究選用Savitzky-Golay平滑算法,該算法通過在一定窗口內(nèi)對光譜數(shù)據(jù)進(jìn)行多項(xiàng)式擬合,實(shí)現(xiàn)對噪聲的有效抑制。在進(jìn)行Savitzky-Golay平滑處理時(shí),對窗口大小和多項(xiàng)式階數(shù)進(jìn)行了優(yōu)化。分別嘗試了窗口大小為5、7、9,多項(xiàng)式階數(shù)為2、3、4的不同組合。當(dāng)窗口大小為7,多項(xiàng)式階數(shù)為2時(shí),光譜中的噪聲得到了較好的抑制,同時(shí)較好地保留了光譜的特征信息,能夠更清晰地展現(xiàn)蘿卜硫苷在近紅外光譜中的特征吸收峰,為后續(xù)的分析提供了更可靠的基礎(chǔ)?;€校正用于消除光譜中的基線漂移,使光譜的基線更加平穩(wěn),避免基線漂移對光譜分析產(chǎn)生干擾。本研究采用多項(xiàng)式擬合的基線校正方法,通過選擇光譜中的非峰區(qū)域數(shù)據(jù)點(diǎn),擬合一個(gè)多項(xiàng)式來代表基線,然后將原始光譜減去擬合的基線,得到校正后的光譜。在多項(xiàng)式擬合過程中,對多項(xiàng)式的階數(shù)進(jìn)行了優(yōu)化。當(dāng)多項(xiàng)式階數(shù)為3時(shí),能夠準(zhǔn)確地?cái)M合基線,有效地消除基線漂移,使光譜中與蘿卜硫苷相關(guān)的特征峰更加突出,提高了光譜的分析精度。導(dǎo)數(shù)處理能夠增強(qiáng)光譜中微弱的特征,分離重疊峰,并消除基線漂移的影響。本研究對預(yù)處理后的光譜數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)處理,通過計(jì)算光譜的一階導(dǎo)數(shù),突出了光譜的變化率,使原本難以區(qū)分的微弱特征峰變得更加明顯,同時(shí)有效消除了基線漂移的影響。在進(jìn)行一階導(dǎo)數(shù)處理時(shí),采用了中心差分法,該方法能夠更準(zhǔn)確地計(jì)算光譜的導(dǎo)數(shù),提高了光譜的分辨率。將經(jīng)過不同預(yù)處理方法處理后的光譜數(shù)據(jù)與原始光譜數(shù)據(jù)進(jìn)行對比分析。在對比過程中,從多個(gè)角度進(jìn)行評估,包括光譜的平滑度、基線的穩(wěn)定性、特征峰的清晰度等。從平滑度方面來看,經(jīng)過Savitzky-Golay平滑處理后的光譜曲線明顯比原始光譜更加平滑,噪聲干擾得到了有效抑制;在基線穩(wěn)定性方面,經(jīng)過多項(xiàng)式擬合基線校正后的光譜基線更加平穩(wěn),消除了原始光譜中存在的基線漂移現(xiàn)象;在特征峰清晰度方面,經(jīng)過一階導(dǎo)數(shù)處理后的光譜,蘿卜硫苷的特征峰更加突出,與其他干擾峰的分離度更好。通過綜合對比不同預(yù)處理方法處理后的光譜數(shù)據(jù),發(fā)現(xiàn)經(jīng)過Savitzky-Golay平滑(窗口大小為7,多項(xiàng)式階數(shù)為2)、多項(xiàng)式擬合基線校正(多項(xiàng)式階數(shù)為3)和一階導(dǎo)數(shù)處理的組合方式,能夠最大程度地消除光譜中的噪聲和干擾,突出蘿卜硫苷的特征信息,提高光譜的質(zhì)量和穩(wěn)定性。因此,確定該組合方式為最優(yōu)的光譜預(yù)處理方式,用于后續(xù)的蘿卜硫苷組分近紅外定標(biāo)模型構(gòu)建,以確保模型能夠準(zhǔn)確地反映蘿卜硫苷含量與近紅外光譜之間的關(guān)系,提高模型的預(yù)測準(zhǔn)確性和可靠性。4.3定標(biāo)方法選擇4.3.1偏最小二乘回歸(PLS)偏最小二乘回歸(PLS)是一種在近紅外光譜定量分析中廣泛應(yīng)用的強(qiáng)大方法,尤其適用于處理復(fù)雜的多變量數(shù)據(jù),對于構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型具有重要意義。PLS的核心原理是同時(shí)對光譜數(shù)據(jù)矩陣(X)和化學(xué)值矩陣(Y)進(jìn)行分解,從而提取出對預(yù)測目標(biāo)最具貢獻(xiàn)的成分,進(jìn)而建立兩者之間精確的定量關(guān)系模型。在處理蘿卜硫苷近紅外光譜數(shù)據(jù)時(shí),光譜數(shù)據(jù)矩陣X包含了大量的波長變量,這些變量之間可能存在復(fù)雜的相關(guān)性和多重共線性,傳統(tǒng)的回歸方法難以有效處理。而PLS通過將X和Y矩陣進(jìn)行主成分分解,能夠有效地提取出隱藏在數(shù)據(jù)中的關(guān)鍵信息,消除噪聲和冗余信息的干擾。在分解過程中,PLS會尋找一系列的潛變量,這些潛變量是原始變量的線性組合,它們不僅能夠最大程度地解釋光譜數(shù)據(jù)的變化,還與蘿卜硫苷的化學(xué)值高度相關(guān)。通過這種方式,PLS能夠建立起準(zhǔn)確反映蘿卜硫苷含量與近紅外光譜之間關(guān)系的模型。在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型時(shí),使用PLS方法的具體步驟如下:將經(jīng)過預(yù)處理后的近紅外光譜數(shù)據(jù)作為自變量矩陣X,對應(yīng)的蘿卜硫苷含量化學(xué)值作為因變量矩陣Y。利用UnscramblerX10.4軟件中的PLS算法,對X和Y矩陣進(jìn)行處理。在處理過程中,通過交叉驗(yàn)證的方式來確定模型的主成分個(gè)數(shù),這是模型構(gòu)建的關(guān)鍵步驟之一。交叉驗(yàn)證能夠有效地評估模型的泛化能力,避免模型過擬合或欠擬合。在每次交叉驗(yàn)證中,將樣本數(shù)據(jù)劃分為訓(xùn)練集和驗(yàn)證集,使用訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練,然后用驗(yàn)證集數(shù)據(jù)來評估模型的預(yù)測性能。通過不斷調(diào)整主成分個(gè)數(shù),觀察模型在驗(yàn)證集上的預(yù)測誤差,選擇使預(yù)測誤差最小的主成分個(gè)數(shù)作為最終模型的參數(shù)。經(jīng)過多次試驗(yàn)和優(yōu)化,確定當(dāng)主成分個(gè)數(shù)為[具體主成分個(gè)數(shù)]時(shí),模型在訓(xùn)練集和驗(yàn)證集上都展現(xiàn)出了出色的預(yù)測性能。模型的相關(guān)系數(shù)(R2)達(dá)到了[具體R2值],接近1,表明模型的擬合效果非常好,能夠很好地解釋蘿卜硫苷含量與近紅外光譜之間的關(guān)系。均方根誤差(RMSE)為[具體RMSE值],數(shù)值較小,說明模型的預(yù)測準(zhǔn)確性高,預(yù)測值與實(shí)際值之間的偏差較小。通過實(shí)際預(yù)測效果來看,對于一組未知蘿卜硫苷含量的西蘭花樣品,使用該P(yáng)LS模型進(jìn)行預(yù)測,預(yù)測結(jié)果與采用高效液相色譜法測定的實(shí)際值之間的相對誤差在[具體誤差范圍]內(nèi),這進(jìn)一步證明了模型的可靠性和準(zhǔn)確性。4.3.2主成分回歸(PCR)主成分回歸(PCR)是另一種用于近紅外光譜定量分析的重要方法,在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型中也具有一定的應(yīng)用價(jià)值,了解其原理并與PLS進(jìn)行對比,有助于選擇最優(yōu)的建模方法。PCR方法的基本原理是首先對光譜數(shù)據(jù)進(jìn)行主成分分析(PCA)。PCA是一種數(shù)據(jù)降維技術(shù),其核心思想是通過對光譜數(shù)據(jù)矩陣進(jìn)行特征分解,找到數(shù)據(jù)中最大方差的方向,將原始數(shù)據(jù)投影到這些方向上,從而得到主成分得分矩陣。在這個(gè)過程中,主成分之間相互正交,且按照方差大小排序,前幾個(gè)主成分能夠包含光譜數(shù)據(jù)中的大部分信息。在對蘿卜硫苷的近紅外光譜數(shù)據(jù)進(jìn)行PCA分析時(shí),可能前3-5個(gè)主成分就能夠解釋90%以上的光譜方差。得到主成分得分矩陣后,以主成分得分作為自變量,蘿卜硫苷的化學(xué)值作為因變量,建立線性回歸模型。通過這種方式,PCR能夠?qū)⒏呔S的光譜數(shù)據(jù)轉(zhuǎn)換為低維的主成分?jǐn)?shù)據(jù),減少數(shù)據(jù)維度,降低噪聲和干擾的影響,從而建立起蘿卜硫苷含量與主成分之間的定量關(guān)系。在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型時(shí),運(yùn)用PCR方法進(jìn)行建模。同樣將預(yù)處理后的近紅外光譜數(shù)據(jù)進(jìn)行PCA分析,提取主成分。通過試驗(yàn)確定保留[具體主成分個(gè)數(shù)]個(gè)主成分,然后以這些主成分作為自變量,蘿卜硫苷含量化學(xué)值作為因變量,使用最小二乘法建立線性回歸模型。模型建立后,對其性能進(jìn)行評估,模型的相關(guān)系數(shù)(R2)為[具體R2值],均方根誤差(RMSE)為[具體RMSE值]。將PCR與PLS在建模中的表現(xiàn)進(jìn)行對比,從模型的準(zhǔn)確性來看,PLS模型的R2值通常比PCR模型更高,RMSE值更低,這表明PLS模型在擬合蘿卜硫苷含量與近紅外光譜關(guān)系方面更加準(zhǔn)確,能夠更好地預(yù)測未知樣品中蘿卜硫苷的含量。這是因?yàn)镻LS在提取主成分時(shí),同時(shí)考慮了光譜數(shù)據(jù)和化學(xué)值的信息,使得提取的主成分與蘿卜硫苷含量的相關(guān)性更強(qiáng)。而PCR在進(jìn)行PCA時(shí),只關(guān)注了光譜數(shù)據(jù)的方差信息,沒有直接考慮光譜與化學(xué)值之間的相關(guān)性,導(dǎo)致建立的模型在預(yù)測能力上相對較弱。從模型的穩(wěn)定性來看,PLS模型也表現(xiàn)得更為出色。在面對不同批次的樣品或不同的實(shí)驗(yàn)條件時(shí),PLS模型的預(yù)測結(jié)果更加穩(wěn)定,波動(dòng)較小,而PCR模型的預(yù)測結(jié)果可能會出現(xiàn)較大的波動(dòng),穩(wěn)定性較差。這是由于PLS模型能夠更好地捕捉到數(shù)據(jù)中的關(guān)鍵信息,對數(shù)據(jù)的變化具有更強(qiáng)的適應(yīng)性。從模型的復(fù)雜性來看,PCR模型相對簡單,計(jì)算速度較快,因?yàn)樗恍枰M(jìn)行PCA和簡單的線性回歸。而PLS模型的計(jì)算過程相對復(fù)雜,需要同時(shí)考慮光譜數(shù)據(jù)和化學(xué)值的信息,計(jì)算量較大。但隨著計(jì)算機(jī)技術(shù)的發(fā)展,計(jì)算速度已不再是限制PLS應(yīng)用的主要因素。綜合考慮,在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型時(shí),PLS方法在準(zhǔn)確性和穩(wěn)定性方面具有明顯優(yōu)勢,更適合用于建立高精度的定標(biāo)模型。4.4模型參數(shù)優(yōu)化4.4.1波段選擇在構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型時(shí),波段選擇是提高模型精度的關(guān)鍵環(huán)節(jié)。蘿卜硫苷分子中的含氫基團(tuán)在近紅外光譜區(qū)具有特定的吸收特征,但原始光譜中包含大量信息,其中部分信息與蘿卜硫苷含量的相關(guān)性較弱,甚至可能引入噪聲干擾,影響模型的準(zhǔn)確性和穩(wěn)定性。通過變量篩選方法選擇對蘿卜硫苷含量敏感的波段,能夠有效減少數(shù)據(jù)維度,突出關(guān)鍵信息,提高模型性能。本研究采用了競爭性自適應(yīng)重加權(quán)采樣(CARS)算法進(jìn)行波段選擇。CARS算法基于蒙特卡羅采樣技術(shù),通過對原始變量進(jìn)行重加權(quán),自適應(yīng)地篩選出與目標(biāo)變量相關(guān)性較強(qiáng)的變量。在運(yùn)用CARS算法時(shí),以蘿卜硫苷含量作為目標(biāo)變量,近紅外光譜數(shù)據(jù)作為自變量。首先,進(jìn)行多次蒙特卡羅采樣,每次采樣后計(jì)算每個(gè)波段的權(quán)重,權(quán)重越大表示該波段與蘿卜硫苷含量的相關(guān)性越強(qiáng)。通過不斷迭代,逐漸剔除權(quán)重較小的波段,保留與蘿卜硫苷含量密切相關(guān)的波段。經(jīng)過CARS算法處理后,從原始的近紅外光譜中篩選出了[具體數(shù)量]個(gè)關(guān)鍵波段。為了驗(yàn)證波段選擇的效果,將篩選后的波段數(shù)據(jù)用于構(gòu)建偏最小二乘(PLS)模型,并與使用全波段數(shù)據(jù)構(gòu)建的PLS模型進(jìn)行對比。從模型的準(zhǔn)確性來看,使用篩選波段構(gòu)建的PLS模型的相關(guān)系數(shù)(R2)從全波段模型的[全波段R2值]提高到了[篩選波段R2值],更接近1,表明模型對蘿卜硫苷含量與近紅外光譜關(guān)系的擬合效果更好,能夠更準(zhǔn)確地預(yù)測蘿卜硫苷含量。均方根誤差(RMSE)從全波段模型的[全波段RMSE值]降低到了[篩選波段RMSE值],數(shù)值更小,說明模型的預(yù)測誤差更小,預(yù)測精度更高。從模型的穩(wěn)定性來看,使用篩選波段構(gòu)建的模型在不同批次的樣品預(yù)測中,預(yù)測結(jié)果的波動(dòng)更小,穩(wěn)定性更好。這是因?yàn)楹Y選后的波段去除了與蘿卜硫苷含量無關(guān)的噪聲信息,使模型對蘿卜硫苷含量的變化更加敏感,能夠更穩(wěn)定地反映蘿卜硫苷含量與近紅外光譜之間的關(guān)系。通過CARS算法選擇對蘿卜硫苷含量敏感的波段,能夠顯著提高模型的精度和穩(wěn)定性,為準(zhǔn)確測定蘿卜硫苷含量提供了更可靠的模型。4.4.2主成分?jǐn)?shù)確定主成分?jǐn)?shù)的確定對蘿卜硫苷組分近紅外定標(biāo)模型的性能有著至關(guān)重要的影響。主成分分析(PCA)是一種常用的數(shù)據(jù)降維技術(shù),在近紅外光譜分析中,通過PCA可以將高維的光譜數(shù)據(jù)轉(zhuǎn)換為低維的主成分得分,這些主成分包含了原始光譜數(shù)據(jù)的主要信息。在構(gòu)建偏最小二乘(PLS)模型時(shí),主成分?jǐn)?shù)的選擇直接關(guān)系到模型對數(shù)據(jù)的擬合能力和泛化能力。本研究深入分析了主成分?jǐn)?shù)對模型性能的影響。從1開始逐步增加主成分?jǐn)?shù),分別構(gòu)建相應(yīng)的PLS模型,并通過交叉驗(yàn)證的方法評估模型的性能。當(dāng)主成分?jǐn)?shù)較少時(shí),模型可能無法充分捕捉到蘿卜硫苷含量與近紅外光譜之間的復(fù)雜關(guān)系,導(dǎo)致模型欠擬合。在主成分?jǐn)?shù)為2時(shí),模型對訓(xùn)練集數(shù)據(jù)的擬合效果較差,相關(guān)系數(shù)(R2)較低,僅為[具體R2值1],均方根誤差(RMSE)較大,為[具體RMSE值1],對未知樣品的預(yù)測準(zhǔn)確性也較低。隨著主成分?jǐn)?shù)的增加,模型能夠提取更多的光譜信息,對數(shù)據(jù)的擬合能力逐漸增強(qiáng)。當(dāng)主成分?jǐn)?shù)增加到[具體主成分?jǐn)?shù)1]時(shí),模型的R2提高到了[具體R2值2],RMSE降低到了[具體RMSE值2],模型的預(yù)測性能得到了明顯提升。當(dāng)主成分?jǐn)?shù)繼續(xù)增加時(shí),雖然模型對訓(xùn)練集數(shù)據(jù)的擬合效果進(jìn)一步提高,但也可能引入過多的噪聲和無關(guān)信息,導(dǎo)致模型過擬合。在主成分?jǐn)?shù)為[具體主成分?jǐn)?shù)2]時(shí),模型在訓(xùn)練集上的R2達(dá)到了很高的值,如[具體R2值3],但在驗(yàn)證集上的R2卻出現(xiàn)了下降,為[具體R2值4],RMSE反而增大,為[具體RMSE值3],說明模型在未知樣品上的預(yù)測能力下降,出現(xiàn)了過擬合現(xiàn)象。綜合考慮模型在訓(xùn)練集和驗(yàn)證集上的表現(xiàn),確定最佳主成分?jǐn)?shù)為[最終確定的主成分?jǐn)?shù)]。在該主成分?jǐn)?shù)下,模型在訓(xùn)練集和驗(yàn)證集上都具有較好的預(yù)測性能,R2達(dá)到了[具體R2值5],接近1,RMSE為[具體RMSE值4],數(shù)值較小,表明模型能夠準(zhǔn)確地預(yù)測蘿卜硫苷含量,同時(shí)具有良好的泛化能力,能夠適應(yīng)不同樣品的檢測需求。通過合理確定主成分?jǐn)?shù),優(yōu)化了蘿卜硫苷組分近紅外定標(biāo)模型的性能,為實(shí)際應(yīng)用提供了更可靠的模型支持。4.5模型評價(jià)4.5.1評價(jià)指標(biāo)為了全面、準(zhǔn)確地評估蘿卜硫苷組分近紅外定標(biāo)模型的性能,本研究選用了校正標(biāo)準(zhǔn)差(SEC)、驗(yàn)證標(biāo)準(zhǔn)差(SEP)、相關(guān)系數(shù)(R)等作為主要評價(jià)指標(biāo)。校正標(biāo)準(zhǔn)差(SEC)用于衡量模型在校正集上的預(yù)測誤差,其計(jì)算公式為:SEC=\sqrt{\frac{\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^{2}}{n-1}}其中,y_{i}是校正集中第i個(gè)樣品蘿卜硫苷含量的真實(shí)值,\hat{y}_{i}是模型對第i個(gè)樣品蘿卜硫苷含量的預(yù)測值,n是校正集樣品的數(shù)量。SEC值越小,表明模型對校正集數(shù)據(jù)的擬合效果越好,模型能夠準(zhǔn)確地描述蘿卜硫苷含量與近紅外光譜之間的關(guān)系。當(dāng)SEC值趨近于0時(shí),說明模型的預(yù)測值與真實(shí)值幾乎完全一致,模型的準(zhǔn)確性極高。驗(yàn)證標(biāo)準(zhǔn)差(SEP)用于評估模型在驗(yàn)證集上的預(yù)測誤差,其計(jì)算公式與SEC類似:SEP=\sqrt{\frac{\sum_{j=1}^{m}(y_{j}-\hat{y}_{j})^{2}}{m-1}}這里,y_{j}是驗(yàn)證集中第j個(gè)樣品蘿卜硫苷含量的真實(shí)值,\hat{y}_{j}是模型對第j個(gè)樣品蘿卜硫苷含量的預(yù)測值,m是驗(yàn)證集樣品的數(shù)量。SEP值反映了模型對未知樣品的預(yù)測能力,SEP值越小,模型的預(yù)測準(zhǔn)確性越高,能夠更可靠地預(yù)測實(shí)際樣品中蘿卜硫苷的含量。相關(guān)系數(shù)(R)用于衡量模型預(yù)測值與真實(shí)值之間的線性相關(guān)性,其取值范圍在-1到1之間。計(jì)算公式為:R=\frac{\sum_{i=1}^{n}(y_{i}-\bar{y})(\hat{y}_{i}-\bar{\hat{y}})}{\sqrt{\sum_{i=1}^{n}(y_{i}-\bar{y})^{2}\sum_{i=1}^{n}(\hat{y}_{i}-\bar{\hat{y}})^{2}}}其中,\bar{y}是校正集中蘿卜硫苷含量真實(shí)值的平均值,\bar{\hat{y}}是校正集中蘿卜硫苷含量預(yù)測值的平均值。R值越接近1,表明模型預(yù)測值與真實(shí)值之間的線性相關(guān)性越強(qiáng),模型的預(yù)測效果越好。當(dāng)R=1時(shí),說明模型的預(yù)測值與真實(shí)值完全線性相關(guān),模型能夠準(zhǔn)確地預(yù)測蘿卜硫苷的含量。若R值接近-1,則表示兩者呈負(fù)相關(guān),模型的預(yù)測效果較差;R值接近0時(shí),說明兩者之間幾乎不存在線性關(guān)系,模型無法有效預(yù)測蘿卜硫苷含量。這些評價(jià)指標(biāo)從不同角度對模型性能進(jìn)行了評估,SEC和SEP主要反映模型的預(yù)測誤差,而R則側(cè)重于衡量模型預(yù)測值與真實(shí)值之間的相關(guān)性。通過綜合分析這些指標(biāo),可以全面、準(zhǔn)確地評價(jià)蘿卜硫苷組分近紅外定標(biāo)模型的性能,為模型的優(yōu)化和應(yīng)用提供有力的依據(jù)。4.5.2模型驗(yàn)證使用外部驗(yàn)證集對構(gòu)建的蘿卜硫苷組分近紅外定標(biāo)模型進(jìn)行驗(yàn)證,是評估模型準(zhǔn)確性和可靠性的關(guān)鍵步驟。外部驗(yàn)證集由未參與模型構(gòu)建的獨(dú)立樣品組成,其蘿卜硫苷含量通過高效液相色譜法(HPLC)準(zhǔn)確測定,作為真實(shí)值。將外部驗(yàn)證集樣品的近紅外光譜數(shù)據(jù)輸入到構(gòu)建好的模型中,模型輸出預(yù)測的蘿卜硫苷含量。將預(yù)測值與通過HPLC測定的真實(shí)值進(jìn)行對比,計(jì)算預(yù)測值與真實(shí)值之間的偏差,以此評估模型的預(yù)測能力和可靠性。計(jì)算預(yù)測值與真實(shí)值之間的絕對誤差和相對誤差。絕對誤差是預(yù)測值與真實(shí)值之差的絕對值,反映了預(yù)測值與真實(shí)值之間的實(shí)際偏差大小。相對誤差則是絕對誤差與真實(shí)值的比值,以百分?jǐn)?shù)表示,它更直觀地反映了預(yù)測值相對于真實(shí)值的偏離程度。對外部驗(yàn)證集進(jìn)行驗(yàn)證后,得到模型的預(yù)測結(jié)果與真實(shí)值之間的絕對誤差范圍為[具體絕對誤差范圍],相對誤差范圍為[具體相對誤差范圍]。大部分樣品的相對誤差在[X]%以內(nèi),這表明模型在外部驗(yàn)證集上具有較高的預(yù)測準(zhǔn)確性,能夠較為準(zhǔn)確地預(yù)測蘿卜硫苷的含量。通過繪制預(yù)測值與真實(shí)值的散點(diǎn)圖,可以更直觀地評估模型的性能。在散點(diǎn)圖中,理想情況下,所有的點(diǎn)應(yīng)該分布在一條斜率為1的直線上,即預(yù)測值與真實(shí)值完全相等。實(shí)際的散點(diǎn)圖中,雖然部分點(diǎn)存在一定的離散性,但整體上點(diǎn)的分布較為集中在直線附近,說明模型的預(yù)測值與真實(shí)值具有較好的一致性。本研究構(gòu)建的蘿卜硫苷組分近紅外定標(biāo)模型在外部驗(yàn)證集上表現(xiàn)出了良好的預(yù)測能力和可靠性,能夠滿足實(shí)際應(yīng)用中對蘿卜硫苷含量快速、準(zhǔn)確檢測的需求。在未來的實(shí)際應(yīng)用中,還需進(jìn)一步對模型進(jìn)行監(jiān)測和評估,不斷優(yōu)化模型,以確保其在不同條件下都能保持良好的性能。五、結(jié)果與討論5.1蘿卜硫苷組分近紅外光譜特征對西蘭花樣品進(jìn)行近紅外光譜采集后,得到的原始光譜如圖[具體圖號]所示。從光譜圖中可以看出,在整個(gè)掃描范圍4000-12500cm?1內(nèi),光譜呈現(xiàn)出復(fù)雜的吸收特征。在7000-7500cm?1波段,出現(xiàn)了一個(gè)較為明顯的吸收峰,這主要是由于蘿卜硫苷分子中O-H基團(tuán)的一階倍頻吸收所致。蘿卜硫苷分子中的羥基(-OH)在該波段與近紅外光相互作用,吸收特定波長的光,從而形成吸收峰。在10000-10500cm?1波段,也存在明顯的吸收峰,這是C-H基團(tuán)的二階倍頻吸收引起的。蘿卜硫苷分子中的碳?xì)洌–-H)結(jié)構(gòu)在該波段對近紅外光產(chǎn)生吸收,形成相應(yīng)的吸收峰。通過對不同蘿卜硫苷含量的西蘭花樣品光譜進(jìn)行對比分析發(fā)現(xiàn),隨著蘿卜硫苷含量的增加,這些特征吸收峰的強(qiáng)度呈現(xiàn)出逐漸增強(qiáng)的趨勢。當(dāng)蘿卜硫苷含量從[具體含量1]增加到[具體含量2]時(shí),7000-7500cm?1波段吸收峰的吸光度從[具體吸光度1]增加到[具體吸光度2],10000-10500cm?1波段吸收峰的吸光度從[具體吸光度3]增加到[具體吸光度4]。這表明蘿卜硫苷含量與近紅外光譜特征吸收峰強(qiáng)度之間存在密切的相關(guān)性,為后續(xù)構(gòu)建蘿卜硫苷組分近紅外定標(biāo)模型提供了重要的依據(jù)。在構(gòu)建模型時(shí),可以利用這些特征吸收峰的強(qiáng)度變化來反映蘿卜硫苷含量的變化,從而實(shí)現(xiàn)對蘿卜硫苷含量的準(zhǔn)確預(yù)測。通過對光譜特征的深入分析,還可以發(fā)現(xiàn)一些與蘿卜硫苷含量相關(guān)性較弱的波段,在后續(xù)的數(shù)據(jù)處理中可以對這些波段進(jìn)行篩選和去除,以提高模型的準(zhǔn)確性和效率。5.2定標(biāo)模型性能比較對不同定標(biāo)方法和參數(shù)優(yōu)化后的模型性能進(jìn)行對比,結(jié)果如表[具體表號]所示。在定標(biāo)方法方面,偏最小二乘回歸(PLS)模型在各項(xiàng)指標(biāo)上表現(xiàn)優(yōu)于主成分回歸(PCR)模型。PLS模型的校正標(biāo)準(zhǔn)差(SEC)為[具體SEC值1],低于PCR模型的[具體SEC值2],表明PLS模型在校正集上的預(yù)測誤差更小,對數(shù)據(jù)的擬合效果更好。PLS模型的驗(yàn)證標(biāo)準(zhǔn)差(SEP)為[具體SEP值1],也低于PCR模型的[具體SEP值2],說明PLS模型在驗(yàn)證集上的預(yù)測準(zhǔn)確性更高,能夠更可靠地預(yù)測未知樣品中蘿卜硫苷的含量。從相關(guān)系數(shù)(R)來看,PLS模型的R值為[具體R值1],更接近1,表明PLS模型預(yù)測值與真實(shí)值之間的線性相關(guān)性更強(qiáng),模型的預(yù)測效果更優(yōu)。在參數(shù)優(yōu)化方面,經(jīng)過波段選擇和主成分?jǐn)?shù)優(yōu)化后的模型性能明顯提升。在未進(jìn)行波段選擇時(shí),模型的SEC為[具體SEC值3],SEP為[具體SEP值3],R值為[具體R值2]。采用競爭性自適應(yīng)重加權(quán)采樣(CARS)算法進(jìn)行波段選擇后,模型的SEC降低至[具體SEC值4],SEP降低至[具體SEP值4],R值提高至[具體R值3]。這表明波段選擇有效地去除了與蘿卜硫苷含量無關(guān)的噪聲信息,突出了關(guān)鍵波段,提高了模型的準(zhǔn)確性和穩(wěn)定性。主成分?jǐn)?shù)優(yōu)化也對模型性能產(chǎn)生了顯著影響。在主成分?jǐn)?shù)為[具體主成分?jǐn)?shù)3]時(shí),模型的SEC為[具體SEC值5],SEP為[具體SEP值5],R值為[具體R值4]。通過逐步分析主成分?jǐn)?shù)對模型性能的影響,確定最佳主成分?jǐn)?shù)為[具體主成分?jǐn)?shù)4]后,模型的SEC降低至[具體SEC值6],SEP降低至[具體SEP值6],R值提高至[具體R值5]。這說明合理確定主成分?jǐn)?shù)能夠使模型更好地捕捉到蘿卜硫苷含量與近紅外光譜之間的關(guān)系,避免過擬合或欠擬合現(xiàn)象,提高模型的泛化能力。綜合比較不同定標(biāo)方法和參數(shù)優(yōu)化后的模型性能,最終選擇采用偏最小二乘回歸(PLS)方法,結(jié)合競爭性自適應(yīng)重加權(quán)采樣(CARS)算法進(jìn)行波段選擇,并將主成分?jǐn)?shù)確定為[具體主成分?jǐn)?shù)4]的模型作為最優(yōu)模型。該模型在準(zhǔn)確性、穩(wěn)定性和泛化能力等方面表現(xiàn)出色,能夠滿足實(shí)際應(yīng)用中對蘿卜硫苷含量快速、準(zhǔn)確檢測的需求。5.3影響模型精度的因素樣品特性對蘿卜硫苷組分近紅外定標(biāo)模型的精度有著顯著影響。樣品的均勻性是一個(gè)關(guān)鍵因素,若樣品在成分分布、顆粒大小等方面不均勻,會導(dǎo)致光譜采集的代表性不足。在西蘭花樣品中,若部分區(qū)域蘿卜硫苷含量較高,而部分區(qū)域較低,在采集光譜時(shí),若未能充分覆蓋這些差異區(qū)域,得到的光譜就無法準(zhǔn)確反映樣品整體的蘿卜硫苷含量,從而影響模型的準(zhǔn)確性。樣品的含水量也會對模型精度產(chǎn)生影響。水分在近紅外光譜區(qū)有較強(qiáng)的吸收,會干擾蘿卜硫苷的光譜信號。當(dāng)西蘭花樣品含水量過高時(shí),水分的吸收峰會掩蓋蘿卜硫苷的特征吸收峰,導(dǎo)致模型難以準(zhǔn)確識別和定量分析蘿卜硫苷含量。光譜采集條件是影響模型精度的重要因素之一。掃描范圍的選擇直接關(guān)系到能否全面獲取蘿卜硫苷的特征光譜信息。若掃描范圍過窄,可能會遺漏一些與蘿卜硫苷含量密切相關(guān)的光譜區(qū)域,導(dǎo)致模型無法準(zhǔn)確反映蘿卜硫苷含量與光譜之間的關(guān)系。若掃描范圍設(shè)置為4000-10000cm?1,可能會遺漏10000-12500cm?1波段中C-H基團(tuán)二階倍頻吸收的關(guān)鍵信息,影響模型對蘿卜硫苷含量的預(yù)測準(zhǔn)確性。掃描次數(shù)也會影響光譜的質(zhì)量和模型精度。掃描次數(shù)過少,光譜的信噪比低,噪聲干擾大,會使光譜數(shù)據(jù)的可靠性降低,進(jìn)而影響模型的準(zhǔn)確性。而掃描次數(shù)過多,雖然可以提高光譜的信噪比,但會增加分析時(shí)間和成本,在實(shí)際應(yīng)用中需要綜合考慮。當(dāng)掃描次數(shù)為16次時(shí),光譜中的噪聲相對較大,模型的預(yù)測誤差也較大;當(dāng)掃描次數(shù)增加到32次時(shí),光譜的信噪比明顯提高,模型的預(yù)測精度也得到了提升?;瘜W(xué)計(jì)量學(xué)方法的選擇和應(yīng)用對模型精度起著決定性作用。不同的光譜預(yù)處理方法對光譜的處理效果不同,會影響模型對蘿卜硫苷含量的預(yù)測能力。在光譜預(yù)處理中,若采用的平滑算法窗口大小和多項(xiàng)式階
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025貴州中醫(yī)藥大學(xué)輔導(dǎo)員考試試題及答案
- 2025秦皇島職業(yè)技術(shù)學(xué)院輔導(dǎo)員考試試題及答案
- 2025蚌埠醫(yī)學(xué)院輔導(dǎo)員考試試題及答案
- 居住空間衛(wèi)生間設(shè)計(jì)要點(diǎn)
- 常見眼底疾病診療概述
- 安順市平壩區(qū)美農(nóng)科技有限公司招聘筆試題庫2025
- 審計(jì)師職稱考試試題及答案2025年
- 公共關(guān)系與溝通技巧2025年考試試卷及答案
- 2025年文化產(chǎn)業(yè)管理師考試模擬試卷及答案
- 2025年移動(dòng)互聯(lián)網(wǎng)與應(yīng)用開發(fā)基礎(chǔ)知識測試試卷及答案
- 企業(yè)組織架構(gòu)表
- 氣象檢測器實(shí)測項(xiàng)目質(zhì)量檢驗(yàn)報(bào)告單
- 重癥胰腺炎(1)課件
- 科學(xué)素養(yǎng)全稿ppt課件(完整版)
- 克拉潑改進(jìn)型電容三點(diǎn)式振蕩器
- 介入導(dǎo)管室耗材準(zhǔn)備及管理
- SPC基礎(chǔ)知識培訓(xùn)教材-入門級_課件
- 計(jì)量經(jīng)濟(jì)學(xué)課程論文——論產(chǎn)業(yè)結(jié)構(gòu)對我國GDP與經(jīng)濟(jì)增長的影響
- 轉(zhuǎn)動(dòng)設(shè)備狀態(tài)監(jiān)測標(biāo)準(zhǔn)
- 美術(shù)作品使用授權(quán)書.docx
- 金屬軋制工藝學(xué)1軋制過程基本參數(shù)
評論
0/150
提交評論