下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于深度學(xué)習(xí)技術(shù)的湖北釘螺視覺(jué)識(shí)別模型的建立及訓(xùn)練策略評(píng)價(jià)
近年來(lái),人工智能(deepedge)和機(jī)械學(xué)習(xí)(machinery)技術(shù)發(fā)展迅速,提高了計(jì)算機(jī)視覺(jué)識(shí)別的精度。湖北釘螺(Oncomelaniahupensis,以下簡(jiǎn)稱(chēng)“釘螺”)是日本血吸蟲(chóng)的唯一中間宿主,控制釘螺是阻斷血吸蟲(chóng)病傳播的重要措施之一本研究采用深度學(xué)習(xí)技術(shù)建立釘螺視覺(jué)智能識(shí)別模型,并應(yīng)用于現(xiàn)場(chǎng)釘螺圖像識(shí)別,采用“數(shù)據(jù)增強(qiáng)+遷移學(xué)習(xí)”優(yōu)化的訓(xùn)練策略提高圖像識(shí)別準(zhǔn)確性,從而為精準(zhǔn)和智能化釘螺調(diào)查提供一種新技術(shù)。內(nèi)容和方法1螺類(lèi)圖像標(biāo)注目前國(guó)內(nèi)缺少標(biāo)準(zhǔn)可靠的釘螺及相似螺類(lèi)圖像數(shù)據(jù)集,為保證數(shù)據(jù)代表性和多樣性,本研究通過(guò)現(xiàn)場(chǎng)采集和互聯(lián)網(wǎng)抓取等方式建立數(shù)據(jù)集?,F(xiàn)場(chǎng)采集以江蘇省作為研究現(xiàn)場(chǎng),根據(jù)釘螺分布規(guī)律標(biāo)準(zhǔn)數(shù)據(jù)集標(biāo)注由多位血吸蟲(chóng)病防治領(lǐng)域?qū)<彝瓿?。根?jù)螺殼長(zhǎng)度、縱肋、旋向、殼色、殼口、唇脊和厴等形態(tài)特征鑒定螺種是“釘螺”還是“非釘螺”,隨后將鑒定結(jié)果對(duì)照真實(shí)樣本編號(hào)進(jìn)行復(fù)核。為確保數(shù)據(jù)標(biāo)簽的有效性和準(zhǔn)確性,對(duì)采集到的圖像數(shù)據(jù)進(jìn)行嚴(yán)格篩選,對(duì)篩選后的圖像利用開(kāi)源圖像標(biāo)注軟件labelImg(/tzutalin/labelImg)進(jìn)行標(biāo)注(表1),累計(jì)標(biāo)注螺類(lèi)圖像2614幅。將標(biāo)注后的螺類(lèi)圖像通過(guò)邊緣填充圖像處理方法調(diào)整為正方形,通過(guò)大小縮放將圖像分辨率統(tǒng)一調(diào)整為500像素×500像素。本研究將釘螺數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集兩部分,其中訓(xùn)練集用于對(duì)模型權(quán)重進(jìn)行迭代更新,達(dá)到最優(yōu)識(shí)別效果;測(cè)試集用于從訓(xùn)練集中優(yōu)選模型獲得實(shí)際測(cè)試運(yùn)行的模擬效果。2方法2.1alneulalp4算法卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,CNN)作為深度學(xué)習(xí)技術(shù)的重要分支發(fā)展迅速式中,m為輸入的螺類(lèi)圖像數(shù),1(y2.2基于遷移學(xué)習(xí)的釘螺圖像數(shù)據(jù)集模型訓(xùn)練策略?xún)?yōu)化采用“數(shù)據(jù)增強(qiáng)+遷移學(xué)習(xí)”。數(shù)據(jù)增強(qiáng)通過(guò)給每一個(gè)圖像增加多個(gè)副本,進(jìn)而大幅度增加訓(xùn)練樣本量。本研究采用水平鏡像、垂直翻轉(zhuǎn)、隨機(jī)裁剪、隨機(jī)亮度調(diào)節(jié)、隨機(jī)對(duì)比度調(diào)節(jié)、隨機(jī)旋轉(zhuǎn)、隨機(jī)放大、隨機(jī)變形、隨機(jī)遮擋等增強(qiáng)方式擴(kuò)增數(shù)據(jù)集。遷移學(xué)習(xí)是將一個(gè)任務(wù)上預(yù)訓(xùn)練好的CNN模型通過(guò)參數(shù)調(diào)整使其適用于一個(gè)新任務(wù)(圖1),主要步驟:(1)利用在ImageNet大型圖像數(shù)據(jù)集上預(yù)訓(xùn)練Inception-ResNet-V2模型,采用遷移學(xué)習(xí)訓(xùn)練策略,將預(yù)訓(xùn)練模型卷積模塊學(xué)習(xí)到的圖像底層特征遷移到釘螺視覺(jué)智能識(shí)別模型的任務(wù)中作為初始化參數(shù);(2)將提取到的特征圖作為輸入對(duì)智能識(shí)別模型進(jìn)行訓(xùn)練,并且將預(yù)訓(xùn)練網(wǎng)絡(luò)最后一層全連接層的輸出替換為本研究釘螺圖像數(shù)據(jù)集的類(lèi)別數(shù),即“是”和“非”2種類(lèi)別數(shù);(3)在已建立的螺類(lèi)圖像數(shù)據(jù)集上完成模型訓(xùn)練。2.3模型學(xué)習(xí)性能調(diào)整本研究采用TensorFlow-GPU1.15軟件為深度學(xué)習(xí)框架,Python3.5為編程語(yǔ)言,PyCharm2018.2.2(CommunityEdition)為集成開(kāi)發(fā)環(huán)境,初始學(xué)習(xí)率設(shè)置為0.001。后續(xù)過(guò)程對(duì)學(xué)習(xí)率采用等間隔調(diào)節(jié)策略,每10輪迭代后學(xué)習(xí)率調(diào)整為當(dāng)前學(xué)習(xí)率為1/10。優(yōu)化器參數(shù)用來(lái)更新和計(jì)算影響模型訓(xùn)練和模型輸出的網(wǎng)絡(luò)參數(shù),使其逼近或達(dá)到最優(yōu)值。本研究?jī)?yōu)化器采用自適應(yīng)矩估計(jì)(adaptivemomentestimation,Adam)算法2.4模型識(shí)別性能評(píng)估混淆矩陣(confusionmatrix)是機(jī)器學(xué)習(xí)模型評(píng)價(jià)中可視化表格,混淆矩陣的每一列代表了預(yù)測(cè)類(lèi)別,每一列總數(shù)表示預(yù)測(cè)為該類(lèi)別數(shù)據(jù)的數(shù)目;每一行代表了數(shù)據(jù)的真實(shí)歸屬類(lèi)別,每一行數(shù)據(jù)總數(shù)表示該類(lèi)別的數(shù)據(jù)實(shí)例的數(shù)目(表2)模型二分類(lèi)準(zhǔn)確性評(píng)價(jià)指標(biāo)有精確率(precision,P)、特異性(specificity,SP)、敏感性(sensitivity,SE)、F1值(F1score)、準(zhǔn)確率(accuracy,ACC)、約登指數(shù)(Youdenindex,γ)、受試者工作特征(ROC)曲線下面積(areaundertheROCcurve,AUC)評(píng)估模型性能。計(jì)算公式如下:精確率指預(yù)測(cè)為正類(lèi)的樣本中,實(shí)際為正類(lèi)的占比。計(jì)算公式:敏感性指實(shí)際為正類(lèi)的樣本中,正確預(yù)測(cè)為正類(lèi)的占比。計(jì)算公式:特異性指實(shí)際為負(fù)類(lèi)的樣本中,正確預(yù)測(cè)為負(fù)類(lèi)的占比。計(jì)算公式:F1值指模型精確率和敏感性的加權(quán)平均,該綜合評(píng)價(jià)指標(biāo)取值范圍0~1。計(jì)算公式:準(zhǔn)確率指所有樣本被正確預(yù)測(cè)的占比,它能夠綜合反映在識(shí)別能力研究中獲得釘螺和非釘螺的正確判斷的比例。計(jì)算公式:約登指數(shù)對(duì)敏感性及特異性賦予相同權(quán)重,與準(zhǔn)確率相比,在一定程度上糾正了釘螺與非釘螺構(gòu)成比例對(duì)綜合評(píng)價(jià)的影響。取值范圍0~1,其值越大表明模型避免漏檢和誤判的能力越強(qiáng)。計(jì)算公式:AUC被廣泛用于醫(yī)學(xué)與公共衛(wèi)生領(lǐng)域的模型評(píng)價(jià),AUC在90%以上時(shí)說(shuō)明判斷結(jié)果有較高準(zhǔn)確性,在70%~90%時(shí)有一定準(zhǔn)確性,50%~70%時(shí)有較低準(zhǔn)確性。2.5統(tǒng)計(jì)方法所有數(shù)據(jù)均采用SPSS26.0軟件進(jìn)行統(tǒng)計(jì)分析。繪制ROC曲線,采用χ結(jié)果1不同輪數(shù)時(shí)3組訓(xùn)練策略下結(jié)果隨著訓(xùn)練輪數(shù)增加,3組不同訓(xùn)練策略下的模型在訓(xùn)練集上的準(zhǔn)確率呈整體上升趨勢(shì)、損失值呈整體下降趨勢(shì)。其中在第3組訓(xùn)練策略下,模型初始第1輪訓(xùn)練時(shí)準(zhǔn)確率最高(31.54%)、損失值最?。?.95);隨著訓(xùn)練輪數(shù)增加,曲線收斂速度最快,曲線波動(dòng)最小。當(dāng)訓(xùn)練輪數(shù)到100時(shí),準(zhǔn)確率升高到平臺(tái)期,達(dá)98.17%;損失值降低到平臺(tái)期,達(dá)0.11。相比另外2組訓(xùn)練策略,第3組訓(xùn)練策略下的模型能夠很好擬合該數(shù)據(jù)集,泛化能力良好(圖2、3)。2在不同的培訓(xùn)策略下,研究了聚螺釘?shù)淖R(shí)別結(jié)果三種訓(xùn)練策略下,模型識(shí)別釘螺的敏感性(χ2=15.875,P<0.001)、特異性(χ釘螺視覺(jué)智能識(shí)別模型的構(gòu)建近年來(lái),隨著計(jì)算機(jī)數(shù)據(jù)處理能力的增強(qiáng),結(jié)合計(jì)算機(jī)視覺(jué)的機(jī)器學(xué)習(xí)技術(shù)逐漸被應(yīng)用于寄生蟲(chóng)病防治研究領(lǐng)域,并且取得一定成果本研究探索了基于深度學(xué)習(xí)技術(shù)構(gòu)建釘螺視覺(jué)智能識(shí)別模型,并將其應(yīng)用于現(xiàn)場(chǎng)釘螺樣本圖像識(shí)別。訓(xùn)練集結(jié)果顯示,隨著訓(xùn)練輪數(shù)增加,在“遷移學(xué)習(xí)+數(shù)據(jù)增強(qiáng)”訓(xùn)練策略下,模型在訓(xùn)練100輪后釘螺識(shí)別準(zhǔn)確率達(dá)到98.17%、損失值降到0.11,較好擬合了螺類(lèi)數(shù)據(jù)集,泛化能力優(yōu)于其他兩種訓(xùn)練策略。測(cè)試集結(jié)果顯示,模型識(shí)別釘螺精確率、敏感性、特異性均超過(guò)90%,準(zhǔn)確率、約登指數(shù)、F1值等綜合評(píng)價(jià)指標(biāo)也在90%左右,AUC為0.94,表明基于深度學(xué)習(xí)技術(shù)的釘螺視覺(jué)智能識(shí)別模型對(duì)釘螺和非釘螺的綜合識(shí)別能力較好。受時(shí)間和空間限制,現(xiàn)場(chǎng)釘螺及4種相似螺圖像的大量采集工作有一定難度。由于深度學(xué)習(xí)結(jié)構(gòu)復(fù)雜、參數(shù)眾多,且模型訓(xùn)練需要大規(guī)模數(shù)據(jù),這對(duì)模型的訓(xùn)練和應(yīng)用帶來(lái)了困難。近年來(lái),“遷移學(xué)習(xí)”已成為解決該問(wèn)題的有效學(xué)習(xí)范式,其可一定程度緩解對(duì)大規(guī)模數(shù)據(jù)標(biāo)注的依賴(lài)并大幅提高學(xué)習(xí)效果數(shù)據(jù)增強(qiáng)是克服由于訓(xùn)練過(guò)程中目標(biāo)樣本數(shù)據(jù)不足,導(dǎo)致深度學(xué)習(xí)方法陷入過(guò)擬合問(wèn)題的有效手段之一本研究尚存在一定局限性:(1)本研究釘螺樣本采集地區(qū)局限于江蘇省內(nèi),不能代表全國(guó)其他地區(qū)樣本圖像識(shí)別能力;(2)本研究建立了二分類(lèi)釘螺識(shí)別模型,僅能分類(lèi)識(shí)別“釘螺”或“非釘螺”,不能細(xì)分類(lèi)識(shí)別出是哪一類(lèi)釘螺亞種或哪一種非釘螺類(lèi)的相似螺。今后將進(jìn)一步擴(kuò)大釘螺及相似螺樣本采集范圍、進(jìn)一步優(yōu)化智能模型的細(xì)分類(lèi)識(shí)別能力,從而提高模型的應(yīng)用范圍綜上,本研究首次建立了基于深度學(xué)習(xí)技術(shù)的日本血吸蟲(chóng)中間宿主湖北釘螺視覺(jué)智能識(shí)別模型,通過(guò)對(duì)螺類(lèi)數(shù)據(jù)集的多次訓(xùn)練和測(cè)試,實(shí)現(xiàn)了對(duì)釘螺圖像的準(zhǔn)確識(shí)別。通過(guò)“數(shù)據(jù)增強(qiáng)+遷移學(xué)習(xí)”優(yōu)化的訓(xùn)練策略提高了模型識(shí)別釘螺的準(zhǔn)確性,為釘螺調(diào)查新技術(shù)和新方法研究提供新思路,而構(gòu)建的螺類(lèi)圖像分類(lèi)數(shù)據(jù)集亦為后續(xù)研究其他寄生蟲(chóng)宿主螺類(lèi)識(shí)別提供了數(shù)據(jù)基礎(chǔ)。Softmax分類(lèi)器是輸出層的基礎(chǔ),利用螺類(lèi)特征圖中的特征預(yù)測(cè)圖片屬于某種螺類(lèi)的概率。該分類(lèi)器在多分類(lèi)過(guò)程中使用,多個(gè)神經(jīng)細(xì)胞的輸出映射到(0,1)區(qū)間,形成一個(gè)概率。在全連接層輸入的特征矩陣接收到后,其輸出為輸入所對(duì)應(yīng)的每個(gè)類(lèi)別上的概率。通過(guò)這一過(guò)程
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 國(guó)內(nèi)擔(dān)保貸款合同示范
- 企業(yè)承包經(jīng)營(yíng)合同的環(huán)保要求
- 2024公眾號(hào)搭建合同
- 2024融資服務(wù)合同范文
- 集體土地上房屋拆遷補(bǔ)償標(biāo)準(zhǔn)
- 2024終止合同協(xié)議書(shū)
- 2024水馬購(gòu)買(mǎi)協(xié)議合同
- 建筑項(xiàng)目施工管理協(xié)議書(shū)
- 2024年企業(yè)知識(shí)產(chǎn)權(quán)歸屬協(xié)議書(shū)
- 資金管理與賬戶(hù)監(jiān)督合同
- 三基選擇題(東南大學(xué)出版社)
- 2021年大唐集團(tuán)招聘筆試試題及答案
- DBJ53/T-39-2020 云南省民用建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)
- 2022版義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)解讀課件PPT模板
- 實(shí)驗(yàn)五 PCR擴(kuò)增課件
- 馬拉松運(yùn)動(dòng)醫(yī)療支援培訓(xùn)課件
- 中醫(yī)藥宣傳手冊(cè)
- 不良資產(chǎn)處置盡職指引
- 人教部編版七年級(jí)歷史上冊(cè)第19課 北魏政治和北方民族大交融課件(23張PPT)
- 機(jī)械設(shè)備定期檢查維修保養(yǎng)使用臺(tái)賬
- 麗聲北極星分級(jí)繪本第四級(jí)上 Stop!Everyone Stop!教學(xué)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論