農(nóng)業(yè)知識圖譜構建技術規(guī)程編制說明_第1頁
農(nóng)業(yè)知識圖譜構建技術規(guī)程編制說明_第2頁
農(nóng)業(yè)知識圖譜構建技術規(guī)程編制說明_第3頁
農(nóng)業(yè)知識圖譜構建技術規(guī)程編制說明_第4頁
農(nóng)業(yè)知識圖譜構建技術規(guī)程編制說明_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

《農(nóng)業(yè)知識圖譜構建技術規(guī)程》編制說明一、工作概況(一)任務來源本標準根據(jù)陜西省市場監(jiān)督管理局《關于下達2022年地方標準計劃的通知》(陜市監(jiān)函〔2022〕380號)立項,項目編號SDBXM120-2022,項目名稱《農(nóng)業(yè)知識圖譜構建技術規(guī)程》。(二)本標準制訂的必要性和意義根據(jù)國家戰(zhàn)略發(fā)展需求,21世紀以來共發(fā)布了20個指導“三農(nóng)”工作的中央一號文件。2023年2月13日《中共中央國務院關于做好2023年全面推進鄉(xiāng)村振興重點工作的意見》進一步指出,深入實施數(shù)字鄉(xiāng)村發(fā)展行動,推動數(shù)字化應用場景研發(fā)推廣。加快農(nóng)業(yè)農(nóng)村大數(shù)據(jù)應用,推進智慧農(nóng)業(yè)發(fā)展。農(nóng)業(yè)農(nóng)村部《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019-2025年)》提出構建重要農(nóng)業(yè)種質資源大數(shù)據(jù),為品種選育、產(chǎn)業(yè)發(fā)展、行業(yè)監(jiān)管提供大數(shù)據(jù)支持。陜西是我國重要的農(nóng)業(yè)產(chǎn)區(qū),地形復雜、海拔高度、雨熱資源和生態(tài)條件差異大,形成了超過20個各具特色的種植業(yè)氣候類型區(qū)。隨著農(nóng)業(yè)產(chǎn)業(yè)的不斷發(fā)展,借助信息技術快速、有效地獲取農(nóng)業(yè)產(chǎn)業(yè)全鏈條生產(chǎn)、銷售等信息變得越發(fā)重要,基于人工智能技術的農(nóng)業(yè)自動問答、推薦、溯源系統(tǒng)快速發(fā)展,為農(nóng)戶、合作社、農(nóng)技人員等農(nóng)業(yè)從業(yè)者在一定程度上提供了相關的信息服務。但當前不同種植業(yè)氣候類型區(qū)作業(yè)方式、作業(yè)時間、農(nóng)資農(nóng)具等需求各不相同,使得農(nóng)業(yè)生產(chǎn)數(shù)據(jù)呈現(xiàn)種類繁多、多源異構等特點,且在計算機中存儲與表達標準不統(tǒng)一,導致農(nóng)業(yè)信息搜索、推薦、問答的有效性、準確性無法進一步提高。知識圖譜是一種新的多關系圖,通過知識圖譜可以快速推測隱含的業(yè)務邏輯,構建小而輕的存儲載體。農(nóng)業(yè)知識圖譜可以更直觀地挖掘、分析、構建、繪制和顯示農(nóng)業(yè)知識。基于知識圖譜的農(nóng)業(yè)知識問答、搜索、推薦等系統(tǒng)能夠高效查詢、匹配信息,為農(nóng)業(yè)從業(yè)人員提供快速敏捷的信息服務。然而,由于農(nóng)業(yè)領域知識名稱與術語沒有統(tǒng)一規(guī)范、各地作物管理過程和知識獲取途徑差異較大,知識融合與知識推理方法也不盡相同,造成農(nóng)業(yè)領域知識圖譜的構建缺乏相應的標準。因此,為了推動陜西智慧農(nóng)業(yè)、數(shù)字鄉(xiāng)村乃至鄉(xiāng)村振興的快速發(fā)展,有必要制定符合陜西農(nóng)業(yè)特色的知識圖譜構建標準。本標準充分考慮了陜西省農(nóng)業(yè)地域特性,規(guī)定了農(nóng)業(yè)知識圖譜相關術語和基本概念;適用于指導農(nóng)業(yè)領域知識圖譜的構建,規(guī)范農(nóng)業(yè)知識抽取、推理、問答和推薦過程,方便相關從業(yè)人員敏捷高效地獲取信息,為智慧農(nóng)業(yè)應用奠定數(shù)據(jù)基礎和技術支撐,從而促進陜西數(shù)字化農(nóng)業(yè)農(nóng)村的發(fā)展。(三)起草單位、主要起草人及任務分工1、起草單位本文件起草單位:西北農(nóng)林科技大學、中國電信股份有限公司陜西分公司、西安交通大學、西北工業(yè)大學、西安電子科技大學、西安農(nóng)鏈互聯(lián)網(wǎng)科技有限公司、楊凌現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)標準化研究推廣服務中心。2、主要起草人本文件主要起草人:張宏鳴、耿耀君、朱珊娜、呂志明、杜寶紅、李亞佳、孫鶴立、李青、馮志璽、陳歡、李書琴、宋榮杰、牛當當、劉斌、蒲攀、黃小星、張婷、周永明。3、任務分工任務分工如表1所示。表1任務分工表序號姓名單位任務分工1張宏鳴西北農(nóng)林科技大學規(guī)程總體設計與最終審定,工作方案制定。2耿耀君西北農(nóng)林科技大學知識圖譜架構設計。3朱珊娜西北農(nóng)林科技大學規(guī)程術語和定義整理。4呂志明西北農(nóng)林科技大學知識圖譜構建流程設計。5杜寶紅中國電信股份有限公司陜西分公司陜西省農(nóng)業(yè)相關領域的發(fā)展狀況分析與總結。6李亞佳中國電信股份有限公司陜西分公司知識圖譜構建環(huán)節(jié)面臨的主要問題和未來趨勢分析。7孫鶴立西安交通大學規(guī)程技術要求制定。8李青西北工業(yè)大學規(guī)程技術要求制定。9馮志璽西安電子科技大學規(guī)程相關國際標準、國家標準查閱、收集、整理與分析。10陳歡西北農(nóng)林科技大學規(guī)程相關行業(yè)標準、地方標準查閱、收集、整理與分析。11李書琴西北農(nóng)林科技大學國內外有關智慧農(nóng)業(yè)、農(nóng)業(yè)知識圖譜構建等其它文獻資料整理與分析。12宋榮杰西北農(nóng)林科技大學規(guī)程的驗證試驗。13牛當當西北農(nóng)林科技大學規(guī)程的驗證試驗。14劉斌西北農(nóng)林科技大學規(guī)程的驗證試驗。15蒲攀西北農(nóng)林科技大學規(guī)程實地調研環(huán)節(jié)資料整理與分析。16黃小星西安農(nóng)鏈互聯(lián)網(wǎng)科技有限公司規(guī)程技術相關實踐經(jīng)驗、存在問題及解決方案的提供。17張婷西安農(nóng)鏈互聯(lián)網(wǎng)科技有限公司規(guī)程實地調研環(huán)節(jié)資料整理與分析。18周永明楊凌現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)標準化研究推廣服務中心規(guī)程相關法律法規(guī)查閱、收集,標準內容形式把關。(四)起草過程1、成立標準起草工作組《農(nóng)業(yè)知識圖譜構建技術規(guī)程》地方標準任務下達后,由西北農(nóng)林科技大學牽頭,聯(lián)合中國電信股份有限公司陜西分公司、西安交通大學、西北工業(yè)大學、西安電子科技大學、西安農(nóng)鏈互聯(lián)網(wǎng)科技有限公司、楊凌現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)標準化研究推廣服務中心等單位,成立了《農(nóng)業(yè)知識圖譜構建技術規(guī)程》陜西省地方標準起草工作組,討論確定標準編制思路和工作方案。2、調查研究和標準起草標準起草工作組通過查閱文獻資料和實地走訪等形式,開展標準需求調研,深入了解陜西省農(nóng)業(yè)相關領域的發(fā)展狀況,分析研究知識圖譜構建環(huán)節(jié)面臨的問題和未來趨勢,并根據(jù)GB/T1.1-2020《標準化工作導則第1部分:標準化文件的結構及起草規(guī)則》的要求,開始規(guī)程的編制起草,經(jīng)過內部多次討論,形成標準草案。3、標準草案提升完善標準起草工作組對西安農(nóng)鏈互聯(lián)網(wǎng)科技有限公司、西北農(nóng)林科技大學獼猴桃示范站、西北農(nóng)林科技大學合陽葡萄試驗示范站、陜西省漢中市鎮(zhèn)巴縣中藥材園區(qū)進行實地調研,就標準編制思路和主要內容與農(nóng)業(yè)相關從業(yè)者、管理、信息化等專業(yè)技術人員進行討論,記錄一線技術人員反饋的意見;同時積極征求聽取農(nóng)業(yè)信息化領域專家建議。根據(jù)多方意見對標準草案進行修改,重點圍繞農(nóng)業(yè)知識圖譜構建技術要求,對技術規(guī)程進行細化調整,不斷完善標準草案。4、形成標準征求意見稿為了做好標準的起草工作,根據(jù)編制團隊多年來在農(nóng)業(yè)知識圖譜構建方面的實踐經(jīng)驗,同時廣泛收集和參閱國內外有關智慧農(nóng)業(yè)、農(nóng)業(yè)知識圖譜構建等方面的文獻資料,確定了本規(guī)程的編寫內容。邀請監(jiān)管部門、企業(yè)、高校、科研院所等相關單位以及示范站、園區(qū)經(jīng)營用戶、標準化領域專家等召開標準研討會,對標準框架和內容逐條逐項進行認真討論。工作組根據(jù)各方意見和建議,對標準草案進行修訂,于2023年4月形成標準征求意見稿。二、標準編制原則和標準主要內容(一)標準編制的原則1、科學性原則本標準的制定嚴格按《中華人民共和國標準化法》、《地方標準制定工作規(guī)范》(DB14/T1665-2018)、《標準化工作導則第1部分:標準化文件的結構和起草規(guī)則》(GB/T1.1-2020)的要求進行。2、適用性原則“規(guī)范”編寫充分考慮了陜西省地方特色和農(nóng)業(yè)知識圖譜構建的當前現(xiàn)狀,既要保持技術上規(guī)范性、合理性,也必須兼顧適應新形勢下從事農(nóng)業(yè)生產(chǎn)、研究人員的實際需求,體現(xiàn)對未來需求的適應性。3、規(guī)范性原則本次編寫采用章、節(jié)、條、款四級的條文編排方式,各自用于不同表達:章——劃分規(guī)程章節(jié),例如以1-6表示。節(jié)——劃分技術模塊,例如以1.1-1.3表示。條——羅列具體技術步驟,例如以1.1.1-1.1.3表示款——羅列具體技術要求,例如以a)-e)表示。其中,款是具體要求,所以規(guī)定不能模糊,必須明確具體要求和效果,本次編寫通過增加款的方式來細化調查、分析及實施的技術要求。(二)標準主要內容1、縮略語關鍵技術要求:對適用于本文件的縮略語,RDF、NER、RE、LSTM等進行說明。確定依據(jù):根據(jù)農(nóng)業(yè)知識圖譜構建技術所包含的關鍵步驟和關鍵模型提出。2、架構與流程(1)關鍵技術要求農(nóng)業(yè)知識圖譜架構包括:基礎數(shù)據(jù)采集層、圖譜構建層、信息解析層和服務層。基礎數(shù)據(jù)采集層:農(nóng)業(yè)知識圖譜數(shù)據(jù)來源于用于構建初步農(nóng)業(yè)知識圖譜的術語集和規(guī)范資料,以及用于擴展農(nóng)業(yè)知識圖譜的各種數(shù)據(jù)源,包括各種網(wǎng)絡資源、農(nóng)業(yè)知識庫以及智能感知設備采集的生產(chǎn)數(shù)據(jù)。采集的數(shù)據(jù)需要進行去噪處理。圖譜構建層:從數(shù)據(jù)中抽取命名實體和關系,并進行知識融合和加工;信息解析層:借助模板匹配和機器學習方法,以及分詞、詞性分析、句法分析、圖搜索、排序和分類組織等自然語言處理技術,通過信息解析和意圖理解,準確理解文字含義及指令意圖;服務層:以農(nóng)業(yè)知識圖譜為基礎為農(nóng)業(yè)相干從業(yè)者、企業(yè)、研究院所提供全產(chǎn)業(yè)鏈、全方位的產(chǎn)業(yè)發(fā)展現(xiàn)狀和趨勢,并給出產(chǎn)業(yè)發(fā)展相關的決策與指導。農(nóng)業(yè)知識圖譜構建流程包括:數(shù)據(jù)準備、知識表示與知識建模、知識獲取與知識融合、知識加工、知識應用服務。數(shù)據(jù)準備:通過農(nóng)業(yè)知識庫、術語集、規(guī)范資料和設備感知等方式獲取結構化、半結構化和非結構化數(shù)據(jù),構建農(nóng)業(yè)領域內的領域知識和重要術語。知識表示與知識建模:定義知識表示的方式,確定知識圖譜構建的框架和工具,設計知識圖譜的數(shù)據(jù)結構,構建本體模型描述農(nóng)業(yè)領域的知識體系。知識獲取與知識融合:利用LSTM、Transformer和Bert等深度學習模型,結合人工眾包完成實體抽取、關系抽取、屬性抽取。通過知識體系映射,去除冗余知識數(shù)據(jù),形成統(tǒng)一的知識結構存儲。知識加工:基于已有知識圖譜構建算法模型,預測未知的隱含知識,驗證知識的正確性后,通過知識補全完善現(xiàn)有知識圖譜。隨著新知識的獲取,完成新的實體、關系、屬性和規(guī)則等知識單元的更新。知識應用服務:根據(jù)農(nóng)業(yè)領域的應用場景部署知識圖譜,通過知識圖譜數(shù)據(jù)庫的查詢,提供知識檢索、知識推理、知識可視化等接口和服務。(2)確定依據(jù)根據(jù)《知識圖譜白皮書》對知識圖譜構建和服務的相關描述及農(nóng)業(yè)鄰域實際需求,確定了農(nóng)業(yè)知識圖譜的架構和構建流程。架構同時也符合大數(shù)據(jù)處理及服務平臺的常規(guī)要求。構建流程中核心步驟依據(jù)知識圖譜核心要點而確定。3、技術要求(1)關鍵技術要求知識抽?。篴)支持從結構化數(shù)據(jù)中直接提取資源描述框架(RDF)三元組。b)支持基于農(nóng)業(yè)領域半結構化、結構化數(shù)據(jù)的概念抽取、實體抽取、關系抽取和屬性抽取。c)抽取模型應基于隱馬爾科夫模型(HMM)、條件隨機場(CRF)等統(tǒng)計學習或長短期記憶網(wǎng)絡(LSTM)、預訓練語言模型等深度學習(DL)的知識抽取方法。d)知識加工應支持基于術語匹配、結構特征、知識分塊的本體層融合和匹配和基于表示學習的實體對齊。e)知識抽取模型的性能應使用準確率、召回率和F1分數(shù)(F1-score)等公認的評價指標評價。知識推理:a)支持本體公理的知識圖譜推理。b)支持圖結構和規(guī)則學習的知識圖譜推理。c)支持表示學習的知識圖譜推理。d)支持圖神經(jīng)網(wǎng)絡的知識圖譜推理。e)支持分布式表示學習的知識圖譜推理。知識問答:a)支持問句模板的知識圖譜問答。b)支持基于語義解析的知識圖譜問答。c)支持基于檢索排序的知識圖譜問答。d)支持基于深度學習的知識問答。e)支持通過PC端網(wǎng)站、APP和小程序等方式進行知識問答。知識推薦:a)支持基于特征的推薦方法和基于路徑的推薦方法。b)支持依次學習、聯(lián)合學習和交替學習的方法,將知識圖譜特征應用到推薦系統(tǒng)中。c)支持通過PC端網(wǎng)站、APP、小程序和短信等方式推薦。(2)確定依據(jù)知識抽取技術要求依據(jù)在可能是結構、非結構和半結構的特點知識圖譜語料中提取信息的方式確定;知識推理技術、知識問答技術和知識推薦技術依據(jù)各自鄰域典型技術分類確定,保證知識背景有差異的研發(fā)人員均可以依據(jù)本規(guī)程構建農(nóng)業(yè)知識圖譜。三、實證研究依托國家重點研發(fā)計劃“綠色宜居村鎮(zhèn)技術創(chuàng)新”重點專項“村鎮(zhèn)數(shù)字化科技信息服務綜合示范(2020YFD1100600)”課題一“農(nóng)業(yè)先進適用技術社會化服務平臺研發(fā)與示范”,在示范基地收集相關數(shù)據(jù),構建葡萄、獼猴桃、蘋果、紅棗、中草藥、谷子等6種農(nóng)作物知識圖譜。部分可視化展示如圖1-圖2所示。(1)構建的葡萄知識圖譜,包括中國葡萄品種、葡萄土肥水管理、葡萄樹體管理、葡萄病害、葡萄蟲害、農(nóng)藥使用方法等,總計4774條三元組數(shù)據(jù)。(2)構建的獼猴桃知識圖譜,包括獼猴桃形態(tài)特征、生長習性、種植管理流程、病蟲害防止和加工運輸?shù)戎R,總計3044條三元組數(shù)據(jù)。(3)構建的蘋果知識圖譜,包括蘋果種植資源、栽培技術、病蟲害防治、采后加工等知識,總計2531條三元組。(4)構建的紅棗知識圖譜,包括紅棗品種、棗樹生長環(huán)境、棗樹育苗、棗樹種植、棗樹管理、棗樹病蟲害、紅棗采收加工、棗樹適用技術等,總計4184條三元組數(shù)據(jù)。圖1獼猴桃知識圖譜部分可視化展示(5)構建的中草藥知識圖譜,包括藥材名,功效,部位,數(shù)值,工具,科,病癥,形態(tài),種植方法,病害,屬,化學成分,成長期,田間管理,病原,產(chǎn)地,氣候,時間段,選種標準,癥狀,氣象指標,地理環(huán)境,禁忌,時機,發(fā)病規(guī)律,藥性,檢測指標,實施者,種植密度,蟲害,藥味,標準,觸發(fā)詞,肥料,害蟲成長階段,經(jīng)絡,植物類別,操作對象,施肥量,防治方法,藥劑,包裝記錄,儲藏條件等類型的實體及關系,總計3765條三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論