版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS號(hào)
中國(guó)標(biāo)準(zhǔn)文獻(xiàn)分類號(hào)
T/CESXXX?XXXX
CES
團(tuán)體標(biāo)準(zhǔn)
T/CESXXX?XXXX
電力人工智能知識(shí)圖譜組件功能及接口規(guī)范
Functionandintegererfacespecificationofpowerartificial
integerelligenceknowledgeatlascomponent
(征求意見稿)
XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施
中國(guó)電工技術(shù)學(xué)會(huì)發(fā)布
Ⅱ
1范圍
本文件規(guī)定了知識(shí)圖譜組件的系統(tǒng)架構(gòu)、功能模塊、服務(wù)接口及性能指標(biāo)規(guī)范要求等內(nèi)容。
本文件適用于知識(shí)圖譜組件的規(guī)劃、設(shè)計(jì)、開發(fā)、建設(shè)、運(yùn)維等環(huán)節(jié),各單位自建知識(shí)圖譜工具應(yīng)
參照?qǐng)?zhí)行。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
GB/T35295-2017信息技術(shù)大數(shù)據(jù)術(shù)語
CESA-2020-2-020人工智能知識(shí)圖譜性能評(píng)估與測(cè)試規(guī)范
CESA-2020-2-019人工智能知識(shí)圖譜分類分級(jí)規(guī)范
3術(shù)語和定義
GB/T37722-2019、GB/T28821-2012、CESA-2020-2-020、CESA-2020-2-019界定的以及下列術(shù)語和
定義適用于本文件。為了便于使用,以下重復(fù)列出了Q/GDW12118.2—2021中的某些術(shù)語和定義。
3.1知識(shí)圖譜knowledgegraph
知識(shí)圖譜最早由Google提出,是用于增強(qiáng)其搜索的知識(shí)庫(kù);其本質(zhì)上是一種語義網(wǎng)絡(luò)(semantic
network);網(wǎng)絡(luò)中的結(jié)點(diǎn)代表實(shí)體(entity)或者概念(concept),邊代表實(shí)體/概念之間的各種語義關(guān)
系。
[Q/GDW12118.2—2021,定義3.7]
3.2知識(shí)knowledge
經(jīng)維護(hù)、處理和解釋后的信息。知識(shí)是一種經(jīng)過驗(yàn)證為真的共同信念,是人對(duì)客觀規(guī)律的認(rèn)知。知
識(shí)是經(jīng)過選擇的信息,具有一定的目的性。知識(shí)是人對(duì)客觀規(guī)律的認(rèn)識(shí)與掌握,是通過人的思維重新組
合和系統(tǒng)化的信息。
3.3本體Ontology
語義數(shù)據(jù)模型,用于定義事物的類型以及可用于描述它們的屬性,是廣義的數(shù)據(jù)模型,并不包含有
關(guān)具體個(gè)體的信息。
3.4本體模型OntologyPattern
本體的形式化描述。
3.5知識(shí)建模knowledgemodeling
建立知識(shí)圖譜的概念模型和知識(shí)層次的活動(dòng),通過知識(shí)建模,知識(shí)圖譜構(gòu)建任務(wù)能夠明確知識(shí)圖譜
的本體結(jié)構(gòu)。
3.6資源描述框架ResourceDescriptionFramework
使用XML語法來表示的資料模型(Resourcemodel),用來描述Web資源的特性,及資源與資源之間的
關(guān)系,其本質(zhì)是一個(gè)數(shù)據(jù)模型(DataModel),由W3C在1999年2月22日頒布。
1
3.7資源描述框架模型RDFSchemaRDFS
用于定義元數(shù)據(jù)屬性元素(例如“創(chuàng)建者”),以描述資源的一種定義語言。它在RDF的基礎(chǔ)上提
供了一個(gè)術(shù)語、概念的定義方式,以及哪些屬性可以應(yīng)用到哪些對(duì)象上,為RDF模型提供了一個(gè)基本的
類型系統(tǒng)。
3.8網(wǎng)絡(luò)本體語言WebOntologyLanguage
W3C提出的對(duì)RDFS擴(kuò)展語言,用于對(duì)本體進(jìn)行語義描述。
3.9神經(jīng)網(wǎng)絡(luò)NeuralNetworks
由加權(quán)鏈路且權(quán)值可調(diào)整連接的基本處理元素的網(wǎng)絡(luò),通過把非線性函數(shù)作用到其輸入值上使每個(gè)
單元產(chǎn)生一個(gè)值,并把它傳送給其他單元或把它表示成輸出值。
4縮略語
API:應(yīng)用程序接口(ApplicationProgrammingintegererface)
https:超文本傳輸安全協(xié)議(HyperTextTransferProtocoloverSecureSocketLayer)
NoSQL:非關(guān)系型的數(shù)據(jù)庫(kù)(NotOnlySQL)
OWL:網(wǎng)絡(luò)本體語言(WebOntologyLanguage)
TPS:事務(wù)數(shù)/秒(TransactionsPerSecond)
XML:可擴(kuò)展標(biāo)記語言(ExtensibleMarkupLanguage)
5系統(tǒng)架構(gòu)
5.1電力知識(shí)圖譜
電力知識(shí)圖譜以結(jié)構(gòu)化方式刻畫電力系統(tǒng)中的概念、實(shí)體、事件及其間的關(guān)系,充分利用電力物聯(lián)
網(wǎng)所承載的數(shù)據(jù)信息,為電力行業(yè)產(chǎn)業(yè)鏈提供一種更為有效的跨媒體大數(shù)據(jù)組織、管理、認(rèn)知能力。由
于電力領(lǐng)域知識(shí)廣泛來源于傳統(tǒng)的電力知識(shí)工程系統(tǒng)、專家經(jīng)驗(yàn)知識(shí)庫(kù)等結(jié)構(gòu)化數(shù)據(jù)與電力標(biāo)準(zhǔn)、制度、
法律、法規(guī)以及專家、技術(shù)人員的經(jīng)驗(yàn)等半/非結(jié)構(gòu)化數(shù)據(jù),涉及多個(gè)業(yè)務(wù)領(lǐng)域,因而其知識(shí)也可按照
復(fù)用程度的差異劃分為通用知識(shí)和專用知識(shí)2大部分。例如部分電力設(shè)備的名稱、電壓等級(jí)、容量以及
單位組織架構(gòu)等信息在客服、調(diào)度、運(yùn)檢、安質(zhì)等多個(gè)業(yè)務(wù)領(lǐng)域均有需求,就屬于電力領(lǐng)域通用知識(shí)范
疇;例如客服領(lǐng)域中的用戶名稱、電費(fèi)、電價(jià)等信息相對(duì)專用,在調(diào)度、運(yùn)檢、安質(zhì)等業(yè)務(wù)領(lǐng)域涉及概
率很小,甚至完全不會(huì)出現(xiàn),就屬于電力領(lǐng)域?qū)S弥R(shí)范疇。但是力領(lǐng)域通用知識(shí)與專用知識(shí)之間的界
限具有模糊性,實(shí)際操作時(shí)需要根據(jù)實(shí)際業(yè)務(wù)進(jìn)行統(tǒng)計(jì)分析以判定通用、專用知識(shí)之間的邊界。電力領(lǐng)
域中的知識(shí)本體主要包括實(shí)體、概念、關(guān)系、屬性、屬性值、函數(shù)以及約束等方面內(nèi)容。由于不同層次
的知識(shí)在表示復(fù)雜程度上有所差異,大部分領(lǐng)域知識(shí)圖譜優(yōu)先對(duì)實(shí)體、概念、關(guān)系、屬性進(jìn)行知識(shí)建模。
其本體架構(gòu)可簡(jiǎn)約劃分為概念層和實(shí)例層。實(shí)際的電力業(yè)務(wù)中存在大量諸如繳費(fèi)、倒閘、消缺等詞語,
既不屬于概念范疇也不屬于實(shí)例范疇,作為一種跟業(yè)務(wù)強(qiáng)相關(guān)的動(dòng)作、事件、規(guī)范邊界的業(yè)務(wù)名詞,無
法準(zhǔn)確的融合到概念層或是實(shí)例層。針對(duì)上述情況,本文在研究電力領(lǐng)域知識(shí)本體建模時(shí)采用3層電
力領(lǐng)域知識(shí)表示架構(gòu),如圖1所示,業(yè)務(wù)層作為概念層與實(shí)例層之間的橋梁,與動(dòng)作、事件等知識(shí)要
素進(jìn)行映射,形成3層電力領(lǐng)域知識(shí)表示架構(gòu)。在電力業(yè)務(wù)垂直領(lǐng)域進(jìn)行本體遷移時(shí),需要根據(jù)業(yè)務(wù)
領(lǐng)域知識(shí)同時(shí)更新概念層、業(yè)務(wù)層以及實(shí)例層的專用數(shù)據(jù)。
2
圖1電力領(lǐng)域知識(shí)表示架構(gòu)圖
5.2總體架構(gòu)
知識(shí)圖譜組件應(yīng)滿足服務(wù)化建設(shè)原則,提供包括知識(shí)建模、知識(shí)存儲(chǔ)、知識(shí)獲取、知識(shí)融合等通用
知識(shí)圖譜服務(wù),應(yīng)采用RESTfulAPI對(duì)外服務(wù),實(shí)現(xiàn)知識(shí)圖譜共性化服務(wù)建設(shè),形成統(tǒng)一標(biāo)準(zhǔn)服務(wù)體系,
支撐各類業(yè)務(wù)應(yīng)用。知識(shí)圖譜組件總體架構(gòu)如下圖所示。
業(yè)務(wù)應(yīng)用主設(shè)備知識(shí)庫(kù)客戶知識(shí)問答項(xiàng)目圖譜分析知識(shí)推薦可視化分析…
應(yīng)用反饋服務(wù)調(diào)用
中臺(tái)/業(yè)務(wù)系統(tǒng)組件服務(wù)
知識(shí)圖譜通用組件其他組件
服務(wù)調(diào)用
業(yè)務(wù)中臺(tái)數(shù)據(jù)接入
知識(shí)建模知識(shí)存儲(chǔ)知識(shí)獲取
總部?jī)蓭?kù)一平臺(tái)
數(shù)據(jù)中臺(tái)模型調(diào)用
數(shù)據(jù)接入知識(shí)融合知識(shí)計(jì)算知識(shí)應(yīng)用樣本庫(kù)訓(xùn)練環(huán)境
…標(biāo)注樣本模型庫(kù)運(yùn)行環(huán)境
總部云平臺(tái)(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等資源)
服務(wù)調(diào)用成果共享
服務(wù)調(diào)用
中臺(tái)/業(yè)務(wù)系統(tǒng)
省側(cè)知識(shí)
省側(cè)設(shè)備圖譜應(yīng)用營(yíng)銷圖譜應(yīng)用……
省側(cè)中臺(tái)圖譜應(yīng)用
數(shù)據(jù)接入
…省側(cè)云平臺(tái)(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等資源)
圖2知識(shí)圖譜組件總體框架
5.3功能架構(gòu)
知識(shí)圖譜組件功能包括知識(shí)建模組件、知識(shí)存儲(chǔ)組件、知識(shí)計(jì)算組件、知識(shí)融合組件、知識(shí)獲取組
件及知識(shí)應(yīng)用組件。知識(shí)圖譜組件功能架構(gòu)如下圖所示。
服務(wù)接口圖譜探索接口圖譜問答接口知識(shí)推薦接口知識(shí)卡片接口圖譜語句解析接口
知識(shí)計(jì)算組件知識(shí)融合組件知識(shí)獲取組件知識(shí)應(yīng)用組件
圖譜查詢可視化編輯實(shí)例編輯
知識(shí)存儲(chǔ)組件
關(guān)系編輯同義編輯數(shù)據(jù)導(dǎo)入導(dǎo)出
知識(shí)建模組件概念定義屬性定義關(guān)系定義導(dǎo)入導(dǎo)出
圖3知識(shí)圖譜組件功能功能框架
3
5.4知識(shí)圖譜的構(gòu)建方式
知識(shí)圖譜的構(gòu)建需要原始的數(shù)據(jù)進(jìn)行抽象表達(dá)。按照數(shù)據(jù)的結(jié)構(gòu)化程度來分,可以分為結(jié)構(gòu)化數(shù)據(jù)、
半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),根據(jù)數(shù)據(jù)的不同的結(jié)構(gòu)化形式,采用不同的方法,將數(shù)據(jù)轉(zhuǎn)換為三元組
的形式,然后對(duì)三元組的數(shù)據(jù)進(jìn)行知識(shí)融合,主要是實(shí)體對(duì)齊,以及和數(shù)據(jù)模型進(jìn)行結(jié)合,經(jīng)過融合之
后,會(huì)形成標(biāo)準(zhǔn)的數(shù)據(jù)表示,為了發(fā)現(xiàn)新知識(shí),可以依據(jù)一定的推理規(guī)則,產(chǎn)生隱含的知識(shí),所有形成
的知識(shí)經(jīng)過一定的質(zhì)量評(píng)估,最終進(jìn)入知識(shí)圖譜,依據(jù)知識(shí)圖譜這個(gè)數(shù)據(jù)平臺(tái),可以實(shí)現(xiàn)語義搜索,智
能問答,推薦系統(tǒng)等一些應(yīng)用。下圖展示了知識(shí)圖譜的構(gòu)建方式。
圖4知識(shí)圖譜的構(gòu)建方式
6功能模塊
6.1知識(shí)建模組件能力
知識(shí)建模組件應(yīng)具備輔助用戶建立知識(shí)圖譜數(shù)據(jù)模型的能力,應(yīng)支持多層級(jí)知識(shí)體系建模,應(yīng)支持
自頂向下建模方式,應(yīng)支持概念、屬性的批量導(dǎo)入,并且能夠及時(shí)的響應(yīng)數(shù)據(jù)的變化,避免大量的模型
變更。知識(shí)圖譜本體建模工具宜具備的功能見附錄A。
6.2知識(shí)存儲(chǔ)組件能力
知識(shí)存儲(chǔ)組件應(yīng)具備圖譜數(shù)據(jù)接入與管理功能。針對(duì)圖譜數(shù)據(jù)接入,應(yīng)提供在線編輯、文件導(dǎo)入等
服務(wù),并可實(shí)現(xiàn)知識(shí)圖譜增量式構(gòu)建;針對(duì)圖譜數(shù)據(jù)管理,應(yīng)提供圖譜數(shù)據(jù)查看、圖譜語言查詢、知識(shí)
溯源等功能。
6.3知識(shí)計(jì)算組件能力
知識(shí)計(jì)算組件應(yīng)提供知識(shí)標(biāo)引、知識(shí)推理等圖譜數(shù)據(jù)計(jì)算功能,可通過實(shí)體標(biāo)引多模態(tài)數(shù)據(jù)、實(shí)體
屬性與關(guān)系推理方式擴(kuò)展知識(shí)范圍,應(yīng)具備通過手工/批量?jī)煞N方式將資源型數(shù)據(jù)與圖譜數(shù)據(jù)的鏈接功
能,應(yīng)支持概念、實(shí)體的知識(shí)標(biāo)引及標(biāo)引關(guān)系的再利用,且應(yīng)具備通過業(yè)務(wù)規(guī)則配置方式,推理產(chǎn)生新
的關(guān)系,并接入圖譜,實(shí)現(xiàn)知識(shí)補(bǔ)全。
6.4知識(shí)融合組件能力
知識(shí)融合組件應(yīng)實(shí)現(xiàn)將圖譜中冗余知識(shí)進(jìn)行融合,可通過自動(dòng)計(jì)算或業(yè)務(wù)專家的干預(yù)等方式實(shí)現(xiàn)知
識(shí)融合,提升知識(shí)圖譜的數(shù)據(jù)質(zhì)量。
6.5知識(shí)獲取組件能力
知識(shí)獲取組件應(yīng)實(shí)現(xiàn)將不同來源、不同結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)化成知識(shí),再到知識(shí)圖譜的過程,應(yīng)包括對(duì)結(jié)
4
構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理,應(yīng)支持從數(shù)據(jù)庫(kù)進(jìn)行源數(shù)據(jù)接入。
6.6知識(shí)應(yīng)用組件能力
知識(shí)應(yīng)用組件應(yīng)具備圖譜可視化分析及意圖識(shí)別配置的能力,應(yīng)以可視化的方式提供知識(shí)圖譜可視
化、網(wǎng)絡(luò)結(jié)構(gòu)分析、統(tǒng)計(jì)分析、推理分析等應(yīng)用。
7服務(wù)接口
7.1接口總體規(guī)范
接口總體規(guī)范從接口協(xié)議、域名、版本控制、路徑規(guī)則、請(qǐng)求方式、命名規(guī)范六個(gè)方面進(jìn)行規(guī)范和
要求。內(nèi)容包括:
a)接口協(xié)議:API與客戶端用戶的通信協(xié)議,應(yīng)使用https協(xié)議,以確保交互數(shù)據(jù)的傳輸安全;
b)域名:應(yīng)盡量將API部署在專用域名之下,例如,如果確定API很
簡(jiǎn)單,不會(huì)有進(jìn)一步擴(kuò)展,可以考慮放在主域名下,例如/api;
c)版本控制:應(yīng)將API的版本號(hào)放入U(xiǎn)RL中,例如/v{n},n代表版本
號(hào),分為整型和浮點(diǎn)型,整型代表大功能版本,如v1、v2、v3等,浮點(diǎn)型代表補(bǔ)充功能版本,如v1.1、
v1.2、v2.1、v2.2等。采用多版本并存,增量發(fā)布的方式。對(duì)于一個(gè)API或服務(wù),應(yīng)在生產(chǎn)中至少保
留3個(gè)最詳細(xì)的版本;
d)路徑規(guī)則:路徑表示API的具體地址,每個(gè)路徑地址代表一種資源,所以路徑地址中不能有動(dòng)
詞,只能有名詞。數(shù)據(jù)庫(kù)中的表一般都是同種記錄的集合,所以API中的名稱也應(yīng)該為復(fù)數(shù)。例如
/v1/users、/v1/schemas等;
e)請(qǐng)求方式:API接口的請(qǐng)求方式包括GET、POST;
f)命名規(guī)范:API接口的方法命名,要符合一定規(guī)范。命名應(yīng)使用中綴上限風(fēng)格。以小寫字母開
頭,后面子單詞的首字母也要大寫,所有其他字母均為小寫。不要使用下劃線將單詞隔開。例如:add{XXX}。
7.2接口列表及能力描述
接口列表對(duì)服務(wù)接口名稱和能力進(jìn)行定義與描述,詳見表1。
表1接口列表
序號(hào)接口名稱接口能力描述
讀取知識(shí)圖譜的實(shí)體關(guān)系數(shù)據(jù),支持按照節(jié)點(diǎn)類型、邊類型過濾。接口
1圖譜探索接口
請(qǐng)求參數(shù)及接口返回值詳見附錄B。
基于給定的知識(shí)圖譜,進(jìn)行圖譜庫(kù)中知識(shí)的問答,包括實(shí)體屬性問答、
2圖譜問答接口實(shí)體關(guān)系問答、屬性約束問答、屬性最值問答及多跳問答。接口請(qǐng)求參
數(shù)及接口返回值詳見附錄B。
為某一實(shí)體進(jìn)行特定多種關(guān)系的實(shí)體推薦,一般見于搜索引擎的右側(cè)推
3知識(shí)推薦接口
薦區(qū)域。接口請(qǐng)求參數(shù)及接口返回值詳見附錄B。
讀取實(shí)體的知識(shí)卡片,用于搜索引擎或百科的實(shí)體卡片。接口請(qǐng)求參數(shù)
4知識(shí)卡片接口
及接口返回值詳見附錄B。
可根據(jù)輸入的語句,返回該語句的實(shí)體、屬性、關(guān)系等信息。輸入應(yīng)為
5圖譜語句解析接口
自然語句。接口請(qǐng)求參數(shù)及接口返回值詳見附錄B。
5
8性能指標(biāo)
8.1知識(shí)建模性能指標(biāo)
8.1.1知識(shí)建模工具性能指標(biāo)
知識(shí)建模工具性能指標(biāo)要求參見表2。
表2知識(shí)建模工具性能指標(biāo)
功能模塊指標(biāo)要求前置條件
建模工具平均響應(yīng)時(shí)間<2秒/
知識(shí)建模支持100人同時(shí)開展在線編輯,同步
/
更新周期<3秒
8.2知識(shí)存儲(chǔ)性能指標(biāo)
8.2.1知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)
知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)要求參見表3。
表3知識(shí)存儲(chǔ)數(shù)據(jù)量級(jí)指標(biāo)。
功能模塊指標(biāo)要求前置條件
支持億級(jí)別節(jié)點(diǎn)、百億以內(nèi)三元組
/
知識(shí)存儲(chǔ)知識(shí)的存儲(chǔ)
支持TB級(jí)圖譜數(shù)據(jù)存儲(chǔ)/
8.2.2知識(shí)寫入性能指標(biāo)
知識(shí)寫入性能指標(biāo)要求參見表4。
表4知識(shí)寫入性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識(shí)存儲(chǔ)批量寫入速度≥5萬三元組每秒/
8.2.3知識(shí)基礎(chǔ)查詢性能指標(biāo)
知識(shí)基礎(chǔ)查詢性能指標(biāo)要求參見表5。
表5知識(shí)基礎(chǔ)查詢性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體基礎(chǔ)檢索,返回節(jié)點(diǎn)總數(shù)不超
億級(jí)別節(jié)點(diǎn)
過1萬個(gè),時(shí)間≤1秒
實(shí)體屬性檢索,返回節(jié)點(diǎn)總數(shù)≤1萬
億級(jí)別節(jié)點(diǎn)、十億級(jí)別屬性
個(gè),響應(yīng)時(shí)間≤1秒
知識(shí)存儲(chǔ)
多屬性條件(≤2個(gè)條件),返回節(jié)
點(diǎn)總數(shù)不超過1萬個(gè),檢索響應(yīng)時(shí)間億級(jí)別節(jié)點(diǎn)、十億級(jí)別屬性
≤2秒
知識(shí)圖譜中單節(jié)點(diǎn)圖譜探索響應(yīng)時(shí)億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系
6
間<1秒
知識(shí)圖譜中4步以內(nèi)兩節(jié)點(diǎn)路徑發(fā)
億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系
現(xiàn)平均響應(yīng)時(shí)間<1分鐘
知識(shí)圖譜中4步以內(nèi)多節(jié)點(diǎn)關(guān)聯(lián)分
億級(jí)別節(jié)點(diǎn)、十億級(jí)別關(guān)系
析平均響應(yīng)時(shí)間<2分鐘
8.3知識(shí)抽取性能指標(biāo)
8.3.1結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)
結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)要求參見表6。
表6結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
在數(shù)據(jù)源(接口)性能滿足條件下,
知識(shí)抽取結(jié)構(gòu)化知識(shí)抽取速度>10000三元組/
每秒
8.3.2非結(jié)構(gòu)化知識(shí)抽取性能指標(biāo)
實(shí)體抽取性能指標(biāo)
實(shí)體抽取性能指標(biāo)要求參見表7。
表7實(shí)體抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體抽取,抽取結(jié)果平均準(zhǔn)確
知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)
率>90%,平均召回率>75%
關(guān)系分類性能指標(biāo)
關(guān)系分類性能指標(biāo)要求參見表8。
表8關(guān)系分類性能指標(biāo)
功能模塊指標(biāo)要求前置條件
關(guān)系抽取,抽取結(jié)果平均準(zhǔn)確
知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)
率>85%,平均召回率>75%
屬性抽取性能指標(biāo)
屬性抽取性能指標(biāo)要求參見表9。
表9屬性抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
屬性抽取,抽取結(jié)果平均準(zhǔn)確
知識(shí)抽取在標(biāo)注語料數(shù)量>1000時(shí)
率>85%,平均召回率>75%
7
事件抽取性能指標(biāo)
事件抽取性能指標(biāo)要求參見表10。
表10事件抽取性能指標(biāo)
功能模塊指標(biāo)要求前置條件
事件抽取中觸發(fā)詞抽取的準(zhǔn)確
知識(shí)抽取/
率>90%,召回率>75%
8.4知識(shí)融合性能指標(biāo)
8.4.1實(shí)體對(duì)齊性能指標(biāo)
實(shí)體對(duì)齊性能指標(biāo)要求參見表11。
表11實(shí)體對(duì)齊性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識(shí)融合實(shí)體對(duì)齊算法的準(zhǔn)確率>90%/
8.4.2屬性融合性能指標(biāo)
屬性融合性能指標(biāo)要求參見表12。
表12屬性融合性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識(shí)融合屬性融合準(zhǔn)確率>85%/
8.5知識(shí)計(jì)算性能指標(biāo)
8.5.1知識(shí)鏈接性能指標(biāo)
知識(shí)鏈接性能指標(biāo)要求參見表13。
表13知識(shí)鏈接性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識(shí)計(jì)算知識(shí)鏈接準(zhǔn)確率>90%,召回率>75%/
8.5.2知識(shí)推理性能指標(biāo)
知識(shí)推理性能指標(biāo)要求參見表14。
表14知識(shí)推理性能指標(biāo)
8
功能模塊指標(biāo)要求前置條件
規(guī)則推理的準(zhǔn)確度>95%(給定推理
的規(guī)則集及圖譜中的事實(shí),對(duì)推理/
結(jié)果進(jìn)行人工驗(yàn)證)
知識(shí)計(jì)算在知識(shí)圖譜基本完備(即包含推理
目標(biāo)需要的事實(shí)支撐)的基礎(chǔ)上,
/
神經(jīng)網(wǎng)絡(luò)推理的準(zhǔn)確率>80%(對(duì)推
理結(jié)果進(jìn)行人工驗(yàn)證)
8.6知識(shí)應(yīng)用性能指標(biāo)
8.6.1知識(shí)搜索性能指標(biāo)
知識(shí)搜索性能指標(biāo)要求參見表15。
表15知識(shí)搜索性能指標(biāo)
功能模塊指標(biāo)要求前置條件
搜索吞吐量(TPS)為100,單次搜
記錄數(shù)不高于1000w(無索引寫入)
索響應(yīng)時(shí)間<0.5秒
基礎(chǔ)搜索的召回率和準(zhǔn)確率不低于
/
知識(shí)應(yīng)用85%,top3準(zhǔn)確率不低于90%0
語義搜索的召回率和準(zhǔn)確率不低于
/
85%,top3準(zhǔn)確率不低于90%
詞庫(kù)的數(shù)量不少于1萬/
8.6.2知識(shí)問答性能指標(biāo)
知識(shí)問答性能指標(biāo)要求參見表16。
表16知識(shí)問答性能指標(biāo)
功能模塊指標(biāo)要求前置條件
實(shí)體識(shí)別準(zhǔn)確率>85%,需識(shí)別文本
中的數(shù)字、時(shí)間、人名、地名、機(jī)/
構(gòu)名等信息
針對(duì)知識(shí)圖譜中的知識(shí)查詢問答準(zhǔn)
/
確率>80%
知識(shí)應(yīng)用知識(shí)圖譜中基礎(chǔ)問答(實(shí)體屬性、
億級(jí)別
實(shí)體關(guān)系問答)響應(yīng)時(shí)間≤1秒
知識(shí)圖譜中約束類問答響應(yīng)時(shí)間≤
億級(jí)別
1秒
知識(shí)圖譜中多跳查詢類問答響應(yīng)時(shí)
億級(jí)別
間≤2秒
9
8.6.3知識(shí)卡片性能指標(biāo)
知識(shí)卡片性能指標(biāo)要求參見表17.
表17知識(shí)卡片性能指標(biāo)
功能模塊指標(biāo)要求前置條件
知識(shí)卡片將與實(shí)體相關(guān)、經(jīng)過梳理
/
的知識(shí)提供給用戶的正確率>85%
用戶滿意度評(píng)價(jià)維度包括響應(yīng)時(shí)
知識(shí)卡片/
間、用戶負(fù)擔(dān)、搜索結(jié)果的價(jià)值等
內(nèi)容與結(jié)構(gòu)包括對(duì)知識(shí)卡片提供的
/
實(shí)體屬性數(shù)量和實(shí)體屬性的內(nèi)容
10
附錄A
(資料性附錄)
知識(shí)圖譜本體建模工具
本體建模工具需要實(shí)現(xiàn)對(duì)RDF/RDFS/OWL知識(shí)表示技術(shù)的支持與封裝,并實(shí)現(xiàn)如下功能,從而有效地
為本體建模提供支撐。
A.1模型定義
基于“概念-實(shí)體-屬性-關(guān)系-事件-規(guī)則-鏈接”統(tǒng)一知識(shí)表示模型,應(yīng)具備圖譜模型構(gòu)建功能,應(yīng)
支持在線定義概念、屬性、關(guān)系、邊屬性。
A.2模型引入
模型發(fā)布可用于圖譜模型共享;模型引入功能應(yīng)具備通過引用其他圖譜模型,從而實(shí)現(xiàn)快速構(gòu)建目
標(biāo)圖譜模型。
A.3模型視圖
模型視圖應(yīng)包含概念可視化與關(guān)系可視化。概念可視化應(yīng)具備展示概念的上下位關(guān)系、數(shù)值屬性、
對(duì)象屬性,并應(yīng)具備模型報(bào)告導(dǎo)出功能。關(guān)系可視化應(yīng)展示圖譜模型中概念之間的關(guān)聯(lián)關(guān)系,并支持可
視化結(jié)果的圖片導(dǎo)出。
A.4屬性分組
屬性分組應(yīng)支持對(duì)圖譜模型的數(shù)值屬性、對(duì)象屬性建立自定義分組,輔助業(yè)務(wù)應(yīng)用。
A.5導(dǎo)入導(dǎo)出
應(yīng)提供圖譜模型的批量導(dǎo)入導(dǎo)出能力,支持的格式應(yīng)包含Excel、RDF、OWL。應(yīng)可采用標(biāo)準(zhǔn)的資源
描述框架RDF與網(wǎng)絡(luò)本體語言O(shè)WL格式進(jìn)行模型的導(dǎo)入導(dǎo)出;并可通過Excel模板文件導(dǎo)入進(jìn)行圖譜概念、
數(shù)值屬性、對(duì)象屬性的批量定義。
11
附錄B
(資料性附錄)
服務(wù)接口參數(shù)及返回值說明
B.1圖譜探索接口
B.1.1接口請(qǐng)求參數(shù)
接口請(qǐng)求參數(shù)見表1。
附表1接口請(qǐng)求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
idstring否實(shí)體id
kwString否實(shí)效體名稱,當(dāng)id為空時(shí)生
distanceinteger否讀取層數(shù)
第二層以上節(jié)點(diǎn)查詢個(gè)數(shù),如果指定,
highLevelSizeinteger否第2層及第2層以上返回的節(jié)點(diǎn)以此數(shù)
為限
查詢邊關(guān)系的方向,0表示雙向,1表
directioninteger否
示出發(fā),2表示到達(dá)
查詢指定的屬性,格式為json數(shù)組,
allowAttsstring否
默認(rèn)為查詢?nèi)?/p>
查詢指定的概念,格式為json數(shù)組,
allowTypesstring否
默認(rèn)為查詢?nèi)?/p>
需要被替換后的classId列表,格式為
replaceClassIdsstring否
json數(shù)組。
屬性唯一標(biāo)識(shí)key列表,當(dāng)allowAtts
allowAttsKeystring否為空時(shí)生效,數(shù)據(jù)將被轉(zhuǎn)換為
allowAtts參數(shù)
概念唯一標(biāo)識(shí)key列表,當(dāng)allowTypes
allowTypesKeystring否為空時(shí)生效,數(shù)據(jù)將被轉(zhuǎn)換為
allowTypes參數(shù)
概念唯一標(biāo)識(shí)key列表,當(dāng)
replaceClassIdsK
string否replaceClassIds為空時(shí)生效,數(shù)據(jù)將
ey
被轉(zhuǎn)換為replaceClassIds參數(shù)
查詢指定的屬性分組,格式為json數(shù)
allowAttrGroupsstring否
組,默認(rèn)為不按照屬性分組查詢
attAttFiltersstring否邊附加屬性過濾條件,json數(shù)組格式
attSortsstring否邊序按,照默邊認(rèn)的不附排件序?qū)傩耘?/p>
reservedAttFilte
string否保留邊屬性過濾條件,json數(shù)組格式
rs
isInheritbool否allowTypes字段指定的概念是否繼承
isRelationMergebool否是否進(jìn)行關(guān)系合并
privateAttReadbool否是讀否取讀取私有屬性,默認(rèn)
pageNointeger否頁數(shù),0表示不分頁
pageSizeinteger否每頁數(shù)量
hyponymyDistanceinteger否上下位關(guān)系的讀取層數(shù),0表示不讀取
12
圖數(shù)探時(shí)索其業(yè)他務(wù)篩規(guī)選則條,件有
graphRulestring否
無此效參
entityQuerystring否節(jié)點(diǎn)過濾條件
在指定的圖譜范圍內(nèi)進(jìn)行
graphBeanstring否
圖探索
B.1.2接口返回值
接口返回值見附表2。
附表2接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
arrayof
data是返回結(jié)果
objects
arrayof是
+graph實(shí)例的詳細(xì)信息
objects
B.2圖譜問答接口
B.2.1接口請(qǐng)求參數(shù)
接口請(qǐng)求參數(shù)見附表3。
附表3接口請(qǐng)求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
querystring是查詢問題
pageNointegereger否當(dāng)前頁數(shù)
pageSizeintegereger否每頁數(shù)量
B.2.2接口返回值
接口返回值見附表4。
附表4接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
dataarrayofobjects是返回結(jié)果
+answersarrayofobjects是答案
13
B.3知識(shí)推薦接口
B.3.1接口請(qǐng)求參數(shù)
接口請(qǐng)求參數(shù)見附表5。
附表5接口請(qǐng)求參數(shù)
參數(shù)類型是否必填描述
graphIdstring是圖譜ID
entityIdlong否實(shí)體id
kwstring否實(shí)體名稱
directiointegere關(guān)系方向。默認(rèn)正向,0表示雙向,1表示出發(fā),
否
nger2表示到達(dá),默認(rèn)0
allowAtt
string否推薦范圍,格式為屬性id的json數(shù)組
s
allowAtt
string否屬性定義生唯一key,allowAtts為空是生效
sKey
integere
pageSize否allowAtts中每個(gè)id返回結(jié)果的數(shù)量
ger
B.3.2接口返回值
接口返回值見附表6。
附表6接口返回值
參數(shù)類型必需詳細(xì)說明
整體返回狀態(tài)碼
statusinteger是200=全部成功
500=失敗
msgstring是返回消息信息
dataarrayofobjects是返回結(jié)果
+e
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版企業(yè)派遣人員服務(wù)協(xié)議樣本版B版
- 2024年環(huán)保型染料研發(fā)生產(chǎn)合同
- 2024年標(biāo)準(zhǔn)型風(fēng)管產(chǎn)品銷售合同樣本版B版
- 2024年度綠化苗木種植與銷售合作協(xié)議3篇
- 2024年度職業(yè)技能培訓(xùn)中心新生入學(xué)教育培訓(xùn)合同3篇
- 2024年新能源土地房屋股權(quán)轉(zhuǎn)讓與開發(fā)建設(shè)合同范本3篇
- 2024年商品房買賣合同違約責(zé)任認(rèn)定及賠償執(zhí)行細(xì)則3篇
- 2024商鋪?zhàn)赓U轉(zhuǎn)租合同樣本:綠色生態(tài)商業(yè)租賃協(xié)議3篇
- 2024年度實(shí)驗(yàn)室化學(xué)品儲(chǔ)存與運(yùn)輸服務(wù)合同3篇
- 造紙廠鉆孔樁施工協(xié)議
- 2023年勞動(dòng)法與社會(huì)保障法電大機(jī)考資料
- 《客艙安全與應(yīng)急處置》-課件:15秒開艙門
- 教師口語智慧樹知到期末考試答案2024年
- 學(xué)校新生結(jié)核病篩查安排剖析
- 中班數(shù)學(xué)《帽子有什么不同》課件
- 浙江省嘉興市2023-2024學(xué)年八年級(jí)上學(xué)期期末英語試題
- 政工類人員培訓(xùn)課件
- 2024年大學(xué)試題(財(cái)經(jīng)商貿(mào))-博弈論筆試歷年真題薈萃含答案
- 監(jiān)獄積分考核工作總結(jié)
- 信息化作戰(zhàn)平臺(tái)
- 影視鑒賞-第六章-影視藝術(shù)的鑒賞與評(píng)論
評(píng)論
0/150
提交評(píng)論