語言資源管理 語義標注框架(SemAF) 第11部分:可度量數(shù)量信息(MQI)_第1頁
語言資源管理 語義標注框架(SemAF) 第11部分:可度量數(shù)量信息(MQI)_第2頁
語言資源管理 語義標注框架(SemAF) 第11部分:可度量數(shù)量信息(MQI)_第3頁
語言資源管理 語義標注框架(SemAF) 第11部分:可度量數(shù)量信息(MQI)_第4頁
語言資源管理 語義標注框架(SemAF) 第11部分:可度量數(shù)量信息(MQI)_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

ICS01.020

CCS點擊此處添加CCS號

中華人民共和國國家標準

GB/TXXXXX—XXXX/ISO24617-11:2021

`

語言資源管理語義標注框架(SemAF)

第11部分:可度量數(shù)量信息(MQI)

Languageresourcemanagement—Semanticannotationframework(SemAF)—

Part11:Measurablequantitativeinformation(MQI)

(ISO24617-11:2021,IDT)

征求意見稿

XXXX-XX-XX發(fā)布XXXX-XX-XX實施

GB/TXXXXX—XXXX/ISO24617-11:2021

前言

本文件按照GB/T1.1—2020《標準化工作導則第1部分:標準化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定

起草。

本文件等同采用ISO24617-11:2019《語言資源管理—語義標注框架(SemAF)—第11部分可度量數(shù)

量信息(MQI)》,文件類型由ISO的技術規(guī)范調(diào)整為我國的國家標準。

請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別專利的責任。

本文件由全國語言與術語標準化技術委員會提出并歸口。

本文件起草單位:南方電網(wǎng)科學研究院等

本文件主要起草人:

II

GB/TXXXXX—XXXX/ISO24617-11:2021

語言資源管理語義標注框架(SemAF)第11部分

可度量數(shù)量信息(MQI)

1范圍

本文件涵蓋了量的可度量或量值方面,以便其能夠關注信息檢索(IR)、問題回答(QA)、文本總

結(jié)(TS)和其他自然語言處理(NLP)應用中測量的技術或?qū)嶋H應用。本文件適用于比在一般語言使用

中發(fā)現(xiàn)的理論問題更具應用相關性的技術領域。

注:ISO24617-12處理量化和數(shù)量信息的更一般和理論問題。

本文件還涉及ISO24617-1中討論的時間持續(xù)時間,以及在ISO24617-7中處理的距離等空間度量,

同時使它們與其他度量類型進行互操作。它還包括ISO24617-6:20168.3中引入的度量或數(shù)量的處理。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,

僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本

文件。

ISO24612語言資源管理—語言學注釋框架(LAF)(LanguageResourceManagement-Linguistic

AnnotationFramework(LAF)

3術語和定義

下列術語和定義適用于本文件。

量qulity

可度量對象的特性,涉及其大小或數(shù)量。

[來源:ISO/IECGuide99:2007,1.1,已修改]

基本量basequantity

在給定量制中約定選取的子集中的量(3.1),其中子集中的任何量均不能用該子集中的其他量表

示。

注:量的種類包括國際量制(ISO)中定義的七種基本量。

[來源:ISO/IECGuide99:2007,1.4,已修改]

導出量derivedquantity

量制中由基本量(3.2)定義的量(3.1)。

示例:速度是由長度(距離)隨時間變化(LT-1)定義的導出量,其中長度(L)和時間(T)屬于基本量。

[來源:ISO/IECGuide99:2009,1.5,已修改]

1

GB/TXXXXX—XXXX/ISO24617-11:2021

數(shù)量信息thenumberofinformation,QI

與可度量對象的量(3.1)相關的測量。

可度量數(shù)量信息measurablequantityinformation,MQI

可用統(tǒng)一數(shù)字術語表示的數(shù)量信息(3.4)

可度量數(shù)量信息標記語言measurablequantityinformationmarkuplanguage,QML

可度量數(shù)量信息的標記語言

數(shù)量標記語言

可從文本或其他媒介類型語言中提取的可度量數(shù)量信息(3.5)標注的規(guī)范語言。

測量單位unitofmeasure

計量單位themeasuringunit

單位

通過乘以以實數(shù)表示的量值,根據(jù)約定定義和采用的測量對象的標量。

注:量中使用的表達,如“米”、“升”和“毫摩爾每千克”,是上述所給定義的單位。在“兩瓶牛奶”、“一

盒蘋果”和“兩杯咖啡”中,“瓶”、“盒”或“兩杯”等數(shù)量表達有時不能被視為單位,但如果它們在某些社區(qū)按

約定或被同意接受為單位,則也可以被視為單位。ISO24617語義標注框架(SemAF)第12部分:量化將這些數(shù)量表達

式視為真單位。

[來源:ISO/IECGuide99:2007,1.9,已修改]

基本單位basicunit

對于基本量(3.2),約定采用的測量單位(3.7)。

注:國際單位制(SI)選擇了與七個國際量制基本量相關的七個基本單位,用于測量量,如表1所示。

表1基本單位

單位制基本單位相關國際量制基本量

(單位符號)(基本量符號)

米(m)長度(L)

千克(kg)質(zhì)量(M)

秒(s)時間(T)

安培(A)電流(I)

開(K)熱力學溫度(è)

摩爾(mol)物質(zhì)數(shù)量(N)

坎(cd)發(fā)光強度(J)

[來源:ISO/IECGuide99:2007,1.10,已修改]

導出單位derivedunits

導出量(3.3)的測量單位(3.7)。

示例:單位“牛頓”(N)是導出量“力”(F)的導出單位,定義為“質(zhì)量乘以加速度”(MLT-2),其中量“加

速度”是由“速度除以時間”(VT-1)定義的導出量,而“速度”定義為“長度(距離)除以時間”(LT-1)。

注:表2舉例說明了一些導出單位。

2

GB/TXXXXX—XXXX/ISO24617-11:2021

[來源:ISO/IECGuide99:2007,1.11]

表2導出單位

導出單位相關導出量

(單位符號)

公里/分鐘(km/min)速度=長度(L)/時間(T)

克/立方米(gram/m3)密度=質(zhì)量(M)/體積(L3)

千克米/平方秒(kgxm/s2)力=質(zhì)量(M)x長度(L)/時間(T2)

流明/平方米(lm/m2)照度=發(fā)光強度(J)/面積(M2)

4數(shù)量標記語言的抽象規(guī)范

概述

數(shù)量標記語言(QML)(3.6)分為抽象和具體兩個層次。4.2中列出了數(shù)量標記語言的一些特征。

數(shù)量標記語言的總體結(jié)構(gòu)由元模型表示,如4.3所述。作為QML_as的數(shù)量標記語言的抽象語法應該是數(shù)

量標記語言在概念方面上的集論規(guī)范,其中,該概念獨立于表示可度量數(shù)量信息標注(內(nèi)容)的方式。

作為QMLcs的數(shù)量標記語言的具體語法應是基于QML_as的一組表示格式的規(guī)范,用于以計算可控的方

式標注可度量數(shù)量信息。在4.4中介紹了QML_as,而在4.5中介紹了QML_cs。等效的具體語法,包括基于

XML的具體語法QML_csx和基于TEI的具體語法QML_cst,分別在第5條和第6條中描述。

注:在單個抽象語法上可以定義許多等效的具體語法。

數(shù)量標記語言的特點

數(shù)量標記語言應具有如下特點:

a)數(shù)量標記語言應關注實體可度量屬性的標注。例如,“BMI在10-20kg/m2之間?!?/p>

b)數(shù)量標記語言應提供標注度量關系的方法。例如,“40歲或以上”和“fpg>=100mg/dl或a1c

不低于5,8%?!?/p>

c)數(shù)量標記語言應涵蓋統(tǒng)一數(shù)值量的復雜用途。例如,“14,0x109”、“糖化血紅蛋白(hba1c)

<正常上限的1,15倍”。

d)數(shù)量標記語言應便于識別歸一化數(shù)字和單位,作為相關實體的可度量屬性。

元模型

可度量數(shù)量信息的總體結(jié)構(gòu)由圖1中的元模型表示。

3

GB/TXXXXX—XXXX/ISO24617-11:2021

圖1可度量數(shù)量信息的元模型

該元模型應由七個類組件組成,如圖1中的方框所示:

a)作為可度量數(shù)量信息標注輸入的源數(shù)據(jù);

b)從數(shù)據(jù)源提取的標記符;

c)三類基本元素:實體、度量和關系符;

d)兩種鏈接:度量鏈接和比較鏈接。

元素“實體”應為具有可度量屬性的任何對象,用“@quantity”表示,作為其中一個屬性。本標

準中使用的“實體”應是一個非常通用的術語,不僅指單個實體,還可以指其屬性,如建筑物的“高度”

或汽車的“速度”,以及任何種類的可能性,如狀態(tài)、過程或轉(zhuǎn)換。

示例1:我們在德國高速公路上以每小時200多公里的速度行駛。

“超過每小時200公里”的速度適用于運動的數(shù)量特性:例如,“超過每小時200公里”的度量適用

于示例中所述的駕駛運動。

元素“度量”表示實體的可度量量,包括三個屬性:量、單位和類型。

示例2:漢拿山高1950米。

度量應包括數(shù)字表達式“1950”和單位“米”所指的量。其適用于地理對象“漢拿山”的“高

度”量。

與標記符相關聯(lián)的元素“關系符”,如“等于”、“大于”、“小于等于”“之間”或“至少”

等,只有一個涉及兩個或多個度量的功能狀態(tài)。

示例3:一磅等于16盎司。

它表示兩個度量之間的特性的關系符,“一磅”和“16盎司”。

示例4:1英尺小于1米,因為它正好等于30.48厘米。

該示例說明了度量之間的兩種類型的鏈接:“小于”的關系和單位元的關系。

“度量”類型的鏈接應將度量與實體的數(shù)量特性相關聯(lián)。這種鏈接由度量元素觸發(fā)。

“比較”類型的鏈接應將度量與另一個或更多度量相關聯(lián)。這種鏈接通常由一個元素“比較”觸

發(fā)。

數(shù)量標記語言(QML_as)的抽象語法

4

GB/TXXXXX—XXXX/ISO24617-11:2021

數(shù)量標記語言是一種標記語言,是度量數(shù)量信息標注的規(guī)范語言。數(shù)量標記語言的抽象語法應根據(jù)

對度量數(shù)量信息的概念理解,以集論方式規(guī)定標注方案。將抽象語法QML_as理解為將其構(gòu)建為三重結(jié)

構(gòu)<B,R,@>,則:

a)B是三種基本元素類型(實體、度量和關系符)的集合;

b)R是兩種鏈接類型(度量和比較類型)的集合;

c)@是賦值集合,指定了與B中的每個基本元素類型和R中的每個鏈接型相關聯(lián)的屬性列表及其

值類型。

B中的每個元素都至少有一個屬性@type,每個鏈接也是如此。@type的值是與每個元素關聯(lián)的CDATA。

示例:“山”的實體屬于“地理”類型,“約翰”的實體屬于“人”類型。

實體的@quantity值是CDATA,可能包括高度、寬度或重量等值。

度量的賦值應具有三個屬性:@numeric、@unit和@type。屬性@numeric的可能值為一個實數(shù)。@unit

的可能值是系統(tǒng)中常規(guī)接受的單位中的一個,如單位制基本單位或?qū)С鰡挝恢械囊粋€。@type的可能值

是作為國際量制基本量或?qū)С隽苛谐龅牧恐械囊粋€,如長度、質(zhì)量、電壓等。

數(shù)量標記語言(QML_cs)及其子集的具體語法

抽象語法應允許使用多個語義等效的具體語法。同樣,QML_as允許使用數(shù)量標記語言(QML_cs)

一組等效的具體語法。本標準在第5條和第6條中分別介紹了兩種具體的語法:QML_csx和QML_csf。

這兩種具體的語法:QML_csx和QML_csf,都是基于抽象語法QML_as,同時采用XML作為它們的

表示語言。它們應符合ISO24612的間隙標注要求。

然而,這兩種具體的語法至少有兩方面的不同。就像ISO24617關于語義標注的其他部分,如

ISO24617-1、ISO24617-7和ISO24617-6,QML_csx沒有將標注內(nèi)容結(jié)構(gòu)與它們的錨定(引用)結(jié)

構(gòu)分離開來,但是,語言學注釋框架要求將這種分離用于語言學注釋。

相比之下,QML_csf是基于特征結(jié)構(gòu)的。在特征結(jié)構(gòu)中表示測量信息時,應遵循語言學注釋框架

將兩個結(jié)構(gòu)(錨定和內(nèi)容結(jié)構(gòu))分離開來。此外,如本標準中所規(guī)定的,QML_cst應采用文本編碼倡

議聯(lián)盟的TEIP5指南中具有值類型規(guī)范的XML元素和屬性的名稱來表示可度量數(shù)量信息。

5數(shù)量標記語言(QML_csx)基于XML的具體語法

概述

基于XML的具體語法QML_csx分兩步介紹。第一步是在5.2中列出QML_csx的標簽名和ID前綴。第二步

是為5.3中的XML根、5.4中列出的每個基本元素類型和5.5中列出的每個鏈接類型指定屬性賦值。

注:XML中引入根標簽,以將XML元素列表嵌入到單個結(jié)構(gòu)中。

帶ID前綴的標簽名稱

QML_csx的每個基本元素類型和鏈接類型都帶有一個惟一的標簽和ID前綴,如表3所示。

表3QML_csx的標簽和ID前綴列表

標簽ID前綴備注

根<MQI>mqiXML根標簽

基本元素類型

實體<entity>x度量適用的對象

度量<measure>me僅限統(tǒng)一數(shù)值量

5

GB/TXXXXX—XXXX/ISO24617-11:2021

標簽ID前綴備注

關系符<relator>c觸發(fā)鏈接相關度量

鏈接類型

度量鏈接<mLink>mL將度量和實體相關聯(lián)并由度量觸發(fā)。

比較鏈接<cLink>cL將一個度量與另一個或更多度量相關聯(lián)。

注:XML中每個ID的屬性名稱為xml:id,每個值都是一個ID前綴,后跟一個正整數(shù),例如<entityxml:id=“x25”/>。

根<MQI>的屬性規(guī)范

列表1:擴展BNF中<MQI>的屬性列表(Backus-Naur形式)

attributes=identifier,target,[lang],[mediumType],[source];{*Attributesin

squarebracketsareoptional;otherwise,theyarerequired.*}

identifier=mqi+positiveinteger;

target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsin

datasourcesorsuchasegmentsequencedirectlyquoted*};

lang=CDATA;{*referstoISO639standardonlanguagecodes*}

mediumType=CDATA;{*text,video,image,etc.*}

source=CDATA.{*referstothesourceofthedata*}

基本元素類型的屬性規(guī)范

列表2:擴展BNF中<entity>的屬性列表

attributes=identifier,target,type,[comment];

identifier=x+positiveinteger;

target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsin

datasourcesoramarkable*}

type=CDATA;{*someontologicaltypessuchas“person”,“vehicle”,etc.*}

comment=CDATA.

列表3:擴展BNF中<measure>的屬性列表

attributes=identifier,target,num,[unit],type,[comment];

identifier=me+positiveinteger;

target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsin

datasourcesoramarkable*}

num=realnumbers;

unit=CDATA;

{*Theattribute@unitisnotspecifiedwhenameasureisassociatedwiththedegree

ofefficiencysuchasJohn’sscoreis95orsomegraderangefrom0to1.*}

type=CDATA;{*L-dimensionaltypesincludelength,width,height,breadth,area,and

volume,etc.*}

comment=CDATA.

列表4:擴展BNF中<relator>的屬性列表

attributes=identifier,target,type,[comment];

identifier=r+positiveinteger;

target=IDREF|CDATA;{*referstotheIDofasequenceofcommunicativesegmentsin

datasourcesoramarkable*}

type=CDATA;{*mathematicaloperatorforcaseslike“greaterthan”,orrelation

forcaseslike“between”*}

comment=CDATA.

6

GB/TXXXXX—XXXX/ISO24617-11:2021

鏈接類型的屬性規(guī)范

根據(jù)ISO24617-6給出的語義標注框架原則,要求每個鏈接結(jié)構(gòu)的形式為<η,E,ρ>,其中,η為

實體結(jié)構(gòu),E為一組實體結(jié)構(gòu),ρ為它們之間的關系。

注:實體結(jié)構(gòu)是一對<m,s>,其中m表示標記符,s表示標注在m上的語義信息。

數(shù)量標記語言中有兩種鏈接類型,在基于XML的QML_csx中,其標簽為<mLink>和<cLink>。它們的

屬性如列表5和列表6所示。

在QML_csx中,實體結(jié)構(gòu)命名為η@measureID,實體結(jié)構(gòu)為E@appliedTo集,用于度量鏈接

<mLink>,以及關系為ρ@relType。

列表5:擴展BNF中<entity>的屬性列表

attributes=identifier,measureID,appliedTo,relType,[comment];

identifier=mL+positiveinteger;

measureID=IDREF;{*IDof<measure>*}

appliedTo=IDREFS;{*IDsof<entity>stowhichthevalueof<measure>applies*}

relType=“measures”;{*followsthespecificationofISO24617-1:2012ISO-TimeML*}

comment=CDATA.

列表6:擴展BNF中<cLink>的屬性列表

attributes=identifier,measure1,measure2,relType,[comment];

identifier=cL+positiveinteger;

measure1=IDREF;{*IDof<measure>*}

measure2=IDREFS;{*IDsof<measure>*}

relType=CDATA;{*typeofalinkthatcomparesonemeasuretoanothermeasureorother

measures

*}

comment=CDATA.

QML_csx的說明

5.6.1概述

本條說明了QML_csx如何表示文本中可度量數(shù)量信息的標注。

5.6.2示例數(shù)據(jù)

為了進行說明,標注了以下示例數(shù)據(jù):

<textxml:id=“t1”>Miais165cmtall.</text>

<textxml:id=“t2”>Johnismorethantwometrestall.</text>

<textxml:id=“t3”>hba1cbetween7,5-9%.</text>

5.6.3標注程序

5.6.3.1概述

在進行詳細說明之前,使用5.6.2提供的示例數(shù)據(jù)對可度量數(shù)量信息標注的每個步驟進行說明。

5.6.3.2預處理:分詞和錨定

在將QML_csx的語義標注應用于某些特定的語言數(shù)據(jù)之前,需要對數(shù)據(jù)進行預處理,例如通過分

詞。示例數(shù)據(jù)t1的分詞用如下所示的內(nèi)聯(lián)元素表示。

(1)<wordSegxml:id=”ws1”target=”#t1”lang=”en”>

<wxml:id=”w1”>Mia</w>

<wxml:id=”w2”>is</w>

<wxml:id=”w3”>165</w>

7

GB/TXXXXX—XXXX/ISO24617-11:2021

<wxml:id=”w4”>cm</w>

<wxml:id=”w5”>tall</w>

<punctxml:id=”p1”>.</punct>

</wordSeg>

也可以用更簡單的方式表示:

(2)<wordSegxml:id=”ws1”target=”#t1”lang=”en”>Mia_w1is_w2165_w3cm_w4

tall_w5._p1</wordSeg>

根據(jù)分詞數(shù)據(jù),如(1)或(2),選擇標記符,并分配一個適當?shù)膶嶓w類型,如下所示。

Mia_x1is[165cmtall]_me1.

5.6.3.3用于說明的可度量數(shù)量信息標注

然后,使用可度量數(shù)量信息標注分詞和錨定數(shù)據(jù),如下所示。

(1)<wordSegxml:id=”ws1”target=”#t1”lang=”en”>

Mia_w1is_w2165_w3cm_w4tall_w5._p1

</wordSeg>

(2)<MQIxml:id=”qi1”target=”#ws1”lang=”EN”>

<entityxml:id=“x1"target=“#w1"type=“person"/>

<measurexml:id=“me1"target=“#w3,#w4,#w5""num=“165"unit=“cm"type=

“height“/>

<mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/>

</MQI>

5.6.3.4標注

對于示例數(shù)據(jù)t2,一個標簽為<relator>的數(shù)量關系觸發(fā)一個標簽為<cLink>的比較關系,該比較

關系將一個度量與另一個或更多度量相關聯(lián)。

(1)<wordSegxml:id=”ws2”target=”#t2”lang=”EN”>

John_w1is_w2more_w3than_w4two_w5metres_w6tall_w7._p1

</wordSeg>

(2)<MQIxml:id=”qi2”target=”#ws2”>

<entityxml:id=“x1"target=“#w1"type=“person"/>

<measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>

{*The<measurexml:id=“me1">isanon-consumingtagthatisunderstoodasbeing

anchoredtoanemptysequenceoftextualstrings*}

<measurexml:id=“me2"target=“#w5,#w6,#w7”num=“2"unit=“metres"type=

“height”/>

<relatorxml:id=“c1”target=“#w3,#w4”type=“greaterThanOrEqual”>

<cLinkxml:id=“cL1"measure1=“#me1”measure2=“#me2"relType=

“greaterThanOrEqual”/>

<mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/>

</MQI>

對該標注的解釋是:說明一個名為“約翰”的人身高大于2米。

示例數(shù)據(jù)t3的標注如下。

注:更多標注示例,請參見附錄A。

(1)<wordSegxml:id=”ws3”target=”#t3”lang=”en”>

hba1c_w1between_w27,5_w3-_w49_w5%_w6._p1

</wordSeg>

(2)<MQIxml:id=”qi3”target=”#ws3”>

<entityxml:id=“x1"target=“#w1"type=“medicalConcept"/>

8

GB/TXXXXX—XXXX/ISO24617-11:2021

<measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>

<measurexml:id=“me2"target=“#w3,#w6”num=“7.5"unit=“%”type=“testValue”

/>

<measurexml:id=“me3"target=“#w5,#w6”num=“9"unit=“%"type=“testValue”

/>

<relatorxml:id=“c1”target=“#w2,#w4”type=“between”>

<cLinkxml:id=“cL1"measure1=“#me1”measure2=“#me2"relType=

“greaterThanOrEqual”/>

<cLinkxml:id=“cL2"measure1=“#me1”measure2=“#me3"relType=“l(fā)owerThanOrEqual”

/>

<mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/>

</MQI>

6數(shù)量標記語言(QML_cst)基于TEI的具體語法

數(shù)量標記語言(QML_cst)的具體語法

6.1.1概述

基于TEI的具體語法QML_cst分兩步介紹。第一步是在6.1.2中列出QML_cst的標簽名和ID前綴。

第二步是為R中列出的每個鏈接類型指定B中列出的基本元素類型(參見4.4)。

6.1.2帶ID前綴的標簽名稱

根據(jù)TEIP5指南,QML_cst有三種基本元素類型和兩種鏈接類型,每種類型都帶有一個唯一的標

簽和ID前綴,如表4所示。

表4QML_cst的標簽和ID前綴列表

標簽ID前綴備注

根<MQI>mqiXML根標簽

基本元素類型

ObjectType<ObjectType>obj描述所述對象的類型

度量<measure>me是指對象的量

關系符<relator>re觸發(fā)鏈接相關度量

鏈接類型

度量鏈接<linktype=mL將度量和實體相關聯(lián)并由度量觸發(fā)。

“measure”>

比較鏈接<linktype=cL將一個度量與另一個或更多度量相關聯(lián)。

“comparison”>

注:與QML_csx相同,ID作為全局屬性,是進行統(tǒng)一表示的,每個值都是一個ID前綴,后跟一個正整數(shù),在XML中為

xml:id,例如,<ObjectTypexml:id=“obj3”/>。

6.1.3基本元素類型的屬性規(guī)范

列表7:擴展BNF中<ObjectType>的屬性列表

attributes=identifier,[comment];

identifier=obj+positiveinteger;

comment=CDATA.

9

GB/TXXXXX—XXXX/ISO24617-11:2021

列表8:擴展BNF中<measure>的屬性列表

attributes=identifier,quantity,unit,type,[comment];

identifier=me+positiveinteger;

quantity=realnumbers;

unit=CDATA;

type=CDATA;{*L-dimensionaltypesincludelength,width,height,breadth,area,and

volume,etc.*}

comment=CDATA.

列表9:擴展BNF中<relator>的屬性列表

attributes=identifier,type,name,[comment];

identifier=re+positiveinteger;

type=“relation”;

name=CDATA;{*mathematicaloperatorforcaseslike“greaterthan”,orrelation

forcaseslike“between”*}

comment=CDATA.

6.1.4兩種鏈接類型的屬性規(guī)范

在基于TEI的QML_cst中,有兩種鏈接類型,其標簽為<linktype=“measure”>和<linktype=

“comparison”>。它們的屬性如列表10和列表11所示。

根據(jù)TEIP5指南,實體結(jié)構(gòu)η和一組實體結(jié)構(gòu)E均包括在@targetof<linktype=“measure”>

和@targetof<linktype=“comparison”>中,關系ρ由@type和@subtype表示。

列表10:擴展BNF中度量鏈接的屬性列表

attributes=identifier,type,target,[subtype],[comment];

identifier=mL+positiveinteger;

type=“measure”;

target=IDREFS;{*IDof<measure>andIDsof<entity>stowhichthevalueof<measure>

applies*}

subtype=“measures”;{*followsthespecificationofISO24617-1:2012ISO-TimeML*}

comment=CDATA.

列表11:擴展BNF中比較鏈接的屬性列表

attributes=identifier,type,target,[subtype],[comment];

identifier=cL+positiveinteger;

type=“comparison”;

target=IDREFS;{*IDsof<measure>s*}

subtype=CDATA;{*typeofarelationthatcomparesonemeasuretoanothermeasureor

othermeasures*}

comment=CDATA.

QML_cst的說明

6.2.1概述

本條說明了QML_csx如何表示文本中可度量數(shù)量信息的標注

6.2.2示例數(shù)據(jù)

為了進行說明,標注了以下示例數(shù)據(jù):

<textxml:id=“t9”>TheLaboratoryisabout120m<sup>2</sup></text>

<textxml:id=“t10”>Thebuildingishigherthan80m.</text>

<textxml:id=“t11”>Oxygensaturationbetween90-95%.</text>

6.2.3基于TEI的具體語法的說明

(1)A:

10

GB/TXXXXX—XXXX/ISO24617-11:2021

<textxml:id=“t9”>

<sxml:id=“s1”>

<phrxml:id=“phr1”>

<w>The</w>

<w>Laboratory</w>

</phr>

<w>is</w>

<w>about</w>

<phrxml:id=“phr2”>

<w>120</w>

<w>m<sup>2</sup></w>

</phr>

<c>.</c>

</s>

</text>

B:

<objectTypexml:id=“obj1”>

<measurexml:id=“me1”type="area"quantity="120"unit="<sup>2</sup>">

<linkGrp>(referstofeaturestructurerepresentation)

<linktarget="#phr1#obj1"/>#linkedtextelementswithfeaturestructures

<linktarget="#phr2#me1"/>#linkedtextelementswithfeaturestructures

<linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/>#definedby

QML

</linkGrp>

</objectType>

(2)A:

<textxml:id=“t10”>

<sxml:id=“s1”>

<phrxml:id=“phr1”>

<w>The</w>

<w>building</w>

</phr>

<w>is</w>

<phrxml:id=“phr2”>

<w>higher</w>

<w>than</w>

</phr>

<phrxml:id=“phr3”>

<w>80</w>

<w>m</w>

</phr>

<c>.</c>

</s>

</text>

B:

<objectTypexml:id=“obj1”>

<measurexml:id=“me1”type=""quantity=""unit="">

<measurexml:id=“me2”type="height"quantity="80"unit="m">

<linkGrp>(referstofeaturestructurerepresentation)

11

GB/TXXXXX—XXXX/ISO24617-11:2021

<linktarget="#phr1#obj1"/>#linkedtextelementswithfeaturestructures

<linktarget="#phr2#re1"/>#linkedtextelementswithfeaturestructures

<linktarget="#phr3#me1"/>#linkedtextelementswithfeaturestructures

<linktype=“comparison”xml:id=“cL1"target=“#me1#me2”subtype=

“greaterThan”/>

<linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/>

</linkGrp>

</objectType>

(3)A:

<textxml:id=“t11”>

<sxml:id=“s1”>

<phrxml:id=“phr1”>

<w>Oxygen</w>

<w>saturation</w>

</phr>

<wxml:id=“wd1”>between</w>

<phrxml:id=“phr2”>

<w>90</w>

<c>-</c>

<w>95</w>

<c>%</c>

</phr>

</s>

</text>

B:

<objectTypexml:id=“obj1”>

<measurexml:id=“me1”type=""quantity=""unit="">

<measurexml:id=“me2”type="testValue"quantity="90"unit="%">

<measurexml:id=“me3”type="testValue"quantity="95"unit="%">

<linkGrp>(referstofeaturestructurerepresentation)

<linktarget="#phr1#obj1"/>#linkedtextelementswithfeature

structures

<linktarget="#wd1#re1"/>#linkedtextelementswithfeaturestructures

<linktarget="#phr2#me1"/>#linkedtextelementswithfeature

structures

<linktype=“comparison”xml:id=“cL1"target=“#me1#me2”subtype=

“greaterThan”/>

<linktype=“comparison”xml:id=“cL1"target=“#me1#me3”subtype=

“l(fā)owerThan”/>

<linktype=“measure”xml:id=“mL1"target=“#me1#obj1”/>

</linkGrp>

</objectType>

12

GB/TXXXXX—XXXX/ISO24617-11:2021

A

A

附錄A

(資料性附錄)

帶更多示例的QML_csx的說明

A.1示例數(shù)據(jù)

為了對QML_csx進行說明,除了5.6.2之外,還標注了以下示例數(shù)據(jù)。

<textxml:id=“t4”>Whitebloodcellcount>14,0X109/L.</text>

<textxml:id=“t5”>fastingbloodsugarlevel>/=125mg/dlbut</=279mg/dl.

</text>

<textxml:id=“t6”>theareaofasoccerpitchvarieswithinalimitof90-120m

inlengthand45-90minwidth.</text>

<textxml:id=“t7”>threepeopleintheroom,allhigherthan180cm.</text>

使用QML_csx進行標注

(1)a.<wordSegxml:id=”ws4”target=”#t4”lang=”en”>

White_w1blood_w2cell_w3count_w4>_w514.0_w6X_w7109_w8/_w9L_w10._p1

</wordSeg>

b.<MQIxml:id=”qi4”target=”#ws4”>

<entityxml:id=“x1"target=“#w1,#w2,#w3"type=“medicalConcept"/>

<measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>

<measurexml:id=“me2"target=“#w4,#w6,#w7,#w8,#w9,#w10”num=“14,0X109"

unit=“L"type=“count”/>

<relatorxml:id=“c1”target=“#w5”type=“greaterThanOrEqua/”>

<cLinkxml:id=“cL1"measure1=“#me1”measure2=“#me2"relType=

“greaterThanOrEqual”/>

<mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"/>

</MQI>

(2)a.<wordSegxml:id=”ws5”target=”#t5”lang=”en”>

fasting_w1blood_w2sugar_w3level_w4>/=_w5125_w6mg/dl_w7but_w8</=_w9279_w10

mg/dl_w11._p1

</wordSeg>

b.<MQIxml:id=”qi5”target=”#ws5”>

<entityxml:id=“x1"target=“#w1,#w2,#w3"type=“medicalConcept"/>

<measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>

<measurexml:id=“me2"target=“#w4,#w6,#w7”num=“125"unit=“mg/dl"type=

“l(fā)evel”/>

<measurexml:id=“me3"target=“#w4,#w10,#w11”num=“279"unit=“mg/dl"type=

“l(fā)evel”/>

<relatorxml:id=“c1”target=“#w5”type=“greaterThanOrEqual”>

<cLinkxml:id=“cL1"measure1=“#me1”measure2=“#me2"relType=

“greaterThanOrEqual”/>

<relatorxml:id=“c2”target=“#w9”type=“l(fā)owerThanOrEqual”>

<cLinkxml:id=“cL2"measure1=“#me1”measure2=“#me3"relType=

“l(fā)owerThanOrEqual”/>

<mLinkxml:id=“mL1"measureID=“#me1”appliedTo=“#x1"relType=“measures"

/>

13

GB/TXXXXX—XXXX/ISO24617-11:2021

</MQI>

(3)a.<wordSegxml:id=”ws6”target=”#t6”lang=”en”>

the_w1area_w2of_w3a_w4soccer_w5pitch_w6varies_w7within_w8a_w9limit_w10of_w11

90_w12

-_w13120_w14m_w15in_w16length_w17and_w1845_w19-_w2090_w21m_w22in_w23width_

w24._p1

</wordSeg>

b.<MQIxml:id=”qi6”target=”#ws6”>

<entityxml:id=“x1"target=“#w4,#w5,#w6"type=“sportFacilite"/>

<measurexml:id=“me1"target=“”num=“”unit=“”type=“”/>

<measurexml:id=“me2"target=“#w12,#w17”num=“90"unit=“m"type=“l(fā)ength”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論