基于軟件工程開發(fā)領域本體構建探究_第1頁
基于軟件工程開發(fā)領域本體構建探究_第2頁
基于軟件工程開發(fā)領域本體構建探究_第3頁
基于軟件工程開發(fā)領域本體構建探究_第4頁
基于軟件工程開發(fā)領域本體構建探究_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基于軟件工程開發(fā)領域本體構建探究摘要本文提出了一種基于軟件工程開發(fā)的領域本體構 建框架,其中利用結構化方法從整體上將領域本體構建過程 劃分為規(guī)劃、分析、設計、實施與運行5個階段,而在領域 本體分析階段又利用原型化方法進行領域概念及概念關系 的分析與設計。在領域本體構建中將兩種軟件工程開發(fā)方法 相結合,揚棄了各自的優(yōu)缺點,使生成的領域本體更高效地 滿足用戶的需求。關鍵詞領域本體;本體構建;結構化方法;原型化方 法中圖分類號jtp311文獻標識碼a(文章編號)10080821 (2012) 08003704目前流行的領域本體構建方法有:英國edinbunrgh大 學ai應用研究所的enterpri

2、se項目組開發(fā)的“骨架法”, 該方法使用middle一out開發(fā)方式提供與商業(yè)和企業(yè)有關的 術語及其定義的集合;加拿大toronto大學企業(yè)集成實驗室 開發(fā)了 tove項目本體,通過該本體來建立指定知識的邏輯 模型;bernaras等人開發(fā)的歐洲eaprit kactus項目中由應 用來控制本體的開發(fā),每個應用都有相應的知識本體,這些 本體即能復用其他的本體,又能集成到項目以后的本體應用 中;西班牙m(xù)adrid理工大學ai實驗室開發(fā)的,methontology 法構建知識級本體;美國southern california大學信息科 學研究所開發(fā)的sensus法,主要通過自然語言處理,提取 和合

3、并不同電子知識源的信息而得到該領域本體的內(nèi)容。本文借鑒了上述傳統(tǒng)領域本體構建方法中的基本思想, 并在構建框架中融合了軟件工程開發(fā)方法中的結構化開發(fā) 方法和原型化開發(fā)方法。1傳統(tǒng)領域本體構建方法分析1. 1共同點分析縱觀上述“骨架法”、“評估法”、“bernaras”、 "methonotology”及"sensus"方法構建領域本體過程中 的思路,它們之間存在以下共同點:(1) 許多本體構建方法都以一個具體任務為起點,這 樣易于知識的獲取和本體功能的描述。(2) 本體構建大致可劃分為階段法(如骨架法)和演 化法(如 methontology 法)。(3) 在構建過

4、程中可分為"非形式化描述本體”和用 正規(guī)描述語言“形式化描述本體”前后兩個階段。(4) 希望通過累積的方法構建本體,即先構建一個基 礎本體,然后做進一步開發(fā)。(5) 對于由同一個基礎本體構建出的領域本體,由于 高層概念的共享,本體系統(tǒng)之間具有互操作能力。1. 2缺陷分析ieee 10741995標準是軟件開發(fā)生命周期過程的標準, 其中包括模型階段、項目管理階段、軟件開發(fā)階段與集成階 段4個開發(fā)階段,其中軟件開發(fā)階段的具體步驟如下:(1) 開發(fā)前期:主要進行可行性研究等活動;(2) 開發(fā)階段:主要進行需求分析、設計和實現(xiàn)等活 動;(3) 開發(fā)后期:主要進行軟件的安裝、試運行、操作 和維

5、護等活動。與ieee 10741995標準對比而言,目前領域本體構建 還遠遠沒有成為一種工程性活動,還具有如下缺陷:(1) 沒有一種方法是完全成熟的,不論是bemaras法、 sensus法、骨架法、評估法,還是methontology法。(2) 缺乏工程化的本體通用構造方法和標準。由于每 個研發(fā)團隊處于不同的學科領域,雖然總結出各個領域不同 的開發(fā)方法和體系結構,但是各個本體開發(fā)方法都不盡統(tǒng) 一,缺乏通用的標準。本文在領域本體構建過程中揚棄上述5種領域本體構建 方法中的優(yōu)缺點,而且借鑒了軟件工程開發(fā)的基本標準。2基于軟件工程開發(fā)的領域本體構建2. 1構建框架本文在領域本體框架構建的形式上采用

6、結構化方法中 分段式模式,將整個領域本體構建過程分為領域本體規(guī)劃階 段、領域本體分析階段、領域本體設計階段、領域本體實施 階段及領域本體運行階段,每個階段都有自己獨立的目標及 主要任務,前一階段任務的完成是后一階段任務開始的前提 和基礎,后一階段任務通常是對前一階段提出的解決問題方 法的進一步具體化,即該過程是按照軟件工程開發(fā)的生命周 期流程來逐步解決問題的。在領域本體分析階段,根據(jù)領域 本體規(guī)劃階段提出的具體要求和目標,采用原型化方法不斷 地對分析結果進行修改和完善。其構建框架如圖1所示。2.2構建框架分析2. 2. 1領域本體規(guī)劃階段(1) 確定領域本體的用途和范圍確定領域本體范圍的方式之

7、一是設計并填寫本體的性 能調(diào)查表,以下從需求的角度對本體支持的性能調(diào)查表進行 簡單的分類: 需求細化。需求細化過程必須滿足何種標準?會產(chǎn)生 多余的需求嗎?需求是客戶的清晰表述嗎? 需求追溯能力。需求還能分解嗎?需求的來源是什 么?誰記錄需求?需求在特定的設計團隊中適用嗎? 需求滿足。需求能夠滿足嗎?兩個或多個需求間相互 沖突嗎?更高抽象級別的需求怎樣滿足評估? 文檔生成。需求屬于哪類文檔?哪些是與需求文檔中 的段落相符的需求?不屬于客戶報告的需求有哪些(商業(yè)機 密)? 升級。這是需求的最新版本嗎?需求的舊版本有哪 些?為什么還要改變需求?變化對需求文檔的一致性和完 整性有影響嗎?(2) 考慮復

8、用現(xiàn)有領域本體一些本體已經(jīng)初具規(guī)模,可以在網(wǎng)上找到相應的本體庫 及相關資料,在具體開發(fā)之前,有必要在這些本體中尋找系 統(tǒng)可以重用的本體,這樣可以省去元本體和頂層本體的建 立,而把本體建立的目標重點放在領域本體的建立上。2. 2. 2領域本體分析階段(1)定義類和類層次類描述了領域的概念而非單詞。在類和類層次的定義過 程中,需要依據(jù)以下8個原則: 確保類層次的正確性恰當使用is一a和kind-of等類間關系,is-a關系指類 a是類b的子類,前提是b的每個實例也是a的實例。類的 子類表示概念是kind-of父類表示的概念;層次關系間具有 傳遞性,并應區(qū)分直接子類和間接子類的關系;避免類層次 的循

9、環(huán),確保類層次隨著領域發(fā)展而進化。分析類層次中的兄弟關系在類層次中,兄弟關系是同一類的直接子類,并在同一 抽象級別上。關于直接子類的個數(shù)并沒有明確規(guī)定,但父類 一般只有2-12個直接子類,過多或過少不都合適。 多重繼承關系一個類可以是幾個類的子類,則子類的實例是其所有父 類的實例,子類將繼承所有父類的屬性和關系約束。 引入新類的時機當類的子類有其父類不具有的新屬性,或有已定義的新 屬性值,或覆蓋父類屬性的約束,此時可以引入一個新類。 新類可以沒有任何新的屬性,沒有必要為了一個額外的限定 條件來創(chuàng)建新類。 新類或特性值如果有不同屬性值的概念變成其他類中不同屬性的約 束,則應該生成新類,以便加以區(qū)

10、別;類的單個實例不應經(jīng) 常改變,當使用概念的外在(非固有)屬性來區(qū)別類時,這 些類的實例將需從一個類移動到另一類。 類或實例判斷類結束和單個實例開始依賴于知識表示中最低的 粒度級,而粒度級又由本體應用來確定;如果概念已經(jīng)形成 自然的層次,則應表述為類,單個實例是最特殊的概念表述, 實例沒有層次性。 限定范圍確保不包括類具有的所有特性,僅在本體中表述類最突 出的特性,不增添所有類(術語)間全部的關系。 不相關子類很多系統(tǒng)明確指定某些子類不相交,如果類沒有任何共 同的實例,則它們不相交。(2)定義類的屬性及其約束類的屬性是描述類和實例的特性,也是類間區(qū)分的特 性。通常有四種對象特性能變成本體中的屬

11、性: 固有的特性,如圓柱的半徑和高度。 外在的屬性,如螺旋的設計者。 局部,若對象是結構化的,物理和抽象的部分。 與其他個體間的關系。不同的約束可以用來描述屬性的值類型、值范圍、值基 準,及值的其他特征。下面從5個方面來描述屬性普通的約 束: 屬性基數(shù)。基數(shù)定義屬性有多少值。有些系統(tǒng)定義單 一和多個基數(shù),而有些系統(tǒng)用最小和最大基數(shù)來描述屬性值 的個數(shù)。有些屬性設置最大基數(shù)為0,目的是為了表示特定 子類的屬性不能有任何值。 屬性值類型。通常屬性值類型可分為字符串型 (string)."浮點或整數(shù)"數(shù)值型(float或integernumber)、"是或否"

12、布爾型(yes或no boolean)、枚舉型 或符號型(enumerated 或 symbol)、實例型(instance)。 屬性的領域和范圍屬性應能描述其領域中所有的類,屬性應能填充其范圍 內(nèi)所有類的實例,同時不應指定屬性的范圍是本體中最通用 的類。 逆屬性屬性值可能會依賴于另一屬性值,稱為逆關系,在兩個 方向保存此數(shù)據(jù)是冗余的,通常使用逆屬性,可以自動填充 另一逆關系的值。 默認值如果類的多數(shù)實例的特定屬性值是相同的,則可把該值 定義成默認值。當類的每個新實例包含這個屬性值時,系統(tǒng) 自動填充默認值,還能把此值改成約束允許的其他值。(3) 生成實例定義類的單個實例首先需要選擇類,接著生成

13、這些類的 單個實例,最后填充屬性值。為了使生成的類、類間層次關系、類屬性及約束、類實 例等更符合構建目標和用途,并為了保障在較短時間內(nèi)適合 用戶的需求,在領域專家的指導下,采用原型化軟件工程開 發(fā)方法對該階段產(chǎn)生的成果不斷修改和完善。2. 2.3領域本體設計階段(1) 領域本體的形式化表示一般用語義模型表示領域本體。perez等人用分類法組 織領域本體,歸納出5個基本建模元語: 類(classes)或概念(concepts)從語義上講,它表示的是對象的集合,其定義一般采用 框架(frame)結構,包括概念的名稱、與其他概念之間的 關系集合、以及用自然語言對概念的描述。 關系(relatiom)

14、在領域中概念之間的交互作用,形式上定義為n維笛卡 爾積的子集,即:r=c1xc2xxcn 函數(shù)(functions)一類特殊的關系。該關系的前n-l個元素可以惟一決定 第n個元素。形式化定義為f: c1xc2xxcn-l-*cno 公理(axioms)代表永真斷言,如概念乙屬于概念甲的范圍。 實例(instances)代表元素,從語義上講實例表示的就是對象。另外,從語義上講基本的關系有4種:整體與部分關系 (partwhole).分類關系(isa)、實例與概念關系 (instance一concept)和屬性關系(attribute-of)o 但在 實際建模過程中,概念之間的關系不限于上述4類關

15、系,可 以根據(jù)領域的具體情況定義相應的關系。(2) 領域本體的形式化描述語言領域本體可用自然語言、框架、語義網(wǎng)絡或邏輯語言等 來描述。但對計算機來說,形式化描述語言做為一種可供計 算機處理的概念模型,應具備以下條件: 應該具有較強的表示能力,同時也應兼顧推理能力, 以滿足智能檢索中進一步實現(xiàn)推理的需求。 應該具有較強的內(nèi)在邏輯系統(tǒng)支持。 應該具備一致的描述概念和表示數(shù)據(jù)的能力。 應該盡可能與w3c已有標準兼容,從而保證其持續(xù)發(fā) 展需求。 應該具備xml語法特性,最好是基于語義web。 所表示的領域知識是形式化的,即機器可讀和可理解 的。目前已經(jīng)開發(fā)了 6種本體語言,有些是直接基于xml語 言的

16、語法,如簡單html本體擴展(simple html ontologyextension, shoe)、本體標記語言(ontology markup language, oml)和基于xml的本體交換語言(xml一based ontology exchange language, xol);另外有 2 種本體語言 是建立于rdf (s)之上,以便改善rdf (s)的特征:本體 交互語言(ontology interchange language, oil)和 darpa 主體標記語言+本體推理層(darap agent markup language with ontology inferen

17、ce layer, daml+oil)。最近,以 oil 和daml+oil語言為起點,已開發(fā)出語義網(wǎng)所用的web本體 語言(web ontology language, owl)o各個本體語言之間的層次化關系如圖2所示:(3)領域本體的文檔化構建和存儲構建領域本體文檔,可對后續(xù)領域本體修改和進化奠定 基礎。1個owl文檔由以下4個部分組成: 本體首部:包含了文檔的元數(shù)據(jù),如導入數(shù)據(jù)、版本 數(shù)據(jù)及與其他owl文檔的兼容數(shù)據(jù)。 類的定義:通過(owl: class)標簽定義類,使用(rdfs: subclassof)來繼承1個或多個類,由此建立類的層次關系。 類的語義用類的描述來表達。owl區(qū)分

18、了 6種類的描述:1 個類標識,1個詳細的列舉,1個屬性的限定,2個或多個類 描述的交,2個或多個類描述的并,1個類描述的補。 屬性的定義:owl存在2種類型的屬性,即對象屬性 (object property)和數(shù)據(jù)類型屬性(datatype property)o對象屬性是用來表述2個類實例之間的關系,而數(shù)據(jù)類型屬 性則描述類的實例、rdf literals,以及xml schema數(shù)據(jù) 類型之間的關系。屬性之間還能夠定義子屬性關系以及為屬 性聲明額外的特征(傳遞屬性和逆屬性)。如能夠定義father 是parent的子屬性,定義ancestor為傳遞屬性,定義child 為parent的逆屬性。 個體(實例)的定義:一個個體是一個特定類的實例, 并與其屬性相聯(lián)系。2. 2.4領域本體實施和運行階段(1) 領域本體評價這里采用gruber在1995年提出的5條準則: 清晰性。所定義的術語應盡量客觀,避免受社會背景 和客觀環(huán)境的影響;給出的定義應盡可能完整。 一致性。即本體中定義的公理應該是邏輯一致的,概 念和概念間關系在邏輯上也應該是一致的。 可擴展性。本體應該能夠保證添加新的通用或專用術 語,而不需要修改原有的定義,即能支持在已有的概念基礎 上定義新術語。 編碼偏好程度最小。概念應該在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論