基于本體的多媒體信息的組織技術研究_第1頁
基于本體的多媒體信息的組織技術研究_第2頁
基于本體的多媒體信息的組織技術研究_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于本體的多媒體信息的組織技術研究摘要: 為了有效利用多媒體資源,挖掘資源背后語義內容并分析它們,本文通過本體理論來建立一個統(tǒng)一描述多媒體資源框架。選用了OWL (Web Ontology Language)作為本體形式化描述語言, 而多媒體信息資源適合于網(wǎng)絡傳播和瀏覽。另外RDF (S)資源描述框架提供了一種標準化的,具有互操作性的多媒體元數(shù)據(jù)模型。在實際中,本框架對多媒體進行組織、查詢和交換得到應用。關鍵詞:本體;多媒體;信息組織;信息管理1引言 隨著現(xiàn)代計算機技術、網(wǎng)絡技術和多媒體技術的迅速發(fā)展,各種多媒體數(shù)據(jù)的急劇增長,多媒體信息在網(wǎng)絡上的表示和獲取已經(jīng)成為計算機及其相關學科的研究熱點

2、課題。過去的組織和應用多媒體資源呈現(xiàn)了一系列缺點:混亂、邏輯差、擴展和缺乏的必要的組織架構,對不同的多媒體資源有較弱的識別和管理。如何克服上述缺陷,在統(tǒng)一的描述框架集成了眾多的多媒體資源,并基于此框架支持不同的應用程序,對于數(shù)據(jù)處理和識別、管理多媒體資源都是必要的。本文采用本體方法通過RDF(資源描述框架)和XML提供一個統(tǒng)一的資源描述框架多媒體資源。基于這個框架, 通過部分邏輯和推理的過程,可以有效地組織和應用多媒體資源。 2.本體及相關技術 2.1本體的基本概念 本體論(Ontology)的概念最初起源于哲學領域,是形而上學理論研究的一個分支,與認識論相對。1991年,在人工智能領域,Ne

3、ches等人最早給出Ontology定義,Neches認為“An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the vocabulary.”即“一個本體給出構成相關領域詞匯的基本術語和關系,以及利用這些術語和關系構成的規(guī)則定義這些詞匯的外延規(guī)則。1993年美國斯坦福大學知識系統(tǒng)實驗室(Knowledge S

4、ystem Laborary,簡稱KSL)的Gruber給出了本體在信息科學領域被廣泛接受的定義:“An ontology is an explicit specification of a conceptualization”。即“本體是概念化的明確的規(guī)范化說明”。這也是最著名并被引用最為廣泛的定義。 盡管本體的定義有很多不同的方式和不同的側重點,但從內涵上來講,本體的概念有下面四層含義: 第一,概念化(conceputalization):通過抽象出客觀世界中一些現(xiàn)象(phenomenon)的相關概念而得到的模型,其表示的含義獨立于具體的環(huán)境狀態(tài)。 第二, 明確(explicit):概念與

5、概念之間的聯(lián)系及使用這些概念的約束都被明確定義。 第三,形式化(formal):有精確的數(shù)學描述,是計算機可讀的。 第四,共享(Share):本體中體現(xiàn)的是共同認可的知識,反映的是相關領域中公認的概念集,它所針對的是團體而不是個體。 2.2多媒體技術 所謂多媒體技術, 就是利用計算機技術把文本、圖形、圖像、聲音等多媒體綜合一體化, 使之建立起邏輯連接,并能對它們獲取、編輯、加工處理、存儲和展示。從研究和發(fā)展的角度看, 多媒體技術具有如下的特征: (1)信息載體的多樣化 信息載體的多樣化指的是信息媒體的多樣化, 即把計算機所能處理的信息空間范圍擴展和放大, 而不再局限于數(shù)值、文本或是被特別對待的

6、圖形或圖像, 這是計算機變得更加人類化所必須的條件。 (2)集成性 多媒體信息的集成性首先是指可將多種不同的媒體信息(如文本、 圖形、 圖像、 聲音)有機地進行同步組合成一個完整的多媒體信息。集成性的另一層含義是把不同的輸入媒體(鍵盤、攝像機、光筆、話筒等設備)或輸出媒體(顯示器、 喇叭等)集成在一起, 形成一個整體。 (3)實時性 多媒體技術由于是多種媒體集成的技術, 其中聲音及活動的視頻圖像是和時間密切相關的, 甚至是強實時的。這決定了多媒體技術必然要支持實時處理。 3多媒體信息的組織管理技術 3.1如何組織多媒體信息 信息及數(shù)據(jù)管理是信息系統(tǒng)的核心問題之一。多媒體的數(shù)據(jù)量巨大、多媒體的種

7、類繁多、每種媒體之間的差別又是那么明顯, 但又具有種種信息上的關聯(lián), 這些都給數(shù)據(jù)與信息的管理帶來了新的問題。如何管理和組織這些數(shù)據(jù)? 如何從各種各樣媒體數(shù)據(jù)中找到所要信息?如何表現(xiàn)這些多媒體信息?這些都是傳統(tǒng)的數(shù)據(jù)庫理論和方法尚沒有很好解決的問題。關系數(shù)據(jù)庫的方法推動了數(shù)據(jù)庫的研究和發(fā)展, 但在處理非規(guī)則數(shù)據(jù)方面又不那么適應, 而多媒體數(shù)據(jù)大多都是非規(guī)則化的數(shù)據(jù)。 3.2構建多媒體信息領域本體 出于本體資源可重用性和開發(fā)協(xié)同性的考慮,一般不會將所有媒體概念和屬性類本體定義在一個文件里,而是按照不同的媒體格式分別定義在不同的本體文件里,在文件中利用owl: imports屬性可以在各個本體文件

8、之間實現(xiàn)資源調用(見下圖,所有的owl文檔存儲于關系數(shù)據(jù)庫中,通過查詢獲取關系數(shù)據(jù)庫中相關信息的存儲地址),如果需要,我們還可以將單個媒體類型本體文件按照概念定義到多個本體文件中。本文選用了OWL (Web Ontology Language)作為本體形式化描述語言, OWL的優(yōu)點是定義完備,以Web資源為描述對象,而且是W3C的推薦標準,而多媒體信息資源適合于網(wǎng)絡傳播和瀏覽。另外RDF (S)資源描述框架提供了一種標準化的,具有互操作性的多媒體元數(shù)據(jù)模型。MPEG-7提供的描述語言DDL可用于深刻描述多媒體信息的各項特征,用戶可以有效地搜尋、過濾和定義想要的影音資料。 選用對以上技術提供良好

9、支持的Protg-2000+OWL插件作為本體構建工具, Protg-2000是由斯坦福大學醫(yī)學院的醫(yī)學情報學研究組開發(fā)研制并在Java環(huán)境中開發(fā)出來的,與其它工具相比其優(yōu)勢在于: (1)具有圖形化的用戶界面; (2)對Unicode字符集輸入的支持; (3)可以免費下載系統(tǒng)安裝軟件和插件(如OWL插件); (4)有為數(shù)眾多的用戶的支持,有利于本體的交流與合并。 3.3本體對多媒體信息組織的作用 本體方法作為一種全新的信息組織方法,具有傳統(tǒng)信息組織方法所不具備的功能和特點,為多媒體信息組織帶來新的變革,并成為多媒體信息組織的核心概念。首先,它是一種直接體現(xiàn)語義的多媒體信息組織。基于分類或主題的

10、多媒體信息組織,所表達的語義都是隱含的,只能被它們的建立者或開發(fā)人員所理解、掌握和使用,不能直接表達為機器(計算機)所理解的形式化的語義。而基于本體的多媒體信息組織借助本體描述語言,就可以直接表達為機器“可理解”的、顯式的、明確的、形式化的語義,方便計算機的“理解和處理”。同時,由于本體中定義的概念是在一定的語義環(huán)境或限制規(guī)則下完成的,因此,在表達概念及其含義時更加清晰和準確,在進行信息組織時也更加規(guī)范。其次,它是多維、網(wǎng)狀的信息組織方式。傳統(tǒng)的基于分類或主題的信息組織方式是線性的、一維的,本體則采用了容易為計算機所接受和處理的體現(xiàn)描述邏輯的知識表現(xiàn)和信息組織方式,概念及其之間的關系形成了一個多維的語義網(wǎng)絡。這不僅有利于網(wǎng)上各種不同類型、不同結構的信息資源的集中與整合,而且更加有利于它們之間關系的描述和揭示。 4結論 基于本體的多媒體信息組織,能將多媒體信息提煉成知識,對多媒體信息資源進行知識重組和表示,實現(xiàn)計算機對多媒體信息資源的自動組織,從而為用戶提供智能的檢索與服務。本體的出現(xiàn)和發(fā)展為現(xiàn)代信息組織,特別是多媒體信息組織注入了新的活力,其體現(xiàn)的思想和方法必將促進信息組織向知識組織轉變。 參考文獻: 【1】楊學良. 多媒體計算機技術及其應用. 北京: 電子工業(yè)出版社,1995 【2】鄧志鴻,唐世渭等.on

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論