




已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
(模式識(shí)別與智能系統(tǒng)專業(yè)論文)一種基于邏輯的數(shù)據(jù)集成系統(tǒng)研究與實(shí)現(xiàn).pdf.pdf 免費(fèi)下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中田科學(xué)技術(shù)人學(xué)壩l j 論文種基于邏輯的數(shù)據(jù)集成系統(tǒng)研究與實(shí)現(xiàn) 摘要 如何充分利用現(xiàn)有各類應(yīng)用產(chǎn)生的數(shù)據(jù)資源,即如何在高度異構(gòu)的企業(yè)應(yīng)用環(huán)境下,建 立信息集成應(yīng)用系統(tǒng),為管理決策服務(wù),是當(dāng)前企業(yè)信息化系統(tǒng)建毆發(fā)展的一個(gè)重點(diǎn)方向。 但這涉及數(shù)據(jù)規(guī)范、數(shù)據(jù)表示、數(shù)據(jù)分析,以及數(shù)據(jù)表現(xiàn)等諸多復(fù)雜的技術(shù)難題。從國(guó)內(nèi)外 這幾年在實(shí)施電子商務(wù)、e r p 或應(yīng)用集成等大型項(xiàng)目系統(tǒng)的效果看,僅基于傳統(tǒng)的數(shù)據(jù)庫(kù) 技術(shù),或僅依靠傳統(tǒng)軟件能力的提高,如采用組件、中間件或采用一些先進(jìn)的軟件工具,來 實(shí)施數(shù)據(jù)集成,效果并不理想。在面向密集型數(shù)據(jù)或信息處理為核心應(yīng)用的領(lǐng)域,引進(jìn)人工 智能的思想和方法,為解決傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)的缺】i f j 及傳統(tǒng)軟件能力的不足提供了一種新的手 段和方法。作為一種知識(shí)表達(dá)語(yǔ)言,描述邏輯( d e s c r i p t i o nl o g i c ,d l ) 早已被廣泛應(yīng)用于人工 智能、知識(shí)工程等領(lǐng)域,用作捕捉基于對(duì)象的概念知識(shí)之形式表示語(yǔ)言。將d l 應(yīng)用丁| 信息 集成領(lǐng)域,是目前數(shù)據(jù)集成應(yīng)用研究的一個(gè)新方向。該應(yīng)用的基本技術(shù)特點(diǎn)是:1 ) 用d l 描述數(shù)據(jù)集成系統(tǒng)的中介模式,并作為系統(tǒng)的信息使用入口;2 ) 利用d l 的有效推理服務(wù), 推理概念模式中概念間的包含關(guān)系層次結(jié)構(gòu)和相互關(guān)系,由此來輔助檢查概念模式的合理 性;3 ) 將d l 的推理服務(wù)用于支持?jǐn)?shù)據(jù)集成系統(tǒng)的查詢處理任務(wù)。顯然,將d l 用于數(shù)據(jù) 集成,具有很大的技術(shù)優(yōu)勢(shì),不僅有助于向用戶提供直觀、抽象和知識(shí)化的統(tǒng)一接口,而且 也為數(shù)據(jù)集成查詢處理提供了一種新的技術(shù)手段。 本論文工作,是項(xiàng)目小綢目前正在研發(fā)的“基于描述邏輯的數(shù)據(jù)集成系統(tǒng)”項(xiàng)目中的一 部分,主要包括基于d l 的中介模式管理和基于移動(dòng)代理的數(shù)據(jù)抽取兩部分。在我們的集成 方案中,中介模式是應(yīng)用域概念術(shù)語(yǔ)知識(shí)和事實(shí)知識(shí)( 對(duì)象成員斷言知識(shí)) 的集合,它們構(gòu) 成了所謂的d l 知識(shí)庫(kù)。本文工作在這一部分的工作,主要是設(shè)計(jì)了一個(gè)以圖形界面方式工 作的d l 知識(shí)庫(kù)管理工具,可以很方便地編輯指定的d l 知識(shí)庫(kù)中的概念、角色、個(gè)體和斷言 ! j _ j 屬關(guān)系。它可以與d l 推理機(jī)交互,并利川d l 的推理服務(wù),計(jì)算知識(shí)庫(kù)中概念的滿足性以 及概念間的包含關(guān)系和層次結(jié)構(gòu)。 數(shù)據(jù)抽取是數(shù)據(jù)集成系統(tǒng)的一個(gè)基本環(huán)節(jié)。在復(fù)雜的網(wǎng)絡(luò)環(huán)境下,采用需要持續(xù)連接的 o d b c 、或遠(yuǎn)程過程調(diào)用( r p c ) 等傳統(tǒng)的數(shù)據(jù)鏈接存取技術(shù),對(duì)網(wǎng)絡(luò)連接的穩(wěn)定性、帶寬要 求很高,無法克服抽取過程中經(jīng)常存在的大量冗余數(shù)據(jù)傳輸問題,網(wǎng)絡(luò)適應(yīng)能力很差。而采 用h t t p 協(xié)議結(jié)合x m l 技術(shù)來抽取數(shù)據(jù),雖然很靈活、網(wǎng)絡(luò)適應(yīng)能力也很好,但當(dāng)主要針對(duì) 數(shù)據(jù)庫(kù)為數(shù)據(jù)源、需要抽取大量結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用場(chǎng)合時(shí),也存在傳輸數(shù)據(jù)量大、抽取效率 低和組織困難等問題。而移動(dòng)a g e n t 是基于代碼移動(dòng)理論,它的基本思想是把計(jì)算過程移動(dòng)數(shù) 據(jù)本地而不是把數(shù)據(jù)移動(dòng)到計(jì)算本地,傳輸?shù)氖羌庸そY(jié)果而不是原始的相關(guān)數(shù)據(jù)。因此,從 本質(zhì)上,它能很好適應(yīng)復(fù)雜網(wǎng)絡(luò)環(huán)境下的數(shù)據(jù)抽取應(yīng)用,而且具有平臺(tái)無關(guān)特性。本文提出 并初步實(shí)現(xiàn)了一種基于移耐j a g e n t 技術(shù)的數(shù)據(jù)抽取解決方案:d a t ae x t r a c t i o nu s i n ga g e n t ,它 具有如r 一些特色:1 ) 與平臺(tái)無關(guān)性:2 ) 對(duì)網(wǎng)絡(luò)質(zhì)量要求較低;3 ) 1 1 有效節(jié)約網(wǎng)絡(luò)帶寬:4 ) 部署和維護(hù)代價(jià)比較低;5 ) 具有很好的分布并行計(jì)算能力和較高的抽取效率。 關(guān)鍵字:數(shù)據(jù)集成:描述邏輯;中介模式;自動(dòng)推理;數(shù)據(jù)抽?。阂苿?dòng)代理 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文種基于邏輯的數(shù)據(jù)集成系統(tǒng)研究與實(shí)現(xiàn) a b s t r a c t h o wt om a k ef u l lu s eo fe x i s t i n gd a t ar e s o u r c e sg e n e r a t e db yv a r i o u sa p p l i c a t i o n sn a m e l y h o wt ob u i l di n f o r m a t i o ni n t e g r a t i o ns y s t e mu n d e rh i g hh e t e r o g e n e o u se n v i r o n m e n to fe n t e r p r i s e a p p l i c a t i o na n dt os e r v em a n a g e m e n td e c i s i o n - m a k i n gi sa ni m p o r t a n tr e s e a r c hd i r e c t i o no ft h e c u r r e n te n t e r p r i s ei n f o r m a t i o n i z a t i o nc o n s t r u c t i o n b u ti ti n v o l v e sm a n yc o m p l e xt e c h n o l o g i c a l p r o b l e m ss u c ha sd a t ac r i t e r i o n ,d a t ae x p r e s s i o n ,d a t aa n a l y s i s ,d a t ae x h i b i t i o n ,e t c a c c o r d i n gt o t h ep r a c t i c eo ft h e i m p l e m e n t a t i o no fi a r g ep r o j e c t s s u c ha se b u s i n e s s ,e r ei n f o r m a t i o n i n t e g r a t i o ns y s t e ma n ds oo ni nr e c e n ty e a r s ,t h ee f f e c to fi m p l e m e n t a t i o no f d a t ai n t e g r a t i o ni sn o t p e r f e c t ,o n l yb a s i n g o nt r a d i t i o n a ld a t a b a s e t e c h n o l o g y o rr e l y i n go nt r a d i t i o n a l s o f t w a r e t e c h n o l o g yi m p r o v e m e n t ,s u c ha st h eu s eo fc o m p o n e n t s ,m i d d l e w a r eo ru s i n ga d v a n c e ds o f t w a r e t o o l st h ei n t r o d u c t i o no ft h ei d e a sa n dm e t h o d so fa r t i f i c i a li n t e l l i g e n c et ot h ea p p l i c a t i o nf i e l d w h o s ek e m e | i si n t e n s i v ed a t aa n di n f o r m a t i o no r i e n t e dp r o c e s s i n gp r o v i d e san e wm e a n st os o l v e t h ed e f i c i e n c i e so ft r a d i t i o n a ld a t a b a s e t e c h n o l o g ya n d s o f t w a r et e c h n o l o g y a sak n o w l e d g e e x p r e s s i o nl a n g u a g e ,d e s c r i p t i o nl o g i c ( d l ) h a sb e e nw i d e l ya p p l i e df o ra r t i f i c i a li n t e l l i g e n c e , k n o w l e d g ee n g i n e e r i n g ,a n do t h e rf i e l d s ,u s e da saf o r m a le x p r e s s i v el a n g u a g et oc a t c ho nt h e c o n c e p tk n o w l e d g eb a s e d o no b j e c t i ti san e wd i r e c t i o nf o rd a t ai n t e g r a t i o nr e s e a r c ht oa p p l yd l t ot h ef i e l do fi n f o r m a t i o ni n t e g r a t i o n t h et e c h n o l o g yh a sm a n yb a s i cc h a r a c t e r i s t i c s :1 ) u s i n g d lt od e s c r i b et h em e d i a t e ds c h e m ao fd a t ai n t e g r a t i o ns y s t e m ,a n du s i n gi ta st h ee n t r a n c eo f i n f o r m a t i o ns y s t e m 2 ) u s i n gt h ee f f e c t i v er e a s o n i n gs e r v i c e so f d lt oc o m p u t ei n c l u s i v er e l a t i o n s a n dl e v e ls t r u c t u r eb e t w e e nc o n c e p t si nt h ec o n c e p tm o d e l ,t os u p p o r tc h e c k i n gt h er a t i o n a l i t yo f c o n c e p tm o d e l 3 ) u s i n gt h er e a s o n i n gs e r v i c e so f d lt os u p p o r tt h eq u e r yt a s ko f d a t ai n t e g r a t i o n s y s t e m a p p a r e n t l y ,i th a sg r e a tt e c h n o l o g i c a la d v a n t a g e su s i n gd li nd a t ai n t e g r a t i o ns y s t e m i t n o to n l yh e l p st op r o v i d eu s e r sw i t hv i s u a l ,a b s t r a c ta n di n t e l l e c t i v eu n i f i e di n t e r f a c e ,b u ta l s o p r o v i d e san e wm e a n sf o rq u e r yp r o c e s s i n gi ni n f o r m a t i o ni n t e g r a t i o ns y s t e m t h ea i mo ft h i sp a p e ri sp a r to ft h e ”d a t ai n t e g r a t i o ns y s t e mb a s e do nt h ed e s c r i p t i o nl o g i c ” p r o j e c tt h a to u rg r o u pa r ed e v e l o p i n g i tm a i n l yc o n t a i n st w op a r t s :t h em a n a g e m e n tm o d u l eo f m e d i a t e ds c h e m ab a s e do nd la n dd a t ae x t r a c t i o nm o d u l eb a s e do nm o b i l ea g e n t i no u rd a t a i n t e g r a t i o nr e s o l u t i o n ,m e d i a t e ds c h e m ai st h es e to fc o n c e p tt e r m i n o l o g yk n o w l e d g ea n df a c t s k n o w l e d g e ( o b j e c ta s s e r t i o nk n o w l e d g e ) i nt h ea p p l i c a t i o nd o m a i n ,a l l o fw h i c hc o n s t i t u t et h e s o - c a l l e dd lk n o w l e d g eb a s e i nt h i sp a r to ft h ep a p e r , m a i na i mi st od e s i g nam a n a g e m e n tt o o l f o rd lk n o w l e d g eb a s e ,w h i c hc a ne d i tc o n c e p t ,r o l e ,i n d i v i d u a la n da x i o mi na na p p o i n t e dd l k n o w l e d g eb a s ec o n v e n i e n t l y , a n dc a nc o m m u n i c a t ew i t hd lr e a s o n e rt om a k et h ec o n s i s t e n c y c h e c k s g e n e r a t ei n h e r i t a n c er e l a t i o n sb e t w e e nt h ec o n c e p t sa n ds oo n i tc a ni n t e r a c t 、v j t l ld l r e a s o n e r ,a n dm a k e su s eo fr e a s o ns e r v i c ep r o v i d e d b yd lt oc h e c kw h e t h e rc o n c e p t i n k n o w l e d g eb a s ei ss a t i s f i a b l ea n dc o m p u t et h eh i b e r a r c h yo fi n c l u s i v er e l a t i o nb e t w e e nc o n c e p t s a d a t ae x t r a c t i o ni sab a s i c p r o c e s s i nd a t a i n t e g r a t i o ns y s t e m i n c o m p l e xn e t w o r k e n v i r o n m e n t s ,t h et r a d i t i o n a l d a t al i n k i n ga n d v i s i t i n gt e c h o l o g i e ss u c h a so d b cn e e d i n g c o n t i n o u sc o n n e c t i o n sa n dr e m o t ep r o c e d u r ec a , ( p p c ) h a v eh i g hd e m a n d sf o r t h es t a b i i t yo ft h e n e t w o r kc o n n e c t i o na n db a n d w i d t h ,a n dc a r ln o to v e r c o m et h er e g u l a rl a r g er e d u n d a n td a t a t r a n s m i s s i o np r o b l e md u r i n ge x t r a c t i o n h a v ep o o rn e t w o r ka d a p t a b i l i t y u s i n gh t t pp r o t o c o lt o e x t r a c td a t ac o m b i n i n gx m lt e c h n o l o g yi sv e r yf l e x i b l ea n dh a sg o o dn e t w o r ka d a p t a b i l i t y ,b u t t h e r ea r et h ep r o b l e m ss u c ha sl a r g ev o l u m ed a t at r a n s m i s s i m ) ,l o we f f i c i e n c ya n dd i f f i c u l t i e st o o r g a n i z ew h e nm a i n l yi nt h ea p p l i c a t i o nf i e l d su s i n gd a t a b a s ea sd a t as o u r c ea n dh a v i n gl a r g e 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文 一種基于邏輯的數(shù)據(jù)集成系統(tǒng)研究與實(shí)現(xiàn) s t r u c t u r e dd a t at ob ee x t r a c t e dm o b i l ea g e n ti sb a s e do nt h et h e o r yo f c o d em o v e m e n t ,i t sb a s i c i d e ai sm o v i n gt h ec o m p u t i n gt ot h el o c a t i o no fd a t ar a t h e rt h a nm o v i n gt h ed a t at ot h el o c a t i o no f c o m p u t i n g ,o n l yp r o c e s s e dr e s u l t r a t h e rt h a nt h ep r i m a r ya n dr e l e v a n t d a t ab e i n gt r a n s m i t t e d t h e r e f o r e ,e s s e n t i a l l y ,i tc a nw e l la d a p tt oa p p l i c a t i o no f d a t ae x t r a c t i o ni nc o m p l e xn e t w o r k k e y w o r d s :d a t ai n t e g r a t i o n ,d e s c r i p t i o nl o g i c ,m e d i a t e ds c h e m a , a u t o m a t e dr e a s o n i n g ,d a t a e x t r a c t i o n ,m o b i l ea g e n t 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文 種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 1 1 研究背景及其意義 第一章緒論 經(jīng)過多年的信息化系統(tǒng)建設(shè),我國(guó)許多大中型企業(yè)都逐步建立了各類信息管理系統(tǒng),以 及自動(dòng)化的數(shù)據(jù)采集系統(tǒng)。這些系統(tǒng)的應(yīng)用,不僅對(duì)企業(yè)規(guī)范管理和工作效率的提高起到了 很好的促進(jìn)作用,而且也為企業(yè)積累了豐富的數(shù)據(jù)資料。但是,由于這些現(xiàn)有應(yīng)用系統(tǒng)大都 是由不同廠商用不同的技術(shù)平臺(tái)實(shí)施的,基本上都屬_ r 分立運(yùn)行、異構(gòu)自治的系統(tǒng),數(shù)據(jù)資 料分散且存在一定的沖突和不一致,數(shù)據(jù)共享和數(shù)據(jù)資源的再利用率很低。目前,企業(yè)中應(yīng) 用環(huán)境異構(gòu)體現(xiàn)在多個(gè)方面,如地理分布不同、軟硬件平臺(tái)系統(tǒng)不同、或數(shù)據(jù)模式異構(gòu),既 可能有傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)或面向?qū)ο髷?shù)據(jù)庫(kù)等結(jié)構(gòu)化數(shù)據(jù)源,也可能有e x c e l 電子表格、e d l 文檔和網(wǎng)頁(yè)等以文件形式存放的半結(jié)構(gòu)化數(shù)據(jù)。 企業(yè)中這種各個(gè)系統(tǒng)各白孤立運(yùn)行的現(xiàn)象,目前被形象成為“信息孤島”?!靶畔⒐聧u” 究其根源是由于不同應(yīng)用系統(tǒng)間,尤其是不同部門間的數(shù)據(jù)信息不能共享,企業(yè)中設(shè)計(jì)、管理 和生產(chǎn)等不同職能部門之間不能進(jìn)行有效的信息交流。主要問題表現(xiàn)包括:有些信息需要在 不同的系統(tǒng)中重復(fù)輸入;信息存在很大的冗余;有大量的垃圾信息;信息交換的一致性無法 保證。“信息孤島”的問題已經(jīng)嚴(yán)重地阻礙了企業(yè)信息化建設(shè)的整體進(jìn)程,企業(yè)越來越多的 高級(jí)應(yīng)用或高層管理輔助決策,都需要對(duì)這些分布、異構(gòu)的各種數(shù)據(jù)資源進(jìn)行整合,實(shí)現(xiàn)全 局、統(tǒng)一和高效的訪問。因此,目前如何充分利用這些異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)資源,建立信息 集成應(yīng)用系統(tǒng),為管理決策服務(wù),已成為當(dāng)前企業(yè)信息化發(fā)展的新方向。構(gòu)建集成應(yīng)用的基 本目標(biāo)是:在不影響現(xiàn)有應(yīng)州運(yùn)行的情況1 f 集成這些應(yīng)用所產(chǎn)生的數(shù)據(jù)資料,并為用戶建 立一個(gè)一致且方便的信息使用入口,使用戶不必再去直接面對(duì)各類數(shù)據(jù)組織異構(gòu)、操縱使用 繁雜的應(yīng)用系統(tǒng)。 1 2 數(shù)據(jù)集成的研究現(xiàn)狀 1 2 1 數(shù)據(jù)集成方法概述 數(shù)據(jù)集成是對(duì)各種異構(gòu)數(shù)據(jù)提供統(tǒng)一的表示、存儲(chǔ)和管理,這些功能在異構(gòu)數(shù)據(jù)集成系 統(tǒng)中實(shí)現(xiàn)。數(shù)據(jù)集成屏蔽了各種異構(gòu)數(shù)據(jù)間的差異通過異構(gòu)數(shù)據(jù)集成系統(tǒng)進(jìn)行統(tǒng)一操作。 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文一種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 因此,集成后的異構(gòu)數(shù)據(jù)對(duì)用戶來說是統(tǒng)一的和無差異的。數(shù)據(jù)集成技術(shù)的研究始于七十年 代中期,至今已有二十多年了。從開始的多數(shù)據(jù)庫(kù)集成發(fā)展到現(xiàn)在的異構(gòu)數(shù)據(jù)源集成,數(shù) 據(jù)集成的范同和作用都在不斷擴(kuò)大。 a m i tp s h e t h l 2 1 提出數(shù)據(jù)集成的發(fā)展可大約分為三個(gè)階段: i 7 0 年代n 8 0 年代中期:出現(xiàn)的主要技術(shù)有多數(shù)據(jù)庫(kù)系統(tǒng)和聯(lián)邦數(shù)據(jù)庫(kù)系統(tǒng),重點(diǎn)在于使 有著不同軟硬件設(shè)備的計(jì)算機(jī)系統(tǒng)進(jìn)行互連和通信,解決了一定程度上的語(yǔ)法和結(jié)構(gòu) 異構(gòu),實(shí)現(xiàn)了地理分布、數(shù)據(jù)模式等的透明性,主要的產(chǎn)品有u n i s q l m ( u n i s q l ) 、 m e r m a i n 、d a t a l o i n e r ( i b m ) , f ( 1 0 m n i c o n n e c t ( s y b a s e ) 。 i i 8 0 年代中期到9 0 年代中期:隨著網(wǎng)絡(luò)的出現(xiàn)、i n t e r n e t 的發(fā)展以及多種類型的數(shù)據(jù)的形 成( 包括結(jié)構(gòu)化數(shù)據(jù)庫(kù)、半結(jié)構(gòu)化數(shù)據(jù)、數(shù)字多媒體等) ,出現(xiàn)了一些支持多種類型的 異構(gòu)數(shù)據(jù)集成的技術(shù),如m e t a d a t a 、m e d i a t o r 、中間件等,主要的系統(tǒng)有t s i m m i s 、 g a r l i c 、s 1 m s 、h e r m e s 和l n f o s l e u t h 等。 越9 0 年代中期到現(xiàn)在這個(gè)階段比較關(guān)注數(shù)據(jù)集成過程中的語(yǔ)義異構(gòu)的解決問題,更多的 運(yùn)用知識(shí)領(lǐng)域的有關(guān)技術(shù)。主要有信息的智能集成、數(shù)字化圖書館等。 綜合這幾個(gè)階段的發(fā)展,期間出現(xiàn)的技術(shù)大致可分為以下兩類: ( 1 ) 虛擬視圖法:其中包括聯(lián)邦數(shù)據(jù)庫(kù)系統(tǒng)和中介系統(tǒng)。 聯(lián)邦數(shù)據(jù)庫(kù)系統(tǒng):是數(shù)據(jù)庫(kù)集成的最簡(jiǎn)單結(jié)構(gòu)。它的構(gòu)成方式是將所有組件數(shù)據(jù)庫(kù)進(jìn) 行一對(duì)一的連接,這種方式的數(shù)據(jù)集成是一個(gè)n 維問題。如果存在n 個(gè)數(shù)據(jù)庫(kù),則每 個(gè)數(shù)據(jù)庫(kù)都需要與其它n 一1 個(gè)數(shù)據(jù)庫(kù)實(shí)現(xiàn) 互操作,即如果你有n 個(gè)不同的系統(tǒng)或數(shù) 據(jù)源需要集成,你就需要建立n ( n 一1 ) 個(gè)不 同的數(shù)據(jù)交互接口( 接近n 的二次方) ,開 發(fā)者就必須編寫n ( n - 1 ) 段代碼來支持兩 兩之間的查詢?cè)L問。對(duì)于大的公司,n 可 能上百位,則n 的二次方則會(huì)超過1 0 0 0 0 , 這看起來是個(gè)不可能的問題,所以聯(lián)邦數(shù) 據(jù)庫(kù)集成系統(tǒng)適合于自治數(shù)據(jù)庫(kù)的數(shù)量 比較小的情況。聯(lián)邦數(shù)據(jù)庫(kù)系統(tǒng)的體系結(jié)構(gòu)如圖1 1 所示 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文一種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 根據(jù)對(duì)聯(lián)邦數(shù)據(jù)庫(kù)的控制及操作方式,可以將聯(lián)邦數(shù)據(jù)庫(kù)分為松耦合聯(lián)邦數(shù)據(jù)庫(kù)和緊耦 臺(tái)聯(lián)邦數(shù)據(jù)庫(kù)。松耦合聯(lián)邦數(shù)據(jù)庫(kù)沒有全局?jǐn)?shù)據(jù)模式存在,用戶必須通過特定的多數(shù)據(jù)庫(kù)操 作語(yǔ)言及自己對(duì)聯(lián)邦的定義、維護(hù)來實(shí)現(xiàn)數(shù)摒運(yùn)營(yíng),這樣聯(lián)邦數(shù)據(jù)庫(kù)中的各數(shù)據(jù)庫(kù)就更具有 自治性。緊耦合聯(lián)邦數(shù)據(jù)庫(kù)擁有全局?jǐn)?shù)據(jù)模式和全局?jǐn)?shù)據(jù)庫(kù)管理員,由管理員負(fù)責(zé)創(chuàng)建和維 護(hù)全局?jǐn)?shù)據(jù)模式,并向州戶提供統(tǒng)一的數(shù)據(jù)操縱接口,由于全局模式耍解決邏輯上的異構(gòu), 就需要領(lǐng)域?qū)<覜Q定數(shù)據(jù)庫(kù)模式間的對(duì)應(yīng)關(guān)系,所以不易增加或刪除系統(tǒng)中的數(shù)據(jù)庫(kù)。根據(jù) 全局模式的數(shù)量可以將緊耦臺(tái)聯(lián)邦數(shù)據(jù)庫(kù)分為單聯(lián)邦數(shù)據(jù)庫(kù)和多聯(lián)邦數(shù)據(jù)庫(kù)。單聯(lián)邦數(shù)據(jù)庫(kù) 只有一個(gè)全局模式存在而多聯(lián)邦數(shù)據(jù)庫(kù)則可以為不同用戶群建立多個(gè)全局模式。 中介系統(tǒng):一種軟件構(gòu)件,通過提供所有異構(gòu)數(shù)據(jù)源的虛擬視圖進(jìn)行集成。數(shù)據(jù)源可 以是數(shù)據(jù)庫(kù)、遺留系統(tǒng)( 1 e g a c ys y s t e m ) ,w e b 數(shù)據(jù)源等。這種集成方式與數(shù)據(jù)倉(cāng)庫(kù)中使 用物化方法集成數(shù)據(jù)源的方式相似,但它不存儲(chǔ)任何實(shí)際數(shù)據(jù)。系統(tǒng)提供給用戶一個(gè) 全局模式( 也稱為中介模式) ,用戶針對(duì)全局模式提交查詢而不必知道數(shù)據(jù)源的位置、 模式和訪問方法,系統(tǒng)將用戶查詢翻譯成一個(gè)或多個(gè)對(duì)數(shù)據(jù)源的查詢。然后將數(shù)據(jù)源 的查淘結(jié)構(gòu)進(jìn)行綜合處理,并將它返回給用戶。中介系統(tǒng)中的數(shù)據(jù)源是完全自治的, 可以容易地增加或刪除數(shù)據(jù)源。中介系統(tǒng)一般由一個(gè)中介器和多個(gè)包裝器( w r 印p e r ) 組成。包裝器用于將數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)換為集成系統(tǒng)可以處理的某種結(jié)構(gòu)化的數(shù)據(jù)。中 介器的功能是分析針對(duì)全局模式的查詢,分解為子查詢,并將它們轉(zhuǎn)換為針對(duì)相應(yīng)數(shù) 據(jù)源的查詢,最后臺(tái)并所有數(shù)據(jù)源的結(jié)果返回給用戶。 ( 2 ) 物化方法:主要指數(shù)據(jù)倉(cāng)庫(kù)方法,該方法需要建立一個(gè)存儲(chǔ)數(shù)據(jù)的倉(cāng)庫(kù),將來自多個(gè)數(shù)據(jù) 源的數(shù)據(jù)副本都存儲(chǔ)在單一的數(shù)據(jù)庫(kù)中,f 1 e t l ( e x t r a c t ,t r a n s f o r m ,i o a d ) i 具定期從數(shù)據(jù)源 過濾數(shù)據(jù),然后裝載到數(shù)據(jù)倉(cāng)庫(kù),供用戶查詢。不足之處在于數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)在存儲(chǔ)之前 要經(jīng)過一定的篩選處理,而且數(shù)據(jù)倉(cāng)庫(kù)還需要定期更新,所以用戶查飼到的數(shù)據(jù)可能不是最 新的。 1 2 2 數(shù)據(jù)集成技術(shù)中的問題 在高度異構(gòu)的企業(yè)應(yīng)用環(huán)境下,設(shè)計(jì)信息集成系統(tǒng)是一項(xiàng)很復(fù)雜的任務(wù),需要考慮多方 面的技術(shù)和因素,包括: 1 ) 如何指定中介數(shù)據(jù)模式( 概念模式) 【3 4 】。為統(tǒng)一用戶接口,并能在較高的抽象層次 上表達(dá)剛戶查向,數(shù)據(jù)集成系統(tǒng)應(yīng)有一個(gè)獨(dú)立于現(xiàn)有數(shù)據(jù)源的、抽象層次較高的中介模式, 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文一種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 應(yīng)能從全局的視角反映企業(yè)集成應(yīng)用需求。 2 ) o n l , ,l 處理中介模式和數(shù)據(jù)源的關(guān)系。目前主要有兩種方法”:第一種稱為 g l o b a l a s v i e w ( g a y ) ,是一種查詢基于的( q u e r y b a s e d ) 表示法,要求將中介模式中的每個(gè)模 式項(xiàng)用源模式中有關(guān)模式項(xiàng)來描述定義;第二種稱為l o c a l a s v i e w ( l a v ) ,是一種源基于的 ( s o u r c e b a s e d ) 方法,要求中介模式獨(dú)立于各數(shù)據(jù)源,將源模式中的各模式項(xiàng)用中介模式中 有關(guān)模式項(xiàng)來描述定義。g a v 方法的集成查向處理簡(jiǎn)單直接,但擴(kuò)展性差,一旦數(shù)據(jù)源變化 需修改中介模式的描述定義:而l a v 法的集成查詢處理是間接的,但提供了更好的可擴(kuò)展性, 當(dāng)源變化時(shí),不需改變中介模式,只需增加或修改一些源描述即可,l a v 主要的缺點(diǎn)是可能 產(chǎn)生不完全的查詢結(jié)果。 3 ) 選用何種集成數(shù)據(jù)存儲(chǔ)方式。有物化和虛擬視圖兩種方式。物化法,也稱數(shù)據(jù)倉(cāng)庫(kù) ( d w ) t 6 1 法,需汁算中介模式的賦值擴(kuò)展來取代現(xiàn)有數(shù)據(jù)源。虛擬法,數(shù)據(jù)始終只駐留在數(shù) 據(jù)源中,用戶查詢將最終轉(zhuǎn)為對(duì)源數(shù)據(jù)的存取。兩種方法各有利弊,物化法,要求事先按集 成查詢需求組織好所有可能的結(jié)果數(shù)據(jù),回答查詢響應(yīng)快,但數(shù)據(jù)集中存儲(chǔ)庫(kù)的定時(shí)刷新和 維護(hù)難度大,也難以靈活適應(yīng)用戶需求的變化。虛擬法由于每次回答用戶查詢都重新計(jì)算, 集成查詢較靈活且可免除對(duì)中間結(jié)果存儲(chǔ)庫(kù)進(jìn)行更新維護(hù)的負(fù)擔(dān),但這對(duì)那些可能涉及大量 數(shù)據(jù)計(jì)算的查詢( 每次查詢都要重新計(jì)算) 效率低f 。 4 ) 如何處理用戶基于中介模式提出的查詢。用戶基于圖形化的界面提出的查詢需要被 轉(zhuǎn)換成一種基于中介模式的規(guī)范化的形式。 5 ) 如何從各種異構(gòu)數(shù)據(jù)源中抽取數(shù)據(jù)。由于互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,大部分中小企業(yè) 的各個(gè)異地部門都采用廉價(jià)的互聯(lián)網(wǎng)來交換數(shù)據(jù),而不是租用昂貴的網(wǎng)絡(luò)專線來構(gòu)建遠(yuǎn)程局 域網(wǎng)。在復(fù)雜的互聯(lián)網(wǎng)環(huán)境中,對(duì)數(shù)據(jù)集成系統(tǒng)提出了新的要求。 6 1 如何進(jìn)行數(shù)據(jù)清潔和協(xié)調(diào)【”。因各數(shù)據(jù)源中數(shù)據(jù)存在不匹配、錯(cuò)誤或表示法不一致 等問題,故對(duì)從數(shù)據(jù)源中抽取來的數(shù)據(jù)進(jìn)行轉(zhuǎn)換協(xié)調(diào),合并等處理,也是數(shù)據(jù)集成的一項(xiàng)重 要任務(wù)。 傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)由于缺乏語(yǔ)義及知識(shí)表達(dá)能力,從應(yīng)用域分析建模過渡到傳統(tǒng)數(shù)據(jù) 庫(kù)中的數(shù)據(jù)表示,不僅缺乏平滑性,而且會(huì)使語(yǔ)義知識(shí)丟失,存在天生的缺陷。國(guó)內(nèi)外大量 的工程項(xiàng)目實(shí)踐已表明,試圖僅依賴傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)和軟件能力的提高( 如采用o o 技術(shù)、 中間件技術(shù)、以及一些先進(jìn)的開發(fā)和管理工具) 是無法從根本上解決這些技術(shù)難題的。 在數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域引進(jìn)人工智能( a i ) 的思想和方法,為解決傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)存在 的缺陷、不足和各種難題提供了一種新的方法和思路。作為一種知識(shí)表示語(yǔ)言,描述邏輯 一4 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文 種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) ( d e s c r i p t i o nl o g i c s ,d l ) 8 1 9 1 早已被廣泛應(yīng)用于人工智能、知識(shí)工程等領(lǐng)域,用作表示基于 對(duì)象的概念知識(shí)和語(yǔ)義的形式語(yǔ)言。目前,基于各類描述邏輯的相關(guān)推理問題,包括可滿足 性和蘊(yùn)涵判定問題的算法以及計(jì)算復(fù)雜性的研究都已經(jīng)很充分。國(guó)外關(guān)于描述邏輯引入數(shù)據(jù) 庫(kù)應(yīng)用領(lǐng)域的研究也已經(jīng)有近十年的歷史,其中受到廣泛關(guān)注的一個(gè)研究熱點(diǎn)是將描述邏輯 應(yīng)用于信息集成。該技術(shù)的基本應(yīng)用特點(diǎn)有: a )利用d l 描述數(shù)據(jù)集成系統(tǒng)的概念模式,概念模式相關(guān)說明知識(shí)和應(yīng)用域的具體對(duì) 象成員斷言知識(shí),構(gòu)成d l 系統(tǒng)的知識(shí)庫(kù)。 b )通過d l 的模型解釋機(jī)制,實(shí)現(xiàn)基于描述邏輯的知識(shí)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)相結(jié)合。 c )利用d l 的推理服務(wù),計(jì)算知識(shí)庫(kù)中概念的滿足性和概念問的包含關(guān)系的層次結(jié) 構(gòu),由此來評(píng)價(jià)、檢查概念模式的合理性和正確性。 d ) 將描述邏輯的推理服務(wù)用于支持集成系統(tǒng)的查詢處理任務(wù)。 顯然,當(dāng)用基于d l 描述的概念模式作為集成系統(tǒng)面向用戶的統(tǒng)一接口后,用戶就不需 要再去熟悉了解各個(gè)應(yīng)用系統(tǒng)及其數(shù)據(jù)源,從而可以減輕用戶的負(fù)擔(dān);而利用d l 的推理能 力輔助檢查、評(píng)價(jià)企業(yè)數(shù)據(jù)的概念模型,對(duì)于構(gòu)建、完善企業(yè)統(tǒng)一面向全局應(yīng)用的數(shù)據(jù)模型, 指導(dǎo)企業(yè)數(shù)據(jù)規(guī)范都具有重要意義。 1 3 本論文的工作 工作 在項(xiàng)目組提出的基于描述邏輯的數(shù)據(jù)集成框架體系下,重點(diǎn)負(fù)責(zé)完成以下幾個(gè)方面的 1 1 深入研究和調(diào)研目前d l 推理器實(shí)現(xiàn)的有關(guān)技術(shù)標(biāo)準(zhǔn)、實(shí)現(xiàn)方案,以及目前可用的、 由第三方開發(fā)提供的d l 推理器資源。 2 )用j a v a 語(yǔ)言,設(shè)計(jì)了一個(gè)基于d l 的知識(shí)庫(kù)管理的、以圖形方式工作的管理工具 模塊,實(shí)現(xiàn)對(duì)數(shù)據(jù)集成系統(tǒng)中介模式的統(tǒng)一有效管理。 3 ) 改計(jì)并實(shí)現(xiàn)一種基丁移動(dòng)a g e n t 技術(shù)的數(shù)據(jù)抽取方案( d e a ) 。它滿足以下一些基本 要求:1 ) 與平臺(tái)無關(guān)性:2 ) 對(duì)網(wǎng)絡(luò)質(zhì)量要求較低;3 ) 能有效節(jié)約網(wǎng)絡(luò)帶寬;4 ) 部署 和維護(hù)代價(jià)都比較低:5 ) 具有很好的分布并行計(jì)算能力和較高的抽取效率。 1 4 章節(jié)安排 第一章緒論主要介紹了數(shù)據(jù)集成研究的背景、意義,以及數(shù)據(jù)集成系統(tǒng)的研究現(xiàn)狀 中國(guó)科學(xué)披術(shù)大學(xué)碩士論文 種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 和研究中的一些難點(diǎn)問題。 第二章描述邏輯基礎(chǔ)介紹了描述邏輯的基本理論和它的標(biāo)準(zhǔn)d i g i 1 。 第二章數(shù)據(jù)集成系統(tǒng)應(yīng)j : j 框架 采用一個(gè)新的數(shù)據(jù)集成的構(gòu)建方案:以描述邏輯 ( d e s c r i p t i o n l o g i c ,d l ) 說明中介模式;采用l a y 方法處理數(shù)據(jù)源和中介模式的關(guān)系。集成查 詢處理器( q u e r ya n s w e r i n gp r o c e s s o q a p ) :是本集成體系的核心組件,本章給出q a p 的實(shí)現(xiàn) 算法。 第四章數(shù)據(jù)集成管理模塊的設(shè)計(jì)_ _ f 實(shí)現(xiàn)設(shè)計(jì)了一個(gè)基于描述邏輯的中介模式管理工 具,它可以有效的管理中介模式的d l 知識(shí)庫(kù),更重要的是它能夠通過與描述邏輯推理機(jī)的 交互具備對(duì)知識(shí)庫(kù)的進(jìn)行推理的功能,驗(yàn)證中介模式的完備性。 第五章基于移動(dòng)a g e n t 技術(shù)的數(shù)據(jù)抽取模塊提出了一種將移動(dòng)a g e n t 技術(shù)應(yīng)用于復(fù)雜 的網(wǎng)絡(luò)環(huán)境中數(shù)據(jù)抽取的解決方案,并開發(fā)了一個(gè)數(shù)據(jù)抽取模塊,作為該集成系統(tǒng)的查詢處 理器中的子查詢處理模塊。 第六章結(jié)束語(yǔ)總結(jié)本論文的研究工作,并提出了下一步的工作目標(biāo)。 最后是讀研期間本人發(fā)表的論文和參考文獻(xiàn)。 中國(guó)科學(xué)技術(shù)火學(xué)碩二l 論文 種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 2 1 描述邏輯簡(jiǎn)介 第二章描述邏輯基礎(chǔ) 在知識(shí)表示的研究中,描述邏輯( d e s c r i p t i o nl o g i c ,d l ) i ”是基于對(duì)象的知識(shí)表示的形式 化工具,它吸取了k l o n e 的主要思想,是一階謂詞邏輯的一個(gè)可判定子集,能夠提供可判定 的推理服務(wù),并且具有語(yǔ)義特征。在經(jīng)過二十多年的研究與發(fā)展之后,描述邏輯已經(jīng)基本趨于 成熟并走向應(yīng)用。除了知識(shí)表示以外,描述邏輯還用在其它許多領(lǐng)域,如信息系統(tǒng)、數(shù)據(jù)庫(kù)、 軟仆l 群、網(wǎng)絡(luò)智能訪問和艦劃i l 。描述邏輯被認(rèn)為是以對(duì)象為中心的表示語(yǔ)言的最為重 要的歸一形式。描述邏輯的重要特征是很強(qiáng)的表達(dá)能力和可判定性,它能保證推理算法總能 停止,并返回正確的結(jié)果。在眾多知識(shí)表示的形式化方法中,描述邏輯在十多年來受到人們的 特別關(guān)注,主要原因在于:它們有清晰的模型一理論機(jī)制;很適合于通過概念分類學(xué)來表示應(yīng) 用領(lǐng)域;并提供了很有用的推理服務(wù)。 在描述邏輯中,用戶感興趣的應(yīng)用被抽象為一組概念和概念問的關(guān)系的知識(shí),其中:概 念被解釋為同類對(duì)象的集合,兩個(gè)概念之間聯(lián)系被稱為角色( r o l e ) 關(guān)系,則被解釋為屬于 兩類概念的實(shí)體對(duì)象問的二元關(guān)系( r e l a t i o n ) 集合。描述邏輯是建立在概念和角色之上, 由構(gòu)造算子( c o n s t r u c t o r ) 從原子概念和角色構(gòu)造出復(fù)雜概念和角色。概念對(duì)應(yīng)于邏輯中的一 元謂詞,角色對(duì)應(yīng)于二元謂詞,構(gòu)造算子決定著語(yǔ)言的表達(dá)能力,類似于邏輯連接詞的功能。 2 2 描述邏輯系統(tǒng)的體系結(jié)構(gòu) 描述邏輯系統(tǒng)是由兩個(gè)部分構(gòu)成:一是知識(shí)庫(kù)( k n o w l e d g eb a s e ) ,知識(shí)庫(kù)又能分成t b o x 和a b o x 兩個(gè)部分,一個(gè)t b o x 存取一個(gè)應(yīng)用域的概念知識(shí)。而一個(gè)a b o x 存取斷言 知識(shí)。二是推理引擎,推理引擎可以實(shí)現(xiàn)不同的推理服務(wù)。描述邏輯系統(tǒng)通過接口與應(yīng)用 程序交互。圖2i 是描述邏輯的基本結(jié)構(gòu): 中茸科學(xué)技術(shù)大學(xué)碩:t 論文 一種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 圖21 描述邏輯系統(tǒng)的結(jié)構(gòu) 2 2 1 描述邏輯的基本語(yǔ)法和語(yǔ)義 在描述邏輯中,用戶感興趣的應(yīng)用域被抽象為一組概念和概念間關(guān)系的知識(shí)。概念 ( c o n c e p t ) 是描述邏輯核,i i , ,概念被解釋為同類對(duì)象的集合,兩個(gè)概念間聯(lián)系被稱為角色承o l e ) 關(guān)系,則被解釋為屬于兩個(gè)概念類的對(duì)象間的二元關(guān)系( r e l a t i o n ) 集合。而描述邏輯語(yǔ)言則 可以在原子概念和角色關(guān)系的基礎(chǔ)上,通過有限的構(gòu)造算子構(gòu)造出復(fù)雜概念( c o m p l e x c o n c e p t ) 和知識(shí)庫(kù)規(guī)則。 有多種描述邏輯版本,它們一般是在最基本的描述邏輯a l c 基礎(chǔ)上,擴(kuò)張一些構(gòu)造算子 而形成。構(gòu)造算子越多知識(shí)表達(dá)的能力越強(qiáng),但相應(yīng)推理的復(fù)雜度會(huì)變大,應(yīng)根據(jù)需要折中 選擇。本方案使用a l c q ,它在a l c 基礎(chǔ)上擴(kuò)展了兩個(gè)數(shù)量限制算子。a l c q 中概念描述( c 或d ) 的構(gòu)造語(yǔ)法是: c ,d atf 上fcndcud1 civrcf 了r cf nr cf nr c 其中,a 是原子概念,r 是角色關(guān)系,代表非空全域概念,即應(yīng)用域的任何概念,t 是 任何概念的父概念,也有文獻(xiàn)中用t o p 表示,1 是空概念即不能包含任何對(duì)象實(shí)例,是任 何概念的子概念,也有文獻(xiàn)中用b o t t o m 表示,cnd 是兩概念的合取,cud 是兩概念的 析取,一c 是概念的否定,即概念c 的補(bǔ),vr c 是全稱量詞限定,3 r c 是存在量詞限定,! n r c 是最大數(shù)量限定,;nl c 是最小數(shù)量限定。 定義1 :一個(gè)解釋i 是一個(gè)二元組( a 1 ,o i ) ,其中是一個(gè)非空域,是一個(gè)解釋函數(shù)。 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文一種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 將每個(gè)概念名c 映射為中的一個(gè)子集c 。,c 1 e a :對(duì)每個(gè)屬性名a ,a 1 是一個(gè)從1 映射到 l 偏函數(shù),角色名r 對(duì)應(yīng)為一組二元關(guān)系子集r 1 ,r 1 e 1 1 。 基于以上定義的下面的各方程是滿足的,它們分別給出了各相關(guān)項(xiàng)的語(yǔ)義,見下表 解釋語(yǔ)義 t li 上i o ( vl c ) 。 x ez x l v y ( x ,y ) r 一y c 1 ) ( jl c ) 1 x z x l i j y ( x ,y ) r 1ay c 1 ) c - nr c v ( x 1 拌( y :( x ,y ) r 1ay c 1 ) n ) ( 三n t c ) 1 x | 抖( y :( x ,y ) r 1ay c i ) 蔓n ) ( 一c ) 1 1 c 1 ( c 幾d ) 1 c 】n d 】 ( c u d ) 1 c j t a d l 表2 1 描述邏輯語(yǔ)義 如果一個(gè)解釋1 使得一個(gè)概念c 滿足c 1 0 則稱解釋1 是概念c 的一個(gè)模型,如果概 念c 存在一個(gè)這樣的解釋l ,則稱概念c 是滿足的。 當(dāng)且僅當(dāng)c 1 e _ d 1 時(shí),稱解釋i 是包含斷言c e _ d 的一個(gè)模型,當(dāng)且僅當(dāng)對(duì)所有的解釋i 都有c 1 e _ d 1 則稱包含斷言c e d 是滿足的。 2 2 2 描述邏輯系統(tǒng)的知識(shí)庫(kù) 定義2 ( 知識(shí)庫(kù)r d 3 ) :知識(shí)庫(kù)是一個(gè)二元組( t ,a ) 。其中,t 是一個(gè)t b o x ,用來存儲(chǔ) 一個(gè)廊用域的術(shù)語(yǔ)概念及其相關(guān)的關(guān)系結(jié)構(gòu)知識(shí);a 是一個(gè)a b o x ,用來描述實(shí)際世界的狀 態(tài),即存放個(gè)體成員斷言或?qū)嵗龜嘌灾R(shí)。 定義3 ( t b o x ) :一個(gè)t b o x 是有限的一組a l c q 概念定義。a l c q 概念定義的具體形 一9 中國(guó)科學(xué)技術(shù)大學(xué)碩士論文種基于邏輯的數(shù)據(jù)集成系統(tǒng)的研究和實(shí)現(xiàn) 式是c c _ d 或c d 。這里c 是被定義的概念名,d 是基于a l c q 的概念描述體。一個(gè)t b o x t 是無環(huán)的,如果t 中的每個(gè)概念描述名只被定義一次,且其唯一定義式右邊沒有直接或間 接包含左邊的定義名。c o d 這種形式引入了一個(gè)原始概念c ,因?yàn)橹欢x了概念c 的一些 必要條件。c 二d 這種形式引入了一個(gè)復(fù)雜概念c ,它精確說明的概念c 的充分必要條件。 顯然,對(duì)基于一個(gè)t b o xt 定義的概念,可在其定義描述體中引用t 中其它的概念名。 而不基于任何t b o x 定義的概念,其概念定義體中只能包含最基本的原子概念。 我們稱一個(gè)解釋i 是一個(gè)t b o x t 的模型,如果i 滿足t 中的所有概念定義。 定義4 ( a b o x ) :一個(gè)a b o x a 是一個(gè)關(guān)于斷言形式c ( a ) ( 概念斷言) 或“a ,b ) ( 角色關(guān) 系斷言) 的有限集,這里c 是一個(gè)概念描述,r 是一個(gè)角色名,a , b 是個(gè)體名。 解釋i 是a b o xa 的一個(gè)模型,如果a i c c l ,( a 1 ,b 1 ) ,對(duì)a 中的所有斷言c ( a ) r lr ( 曲) 都成立。 一個(gè)a b o xa 是一致的,如果它存在一個(gè)模型。稱個(gè)體a 是概念c 關(guān)于知識(shí)庫(kù)k b ( t , a ) 的一個(gè)實(shí)例,如果a c 對(duì)所有知識(shí)庫(kù)k b ( a ,b ) 的模型i 都成立。 2 2 3 描述邏輯系統(tǒng)的推理服務(wù) 可滿足性問題是描述邏輯推理中的核心問題,因?yàn)槠渌S多問題( 如包含檢測(cè)、一致性 問題等) 都可轉(zhuǎn)換為可滿足性問題。為了能t | _ | j 計(jì)算機(jī)自動(dòng)判斷描述邏輯中可滿足性問題, s c h m i d t s c h a u b 和s m o l k a 首先建立了基于描述邏輯a l c 的t a b l e a u 算法【9 】,該算法能在多 項(xiàng)式時(shí)間內(nèi)判斷描述邏輯a l c 概念的可滿足性問題。目前,t a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 11578-2025圣勞倫斯航道登岸吊桿
- GB 45672-2025車載事故緊急呼叫系統(tǒng)
- 行政處罰法律框架試題及答案
- 敬老院火災(zāi)應(yīng)急預(yù)案(3篇)
- 行政法學(xué)復(fù)習(xí)要點(diǎn)試題及答案總結(jié)
- 高頻考點(diǎn)2025年軟考試題及答案
- 網(wǎng)吧火災(zāi)事故應(yīng)急預(yù)案(3篇)
- 行政法與社會(huì)責(zé)任的權(quán)責(zé)界定研究試題及答案
- 軟件水平考試的回顧與展望及試題及答案
- 行政法學(xué)知識(shí)拓展試題與答案
- 機(jī)械工程技術(shù)訓(xùn)練知到智慧樹章節(jié)測(cè)試課后答案2024年秋北京航空航天大學(xué)
- 兒童退熱類藥物安全用藥
- 保潔 合同續(xù)簽申請(qǐng)書
- 220kV變電站新建工程施工設(shè)計(jì)方案
- 失血性休克病人的麻醉管理
- 藏毛竇課件可編輯
- 識(shí)字教學(xué)創(chuàng)新策略
- 小兒推拿合同范例
- 第四單元《遵守法律規(guī)范》測(cè)試卷-高二思想政治課《職業(yè)道德與法治》附答案
- 2024年中考第三次模擬考試題:地理(廣東廣州卷)(解析版)
- 數(shù)字華容道+課時(shí)2
評(píng)論
0/150
提交評(píng)論