GIS數(shù)據(jù)庫更新信息傳播軟件工具規(guī)劃設(shè)計(jì)及其實(shí)現(xiàn).doc_第1頁
GIS數(shù)據(jù)庫更新信息傳播軟件工具規(guī)劃設(shè)計(jì)及其實(shí)現(xiàn).doc_第2頁
GIS數(shù)據(jù)庫更新信息傳播軟件工具規(guī)劃設(shè)計(jì)及其實(shí)現(xiàn).doc_第3頁
GIS數(shù)據(jù)庫更新信息傳播軟件工具規(guī)劃設(shè)計(jì)及其實(shí)現(xiàn).doc_第4頁
GIS數(shù)據(jù)庫更新信息傳播軟件工具規(guī)劃設(shè)計(jì)及其實(shí)現(xiàn).doc_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

GIS數(shù)據(jù)庫更新信息傳播軟件工具設(shè)計(jì)與實(shí)現(xiàn)王育紅(河南理工大學(xué)測(cè)繪與國土信息工程學(xué)院,焦作市世紀(jì)大道2001號(hào),454003)摘 要:針對(duì)現(xiàn)有GIS軟件工具缺乏相應(yīng)的功能模塊,不支持批處理,需要大量的人機(jī)交互,不能滿足GIS數(shù)據(jù)庫更新信息自動(dòng)高效傳播要求的缺陷,采用ArcEngine組件技術(shù)設(shè)計(jì)實(shí)現(xiàn)了一個(gè)專門的更新傳播工具。該工具通過自動(dòng)地執(zhí)行更新傳播過程中的模式匹配、變化提取、更新集成等操作,能夠有效地提高更新傳播的效率,彌補(bǔ)現(xiàn)有軟件的不足。關(guān)鍵詞:更新傳播、模式匹配、變化提取、更新集成當(dāng)前GIS的核心已從數(shù)據(jù)生產(chǎn)轉(zhuǎn)為數(shù)據(jù)更新,數(shù)據(jù)更新關(guān)系著GIS的可持續(xù)發(fā)展1。隨著世界各國測(cè)繪部門和相關(guān)機(jī)構(gòu)對(duì)基礎(chǔ)地理數(shù)據(jù)庫更新工作的持續(xù)開展2,更新信息傳播問題,即如何利用新版基礎(chǔ)地理數(shù)據(jù)庫中的更新數(shù)據(jù)快速高效地更新用戶數(shù)據(jù)庫的問題,已成為生產(chǎn)部門、應(yīng)用機(jī)構(gòu)以及學(xué)術(shù)界共同關(guān)注的熱點(diǎn)問題之一3-4。由于應(yīng)用需求、建庫目的、專業(yè)背景等方面的不同,應(yīng)用部門經(jīng)常要對(duì)首次獲得的基礎(chǔ)地理數(shù)據(jù)庫副本,進(jìn)行一定的重構(gòu)、轉(zhuǎn)換、集成、擴(kuò)展等處理之后方可建立用戶數(shù)據(jù)庫。這些處理使得基礎(chǔ)地理數(shù)據(jù)庫和用戶數(shù)據(jù)庫,即使是對(duì)相同的實(shí)現(xiàn)地物地形的描述和表達(dá),也往往在數(shù)據(jù)模型、數(shù)據(jù)模式、數(shù)據(jù)實(shí)例等方面存在一系列的差異或沖突5。上述差異的存在導(dǎo)致更新傳播的具體實(shí)施變得相當(dāng)復(fù)雜,不能簡單地通過“新圖層直接替換舊圖層”或“新數(shù)據(jù)直接替換舊數(shù)據(jù)”的方式加以實(shí)現(xiàn),因?yàn)椋@樣將破壞用戶數(shù)據(jù)庫的自治性、完整性、正確性和一致性等特性,最終導(dǎo)致在其之上建立的應(yīng)用系統(tǒng)不能正常運(yùn)行。一般來說,實(shí)現(xiàn)更新信息傳播需要模式匹配、變化提取、實(shí)體識(shí)別和更新集成等四個(gè)操作環(huán)節(jié)的支持6。然而,由于現(xiàn)有GIS軟件缺乏針對(duì)性的自動(dòng)批處理模塊,更新傳播的具體實(shí)施只能靠操作員手動(dòng)完成,效率低,易出錯(cuò),很難滿足GIS數(shù)據(jù)庫更新自動(dòng)高效的要求。1系統(tǒng)框架和功能設(shè)計(jì)針對(duì)現(xiàn)有GIS軟件的局限性,目前主要有獨(dú)立開發(fā)、宿主型二次開發(fā)和基于GIS組件的二次開發(fā)等三種可選方式,來設(shè)計(jì)和實(shí)現(xiàn)針對(duì)更新傳播的專用軟件工具系統(tǒng)。相對(duì)來講,基于GIS組件的開發(fā)方式既可以充分利用GIS工具軟件對(duì)空間數(shù)據(jù)庫的管理、分析功能,又可以利用其它可視化開發(fā)語言具高效、方便等編程優(yōu)點(diǎn),不僅能大大提高應(yīng)用系統(tǒng)的開發(fā)效率,而且開發(fā)出來的應(yīng)用程序具有更好的外觀效果,更強(qiáng)大的數(shù)據(jù)庫功能,而且可靠性好、易于移植、便于維護(hù)?;谶@些分析,本文以目前非常流行的ArcEgine組件為基礎(chǔ),來開發(fā)和設(shè)計(jì)更新傳播軟件工具。1.1系統(tǒng)框架如圖1所示,更新傳播軟件工具采用GIS組件ArcEngine與面向?qū)ο缶幊陶Z言Visual Basic 2005二次集成開發(fā)方式構(gòu)建而成。其中,ArcEngine組件提供諸如空間數(shù)據(jù)管理、圖形操作、數(shù)據(jù)查詢等通用的GIS基本功能;而更新更新傳播專有的功能模塊,如模式匹配、變化檢測(cè)、更新集成采用Visual Basic語言開發(fā)實(shí)現(xiàn);另外,還通過自制組件以及其他界面輔助組件開發(fā)實(shí)現(xiàn)了分析處理結(jié)果的可視化模塊,以便于對(duì)分析結(jié)果的檢查、核對(duì)和更正。1.2系統(tǒng)功能1)基本的GIS空間數(shù)據(jù)顯示、查詢、編輯等功能。系統(tǒng)不僅提供放大、縮小、全圖、漫游等基本的地圖操作顯示功能、而且利用地圖列表可控制地圖窗口的顯示內(nèi)容、狀態(tài)、順序等,并能根據(jù)用戶需要設(shè)置相應(yīng)的顯示樣式。系統(tǒng)提供了多種的查詢方式,用戶可以檢索、瀏覽空間信息和屬性字段信息。系統(tǒng)提供了常規(guī)的數(shù)據(jù)編輯工具,使用戶能夠手動(dòng)方式對(duì)其數(shù)據(jù)進(jìn)行更新,主要包括單個(gè)實(shí)體的添加、刪除、修改(移動(dòng)對(duì)象,操作結(jié)點(diǎn),改變屬性值等)、分割以及多實(shí)體的置換、合并等操作。這些功能一般在如圖2所示的子窗口中加以實(shí)現(xiàn)。 圖2 數(shù)據(jù)管理窗口 圖3 模式匹配窗口2)模式匹配功能。模式匹配,是指從兩個(gè)數(shù)據(jù)庫模式中確定語義相關(guān)的對(duì)應(yīng)模式元素(要素類和屬性等),并聲明其具體映射關(guān)系的過程。模式匹配是更新信息自動(dòng)傳播的基礎(chǔ)處理環(huán)節(jié),它所取得的匹配結(jié)果可被用于指導(dǎo)和簡化其他處理操作,保證基礎(chǔ)地理數(shù)據(jù)庫中的變化信息被充分準(zhǔn)確提取和集成。系統(tǒng)分別設(shè)計(jì)了相應(yīng)的圖形用戶界面和自動(dòng)化向?qū)Чぞ邅硗瓿筛聜鞑ブ械哪J狡ヅ洳僮?。其中,模式匹配圖形界面(如圖3所示)不僅支持以拖線方式手動(dòng)建立模式映射關(guān)系,而且可以顯示和查看自動(dòng)向?qū)Мa(chǎn)生的匹配結(jié)果,并進(jìn)行相應(yīng)的修改和調(diào)整。GIS數(shù)據(jù)庫模式間包含兩種不同層次的匹配關(guān)系:一種是要素類與要素類之間匹配(用圖3中部第一條直線表示),另一種是屬性與屬性間的匹配(用圖3中的其他條直線表示)。 圖4 變化信息窗口3)變化提取功能。通過比較新版源數(shù)據(jù)和舊版目標(biāo)數(shù)據(jù)之間對(duì)應(yīng)實(shí)體的幾何圖形和屬性信息判斷其是否發(fā)生變化,并將諸如新增、消失、合并、分解、幾何變化、屬性變化等變化類型的實(shí)體及其相關(guān)信息列在如圖4所示的窗口中,以供用戶做最終的檢查、核對(duì)和篩選。4)更新集成功能。根據(jù)模式匹配映射關(guān)系以及源數(shù)據(jù)和目標(biāo)數(shù)據(jù)之間的實(shí)體對(duì)應(yīng)性,可通過添加、刪除、修改等三種基本更新算子及其組合將檢核確認(rèn)后的更新變化信息集成到目標(biāo)數(shù)據(jù)中。整個(gè)過程以自動(dòng)生成的命令腳本加以描述,能夠以批處理的方式自動(dòng)運(yùn)行。2軟件功能的自動(dòng)化實(shí)現(xiàn)本節(jié)將進(jìn)一步介紹上述主要功能的自動(dòng)化實(shí)現(xiàn)算法和基本原理。2.1基于空間實(shí)例的模式匹配為實(shí)現(xiàn)GIS數(shù)據(jù)庫模式的自動(dòng)匹配,我們根據(jù)GIS數(shù)據(jù)庫的特點(diǎn)以及模式匹配的應(yīng)用背景,提出了一種基于空間實(shí)例統(tǒng)計(jì)相似性的模式自動(dòng)匹配方法。該方法的基本步驟如下7:1)在目標(biāo)數(shù)據(jù)庫中一個(gè)要素類的實(shí)例集合中,隨機(jī)地抽取若干個(gè)實(shí)體樣品,并采用較小的緩沖半徑生成這些樣品的緩沖區(qū),然后依次在源數(shù)據(jù)庫的每個(gè)要素類查找落在這些緩沖區(qū)中的對(duì)應(yīng)候選實(shí)體,最后通過比較幾何類型、候選實(shí)體個(gè)數(shù)、大小、長度等信息,建立采樣實(shí)體和候選實(shí)體的對(duì)應(yīng)關(guān)系,如圖5所示。圖5. 對(duì)應(yīng)實(shí)體抽樣識(shí)別示例2)根據(jù)對(duì)應(yīng)實(shí)體抽樣識(shí)別結(jié)果,計(jì)算要素類的相似性,并匹配語義相關(guān)的要素類。假設(shè)在源要素類S中抽樣選取了s個(gè)實(shí)體,而在目標(biāo)要素類T中發(fā)現(xiàn)了t個(gè)與之對(duì)應(yīng)的實(shí)體,則兩個(gè)要素的相似性CSim(S,T)為: (1)如果源數(shù)據(jù)庫和目標(biāo)數(shù)據(jù)庫分別共用m和n個(gè)要素類,采用公式(1)分別兩兩計(jì)算要素類的相似性,將形成一個(gè)mn的要素類相似矩陣(i=1,,m;j=1,,n)。對(duì)于給定閾值,如果,則斷定源數(shù)據(jù)庫中第i個(gè)要素類和目標(biāo)數(shù)據(jù)庫中第j個(gè)要素類匹配。3)根據(jù)對(duì)應(yīng)實(shí)體的屬性值,在已匹配的要素類之間,計(jì)算其屬性相似性,并確定相關(guān)的屬性匹配。對(duì)于分別來自源要素類和目標(biāo)要素類的兩個(gè)數(shù)字型屬性A和B,其在n對(duì)對(duì)應(yīng)實(shí)體中的屬性值分別為ai和bi(i=1,n),則其相似性為: (2)式中:。對(duì)于分別來自源要素類和目標(biāo)要素類的兩個(gè)字符型屬性A和B,其在n對(duì)對(duì)應(yīng)實(shí)體中的屬性值分別為ai和bi(i=1,n),則其的相似性為: (3)式中,為屬性值ai和bi之間的編輯距離,和分別為屬性值ai和bi的字符長度。對(duì)于來自源要素類的數(shù)值型(或字符型)屬性A和來自源要素類的字符型(或數(shù)值型)屬性B(例如,圖5中的T和Grade),如果其可能的取值數(shù)目相同,則采用下式計(jì)算其相似性: (4)式中,和為分別屬性值ai和bi出現(xiàn)的概率,為屬性值ai和bi同時(shí)出現(xiàn)的聯(lián)合概率。;。假設(shè)兩個(gè)匹配要素類中分別存在m和n個(gè)屬性,根據(jù)屬性的類型分別采用上述公式兩兩計(jì)算屬性之間的相似性,將形成一個(gè)mn的屬性相似矩陣(i=1,,m;j=1,,n)。對(duì)于給定的閾值,如果,并且,則第i個(gè)屬性和第j個(gè)屬性匹配。在確定模式匹配關(guān)系之后,為保證匹配的質(zhì)量以及進(jìn)一步的應(yīng)用,可以采用手動(dòng)方式檢核和更正模式匹配結(jié)果,并聲明匹配元素之間具體的映射關(guān)系。2.2 面向變化提取的實(shí)體識(shí)別目前主要快照差分法、時(shí)間戳法、觸發(fā)器法、日志法等四種變化信息提取方法8。其中,快照差分法因具有通用性高、不需要其他外部輔助設(shè)施的支持等特點(diǎn),而被廣泛采用,它主要通過比較不同時(shí)期的數(shù)據(jù)集快照來獲取其中的更新變化信息。實(shí)現(xiàn)該方法的關(guān)鍵是如何高效地在兩個(gè)快照之間識(shí)別和發(fā)現(xiàn)代表同一現(xiàn)實(shí)事物的對(duì)應(yīng)實(shí)體,即實(shí)體識(shí)別。在更新傳播背景下,由于源要素類和目標(biāo)要素類時(shí)間跨度比較大,同一空間實(shí)體的在不同要素類的描述信息(幾何圖形、屬性值、拓?fù)潢P(guān)系等)可能差別較大,因此僅通過比較某一種類型的信息來識(shí)別實(shí)體是否對(duì)應(yīng),很容易產(chǎn)生遺漏或錯(cuò)配情況。為此,本文提出了一種基于多源信息的空間實(shí)體識(shí)別方法。假設(shè)S和T分別代表源數(shù)據(jù)庫和目標(biāo)數(shù)據(jù)庫中相關(guān)要素類中的實(shí)體集合,和分別表示為S和T中的屬性字段,對(duì)于實(shí)體,令表示實(shí)體的在屬性上的值,表示實(shí)體的在屬性上的值,表示和為對(duì)應(yīng)實(shí)體。首先,通過比較語義相同屬性的值,來識(shí)別要素類間的一部分對(duì)應(yīng)實(shí)體。對(duì)于實(shí)體,如果屬性Am和Bn含義相同,和存在且唯一,并且,則。然后,根據(jù)實(shí)體的幾何類型,通過比較實(shí)體的幾何特征或拓?fù)潢P(guān)系,識(shí)別發(fā)現(xiàn)要素類間所遺漏的對(duì)應(yīng)實(shí)體。1)對(duì)應(yīng)兩個(gè)點(diǎn)狀實(shí)體,如果兩者之間的距離小于給定閾值,則認(rèn)為二者對(duì)應(yīng)。2)對(duì)于兩個(gè)線狀實(shí)體,先以較小緩沖半徑生成其中一實(shí)體的緩沖區(qū),然后計(jì)算另一實(shí)體落在該緩沖區(qū)的所有子段長度之和與該實(shí)體總長度之比,如果該閾值大于給定閾值,則兩實(shí)體對(duì)應(yīng)。3)對(duì)于兩個(gè)面狀實(shí)體,如果兩者相較部分的面積大于0,則認(rèn)為二者對(duì)應(yīng)。根據(jù)識(shí)別發(fā)現(xiàn)的對(duì)應(yīng)實(shí)體關(guān)系,可以進(jìn)一步提取源要素類中更新變化信息,其具體規(guī)則如下:1)對(duì)于未發(fā)現(xiàn)實(shí)體與之對(duì)應(yīng)的源要素類中的實(shí)體,則認(rèn)為其為新增實(shí)體。2)對(duì)于未發(fā)現(xiàn)實(shí)體與之對(duì)應(yīng)的目標(biāo)要素類中的實(shí)體,則認(rèn)為其為消失實(shí)體。3)對(duì)于源要素類中的一個(gè)實(shí)體,如果僅在目標(biāo)要素類發(fā)現(xiàn)一個(gè)實(shí)體與之對(duì)應(yīng),則需要進(jìn)一步比較兩實(shí)體的形狀、屬性、位置等特征,以確定實(shí)體是現(xiàn)狀、位置、屬性發(fā)生了變化,或是根本沒有發(fā)生變化。4)對(duì)于源要素類中的一個(gè)實(shí)體,如果在目標(biāo)要素類發(fā)現(xiàn)多個(gè)實(shí)體與之對(duì)應(yīng),則源要素類中的這個(gè)實(shí)體為合并實(shí)體。5)對(duì)于源要素類中的多個(gè)實(shí)體,如果在目標(biāo)要素類僅發(fā)現(xiàn)一個(gè)實(shí)體與之對(duì)應(yīng),則源要素類中這些實(shí)體為分解實(shí)體。6)對(duì)于源源要素類中的多個(gè)實(shí)體,如果在目標(biāo)源要素類也發(fā)現(xiàn)多個(gè)實(shí)體與之對(duì)應(yīng),則源要素類這些實(shí)體為聚集實(shí)體。2.3 模式和實(shí)體映射引導(dǎo)下的更新集成根據(jù)模式映射和實(shí)體對(duì)應(yīng)關(guān)系,可通過添加、刪除、修改等三個(gè)基本操作算子及其組合,將提取的更新變化信息集成到相應(yīng)的目標(biāo)要素類中,以使其也具有良好的現(xiàn)勢(shì)性?,F(xiàn)定義三個(gè)操作算子的基本形式如下:Intsert (FeatureClass,ID):在名稱為FeatureClass的數(shù)據(jù)集中插入一個(gè)標(biāo)識(shí)符為ID的實(shí)體;Update (FeatureClass,x,F(xiàn)ieldName,F(xiàn)ieldValue):修改要素類FeatureClass中標(biāo)號(hào)為x的實(shí)體的FieldName屬性值為FieldValue;Delete (FeaturClass,x):刪除數(shù)據(jù)集FeatureClass中標(biāo)號(hào)為x的實(shí)體。假設(shè)源要素類S和目標(biāo)要素類之間存在形如和兩個(gè)屬性映射關(guān)系,對(duì)S中不同類型的變化信息,為保證集成后數(shù)據(jù)盡可能完整正確,可采用如下形式的操作指令將其集成到T中:1)對(duì)于消失實(shí)體,可直接執(zhí)行Delete(T.name, t.id);2)對(duì)于新增實(shí)體,應(yīng)執(zhí)行一個(gè)操作序列,記作E(s) =Insert(T.name, id=y); Update(T.name, y, Shape, s.shape), Update(T.name, y, A1, f1( s.a1 ) ), Update(T.name, y, A2, f2( s.a2, s.a3 ) );3)對(duì)于在屬性A1變化的實(shí)體和與之對(duì)應(yīng)的匹配實(shí)體,可直接執(zhí)行Update(T.name, t.id, A1 , f1 (s.a1),同樣,對(duì)于幾何變化,可直接執(zhí)行Update(T.name, t.id, Shape, s.shape);4)對(duì)于分解實(shí)體和與之對(duì)應(yīng)的實(shí)體集。首先應(yīng)該從選擇一個(gè)主實(shí)體s1,然后執(zhí)行相應(yīng)的操作序列,記作E (t) =Update (T.name, t.id, Shape, s1.shape), Update (T.name, t.id, A1 , f1 (s1.a1), Update (T.name, y, A2, f2( s1.a2, s1.a3 ) ), E(s2) , E(s3) , ., E(sn) ,其中sk, k =1, 2, 3, ., |;5)對(duì)于合并實(shí)體集和與之對(duì)應(yīng)的實(shí)體匹配,應(yīng)該執(zhí)行的操作操作序列可表示為:E(s)=Delete(T.name, t1.id), Delete(T.name, t2.id), ., Delete(T.name, tm.id), E(s) ,其中tk, k =1, 2, 3, ., |。6)對(duì)于聚集實(shí)體集和與之對(duì)應(yīng)的實(shí)體集,應(yīng)該執(zhí)行的操作可表示為:E()= Delete(T.name, t1.id), Delete(T.name, t2.id), ., Delete (T.name, tm.id), E(s2) , E(s3) , ., E(sn),其中ti, i =1, 2, 3, ., |;sj, j =1, 2, 3, ., |。3 結(jié)語針對(duì)實(shí)現(xiàn)中的具體需要,本文討論了更新傳播軟件工具的開發(fā)策略和主要功能,以及更新傳播中主要操作的自動(dòng)化處理實(shí)現(xiàn)方式。當(dāng)然,系統(tǒng)還有一定的局限和不足,在1對(duì)多、多對(duì)多類型的屬性匹配、更新一致性檢測(cè)和維護(hù)等方面尚需做進(jìn)一步的補(bǔ)充和完善。致謝:本文得到國家自然科學(xué)基金項(xiàng)目(40337055)、國家科技支撐項(xiàng)目(2006BAJ05A14),河南省科技計(jì)劃重點(diǎn)攻關(guān)項(xiàng)目(092102210361),河南省教育廳自然科學(xué)研究計(jì)劃項(xiàng)目(2009B420001),河南理工大學(xué)博士基金項(xiàng)目(B2008-49)的資助。參考文獻(xiàn)1 Fritsch D., GIS Data Revision and RealityC, Keynote Speech in Joint ISPRS Commission Workshop on Dynamic and Multi-dimensional GIS, Beijing, 1999。2 蔣捷,陳軍,基礎(chǔ)地理信息數(shù)據(jù)庫更新的若干思考J,測(cè)繪通報(bào),2000(5):1-3。3 Spery Laurent, A Framework for Update Process in GISC, Proceedings of the 3rd International Conference on GeoComputa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論