版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第八講空間元數(shù)據(jù)1、元數(shù)據(jù)的基本概念2、元數(shù)據(jù)的內(nèi)容及標準 3、元數(shù)據(jù)的表達4、元數(shù)據(jù)系統(tǒng)5、元數(shù)據(jù)應用1、元數(shù)據(jù)的基本概念元數(shù)據(jù)(Metadata)是關(guān)于數(shù)據(jù)集的數(shù)據(jù),是數(shù)據(jù)集的說明或描述。在地理信息系統(tǒng)中用于描述地理數(shù)據(jù)集的內(nèi)容,質(zhì)量等數(shù)據(jù)的一些特征。它可以幫助人們查找和理解數(shù)據(jù)。
1、元數(shù)據(jù)的基本概念 ——實例元數(shù)據(jù)并不是一個新的概念,以下各例均可以看成是元數(shù)據(jù):傳統(tǒng)的圖書館卡片
出版圖書的版權(quán)說明
磁盤的標簽
紙制地圖的元數(shù)據(jù)表示為:地圖類型、地圖圖例、圖名、空間參照系統(tǒng)和圖廓坐標地圖內(nèi)容說明、比率尺和精度、編制出版單位日期或更新日期、銷售信息
…1、元數(shù)據(jù)的基本概念 ——數(shù)據(jù)存儲我們所討論的元數(shù)據(jù)是以數(shù)據(jù)的形式存儲的,這不同于以往的元數(shù)據(jù)。它應盡可能多地反映數(shù)據(jù)集自身的特征規(guī)律,以便于用戶對數(shù)據(jù)集的準確、高效與充分的開發(fā)與利用,不同領(lǐng)域的數(shù)據(jù)庫,其元數(shù)據(jù)的內(nèi)容會有很大差異。通過元數(shù)據(jù)可以檢索、訪問數(shù)據(jù)庫,可以有效利用計算機的系統(tǒng)資源,可以對數(shù)據(jù)進行加工處理和二次開發(fā)等。
科學界關(guān)于元數(shù)據(jù)認識的共同點是:元數(shù)據(jù)的目的就是促進數(shù)據(jù)集的高效利用,并為計算機輔助軟件工程(CASE)服務。
1、元數(shù)據(jù)的基本概念 ——空間元數(shù)據(jù)空間元數(shù)據(jù)(GeoMetadata),是關(guān)于地理相關(guān)數(shù)據(jù)和信息資源的描述性信息。它通過對地理空間數(shù)據(jù)的內(nèi)容、質(zhì)量、條件、位置和其他特征進行描述與說明,幫助和促進人們有效地定位、評價、比較、獲取和使用地理相關(guān)數(shù)據(jù)。對空間數(shù)據(jù)某一特征的描述,稱為一個空間元數(shù)據(jù)項。
空間元數(shù)據(jù)是一個由若干復雜或簡單的元數(shù)據(jù)項組成的集合??臻g元數(shù)據(jù)是對地理空間數(shù)據(jù)的一個抽象映射。從這個意義上來說,空間元數(shù)據(jù)和地理空間數(shù)據(jù)是對地理空間實體不同抽象層次的描述,是對地理信息的不同深度的表達,它們統(tǒng)一于它們所反映的客觀內(nèi)容。
1、元數(shù)據(jù)的基本概念 ——空間元數(shù)據(jù)概念列舉空間數(shù)據(jù)(GeospatialData):用于確定具有自然特征或者人工建筑特征的地理實體的地理位置、屬性及其邊界的信息;類型(Type):在元數(shù)據(jù)標準中,數(shù)據(jù)類型指該數(shù)據(jù)能接收的值的類型;對象(Object):對地理實體的部分或整體的數(shù)字表達;實體類型(EntityType):對于具有相似地理特征的地理實體集合的定義和描述;點(Point):用于位置確定的零維地理對象;結(jié)點(Node):拓撲連接兩個或多個鏈或環(huán)的一維對象;標識點(LabelPoint):顯示地圖后圖表時用于特征標識的參考點;線(Line):一維對象的一般術(shù)語;線段(LineSegment):兩個點之間的直線段;串(String):由相互連接的一系列線段組成的沒有分支線段的序列,它可與自身或與其它線相切;弧(Arc):由數(shù)學表達式確定的點集組成的弧狀曲線;鏈(Link):兩個結(jié)點之間的拓撲關(guān)聯(lián);鏈環(huán)(Chain):非相切線段或由結(jié)點區(qū)分的弧段構(gòu)成的有方向無分支序列;環(huán)(Ring):封閉狀不相切鏈環(huán)或弧段序列;多邊形(Ploygon):在二維平面中由封閉弧段包圍的區(qū)域;1、元數(shù)據(jù)的基本概念 ——空間元數(shù)據(jù)概念列舉(續(xù)一)外多邊形(UniversePolygon):數(shù)據(jù)覆蓋區(qū)域內(nèi)最外側(cè)的多邊形,其面積是其它所有多邊形的面積之和;內(nèi)部區(qū)域(InteriorArea):不包括其邊界的區(qū)域;格網(wǎng)(Grid):組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的格網(wǎng)集合,或者組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌的點集合;格網(wǎng)單元(GridCell):表示格網(wǎng)最小分為要素的二維對象;矢量(Vector):有方向線的組合;柵格(Raster):同一格網(wǎng)或數(shù)字影像的一個或多個疊加層;像元(Pixel):二維圖形要素,它是數(shù)學影像最小要素;柵格對象(RasterObject):一個或多個影象或格網(wǎng),每個影象或格網(wǎng)表示一個數(shù)據(jù)層,各層之間相應的格網(wǎng)單元或像元一致且相互套準;圖形(Graph):與預定義的限制規(guī)則一致的零維(如node)、一維(link或chain)和二維(T多邊形)有拓撲相關(guān)的對象集;數(shù)據(jù)層(Layer):集成到一起的面域分布空間數(shù)據(jù)集,它用于表示一個主體中的實體,或者有一公共屬性或?qū)傩灾档目臻g對象的聯(lián)合;層(Stratum):在有序系統(tǒng)中數(shù)據(jù)層、級別或梯度序列;緯度(Latitude):在中央經(jīng)線上度量,以角度單位度量離開赤道的距離;經(jīng)度(Longitude):經(jīng)線面到格林尼治中央經(jīng)線面的角度距離;1、元數(shù)據(jù)的基本概念 ——空間元數(shù)據(jù)概念列舉(續(xù)二)經(jīng)圈(Meridian):穿過地球兩極的地球的大圓圈;坐標(Ordinate):在笛卡爾坐標系中沿平行于X軸和Y軸測量的坐標值;投影(Projection):將地球球面坐標中的空間特征(集)轉(zhuǎn)化到平面坐標體系時使用的數(shù)學轉(zhuǎn)化方法;投影參數(shù)(ProjectionParameters):對數(shù)據(jù)集進行投影操作時用于控制投影誤差、變形實際分布的參考特征;地圖(Map):空間現(xiàn)象的空間表征,通常以平面圖形表示;現(xiàn)象(Phenomenon):事實、發(fā)生的事件、狀態(tài)等;分辨率(Resolution):由涉及到或使用的測量工具或分析方法能區(qū)分開的兩個獨立測量或計算的值的最小差值;質(zhì)量(Quality):數(shù)據(jù)符合一定使用要求的基本或獨特的性質(zhì);詳述(Explicit):由一對數(shù)或三個數(shù)分別直接描述水平位置和三維位置的方法;介質(zhì)(Media):用于記錄、存儲或傳遞數(shù)據(jù)的物理設(shè)備。2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的內(nèi)容元數(shù)據(jù)的內(nèi)容包括:對數(shù)據(jù)集的描述;對數(shù)據(jù)集中各數(shù)據(jù)項、數(shù)據(jù)來源、數(shù)據(jù)所有者及數(shù)據(jù)序代(數(shù)據(jù)生產(chǎn)歷史)等的說明;對數(shù)據(jù)質(zhì)量的描述,如數(shù)據(jù)精度、數(shù)據(jù)的邏輯一致性、數(shù)據(jù)完整性、分辨率、元數(shù)據(jù)的比例尺等;對數(shù)據(jù)處理信息的說明,如量綱的轉(zhuǎn)換等;對數(shù)據(jù)轉(zhuǎn)換方法的描述;對數(shù)據(jù)庫的更新、集成等的說明。
2、元數(shù)據(jù)的內(nèi)容及標準 ——空間元數(shù)據(jù)的內(nèi)容
確定一套地理空間數(shù)據(jù)的存在性及其位置確定一套地理空間數(shù)據(jù)對某種應用的適宜性確定獲取一套地理空間數(shù)據(jù)的手段確定成功地轉(zhuǎn)換一套地理空間數(shù)據(jù)的方法和途徑確定一套地理空間數(shù)據(jù)的存儲與表達方法確定一套地理空間數(shù)據(jù)的使用方法
…
2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的分類(按內(nèi)容劃分)科研型元數(shù)據(jù):這類元數(shù)據(jù)的任務是幫助科研工作者高效獲取所需數(shù)據(jù),內(nèi)容包括數(shù)據(jù)源名稱、作者、主體內(nèi)容等傳統(tǒng)的、圖書管理式的元數(shù)據(jù),以及數(shù)據(jù)拓撲關(guān)系。評估型元數(shù)據(jù):主要服務于數(shù)據(jù)利用的評價,內(nèi)容包括數(shù)據(jù)最初收集情況、收集數(shù)據(jù)所用的儀器、數(shù)據(jù)獲取的方法和依據(jù)、數(shù)據(jù)處理過程和算法、數(shù)據(jù)質(zhì)量控制、采樣方法、數(shù)據(jù)精度、數(shù)據(jù)的可信度、數(shù)據(jù)潛在應用領(lǐng)域等。模型元數(shù)據(jù):用于描述數(shù)據(jù)模型的元數(shù)據(jù)與描述數(shù)據(jù)的元數(shù)據(jù)在結(jié)構(gòu)上大致相同,其內(nèi)容包括模型名稱、模型類型、建模過程、模型參數(shù)、邊界條件、作者、引用模型描述、建模使用軟件、模型輸出等。2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的分類(按對象劃分)數(shù)據(jù)層元數(shù)據(jù):指描述數(shù)據(jù)集中每個數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括日期郵戳、位置戳、量綱、注釋、誤差標識、縮略標識、存在問題標識、數(shù)據(jù)處理過程等。屬性元數(shù)據(jù):是關(guān)于屬性數(shù)據(jù)的元數(shù)據(jù),內(nèi)容包括為表達數(shù)據(jù)及其含義所建的數(shù)據(jù)字典、數(shù)據(jù)處理規(guī)則(協(xié)議),如采樣說明、數(shù)據(jù)傳輸線路及代數(shù)編碼等。實體元數(shù)據(jù):是描述整個數(shù)據(jù)集的元數(shù)據(jù),內(nèi)容包括數(shù)據(jù)集區(qū)域采樣原則、數(shù)據(jù)庫的有效期、數(shù)據(jù)時間跨度等。2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的分類(按系統(tǒng)作用劃分)系統(tǒng)級別元數(shù)據(jù):指用于實現(xiàn)文件系統(tǒng)特征或管理文件系統(tǒng)中數(shù)據(jù)的信息,如訪問數(shù)據(jù)的時間、數(shù)據(jù)的大小、在存儲級別中的當前位置、如何存儲數(shù)據(jù)塊以保證服務控制質(zhì)量等。應用層元數(shù)據(jù):指有助于用戶查找、評估、訪問和管理數(shù)據(jù)等與數(shù)據(jù)用戶有關(guān)的信息,如文本文件內(nèi)容的摘要信息、圖形快照、描述與其它數(shù)據(jù)文件相關(guān)關(guān)系的信息。2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的分類(按作用劃分)說明元數(shù)據(jù):是為用戶使用數(shù)據(jù)服務的元數(shù)據(jù)。它一般用自然語言表達,如源數(shù)據(jù)覆蓋的空間范圍、源數(shù)據(jù)圖的投影方式及比例尺的大小、數(shù)據(jù)集說明文件等,這類元數(shù)據(jù)多為描述性信息,側(cè)重于數(shù)據(jù)庫的說明??刂圃獢?shù)據(jù):是用于計算機操作流程控制的元數(shù)據(jù),這類元數(shù)據(jù)由一定的關(guān)鍵詞和特定的句法來實現(xiàn)。其內(nèi)容包括數(shù)據(jù)存儲和檢索文件、檢索中與目標匹配方法、目標的檢索和顯示、分析查詢結(jié)果排列顯示、數(shù)據(jù)轉(zhuǎn)換方法、空間數(shù)據(jù)和屬性數(shù)據(jù)的集成、根據(jù)索引項把數(shù)據(jù)繪制成圖、數(shù)據(jù)模型的建設(shè)和利用等。這類元數(shù)據(jù)主要是與數(shù)據(jù)庫操作有關(guān)的方法。
2、元數(shù)據(jù)的內(nèi)容及標準 ——建立元數(shù)據(jù)標準的必要性空間數(shù)據(jù)是一種結(jié)構(gòu)比較復雜的數(shù)據(jù)類型。它涉及到對于空間特征的描述,也涉及到對于屬性特征及其它們之間關(guān)系的描述,所以空間數(shù)據(jù)元數(shù)據(jù)標準的建立是項復雜的工作;由于種種原因,某些數(shù)據(jù)組織或數(shù)據(jù)用戶開發(fā)出來的空間數(shù)據(jù)元數(shù)據(jù)標準很難為地學界所廣泛接受。但空間數(shù)據(jù)元數(shù)據(jù)標準的建立是空間數(shù)據(jù)標準化的前提和保證,只有建立起規(guī)范的空間數(shù)據(jù)元數(shù)據(jù)才能有效利用空間數(shù)據(jù)。2、元數(shù)據(jù)的內(nèi)容及標準 ——元數(shù)據(jù)的標準
當前,人們對于空間元數(shù)據(jù)的研究已形成了兩個標準:美國聯(lián)邦數(shù)據(jù)委員會(FGDC)的空間元數(shù)據(jù)標準國際標準化組織(ISO/TC211)的空間元數(shù)據(jù)標準這兩個標準從不同側(cè)面對地理空間數(shù)據(jù)進行了比較詳細的描述。
2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準
美國聯(lián)邦地理數(shù)據(jù)委員會(FederalCongraphicDataCommittee,F(xiàn)GDC)成立于1990年,由來自16個單位的17位專家組成。1994年8月FGDC通過并發(fā)布第一版CSDGM。此后,美國聯(lián)邦政府內(nèi)外的許多單位根據(jù)12906號總統(tǒng)令的要求,從1995年開始執(zhí)行這一標準。FDGC于1997年完成了第二版CSDGM,并于1998年6月認可了該標準(FGDC-STD-001-1998)。
2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準 根據(jù)最新的FGDC的用戶手冊,標準中定義了三類元素:子集(Sectoins):標準中主要的章節(jié)被稱為子集,其實它也是復合元素。復合元素(CompoundElement):一組相關(guān)的數(shù)據(jù)元素或者其它復合元素。
數(shù)據(jù)元素(DataElement):從邏輯上不可再分割的數(shù)據(jù)項。
每個元素可以是必選的,可選的,或者是一定條件下可選的(如元數(shù)據(jù)的實例包含了某個子集、復合元素或具有了某個屬性,就必須提供信息)。2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準 FGDC元數(shù)據(jù)標準的各個子集的示意圖
其中1到7是主要子集,而8到10屬于次要子集,它們不能單獨存在,只能在主要子集中被引用。2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準信息項說明標識信息(Identification)是關(guān)于數(shù)據(jù)集的基本信息。主要包括:引用,描述信息,狀態(tài)信息,空間范圍,關(guān)鍵詞,訪問限制,使用限制等。數(shù)據(jù)質(zhì)量信息(DataQuality)
對數(shù)據(jù)質(zhì)量進行總體評價的信息。包括屬性精度,邏輯可靠性報告,完整性報告,位置精度,繼承信息(數(shù)據(jù)源+處理步驟)等。
空間數(shù)據(jù)表示信息(SpatialDataOrganization)
數(shù)據(jù)集中空間信息的組織方法。由空間表示類型,矢量空間表示信息,柵格空間表示信息等組成。
空間參照系信息(SpatialReference)數(shù)據(jù)集中坐標的參考框架以及編碼方式的描述,是反映現(xiàn)實世界和地理數(shù)字世界之間關(guān)系的通道。包括平面坐標系定義和垂直坐標系定義。2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準 信息項說明實體和屬性信息(EntityandAttribute)
是關(guān)于數(shù)據(jù)集內(nèi)容的細節(jié)信息,包括實體類型,它們的屬性及屬性的值域。
發(fā)行信息(Distribution)
是關(guān)于數(shù)據(jù)發(fā)行和獲取的信息。包括發(fā)行部門,數(shù)據(jù)資源描述,發(fā)行部門責任,獲取手段等。
元數(shù)據(jù)參考信息(MetadataReference)
元數(shù)據(jù)當前狀況及其負責部門的信息,包括元數(shù)據(jù)日期信息、聯(lián)系地址,制定元數(shù)據(jù)所使用的標準、版本、限制條件、安全信息以及元數(shù)據(jù)擴展信息等,是當前數(shù)據(jù)集所作元數(shù)據(jù)的描述的依據(jù)。引用信息(Citation)
引用和參考數(shù)據(jù)集時所需的簡要信息。包括標題、作者信息和參考時間等。
2、元數(shù)據(jù)的內(nèi)容及標準 ——FGDC空間元數(shù)據(jù)標準 信息項說明時間范圍信息(TimePeriod)
有關(guān)事件的日期和時間信息,被主要子集的元素引用。
聯(lián)系信息(Contact)
在主要子集中被引用的有關(guān)個人或組織的聯(lián)系信息?!咀ⅰ浚好绹鳩GDC元數(shù)據(jù)標準除在美國國內(nèi)廣泛使用外,加拿大、印度等國也同等采用,作為各自的國家標準。ISO/TC211利用該標準文本作為基礎(chǔ),正在制定相應的國際標準。
2、元數(shù)據(jù)的內(nèi)容及標準 ——ISO/TC211空間元數(shù)據(jù)標準 國際標準化組織ISO作為全球標準的權(quán)威機構(gòu),對地理數(shù)據(jù)標準化問題一直比較重視。1994年后期,國際標準化組織面對地理信息數(shù)據(jù)標準化的趨勢,成立了地理信息/地球信息業(yè)技術(shù)委員會,即ISO/TC211編號為15046,用于專門研究和建立一個處理與地球位置有直接或間接關(guān)系的地理對象或現(xiàn)象的標準體系。ISO/TC211的元數(shù)據(jù)標準以FGDC等現(xiàn)有標準為基礎(chǔ),按照國際標準化組織制定的標準導則要求制定。其工作范圍是:定義說明地理信息和服務所需要的信息。提供有關(guān)數(shù)字地理數(shù)據(jù)標識、覆蓋范圍、質(zhì)量、空間和時間模式、空間參照系統(tǒng)和發(fā)行信息。該標準適用于數(shù)據(jù)集編目、數(shù)據(jù)交換網(wǎng)絡,以及數(shù)據(jù)集的詳盡說明。適用于地理數(shù)據(jù)集、數(shù)據(jù)集系列、地理要素和屬性。2、元數(shù)據(jù)的內(nèi)容及標準 ——ISO/TC211空間元數(shù)據(jù)標準TC211于1998年9月發(fā)布了地理信息元數(shù)據(jù)元數(shù)據(jù)標準的草案TC21115046-15。標準
一共有400多個元素分為:必選、可選或一定條件下必選幾種,同時標準還提出了用戶自己擴充元數(shù)據(jù)的方法。標準中定義了兩級元數(shù)據(jù):一級元數(shù)據(jù):主要用于支持數(shù)據(jù)編目和空間信息交換中心的數(shù)據(jù)發(fā)現(xiàn)服務,包含了53個元數(shù)據(jù)元素。二級元數(shù)據(jù):提供了更完全的數(shù)據(jù)集描述,包含了13種類型的元數(shù)據(jù)。2、元數(shù)據(jù)的內(nèi)容及標準 ——ISO/TC211空間元數(shù)據(jù)標準二級元數(shù)據(jù)標識信息(Identificationinformation)數(shù)據(jù)質(zhì)量信息(DataQualityinformation)譜系信息(Lineageinformation)空間數(shù)據(jù)表示(Spatialdatarepresentation)參考系統(tǒng)信息(Referencesysteminformation)
特征目錄信息(Featurecatalogueinformation)
發(fā)布信息(Distributioninformation)元數(shù)據(jù)參考信息(Metadatareferenceinformation)引用信息(Citationinformation)
數(shù)據(jù)負責者信息(Responsiblepartyinformation)
地址信息(Addressinformation)
范圍信息(Extentinformation)在線資源信息(
On-lineresourceinformation)
其中前8個是元數(shù)據(jù)的子集而后5個是可重復的實體,它們不能單獨使用,總是作為一個單元出現(xiàn)在8個子集中。
2、元數(shù)據(jù)的內(nèi)容及標準 ——ISO/TC211空間元數(shù)據(jù)標準ISO/TC211空間元數(shù)據(jù)標準是至今最完整、也是最為復雜的元數(shù)據(jù)標準方案。另外,還有一個英國Dublin元數(shù)據(jù)核心標準。它是1995年3月由有關(guān)圖書館、數(shù)字圖書館、標記語言等方面的專家們制定的一個有關(guān)網(wǎng)絡電子資源的發(fā)現(xiàn)標準(RFC2413)。有關(guān)這一標準的詳細說明請參考實驗室張穎碩士論文。2、元數(shù)據(jù)的內(nèi)容及標準 ——我國元數(shù)據(jù)的發(fā)展與國外相比,我國對地理信息元數(shù)據(jù)的研究以及對相關(guān)標準的制定和實施剛剛起步。按照國家“九五”科技攻關(guān)計劃“中國可持續(xù)發(fā)展信息共享示范”和“國土資源與地區(qū)經(jīng)濟信息系統(tǒng)和國家空間信息基礎(chǔ)設(shè)施關(guān)鍵技術(shù)研究”兩個項目的相關(guān)專題設(shè)計,通過對前兩個國際標準的研究分析,初步制定了項目內(nèi)部使用的《中國可持續(xù)發(fā)展信息共享元數(shù)據(jù)標準》和《NREDIS信息共享元數(shù)據(jù)內(nèi)容標準草案》。2、元數(shù)據(jù)的內(nèi)容及標準 ——NREDIS信息共享元數(shù)據(jù)標準我國在元數(shù)據(jù)方面的標準主要是參考美國的FGDC地理空間元數(shù)據(jù)標準。NREDIS信息共享元數(shù)據(jù)標準是有代表性的一個。在該標準中,各個元素的選擇主要基于以下四方面來考慮:數(shù)據(jù)集的可用性數(shù)據(jù)集的適用性如何獲取數(shù)據(jù)集如何使用數(shù)據(jù)集2、元數(shù)據(jù)的內(nèi)容及標準 ——NREDIS信息共享元數(shù)據(jù)標準
NREDIS信息共享元數(shù)據(jù)標準的標準組織結(jié)構(gòu):章節(jié)部分 標明該標準是由何樣層狀結(jié)構(gòu)組織元數(shù)據(jù)元素和復合元素。復合元素 由數(shù)據(jù)元素和其它符合元素組成,表示較高層次的概念。元素 元數(shù)據(jù)的最基本信息單元,包括元素名、定義、類型、值域、域名縮寫。類型有integer、real、text、date、time五種。域名縮寫由少于八個字符組成。值域指明了元素的取值范圍。日期 用不同的時間格式表示不同的公元時間段。如,公元元年到公元9999年12月31日,用YYYYMMDD表示。2、元數(shù)據(jù)的內(nèi)容及標準 ——NREDIS信息共享元數(shù)據(jù)標準
NREDIS信息共享元數(shù)據(jù)標準的標準組織結(jié)構(gòu):時間 有地方時、帶時差的地方時和統(tǒng)一時三種表示。例如帶時差的地方時可以表示為HHMMSSSSshhmm,其中HHMMSSSS表示地方時,s表示時間差符號(+/-),hhmm表示時間差的時和分。經(jīng)緯度 用十進制小數(shù)表示經(jīng)緯度。維度在赤道以北,用+標明,以南用-標明;經(jīng)度在主子午線以東用+(或不加符號)標明,以西用-標明。網(wǎng)址和文件名 文件名和網(wǎng)址遵循Internet的URL規(guī)定。元素的可選條件 包括必選(Mandatory)、條件必選(Mandatory-if-Applicable)和可選(Optional)。2、元數(shù)據(jù)的內(nèi)容及標準 ——NREDIS信息共享元數(shù)據(jù)標準
NREDIS信息共享元數(shù)據(jù)標準的標準組織結(jié)構(gòu):產(chǎn)生規(guī)則 用于確定一個復合元素和它的下一級的數(shù)據(jù)元素和復合元素之間的關(guān)系。例如:
a=b+c:a由b和c組成;
a=[b|c]:a由b或c組成;
a=46:a由b重復4到6次組成。擴展性 數(shù)據(jù)集生產(chǎn)者和共享用戶可以定義擴展元素,它是不包括在標準中的元素。定義時,必須符合標準的繼承結(jié)構(gòu),不能改變標準元素的名稱、定義。類型和域,可以定義為符合元素,也可以包括擴展和標準元素。3、元數(shù)據(jù)的表達 ——XML和元數(shù)據(jù)現(xiàn)今網(wǎng)絡時代,XML即將成為網(wǎng)上信息交換的基本格式。XML本身具有的特點使它很自然的成為元數(shù)據(jù)表達的基本方式(我們假定大家對XML本身已經(jīng)有了一定了解):純文本表示,具有平臺無關(guān)性
信息的內(nèi)容與信息的表示是分開的,可滿足各種不同的需求
系統(tǒng)可以利用XML來方便地表達元數(shù)據(jù)
系統(tǒng)可以利用XML的樣式語言來實現(xiàn)元數(shù)據(jù)間的轉(zhuǎn)換和顯示
可以方便地查詢系統(tǒng)元數(shù)據(jù)
業(yè)界對XML技術(shù)有廣泛的支持
3、元數(shù)據(jù)的表達 ——DTD和XMLSchema上面已經(jīng)提到,XML的優(yōu)勢之一在于數(shù)據(jù)和描述的分離。而用來描述XML數(shù)據(jù)本身的DTD(DocumentTypeDefinition)和XMLSchema成為元數(shù)據(jù)定義的主要表達方式。DTD(DocumentTypeDefinition)
由XML1.0規(guī)范提出,它是XML文檔的文檔類型聲明段。它規(guī)定了元素的結(jié)構(gòu)和屬性列表以及元素間的邏輯關(guān)系,以對XML文檔進行有效性檢查。
XMLSchema XMLSchema是定義XML標記集合和應用的元語言,它的功能就類似于XML1.0中的文檔類型定義(DTD)。
但是給出了更多的擴展,而且本身也用XML表達。3、元數(shù)據(jù)的表達 ——DTD和XMLSchema數(shù)據(jù)XML數(shù)據(jù)文件Schema文件XML1.0DTD或XMLSchema內(nèi)容信息結(jié)構(gòu)和限制信息保證文檔是格式良好的保證文檔的有效性DTD、XMLSchema對XML的格式定義3、元數(shù)據(jù)的表達 ——DTD對XML文檔的定義帶有DTD定義的XML數(shù)據(jù)文件3、元數(shù)據(jù)的表達 ——XMLSchemaXMLSchema是定義XML標記集合和應用的元語言,它的功能就類似于XML1.0中的文檔類型定義(DTD)。XMLSchema中增加許多新的機制,包括可以規(guī)定元素和屬性的數(shù)據(jù)類型(比如整型,日期類型)、可以明確地支持名域,以及比DTD更為強大的內(nèi)容模型(包括簡單類型和復雜類型)等。XMLSchema在聲明的時候使用的也是XML,而不是其它特殊的記法。這就意味著XMLSchema文檔可以被普通的XML軟件所處理,而不象DTD那樣需要特殊的工具。
3、元數(shù)據(jù)的表達 ——XMLSchema的一些概念
類型定義:簡單類型定義(SimpleTypeDefinition)
復雜類型定義(ComplexTypeDefinition)
類型繼承:限制性繼承(DrivingComplexTypesfromRestriction
)
擴展性繼承(DrivingTypesfromExtention)
元素聲明屬性聲明(AttributeDeclarations)
模型組(ModelGroup):Sequence,Choice,All元素重復次數(shù):minoccur
和maxoccur返回一個較為復雜的XML數(shù)據(jù)文件該數(shù)據(jù)文件的XMLSchema文件3、元數(shù)據(jù)的表達 ——XML、RDF和元數(shù)據(jù)
XML和元數(shù)據(jù)
XML的一個很大的優(yōu)點就是具有自說明性,因為通過文件的DTD和XMLSchema就可以了解數(shù)據(jù)集的結(jié)構(gòu)信息――可以說,雖然沒有直接說DTD和XMLSchema是元數(shù)據(jù),其實它在功能上講就是一種元數(shù)據(jù)——是關(guān)于數(shù)據(jù)集關(guān)系和數(shù)據(jù)元素限制條件的元數(shù)據(jù),所以用它們來表示數(shù)據(jù)集間的關(guān)系顯得很自然。
RDF和元數(shù)據(jù)
RDF(ResourceDefineFramework)是一種用來描述網(wǎng)上資源的元數(shù)據(jù)描述框架,而RDFSchema可以定義RDF所須的標簽詞匯,通過subClassOf和subPropertyOf等概念,RDFSchema不僅可以描述對象類之間的派生關(guān)系,也可以描述屬性成員上的約束關(guān)系。由于目前對RDFSchema的支持軟件明顯不如DTD和XMLSchema,在這里不再過多介紹RDF。
3、元數(shù)據(jù)的表達 ——用XML表示元數(shù)據(jù)XML1.0規(guī)范(包含了DTD的說明)XMLSchemaRDF標準元數(shù)據(jù)共識元數(shù)據(jù)用戶自定義元數(shù)據(jù)元數(shù)據(jù)記錄系統(tǒng)的元數(shù)據(jù)利用XML來表示元數(shù)據(jù)3、元數(shù)據(jù)的表達 ——元數(shù)據(jù)表示實例下面給出了一段關(guān)于圖層元數(shù)據(jù)的DTD表達<!--空間元數(shù)據(jù)DTD表示--><!--0.空間元數(shù)據(jù)--><!ELEMENTmetadata(idinfo,dataqual?,spdoinfo?,spref?,eninfo?,distinfo?,metainfo,locate?)><!--標識信息部分--><!--1.標識信息:
是關(guān)于數(shù)據(jù)集的基本信息--><!ELEMENTidinfo(citeinfo,descript,timeinfo,status,spdom,keywords,accconst,useconst,ptcontac?,secinfo?)><!--1.1引用
在citeinfo中有描述--><!--1.2描述信息--><!ELEMENTdescript(EMPTY)><!ATTLISTdescriptabstractCDATA#IMPLIEDpurposeCDATA#IMPLIED>
3、元數(shù)據(jù)的表達 ——元數(shù)據(jù)表示實例(續(xù))<!--1.3內(nèi)容時間信息--數(shù)據(jù)集內(nèi)容相應與參考時間的時間信息,在timeinfo中有描述--><!--1.4狀態(tài)--數(shù)據(jù)集的狀態(tài)和維護信息--><!ELEMENTstatusEMPTY)><!ATTLISTstatusprogress(Complete|Inwork|Planned)“Planned”update(Continually|Daily|Weekly|Monthly|Annually|Unknown|Asneeded|Irregular|Noneplanned)“Unknown”><!--1.5空間范圍--數(shù)據(jù)集中的地理區(qū)域--><!ELEMENTspdomEMPTY><!ATTLISTspdomwestbcCDATA#REQUIREDeastbcCDATA#REQUIREDnorthbcCDATA#REQUIRED
3、元數(shù)據(jù)的表達 ——元數(shù)據(jù)表示實例(續(xù))southbcCDATA#REQUIRED><!--1.6關(guān)鍵詞—概括數(shù)據(jù)集某一方面特性的詞或短語--><!ELEMENTkeywordsEMPTY><!ATTLISTkeywordsthemeCDATA#IMPLIEDplaceCDATA#IMPLIEDstratumCDATA#IMPLIEDtemporalCDATA#IMPLIED><!--1.7訪問限制--存取數(shù)據(jù)集的必要的限制和規(guī)定--><!ELEMENTaccconst(#PCDATA)><!--1.8聯(lián)系信息--可知的關(guān)于數(shù)據(jù)集的個體或團體的聯(lián)系信息--><!ELEMENTuseconst(#PCDATA)>
4、元數(shù)據(jù)系統(tǒng) ——元數(shù)據(jù)系統(tǒng)和GeoMeta
雖然利用目前一些現(xiàn)成的免費軟件很快就可以搭建一個元數(shù)據(jù)系統(tǒng),比如說國內(nèi)的用戶就可以直接到國家空間信息基礎(chǔ)設(shè)施網(wǎng)站下載I-Site的相關(guān)軟件包,但其無論是在對元數(shù)據(jù)的描述能力還是存儲和查詢的支持都十分有限。
考慮到上面我們使用XML作為元數(shù)據(jù)的表達工具,一個能夠使用XML來描述各種層次的元數(shù)據(jù)以及基于XML進行元數(shù)據(jù)存儲、轉(zhuǎn)換和查詢的元數(shù)據(jù)系統(tǒng)將能夠反映基本的元數(shù)據(jù)集成操作的主要特征。以下我們將重點介紹實驗室設(shè)計的GeoMeta——一個基于XML的地理信息元數(shù)據(jù)系統(tǒng)。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta體系結(jié)構(gòu)Z39.50查詢處理器Z39.50服務器元數(shù)據(jù)管理器查詢處理器GeoMeta服務器文件系統(tǒng)元數(shù)據(jù)管理工具元數(shù)據(jù)查詢工具Z39.50客戶端GeoMeta通訊協(xié)議WEB服務器網(wǎng)關(guān)元數(shù)據(jù)庫服務器Z39.50協(xié)議Z39.50協(xié)議GeoMeta通訊協(xié)議系統(tǒng)配置工具數(shù)據(jù)庫WWWHTTPHTTPGeoMeta服務端GeoMeta客戶端通訊協(xié)議網(wǎng)關(guān)GeoMeta系統(tǒng)在參考了FGDC提供的用于建設(shè)空間信息交換中心(ClearingHouse)
的I-Site系列軟件和由BlueAngelTechnologies公司開發(fā)的MetaStar系列產(chǎn)品后設(shè)計并部分實現(xiàn)的。主要包括服務器端的GeoMeta服務器、元數(shù)據(jù)管理器、查詢處理器和系統(tǒng)配置工具,客戶端的元數(shù)據(jù)查詢工具和元數(shù)據(jù)管理工具。為了方便用戶使用,服務器還提供一個網(wǎng)關(guān)使得用戶可以通過WWW網(wǎng)在瀏覽器中對系統(tǒng)進行查詢和管理。由于通過Z39.50協(xié)議不容易表達XQuery查詢,系統(tǒng)設(shè)計了一個簡單的通訊協(xié)議――GeoMeta協(xié)議。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)簡介4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的服務器端
GeoMeta服務器:是元數(shù)據(jù)服務器對外的接口。主要負責接收來自客戶端的按GeoMeta通訊協(xié)議組織的消息,經(jīng)過解析后調(diào)用相應的功能模塊,然后將結(jié)果組織好后返回給客戶端。元數(shù)據(jù)管理器:負責管理各種元數(shù)據(jù)的模式文件(DTD或XMLSchema)以及它們的元數(shù)據(jù)記錄。用戶可以通過元數(shù)據(jù)管理工具來編輯元數(shù)據(jù)的模式文件并加入到系統(tǒng)中,還可以建立一些系統(tǒng)元數(shù)據(jù)之間的映射關(guān)系,以及各種數(shù)據(jù)的輸入輸出格式與系統(tǒng)元數(shù)據(jù)的映射關(guān)系從而方便地導入和導出不同格式的元數(shù)據(jù)文件。它還負責元數(shù)據(jù)記錄的添加、刪除和修改。查詢處理器:負責處理由GeoMeta服務器傳過來的各種查詢要求(例如支持最簡單的關(guān)鍵詞查詢,結(jié)構(gòu)化或半結(jié)構(gòu)化的帶限制的XQuery查詢語句)。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的服務器端
Z39.50服務器:負責接收來自Z39.50客戶端的查詢請求。將請求重新組織后交給Z39.50查詢處理器,得到結(jié)果后將其按用戶要求組織,返回給客戶端。
Z39.50查詢處理器:根據(jù)用戶的請求查詢請求,參照系統(tǒng)的檢索屬性映射表和系統(tǒng)的實際存儲策略來構(gòu)造查詢語句,得到結(jié)果后返回給Z39.50服務器。
系統(tǒng)配置工具:負責配置元數(shù)據(jù)庫服務器的系統(tǒng)參數(shù),比如GeoMeta服務器的監(jiān)聽端口、文件管理目錄等等。還負責維護為支持Z39.50協(xié)議而保存的檢索屬性映射表和屬性與元數(shù)據(jù)元素的對應關(guān)系。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的客戶端元數(shù)據(jù)查詢工具:查詢工具由用戶界面模塊和協(xié)議處理傳輸模塊構(gòu)成,可以是基于GeoMeta通訊協(xié)議的應用程序、嵌入式構(gòu)件(COM)或JavaApplet。由于系統(tǒng)所支持的查詢語言不是一般用戶能書寫的,所以要由用戶界面模塊來負責與用戶交互,輸入查詢條件和呈現(xiàn)查詢結(jié)果。而協(xié)議處理傳輸模塊負責將用戶界面模塊收集到的查詢參數(shù)組織成查詢語句,再根據(jù)GeoMeta協(xié)議產(chǎn)生系統(tǒng)消息,通過TCP/IP協(xié)議發(fā)送給GeoMeta服務器。接受到返回結(jié)果后拆包,將查詢結(jié)果交用戶界面模塊顯示。如果是在瀏覽器上做查詢界面,只需在HTML的表單中收集到查詢的參數(shù),發(fā)送給WEB服務器就可以取得以HTML格式返回的數(shù)據(jù)了。
元數(shù)據(jù)管理工具:結(jié)構(gòu)同上,主要是要提供給用戶一個友好的界面來管理元數(shù)據(jù)模式信息、元數(shù)據(jù)記錄以及各種映射關(guān)系,包括增、刪、改和顯示。它也是既可以走GeoMeta通訊協(xié)議也可以通過瀏覽器來處理。不同的是它需要先登錄,才能進行權(quán)限內(nèi)的一些操作,還需要對前面的操作有所記錄,以便做日志或支持取消操作。
Z39.50客戶端:幫助用戶構(gòu)造基于Z39.50協(xié)議的查詢并呈現(xiàn)返回結(jié)果。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的客戶端
HTTP協(xié)議:為了讓用戶能通過瀏覽器來進行各種操作,系統(tǒng)必須支持HTTP協(xié)議。
GeoMeta通訊協(xié)議:GeoMeta系統(tǒng)自行設(shè)計的基于XML的通訊協(xié)議。協(xié)議通過XMLSchema文件描述了不同種類的服務以及服務參數(shù)和返回結(jié)果。這樣就可以由GeoMeta服務器統(tǒng)一接收消息,經(jīng)過解釋器處理以后發(fā)送到相應的功能模塊。這樣系統(tǒng)服務的添加和修改就顯得比較簡單,只需雙方都有該服務的那部分Schema就可以通訊了,而且由于消息是純文本格式,還避免了不同平臺的字符編碼問題。
39.50協(xié)議:是一種在客戶/服務器環(huán)境下計算機與計算機之間進行數(shù)據(jù)庫檢索的通訊協(xié)議。它的出版及使用解決了不同系統(tǒng)間的數(shù)據(jù)交流的問題,克服了信息檢索網(wǎng)絡化的障礙。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的協(xié)議
GeoMeta系統(tǒng)包括GeoMeta網(wǎng)關(guān)和Z39.50網(wǎng)關(guān)。它在某個意義上相當于客戶端的協(xié)議處理傳輸模塊的工作。它的主要功能是將用戶通過HTTP協(xié)議傳過來的一系列參數(shù)轉(zhuǎn)化為滿足協(xié)議的系統(tǒng)消息,然后發(fā)送到服務器,最后將結(jié)果以HTML格式的形式返回給瀏覽器。系統(tǒng)使用CGI程序來做GeoMeta網(wǎng)關(guān),對于Z39.50網(wǎng)關(guān)使用現(xiàn)成的免費軟件。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta系統(tǒng)的網(wǎng)關(guān)4、元數(shù)據(jù)系統(tǒng) ——基于XML的數(shù)據(jù)存儲策略用XML來表達和傳輸元數(shù)據(jù)已為大家普遍接受,所以如何有效地管理基于XML的元數(shù)據(jù)(特別是海量的元數(shù)據(jù))以方便用戶查詢必然是元數(shù)據(jù)系統(tǒng)需要解決的問題。由于目前還沒有出現(xiàn)可用的XML數(shù)據(jù)庫,雖然XML文件有諸多優(yōu)勢,但并沒有表現(xiàn)在存儲上。盡管我們希望數(shù)據(jù)存儲和表達能有比較好的對應,但在真正有效的XML數(shù)據(jù)庫出現(xiàn)以前,任何存儲策略只需通過接口服務程序使得在用戶看來系統(tǒng)的數(shù)據(jù)是按XML的模式來存儲的,并且可以將滿足這些模式的XML數(shù)據(jù)文件存入系統(tǒng),同時可以要求結(jié)果按某種XML模式返回就可以了(當然能支持XQuery更好)。
4、元數(shù)據(jù)系統(tǒng) ——基于XML的數(shù)據(jù)存儲策略Wrapper(包裝)自己格式的數(shù)據(jù)XML數(shù)據(jù)庫XMLVIEWXMLVIEW示意圖4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略GeoMeta的突出特點之一是給出了比較完備的數(shù)據(jù)存儲策略。它支持以下類型的元數(shù)據(jù)的存儲:無結(jié)構(gòu)的存儲
基于線性域段結(jié)構(gòu)的存儲
基于結(jié)構(gòu)的存儲
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略無結(jié)構(gòu)的存儲
將元數(shù)據(jù)文件直接存到文件系統(tǒng)或數(shù)據(jù)庫的長二進制域段中,在Oracle8i以上版本中還可以用
CLOB(characterLOBs’)、BLOB(binaryLOBs’)或者BFILE(binaryfiles’)來保存文件。這樣做對于數(shù)據(jù)文件的存取十分簡單有效,但對查詢的支持比較有限。如果文件很多的話,基本上只能通過關(guān)鍵詞檢索。在查詢要求不高或數(shù)據(jù)本來就無結(jié)構(gòu)時此方法比較有效。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略基于線性域段結(jié)構(gòu)的存儲
一般來說,元數(shù)據(jù)從邏輯結(jié)構(gòu)上講都是樹狀的。如果沒有可重復多次的節(jié)點,可以利用節(jié)點標簽的唯一性(如果不唯一的話還可以通過該節(jié)點的XPath來做標記)將整個樹壓扁了存儲在一個關(guān)系表中,取數(shù)據(jù)的時候再恢復過來。在實際應用中,一般只需將用戶檢索時用到的節(jié)點提出來存放到關(guān)系表中并且建立索引,把源文件直接按無結(jié)構(gòu)的存儲策略存放就可以了。如果需要返回的部分是整個記錄或者記錄的大部分內(nèi)容,并且可能出現(xiàn)在查詢條件中的元素沒有重復結(jié)構(gòu)時,這種存儲策略還是比較有效的。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略...11.2.2將樹形結(jié)構(gòu)存放到關(guān)系表中4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略基于結(jié)構(gòu)的存儲
基于結(jié)構(gòu)的存儲大致有兩種方式:按節(jié)點存儲
利用對象關(guān)系數(shù)據(jù)庫來存儲
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略
按節(jié)點存儲先周游整個Schema結(jié)構(gòu),找出所有可能的XPath,然后將數(shù)據(jù)文件的元素按不同的XPath存放它們的數(shù)據(jù)(相當于把基于XPath的索引信息也保存了),必要時可將它們再組合起來。該方式對系統(tǒng)的要求不高,用文件系統(tǒng)或關(guān)系數(shù)據(jù)庫都可以,而且可以比較好地支持XQuery查詢,就是實現(xiàn)工作比較復雜。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)存儲策略利用對象關(guān)系數(shù)據(jù)庫來存儲
隨著XML技術(shù)的廣泛使用,越來越多的數(shù)據(jù)通過它來傳輸和表達,人們自然而然的會想到直接XML數(shù)據(jù)存儲起來。如果需要結(jié)構(gòu)化存儲,最終實用的可能還是各大數(shù)據(jù)庫廠商提供的支持產(chǎn)品。事實上各大數(shù)據(jù)庫廠商都緊密關(guān)注XML發(fā)展,紛紛推出幫助用戶使用和管理(不單單是存儲)XML數(shù)據(jù)的產(chǎn)品。因為面向?qū)ο箨P(guān)系數(shù)據(jù)提供了復雜類型和面向?qū)ο蟮囊恍┲С郑热纾?/p>
對象類型,對象類型的集合,對象類型的引用,繼承。從而使我們可以在一定程度上結(jié)構(gòu)化地存儲XML數(shù)據(jù)文件?!纠靠梢钥紤]XMLSchema的結(jié)構(gòu)信息
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略GeoMeta系統(tǒng)的另外一個特點在于它多方面的數(shù)據(jù)查詢策略的支持。在元數(shù)據(jù)庫中存儲策略的選擇是由實際要求來決定的,而其中最關(guān)鍵的因素是對查詢的支持。因為建立元數(shù)據(jù)庫的一個重要目的就是為了用戶能夠讓用戶方便有效地得到自己需要的數(shù)據(jù)。從實現(xiàn)的技術(shù)角度講,元數(shù)據(jù)的查詢和一般數(shù)據(jù)的查詢并沒有什么差別。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略搜索(search)和查詢(query)
”search”是指在用戶不是很清楚自己要找的數(shù)據(jù)具體在什么位置時通過搜索引擎(相當于元數(shù)據(jù)庫的工作)幫助用戶定位數(shù)據(jù)的位置,然后用戶就可以獲?。ā眗etrieve”)數(shù)據(jù)。它強調(diào)的是如何通過自己要找數(shù)據(jù)的特征來定位它(可能還需要通過第三方,而且一般是非結(jié)構(gòu)化查詢)”query”是指在知道數(shù)據(jù)位置和格式的情況下,按照一定的條件得到自己想要的那一部分數(shù)據(jù)。當然在實際情況中它們分得并不是那么很清楚(以后我們所用的查詢也包含了搜索的含義)。它直接針對數(shù)據(jù),通過查詢條件和查詢結(jié)果的構(gòu)造來提取數(shù)據(jù)(一般是結(jié)構(gòu)化查詢)。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略GeoMeta支持以下的數(shù)據(jù)查詢策略:非結(jié)構(gòu)化的查詢
結(jié)構(gòu)化的查詢
半結(jié)構(gòu)化查詢
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
非結(jié)構(gòu)化的查詢
直接利用數(shù)據(jù)庫的全文檢索功能,在保存元數(shù)據(jù)文件的域段上建立interMedia文本索引,通過“Contains(XML文件所在域段,“關(guān)鍵詞”)”來查找就可以了。如果用戶對返回的格式有所要求,可以根據(jù)某個映射文件將其轉(zhuǎn)換后再返回。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢
Z39.50客戶端傳過來的查詢:它一般是一個二叉查詢樹結(jié)構(gòu)(由服務器將客戶端傳來的經(jīng)過BER編碼的逆波蘭(RPN)查詢表達式轉(zhuǎn)換而得)。一般的元數(shù)據(jù)系統(tǒng)用的是基于線性域段結(jié)構(gòu)的存儲,根據(jù)查找相關(guān)的注冊屬性集(如Bib-1)中用戶屬性和相關(guān)操作對應的編碼以及所用的屬性表,就可以構(gòu)造一條帶有選擇字段、查詢的表名和條件子句的完整的SELECT語句。將它提交給數(shù)據(jù)庫,就可以得到查詢結(jié)果了。GeoMeta目前在這方面的實現(xiàn)不多。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢
XQuery結(jié)構(gòu)化的查詢:系統(tǒng)的工作重點在于如何將一段XQuery語句用
SQL語言來表達。XQuery所要求的XMLQueryDataModel,與對象關(guān)系數(shù)據(jù)庫的對象關(guān)系模型有很好的對應:其中元素節(jié)點對應于對象類型或表,屬性節(jié)點對應于表或類型的域段,而文本節(jié)點對應的是以文本方式存儲的無結(jié)構(gòu)的域段(可能是一個XML文件)。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢EEETTAAE元素節(jié)點A屬性節(jié)點T文本節(jié)點一個查詢數(shù)據(jù)模型的實例4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢XQuery和SQL語句的對應:
XPath表達式在XQuery中一個XPath表達式代表了原文件的Model(XMLQueryDataModel)中的一個或多個有序的節(jié)點(包含它們各自的子節(jié)點)。很多情況下一個XPath表達式就可以代表一個查詢。如一個XPath:document(“zoo.XML”)/chapter[2]//figure[caption=“TreeFrogs”],它就包含了SQL查詢中的三個重要部分1)域段選擇:Chapter[2].figure,2)查詢表:zoo.xml,3)查詢條件:figure的屬性caption=’TreeFrogs’。相應的SQL語句為“selectzoo.capter[2].figurefromzoowherezoo.chapter[2].figure.caption=’TreeFrogs’”。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢元素構(gòu)造表達式
通過元素構(gòu)造表達式我們可以基于原來的XML文件構(gòu)造出新的XML文件。它由開始標簽,結(jié)束標簽和由其它表達式得到的內(nèi)容組成。它不好直接對應到SQL語句,但是通過對其它表達式的支持,不難構(gòu)造出該元素的實例。
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢
FLWR表達式FLWR(FOR,LET,WHERE,RETURN)表達式,從它的數(shù)據(jù)流可以看出其結(jié)構(gòu)很像SQL的SELECT語句,因而可以很自然地建立它們的對應關(guān)系。其FOR部分相當于SQL中的From部分,WHERE部分相當于SQL中的Where部分,RETURN部分是一個可不帶標簽的元素構(gòu)造表達式,相當于SQL中SELECT后面的結(jié)果組織部分。雖然SQL中沒有與LET的直接對應,但“LET$a=XPath表達式”相當于將XPath表達式對應節(jié)點與變量a綁定,我們在SELECT語句中直接用XPath表達式對應的節(jié)點就可以了。4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢FLWR表達式的數(shù)據(jù)流4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
結(jié)構(gòu)化的查詢一個XQuery查詢[35]到SQL語句的對應:FOR$bINdocument("bib.xml")//bookWHERE$b/publisher="MorganKaufmann"AND$b/year="1998"RETURN$b/title
selectb.titlefrombib.bookasb
whereb.publisher='MorganKaufmann'andb.year='1998'
4、元數(shù)據(jù)系統(tǒng) ——GeoMeta的數(shù)據(jù)查詢策略
半結(jié)構(gòu)化的查詢
半結(jié)構(gòu)化的查詢大致可以分為兩類:
第一類情況:如果查詢中任何兩個節(jié)點node(x)、node(y)在判斷條件中都沒有涉及到它們之間的結(jié)構(gòu)關(guān)系:比如node(x)在node(y)前出現(xiàn),node(x)是node(y)的后代等等。這時我們就可以基于一定策略先找到所有這種的節(jié)點,分別判斷,然后在根據(jù)它們之間的and、or、not關(guān)系,組合起來作為條件判斷的依據(jù)。比如“要查1950年以后出版的一本老舍寫的書”,就可以用“node(author)contains(“老舍”)andnode(pub_year)>1950”作為查詢的判斷條件。第二類情況:涉及了節(jié)點間結(jié)構(gòu)上的關(guān)系,一般需要周游Model樹來判斷,這就得先將XML文件讀入內(nèi)存,通過解釋器將其構(gòu)造成Model實例樹,但這樣做在數(shù)據(jù)量大時效率很差。
5、元數(shù)據(jù)應用 ——空間元數(shù)據(jù)的特點和局限由于網(wǎng)絡的發(fā)展,元數(shù)據(jù)已經(jīng)由一種數(shù)據(jù)描述與索引的方法擴展到包括數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)管理和數(shù)據(jù)使用的整個網(wǎng)絡信息過程中不可缺少強有力的工具和方法之一。但是依據(jù)各標準建立的各種地理空間元數(shù)據(jù)庫,都是以文本形式提供給人使用的,由人去確定如何使用元數(shù)據(jù),來定位、評價、比較、獲取和使用地理相關(guān)數(shù)據(jù)的。并且,每個地理空間元數(shù)據(jù)庫都是針對一個地理空間數(shù)據(jù)庫來描述的,而不同地理空間數(shù)據(jù)庫之間的聯(lián)系、網(wǎng)絡上地理空間數(shù)據(jù)庫的分布情況和如何支持地理空間數(shù)據(jù)快速查找等在已有的研究中都沒有涉及到。
5、元數(shù)據(jù)應用 ——空間元數(shù)據(jù)庫框架
鑒于以上元數(shù)據(jù)應用的局限性,下面將簡要介紹一個實驗室的元數(shù)據(jù)應用項目:一個基于Agent的地理空間數(shù)據(jù)搜索獲取的策略。
該項目設(shè)計了一個基于網(wǎng)絡的多層次的空間元數(shù)據(jù)庫框架,以組織和管理網(wǎng)絡上分布式地理空間數(shù)據(jù),并且以該空間元數(shù)據(jù)庫框架為基礎(chǔ),提供一種面向用戶的簡單數(shù)據(jù)請求描述方式。在此之上,結(jié)合Agent實體的智能搜索和協(xié)作特性,得到最終的數(shù)據(jù)搜索獲取的策略。5、元數(shù)據(jù)應用 ——空間元數(shù)據(jù)庫框架
空間元數(shù)據(jù)的主要內(nèi)容之一就是地圖(圖層)的管理信息。地圖(圖層)的基本要素就是專題、空間范圍、地層和時間,其中最主要的是專題和
空間范圍。因此,每一幅地圖(圖層)的管理信息都要包括專題、空間范圍、地層和時間,而且一幅地圖(圖層)都可以用一個四元組<專題,空間范圍,地層,時間>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Windows Server 2022活動目錄管理實踐( 第2版 微課版)-課件項目14 活動目錄環(huán)境中的多用戶隔離FTP實驗
- 2023-2024學年四川省綿陽市游仙區(qū)富樂學校九年級(上)學情調(diào)查數(shù)學試卷(10月份)
- 魯教版八年級數(shù)學上冊第一章因式分解素養(yǎng)綜合檢測課件
- 北師大版八年級生物上冊專項素養(yǎng)綜合練(六)跨學科試題課件
- 【核心素養(yǎng)】部編版小學語文一年級上冊語文園地三主題閱讀(含答案)
- 內(nèi)蒙古赤峰市洪山區(qū)重點中學2024年中考押題數(shù)學預測卷含解析
- 四川省五通橋區(qū)2022-2023學年八年級上學期期末教學質(zhì)量檢測地理試卷
- 八年級生物期中模擬卷(全解全析)(內(nèi)蒙古專用)
- 2024年煙花爆竹儲存證考試題庫及答案
- 酒店用房合同模板
- 城市軌道交通列車自動控制系統(tǒng)維護 課件 3.1 ZC系統(tǒng)認知
- 2024年消防宣傳月知識競賽考試題庫200題(含答案)
- 《全面質(zhì)量管理》習題集(含答案)
- 期中(1-4單元)(試題)-2024-2025學年六年級數(shù)學上冊西師大版
- 河南國有資本運營集團有限公司招聘筆試題庫2024
- 2024年勞資員題庫
- Unit 3 Family Matters Developing Ideas Writing about a Family Memory 教學設(shè)計-2024-2025學年高一上學期英語外研版(2019)必修第一冊
- 《直播運營實務》 課件 5.3直播間場景搭建
- 內(nèi)外部項目合作管理制度
- DL∕T 523-2017 化學清洗緩蝕劑應用性能評價指標及試驗方法
- CJT 427-2013 超高分子量聚乙烯膜片復合管
評論
0/150
提交評論