第六講空間數據質量與元數據_第1頁
第六講空間數據質量與元數據_第2頁
第六講空間數據質量與元數據_第3頁
第六講空間數據質量與元數據_第4頁
第六講空間數據質量與元數據_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第六講第六講 空間數據質量與元數據空間數據質量與元數據學學 習習 目目 標標 理解空間數據質量及其相關概念理解空間數據質量及其相關概念 了解空間數據質量評價的標準,并分析造成數據質量問題的來源了解空間數據質量評價的標準,并分析造成數據質量問題的來源 說明控制空間數據質量的措施說明控制空間數據質量的措施 理解元數據的概念,了解空間數據元數據所用到的概念理解元數據的概念,了解空間數據元數據所用到的概念 了解空間數據元數據的分類和標準了解空間數據元數據的分類和標準 了解空間數據元數據的獲取方法了解空間數據元數據的獲取方法 弄清為什么在地理信息系統(tǒng)中使用元數據弄清為什么在地理信息系統(tǒng)中使用元數據 說明

2、空間數據元數據的應用說明空間數據元數據的應用 重點:空間數據質量的概念,數據質量評價,元數據的概念。重點:空間數據質量的概念,數據質量評價,元數據的概念。 難點:元數據的分類與標準。難點:元數據的分類與標準。 第五章第五章 空間數據質量與元數據空間數據質量與元數據 第一節(jié)第一節(jié) 空間數據的質量空間數據的質量空間數據質量的概念空間數據質量的概念空間數據質量評價空間數據質量評價空間數據質量問題的來源與分析空間數據質量問題的來源與分析數據質量控制數據質量控制一、空間數據質量的概念一、空間數據質量的概念空間數據:空間數據:是對有關空間位置、專題特征及時間信息的符是對有關空間位置、專題特征及時間信息的符

3、號紀錄,是對現(xiàn)實世界中空間特征和過程的抽象表達。號紀錄,是對現(xiàn)實世界中空間特征和過程的抽象表達。空間數據質量空間數據質量:空間數據在表達實體空間位置、特征和實空間數據在表達實體空間位置、特征和實踐所能達到的踐所能達到的準確性、一致性、完整性和三者統(tǒng)一性的程準確性、一致性、完整性和三者統(tǒng)一性的程度度,以及數據適應于不同應用的能力。,以及數據適應于不同應用的能力。二、空間數據質量評價二、空間數據質量評價 數據質量特征數據質量特征(1)誤差)誤差(2)準確度)準確度(3)精度)精度(4)不確定性)不確定性 空間數據質量標準空間數據質量標準(1)數據說明)數據說明(2)位置精度)位置精度(3)屬性精度

4、)屬性精度(4)時間精度)時間精度(5)邏輯一致性)邏輯一致性(6)完整性)完整性(7)表達形式的合理性)表達形式的合理性1 1)數據質量的基本特征)數據質量的基本特征q準確度:測量值與其實際真值的接近程度準確度:測量值與其實際真值的接近程度q精度:對象表達的詳細程度,包括定位精度、屬性精度精度:對象表達的詳細程度,包括定位精度、屬性精度、空間分辨力、空間分辨力AB(1)AB(2)BA(3)A的準確度低于B,但A的精度高于B(1)、(2)中A、B準確度一致,但A的精度高于B2 2)數據質量的基本特征(續(xù))數據質量的基本特征(續(xù))q不確定性:當某種現(xiàn)象不能精確測定時,其值無法知道,其不確定性:當

5、某種現(xiàn)象不能精確測定時,其值無法知道,其誤差也就無法確定,這時就用不確定性代替誤差,一般采取誤差也就無法確定,這時就用不確定性代替誤差,一般采取對同一現(xiàn)象進行多次觀測并求標準差來表示對同一現(xiàn)象進行多次觀測并求標準差來表示q相容性:兩個來源數據在同一應用中的難易程度相容性:兩個來源數據在同一應用中的難易程度土地利用圖拼接時,邊緣處地物類型和幾何位置應該相容土地利用圖拼接時,邊緣處地物類型和幾何位置應該相容不同比例尺可造成數據的不相容,如一種圖上有,而另一不同比例尺可造成數據的不相容,如一種圖上有,而另一種圖上被忽略種圖上被忽略q一致性:同一現(xiàn)象或同類現(xiàn)象表達的一致程度,包括一致性:同一現(xiàn)象或同類

6、現(xiàn)象表達的一致程度,包括位置不一致:河流位置不一致:河流, ,行政邊界在不同的圖上形狀不同行政邊界在不同的圖上形狀不同邏輯不一致:道路不能穿越房子、等高線不能交叉邏輯不一致:道路不能穿越房子、等高線不能交叉2 2)數據質量的基本特征(續(xù))數據質量的基本特征(續(xù))q完整性:指數據的完整性,包括分層的完整性、分類的完整完整性:指數據的完整性,包括分層的完整性、分類的完整性、內容完整性(不缺少數據)性、內容完整性(不缺少數據)q可得性:獲得或使用數據的容易程度可得性:獲得或使用數據的容易程度q現(xiàn)勢性:數據反映客觀現(xiàn)象目前狀況的程度,對許多類型的現(xiàn)勢性:數據反映客觀現(xiàn)象目前狀況的程度,對許多類型的地理

7、信息來說,時間是一個嚴格的因素,如人口統(tǒng)計信息、地理信息來說,時間是一個嚴格的因素,如人口統(tǒng)計信息、土地利用類型信息土地利用類型信息q適用性:數據質量的適用性主要取決于所使用數據的內容與適用性:數據質量的適用性主要取決于所使用數據的內容與質量、用戶的財力、獲得數據的易容程序等質量、用戶的財力、獲得數據的易容程序等 上述這些數據質量的基本特征決定了數據質量的好壞。上述這些數據質量的基本特征決定了數據質量的好壞。2、空間數據質量標準、空間數據質量標準 空間數據質量標準是生產、使用和評價空間數據的依據。數據空間數據質量標準是生產、使用和評價空間數據的依據。數據質量是數據整體性能的綜合體現(xiàn)。其主要內容

8、如下:質量是數據整體性能的綜合體現(xiàn)。其主要內容如下: 數據說明:數據說明:要求對空間數據的來源、數據內容及其處理過程等要求對空間數據的來源、數據內容及其處理過程等作出準確、全面和詳盡的說明。作出準確、全面和詳盡的說明。位置精度:位置精度:指空間實體的坐標數據與實體真實位置的接近程度指空間實體的坐標數據與實體真實位置的接近程度,常表現(xiàn)為空間三維坐標數據的精度。,常表現(xiàn)為空間三維坐標數據的精度。 屬性精度:屬性精度:指空間實體的屬性值與其真值相符的程度。它取決指空間實體的屬性值與其真值相符的程度。它取決于地理數據的類型,常常與位置精度有關。于地理數據的類型,常常與位置精度有關。時間精度:時間精度:

9、指時間的現(xiàn)勢性??梢酝ㄟ^數據更新的時間和頻度指時間的現(xiàn)勢性??梢酝ㄟ^數據更新的時間和頻度來體現(xiàn)。來體現(xiàn)。2、空間數據質量標準、空間數據質量標準邏輯一致性:邏輯一致性:指地理數據關系上的可靠性,包括數據結構、數指地理數據關系上的可靠性,包括數據結構、數據內容,以及拓撲性質上的內在一致性。據內容,以及拓撲性質上的內在一致性。完整性:完整性:指地理數據在范圍、內容及結構等方面滿足所有要求指地理數據在范圍、內容及結構等方面滿足所有要求的完整程度,包括數據范圍、空間實體類型、空間關系分類、的完整程度,包括數據范圍、空間實體類型、空間關系分類、屬性特征分類等方面的完整性。屬性特征分類等方面的完整性。表達形

10、式的合理性:表達形式的合理性:指數據抽象、數據表達與實體的吻合性,指數據抽象、數據表達與實體的吻合性,包括空間特征、專題特征和時間特征表達的合理性等。包括空間特征、專題特征和時間特征表達的合理性等。 三、空間數據質量問題的來源與分析三、空間數據質量問題的來源與分析源誤差源誤差空間現(xiàn)象自身存在的不穩(wěn)定性空間現(xiàn)象自身存在的不穩(wěn)定性空間現(xiàn)象的表達空間現(xiàn)象的表達操作誤差操作誤差空間數據使用中的誤差空間數據使用中的誤差1、源誤差、源誤差地面測量數字數據的誤差地面測量數字數據的誤差地圖數字化數據的誤差地圖數字化數據的誤差遙感數據的誤差遙感數據的誤差(1)地面測量數字數據的誤差)地面測量數字數據的誤差 來源

11、于地面測量的數字數據中含有控制測量和碎部測量誤差。其中控制點誤差又受控制網的參考基準、網形和觀測精度以及觀測費用等因素的影響。碎部點誤差除繼承了控制點的誤差外,還受自身的觀測方法、觀測精度和地界的人為判斷,以及地物地貌的取舍等因素的影響。當然,原始觀測誤差受觀測儀器、觀測者和外界環(huán)境三種因素影響。地面測量數據中的誤差可以表現(xiàn)為隨機誤差、系統(tǒng)誤差或粗差。 一般而言,粗差可采用可靠性理論探測剔除,系統(tǒng)誤差可采用實驗方法校正或建立系統(tǒng)誤差模型處理,隨機誤差可采用隨機模型,如最小二乘法平差處理。利用誤差傳播規(guī)律可求得點坐標的方差協(xié)方差矩陣或誤差橢圓(球)元素來表達點坐標數據的精度。 測量方面的誤差通常

12、考慮的是:系統(tǒng)誤差、操作誤差和偶然誤差。(2)地圖數字化數據的誤差)地圖數字化數據的誤差 地圖數字化是地圖數字化是GIS數據來源之一,原圖固有誤差和數字化數據來源之一,原圖固有誤差和數字化過程誤差是地圖數字化數據誤差的主要來源。過程誤差是地圖數字化數據誤差的主要來源。原圖固有誤差除含有上述地面控制測量和碎部測量的全部原圖固有誤差除含有上述地面控制測量和碎部測量的全部誤差外,還含有制圖誤差。誤差外,還含有制圖誤差。制圖誤差制圖誤差數字化誤差數字化誤差 制圖誤差制圖誤差 控制點展繪誤差:控制點展繪誤差:展繪控制點是成圖的第一步。展繪控制點是成圖的第一步。編繪誤差:編繪誤差:地形圖的編繪一般用攝影測

13、量手段把各種原始地形圖的編繪一般用攝影測量手段把各種原始資料化為同一比例尺的過程,其中所引入的誤差大約在資料化為同一比例尺的過程,其中所引入的誤差大約在0.300.33毫米之間。毫米之間。繪圖誤差:繪圖誤差:這項誤差是在繪圖過程中產生的。這項誤差是在繪圖過程中產生的。 綜合誤差:綜合誤差:地圖綜合誤差的大小取決于特征的類型與復雜地圖綜合誤差的大小取決于特征的類型與復雜程度,故該項誤差極難量化。程度,故該項誤差極難量化。 制圖誤差制圖誤差 地圖復制誤差:地圖復制誤差:地圖復制誤差的均方差為地圖復制誤差的均方差為0.10.2毫米。毫米。 分色版套合誤差:分色版套合誤差:該項誤差的均方差為該項誤差的

14、均方差為0.170.30毫米。毫米。繪圖材料的變形誤差:繪圖材料的變形誤差:地圖一般印刷于紙質載體上,隨著溫度地圖一般印刷于紙質載體上,隨著溫度和濕度的變化,紙的尺寸也會改變。和濕度的變化,紙的尺寸也會改變。歸化到同一比例尺所引起的誤差:歸化到同一比例尺所引起的誤差:地圖的比例尺是指真實的主地圖的比例尺是指真實的主比例尺,在將地圖數字化或從地圖量距時,必須利用適當的比比例尺,在將地圖數字化或從地圖量距時,必須利用適當的比例尺因子進行修正。例尺因子進行修正。 制圖誤差制圖誤差 特征的定義:特征的定義:自然界的許多特征并無明確的界限。特征定自然界的許多特征并無明確的界限。特征定義會引起特征位置的某

15、些不確定性,但并非所有的特征都義會引起特征位置的某些不確定性,但并非所有的特征都有此誤差。有此誤差。特征夸大誤差特征夸大誤差:為了增強地圖的易讀性,有時需要夸大某為了增強地圖的易讀性,有時需要夸大某些特征,因為它們在圖上難以按其真實情況表示。些特征,因為它們在圖上難以按其真實情況表示。 由于很難知道制圖過程中各種誤差間的關系以及圖由于很難知道制圖過程中各種誤差間的關系以及圖紙尺寸的不穩(wěn)定性,因此,很難準確地評價原圖固有誤差紙尺寸的不穩(wěn)定性,因此,很難準確地評價原圖固有誤差。 數字化誤差數字化誤差 數字化方式主要有手扶跟蹤數字化和掃描數字化。在生產數字化方式主要有手扶跟蹤數字化和掃描數字化。在生

16、產實踐中,采用掃描數字化,然后屏幕半自動化跟蹤。線劃跟蹤實踐中,采用掃描數字化,然后屏幕半自動化跟蹤。線劃跟蹤與掃描數字化所引起的平面誤差較小,只是在掃描時,要素結與掃描數字化所引起的平面誤差較小,只是在掃描時,要素結合處出現(xiàn)的誤差較大。手扶跟蹤數字化引起的誤差主要與被數合處出現(xiàn)的誤差較大。手扶跟蹤數字化引起的誤差主要與被數字化的要素對象、作業(yè)員和數字化儀有關。字化的要素對象、作業(yè)員和數字化儀有關。 要素對象要素對象:要素本身的寬度、密度和復雜程度對數字化誤要素本身的寬度、密度和復雜程度對數字化誤差有顯著影響。差有顯著影響。 數字化誤差數字化誤差作業(yè)員:作業(yè)員: 作業(yè)員的經驗與技能主要表現(xiàn)在選

17、擇最佳點位、跟蹤作業(yè)員的經驗與技能主要表現(xiàn)在選擇最佳點位、跟蹤曲線和判斷十字絲與目標重合程度的能力等方面。曲線和判斷十字絲與目標重合程度的能力等方面。數字化儀:數字化儀: 數字化儀的分辨率對數字化誤差有決定性影響。一般數字化儀的分辨率對數字化誤差有決定性影響。一般在選擇數字化儀時采用經濟實用的原則。在選擇數字化儀時采用經濟實用的原則。 (3 3)遙感數據誤差遙感數據誤差 遙感數據的誤差積累過程可以分為:數據獲取誤差、數據遙感數據的誤差積累過程可以分為:數據獲取誤差、數據預處理誤差和人工判讀誤差等。預處理誤差和人工判讀誤差等。數據獲取誤差:數據獲取誤差:遙感資料獲取時存在著多種誤差。其中有些誤遙

18、感資料獲取時存在著多種誤差。其中有些誤差源是可控的,有些則是不可控的,可控的數據獲取誤差又包差源是可控的,有些則是不可控的,可控的數據獲取誤差又包括幾何誤差和遙感平臺誤差。括幾何誤差和遙感平臺誤差。數據預處理誤差:數據預處理誤差:數據預處理包括利用地面控制對原始數據進數據預處理包括利用地面控制對原始數據進行的幾何校正、圖像增強和分類等。這些預處理會引入各種各行的幾何校正、圖像增強和分類等。這些預處理會引入各種各樣的誤差。樣的誤差。 (3 3)遙感數據誤差遙感數據誤差 人工判讀誤差:人工判讀誤差: 在數據分析和判讀階段會引入人工判讀誤差。在在數據分析和判讀階段會引入人工判讀誤差。在GIS中使用遙

19、感數據時,人工判讀會影響隨后的地圖分析結果中使用遙感數據時,人工判讀會影響隨后的地圖分析結果。 2、操作誤差、操作誤差 除了地圖原始錄入數據本身帶有的源誤差外,空間數除了地圖原始錄入數據本身帶有的源誤差外,空間數據處理操作中還會引入新誤差。據處理操作中還會引入新誤差。由計算機字長引起的誤差由計算機字長引起的誤差 空間數據處理中的誤差空間數據處理中的誤差 在計算機中,數據是由一定字長的編碼表示的。舍入誤差是由計算機字長引起的一種誤差。除了數據處理精度外,數據存儲精度也與計算機字長有關。(1)空間數據處理中的誤差)空間數據處理中的誤差 投影變換:地圖投影是三維地球橢球面到二維平面的拓撲變換。在不同

20、投影形式下,地理特征的位置、面積和方向的表現(xiàn)會有誤差。 數據格式轉換:在矢量格式和柵格格式之間的轉換中,數據所表達的空間特征的位置具有差異性。 數據抽象:在數據發(fā)生比例尺變換時,對數據進行聚類、歸并、合并等操作時產生的誤差。 建立拓撲關系:建立拓撲過程中,伴隨有數據所表達的空間特征的位置坐標的變化。 (1)空間數據處理中的誤差)空間數據處理中的誤差 與主控數據層的匹配:與主控數據層的匹配:為保證各數據層之間空間位置的協(xié)調性為保證各數據層之間空間位置的協(xié)調性,在同一地區(qū)的多層數據面中,一般建立一個主控數據層,以,在同一地區(qū)的多層數據面中,一般建立一個主控數據層,以控制其他數據層的邊界和控制點。在

21、與主控數據層匹配的過程控制其他數據層的邊界和控制點。在與主控數據層匹配的過程中也會存在空間位移,從而導致誤差。中也會存在空間位移,從而導致誤差。 數據疊加操作和更新:數據疊加操作和更新:數據在疊加運算以及數據更新時,會產數據在疊加運算以及數據更新時,會產生空間位置和屬性值的差異。生空間位置和屬性值的差異。數據集成處理:數據集成處理:在來源不同、類型不同的各種數據集的相互操在來源不同、類型不同的各種數據集的相互操作過程中錯產生的誤差。作過程中錯產生的誤差。 (1)空間數據處理中的誤差)空間數據處理中的誤差 數據的可視化表達:數據的可視化表達:數據在可視化表達過程中,為適應視數據在可視化表達過程中

22、,為適應視覺效果序對數據的空間特征位置、注記等進行調整,由此覺效果序對數據的空間特征位置、注記等進行調整,由此產生數據表達上的誤差。產生數據表達上的誤差。 數據處理過程中誤差的傳遞和擴散數據處理過程中誤差的傳遞和擴散:在數據處理的各個環(huán)在數據處理的各個環(huán)節(jié)和過程中,誤差是累積和擴散的,前一過程的誤差可能節(jié)和過程中,誤差是累積和擴散的,前一過程的誤差可能成為下一階段的誤差起源,從而導致新的誤差的產生。成為下一階段的誤差起源,從而導致新的誤差的產生。 3、空間數據使用中的誤差、空間數據使用中的誤差 在空間數據使用過程中也會導致誤差的出現(xiàn),主要在空間數據使用過程中也會導致誤差的出現(xiàn),主要表現(xiàn)在兩方面

23、:一是用戶錯誤理解信息造成的誤差;二是表現(xiàn)在兩方面:一是用戶錯誤理解信息造成的誤差;二是缺少文檔說明,從而導致用戶不正確地使用信息,造成數缺少文檔說明,從而導致用戶不正確地使用信息,造成數據的隨意性使用而使誤差擴散。據的隨意性使用而使誤差擴散。 一般來說,源誤差遠大于操作誤差,因此,要想控一般來說,源誤差遠大于操作誤差,因此,要想控制制GIS產品的質量,良好的原始錄用數據是首要的。產品的質量,良好的原始錄用數據是首要的。數據采集數據采集野外測量誤差:儀器誤差、野外測量誤差:儀器誤差、地圖數據誤差:原始數據誤差、坐標轉換誤差地圖數據誤差:原始數據誤差、坐標轉換誤差遙感數據誤差:信息提取誤差遙感數

24、據誤差:信息提取誤差數據輸入數據輸入數字化誤差:儀器誤差、操作誤差數字化誤差:儀器誤差、操作誤差不同系統(tǒng)格式轉換誤差不同系統(tǒng)格式轉換誤差: :柵格柵格- -矢量互換、三角網矢量互換、三角網- -等值線互等值線互換換數據存儲數據存儲數值精度不夠數值精度不夠空間精度不夠:格網或圖像太大、地圖最小制圖單元太大空間精度不夠:格網或圖像太大、地圖最小制圖單元太大數據操作數據操作分類間隔不合理分類間隔不合理多層數據疊加引起的誤差傳播:插值誤差多層數據疊加引起的誤差傳播:插值誤差比例尺太小引起的誤差比例尺太小引起的誤差數據輸出數據輸出輸出設備不精確引起的誤差輸出設備不精確引起的誤差輸出的媒介不穩(wěn)定造成的誤差

25、輸出的媒介不穩(wěn)定造成的誤差數據使用數據使用對數據所包含的信息的誤解對數據所包含的信息的誤解對數據信息使用不當對數據信息使用不當使用GIS過程中的誤差來源(陳俊、宮鵬,1998)返回3 3)數據的誤差類型)數據的誤差類型q誤差類型的分類有不同的方法誤差類型的分類有不同的方法qGISGIS數據處理過程分類(史文中,數據處理過程分類(史文中,19941994)q按誤差性質來分類按誤差性質來分類幾何誤差、屬性誤差、時間誤差、邏輯誤差幾何誤差、屬性誤差、時間誤差、邏輯誤差地形圖誤差地形圖誤差地形圖的位置誤差、屬性誤差、時間誤差、邏輯地形圖的位置誤差、屬性誤差、時間誤差、邏輯不一致性誤差、不完整性誤差不一

26、致性誤差、不完整性誤差數據轉換和處數據轉換和處理誤差理誤差數字化誤差(儀器誤差、操作誤差)、不同格式數字化誤差(儀器誤差、操作誤差)、不同格式轉換誤差、不同轉換誤差、不同GISGIS系統(tǒng)之間的轉換誤差系統(tǒng)之間的轉換誤差應用分析誤差應用分析誤差數據層疊置時冗余多邊形數據層疊置時冗余多邊形數據應用時,應用模型引起的誤差數據應用時,應用模型引起的誤差明顯誤差明顯誤差數據年代久遠、地圖比例尺、數據格式、數據的可接數據年代久遠、地圖比例尺、數據格式、數據的可接近性、數據代價近性、數據代價原始測量誤差原始測量誤差位置誤差、屬性誤差、數據輸入輸出誤差、觀測者偏位置誤差、屬性誤差、數據輸入輸出誤差、觀測者偏差

27、、獲取數據時不同環(huán)境所引起的誤差差、獲取數據時不同環(huán)境所引起的誤差數據處理誤差數據處理誤差計算機字長引起的誤差、處理模型引起的誤差、邏輯計算機字長引起的誤差、處理模型引起的誤差、邏輯誤差、地圖疊置誤差、拓撲關系所造成的誤差、分類誤差、地圖疊置誤差、拓撲關系所造成的誤差、分類及處理方法引起的誤差及處理方法引起的誤差按誤差來源分類返回四、數據質量控制四、數據質量控制 數據質量控制是指為達到規(guī)范或規(guī)定對數據質量要求而采取的作業(yè)技術和措施。 空間數據質量控制常見的方法有: 傳統(tǒng)的手工方法:主要是將數字化數據與數據源進行圖形部分和屬性部分的比較檢查。 元數據方法:通過元數據可以檢查數據質量,通過跟蹤元數

28、據可以了解數據質量的狀況和變化。 地理相關法:指的是用空間數據的地理特征要素自身的相關性來分析數據的質量。 q 對數據的質量控制或質量評價一般從數據的邏輯性檢查入手,例如停車場與橋梁與公路應該有接口相鄰地物的邊界不能有交叉和裂縫不同弧段依附于同一結點時,坐標應該一致屬性相鄰的地塊應該合并地類標注應該符合植物的演變規(guī)律5 5)數據幾何誤差檢測和表達)數據幾何誤差檢測和表達q點誤差:某點的測量值與其真實位置之間的差異,一般點誤差:某點的測量值與其真實位置之間的差異,一般采取點位誤差分布橢圓表示采取點位誤差分布橢圓表示q線誤差:線誤差的分布可以采取線誤差:線誤差的分布可以采取“骨頭型骨頭型”和和“車

29、鏈型車鏈型”分布帶表示,也可以采用分布帶表示,也可以采用 - -帶表示帶表示點誤差分布模型線誤差分布模型真實位置測量位置6 6)屬性誤差不確定性)屬性誤差不確定性q屬性數據是指對于某一屬性數據是指對于某一GISGIS中點、線、面或遙感數據的屬性值中點、線、面或遙感數據的屬性值或屬性類別的描述或屬性類別的描述q屬性數據可以具有(離散)類別值或連續(xù)值,也可以區(qū)分為定屬性數據可以具有(離散)類別值或連續(xù)值,也可以區(qū)分為定性或定量屬性值性或定量屬性值類別變量類別變量是一個有限集合內的有限個元素,如土地覆蓋分類是一個有限集合內的有限個元素,如土地覆蓋分類系統(tǒng)中的土地類別是有限的,這時類別值沒有先后、大小

30、的涵系統(tǒng)中的土地類別是有限的,這時類別值沒有先后、大小的涵義義連續(xù)變量連續(xù)變量是某一區(qū)間內的任意值,如環(huán)境指標從是某一區(qū)間內的任意值,如環(huán)境指標從1 1到到4 4依次表依次表示最好到最差,這時類別值有先后次序的涵義示最好到最差,這時類別值有先后次序的涵義q屬性數據誤差屬性數據誤差由屬性的取值與其真值的相差程度決定由屬性的取值與其真值的相差程度決定q連續(xù)屬性數據誤差連續(xù)屬性數據誤差可以用量測誤差來確定,這時可以采用與位可以用量測誤差來確定,這時可以采用與位置誤差相同的方法來確定,如誤差傳播定律置誤差相同的方法來確定,如誤差傳播定律q類別屬性數據誤差類別屬性數據誤差確定是一個復雜的過程,受多種因素

31、的影響確定是一個復雜的過程,受多種因素的影響:類別、區(qū)域形狀與大小、試驗點的取樣方法以及相互混合類:類別、區(qū)域形狀與大小、試驗點的取樣方法以及相互混合類別情況等別情況等q舉例:土地利用分類中,一個地塊實際的裸地占舉例:土地利用分類中,一個地塊實際的裸地占30%30%、水、水面占面占10%10%、植物覆蓋占、植物覆蓋占60%60%,如果該地塊記錄為植被類型,如果該地塊記錄為植被類型,則有則有40%40%的不確定性的不確定性q如果用航片解譯方法得到該地塊中裸地占如果用航片解譯方法得到該地塊中裸地占28%28%、水面占、水面占15%15%、植物覆蓋占、植物覆蓋占55%55%、城鎮(zhèn)占、城鎮(zhèn)占2%2%,

32、則裸地低估,則裸地低估2%2%、水面高、水面高估估5%5%、植物低估、植物低估5%5%、城鎮(zhèn)高估、城鎮(zhèn)高估2%2%,這時總的不確定性為四,這時總的不確定性為四類土地類型估計誤差的絕對值之和:類土地類型估計誤差的絕對值之和: 2+5+5+2 = 14 2+5+5+2 = 14。第二節(jié)第二節(jié) 空間數據的元數據空間數據的元數據 一、元數據概念與分類一、元數據概念與分類 二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 三、空間數據元數據的標準三、空間數據元數據的標準 四、空間數據元數據的獲取與管理四、空間數據元數據的獲取與管理 五、空間數據元數據的應用五、空間數據元數據的應用 一、元數據

33、概念與分類一、元數據概念與分類元數據(元數據(Metadata)“meta”是一希臘語詞根,意思是是一希臘語詞根,意思是“改變改變”,“Metadata”一詞的原意是一詞的原意是關于數據變化的描述關于數據變化的描述。 一般都認為元數據就是一般都認為元數據就是 “關于數據的數據關于數據的數據”,即關于數即關于數據的描述性數據信息。據的描述性數據信息。在地理空間數據中,元數據說明數據內容、質量、狀況和在地理空間數據中,元數據說明數據內容、質量、狀況和其他有關特征的背景信息。其他有關特征的背景信息。(聯(lián)想:紙質地圖的元數據)(聯(lián)想:紙質地圖的元數據)隨著計算機技術和隨著計算機技術和GIS技術發(fā)展,特

34、別是網絡通信技術的發(fā)展技術發(fā)展,特別是網絡通信技術的發(fā)展,空間數據共享日益普遍。,空間數據共享日益普遍。管理和訪問大型數據集的復雜性正成為數據生產者和用戶面臨管理和訪問大型數據集的復雜性正成為數據生產者和用戶面臨的突出問題。的突出問題。在這種情況下,空間數據的內容、質量、狀況等元數據信息變在這種情況下,空間數據的內容、質量、狀況等元數據信息變得更加重要。得更加重要。地理信息元數據標準和操作工具已經成為空間空間數據基礎設地理信息元數據標準和操作工具已經成為空間空間數據基礎設施的一個重要組成部分。施的一個重要組成部分。元數據產生背景元數據產生背景一、元數據概念與分類一、元數據概念與分類1、元數據概

35、念、元數據概念元數據:元數據:是關于數據變化的描述,是描述數據的數據,它是關于數據變化的描述,是描述數據的數據,它應盡可能多地反映數據集自身的特征規(guī)律,以便于用戶對應盡可能多地反映數據集自身的特征規(guī)律,以便于用戶對數據的準確、高效與充分的開發(fā)與利用。數據的準確、高效與充分的開發(fā)與利用。關于元數據認識的共同點是:關于元數據認識的共同點是:元數據的目的是促進數據集元數據的目的是促進數據集的高效利用,并為計算機輔助軟件工程服務。的高效利用,并為計算機輔助軟件工程服務。2、元數據的內容、元數據的內容元數據的內容包括:元數據的內容包括: (1)對數據的描述)對數據的描述,對數據集中各數據項,數據來源、數

36、,對數據集中各數據項,數據來源、數據所有者、數據序代(數據生產歷史)等的說明;據所有者、數據序代(數據生產歷史)等的說明; (2)對數據質量的描述)對數據質量的描述,如數據精度、數據的邏輯一致性,如數據精度、數據的邏輯一致性、數據完整性、分辨率、源數據的比例尺等;、數據完整性、分辨率、源數據的比例尺等; (3)對數據處理的說明)對數據處理的說明,如量綱的轉換等;,如量綱的轉換等; (4)對數據轉換方法的描述;)對數據轉換方法的描述; (5)對數據庫的更新、集成方法等的說明。)對數據庫的更新、集成方法等的說明。3、元數據的主要作用、元數據的主要作用 (1)幫助數據生產單位有效地管理和維護空間數據

37、,建立數)幫助數據生產單位有效地管理和維護空間數據,建立數據文檔;據文檔; (2)提供有關數據生產單位數據存儲、數據分類、數據內容)提供有關數據生產單位數據存儲、數據分類、數據內容、數據質量、數據交換網絡及數據銷售等方面的信息,便于用、數據質量、數據交換網絡及數據銷售等方面的信息,便于用戶查詢檢索地理空間數據;戶查詢檢索地理空間數據; (3)提供通過網絡對數據進行查詢檢索的方法或途徑,以及)提供通過網絡對數據進行查詢檢索的方法或途徑,以及與數據交換和傳輸有關的輔助信息;與數據交換和傳輸有關的輔助信息; (4)幫助用戶了解數據,以便就數據是否能滿足其需求作出)幫助用戶了解數據,以便就數據是否能滿

38、足其需求作出正確的判斷正確的判斷 ;(5)提供有關信息,以便用戶處理和轉換有用的數據。)提供有關信息,以便用戶處理和轉換有用的數據。 4、元數據的表達形式、元數據的表達形式 元數據的表達形式:元數據的表達形式: 元數據也是一種數據,在形式上與其他數據沒有區(qū)別,它元數據也是一種數據,在形式上與其他數據沒有區(qū)別,它可以以數據存在的任何一種形式存在??梢砸詳祿嬖诘娜魏我环N形式存在。 主要的形式是與元數據內容標準相一致的主要的形式是與元數據內容標準相一致的數字形式數字形式,數字,數字形式的元數據可以用多種方法建立、存儲和使用。形式的元數據可以用多種方法建立、存儲和使用。 (1)最基本的方法是文本文件

39、。)最基本的方法是文本文件。 (2)元數據的另一種形式是用超文本鏈接標示語言()元數據的另一種形式是用超文本鏈接標示語言(HTML)編寫的超文本文件,用戶可用瀏覽器查閱元數據。)編寫的超文本文件,用戶可用瀏覽器查閱元數據。 (3)用通用標示語言()用通用標示語言(SGML)建立元數據。)建立元數據。 SGML提供一提供一種有效的方法連接元數據便于在空間數據交換網絡上查詢。種有效的方法連接元數據便于在空間數據交換網絡上查詢。5、元數據的分類、元數據的分類 分類原則不同,元數據的分類體系和內容將會有很大的差分類原則不同,元數據的分類體系和內容將會有很大的差異,主要分類方法有:異,主要分類方法有:根

40、據元數據的內容分類根據元數據的內容分類 根據元數據描述對象分類根據元數據描述對象分類 根據數據在系統(tǒng)中的作用分類根據數據在系統(tǒng)中的作用分類根據元數據的作用分類根據元數據的作用分類 (1)根據元數據的內容分類)根據元數據的內容分類 科研型元數據科研型元數據 :主要目標是幫助用戶獲取各種來源的數據及主要目標是幫助用戶獲取各種來源的數據及其相關信息其相關信息 ,主要任務是幫助科研工作者高效獲取所需數據,主要任務是幫助科研工作者高效獲取所需數據。 評估型元數據:評估型元數據:主要服務于數據利用的評價。主要服務于數據利用的評價。 模型元數據模型元數據 :用于描述數據模型的元數據,與描述數據的元用于描述數

41、據模型的元數據,與描述數據的元數據在結構上大致相同。數據在結構上大致相同。 (2)根據元數據描述對象分類)根據元數據描述對象分類 數據層元數據數據層元數據 :指描述數據集中每個數據的元數據指描述數據集中每個數據的元數據 。屬性元數據:屬性元數據:關于屬性數據的元數據關于屬性數據的元數據 。實體元數據實體元數據 :是描述整個數據集的元數據是描述整個數據集的元數據 。(3)根據數據在系統(tǒng)中的作用分類)根據數據在系統(tǒng)中的作用分類 系統(tǒng)級別元數據系統(tǒng)級別元數據 :指用于實現(xiàn)文件系統(tǒng)特征或管理文件系統(tǒng)指用于實現(xiàn)文件系統(tǒng)特征或管理文件系統(tǒng)中數據的信息中數據的信息 。應用層元數據應用層元數據 :指有助于用戶

42、查找、評估、訪問和管理數據指有助于用戶查找、評估、訪問和管理數據等與數據用戶有關的信息等與數據用戶有關的信息 。(4)根據元數據的作用分類)根據元數據的作用分類 說明元數據:說明元數據:是為用戶使用數據服務的元數據。多為描述是為用戶使用數據服務的元數據。多為描述性信息,側重數據庫的說明。性信息,側重數據庫的說明。 控制元數據:控制元數據:是用于計算機操作流程控制的元數據,這類是用于計算機操作流程控制的元數據,這類元數據有一定的關鍵詞和特定的句法來實現(xiàn)。元數據有一定的關鍵詞和特定的句法來實現(xiàn)。 二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 空間數據:空間數據:用于確定具有自然特征

43、或者人工建筑特征的地理實用于確定具有自然特征或者人工建筑特征的地理實體的地理位置、屬性及其便捷的信息;體的地理位置、屬性及其便捷的信息;類型:類型:在元數據標準中,數據類型指該數據能接收的值的類型在元數據標準中,數據類型指該數據能接收的值的類型;對象對象: 對地理實體的部分或整體的數字表達;對地理實體的部分或整體的數字表達;實體類型:實體類型:對于具有相似地理特征的地理實體集合的定義和描對于具有相似地理特征的地理實體集合的定義和描述;述;點點: 用于位置確定的零維地理對象;用于位置確定的零維地理對象;結點結點: 拓撲連接兩個或多個鏈或環(huán)的一維對象;拓撲連接兩個或多個鏈或環(huán)的一維對象;標識點標識

44、點: 顯示地圖或圖表時,用于特征標識的參考點;顯示地圖或圖表時,用于特征標識的參考點; 線線: 一維對象的一般術語;一維對象的一般術語;線段線段: 兩個點之間的直線段;兩個點之間的直線段;弧弧: 由數學表達式確定的點集組成的弧狀曲線;由數學表達式確定的點集組成的弧狀曲線;鏈鏈: 兩個結點之間的拓撲關聯(lián);兩個結點之間的拓撲關聯(lián);鏈環(huán)鏈環(huán): 非相切線段或由結點區(qū)分的弧段構成的有方向無分支序非相切線段或由結點區(qū)分的弧段構成的有方向無分支序列;列;環(huán)環(huán): 封閉狀不相切鏈環(huán)或弧段序列;封閉狀不相切鏈環(huán)或弧段序列;多邊形多邊形: 在二維平面中由封閉弧段包圍的區(qū)域;在二維平面中由封閉弧段包圍的區(qū)域; 二、空

45、間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 外多邊形外多邊形: 數據覆蓋區(qū)域內最外側的多邊形,其面積是其他所數據覆蓋區(qū)域內最外側的多邊形,其面積是其他所有多邊形的面積之和;有多邊形的面積之和;內部區(qū)域內部區(qū)域: 不包括其邊界的區(qū)域;不包括其邊界的區(qū)域;格網格網: 組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的格網集合,組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的格網集合,或者組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的點集合;或者組成一規(guī)則或近似規(guī)則的棋盤狀鑲嵌表面的點集合;格網單元格網單元: 表示格網最小可分要素的二維對象;表示格網最小可分要素的二維對象;矢量矢量: 有方向線的組合;有方向線的組合;

46、柵格柵格: 同一格網或數字影像的一個或多個疊加層;同一格網或數字影像的一個或多個疊加層; 二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 像元像元: 二維圖形要素,它是數字影像最小要素;二維圖形要素,它是數字影像最小要素;柵格對象柵格對象: 一個或多個影像或格網,每一個影像或格網表示一一個或多個影像或格網,每一個影像或格網表示一個數據層,各層之間相應的格網單元或像元一致且相互套準;個數據層,各層之間相應的格網單元或像元一致且相互套準;圖形圖形: 與預定義的限制規(guī)則一致的零維、一維和二維有拓撲相與預定義的限制規(guī)則一致的零維、一維和二維有拓撲相關的對象集;關的對象集;數據層數據層:

47、集成到一起的面域分布空間數據集,它用于表示一個集成到一起的面域分布空間數據集,它用于表示一個主體中的實體,或者有一公共屬性或屬性值的空間對象的聯(lián)合主體中的實體,或者有一公共屬性或屬性值的空間對象的聯(lián)合;二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 層層: 在有序系統(tǒng)中數據層、級別或梯度序列;在有序系統(tǒng)中數據層、級別或梯度序列;緯度緯度: 在中央經線上度量,以角度單位度量離開赤道的距在中央經線上度量,以角度單位度量離開赤道的距離;離;經度經度: 經線面到格林威治中央經線面的角度距離;經線面到格林威治中央經線面的角度距離;經圈經圈: 穿過地球兩極的地球的大圓圈;穿過地球兩極的地球的

48、大圓圈;坐標坐標: 在笛卡爾坐標系中沿平行在笛卡爾坐標系中沿平行X軸和軸和Y軸測量的坐標值;軸測量的坐標值;投影投影: 將地球球面坐標中的空間特征(集)轉化到平面坐將地球球面坐標中的空間特征(集)轉化到平面坐標體系時使用的數學轉換方法;標體系時使用的數學轉換方法;二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 投影參數投影參數: 對數據集進行投影操作時用于控制投影誤差、變形對數據集進行投影操作時用于控制投影誤差、變形實際分布的參考特征;實際分布的參考特征;地圖地圖: 空間現(xiàn)象的空間表征,通常以平面圖形表示;空間現(xiàn)象的空間表征,通常以平面圖形表示;現(xiàn)象現(xiàn)象: 事實、發(fā)生的事件、狀態(tài)

49、等;事實、發(fā)生的事件、狀態(tài)等;分辨率分辨率: 由涉及到或使用的測量工具或分析方法能區(qū)分開的兩由涉及到或使用的測量工具或分析方法能區(qū)分開的兩個獨立測量或計算的值的最小差值;個獨立測量或計算的值的最小差值;質量質量: 數據符合一定使用要求的基本或獨特的性質;數據符合一定使用要求的基本或獨特的性質; 二、空間數據元數據所涉及的概念二、空間數據元數據所涉及的概念 詳述詳述: 用一對數或三個數分別直接描述水平位置和三維位用一對數或三個數分別直接描述水平位置和三維位置的方法;置的方法;介質介質: 用于記錄、存儲或傳遞數據的物理設備。用于記錄、存儲或傳遞數據的物理設備。二、空間數據元數據所涉及的概念二、空間

50、數據元數據所涉及的概念 三、空間數據元數據的標準三、空間數據元數據的標準 空間數據元數據標準的建立是空間數據標準化的前空間數據元數據標準的建立是空間數據標準化的前提和保證,只有建立起規(guī)范的空間數據元數據才能有效利提和保證,只有建立起規(guī)范的空間數據元數據才能有效利用空間數據。目前,空間數據元數據已形成了一些區(qū)域性用空間數據。目前,空間數據元數據已形成了一些區(qū)域性或部門性的標準?;虿块T性的標準。 下表為有關空間數據元數據的幾個現(xiàn)有主要標準。下表為有關空間數據元數據的幾個現(xiàn)有主要標準。 三、空間數據元數據的標準三、空間數據元數據的標準元數據標準名稱元數據標準名稱 建立標準的組織建立標準的組織 CSD

51、GM地球空間數據元數據內地球空間數據元數據內容標準容標準 FGDC,美國聯(lián)邦空間數據委員,美國聯(lián)邦空間數據委員會會 GDDD數據集描述方法數據集描述方法 MEGRIN,歐洲地圖事務組織,歐洲地圖事務組織 CGSB空間數據集描述空間數據集描述 CSC,加拿大標準委員會,加拿大標準委員會 CEN地學信息地學信息數據描述數據描述元數元數據據 CEN/TC287 DIF目錄交換格式目錄交換格式 NASA ISO地理信息地理信息 ISO/TC211 Page 58三、空間數據元數據的標準三、空間數據元數據的標準 美國聯(lián)邦空間數據委員會(美國聯(lián)邦空間數據委員會(FGDC)的空間數據元數)的空間數據元數據內

52、容標準的影響較大,該標準用于確定地學空間數據庫據內容標準的影響較大,該標準用于確定地學空間數據庫的元數據內容。該標準于的元數據內容。該標準于1992年年7月開始起草,月開始起草,1994年年7月月8日,日,F(xiàn)GDC正式確認該標準。該標準將地學領域中應正式確認該標準。該標準將地學領域中應用的空間數據元數據分為用的空間數據元數據分為7個部分,它們是:數據標識信個部分,它們是:數據標識信息、數據質量信息、空間數據組織信息、空間參照系統(tǒng)信息、數據質量信息、空間數據組織信息、空間參照系統(tǒng)信息、地理實體及屬性信息、數據傳播及共享信息和元數據息、地理實體及屬性信息、數據傳播及共享信息和元數據參考信息。參考信

53、息。 元數據標準化這一問題逐漸成為共享地學信息的熱點。元數據標準化這一問題逐漸成為共享地學信息的熱點。元數據標準依賴于信息共享標準的理論。元數據標準依賴于信息共享標準的理論。三、空間數據元數據的標準三、空間數據元數據的標準四、空間數據元數據的獲取與管理四、空間數據元數據的獲取與管理 空間數據的地理特征要求對數據的各種操作,從數空間數據的地理特征要求對數據的各種操作,從數據獲取、數據處理、數據存儲、數據分析、數據更新等方據獲取、數據處理、數據存儲、數據分析、數據更新等方面應有一套面向地理對象的方法,相應的空間數據元數據面應有一套面向地理對象的方法,相應的空間數據元數據的內容和相關的操作也就具有了

54、不同于其它類數據元數據的內容和相關的操作也就具有了不同于其它類數據元數據的特點。的特點??臻g數據元數據的獲取空間數據元數據的獲取 空間數據元數據的管理空間數據元數據的管理 1、空間數據元數據的獲取、空間數據元數據的獲取 獲取分為三個階段:數據收集前、數據收集中和數獲取分為三個階段:數據收集前、數據收集中和數據收集后。對于模型元數據,這三個階段分別是模型形成據收集后。對于模型元數據,這三個階段分別是模型形成前、模型形成中和模型形成后。前、模型形成中和模型形成后。 第一階段的元數據第一階段的元數據是根據要建設的數據庫的內容而設計的是根據要建設的數據庫的內容而設計的元數據,內容包括:元數據,內容包括

55、: (1)普通元數據;)普通元數據; (2)專指性元數據;)專指性元數據; 1、空間數據元數據的獲取、空間數據元數據的獲取 第二階段的元數據第二階段的元數據隨數據的形式同步產生。隨數據的形式同步產生。第三階段的元數據第三階段的元數據是在上述數據收集到以后,根據需要產生的。是在上述數據收集到以后,根據需要產生的。獲取方法:獲取方法: (1)鍵盤輸入法:一般工作量大且易出錯,如有可能應盡量)鍵盤輸入法:一般工作量大且易出錯,如有可能應盡量避免避免 。 (2) 關聯(lián)表法:是通過公共項(字段)從已存在的元數據或關聯(lián)表法:是通過公共項(字段)從已存在的元數據或數據中獲取有關的元數據。數據中獲取有關的元數

56、據。 (3)測量法:易使用且出錯少)測量法:易使用且出錯少 。 (4)計算法)計算法 :由其他元數據或數據計算得到的元數據:由其他元數據或數據計算得到的元數據 。 (5)推理法)推理法 :根據數據的特征獲取元數據:根據數據的特征獲取元數據 。 在元數據獲取的不同階段,使用的方法也有差異。在第一階在元數據獲取的不同階段,使用的方法也有差異。在第一階段主要是鍵盤輸入法和關聯(lián)表法;第二階段主要是采樣測量法;段主要是鍵盤輸入法和關聯(lián)表法;第二階段主要是采樣測量法;第三階段主要是計算法和推理法。第三階段主要是計算法和推理法。2、空間數據元數據的管理、空間數據元數據的管理 空間數據元數據的理論和方法涉及到數據庫和元數據兩空間數據元數據的理論和方法涉及到數據庫和元數據兩方面。由于元數據的內容、形式的差異,元數據的管理與數據方面。由于元數據的內容、形式的差異,元數據的管理與數據涉及的領域有關,它通過建立不同數據領域基礎上的元數據信涉及的領域有關,它通過建立不同數據領域基礎上的元數據信息系統(tǒng)實現(xiàn)的。在元數據管理系統(tǒng)中,物理層存放數據與元數息系統(tǒng)實現(xiàn)的。在元數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論