




免費(fèi)預(yù)覽已結(jié)束,剩余24頁(yè)可下載查看
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第10章 空間統(tǒng)計(jì)分析統(tǒng)計(jì)分析是空間分析的主要手段,貫穿于空間分析的各個(gè)主要環(huán)節(jié)??臻g統(tǒng)計(jì)分析方法不僅僅限于常規(guī)統(tǒng)計(jì)方法,還包括利用空間位置的空間自相關(guān)分析。本章主要介紹常用統(tǒng)計(jì)量、數(shù)據(jù)特征分析(即探索性數(shù)據(jù)分析)、分級(jí)統(tǒng)計(jì)分析、空間插值和空間回歸分析五方面內(nèi)容。10.1概述10.1.1基本概念空間統(tǒng)計(jì)分析可包括“空間數(shù)據(jù)的統(tǒng)計(jì)分析”及“數(shù)據(jù)的空間統(tǒng)計(jì)分析”,前者著重于空間物體和現(xiàn)象的非空間特性的統(tǒng)計(jì)分析,解決的一個(gè)中心議題就是如何以數(shù)學(xué)統(tǒng)計(jì)模型來(lái)描述和模擬空間現(xiàn)象和過(guò)程,即將地理模型轉(zhuǎn)換成數(shù)學(xué)統(tǒng)計(jì)模型,以便于定量描述和計(jì)算機(jī)處理,著重于常規(guī)的統(tǒng)計(jì)分析方法,尤其是多元統(tǒng)計(jì)分析方法對(duì)空間數(shù)據(jù)的處理,而空間數(shù)據(jù)所描述的事物的空間位置在這些分析中不起制約作用。如趨勢(shì)面擬合被廣泛應(yīng)用于地理數(shù)據(jù)的趨勢(shì)分析中,但在這種分析中,僅考慮了樣本值的大小,而并不考慮這些樣本在地理空間的分布特征及其相互間的位置關(guān)系。從這個(gè)意義上講,空間數(shù)據(jù)的統(tǒng)計(jì)分析在很多方面,與一般的數(shù)據(jù)分析并無(wú)本質(zhì)差別,但是對(duì)空間數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果的解釋則必然要依托于地理空間進(jìn)行,在很多情況下,分析的結(jié)果以地圖方式來(lái)描述和表達(dá)的。因此,空間數(shù)據(jù)的統(tǒng)計(jì)分析盡管在分析過(guò)程中沒(méi)有考慮數(shù)據(jù)抽樣點(diǎn)的空間位置,但描述的仍然是空間過(guò)程,揭示的也是空間規(guī)律和空間機(jī)制。數(shù)據(jù)的空間統(tǒng)計(jì)分析則是直接從空間物體的空間位置、聯(lián)系等方面出發(fā),研究既具有隨機(jī)性又具有結(jié)構(gòu)性,或具有空間相關(guān)性和依賴(lài)性的自然現(xiàn)象。凡是與空間數(shù)據(jù)的結(jié)構(gòu)性和隨機(jī)性,或空間相關(guān)性和依賴(lài)性,或空間格局與變異有關(guān)的研究,并對(duì)這些數(shù)據(jù)進(jìn)行最優(yōu)無(wú)偏內(nèi)插估計(jì),或模擬這些數(shù)據(jù)的離散性、波動(dòng)性,都是數(shù)據(jù)的空間統(tǒng)計(jì)分析的研究?jī)?nèi)容。數(shù)據(jù)的空間統(tǒng)計(jì)分析不是拋棄了傳統(tǒng)的統(tǒng)計(jì)學(xué)的理論和方法,它是在傳統(tǒng)的統(tǒng)計(jì)學(xué)基礎(chǔ)上發(fā)展起來(lái)的。數(shù)據(jù)的空間統(tǒng)計(jì)學(xué)與經(jīng)典統(tǒng)計(jì)學(xué)的共同之處在于:它們都是在大量采樣的基礎(chǔ)上,通過(guò)對(duì)樣本屬性值的頻率分布、均值、方差等關(guān)系及其相應(yīng)規(guī)則的分析,確定其空間分布格局與相關(guān)關(guān)系。數(shù)據(jù)的空間統(tǒng)計(jì)學(xué)區(qū)別于經(jīng)典統(tǒng)計(jì)學(xué)的最大特點(diǎn)是:數(shù)據(jù)的空間統(tǒng)計(jì)學(xué)既考慮到樣本值的大小,又重視樣本空間位置及樣本間的距離??臻g數(shù)據(jù)具有空間依賴(lài)性(空間自相關(guān)) 和空間非均質(zhì)性(空間結(jié)構(gòu)),扭曲了經(jīng)典統(tǒng)計(jì)方法的假設(shè)條件,使得經(jīng)典統(tǒng)計(jì)模型對(duì)空間數(shù)據(jù)的分析會(huì)產(chǎn)生虛假的解釋。經(jīng)典統(tǒng)計(jì)學(xué)模型是在觀測(cè)結(jié)果相互獨(dú)立的假設(shè)基礎(chǔ)上建立的,但實(shí)際上地理現(xiàn)象之間大都不具有獨(dú)立性。數(shù)據(jù)的空間統(tǒng)計(jì)學(xué)研究的基礎(chǔ)是空間對(duì)象間的相關(guān)性和非獨(dú)立的觀測(cè),它們與距離有關(guān),并隨著距離的增加而變化。這些問(wèn)題為經(jīng)典的統(tǒng)計(jì)學(xué)所忽視,但卻成為數(shù)據(jù)的空間統(tǒng)計(jì)學(xué)的核心。10.1.2主要分析內(nèi)容 空間統(tǒng)計(jì)分析與經(jīng)典統(tǒng)計(jì)學(xué)的內(nèi)容往往是交叉的??臻g統(tǒng)計(jì)分析使用統(tǒng)計(jì)方法解釋空間數(shù)據(jù),分析數(shù)據(jù)在統(tǒng)計(jì)上是否是“典型”的,或“期望”的。同時(shí),它又具有自己獨(dú)有的空間自相關(guān)分析。主要分析內(nèi)容包含以下幾點(diǎn):1. 基本統(tǒng)計(jì)量統(tǒng)計(jì)量是數(shù)據(jù)特征的反映,也是統(tǒng)計(jì)分析的基礎(chǔ)。2. 探索性數(shù)據(jù)分析探索性數(shù)據(jù)分析能讓用戶(hù)更深入了解數(shù)據(jù),認(rèn)識(shí)研究對(duì)象,從而對(duì)與其數(shù)據(jù)相關(guān)的問(wèn)題做出更好的決策。探索性數(shù)據(jù)分析主要包括確定統(tǒng)計(jì)數(shù)據(jù)屬性、探測(cè)數(shù)據(jù)分布、全局和局部異常值(過(guò)大值或過(guò)小值)、尋求全局的變化趨勢(shì)、研究空間自相關(guān)和理解多種數(shù)據(jù)集之間相關(guān)性。3. 分級(jí)統(tǒng)計(jì)分析分級(jí)統(tǒng)計(jì)是對(duì)數(shù)據(jù)的進(jìn)一步處理分析,以便于更好得揭示數(shù)據(jù)規(guī)律或在制圖中獲得更好的效果。4. 空間插值基于探索性數(shù)據(jù)分析結(jié)果,選擇合適的數(shù)據(jù)內(nèi)插模型,由已知樣點(diǎn)來(lái)創(chuàng)建表面,研究空間分布。5. 空間回歸研究?jī)蓚€(gè)或兩個(gè)以上的變量之間統(tǒng)計(jì)關(guān)系,通過(guò)空間關(guān)系,包括考慮空間的自相關(guān)性,把屬性數(shù)據(jù)與空間位置關(guān)系結(jié)合起來(lái),更好的解釋地理事物的空間關(guān)系。6. 空間分類(lèi)基于地圖表達(dá),采用與變量聚類(lèi)分析相類(lèi)似的方法來(lái)產(chǎn)生新的綜合性或者簡(jiǎn)潔性專(zhuān)題地圖。包括多變量統(tǒng)計(jì)分析,如主成分分析、層次分析,以及空間分類(lèi)統(tǒng)計(jì)分析,如系統(tǒng)聚類(lèi)分析、判別分析等。10.2 基本統(tǒng)計(jì)量平均數(shù)中位數(shù)眾數(shù)分位數(shù)偏度峰度總和比率比例種類(lèi)集中趨勢(shì)描述數(shù)據(jù)特征的統(tǒng)計(jì)量離散程度基本統(tǒng)計(jì)量其他統(tǒng)計(jì)量分布形狀極值極差離差平均離差離差平方和方差標(biāo)準(zhǔn)差變差系數(shù)常用的基本統(tǒng)計(jì)量主要包括:最大值、最小值、極差、均值、中值、總和、眾數(shù)、種類(lèi)、離差、方差、標(biāo)準(zhǔn)差、變差系數(shù)、峰度和偏度等。這些統(tǒng)計(jì)量反映了數(shù)據(jù)集的范圍、集中情況、離散程度、空間分布等特征,對(duì)進(jìn)一步的數(shù)據(jù)分析起著鋪墊作用(見(jiàn)圖10.1)。圖10.1 基本統(tǒng)計(jì)量10.2.1 代表數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)量代表數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)量包括平均數(shù)、中位數(shù)、眾數(shù),它們都可以用來(lái)表示數(shù)據(jù)的分布位置和一般水平。表10.1中,列出了各統(tǒng)計(jì)量的含義以及在實(shí)際應(yīng)用的作用。其中,表示數(shù)據(jù)集中的第i個(gè)變量,i=1,2,n。表10.1 代表集中趨勢(shì)的統(tǒng)計(jì)量的含義、特點(diǎn)及作用統(tǒng)計(jì)量含義特點(diǎn)及作用平均數(shù)算術(shù)平均數(shù)簡(jiǎn)單算術(shù)平均數(shù)n個(gè)數(shù)據(jù)的總和與數(shù)據(jù)的總個(gè)數(shù)n的比值平均數(shù)是最常用的表示數(shù)據(jù)集中趨勢(shì)的指標(biāo),平均數(shù)可分為三種:算術(shù)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)。其中,前兩者在GIS分析中最常用到。算術(shù)平均數(shù)代表了數(shù)據(jù)集的平均水平,不受總體范圍的影響,因此可以作為比較分析的指標(biāo),還可作為評(píng)價(jià)事物的客觀標(biāo)準(zhǔn)。如一個(gè)地區(qū)某一年的人均收入可以作為衡量該地區(qū)當(dāng)年經(jīng)濟(jì)狀況的指標(biāo);要比較該地區(qū)近幾年的經(jīng)濟(jì)增長(zhǎng)水平,也需要用該地區(qū)近幾年的人均收入來(lái)比較,因?yàn)槿司杖肽艽碓摰貐^(qū)經(jīng)濟(jì)狀況的平均水平,可以用來(lái)做比較分析。另外求取離差、平均離差、離差平方和、方差、標(biāo)準(zhǔn)差、變差系數(shù)、偏度系數(shù)和峰度系數(shù)等時(shí),要先求得算術(shù)平均數(shù);算術(shù)平均數(shù)也可用于圖像處理中的平滑運(yùn)算。加權(quán)平均數(shù)與算術(shù)平均數(shù)的應(yīng)用是大致相同的,但加權(quán)平均數(shù)要考慮各數(shù)據(jù)點(diǎn)的貢獻(xiàn)作用。加權(quán)算術(shù)平均數(shù)在求算術(shù)平均數(shù)時(shí),考慮到數(shù)據(jù)集中的n個(gè)值有時(shí)會(huì)含有不同的比重,對(duì)平均數(shù)的影響也就不同。所以用加權(quán)平均法來(lái)計(jì)算其算術(shù)平均數(shù)。權(quán)重為出現(xiàn)的頻數(shù),加權(quán)平均數(shù)可以按下式計(jì)算: 其中,幾何平均數(shù)n個(gè)數(shù)據(jù)的連乘積再開(kāi)n次方所得的方根數(shù)幾何平均數(shù)用于分析和研究平均改變率、平均增長(zhǎng)率、平均定比等,還在偏相關(guān)系數(shù)里有應(yīng)用。中位數(shù)若將數(shù)據(jù)值按大小順序排列,位于中間的那個(gè)值就是中位數(shù)或稱(chēng)中值。當(dāng)數(shù)據(jù)集中有奇數(shù)個(gè)數(shù)據(jù)時(shí),數(shù)據(jù)按大小順序排列,那么第位數(shù)就是中位數(shù);當(dāng)有偶數(shù)個(gè)數(shù)據(jù)時(shí),中位數(shù)為第項(xiàng)與第項(xiàng)的平均數(shù)。中位數(shù)不受極端數(shù)值的影響,如果數(shù)據(jù)集的分布形狀是左右對(duì)稱(chēng)的,則中位數(shù)等于平均數(shù);當(dāng)數(shù)據(jù)集的分布形狀呈左偏或右偏,以中位數(shù)表示它們的集中趨勢(shì)比算術(shù)平均數(shù)更合理。眾數(shù)是數(shù)據(jù)集中最常出現(xiàn)的,因此一定是數(shù)據(jù)集中的某個(gè)值,代表了多少意見(jiàn),不受極端值的影響,在頻數(shù)分布曲線上位居最高點(diǎn),即曲線的峰值。眾數(shù)常用于投票選舉。若數(shù)據(jù)集的分布并不是明顯集中在某個(gè)數(shù)值上,用眾數(shù)來(lái)代表集中情形就沒(méi)有多大意義,甚至?xí)姓`導(dǎo)作用。眾數(shù)眾數(shù)是數(shù)據(jù)集中出現(xiàn)頻數(shù)(次數(shù))最多的某個(gè)(或某幾個(gè))數(shù)。10.2.2 代表數(shù)據(jù)離散程度的統(tǒng)計(jì)量平均數(shù)、中位數(shù)、眾數(shù)在反映總體一般數(shù)量水平的同時(shí),也掩蓋了總體中各單位的數(shù)量差異。所以,只有這些統(tǒng)計(jì)量還不能充分說(shuō)明一個(gè)數(shù)列中數(shù)值的分布情況和波動(dòng)狀態(tài)。有時(shí)雖然兩個(gè)數(shù)據(jù)集的平均數(shù)相等,但各數(shù)據(jù)分布在平均數(shù)左右的疏密程度卻不相同,也就是它們的離散程度不一樣,為了把一個(gè)數(shù)據(jù)集的離散程度表現(xiàn)出來(lái),就需要研究離散度。代表數(shù)據(jù)離散程度的統(tǒng)計(jì)量包括最大值、最小值、分位數(shù)、極差、離差、平均離差、離差平方和、方差、標(biāo)準(zhǔn)差、變差系數(shù)等。離散程度越大,數(shù)據(jù)波動(dòng)性越大,以小樣本數(shù)據(jù)代表數(shù)據(jù)總體的可靠性越低;離散程度越小,則數(shù)據(jù)波動(dòng)性小,以小樣本數(shù)據(jù)代表數(shù)據(jù)總體的可靠性越高。表10.2列出了表示離散程度各個(gè)統(tǒng)計(jì)量的含義及在實(shí)際應(yīng)用的作用。表10.2 代表離散程度的統(tǒng)計(jì)量及其特點(diǎn)、作用統(tǒng)計(jì)量含義特點(diǎn)及作用最大值與最小值把數(shù)據(jù)從小到大排列,最前端的值就是最小值,最后一個(gè)就是最大值通過(guò)最大、最小值和極差,可以了解數(shù)據(jù)的取值范圍、分散程度,易于計(jì)算,容易理解,但他們都易受極端數(shù)值的影響,漠視了其他值的存在,無(wú)法精確地反映所有數(shù)據(jù)的分散情形,因此可能會(huì)有誤導(dǎo)作用。在地形分析中,極差主要用于求取一定區(qū)域內(nèi)的高差。對(duì)于兩個(gè)不同地區(qū),雖然它們的平均高程相同,但最高點(diǎn)、最低點(diǎn)及高差不同,說(shuō)明了這兩個(gè)地區(qū)的高程分布狀況有差異。極差一個(gè)數(shù)據(jù)集的最大值與最小值的差值稱(chēng)為極差,它表示這個(gè)數(shù)據(jù)集的取值范圍分位數(shù)將數(shù)列按大小排列,把數(shù)列劃分為相等個(gè)數(shù)的分段,處于分段點(diǎn)上的值就是分位數(shù)。分位數(shù)剔除了數(shù)據(jù)集中極端值的影響,但計(jì)算麻煩,且沒(méi)有用到數(shù)據(jù)集中的所有數(shù)據(jù)點(diǎn)。分位數(shù)在數(shù)據(jù)分級(jí)中應(yīng)用較多。離差離差表示各數(shù)值與其平均值的離散程度,其值等于某個(gè)數(shù)值與該數(shù)據(jù)集的平均值之差d= x-兩個(gè)數(shù)據(jù)集的均值相同,但其離差可以有很大的差別,這說(shuō)明這兩個(gè)數(shù)據(jù)集與各自平均值的離散程度不同。平均離差和離差平方和可以克服恒等于零的缺點(diǎn),還可以把負(fù)數(shù)消除,只剩正值,這樣更易于描述離散程度,而且離差平方和得到的結(jié)果較大,使離散程度更明顯。離差平方和用于相關(guān)分析中求取相關(guān)系數(shù)在回歸分析中,對(duì)回歸方程進(jìn)行顯著性檢驗(yàn)時(shí),需要對(duì)原始數(shù)據(jù)進(jìn)行離差平方和的分解,即把離差平方和分解為剩余平方和與回歸平方和兩部分,這兩部分的比值可以反映回歸方程的顯著性。在趨勢(shì)面分析中,對(duì)于趨勢(shì)面的擬合程度可以用離差平方和來(lái)檢驗(yàn),其方法也是將原始數(shù)據(jù)的離差平方和分解為剩余平方和與回歸平方和兩部分,回歸平方和的值越大,表明擬合程度越高。平均離差平均離差是把離差取決對(duì)值,然后求和,再除以變量個(gè)數(shù)離差平方和離差平方和是把離差求平方,然后求和方差方差是均方差的簡(jiǎn)稱(chēng)。它是以離差平方和除以變量個(gè)數(shù)而得到的它們是表示一組數(shù)據(jù)對(duì)于平均值的離散程度的很重要的指標(biāo),為了應(yīng)用上的方便,常對(duì)方差進(jìn)行開(kāi)方,即為標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差都可應(yīng)用于相關(guān)分析、回歸分析、正態(tài)分布檢驗(yàn)等,還可用于誤差分析、評(píng)價(jià)數(shù)據(jù)精度、求取變差系數(shù)、偏度系數(shù)和峰度系數(shù)等。標(biāo)準(zhǔn)差還可用于數(shù)據(jù)分級(jí)。標(biāo)準(zhǔn)差對(duì)方差進(jìn)行開(kāi)方,即為標(biāo)準(zhǔn)差變差系數(shù)變差系數(shù)也稱(chēng)為離差系數(shù)或變異系數(shù),是標(biāo)準(zhǔn)差與均值的比值,以表示100%式中為變差系數(shù),其值為百分率;S是標(biāo)準(zhǔn)差;為平均值。變差系數(shù)是用相對(duì)數(shù)的形式來(lái)刻畫(huà)數(shù)據(jù)離散程度的指標(biāo),它可以用來(lái)衡量數(shù)據(jù)在時(shí)間與空間上的相對(duì)變化(波動(dòng))的程度。變差系數(shù)可用來(lái)求算地形高程變異系數(shù)。10.2.3 代表數(shù)據(jù)分布形態(tài)的統(tǒng)計(jì)量分布形態(tài)可以從兩個(gè)角度考慮,一是數(shù)據(jù)分布對(duì)稱(chēng)程度,另一個(gè)是數(shù)據(jù)分布集中程度。前者的測(cè)定參數(shù)稱(chēng)為偏度或偏斜度,后者的測(cè)定參數(shù)稱(chēng)為峰度。偏度和峰度是衡量數(shù)據(jù)分布特征的重要指標(biāo)。表10.3 代表分布形態(tài)的統(tǒng)計(jì)量及其作用統(tǒng)計(jì)量含義作用偏度偏度是刻畫(huà)數(shù)據(jù)在均值兩側(cè)的對(duì)稱(chēng)程度的參數(shù),用偏度系數(shù)來(lái)衡量。標(biāo)準(zhǔn)偏度系數(shù)(g):g=當(dāng)g0時(shí),數(shù)據(jù)的分布情況如下圖:f(x)f(x)f(x)f(x) f(x)f(x)f(x)是數(shù)據(jù)分布的密度函數(shù),是數(shù)據(jù)的平均值偏度可以表示數(shù)據(jù)分布的不對(duì)稱(chēng)性,刻畫(huà)出是向正的方向偏還是向負(fù)的方向偏(小于或大于)峰度可以表示數(shù)據(jù)頻數(shù)分布曲線峰形的相對(duì)高聳程度或尖平程度。這兩個(gè)指標(biāo)主要用于分析數(shù)據(jù)的頻率統(tǒng)計(jì)圖以及評(píng)價(jià)正態(tài)分布性,當(dāng)g=0且g=0時(shí),數(shù)據(jù)是標(biāo)準(zhǔn)正態(tài)分布。峰度峰度是刻畫(huà)數(shù)據(jù)在均值兩側(cè)的集中程度的參數(shù),用峰度系數(shù)來(lái)衡量。標(biāo)準(zhǔn)峰度系數(shù) g按下式計(jì)算:g=g0gR時(shí),區(qū)域化變量Z(x)的空間相關(guān)性不存在,即當(dāng)某點(diǎn)與已知點(diǎn)的距離大于變程時(shí),該點(diǎn)數(shù)據(jù)不能用于內(nèi)插或外推。4. Voronoi圖Voronoi地圖是由在樣點(diǎn)周?chē)纬傻囊幌盗卸噙呅谓M成的。某一樣點(diǎn)的Voronoi多邊形的生成方法是:多邊形內(nèi)任何位置距這一樣點(diǎn)的距離都比該多邊形到其它樣點(diǎn)的距離要近。Voronoi 多邊形生成之后,相鄰的點(diǎn)就被定義為具有相同連接邊的樣點(diǎn)。Voronoi 圖中多邊形值可以采用多種分配和計(jì)算方法:l 簡(jiǎn)化(Simple):分配到某個(gè)多邊形單元的值是該多邊形單元的值;l 平均(Mean):分配到某個(gè)多邊形單元的值是這個(gè)單元與其相鄰單元的平均值;l 模式(Mode):所有的多邊形單元被分為五級(jí)區(qū)間,分配到某個(gè)多邊形單元的值是這個(gè)單元與其相鄰單元的模式(即出現(xiàn)頻率最多的區(qū)間);l 聚類(lèi)(Cluster):所有的多邊形單元被分配到這五級(jí)區(qū)間中,如果某個(gè)多邊形單元的級(jí)區(qū)間與它的相鄰單元的級(jí)區(qū)間都有不同,這個(gè)單元用灰色表示,以區(qū)別于其它單元;l 熵(Entropy):所有單元都根據(jù)數(shù)據(jù)值的自然分組分配到這五級(jí)中。分配到某個(gè)多邊形單元的值是根據(jù)該單元和其相鄰單元計(jì)算出來(lái)的熵;l 中值(Median):分配給某多邊形的值是根據(jù)該單元和其相鄰單元的頻率分布計(jì)算的中值;l 標(biāo)準(zhǔn)差(StDev):分配給某多邊形的值是根據(jù)該單元和其相鄰單元計(jì)算出的標(biāo)準(zhǔn)差;l 四分位數(shù)間間隔(IQR):第一和第三四分位數(shù)是根據(jù)某單元和其相鄰單元的頻率分布得出的。分配給某多邊形單元的值是用第三四分位數(shù)減去第一四分位數(shù)得到的差。圖10.7 簡(jiǎn)化(Simple)Voronoi地圖圖10.8 熵(Entropy)Voronoi地圖圖10.7為簡(jiǎn)化(Simple)Voronoi地圖,圖10.8為熵(Entropy)Voronoi地圖,顯然不同的多邊形賦值方式,獲取的Voronoi地圖提供信息也不同。簡(jiǎn)化(Simple)Voronoi圖可以了解到每個(gè)采樣點(diǎn)控制的區(qū)域范圍,也可以體現(xiàn)出每個(gè)采樣點(diǎn)對(duì)區(qū)域內(nèi)插的重要性。利用簡(jiǎn)化(Simple)Voronoi地圖中就可以找出一些對(duì)區(qū)域內(nèi)插作用不大且可能影響內(nèi)插精度的采樣點(diǎn)值,可以將它剔除。用聚類(lèi)和熵的方法生成的Vonoroi圖可用來(lái)幫助識(shí)別可能的離群值。熵值是量度相鄰單元相異性的一個(gè)指標(biāo)。自然界中,距離相近的事物比距離遠(yuǎn)的事物具有更大的相似性,因此,局部離群值可以通過(guò)高熵值的區(qū)域識(shí)別出來(lái)。同樣,一般認(rèn)為某個(gè)特定單元的值至少應(yīng)與它周?chē)鷨卧械哪骋粋€(gè)的值相近。因此聚類(lèi)方法也能將那些與周?chē)鷨卧幌嗤膯卧R(shí)別出來(lái)。10.3.2檢驗(yàn)數(shù)據(jù)分布在空間統(tǒng)計(jì)的分析中,許多統(tǒng)計(jì)分析模型,如地統(tǒng)計(jì)分析,都是建立在平穩(wěn)假設(shè)的基礎(chǔ)上,這種假設(shè)在一定程度上要求所有數(shù)據(jù)值具有相同的變異性。另外,一些克里格插值(如普通克里格法、簡(jiǎn)單克里格法和泛克里格法等)都假設(shè)數(shù)據(jù)服從正態(tài)分布。如果數(shù)據(jù)不服從正態(tài)分布,需要進(jìn)行一定的數(shù)據(jù)變換,從而使其服從正態(tài)分布。因此,在進(jìn)行地統(tǒng)計(jì)分析前,檢驗(yàn)數(shù)據(jù)分布特征,了解和認(rèn)識(shí)數(shù)據(jù)具有非常重要的意義。數(shù)據(jù)的檢驗(yàn)可以通過(guò)直方圖和正態(tài)QQPlot分布圖完成。如果數(shù)據(jù)服從正態(tài)分布,數(shù)據(jù)的直方圖應(yīng)該呈鐘形曲線,在正態(tài)QQPlot圖中,數(shù)據(jù)的分布近似成為一條直線。10.3.3尋找數(shù)據(jù)離群值數(shù)據(jù)離群值分為全局離群值和局部離群值兩大類(lèi)。全局離群值是指對(duì)于數(shù)據(jù)集中所有點(diǎn)來(lái)講,具有很高或很低的值的觀測(cè)樣點(diǎn)。局部離群值值對(duì)于整個(gè)數(shù)據(jù)集來(lái)講,觀測(cè)樣點(diǎn)的值處于正常范圍,但與其相鄰測(cè)量點(diǎn)比較,它又偏高或偏低。離群點(diǎn)的出現(xiàn)有可能就是真實(shí)異常值,也可能是由于不正確的測(cè)量或記錄引起的。如果離群值是真實(shí)異常值,這個(gè)點(diǎn)可能就是研究和理解這個(gè)現(xiàn)象的最重要的點(diǎn)。反之,如果它是由于測(cè)量或數(shù)據(jù)輸入的明顯錯(cuò)誤引起的,在生成表面之前,它們就需要改正或剔除。對(duì)于預(yù)測(cè)表面,離群值可能引起多方面的有害影響,包括影響半變異建模和鄰域分析的取值。離群值的尋找可以通過(guò)三種方式實(shí)現(xiàn):1. 利用直方圖查找離群值離群值在直方圖上表現(xiàn)為孤立存在或被一群顯著不同的值包圍。但需注意的是,在直方圖中孤立存在或被一群顯著不同的值包圍的樣點(diǎn)不一定是離群值。2. 用半變異/協(xié)方差函數(shù)云圖識(shí)別離群值如果數(shù)據(jù)集中有一個(gè)異常高值的離群值,則與這個(gè)離群值形成的樣點(diǎn)對(duì),無(wú)論距離遠(yuǎn)近,在半變異/協(xié)方差函數(shù)云圖中都具有很高的值。3. 用Voronoi圖查找局部離群值用聚類(lèi)和熵的方法生成的Voronoi圖可用來(lái)幫助識(shí)別可能的離群值。熵值是量度相鄰單元相異性的指標(biāo)。通常,距離近的事物比距離遠(yuǎn)的事物具有更大的相似性。因此,局部離群值可以通過(guò)高熵值的區(qū)域識(shí)別出來(lái)。同理,聚類(lèi)方法也可將那些與它們周?chē)鷨卧幌嗤膯卧R(shí)別出來(lái)。圖10.9 直方圖查找離群值圖如圖10.9,直方圖最右邊被選中的一個(gè)柱狀條即是該數(shù)據(jù)的離群值。相應(yīng)地,數(shù)據(jù)點(diǎn)層面上對(duì)應(yīng)的樣點(diǎn)也被刷光。10.3.4全局趨勢(shì)分析(a)圖10.10 趨勢(shì)面分析透視面圖(b)通常一個(gè)表面主要由兩部分組成:確定的全局趨勢(shì)和隨機(jī)的短程變異??臻g趨勢(shì)反映了空間物體在空間區(qū)域上變化的主體特征,它主要揭示了空間物體的總體規(guī)律,而忽略局部的變異。趨勢(shì)面分析是根據(jù)空間抽樣數(shù)據(jù),擬合一個(gè)數(shù)學(xué)曲面,用該數(shù)學(xué)曲面來(lái)反映空間分布的變化情況。它可分為趨勢(shì)面和偏差兩大部分,其中趨勢(shì)面反映了空間數(shù)據(jù)總體的變化趨勢(shì),受全局性、大范圍的因素影響。如果能夠準(zhǔn)確識(shí)別和量化全局趨勢(shì),在空間分析統(tǒng)計(jì)建模中就可以方便的剔除全局趨勢(shì),從而能更準(zhǔn)確地模擬短程隨機(jī)變異。透視分析是探測(cè)全局趨勢(shì)常用方法,準(zhǔn)確的判定趨勢(shì)特征關(guān)鍵在于選擇合適的透視角度。同樣的采樣數(shù)據(jù),透視角度不同,反映的趨勢(shì)信息也不相同。圖10.10(a)為顯示某地區(qū)東西方向(X軸)和南北方向(Y軸)的高程趨勢(shì)圖。圖10.10(b)逆時(shí)針旋轉(zhuǎn)45度后,顯示東南-西北方向和西南-東北方向的高程趨勢(shì)圖。趨勢(shì)分析過(guò)程中,透視面的選擇應(yīng)盡可能使采樣數(shù)據(jù)在透視面上的投影點(diǎn)分布比較集中,通過(guò)投影點(diǎn)擬合的趨勢(shì)方程才具有代表性,才能有效反映采樣數(shù)據(jù)集全局趨勢(shì)。顯然,圖10.10(a)反映的趨勢(shì)比圖10.10(b)更為準(zhǔn)確。10.3.5空間自相關(guān)及方向變異大部分的地理現(xiàn)象都具有空間相關(guān)特性,即距離越近的兩事物越相似。這一特性也是空間地統(tǒng)計(jì)分析的基礎(chǔ)。半變異/協(xié)方差函數(shù)云圖就是這種相似性的定量化表示??臻g自相關(guān)分析包括全程空間自相關(guān)分析和局部空間自相關(guān)分析,自相關(guān)分析的結(jié)果可用來(lái)解釋和尋找存在的空間聚集性或“焦點(diǎn)”。 空間自相關(guān)分析需要的空間數(shù)據(jù)類(lèi)型是點(diǎn)或面數(shù)據(jù),分析的對(duì)象是具有點(diǎn)/面分布特征的特定屬性。全程空間自相關(guān)用來(lái)分析在整個(gè)研究范圍內(nèi)指定的屬性是否具有自相關(guān)性。局部空間自相關(guān)用來(lái)分析在特定的局部地點(diǎn)指定的屬性是否具有自相關(guān)性。具有正自相關(guān)的屬性,其相鄰位置值與當(dāng)前位置的值具有較高的相似性。下面介紹兩個(gè)常用的分析空間自相關(guān)的參數(shù):MoransI和GearyC。1. 空間權(quán)重矩陣地理事物在空間上的此起彼伏和相互影響是通過(guò)它們之間的相互聯(lián)系得以實(shí)現(xiàn)的,空間權(quán)重矩陣是傳載這一作用過(guò)程的實(shí)現(xiàn)方法。因此,構(gòu)建空間權(quán)重矩陣是研究空間自相關(guān)的基本前提之一??臻g數(shù)據(jù)中隱含的拓?fù)湫畔⑻峁┝丝臻g鄰近的基本度量。通常定義一個(gè)二元對(duì)稱(chēng)空間權(quán)重矩陣Wnn來(lái)表達(dá)n個(gè)空間對(duì)象的空間鄰近關(guān)系,可根據(jù)鄰接標(biāo)準(zhǔn)或距離標(biāo)準(zhǔn)來(lái)度量,還可以根據(jù)屬性值xj和二元空間權(quán)重矩陣來(lái)定義一個(gè)加權(quán)空間鄰近度量方法??臻g權(quán)重矩陣的表達(dá)形式為 (10.1)根據(jù)鄰接標(biāo)準(zhǔn),當(dāng)空間對(duì)象i和空間對(duì)象j相鄰時(shí),空間權(quán)重矩陣的元素wij為1,其他情況為0,表達(dá)式如下: (10.2)根據(jù)距離標(biāo)準(zhǔn),當(dāng)空間對(duì)象i和空間對(duì)象j在給定距離d之內(nèi)時(shí),空間權(quán)重矩陣的元素wij 為1,否則為0,表達(dá)式為 (10.3)如果采用屬性值xj和二元空間權(quán)重矩陣來(lái)定義一個(gè)加權(quán)空間鄰近度量方法,則對(duì)應(yīng)的空間權(quán)重矩陣可以定義如下: (10.4)2. MoransI參數(shù)MoransI是應(yīng)用最廣的一個(gè)參數(shù)。對(duì)于全程空間自相關(guān),MoransI定義是:Morans (10.5)對(duì)于局部位置i的空間自相關(guān),MoransI定義是: (10.6)其中:n 是觀察值的數(shù)目;xi 是在位置i的觀察值;Zi 是xi 的標(biāo)準(zhǔn)化變換,。,。是對(duì)稱(chēng)的空間權(quán)重矩陣,如果i與j相鄰,取值為,否則取值為。按照行和歸一化后的權(quán)重矩陣(每行的和為1),非對(duì)稱(chēng)的空間權(quán)重矩陣。MoransI值介于-1到1之間,0為不相關(guān)。按照假定的空間數(shù)據(jù)分布可以計(jì)算Morans I的期望值和期望方差。對(duì)于正態(tài)分布假設(shè), (10.7) (10.8)對(duì)于隨機(jī)分布假設(shè), (10.9) (10.10)其中, ,是第行權(quán)重值之和,是第列權(quán)重值之和。原假設(shè)是沒(méi)有空間自相關(guān)。根據(jù)下面標(biāo)準(zhǔn)化統(tǒng)計(jì)量參照正態(tài)分布表可以進(jìn)行假設(shè)檢驗(yàn)。 (10.11)MoransI如果是正的而且顯著,表明具有正的空間相關(guān)性。即在一定范圍內(nèi)各位置的值是相似的,如果是負(fù)值而且顯著的,則具有負(fù)的空間相關(guān)性,數(shù)據(jù)之間不相似。接近于0則表明數(shù)據(jù)的空間分布是隨機(jī)的,沒(méi)有空間相關(guān)性。3. GerayC參數(shù)對(duì)于全局空間自相關(guān): (10.12)對(duì)于局部位置i的空間自相關(guān): (10.13)其中,Wij是空間權(quán)重矩陣。C的值總是正的。假設(shè)檢驗(yàn)是如果沒(méi)有空間自相關(guān),C的均值為1。顯著性的低值(0和1之間)表明具有正的空間自相關(guān),顯著性的高值(大于1)表明具有負(fù)的空間自相關(guān)。10.4分級(jí)統(tǒng)計(jì)分析分級(jí)是對(duì)數(shù)據(jù)進(jìn)行加工處理的一種重要方法,通過(guò)分級(jí)可以把數(shù)據(jù)劃分成不同的級(jí)別,體現(xiàn)數(shù)據(jù)自身的特征,為應(yīng)用研究及專(zhuān)題制圖提供基礎(chǔ)。10.4.1 分級(jí)的概念與目的數(shù)據(jù)分級(jí)根據(jù)一定的方法或標(biāo)準(zhǔn)把數(shù)據(jù)分成不同的級(jí)別,也就是把一個(gè)數(shù)據(jù)集劃分成不同的子集,在此過(guò)程中,還可設(shè)置分級(jí)精度和分級(jí)數(shù)目等。數(shù)據(jù)分級(jí)之后,僅使原來(lái)的數(shù)據(jù)重新歸類(lèi),數(shù)據(jù)的屬性沒(méi)有發(fā)生改變,研究人員可以根據(jù)分級(jí)后的數(shù)據(jù)進(jìn)行下一步的應(yīng)用分析。數(shù)據(jù)分級(jí)的根本目的在于區(qū)分?jǐn)?shù)據(jù)集中個(gè)體的差別,分級(jí)統(tǒng)計(jì)的過(guò)程就是區(qū)別個(gè)體性質(zhì)的過(guò)程。分級(jí)的應(yīng)用目的有兩點(diǎn):一是為了分級(jí)后,圖面制圖效果好,有利于用戶(hù)讀圖;二是用不同的分級(jí)方法來(lái)突出顯示制圖區(qū)域內(nèi)不同的地貌特征。10.4.2 分級(jí)的原則 科學(xué)性原則:分級(jí)指標(biāo)的確定要遵循一定的科學(xué)規(guī)律; 完整性原則:整個(gè)數(shù)據(jù)集中的所有數(shù)據(jù)都應(yīng)被分到不同的級(jí)別中,沒(méi)有遺漏,而且同一數(shù)據(jù)集中的每一數(shù)據(jù)只能被分到某一級(jí)別中,不能同時(shí)分到兩個(gè)或多個(gè)級(jí)別中; 適用性原則:對(duì)于一個(gè)數(shù)據(jù)集,應(yīng)該根據(jù)研究或應(yīng)用的需要選擇合適的分級(jí)方法,使得分級(jí)結(jié)果能較好地滿(mǎn)足目的; 美觀性原則:分級(jí)方法及分級(jí)數(shù)目的確定不但要依據(jù)研究目的,還要注重制圖效果,制作專(zhuān)題地圖不僅要體現(xiàn)數(shù)據(jù)的空間分布特征,還要使得圖面色彩平衡,特征明顯,易于理解。10.4.3 分級(jí)統(tǒng)計(jì)的方法分級(jí)方法多種多樣,在應(yīng)用時(shí)應(yīng)根據(jù)研究的需要選擇合適的方法來(lái)突出需要的數(shù)據(jù)信息。分級(jí)方法的種類(lèi)也很多,本書(shū)主要介紹以下三種: 按使用分級(jí)方法的多少可分為單一分級(jí)法和復(fù)合分級(jí)法:?jiǎn)我环旨?jí)是指對(duì)于一個(gè)數(shù)據(jù)集只用了一種分級(jí)方法;復(fù)合分級(jí)是指由于數(shù)據(jù)自身的特點(diǎn),需要對(duì)一部分?jǐn)?shù)據(jù)使用某種分級(jí)方法,對(duì)另一部分?jǐn)?shù)據(jù)使用另外一種分級(jí)方法,才能更好地滿(mǎn)足研究的需要。如一組坡度數(shù)據(jù),一部分較?。ㄆ旅嫫骄彛?,而另一部分很大(地勢(shì)陡峭),對(duì)這兩部分?jǐn)?shù)據(jù),就應(yīng)選用兩種不同的分級(jí)方法,才能更好地突出變化特征。自定義分級(jí)模式分級(jí)等間距分級(jí)分位數(shù)分級(jí)等面積分級(jí)標(biāo)準(zhǔn)差分級(jí)自然裂點(diǎn)法其它分級(jí)方法有系統(tǒng)的不等間距分級(jí)面積正態(tài)分布分級(jí)嵌套平均值分級(jí) 按級(jí)差是否相等可分為等值分級(jí)法和不等值分級(jí)法:等值分級(jí)法又可以分為等面積分級(jí)、等間距分級(jí)、分位數(shù)分級(jí)等:不等值分級(jí)法可以分為自然裂點(diǎn)法、標(biāo)準(zhǔn)差分級(jí)、平均值嵌套分級(jí)等。 按確定級(jí)差的方法可分為自定義分級(jí)法和模式分級(jí)法。本節(jié)就是按這種分類(lèi)體系展開(kāi)討論的,其結(jié)構(gòu)圖如下: 圖10.11 分級(jí)方法的類(lèi)型1. 自定義分級(jí)自定義分級(jí)即對(duì)一個(gè)數(shù)據(jù)集,根據(jù)自己的應(yīng)用目的設(shè)定各個(gè)級(jí)別的數(shù)值范圍來(lái)實(shí)現(xiàn)分級(jí)的方法。這種方法適用于研究者對(duì)該數(shù)據(jù)集比較了解,能夠找到合適的分級(jí)臨界點(diǎn)。在自定義分級(jí)中,臨界點(diǎn)的選擇非常重要,臨界點(diǎn)選擇得好,就能夠增強(qiáng)同一級(jí)別區(qū)域間的同質(zhì)性分級(jí)和各級(jí)之間的差異性,分級(jí)結(jié)果就能夠很好地滿(mǎn)足各種分析需求。如在對(duì)坡度進(jìn)行分級(jí)的過(guò)程中,應(yīng)根據(jù)應(yīng)用目標(biāo)的要求, 確定臨界坡度。2. 模式分級(jí)模式分級(jí)就是指按固定模式進(jìn)行分級(jí),在固定模式中,級(jí)差由特定的算法自動(dòng)設(shè)定。模式分級(jí)分為等間距分級(jí)、分位數(shù)分級(jí)、等面積分級(jí)、標(biāo)準(zhǔn)差分級(jí)、自然裂點(diǎn)法分級(jí)等。 等間距分級(jí)等間距分級(jí)是一種最簡(jiǎn)單的分級(jí)方法,它按某個(gè)恒定間隔來(lái)對(duì)數(shù)據(jù)進(jìn)行分級(jí)。假定數(shù)據(jù)集里有最大值和最小值,那么間距D=。圖10.12 等間距分級(jí)示意圖圖10.13 分位數(shù)分級(jí)示意圖等間距方法原理簡(jiǎn)單、易操作,但當(dāng)數(shù)據(jù)集中在某一小范圍內(nèi)時(shí),各分級(jí)之間數(shù)據(jù)個(gè)數(shù)的差別太大會(huì)造成圖面配置不均衡,影響了制圖效果??梢?jiàn),當(dāng)數(shù)據(jù)具有均勻變化的分布特征時(shí),等間距分級(jí)法就簡(jiǎn)明實(shí)用;若數(shù)據(jù)分布差異過(guò)大,將會(huì)以響制圖與對(duì)統(tǒng)計(jì)結(jié)果的分析。圖10.12為某一地區(qū)溫度數(shù)據(jù)的等間距分級(jí)示意圖。 分位數(shù)分級(jí)分位數(shù)分級(jí)是把數(shù)列劃分為相等個(gè)數(shù)的分段,根據(jù)實(shí)際需要選擇四分位、五分位、六分位十分位。為此,要先將數(shù)列按大小排列,從一端開(kāi)始計(jì)算其分位數(shù),把處于分位數(shù)上的那個(gè)值作為分級(jí)值。分位數(shù)分級(jí)可以使每一級(jí)別的數(shù)據(jù)個(gè)數(shù)接近一致,往往能產(chǎn)生較好的制圖效果。圖10.13為某地區(qū)溫度數(shù)據(jù)的分位數(shù)分級(jí)示意圖。 等面積分級(jí)對(duì)于矢量數(shù)據(jù)而言,對(duì)每個(gè)多邊形都可以求出其面積,將面積的值按大小順序排列并累加,把累加面積分為相等的幾段,作為分級(jí)范圍,這樣,每個(gè)級(jí)別中包含的樣本數(shù)目雖然不同,但總面積基本一致。等面積方法使得每一級(jí)在圖上占據(jù)的面積相等(或大致相等)。這種方法的特點(diǎn)是在圖面上只反映各級(jí)占有相同的面積,制圖效果好,但是沒(méi)有充分利用圖面表示級(jí)間的差異。對(duì)于規(guī)則柵格數(shù)據(jù)而言,一定區(qū)域內(nèi)的面積可由該區(qū)域內(nèi)的柵格個(gè)數(shù)乘以柵格分辨率得到,所以按等面積分級(jí)只需考慮柵格個(gè)數(shù)即可。這時(shí)可以將數(shù)據(jù)按大小順序排列,將數(shù)據(jù)個(gè)數(shù)累加,并把累加的個(gè)數(shù)分為相等的幾段,這與分位數(shù)分級(jí)法得到的分級(jí)結(jié)果基本上是一致的。 標(biāo)準(zhǔn)差分級(jí)標(biāo)準(zhǔn)差可以反映各數(shù)據(jù)間的離散程度,按標(biāo)準(zhǔn)差分級(jí),首先要保證數(shù)據(jù)的分布具有正態(tài)分布的規(guī)律,才可計(jì)算平均值和標(biāo)準(zhǔn)差Std.Dev,然后根據(jù)數(shù)據(jù)波動(dòng)情況劃分等級(jí)。以算術(shù)平均值作為中間級(jí)別的一個(gè)分界點(diǎn),以一倍標(biāo)準(zhǔn)差參與分級(jí)時(shí)其余分界點(diǎn)為:Std.Dev,2Std.Dev,3Std.DeviStd.Dev。當(dāng)然也可以采用1/2倍標(biāo)準(zhǔn)差參與分級(jí),即1/2Std.Dev,2/2Std.Dev,3/2Std.Devi/2Std.Dev的形式,也可以用1/3倍標(biāo)準(zhǔn)差或1/4倍標(biāo)準(zhǔn)差。顯然,分級(jí)數(shù)目是由數(shù)據(jù)本身所決定的,且對(duì)于同一數(shù)據(jù)集,采用一倍標(biāo)準(zhǔn)差時(shí),分級(jí)數(shù)目最少,采用1/4倍標(biāo)準(zhǔn)差時(shí),分級(jí)數(shù)目最多。圖10.14為某地區(qū)溫度數(shù)據(jù)的標(biāo)準(zhǔn)差分級(jí)示意圖。 自然裂點(diǎn)法分級(jí)任何統(tǒng)計(jì)數(shù)列都存在一些自然轉(zhuǎn)折點(diǎn)、特征點(diǎn),用這些點(diǎn)可以把研究的對(duì)象分成性質(zhì)相似的群組,因此,裂點(diǎn)本身就是分級(jí)的良好界限。將統(tǒng)計(jì)數(shù)據(jù)制成頻率直方圖、坡度曲線圖、積累頻率直方圖,都有助于找出數(shù)據(jù)的自然裂點(diǎn)。如果頻率最低點(diǎn)與峰值構(gòu)成一個(gè)近似正態(tài)分布曲線,可以把任意兩個(gè)正態(tài)分布曲線交點(diǎn)作為分級(jí)界線。圖10.15 自然裂點(diǎn)法分級(jí)示意圖圖10.14 標(biāo)準(zhǔn)差分級(jí)示意圖自然裂點(diǎn)法基本上是基于讓各級(jí)別中的變異總和達(dá)到最小的原則來(lái)選擇分級(jí)斷點(diǎn)的。由于自然裂點(diǎn)法是根據(jù)數(shù)據(jù)本身特征找出一些自然裂點(diǎn)進(jìn)行分級(jí)的。圖10.15為某地區(qū)溫度數(shù)據(jù)的自然裂點(diǎn)法分級(jí)示意圖。 其他分級(jí)方法a. 有規(guī)律的不等間距分級(jí)這種方法與等間距分級(jí)法的區(qū)別在于它的間距是按一定規(guī)律變化的,而不是一個(gè)恒定的間隔。該方法采用的間隔或級(jí)差有算術(shù)級(jí)數(shù)和幾何級(jí)數(shù)兩種,每種又都可通過(guò)以下六種變化方法來(lái)確定各級(jí)的分級(jí)間隔:按某一恒定速率遞增、按某一加速度遞增、按某一減速度遞增、按某一恒定速率遞減、按某一加速度遞減、按某一減速度遞減。b. 按嵌套平均值分級(jí)該方法先計(jì)算整個(gè)數(shù)據(jù)集的平均值,它將數(shù)據(jù)集分為兩部分,每部分中再計(jì)算平均值,又各自把所有的那一部分分成兩段,以此類(lèi)推,就可以把數(shù)據(jù)集區(qū)分為2個(gè)等級(jí),即2的幾何級(jí)數(shù)。n是計(jì)算中的平均值的嵌套序數(shù),用這種方法只能得到偶數(shù)個(gè)級(jí)別,而不可能得到奇數(shù)個(gè)級(jí)別。c. 按面積正態(tài)分布分級(jí)按數(shù)據(jù)的大小排列,累加其面積,然后按正態(tài)分布的規(guī)則使中間級(jí)別所占的面積較大,往高端和低端的級(jí)別中所占的面積都依次減小,并由此來(lái)確定每級(jí)的分界線。顯然,這種方法不僅使每個(gè)級(jí)別中樣本的數(shù)目不相等,而且各級(jí)別的累加面積呈正態(tài)分布。總之,關(guān)于數(shù)據(jù)的統(tǒng)計(jì)分級(jí)的研究還很多,其目的都在于改善分級(jí)間隔的規(guī)則性、同級(jí)之中的同質(zhì)性和不同級(jí)別之間的差異性等等。10.5 空間插值空間數(shù)據(jù)插值是進(jìn)行數(shù)據(jù)外推的基本方法。常用的插值方法有很多,分類(lèi)并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),例如從數(shù)據(jù)分布規(guī)律來(lái)講,有基于規(guī)則分布數(shù)據(jù)的內(nèi)插方法、基于不規(guī)則分布的內(nèi)插方法和適合于等高線數(shù)據(jù)的內(nèi)插方法等;從內(nèi)插函數(shù)與參考點(diǎn)的關(guān)系方面,又分為曲面通過(guò)所有采樣點(diǎn)的純二維插值方法和曲面不通過(guò)參考點(diǎn)的曲面擬合插值方法;從內(nèi)插曲面的數(shù)學(xué)性質(zhì)來(lái)講,有多項(xiàng)式內(nèi)插、樣條內(nèi)插、最小二乘配置內(nèi)插等內(nèi)插函數(shù);從對(duì)地形曲面理解的角度,內(nèi)插方法有克立金法、 多層曲面疊加法、加權(quán)平均法、分形內(nèi)插等;從內(nèi)插點(diǎn)的分布范圍,內(nèi)插方法分為整體內(nèi)插、局部?jī)?nèi)插和逐點(diǎn)內(nèi)插法??臻g內(nèi)插的根本是對(duì)空間曲面特征的認(rèn)識(shí)和理解,具體到方法上,則是內(nèi)插點(diǎn)鄰域范圍的確定、權(quán)值確定方法(自相關(guān)程度)、內(nèi)插函數(shù)的選擇等三方面的問(wèn)題。由于每一種內(nèi)插方法都有其自身的特點(diǎn)和適用范圍,了解方法的特點(diǎn)是本質(zhì)所在。本書(shū)并不打算對(duì)各種內(nèi)插算法從數(shù)學(xué)實(shí)現(xiàn)方法上進(jìn)行分析討論,而是從內(nèi)插范圍分類(lèi)方法入手,對(duì)每一類(lèi)內(nèi)插方法的特點(diǎn)進(jìn)行簡(jiǎn)要的分析歸納,同時(shí)為保證內(nèi)容上的完整性和連續(xù)性,在本節(jié)只介紹概念上的東西,而具體的實(shí)現(xiàn)方法與相應(yīng)內(nèi)容請(qǐng)查閱相關(guān)文檔。10.5.1整體內(nèi)插整體內(nèi)插,就是在整個(gè)區(qū)域用一個(gè)數(shù)學(xué)函數(shù)來(lái)表達(dá)地形曲面,如圖10.16所示。整體內(nèi)插函數(shù)通常是高次多項(xiàng)式,要求地形采樣點(diǎn)的個(gè)數(shù)大于或等于多項(xiàng)式的系數(shù)數(shù)目。當(dāng)?shù)匦尾蓸狱c(diǎn)的個(gè)數(shù)與多項(xiàng)式的系數(shù)相等時(shí),這時(shí)能得到一個(gè)唯一的解,多項(xiàng)式通過(guò)所有的地形采樣點(diǎn),屬純二維插值;而當(dāng)采樣點(diǎn)個(gè)數(shù)多于多項(xiàng)式系數(shù)時(shí),沒(méi)有唯一解,這時(shí)一般采用最小二乘法求解,即要求多項(xiàng)式曲面與地形采樣點(diǎn)之間差值的平方和為最小,屬曲面擬合插值或趨勢(shì)面插值。從數(shù)學(xué)角度講,任何復(fù)雜的曲面都可用多項(xiàng)式在任意精度上逼近,但由于以下原因,在空間內(nèi)插中整體內(nèi)插并不常用:曲面擬合Z=f (x,y )內(nèi)插格網(wǎng)點(diǎn)高程圖10.16 整體內(nèi)插l 整體內(nèi)插函數(shù)保凸性較差,高次多項(xiàng)式雖然能在任意精度上逼近地形曲面,并且能使數(shù)學(xué)曲面與實(shí)際地形曲面有更多的重合點(diǎn),但由于多項(xiàng)式是自變量?jī)绾瘮?shù)的和的形式,采樣點(diǎn)的增減或移動(dòng)都需要對(duì)多項(xiàng)式的系數(shù)作全面調(diào)整,從而采樣點(diǎn)之間會(huì)出現(xiàn)難以控制的振蕩現(xiàn)象,致使函數(shù)極不穩(wěn)定,從而導(dǎo)致保凸性較差;l 不容易得到穩(wěn)定的數(shù)值解解,高次多項(xiàng)式的系數(shù)求解一般要解算較高階的線性方程組,計(jì)算的舍入誤差和數(shù)據(jù)采樣誤差(平面位置誤差),都有可能引起多項(xiàng)式系數(shù)發(fā)生較大變化,使高次多項(xiàng)式不容易得到穩(wěn)定的數(shù)值解。而且這種微小的數(shù)據(jù)擾動(dòng)影響,在二元高次多項(xiàng)式中更為嚴(yán)重,因?yàn)樵谝辉瘮?shù)插值時(shí),自變量誤差僅在一個(gè)方向上(x軸),而在二維平面上,采樣點(diǎn)的偏移方向卻是無(wú)限的。l 多項(xiàng)式系數(shù)物理意義不明顯,在低階多項(xiàng)式中,各個(gè)系數(shù)的物理意義非常明確,例如線性多項(xiàng)是中,a、b分別為兩個(gè)坐標(biāo)軸方向的斜率,而在高次多項(xiàng)式中,各個(gè)系數(shù)的物理意義一般不明確,容易導(dǎo)致無(wú)意義的地形起伏現(xiàn)象。l 解算速度慢且對(duì)計(jì)算機(jī)容量要求較高。l 不能提供內(nèi)插區(qū)域的局部地形特征;a. 二次趨勢(shì)擬合b. 三次趨勢(shì)擬合圖10.17 江蘇某地區(qū)GDP全局多項(xiàng)式趨勢(shì)擬合整體內(nèi)插雖然有如上的缺點(diǎn),但其優(yōu)點(diǎn)也是明顯的,例如整個(gè)區(qū)域上函數(shù)的唯一性、能得到全局光滑連續(xù)的空間曲面、充分反映宏觀地形特征等。整體內(nèi)插函數(shù)常常用來(lái)揭示整個(gè)區(qū)域內(nèi)的地形宏觀起伏態(tài)勢(shì)。在空間內(nèi)插中,一般是與局部?jī)?nèi)插方法配合使用,例如在使用局部?jī)?nèi)插方法前,利用整體內(nèi)插去掉不符合總體趨勢(shì)的宏觀地物特征。圖10.17(a)和圖10.17(b)分別為江蘇某地區(qū)GDP二次擬合及三次擬合的全局多項(xiàng)式擬合圖。顯然,次數(shù)越低,擬合的表面越粗糙,實(shí)際表面擬合的效果越差,大致代表了此區(qū)域的宏觀趨勢(shì);次數(shù)越高,擬合面越光滑,擬合的結(jié)果更接近實(shí)際的表面。但并不是次數(shù)越高越好,次數(shù)過(guò)高使得計(jì)算量大大增加而精度提高不大,一般選用到三次即可。10.5.2局部分塊內(nèi)插利用數(shù)學(xué)曲面來(lái)模擬實(shí)際地形表面,是地形表達(dá)的一個(gè)常用的手段。例如一階線性平面可模擬具有單一坡度的斜坡地形表面,二次曲面方程可表達(dá)山頭、洼地區(qū)域,而三次曲面則能描述較為復(fù)雜的地形曲面。然而低階多項(xiàng)式雖然可表達(dá)各種地形曲面,但一個(gè)地區(qū)確常常包含各種復(fù)雜的地貌形態(tài),簡(jiǎn)單的曲面并不能很好的表達(dá)這些地形曲面。理論上任何復(fù)雜的曲面都可用多項(xiàng)式進(jìn)行逼近,但高階多項(xiàng)式的上述缺點(diǎn),也不是理想的地形描述工具。解決這類(lèi)問(wèn)題的辦法就是采取分而治之的辦法,即將復(fù)雜的地形地貌分解成一系列的局部單元,在這些局部單元內(nèi)部地形曲面具有單一的結(jié)構(gòu),由于范圍的縮小和曲面形態(tài)的簡(jiǎn)化,用簡(jiǎn)單曲面就可較好的描述地形曲面。將地形區(qū)域按一定的方法進(jìn)行分塊,對(duì)每一塊根據(jù)地形曲面特征單獨(dú)進(jìn)行曲面擬合和高程內(nèi)插,稱(chēng)為空間分塊內(nèi)插(圖10.18)。區(qū)域分塊簡(jiǎn)化了地形的曲面形態(tài),使得每一塊都可用不同的曲面進(jìn)行表達(dá),但隨之而來(lái)的是如何進(jìn)行分塊和如何保證各個(gè)分塊之間的曲面的連續(xù)性。一般的可按地形結(jié)構(gòu)線或規(guī)則區(qū)域進(jìn)行分塊,而分塊大小取決于地形的復(fù)雜程度、地形采樣點(diǎn)的密度和分布;為保證相鄰分塊之間的平滑連接,相鄰分塊之間要有一定寬度的重疊,另外一種分塊之間的平滑連接是對(duì)內(nèi)插曲面補(bǔ)充一定的連續(xù)性條件。圖10.18 局部分塊內(nèi)插方法塊內(nèi)逐點(diǎn)內(nèi)插格網(wǎng)點(diǎn)高程分塊已知點(diǎn)格網(wǎng)點(diǎn)不同的分塊單元可用不同的內(nèi)插函數(shù),常用的內(nèi)插數(shù)函數(shù)有線性?xún)?nèi)插、雙線性?xún)?nèi)插、多項(xiàng)式內(nèi)插、樣條函數(shù)、多層曲面疊加法等。l 線性?xún)?nèi)插和雙線性?xún)?nèi)插形如的多項(xiàng)式稱(chēng)為線性平面,它將分塊單元內(nèi)部的地形曲面視為平面。如果在線性多項(xiàng)式中增加了交叉項(xiàng),線性?xún)?nèi)插則變成雙線性?xún)?nèi)插函數(shù):,之所以稱(chēng)為雙線性?xún)?nèi)插,是因?yàn)楫?dāng)y為常數(shù)時(shí),表達(dá)的是x方向的線性函數(shù),而當(dāng)x為常數(shù)時(shí),則為y方向的線性函數(shù)。線性?xún)?nèi)插函數(shù)中有三個(gè)未知數(shù),需要三個(gè)采樣點(diǎn)才能唯一確定,而雙線性?xún)?nèi)插函數(shù)中有四個(gè)未知數(shù),需要四個(gè)已知點(diǎn)。線性?xún)?nèi)插和雙線性?xún)?nèi)插函數(shù)由于物理意義明確,計(jì)算簡(jiǎn)單,是基于TIN和基于正方形格網(wǎng)分布采樣數(shù)據(jù)的DEM內(nèi)插和分析應(yīng)用的最常用的方法。l 二元樣條函數(shù)內(nèi)插所謂樣條曲面,就是將一張具有彈性的薄板壓定在各個(gè)采樣點(diǎn)上,而其它的地方自由彎曲。從數(shù)學(xué)上講,就是一個(gè)分段的低次多項(xiàng)式,多項(xiàng)式的次數(shù)一般不超過(guò)三階。通過(guò)樣條函數(shù),可以獲取在各個(gè)采樣點(diǎn)上具有最小曲率的擬合曲面。二元樣條函數(shù)首先對(duì)采樣區(qū)域進(jìn)行分塊,對(duì)每一塊用一個(gè)多項(xiàng)式進(jìn)行擬合,為保證各個(gè)分塊之間的平滑過(guò)渡,按照彈性力學(xué)條件設(shè)立分塊之間的連續(xù)性條件,即公共邊界上的導(dǎo)數(shù)連續(xù)條件。雖然樣條函數(shù)可適合的任意形狀的分塊單元,但一般還是將其應(yīng)用在規(guī)則格網(wǎng)分布的采樣數(shù)據(jù)中。與整體內(nèi)插函數(shù)相比較,樣條函數(shù)不但保留了局部地形的細(xì)部特征,還能獲取連續(xù)光滑的DEM。同時(shí)樣條函數(shù)在擬合時(shí),由于多項(xiàng)式的階數(shù)比較低,對(duì)數(shù)據(jù)誤差的響應(yīng)不敏感,具有較好的保凸性和逼真性,同時(shí)也有良好的平滑性。圖10.19為江蘇某地區(qū)GDP的張力樣條函數(shù)插值結(jié)果,圖10.19(A)取權(quán)重為0,圖10.19(B)取權(quán)重為5,圖10.19(C)為兩次插值結(jié)果的差值的絕對(duì)值??梢钥闯?,權(quán)重越高,表面越粗糙,權(quán)重不同,局部地區(qū)插值結(jié)果變化比較劇烈。樣條函數(shù)將地表分塊視為彈性剛體,采取具有彈性力學(xué)條件的光滑連續(xù)條件。然后地形并不是一個(gè)狹義的剛體,也不具備滿(mǎn)足彈性力學(xué)光滑性條件。因此雖然樣條函數(shù)具有嚴(yán)密的理論基礎(chǔ),但未必是數(shù)字地形內(nèi)插的理想數(shù)學(xué)模型。圖10.19 張力樣條函數(shù)插值結(jié)果A: Weight = 0B: Weight = 5C:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防安全治理新模式探索試題及答案
- 消防安全專(zhuān)業(yè)術(shù)語(yǔ)解讀試題及答案
- 固定資產(chǎn)審計(jì)的風(fēng)險(xiǎn)控制試題及答案
- 2024高級(jí)會(huì)計(jì)考試要點(diǎn)試題及答案
- 無(wú)人機(jī)在交通管理中的角色試題及答案
- 審計(jì)實(shí)務(wù)操作指南試題及答案
- 無(wú)人機(jī)飛行經(jīng)濟(jì)性的試題及答案
- 2025年入團(tuán)考試學(xué)習(xí)技巧集錦試題及答案
- 企業(yè)用電功率因數(shù)管理-并聯(lián)電容器的接線方式(用電負(fù)荷管理)
- 地?zé)岚l(fā)電技術(shù)-羊八井地?zé)岚l(fā)電廠(新能源發(fā)電技術(shù))
- 《取水許可核驗(yàn)報(bào)告編制導(dǎo)則(試行)(征求意見(jiàn)稿)》
- 2024年重慶八中中考數(shù)學(xué)一模試卷
- MOOC 中國(guó)特色文化英語(yǔ)教學(xué)-蘇州大學(xué) 中國(guó)大學(xué)慕課答案
- 職業(yè)道德與法律說(shuō)課稿市公開(kāi)課一等獎(jiǎng)省賽課微課金獎(jiǎng)?wù)n件
- 職業(yè)教育教學(xué)成果獎(jiǎng)申報(bào)與實(shí)施路徑
- 廣東省廣州市天河區(qū)2024年八年級(jí)下冊(cè)數(shù)學(xué)期末考試試題含解析
- RoHS2.0 HF與REACH法規(guī)培訓(xùn)教材
- 【大數(shù)據(jù)“殺熟”的法律規(guī)制探究17000字(論文)】
- 股權(quán)轉(zhuǎn)讓協(xié)議(工商局版本)
- 鐵道概論(第八版)佟立本主編
- 全國(guó)各省市名稱(chēng)大全
評(píng)論
0/150
提交評(píng)論