空間數(shù)據(jù)分析模型_第1頁(yè)
空間數(shù)據(jù)分析模型_第2頁(yè)
空間數(shù)據(jù)分析模型_第3頁(yè)
空間數(shù)據(jù)分析模型_第4頁(yè)
空間數(shù)據(jù)分析模型_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

空間數(shù)據(jù)分析模型7.1空間數(shù)據(jù)

按照空間數(shù)據(jù)的維數(shù)劃分,空間數(shù)據(jù)有四種基本類型:點(diǎn)數(shù)據(jù)、線數(shù)據(jù)、面數(shù)據(jù)和體數(shù)據(jù)。

點(diǎn)是零維的。從理論上講,點(diǎn)數(shù)據(jù)可以是以單獨(dú)地物目標(biāo)的抽象表達(dá),也可以是地理單元的抽象表達(dá)。這類點(diǎn)數(shù)據(jù)種類很多,如水深點(diǎn)、高程點(diǎn)、道路交叉點(diǎn)、一座城市、一個(gè)區(qū)域。

線數(shù)據(jù)是一維的。某些地物可能具有一定寬度,例如道路或河流,但其路線和相對(duì)長(zhǎng)度是主要特征,也可以把它抽象為線。其他的線數(shù)據(jù),有不可見(jiàn)的行政區(qū)劃界,水陸分界的岸線,或物質(zhì)運(yùn)輸或思想傳播的路線等。

面數(shù)據(jù)是二維的,指的是某種類型的地理實(shí)體或現(xiàn)象的區(qū)域范圍。國(guó)家、氣候類型和植被特征等,均屬于面數(shù)據(jù)之列。

真實(shí)的地物通常是三維的,體數(shù)據(jù)更能表現(xiàn)出地理實(shí)體的特征。一般而言,體數(shù)據(jù)被想象為從某一基準(zhǔn)展開(kāi)的向上下延伸的數(shù),如相對(duì)于海水面的陸地或水域。在理論上,體數(shù)據(jù)可以是相當(dāng)抽象的,如地理上的密度系指單位面積上某種現(xiàn)象的許多單元分布。

在實(shí)際工作中常常根據(jù)研究的需要,將同一數(shù)據(jù)置于不同類別中。例如,北京市可以看作一個(gè)點(diǎn)(區(qū)別于天津),或者看作一個(gè)面(特殊行政區(qū),區(qū)別于相鄰地區(qū)),或者看作包括了人口的“體”。

7.2空間數(shù)據(jù)分析

空間數(shù)據(jù)分析涉及到空間數(shù)據(jù)的各個(gè)方面,與此有關(guān)的內(nèi)容至少包括四個(gè)領(lǐng)域。

1)空間數(shù)據(jù)處理??臻g數(shù)據(jù)處理的概念常出現(xiàn)在地理信息系統(tǒng)中,通常指的是空間分析。就涉及的內(nèi)容而言,空間數(shù)據(jù)處理更多的偏重于空間位置及其關(guān)系的分析和管理。

2)空間數(shù)據(jù)分析??臻g數(shù)據(jù)分析是描述性和探索性的,通過(guò)對(duì)大量的復(fù)雜數(shù)據(jù)的處理來(lái)實(shí)現(xiàn)。在各種空間分析中,空間數(shù)據(jù)分析是重要的組成部分。空間數(shù)據(jù)分析更多的偏重于具有空間信息的屬性數(shù)據(jù)的分析。

3)空間統(tǒng)計(jì)分析。使用統(tǒng)計(jì)方法解釋空間數(shù)據(jù),分析數(shù)據(jù)在統(tǒng)計(jì)上是否是“典型”的,或“期望”的。與統(tǒng)計(jì)學(xué)類似,空間統(tǒng)計(jì)分析與空間數(shù)據(jù)分析的內(nèi)容往往是交叉的。

4)空間模型??臻g模型涉及到模型構(gòu)建和空間預(yù)測(cè)。在人文地理中,模型用來(lái)預(yù)測(cè)不同地方的人流和物流,以便進(jìn)行區(qū)位的優(yōu)化。在自然地理學(xué)中,模型可能是模擬自然過(guò)程的空間分異與隨時(shí)間的變化過(guò)程。空間數(shù)據(jù)分析和空間統(tǒng)計(jì)分析是建立空間模型的基礎(chǔ)。

7.3空間數(shù)據(jù)分析的一些基本問(wèn)題

空間數(shù)據(jù)不僅有其空間的定位特性,而且具有空間關(guān)系的連接屬性。這些屬性主要表現(xiàn)為空間自相關(guān)特點(diǎn)和與之相伴隨的可變區(qū)域單位問(wèn)題、尺度和邊界效應(yīng)。傳統(tǒng)的統(tǒng)計(jì)學(xué)方法在對(duì)數(shù)據(jù)進(jìn)行處理時(shí)有一些基本的假設(shè),大多都要求“樣本是隨機(jī)的”,但空間數(shù)據(jù)可能不一定能滿足有關(guān)假設(shè),因此,空間數(shù)據(jù)的分析就有其特殊性(David,2003)。

7.3.1空間自相關(guān)

空間自相關(guān)是空間位置上越靠近,事物或現(xiàn)象就越相似,即事物或現(xiàn)象具有對(duì)空間位置的依賴關(guān)系。如氣溫、濕度等的空間分布均體現(xiàn)了與海陸距離、海拔高程等的相關(guān)性。如果沒(méi)有空間自相關(guān),地理事物或地理現(xiàn)象的分布將是隨意的,地理學(xué)中的空間分異規(guī)律就不能體現(xiàn)出來(lái)??臻g自相關(guān)性使得傳統(tǒng)的統(tǒng)計(jì)學(xué)方法不能直接用于分析地理現(xiàn)象的空間特征。因?yàn)閭鹘y(tǒng)的統(tǒng)計(jì)學(xué)方法的基本假設(shè)就是獨(dú)立性和隨機(jī)性。為了分析具有空間自相關(guān)性的地理現(xiàn)象,需要對(duì)傳統(tǒng)的統(tǒng)計(jì)學(xué)方法進(jìn)行改進(jìn)與發(fā)展,空間統(tǒng)計(jì)學(xué)就應(yīng)運(yùn)而生了。

如果我們想確定某個(gè)位置測(cè)定的屬性值是否合適,自相關(guān)分析將幫助我們記述已知的觀測(cè)位置在多大程度上是有用的。自相關(guān)有三種:正自相關(guān),負(fù)自相關(guān)和無(wú)相關(guān)(零自相關(guān))。正自相關(guān)是最常見(jiàn)的,指的是附近的觀察值很可能是彼此相似的;負(fù)自相關(guān)較少見(jiàn),指的是附近的觀察值很可能是彼此不同的;零自相關(guān)指的是無(wú)法辨別空間效應(yīng),觀察值在空間上似乎是隨機(jī)變化的。區(qū)分這三種自相關(guān)是統(tǒng)計(jì)方法正確應(yīng)用的前提。

7.3.2可變區(qū)域單位問(wèn)題

空間數(shù)據(jù)處理中存在的一個(gè)重要問(wèn)題是空間范圍對(duì)空間分析的影響。大區(qū)域的數(shù)據(jù)可能來(lái)自小區(qū)域詳細(xì)數(shù)據(jù)的統(tǒng)計(jì)匯總。以國(guó)家級(jí)人口普查數(shù)據(jù)的統(tǒng)計(jì)匯總為例,人口調(diào)查以戶為單位進(jìn)行,而產(chǎn)生的人口調(diào)查報(bào)告中的數(shù)據(jù)則是不同區(qū)域?qū)哟稳丝跀?shù)據(jù)匯總統(tǒng)計(jì)的結(jié)果。匯總單位與所研究的現(xiàn)象沒(méi)有任何關(guān)系,但是匯總單位影響著由基層單位產(chǎn)生的統(tǒng)計(jì)結(jié)果。

統(tǒng)計(jì)匯總的區(qū)域?qū)哟尾煌?,統(tǒng)計(jì)結(jié)果間的關(guān)系也就不同,這就產(chǎn)生了可變區(qū)域單位問(wèn)題(modifiablearealunitproblem,MAUP)。如果在特定的研究中指定了不同的空間單位,觀察到的格局和關(guān)系可能有很大的差異。這個(gè)問(wèn)題可以參考圖7.1。圖中使用了橫向和縱向兩種不同的匯總方法,形成了兩種不同的回歸分析結(jié)果,由此說(shuō)明匯總單位對(duì)回歸方程和確定系數(shù)的影響是很明顯,回歸關(guān)系通過(guò)匯總得到了加強(qiáng)。事實(shí)上,利用同樣的數(shù)據(jù)通過(guò)不同的匯總方式可以使得相關(guān)系數(shù)在-1和1之間任意變化。

由匯總單位產(chǎn)生的影響有兩個(gè)。第一個(gè)影響與分析的空間范圍和匯總效應(yīng)有關(guān)。匯總之后的平均值更接近于回歸線,使得散點(diǎn)圖的結(jié)果更接近于線性,導(dǎo)致相關(guān)系數(shù)增加。一般通過(guò)匯總往往產(chǎn)生更好的擬合結(jié)果。第二個(gè)影響是不同匯總方法得到的結(jié)果實(shí)質(zhì)上是不同的。圖7.1可變區(qū)域單位問(wèn)題7.3.3生態(tài)學(xué)謬誤

可變區(qū)域單位問(wèn)題與更一般的統(tǒng)計(jì)問(wèn)題——生態(tài)學(xué)謬誤相聯(lián)系。當(dāng)特定匯總層次的觀察值之間的統(tǒng)計(jì)關(guān)系假定可以接受,然后在更細(xì)的層次接受同樣關(guān)系的時(shí)候,就產(chǎn)生了這個(gè)問(wèn)題。例如,在國(guó)家這個(gè)層次上,我們可能看到收入和犯罪之間有強(qiáng)烈的關(guān)系,即低收入往往伴隨著高犯罪。但是,如果我們據(jù)此認(rèn)為低收入的人更可能干壞事,那就犯了生態(tài)學(xué)謬誤的錯(cuò)誤。事實(shí)上,對(duì)于這樣的數(shù)據(jù),有效的精確的說(shuō)法是:低收入國(guó)家傾向于經(jīng)歷較高的犯罪。是什么導(dǎo)致了這些觀察到的現(xiàn)象,可能有很大的差異:有可能是低收入地區(qū)治安很差,夜賊很多;或者是這些地區(qū)的人經(jīng)常酗酒;或者根本就與收入沒(méi)有關(guān)系。重要的是,高層次匯總數(shù)據(jù)中出現(xiàn)的關(guān)系應(yīng)該在底層匯總數(shù)據(jù)中重現(xiàn)并得到解釋。

這個(gè)問(wèn)題很普遍。如果你關(guān)注新聞,在每天的日常生活或媒體中都可以發(fā)現(xiàn)生態(tài)學(xué)謬誤。犯罪率和死刑,槍支控制與關(guān)押率,車禍與車速限制等。不幸的是,生態(tài)學(xué)謬誤在學(xué)術(shù)界也不少見(jiàn)。這個(gè)問(wèn)題經(jīng)常發(fā)生,其根本的原因可能是為了簡(jiǎn)化解釋。事實(shí)上,特別在人文地理中,事情很少這么簡(jiǎn)單。生態(tài)學(xué)謬誤和可變區(qū)域單位問(wèn)題都要注意的是:統(tǒng)計(jì)關(guān)系會(huì)隨著匯總層次而發(fā)生變化。

7.3.4空間尺度

進(jìn)行空間分析時(shí),必須考慮空間尺度問(wèn)題。不同對(duì)象的表現(xiàn)需要的不同尺度,例如,在大陸尺度,城市用點(diǎn)來(lái)表示。在區(qū)域尺度,城市用面來(lái)表示。在局部尺度,城市成為復(fù)雜的點(diǎn)、線、面和網(wǎng)絡(luò)的集合體。研究對(duì)象的空間尺度影響空間分析。因此,應(yīng)當(dāng)選定正確的或合適的空間尺度。

7.3.5空間非均一性和邊界效應(yīng)

區(qū)分空間分析與傳統(tǒng)統(tǒng)計(jì)分析的重要標(biāo)志是空間的不均一性。例如,搜集到城區(qū)犯罪位置的數(shù)據(jù),并用點(diǎn)在地圖上標(biāo)繪出來(lái),就能可視化地表示犯罪的空間分布規(guī)律。在居住區(qū)和工作密集的地方,犯罪會(huì)有明顯的聚集性,在公園或道路的交叉口,可能會(huì)出現(xiàn)空缺。這些聚集或空缺只是城市內(nèi)部不均一性的一個(gè)結(jié)果。類似的問(wèn)題是考慮疾病發(fā)生率的時(shí)候,必須考慮從事高風(fēng)險(xiǎn)工作的人所在的位置。目前,處理這些問(wèn)題的方法還很少。

邊界效應(yīng)是不均一問(wèn)題的一個(gè)特殊類型。邊界效應(yīng)問(wèn)題是指在研究區(qū)的中心位置,各個(gè)方向上的觀察值相接近;在研究區(qū)的邊界,只有研究區(qū)內(nèi)的觀察值才是相接近的。因此,確定適當(dāng)?shù)倪吔绮趴赡芊从硵?shù)據(jù)的真實(shí)性。

7.4空間數(shù)據(jù)的關(guān)系

空間數(shù)據(jù)中蘊(yùn)涵了豐富的信息,本章僅考慮空間數(shù)據(jù)的位置屬性所能提供的信息。

重要的空間概念是:距離(distance)、鄰接(adjacency)和交互(interaction),與此密切相關(guān)的術(shù)語(yǔ)是近鄰(neighborhood)。在空間數(shù)據(jù)分析中,我們不僅對(duì)屬性數(shù)據(jù)的均值、方差等進(jìn)行分析,也對(duì)空間上相聯(lián)系的實(shí)體的分布進(jìn)行分析。空間分布指的是空間實(shí)體之間的關(guān)系,可以通過(guò)距離、鄰接和交互分析,獲得對(duì)空間關(guān)系的認(rèn)識(shí)。

7.4.1距離

在空間數(shù)據(jù)中,距離是空間實(shí)體間的直線距離或球面距離??臻g數(shù)據(jù)中的距離不同于數(shù)學(xué)上的距離(數(shù)學(xué)上的距離值兩個(gè)變量/樣本之間的距離,參閱模糊數(shù)學(xué)一章)。在小的地區(qū)(小尺度的研究),可以忽略地球曲率的影響,通常使用歐氏距離。對(duì)于空間上的兩個(gè)點(diǎn)i,j,其坐標(biāo)分別為(xi,yi),(xj,yj),那么兩點(diǎn)之間的直線距離為:在較大的區(qū)域(大尺度研究),距離的計(jì)算要考慮地球的曲率。

除了直線距離外,實(shí)際應(yīng)用中也可按照道路、鐵路、河流或路網(wǎng)來(lái)計(jì)算距離;也可按照消耗的時(shí)間來(lái)計(jì)算距離。

7.4.2鄰接

鄰接可以認(rèn)為是名義的、雙向的相等的距離。兩個(gè)空間實(shí)體,或者相鄰或者不相鄰,沒(méi)有中間狀態(tài)。確定相鄰有多種方式。最簡(jiǎn)單的確定方式是,如果兩個(gè)實(shí)體在指定的空間距離內(nèi),那么它們是相鄰的,否則不相鄰。類似的,對(duì)于任一實(shí)體,確定出與其最相鄰的其他實(shí)體。我們也可以認(rèn)為只有最鄰近的實(shí)體才是相鄰的。

與距離一樣,對(duì)鄰接的概念也可以進(jìn)行擴(kuò)展。鄰接的實(shí)體不一定是相近的。例如,就機(jī)場(chǎng)而言,在考慮上海、北京和莫斯科機(jī)場(chǎng)的鄰接關(guān)系時(shí),可以認(rèn)為上海機(jī)場(chǎng)與北京機(jī)場(chǎng)、北京機(jī)場(chǎng)與莫斯科機(jī)場(chǎng)是鄰接的,但上海機(jī)場(chǎng)與莫斯科機(jī)場(chǎng)則不鄰接的。

鄰接的概念主要應(yīng)用在空間自相關(guān)分析、空間插值和網(wǎng)絡(luò)分析中。

7.4.3交互

交互可以認(rèn)為是距離和鄰接的綜合,它來(lái)自于一個(gè)基本的想法:近處的事物關(guān)系更密切。從數(shù)學(xué)上講,可將兩個(gè)空間實(shí)體之間的交互度表示為0(無(wú)交互)和1(高度交互)之間的數(shù)。鄰接也可以用類似的方式來(lái)表示,因?yàn)猷徑邮请p向的。在空間分析中,典型的交互可用距離倒數(shù)加權(quán)來(lái)定義:其中,w是距離為d的兩個(gè)實(shí)體i,j之間的交互權(quán)重。k控制著權(quán)重的變化率。距離越近,權(quán)重越大,交互越強(qiáng)。

通用的交互計(jì)算中使用兩個(gè)實(shí)體的屬性值,例如人口的引力公式為:其中,pi,pj是i,j兩地的人口數(shù)量。

此外,也可以在公式中加入面積來(lái)定義兩個(gè)區(qū)域單位間的交互。

除了空間距離外,也可以使用其它的距離定義。例如,可以使用兩個(gè)國(guó)家的貿(mào)易量來(lái)定義交互程度。

7.4.4近鄰

近鄰有多種表達(dá)方式。例如,特定空間實(shí)體的近鄰是與該實(shí)體鄰接的其他空間實(shí)體的集合,此時(shí),近鄰依賴于鄰接的定義。此外,可以不考慮鄰接性,將近鄰定義為空間上相聯(lián)系的區(qū)域,此時(shí)則需要使用距離的概念。近鄰的概念經(jīng)常被使用,主要是由于空間分布上鄰近的區(qū)域更為相似。這是一種內(nèi)部相似,不同于周邊區(qū)域。例如,考慮海拔高度,山是一種近鄰,其周圍的海拔都較高。圖7.2進(jìn)一步揭示了這四個(gè)概念。左上角的圖指明了研究區(qū)內(nèi)A到其它點(diǎn)的距離。一般而言,總是可以確定兩點(diǎn)之間的距離。在右上角的圖中,按照距離指明了與A鄰接的兩點(diǎn)E和F。這種鄰接可以通過(guò)多種方法來(lái)定義。例如,以50米內(nèi)為鄰接的距離。注意,這種定義意味著D沒(méi)有鄰接的對(duì)象。我們也可以定義最近的對(duì)象是鄰接對(duì)象,這可以保證所有的對(duì)象都有兩個(gè)鄰接對(duì)象,雖然它同時(shí)意味著鄰接不再是對(duì)稱關(guān)系。例如,此時(shí),D與E鄰接(最近的是C和E),但E并不鄰接D(與E最近的是A)。在左下角的圖中,使用線寬指明A與其它對(duì)象的交互作用強(qiáng)度。這里,交互是距離的倒數(shù),所以A與E交互作用強(qiáng)。在右下角的圖中,給出了對(duì)象A的兩個(gè)可能的近鄰,曲線內(nèi)是與A鄰接的對(duì)象,包括了A,E和F。另一個(gè)可能的近鄰是帶陰影的多邊形,該空間也接近于A。圖7.2距離、鄰接、交互和近鄰的概念7.5空間自相關(guān)分析

空間自相關(guān)分析包括全程空間自相關(guān)分析和局部空間自相關(guān)分析兩部分(GetisandOrd,1996),自相關(guān)分析的結(jié)果可用來(lái)解釋和尋找存在的空間聚集性或“焦點(diǎn)”??臻g自相關(guān)分析需要的空間數(shù)據(jù)類型是點(diǎn)或面數(shù)據(jù),分析的對(duì)象是具有點(diǎn)/面分布特征的特定屬性。

全程空間自相關(guān)分析用來(lái)分析在整個(gè)研究范圍內(nèi)指定的屬性是否具有自相關(guān)性。局部空間自相關(guān)分析用來(lái)分析在特定的局部地點(diǎn)指定的屬性是否具有自相關(guān)性。具有正自相關(guān)的屬性,其相鄰位置值與當(dāng)前位置的值具有較高的一致性。

空間自相關(guān)分析,當(dāng)前常用的參數(shù)有三個(gè),即Moran’sI,GearyC和G統(tǒng)計(jì)量

7.5.1Moran’sI參數(shù)

Moran’sI是應(yīng)用最廣的一個(gè)參數(shù),可用來(lái)進(jìn)行全程空間自相關(guān)分析和局部空間自相關(guān)分析。全程空間自相關(guān)分析參數(shù)的定義是:Moran’s局部空間自相關(guān)分析參數(shù)的定義是:其中:

n是觀察值的數(shù)目,xi是在位置i的觀察值,Zi是xi的標(biāo)準(zhǔn)化形式。

,。{wij}是對(duì)稱的二項(xiàng)分布空間權(quán)重矩陣,在以樣點(diǎn)i為中心、距離為d的范圍內(nèi),取值為1,否則取值為0。

Moran’sI值越大,表明數(shù)據(jù)正的空間相關(guān)性越強(qiáng)。

7.5.2GerayC參數(shù)

GerayC參數(shù)用來(lái)分析局部空間相關(guān)性:作變換,C=1-C(d),C值大于0,表明正值四周為高值,小于0,則為低值,0則為無(wú)聚集特征。

7.5.3G統(tǒng)計(jì)量

G統(tǒng)計(jì)量由Ord和Getis1992年提出,1994年和1995年做了部分的修改,用來(lái)分析局部空間自相關(guān)性。空間統(tǒng)計(jì)量Gi(d)定義為:

,

=Wi/(n-1),

,

;.

為了便于解釋,定義Gi(d)的標(biāo)準(zhǔn)化形式為:

i≠j,各變量的含義同上。

模擬表明(Ord和Getis1994),在原假設(shè)xi周圍不存在空間聚集的條件下,G的分布接近于正態(tài),所以,經(jīng)常借助于正態(tài)分布檢驗(yàn)G值的顯著性。對(duì)于不同的觀察值N,在不同的顯著性概率(水平)下G值各不相同,例如,在0.1的顯著水平下,40個(gè)樣本對(duì)應(yīng)的G值為2.79,100個(gè)樣本對(duì)應(yīng)的G值為3.07。

檢驗(yàn)顯著的G值說(shuō)明位置i周圍是較高的數(shù)據(jù),即數(shù)據(jù)具有空間上的聚集性。

7.6空間變異分析

7.6.1空間變異

空間變異指研究對(duì)象在空間上的變化,它是地理學(xué)研究的基本問(wèn)題??臻g變異的研究可借鑒空間分析的有關(guān)方法,通過(guò)對(duì)地理系統(tǒng)的特征進(jìn)行分析,了解地理系統(tǒng)在空間上的分布和演替規(guī)律。圖7.3指導(dǎo)傳統(tǒng)地理制圖的概念模型空間變異是比較復(fù)雜的。降水、風(fēng)化、侵蝕、堆積、人類活動(dòng)以及地球構(gòu)造運(yùn)動(dòng)等地球的內(nèi)外營(yíng)力造成了物質(zhì)組成的空間變化,是導(dǎo)致空間變異最基本的原因。同時(shí),地理系統(tǒng)的不同屬性隨時(shí)間發(fā)生變化,具有不同的時(shí)間變異性,而且這種變異性有可能超過(guò)空間變異,從而增加了空間變異研究的難度。

早期研究中,人們考慮到空間變異的復(fù)雜性以及有效研究工具的缺乏,往往通過(guò)定義系統(tǒng)分類單元和均質(zhì)制圖單元對(duì)空間變異進(jìn)行系統(tǒng)分析,并假設(shè)所定義的空間單元由空間由均質(zhì)的(homogeneous)或接近均質(zhì)的塊段構(gòu)成,所有重要的變化都發(fā)生在邊界處(圖7.3)同樣,如果研究性質(zhì)的觀察值被直接地劃分為名義上的等級(jí)(例如植被中蓋度、土壤中的質(zhì)地),那么就很難考慮漸進(jìn)的、單元內(nèi)的變異。

自20世紀(jì)70年代以來(lái),隨著研究的深入,人們逐漸認(rèn)識(shí)到了空間的一些特性。大量的實(shí)驗(yàn)結(jié)果表明存在有不同尺度的空間變異。比如土壤的孔隙度,不僅隨地點(diǎn)變化,還隨采樣樣本的大小變化。極小空間范圍的變異或時(shí)間變異也可能導(dǎo)致不可預(yù)料的屬性測(cè)量值較大幅度的變化。大尺度的遙感研究,特別是使用紅外輻射研究裸地可以清楚地表現(xiàn)出地表的變異性。探地雷達(dá)研究則表明地表在垂向短距離內(nèi)也可以急劇地變異。

空間變異的程度依賴于過(guò)程的類型和它們?cè)诳臻g和時(shí)間中的協(xié)同關(guān)系。

7.6.2空間變異模型

考慮到地理過(guò)程對(duì)空間格局的影響,依據(jù)研究對(duì)象的空間分布形式劃分出兩種變異理論模型。

7.6.2.1常規(guī)模型

常規(guī)模型為突變模型(圖7.4a)。假定屬性在邊界處突然變化,但邊界之內(nèi)屬性變化很小。圖上單元由具有相似性質(zhì)的個(gè)體構(gòu)成,代表均質(zhì)的范圍,至少在分類系統(tǒng)的最低分類單位水平上相同(地圖上可辨別的最低分類單位與地圖的比例尺有關(guān),即與空間尺度有關(guān))。邊界可以通過(guò)采樣來(lái)確定,或者直接地通過(guò)空間特征(如坡形、坡位、植被變化)來(lái)確定,或者通過(guò)航片、衛(wèi)片上的相關(guān)特征來(lái)確定。

7.6.2.2

連續(xù)模型

連續(xù)模型(圖7.4b)假定屬性在空間逐漸變化,而且這種變化可以用數(shù)學(xué)模擬來(lái)逼近。

常規(guī)模型和連續(xù)模型在實(shí)際應(yīng)用中是不同的。以污染為例,如果污染水平高于某一臨界值,按照常規(guī)模型,就需要對(duì)整個(gè)地區(qū)進(jìn)行凈化處理,這無(wú)疑是十分昂貴的。按照連續(xù)模型的觀點(diǎn),污染常常是非均質(zhì)的,臨界位置上的采樣點(diǎn)在污染水平上差異甚大,可以采取統(tǒng)計(jì)方法來(lái)估計(jì)區(qū)域內(nèi)各個(gè)地方受污染的程度,這樣就可以有針對(duì)性的進(jìn)行治理,從而節(jié)省大量資源。

變異模型可以通過(guò)確定性方法或隨機(jī)方法來(lái)逼近。確定性方法不承認(rèn)屬性觀測(cè)值的不確定性,其結(jié)果是,連續(xù)模型認(rèn)為性質(zhì)的變化是一個(gè)平穩(wěn)的可微分過(guò)程,而常規(guī)模型認(rèn)為地理現(xiàn)象沒(méi)有內(nèi)部變異。隨機(jī)方法承認(rèn)地理現(xiàn)象是一個(gè)復(fù)雜的自然體,必須通過(guò)采樣方法來(lái)研究,我們只能估計(jì)其屬性的量值而且這些估計(jì)受制于概率規(guī)則,即任何估計(jì)的準(zhǔn)確性都只具有某種概率(圖7.4c、d、e、f)。用統(tǒng)計(jì)學(xué)語(yǔ)言來(lái)表達(dá)就是,每一個(gè)屬性Ai在每個(gè)圖上單元j中的數(shù)值都可以估計(jì)為Aij±e,其中e是一個(gè)正態(tài)分布的隨機(jī)誤差。上述兩種模型的進(jìn)一步發(fā)展是不同類型的空間變異可以在不同尺度上發(fā)生(多尺度模型)。

實(shí)際上,空間變異研究中存在兩種明顯不同、但原理上互相聯(lián)系的觀點(diǎn)。一種是實(shí)用地、當(dāng)然地理解空間變異方式,認(rèn)為觀察點(diǎn)位的數(shù)據(jù)可以外推到更大的區(qū)域。第二種是科學(xué)探求式的,認(rèn)為形成過(guò)程導(dǎo)致自然和人為的分布形式的多樣性。但無(wú)論如何,過(guò)程的深入理解都有助于對(duì)空間分布形式作出合理的推斷。圖7.4空間變異的假想模型7.6.3空間數(shù)據(jù)插值

空間數(shù)據(jù)插值是進(jìn)行數(shù)據(jù)外推的基本方法。常用的插值方法有:1)距離倒數(shù)插值(inverse

distanceweighted,IDW);2)樣條插值(spline);3)三角網(wǎng)插值;4)最小曲線法插值;5)等方位加權(quán)法插值;6)多項(xiàng)式擬合(趨勢(shì)面分析)插值;7)克里格插值(Kriging)?;跇颖局邓淼默F(xiàn)象和樣本點(diǎn)的空間分布方式,插值方法將生成與實(shí)際值相關(guān)性較好的預(yù)測(cè)值。不同的插值方法對(duì)于如何獲得最佳估計(jì)值都給予了一定的假設(shè),但無(wú)論你選哪種插值方法,樣本點(diǎn)越多,樣本點(diǎn)分布越均勻,插值結(jié)果越接近實(shí)際值。

7.7趨勢(shì)面分析

趨勢(shì)面分析的基本功能,是把空間中分布的一個(gè)具體的或抽象的曲面分解成兩部分:一部分主要由變化比較緩慢、影響遍及整個(gè)研究區(qū)的區(qū)域成分組成,稱為趨勢(shì);另一部分是變化比較快,其影響在區(qū)內(nèi)并非處處可見(jiàn)的成分,稱為局部異常。趨勢(shì)面分析的實(shí)質(zhì)是進(jìn)行數(shù)據(jù)的擬合,它對(duì)因變量無(wú)特別的要求,自變量一般總是由地理坐標(biāo)(平面坐標(biāo),在特別的情況下,也可以用經(jīng)緯度)組成。在三維趨勢(shì)面分析中,則增加了高程或深度坐標(biāo)值。

趨勢(shì)面分析實(shí)際是回歸分析的一種特殊應(yīng)用,或者說(shuō)是回歸分析的一個(gè)變種。兩者在數(shù)學(xué)原理、計(jì)算步驟等方面幾乎完全相同,但是兩者在應(yīng)用上有較大的區(qū)別。回歸分析的目的是研究變量之間的關(guān)系,并在此基礎(chǔ)上進(jìn)行預(yù)報(bào)或建立回歸模型,趨勢(shì)面分析是要分離出區(qū)域趨勢(shì)和局部異常兩個(gè)成分。在實(shí)際應(yīng)用中,由于多項(xiàng)式函數(shù)對(duì)曲面擬合能力比較強(qiáng),又由于地理上對(duì)擬合及分離的精度要求并不高,才使得趨勢(shì)面分析法得到廣泛的應(yīng)用。

從統(tǒng)計(jì)學(xué)中知道,回歸分析有幾個(gè)重要的假設(shè)條件,只有當(dāng)這些條件都基本上得到滿足之后,分析的結(jié)果在數(shù)學(xué)上才是精確可靠的,否則就可能產(chǎn)生虛假的結(jié)果。對(duì)于這些前提假設(shè),趨勢(shì)面分析可以嚴(yán)格地加以考慮,這時(shí)趨勢(shì)面分析實(shí)際就成為回歸分析,分析的目的,則是探討因變量和地理位置的關(guān)系。當(dāng)趨勢(shì)面分析不考慮,或部分地考慮這些前提假設(shè)時(shí),分析目的就有別于回歸分析了。在趨勢(shì)面分析中,如果照搬回歸分析的上述假設(shè),可能一無(wú)所獲,而使局部異常的識(shí)別或分離無(wú)法實(shí)現(xiàn)。

7.7.1狹義趨勢(shì)面分析與廣義趨勢(shì)面分析

一般而言,趨勢(shì)面分析基本上僅限于Grant和Krumbein提出的多項(xiàng)式趨勢(shì)面分析法,即狹義的趨勢(shì)面分析。由于趨勢(shì)面分析的根本目的是要將觀測(cè)面所包含的信息分解為趨勢(shì)和局部異常兩個(gè)成分,而具有類似的或相同功能的方法還有許多,如滑動(dòng)平均、滑動(dòng)中值、克里格法、譜分析、自協(xié)方差分析及空間濾波等。這些方法不同于多項(xiàng)式趨勢(shì)面法,稱之為廣義的趨勢(shì)面分析法。

廣義趨勢(shì)面分析中,各種方法本來(lái)的功能并不僅僅局限于分離趨勢(shì)和局部異常,不同的方法各有其特殊的性質(zhì)。如滑動(dòng)平均法主要是用以消除隨機(jī)干擾;克里格法是要在觀測(cè)數(shù)據(jù)的基礎(chǔ)上,對(duì)所分析的變量進(jìn)行插值,并給出相應(yīng)的估計(jì)誤差;空間濾波則是根據(jù)情況,由分析者指定,分離出一定波長(zhǎng)范圍內(nèi)的曲面組分。這些方法,或者要清除曲面中的一些組分,或者只提取曲面中的某些組分,和趨勢(shì)面分析的要求是重疊的或者是相容的。因此,在一定的條件下,它們可以起到趨勢(shì)面分析的作用。由于這些方法并非專用于分離趨勢(shì)和局部異常,故若作為趨勢(shì)面分析工具使用時(shí),有的效果較好,如空間濾波,而多數(shù)的效果不如多項(xiàng)式趨勢(shì)面分析方法。

對(duì)趨勢(shì)面分析法,雖然人們都把它歸入統(tǒng)計(jì)學(xué)的范疇,但它在許多方面又不能嚴(yán)格地滿足統(tǒng)計(jì)上的條件,因此只能認(rèn)為是一種簡(jiǎn)單的斷面擬合。

趨勢(shì)面分析的結(jié)果表現(xiàn)為趨勢(shì)圖和局部異常,人們從中可以解讀出有意義的地理信息,而對(duì)趨勢(shì)面方程及其系數(shù),極少有人去探求其特定的含義,不同的函數(shù)可以產(chǎn)生幾乎相同的結(jié)果,也在一定程度上使得有關(guān)參數(shù)的物理意義難以明確。

7.7.2趨勢(shì)面模型

從理論上說(shuō),屬性數(shù)據(jù)的空間變化可以分解為三個(gè)部分;1)區(qū)域趨勢(shì);2)局部異常;3)隨機(jī)干擾(即隨機(jī)噪聲)。

所謂區(qū)域趨勢(shì)是指遍及全區(qū)的、規(guī)模較大的地理過(guò)程的反映。局部異常是由規(guī)模比研究區(qū)小的地理過(guò)程所產(chǎn)生的,但其規(guī)模又至少大于兩個(gè)觀測(cè)點(diǎn)之間的距離。局部異常的規(guī)模和觀測(cè)點(diǎn)間距離的這種關(guān)系,一般在觀測(cè)點(diǎn)為規(guī)則網(wǎng)格時(shí)才是明確的。隨機(jī)干擾,一般認(rèn)為是由抽樣誤差和觀測(cè)誤差組成,不包括系統(tǒng)誤差。隨機(jī)干擾的影響范圍很小,它僅限于單個(gè)觀測(cè)點(diǎn)的控制區(qū)內(nèi),或者說(shuō)其規(guī)模小于相鄰兩觀測(cè)點(diǎn)之間的距離。

根據(jù)上述理論模型,有觀測(cè)面=區(qū)域趨勢(shì)+局部異常+隨機(jī)干擾每一具體的屬性值,都可以認(rèn)為包含了上述三種成分。趨勢(shì)面分析的目的,是如何對(duì)這三種成分進(jìn)行有效的分離。

隨機(jī)成分的分析要求有重復(fù)抽樣的觀測(cè)數(shù)據(jù),這在地理工作中往往難以滿足。因此在實(shí)際工作中,往往并不要求分離三種成分,而只要求分離其中的兩種成分。這樣,理論模型在實(shí)際應(yīng)用時(shí)就成為:觀測(cè)面=區(qū)域趨勢(shì)+局部異常

觀測(cè)面=區(qū)域趨勢(shì)+隨機(jī)干擾在上式中,局部異常成分必然包含隨機(jī)干擾成分,只不過(guò)異常成分處于主導(dǎo)地位,而隨機(jī)成分所占比重很小,以至于可以忽略不計(jì)。同理,隨機(jī)干擾仍可能包含有局部異常成分,只是它相對(duì)于隨機(jī)成分來(lái)說(shuō)規(guī)模要小。由于隨機(jī)成分有可能包含有異常成分,因此它有時(shí)仍可以有一定的地理意義。在具體工作中,隨機(jī)成分里是否包含有局部異常成分,通過(guò)將分離開(kāi)的各個(gè)成分分別作圖(一般只作等值線圖),進(jìn)行對(duì)比,然后作地理解釋后才能確定。

趨勢(shì)面分析結(jié)果可以使用下式來(lái)說(shuō)明擬合的程度:其中,n為樣點(diǎn)數(shù),z是屬性值,U是回歸平方和,S是離差平方和,c是擬合程度。

c值表明了趨勢(shì)面反映原始數(shù)據(jù)的程度。當(dāng)c=100%時(shí),則趨勢(shì)值在所有的樣點(diǎn)上與原有值相等,但這種情況很少出現(xiàn),從趨勢(shì)面分析的角度看失去了分解的意義。c接近于0,說(shuō)明擬合程度低。

如果設(shè)W為剩余平方和,即可以用F分布來(lái)檢驗(yàn)結(jié)果的顯著性。F統(tǒng)計(jì)量為:其中m是趨勢(shì)面中多項(xiàng)式的項(xiàng)數(shù)(不包括常數(shù)項(xiàng))。

在空間數(shù)據(jù)分析中,由于目的是分析趨勢(shì)和異常,所以,并不追求高的擬合程度。一般的,擬合程度達(dá)到60-80%,階數(shù)在1-4之間就可以滿足要求了。

7.7.3趨勢(shì)面分析實(shí)例

1.目的和地區(qū)概況

利用1:2.5萬(wàn)地形圖對(duì)王家坡谷地形態(tài)進(jìn)行分析,并與我國(guó)西部岡底斯山脈南坡的一條古冰川谷地進(jìn)行形態(tài)對(duì)比,探討廬山谷地是否具有冰川谷的特征,進(jìn)而推斷廬山是否曾發(fā)育過(guò)冰川。

王家坡谷地為地質(zhì)構(gòu)造上的向斜谷地。谷地兩側(cè)山脊線之間寬度平均為1300米,長(zhǎng)約4000米,西南向東北傾斜,海拔高度由1200米降到200米。兩翼巖層傾角西北翼為30度左右,東南翼為35度左右。谷形成不對(duì)稱狀態(tài),谷底平緩。我們部分冰川學(xué)者認(rèn)為,這是廬山最典型的古冰川谷地。

在1:2.5萬(wàn)地形圖上,對(duì)王家坡谷地布置了341個(gè)規(guī)則網(wǎng)點(diǎn),密度為8x8毫米。分別計(jì)算了1-3階的趨勢(shì)面(給出的是3階趨勢(shì)面的結(jié)果,圖7.11右),其中,3階趨勢(shì)面的模擬程度為98%。西藏東南部啊哪塘海洋冰川谷地3階趨勢(shì)面(左圖)的模擬程度為41%。兩條谷底的趨勢(shì)面圖的部分見(jiàn)圖7.5

2.趨勢(shì)面分析

圖7.5中左圖的等高距為50米,若插值為可與右圖相對(duì)比的25米等高距,則相鄰等高線之間距離變小,等高線密集,說(shuō)明谷坡陡峭。同一高程的等高線在谷坡向谷底過(guò)渡中有明顯的轉(zhuǎn)折,說(shuō)明坡麓清晰;過(guò)谷底的等高線較平直,說(shuō)明谷底平緩;谷地兩側(cè)等高線大致都呈同一方向平直延伸(北-南);在東北部有一組等高線(4900米)向東彎曲,而4750米、4800米和4850米這組等高線在其下平直通過(guò),谷地延伸與啊哪塘谷地近于直交,是一支冰川谷—懸谷。右圖的等高距為20米,谷坡則比左圖平緩。同一高程等高線從谷坡向谷底舒緩過(guò)渡,無(wú)明顯的轉(zhuǎn)折,說(shuō)明谷坡谷底無(wú)明顯分界。過(guò)谷底的等高線都是圓弧狀,數(shù)條等高線排列整齊,形狀幾乎相同,說(shuō)明坡面傾角與巖層傾角基本一致。兩個(gè)圖相比較無(wú)明顯相似處,表明王家坡谷地似未曾經(jīng)歷過(guò)冰川的強(qiáng)烈作用,谷地形態(tài)只是一個(gè)向斜谷地的典型地形特征。

圖7.5谷地趨勢(shì)面圖對(duì)比7.8方差云圖

在實(shí)際應(yīng)用中,人們更關(guān)心的對(duì)象的空間位置與其它屬性數(shù)據(jù)之間的關(guān)系。通過(guò)繪制實(shí)體屬性值的差異與其位置差異的圖件,可以得到這種關(guān)系的一般描述。所形成的圖件稱為方差云圖。

首先看一下圖7.6中的數(shù)據(jù),這是310x310米調(diào)查區(qū)的高程點(diǎn),其中繪制等值線是為了顯示數(shù)據(jù)的總體空間變化特征。從北向南,總的趨勢(shì)是上坡。南坡地形似乎更為復(fù)雜一些。圖7.5高程點(diǎn)和等高線(注意等高線是人工勾繪的)對(duì)每個(gè)可能點(diǎn)對(duì),我們按照點(diǎn)對(duì)高程差的平方根與點(diǎn)對(duì)的距離來(lái)繪圖,得到圖7.7。圖中點(diǎn)的分布比較雜亂,但從密集點(diǎn)的分布可以看出,高程點(diǎn)間距離越大,高程差異越大。

從圖7.6中可以看出,高度上的增加趨勢(shì)是由北向南。事實(shí)上,可以只繪制近南北方向分離的點(diǎn)對(duì)。如果將方向精確地限制在南北方向上,可能沒(méi)有繪圖的點(diǎn)對(duì)。所以實(shí)際上取的范圍是南北方向±50。類似地可繪制東西方向的點(diǎn)對(duì)。圖7.8給出了這些點(diǎn)對(duì)的分布,其中,南北方向的用空心圓表示,東西方向的用點(diǎn)表示。

在上圖中注意如下幾個(gè)方面:

1)繪圖的點(diǎn)數(shù)減少。這是因?yàn)槟媳焙蜄|西兩個(gè)方向上點(diǎn)的數(shù)目較少。實(shí)際上,我們可以推測(cè)每個(gè)方向上的點(diǎn)數(shù)大致是原來(lái)的10/180=1/18(假如數(shù)據(jù)點(diǎn)的分布是均勻的)。

2)可繪圖的距離范圍要小一些。因?yàn)檠芯繀^(qū)在兩個(gè)方向上是300米,300米就是最大的距離間隔。從空間分析來(lái)看,300米構(gòu)成了邊界效應(yīng)。

3)雖然有部分重疊,但南北方向上的差異要大于東西方向上的差異,反映了調(diào)查點(diǎn)的真實(shí)趨勢(shì)。

4)不同方向上顯示出的差異可以用各向異性(anisotropy)的概念來(lái)表示,即數(shù)據(jù)的空間變異與方向有關(guān)。相反,如果各個(gè)方向上沒(méi)有差異,則用概念各向同性來(lái)表示。

圖7.6高程點(diǎn)的方差云圖圖7.7南北方向(圓圈)和東西向(點(diǎn))的方差云圖方差云圖是有用的探索工具,但因?yàn)辄c(diǎn)數(shù)多,所以有時(shí)候難以解釋。更簡(jiǎn)要的概括是把距離軸改為不同的間隔(lag),然后對(duì)每個(gè)間隔內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行概括。如

圖7.9所示,其中,有10個(gè)間隔,每個(gè)間隔是50米。在較大的距離間隔上,高程點(diǎn)的差異較大,這種趨勢(shì)很清楚。對(duì)應(yīng)于定義的研究區(qū),邊界效應(yīng)也很明顯,出現(xiàn)在間隔6和7中(對(duì)應(yīng)于300米)。間隔8,9,10包括了不同的差異,更多的反映了研究區(qū)四個(gè)角的空間特征。如果增大研究區(qū)的范圍,那么就不會(huì)出現(xiàn)這樣的效應(yīng)。圖7.8不同距離間隔的高程點(diǎn)盒子圖圖7.9表明,距離越遠(yuǎn),高程點(diǎn)之間的差異越大。這與我們熟知的地形變化是一致的。方差云圖有助于揭示數(shù)據(jù)中的自相關(guān)結(jié)構(gòu),但更重要的是,還可通過(guò)估計(jì)屬性的方差變異與間隔距離的函數(shù)關(guān)系,優(yōu)化插值的結(jié)果。

7.9區(qū)域變量和克里格插值

7.9.1區(qū)域化變量

一個(gè)變量的空間分布稱為該變量的區(qū)域化。如果變量以三個(gè)空間坐標(biāo)(x,y,z)為自變量,那么該變量就是區(qū)域化變量。

區(qū)域化變量假定,在一定空間范圍內(nèi),屬性指標(biāo)的變異可以用一個(gè)連續(xù)的、空間上相關(guān)的隨機(jī)域來(lái)模擬。任何變量的空間變異可以表示為三個(gè)主要組分之和:確定性成份、區(qū)域成分和隨機(jī)成分。

設(shè)x為樣點(diǎn)在1,2或3維空間的位置,x點(diǎn)的隨機(jī)變量Z值為:其中m(x)是描述Z結(jié)構(gòu)項(xiàng)的一個(gè)確定性數(shù),c’(x)是描述隨機(jī)區(qū)域變異但空間相關(guān)的殘余項(xiàng),即區(qū)域變量,ξ"是殘余的空間不相關(guān)的高斯噪音項(xiàng)(服從標(biāo)準(zhǔn)正態(tài)分布,即平均值為0,方差為α2)。如果沒(méi)有趨勢(shì),那么m(x)等于樣區(qū)數(shù)據(jù)的平均值,而且任何兩點(diǎn)x和x+h(h為間隔距離)之間的平均值或期望值的差為0。

使用Z(x),Z(x+h)表示隨機(jī)變量Z在位置x,x+h的觀測(cè)值,區(qū)域化變量理論假設(shè)任意兩點(diǎn)Z的差值的方差僅取決于位置間的距離h。

在有趨勢(shì)的情況下,假設(shè)數(shù)據(jù)是弱平穩(wěn)的,并假設(shè)對(duì)于所有的h,增量Z(x)-Z(x+h)的方差是有限的,而且只是相隔h的函數(shù)。在該假設(shè)成立的情況下,定義半方差為:其中,n是相隔距離為h的樣點(diǎn)對(duì)的個(gè)數(shù)。將r(h)和h作為縱、橫坐標(biāo)作圖即可獲得實(shí)驗(yàn)半方差函數(shù)圖(圖7.10)。實(shí)驗(yàn)方差函數(shù)圖不受數(shù)據(jù)的非平穩(wěn)性影響,是空間變異性研究中的一個(gè)有力工具,也是區(qū)域變量定量描述的第一步。圖7.9實(shí)驗(yàn)半方差變異函數(shù)圖在方差變異圖上,如果樣點(diǎn)具有空間關(guān)系,那么,空間上分布愈接近的點(diǎn)對(duì)(靠近x軸的左邊)應(yīng)該具有更相似的值(靠近y軸的下邊),而距離愈遠(yuǎn)的點(diǎn)對(duì)(沿x軸方向向右移動(dòng)),應(yīng)該具有更多的不相似性和更高的方差(沿y軸方向向上移動(dòng))。

7.9.2方差變異函數(shù)

7.9.2.1基本概念

圖7.11是一個(gè)典型的實(shí)驗(yàn)方差函數(shù)和其理論方差函數(shù)曲線,它有下面幾個(gè)重要的特征。

1)隨間隔增大,方差增大,并在一定的間隔后達(dá)到一個(gè)基本穩(wěn)定的常數(shù)。這個(gè)方差常數(shù)稱為基臺(tái)(sill),在理論函數(shù)模型中用C+C0表示。平穩(wěn)數(shù)據(jù)的基臺(tái)值近似于采樣方差。

基臺(tái)值意味著在對(duì)應(yīng)(或大于)距離的樣點(diǎn)之間沒(méi)有空間相關(guān)性,因?yàn)榉讲畈辉匐S距離變化。

2)曲線從較低的方差值升高,到一定的間隔值時(shí)到達(dá)基臺(tái)值,這一間隔稱為變程(range)。在理論函數(shù)模型中,變程用a表示。

變程是半方差函數(shù)中最重要的參數(shù),它描述了該間隔內(nèi)樣點(diǎn)的空間相關(guān)特征。在變程內(nèi),樣點(diǎn)越接近,兩點(diǎn)之間相似性、即空間上的相關(guān)性越強(qiáng)。很明顯,如果某點(diǎn)與已知點(diǎn)距離大于變程,那么該點(diǎn)數(shù)據(jù)不能用于數(shù)據(jù)內(nèi)插(或外推),因?yàn)榭臻g上的自相關(guān)性不復(fù)存在。

變程的高低取決于觀測(cè)的尺度,說(shuō)明了相互作用所影響的范圍。不同的屬性,其變程值可以變化很大。圖7.10典型試驗(yàn)方差函數(shù)和擬合曲線3)理論方差函數(shù)曲線不穿過(guò)原點(diǎn),而是存在一個(gè)最小的方差值。理論上講,當(dāng)間隔h=0時(shí),估值的方差應(yīng)該為0,因?yàn)槿魏我稽c(diǎn)與自身之差的值為0。h趨近于0時(shí),r(h)軸上的正截距是殘差的一個(gè)估計(jì),該值稱為塊金(或基底,nugget)。在理論函數(shù)模型中,用C0表示。

塊金是在間隔距離小于采樣間距時(shí)的測(cè)量誤差或空間變異,或者是二者的和。測(cè)量誤差是由儀器的內(nèi)在誤差引起的,空間變異是自然現(xiàn)象在一定空間范圍內(nèi)的變化。小于采樣間距的微觀尺度上空間變異是塊金的一部分。

當(dāng)r(h)值在所有的h值上都等于基臺(tái)值時(shí),實(shí)驗(yàn)半方差函數(shù)就表現(xiàn)為純塊金效應(yīng),這通常由于短間距內(nèi)點(diǎn)與點(diǎn)的變異很大而引起,表明所使用的采樣間隔內(nèi)完全沒(méi)有空間相關(guān)性,此時(shí),可以認(rèn)為各個(gè)樣點(diǎn)是隨機(jī)的,區(qū)域平均值就是各點(diǎn)的最佳估計(jì)值。此時(shí),只有增大采樣間隔才能揭示出空間相關(guān)性。

塊金與基臺(tái)的比值(C0/(C+C0),基底效應(yīng))可以用來(lái)說(shuō)明空間的變異特征,該值越大,說(shuō)明空間變異更多的是隨機(jī)成分引起的,否則,則是由特定的地理過(guò)程或多個(gè)過(guò)程綜合引起的。

空間相關(guān)性的強(qiáng)弱,可用C/(C+C0)表示,該值越高,表明空間相關(guān)性越強(qiáng)。

在實(shí)際的模型計(jì)算中,塊金與基臺(tái)兩個(gè)參數(shù)是可以調(diào)整的,其取值取決于整體的擬合效果。

7.9.2.2理論變異函數(shù)模型

理論變異函數(shù)模型用來(lái)擬合實(shí)驗(yàn)半方差圖的離散點(diǎn)。常用的模型有如下幾種。

1.線性模型(Linearmodel_)其中,w是直線的斜率,此模型是最簡(jiǎn)單模型,但在一定范圍內(nèi)也是適用的。在某些情況下,w可以為0,這時(shí)就是純塊金效應(yīng)模型。

2.球狀模型(Sphericalmodel)式中符號(hào)的意義與前面相同。球面模型最為常用,此外,由于球狀模型是根據(jù)三維空間的隨機(jī)移動(dòng)平均過(guò)程推導(dǎo)獲得,因此特別適用于三維空間。

3.指數(shù)模型(Exponentialmodel)其中,d是控制方程空間范圍的距離參數(shù)。這里,僅在無(wú)窮遠(yuǎn)處相關(guān)性完全消失。變程為3d。指數(shù)模型在統(tǒng)計(jì)理論中地位重要,它表示了空間隨機(jī)性的要素,是一階自回歸和馬爾可夫過(guò)程的半方差函數(shù)。作為自相關(guān)函數(shù),它們是采樣設(shè)計(jì)有效性的理論基礎(chǔ)。

4.高斯模型(Gaussianmodel)變程為。

圖7.11是球狀模型、指數(shù)模型和高斯模型的比較,可以看出,球狀模型的變程最小,指數(shù)的模型變程最大,高斯模型的變程介于二者之間。球狀模型和指數(shù)模型過(guò)原點(diǎn)存在切線,高斯模型則沒(méi)有。

圖7.11球狀模型、指數(shù)模型和高斯模型的比較5.雙曲線模型6.圓形模型在空間分析中,根據(jù)數(shù)據(jù)的空間自相關(guān)性和研究對(duì)象的先驗(yàn)知識(shí),選擇要使用的模型。選定了理論模型后,通常是用最小二乘法計(jì)算方程的各個(gè)參數(shù),并用最大似然法(ML)來(lái)選擇擬合效果最好的模型。

此外,在擬合中可以疊加使用上面的模型,模型的參數(shù)也可以進(jìn)行調(diào)節(jié),以達(dá)到最大程度的擬合實(shí)驗(yàn)數(shù)據(jù)。

7.9.2.3空間插值

計(jì)算理論方差函數(shù)是確定插值權(quán)重的基本過(guò)程,是預(yù)測(cè)未知位置屬性值的克里格方法(Kriging)的基礎(chǔ)。D.G.Krige是南非采礦工程學(xué)家,在1951年提出了礦產(chǎn)品位和儲(chǔ)量估值方法。法國(guó)地統(tǒng)計(jì)學(xué)家Matheron(1971)命名了這種方法,并在此基礎(chǔ)上提出了區(qū)域化變量理論,使傳統(tǒng)的地學(xué)方法與統(tǒng)計(jì)方法相結(jié)合,形成了完整的方法體系。

7.9.3克里格插值

克里格法是利用原始數(shù)據(jù)和半方差函數(shù)的結(jié)構(gòu)性,對(duì)未采樣點(diǎn)的區(qū)域化變量進(jìn)行無(wú)偏最佳估計(jì)值的一種方法,這種方法的一個(gè)特點(diǎn)是能夠計(jì)算出每個(gè)估計(jì)值的誤差大小(估計(jì)值方差),從而能知道估計(jì)值的可靠性程度??死锔穹椒ìF(xiàn)已發(fā)展為多種類型,如簡(jiǎn)單克里格(simpleKriging),普通克里格(ordinaryKriging),點(diǎn)克里格(pointKriging),塊段克里格(blockKriging),通用克里格(universalKriging),協(xié)同克里格(co-kriging),不連續(xù)克里格及指標(biāo)克里格等。

如果變量滿足平穩(wěn)性假設(shè),可直接用點(diǎn)或塊段克里格方法,這兩種方法也稱普通克里格。如果是非平穩(wěn)的,需要采用泛克里格方法。如果分析多個(gè)變量的協(xié)同區(qū)域化問(wèn)題,要采用協(xié)同克里格方法。其他的各種克里格方法也各有其應(yīng)用領(lǐng)域。

克里格插值與距離倒數(shù)加權(quán)插值的相似之處在于,二者都通過(guò)給已知樣本點(diǎn)賦權(quán)重來(lái)求其他點(diǎn)的預(yù)測(cè)值。兩種內(nèi)插方法的通用公式如下:其中,Z(si)是已測(cè)得的第i個(gè)位置的屬性值,wi是在第i個(gè)位置上測(cè)得值的權(quán)重,s0是待插值的位置,n是已知樣點(diǎn)的數(shù)目。

距離倒數(shù)加權(quán)插值中,權(quán)重wi僅取決于樣點(diǎn)到待插值點(diǎn)的距離。在克里格插值中,權(quán)重不僅考慮了已知點(diǎn)與插值點(diǎn)間的距離,而且考慮了己知點(diǎn)的位置和屬性值整體的空間分布和格局??死锔癫逯抵械臋?quán)重來(lái)自半方差函數(shù)模型(生成的表示地理現(xiàn)象連續(xù)表面的函數(shù)),在半方差函數(shù)模型和鄰近已知點(diǎn)的空間分布的基礎(chǔ)上,對(duì)研究區(qū)內(nèi)的各個(gè)位置進(jìn)行預(yù)測(cè),權(quán)重wi取決于已知點(diǎn)的擬合模型、到插值點(diǎn)的距離和插值點(diǎn)周圍的已知樣點(diǎn)的空間關(guān)系。

利用克里格方法進(jìn)行預(yù)測(cè),必須完成兩個(gè)任務(wù):(1)揭示空間相關(guān)規(guī)律;(2)進(jìn)行預(yù)測(cè)。為此,克里格插值方法需要兩個(gè)步驟:(1)生成變異函數(shù)和協(xié)方差函數(shù),用于估算樣點(diǎn)值間的統(tǒng)計(jì)相關(guān)(空間自相關(guān))。變異函數(shù)和協(xié)方差函數(shù)取決于自相關(guān)模型(擬合模型)。(2)預(yù)測(cè)未知點(diǎn)的值。

7.9.3.1普通克里格方法

普通克里格是滿足假設(shè)的區(qū)域化變量的線性估計(jì),它假設(shè)數(shù)據(jù)的變化呈正態(tài)分布,假設(shè)區(qū)域化變量Z的期望值是未知的(如果為已知的常數(shù),則為簡(jiǎn)單克里格方法)。插值過(guò)程類似于加權(quán)滑動(dòng)平均,只是權(quán)重值不是來(lái)自于確定性空間函數(shù),而是來(lái)自于空間數(shù)據(jù)分析。

1)點(diǎn)克里格

簡(jiǎn)單的點(diǎn)估值是最常用的克里格法??死锔穹梢哉f(shuō)是一種局部估值方法,每一估值都是由其鄰近觀測(cè)值加權(quán)平均計(jì)算而得的。有實(shí)驗(yàn)表明,點(diǎn)克里格法比多項(xiàng)式和加權(quán)平均法的估值精度高。

由克里格法估值產(chǎn)生的方差圖,可以識(shí)別出需要進(jìn)一步采樣的地區(qū)。

2)塊段克里格A

B

圖7.12半方差模型參數(shù)

A:各向同性

B:各向異性塊段克里格是對(duì)中心在x0的小區(qū)或塊段進(jìn)行估值。任一塊段V中的屬性Z的克里格值,是其鄰近塊段觀測(cè)值xi的加權(quán)平均。

塊段克里格與點(diǎn)克里格法的區(qū)別僅在于權(quán)重系數(shù)的確定。當(dāng)塊段的大小等于原有平均點(diǎn)或樣點(diǎn)所覆蓋的范圍時(shí),克里格就是精確內(nèi)插,因?yàn)閮?nèi)插值與數(shù)據(jù)點(diǎn)值相等,點(diǎn)克里格就成為塊段克里格的特例。塊段克里格的估值方差總是小于點(diǎn)克里格法。

塊段克里格法的最普通用途是繪制等值線圖,而且圖中的等值線較平滑,對(duì)揭示區(qū)域內(nèi)的變化規(guī)律格局尤為有效。

普通克里格分析需要給出如下的結(jié)果:半方差圖(圖7.12),半方差模型參數(shù),克里格插值結(jié)果圖,插值結(jié)果的交叉檢驗(yàn)(圖7.13-圖7.15)。下面給出的是對(duì)青海省青海湖西側(cè)鐵卜加樣區(qū)數(shù)據(jù)進(jìn)行克里格分析得到的結(jié)果。數(shù)據(jù)樣本數(shù)為100,10x10等間隔30米采樣。指標(biāo)為蟻蝗密度,單位是頭/平方米。AB

圖7.13克里格分析的半方差圖

A:各向同性

B:各向異性半方差模型中參數(shù)使用回歸方法估計(jì)(圖7.12)。對(duì)比確定系數(shù)r2和殘差的標(biāo)準(zhǔn)差RSS,選取指數(shù)模型為最佳半方差模型。這在各向同性和各向異性時(shí)均有較好的擬合效果。各向同性的模型獲得的變程為135.8m,各向異性模型獲得的變程為90-210米,依計(jì)算的方向不同有所差異。從擬合效果看(RSS最?。?,以90度方向的效果最好。

圖7.14是使用上述模型得到的插值結(jié)果,圖7.15是克里格插值的交叉檢驗(yàn)圖。

圖7.15中,回歸系數(shù)表示回歸方程的擬合程度。最佳的回歸系數(shù)為1(圖中的實(shí)線部分,虛線是當(dāng)前的結(jié)果)。r2(圖中表示為r2)是確定系數(shù)。SE是標(biāo)準(zhǔn)差。當(dāng)我們認(rèn)為蟻蝗密度的變化具有各向同性時(shí),得到回歸系數(shù)高于各向異性,而且具有較低的預(yù)測(cè)標(biāo)準(zhǔn)誤差。所以,就研究地區(qū)而言,雖然種群密度在不同方向上是有變化的,但不是非常顯著。各向同性模型對(duì)于預(yù)測(cè)更為合適。

圖7.14各向同性的點(diǎn)克里格插值

圖7.15克里格插值的交叉檢驗(yàn)

A:各向同性

B:各向異性7.9.3.2泛克里格方法

普通克里格方法要求數(shù)據(jù)是二階平穩(wěn)的或準(zhǔn)平穩(wěn)的。如果數(shù)據(jù)在空間上存在明顯的趨勢(shì),那么,普通克里格方法就不再適用。此時(shí),應(yīng)該使用泛克里格方法進(jìn)行分析。

泛克里格方法假設(shè)數(shù)據(jù)中有主導(dǎo)趨勢(shì),而且該趨勢(shì)可以用一個(gè)確定性的函數(shù)或多項(xiàng)式來(lái)擬合。

進(jìn)行泛克里格方法分析的步驟為:

1)趨勢(shì)分析

分析數(shù)據(jù)中存在的空間上的變化趨勢(shì),獲得擬合模型。這部分內(nèi)容與前面的趨勢(shì)面分析相同。

2)殘差的克里格分析

這部分的分析方法與前面的普通克里格分析相同,不同的是,計(jì)算使用的數(shù)據(jù)是原始數(shù)據(jù)減去趨勢(shì)數(shù)據(jù),即殘差數(shù)據(jù)。

3)泛克里格插值

將趨勢(shì)面分析和殘差的克里格插值結(jié)果加和,即構(gòu)成了泛克里格方法分析的結(jié)果(圖7.16)。圖7.16泛克里格插值結(jié)果AIC準(zhǔn)則可以用來(lái)對(duì)比模型的擬合程度,下面是三個(gè)模型的AIC值:

趨勢(shì)面分析

500.08

普通克里格方法

490.21

泛克里格方法

470.31

克里格方法明顯的優(yōu)于趨勢(shì)面分析,泛克里格插值結(jié)果比普通克里格方法要更好一些。

7.9.3.3協(xié)同克里格方法

通常同一個(gè)樣點(diǎn)有多個(gè)屬性值,某一屬性的空間分布經(jīng)常與其它屬性密切相關(guān),因?yàn)樗鼈兪芡瑯拥膮^(qū)域化現(xiàn)象或空間過(guò)程的影響,這些屬性就稱為協(xié)同區(qū)域化屬性。某些屬性Z2測(cè)定可能比較昂貴,所以數(shù)據(jù)點(diǎn)較稀,而另一些Z1則易于獲得因而觀測(cè)值較多。如果Z1和Z2空間相關(guān),那么就可以利用Z1的空間變異信息獲取Z2的分布狀況。除了描述各自非結(jié)構(gòu)性變異之外,協(xié)同克里格還需要分析兩個(gè)變量的聯(lián)合交叉變異。兩個(gè)變量Z1,Z2的協(xié)同區(qū)域化可以用它們的交叉半方差函數(shù)(cross-semivariogram)來(lái)表示:其中,n(h)是以距離間隔h內(nèi)的樣本數(shù)目。協(xié)同區(qū)域化屬性的空間相關(guān)性也可以用交叉相關(guān)函數(shù)來(lái)確定。交叉方差可以是正值,也可以是負(fù)值,依Z1和Z2的相關(guān)關(guān)系而定。

協(xié)同克里格法把區(qū)域化變量理論的最佳估值方法從單一屬性發(fā)展到二個(gè)以上的協(xié)同區(qū)域化屬性。當(dāng)某一屬性由于各種原因無(wú)法充分采樣時(shí),協(xié)同克里格法可以利用它與另一個(gè)采樣多的變量之間的空間相關(guān)性,有效地提供具有一定精度的估值。協(xié)同克里格在計(jì)算中要用到Z1,Z2各自的半方差函數(shù)和交叉半方差函數(shù),計(jì)算比較復(fù)雜。

協(xié)同克里格既可用于點(diǎn)估值,也可用于塊段估值。如果變量的空間模式與常見(jiàn)的物理過(guò)程相聯(lián)系,協(xié)同克里格法最為成功。例如,Leenaersetal(1989)在荷蘭南北Geul河沖積平原表土重金屬(Cd,Pb和Zn)含量分布的制圖中,使用了協(xié)同克里格方法。因?yàn)槲廴疚锟偸俏接诰徛两档募?xì)顆粒,重金屬污染會(huì)在長(zhǎng)期停留的地方富集。結(jié)果發(fā)現(xiàn),沖積平原中泛濫河水停留時(shí)間最長(zhǎng)的地方重金屬含量最高,表明該區(qū)域相對(duì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論