地理數(shù)據(jù)及其采集與處理課件_第1頁
地理數(shù)據(jù)及其采集與處理課件_第2頁
地理數(shù)據(jù)及其采集與處理課件_第3頁
地理數(shù)據(jù)及其采集與處理課件_第4頁
地理數(shù)據(jù)及其采集與處理課件_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章地理數(shù)據(jù)及其

采集與預處理第二章地理數(shù)據(jù)及其

采集與預處理1本章主要內容:

地理數(shù)據(jù)的類型地理數(shù)據(jù)的基本特征地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的統(tǒng)計處理地理數(shù)據(jù)分布的集中化與均衡度指數(shù)

本章主要內容:地理數(shù)據(jù)的類型2第一節(jié)地理數(shù)據(jù)的類型空間數(shù)據(jù):用于描述地理實體、地理要素、地理現(xiàn)象、地理事件及地理過程產(chǎn)生、存在和發(fā)展的地理位置、區(qū)域范圍及空間聯(lián)系。屬性數(shù)據(jù):用于描述地理實體、地理要素、地理現(xiàn)象、地理事件、地理過程的有關屬性特征。兩個概念:第一節(jié)地理數(shù)據(jù)的類型空間數(shù)據(jù):用于描述地理實體、地理要素3一、空間數(shù)據(jù)的表達點——由一個獨立的坐標點(x,y)定位,是空間上不可再分的幾何實體。線——由若干個(至少兩個,理論上是無窮個)坐標點(xi,yi)(i=1,2,…)定義,有一定的長度和走向,表示線狀地物或點實體之間的聯(lián)系。面——表示在空間上連續(xù)分布的地理景觀或區(qū)域。點、線、面之間的拓撲關系。

一、空間數(shù)據(jù)的表達點——由一個獨立的坐標點(x,y)定位,是4三種基本的地理幾何實體及其組合點線面地域類型網(wǎng)絡地帶區(qū)域圖2.1.1三種基本的地理幾何實體及其組合

三種基本的地理幾何實體及其組合點線面地域類型網(wǎng)絡地帶區(qū)域圖25二、屬性數(shù)據(jù)的類型

數(shù)量標志數(shù)據(jù)①間隔尺度數(shù)據(jù):以有量綱的數(shù)據(jù)形式表示測度對象在某種單位(量綱)下的絕對量。②比例尺度數(shù)據(jù):以無量綱的數(shù)據(jù)形式表示測度對象的相對量。

二、屬性數(shù)據(jù)的類型數(shù)量標志數(shù)據(jù)6品質標志數(shù)據(jù)①有序數(shù)據(jù):當測度標準不是連續(xù)的量,只是表示其順序關系的數(shù)據(jù)。②二元數(shù)據(jù):用0、1兩個數(shù)據(jù)表示地理事物、地理現(xiàn)象或地理事件的是非判斷問題。③名義尺度數(shù)據(jù):用數(shù)字表示地理實體、地理要素、地理現(xiàn)象或地理事件的狀態(tài)類型。品質標志數(shù)據(jù)7幾種屬性數(shù)據(jù)舉例:年平均氣溫(°C)年降水量(mm)土地面積(ha)人口(人)國內生產(chǎn)總值(萬元)區(qū)域18.0500.2245.612102678.28區(qū)域27.6498.61064.10232015.47區(qū)域36.5550.9894.38481754.56區(qū)域38.5586.4668.76541365.46表2.1.1間隔尺度數(shù)據(jù)間隔尺度數(shù)據(jù)幾種屬性數(shù)據(jù)舉例:年平均氣溫(°C)年降水量土地面積人口國8比例尺度數(shù)據(jù)年

份19961997199819992000耕地復種指數(shù)120.40113.56126.54132.76121.43農(nóng)業(yè)發(fā)展指數(shù)100115.68124.50135.69129.56表2.1.2某地區(qū)耕地復種指數(shù)和農(nóng)業(yè)發(fā)展指數(shù)比例尺度數(shù)據(jù)年份199619971998199929有序尺度數(shù)據(jù)城市A城市B城市C城市D城市E城市F規(guī)模等級123443人口位次124653表2.1.3城市等規(guī)模等級與人口數(shù)量的排位次序

有序尺度數(shù)據(jù)城市A城市B城市C城市D城市E城市F規(guī)模等級1210

二元數(shù)據(jù)

城市A城市B城市C城市D城市E城市A—1101城市B1—110城市C11—10城市D011—1城市E1001—表2.1.4二元數(shù)據(jù)其中:1表示兩城市之間通航

0表示兩城市之間不通航二元數(shù)據(jù)

城市A城市B城市C城市D城市E城市A—1101城11名義尺度數(shù)據(jù)地塊序列號123456土地利用類型131521141431表2.1.5土地利用類型名義尺度數(shù)據(jù)地塊序列號123456土地利用類型131512第二節(jié)地理數(shù)據(jù)的基本特征

數(shù)量化、形式化與邏輯化不確定性多種時空尺度多維性第二節(jié)地理數(shù)據(jù)的基本特征數(shù)量化、形式化與邏輯化13一、數(shù)量化、形式化與邏輯化定量化的地理數(shù)據(jù)是建立地理數(shù)學模型的基礎,其作用為:①確定模型的參數(shù)、給定模型運行的初值條件;②檢驗模型的有效性。形式化、邏輯化與數(shù)量化,是所有地理數(shù)據(jù)的共同特征。地理計算學,對于地理數(shù)據(jù)的形式化、邏輯化提出了更高的要求,要求“整體”和“大容量”的地理數(shù)據(jù)具有統(tǒng)一的數(shù)據(jù)形式和交換標準。一、數(shù)量化、形式化與邏輯化定量化的地理數(shù)據(jù)是建立地理數(shù)學模型14不確定性是地理數(shù)據(jù)的基本特征之一。地理數(shù)據(jù)不確定性的來源:地理系統(tǒng)本身的復雜性從本質上決定著地理數(shù)據(jù)的不確定性。各種原因所導致的數(shù)據(jù)誤差。二、不確定性不確定性是地理數(shù)據(jù)的基本特征之一。地理數(shù)據(jù)不確定性的15三、地理數(shù)據(jù)的多時空尺度:從空間尺度上來看,描述地理區(qū)域的各種地理數(shù)據(jù),具有多種空間尺度—既有全球尺度的、洲際尺度的、國家尺度的,也有流域尺度的、地區(qū)尺度的、城市尺度的、社區(qū)尺度的。從時間尺度上來看,描述地理過程的各種地理數(shù)據(jù)具有多種時間尺度,如歷史年代、天、月、季度、年等。

三、地理數(shù)據(jù)的多時空尺度:從空間尺度上來看,描述地理區(qū)域的各16四、多維性

對于一個地理對象的具體意義要從空間、屬性、時間三個方面綜合描述。

空間方面,描述該地理對象所處的地理位置和空間范圍,一般需要2~3個變量;屬性方面,描述該地理對象的具體內容,至少需要1個以上,多則需要十幾個、甚至幾十個變量;四、多維性對于一個地理對象的具體意義17時間方面,描述該地理對象產(chǎn)生、發(fā)展和存在的時間范圍,需要1個變量;地理數(shù)據(jù)的這種多維性,被人們描述為地理數(shù)據(jù)立方體(TheGeographicalDataCube)。時間方面,描述該地理對象產(chǎn)生、發(fā)展和存在的時間范圍,需要118地理數(shù)據(jù)立方體1,2,…m區(qū)域

要素1,2,3,……,nt1t2…tk時間圖2.2.1地理數(shù)據(jù)立方體

地理數(shù)據(jù)立方體1,2,…m區(qū)要素1,2,3,……,nt1t219第三節(jié)地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集地理數(shù)據(jù)處理第三節(jié)地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集20一、地理數(shù)據(jù)的采集

地理數(shù)據(jù)的渠道來源:(1)來自于觀測、測量部門的有關專業(yè)數(shù)據(jù)。(2)來自于統(tǒng)計年鑒、統(tǒng)計公報中的有關自然資源及社會經(jīng)濟發(fā)展數(shù)據(jù)。(3)來自于有關單位或個人的不定期的典型調查數(shù)據(jù)、抽樣調查數(shù)據(jù)。(4)來自于政府公報、政府文件中的有關數(shù)據(jù)。一、地理數(shù)據(jù)的采集地理數(shù)據(jù)的渠道來源:21(5)來自于檔案、圖書等文獻資料中的有關數(shù)據(jù)。(6)來自于互聯(lián)網(wǎng)(Internet)的有關共享數(shù)據(jù)。(7)地圖圖件。主要包括各種比例尺的地形圖、影像地圖、專題地圖等。(8)遙感數(shù)據(jù)。主要包括各種航空遙感數(shù)據(jù)和衛(wèi)星遙感數(shù)據(jù)。(9)其它來源的有關數(shù)據(jù)。(5)來自于檔案、圖書等文獻資料中的有關數(shù)據(jù)。22采集地理數(shù)據(jù)的過程中需要注意的問題:

(1)數(shù)據(jù)的完備性和可靠性。(2)在數(shù)據(jù)采集過程中,最大限度地減小數(shù)據(jù)的誤差。(3)在數(shù)據(jù)采集完畢后,進行檢驗,進行比較、辨別真?zhèn)?,通過數(shù)據(jù)篩選,去粗存精、去偽存真。采集地理數(shù)據(jù)的過程中需要注意的問題:(1)數(shù)據(jù)的完備性和可23二、地理數(shù)據(jù)處理

地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)。從理論上講,在地理學中,數(shù)學方法的運用主要有兩個目的:(1)運用數(shù)學語言對地理問題的描述,建立地理數(shù)學模型,從更高、更深層次上揭示地理問題的機理;(2)運用有關數(shù)學方法,通過定量化的計算和分析,對地理數(shù)據(jù)進行處理,從而揭示有關地理現(xiàn)象的內在規(guī)律。因此,從一定意義上來說,地理數(shù)據(jù)處理也是計量地理學的任務之一。二、地理數(shù)據(jù)處理地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)24地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它實現(xiàn)了空間數(shù)據(jù)與屬性數(shù)據(jù)的完美結合。數(shù)學方法確是其強有力支撐。地理計算學(Geocomputation)的實質是借助于現(xiàn)代化的計算理論、計算方法和計算技術,通過對“整體”和“大容量”的地理數(shù)據(jù)進行處理,揭示復雜地理系統(tǒng)的運行機制,探索和尋求新的地理系統(tǒng)理論。地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它實現(xiàn)了空間數(shù)據(jù)與屬性25地理數(shù)據(jù)的采集、處理及其與數(shù)學方法、地理信息系統(tǒng)、地理計算學之間的相互關系圖:

地理數(shù)據(jù)的數(shù)據(jù)源地理數(shù)據(jù)采集數(shù)學方法GISGeocomputation地理處理數(shù)據(jù)圖2.3.1地理數(shù)據(jù)采集與處理

地理數(shù)據(jù)的采集、處理及其與數(shù)學方法、地理信息系統(tǒng)、地理計算學26第四節(jié)地理數(shù)據(jù)的統(tǒng)計處理統(tǒng)計整理幾種常用的統(tǒng)計指標與參數(shù)變異系數(shù)的一個應用實例:中國經(jīng)濟發(fā)展水平的省際差異分析第四節(jié)地理數(shù)據(jù)的統(tǒng)計處理統(tǒng)計整理27一、統(tǒng)計整理統(tǒng)計整理的基本步驟:(1)統(tǒng)計分組所謂統(tǒng)計分組,就是根據(jù)研究目的,按照一定的分組標志將地理數(shù)據(jù)分成若干組。(2)計算各組數(shù)據(jù)的頻數(shù)、頻率,編制統(tǒng)計分組表。(3)作分布圖。一、統(tǒng)計整理統(tǒng)計整理的基本步驟:28例:對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調查數(shù)據(jù),步驟如下:以地塊面積作為統(tǒng)計分組標志進行分組;計算各組數(shù)據(jù)的頻數(shù)、頻率,編制成如下的統(tǒng)計分組表;例:對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調查數(shù)據(jù),步驟如29分組序號1234567891011分組標志(0,1](1,2](2,3](3,4](4,5](5,6](6,7](7,8](8,9](9,10](10,11)組中值0.51.52.53.54.55.56.57.58.59.510.5頻數(shù)25961362142532862602031548524頻率1.445.537.8312.3314.5716.4714.9811.698.874.901.38向上累計頻數(shù)25121257471724101012701473162717121736向下累計頻數(shù)17361711161514791265101272646626310924表2.4.1某縣人工造林地面積的統(tǒng)計分組數(shù)據(jù)

分組序號1234567891011分組標志(0,1](1,30做出頻數(shù)分布的直方圖:圖2.4.1頻數(shù)分布柱狀圖做出頻數(shù)分布的直方圖:圖2.4.1頻數(shù)分布柱狀圖31將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布的曲線圖:圖2.4.2頻數(shù)分布曲線圖

將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布32二、幾種常用的統(tǒng)計指標與參數(shù)描述地理數(shù)據(jù)一般水平的指標描述地理數(shù)據(jù)分布的離散程度的指標描述地理數(shù)據(jù)分布特征的參數(shù)二、幾種常用的統(tǒng)計指標與參數(shù)描述地理數(shù)據(jù)一般水平的指標33(一)描述地理數(shù)據(jù)一般水平的指標平均值,反映了地理數(shù)據(jù)一般水平。計算方法:

①未分組的地理數(shù)據(jù)

②分組的地理數(shù)據(jù)

(2.4.1)(2.4.2)(一)描述地理數(shù)據(jù)一般水平的指標平均值,反映了地理數(shù)據(jù)一般34中位數(shù)

①對于未分組的地理數(shù)據(jù),樣本數(shù)n為奇數(shù)時,中位數(shù)是位置排在第(n+1)/2位的數(shù)據(jù);樣本數(shù)n為偶數(shù)時,中位數(shù)是排在中間位置的兩個數(shù)據(jù)的平均值。②分組的地理數(shù)據(jù),中位數(shù)的計算方法:確定中位數(shù)所在的組位置,按下述公式計算中位數(shù):

或(2.4.3)(2.4.4)中位數(shù)或(2.4.3)(2.4.4)35在式(2.4.3)和(2.4.4)中,Me代表中位數(shù);L為中位數(shù)所在組的下限值;U為中位數(shù)所在組的上限值;fm為中位數(shù)所在組的頻數(shù);Sm-1為中位數(shù)所在組以下的累計頻數(shù);Sm+1為中位數(shù)所在組以上的累計頻數(shù);d為中位數(shù)所在組的組距。在式(2.4.3)和(2.4.4)中,36眾數(shù):眾數(shù)就是出現(xiàn)頻數(shù)最多的那個數(shù),計算方法分為以下兩種情況:①未分組的地理數(shù)據(jù),可以根據(jù)每一個數(shù)據(jù)出現(xiàn)的頻數(shù)大小直接確定眾數(shù)。②對于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計算步驟如下:a.確定頻數(shù)最多的組為眾數(shù)所在組。b.按以下公式計算眾數(shù):

或(2.4.5)(2.4.6)眾數(shù):眾數(shù)就是出現(xiàn)頻數(shù)最多的那個數(shù),計算方法分為以下兩種情況37在式(2.4.5)和(2.4.6)中,M0代表眾數(shù);L為眾數(shù)所在組的下限值;U為眾數(shù)所在組的上限值;?1為眾數(shù)組頻數(shù)與下一組頻數(shù)之差;?2為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;d為眾數(shù)所在組的組距。在式(2.4.5)和(2.4.6)中,38例1:下表給出了某農(nóng)場各農(nóng)田地塊的面積,試計算其平均值、中位數(shù)和眾數(shù)。

地塊編號

123456789101112平均值中位數(shù)眾數(shù)面積(ha)

12835035555072408529657554.2552.550應按照未分組數(shù)據(jù)計算其平均值、中位數(shù)和眾數(shù),計算結果見上表最后三列。

表2.4.2某農(nóng)場各農(nóng)田地塊的面積(單位:ha)例1:下表給出了某農(nóng)場各農(nóng)田地塊的面積,試計算其平均值、中位39例2:下表給出了中國西部地區(qū)某城市2000年家庭月收入的抽樣調查結果,試計算其平均值、中位數(shù)和眾數(shù)。家庭月收入分組(元)戶數(shù)向上累計頻數(shù)向下累計頻數(shù)2000~300030030021303000~40001300160018304000~500020018005305000~600015019503306000~700010020501807000~8000502100808000~900030213030合

計2130——表2.4.3中國西部地區(qū)某城市2000年家庭月收入的抽樣調查結果(單位:元)

例2:下表給出了中國西部地區(qū)某城市2000年家庭月收入的抽樣40解題步驟:用公式(2.4.2)計算平均數(shù):

計算中位數(shù)。先確定中位數(shù)所在組的位置,再按照公式(2.4.3)或者(2.4.4)計算中位數(shù)。

Me=3588.46(元)=3899.06(元)解題步驟:=3899.06(元)41計算眾數(shù)。先確定眾數(shù)所在組,再按照公式(2.4.5)或(2.4.6)計算眾數(shù)。顯然,眾數(shù)所在組應該在第二組。眾數(shù)M0

=3476.19(元)。計算眾數(shù)。先確定眾數(shù)所在組,再按照公式(2.4.5)或(2.42(二)描述地理數(shù)據(jù)分布的離散程度的指標

極差,指所有數(shù)據(jù)中最大值與最小值之差:離差,指每一個地理數(shù)據(jù)與平均值的差,計算公式為:離差平方和。它從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度,其計算公式為:

(2.4.9)(2.4.8)

(2.4.7)(二)描述地理數(shù)據(jù)分布的離散程度的指標

極差,指所有數(shù)據(jù)中最43方差與標準差,從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度。方差計算公式為:

標準差為方差的平方根,計算公式為:(2.4.10)(2.4.11)

方差與標準差,從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度。44如果以樣本方差對標準差進行無偏估計,則計算公式為:(2.4.12)如果以樣本方差對標準差進行無偏估計,則計算公式為:45變異系數(shù),表示了地理數(shù)據(jù)的相對變化(波動)程度,其計算公式:(2.4.13)(2.4.13)46例如:對于下表中的數(shù)據(jù),分別計算極差、離差、離差平方和、方差、標準差、標準差的無偏估計,以及變異系數(shù)。

地塊編號

123456789101112平均值中位數(shù)眾數(shù)面積(ha)

12835035555072408529657554.2552.550表2.4.2某農(nóng)場各農(nóng)田地塊的面積(單位:ha)例如:對于下表中的數(shù)據(jù),分別計算極差、離差、離差平方和、方差47步驟:按照公式(2.4.7)計算極差:按照公式(2.4.8)計算離差,結果見下表。

序號123456789101112面積128350355550724085296575離差-42.2528.75-4.25-19.250.75-4.2517.75-14.2530.75-25.2510.7520.75表2.4.4地理數(shù)據(jù)的離差步驟:序號123456789101112面積128350348按照公式(2.4.9)計算離差平方和:按照公式(2.4.10)計算方差:

按照公式(2.4.11)計算標準差:按照公式(2.4.12)計算標準差的無偏估計:按照公式(2.4.13)計算變異系數(shù):

按照公式(2.4.9)計算離差平方和:49(三)描述地理數(shù)據(jù)分布特征的參數(shù)

偏度系數(shù),測度地理數(shù)據(jù)分布的不對稱性情況,刻畫以平均值為中心的偏向情況,計算公式為:

g1<0,表示負偏,即均值在峰值的左邊;g1>0,表示正偏,即均值在峰值的右邊;g1=0,表示對稱分布(如下圖)。

(2.4.14)(三)描述地理數(shù)據(jù)分布特征的參數(shù)偏度系數(shù),測度地理數(shù)據(jù)分布50圖2.4.3偏度系數(shù)的三種情形圖2.4.3偏度系數(shù)的三種情形51峰度系數(shù)。它測度了地理數(shù)據(jù)在均值附近的集中程度,其計算公式為標準正態(tài)分布的峰度系數(shù)g2=0;g2>0,表示地理數(shù)據(jù)分布的集中程度高于正態(tài)分布;g2<0,表示地理數(shù)據(jù)分布的集中程度低于正態(tài)分布(見下圖)。

g2>0g2=0g2<0圖2.4.4標準峰度系數(shù)的三種情形(2.4.15)g2>0g2=0g2<0圖2.4.4標準峰度系數(shù)的三種52三、應用實例:中國大陸省份人均GDP的變異系數(shù)

我們知道變異系數(shù)測度的是地理數(shù)據(jù)分布的相對差異。為了分析中國大陸經(jīng)濟發(fā)展的省際差異及其演化過程,我們首先把1978-2002年各?。ㄖ陛犑?、自治區(qū))的GDP數(shù),按照可比價格進行折算,再除以人口數(shù),計算出按照可比價衡量的人均GDP數(shù)據(jù),然后再用公式(2.4.13)式計算變異系數(shù),結果如下圖。三、應用實例:中國大陸省份人均GDP的變異系數(shù)53圖2.4.51978—2002年中國大陸省份人均GDP的變異系數(shù)

圖2.4.51978—2002年中國大陸省份人均GDP的變54從圖中可以看出,在1978-2002年期間,人均GDP的變異系數(shù),以1990年為轉折點,呈現(xiàn)出一個U形曲線。即:人均GDP的變異系數(shù),在1978-1990年期間基本上呈現(xiàn)下降趨勢,而在1990-2002年期間則基本上呈現(xiàn)上升趨勢。這說明,在1978-1990年期間,中國大陸經(jīng)濟發(fā)展的省際差異,基本上呈縮小趨勢,而1990-2001年期間則基本上呈擴大趨勢。這一變化與國家宏觀經(jīng)濟政策變動的時間、趨勢大體一致。

從圖中可以看出,在1978-2002年期間,人均GDP的變異55第五節(jié)地理數(shù)據(jù)分布的集中化

與均衡度指數(shù)

羅倫次曲線與集中化指數(shù)基尼系數(shù)錫爾系數(shù)第五節(jié)地理數(shù)據(jù)分布的集中化

與均衡度指數(shù)羅倫次曲線與集中56(一)羅倫次曲線20世紀初,意大利統(tǒng)計學家羅倫次(M.Lorenz),首先使用累計頻率曲線研究工業(yè)化的集中化程度。后來,這種曲線就被稱之為羅倫次曲線。

一、羅倫次曲線與集中化指數(shù)(一)羅倫次曲線20世紀初,意大利統(tǒng)計學家羅倫次(M.Lo57繪制羅倫次曲線實例:

(1)將表2.5.1各產(chǎn)業(yè)部門的收入及其占總收入比重(百分比),從大到小重新排序;(2)從大到小,逐次計算累計百分比;(3)以自然序號為橫坐標(x),累計百分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線(圖2.5.1和圖2.5.2),即羅倫次曲線。繪制羅倫次曲線實例:(1)將表2.5.1各產(chǎn)業(yè)部門的收入及58表2.5.1某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構成

表2.5.1某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構成59圖2.5.11999年農(nóng)戶家庭經(jīng)

營性純收入構成的羅倫次曲線圖2.5.22004年農(nóng)戶家庭經(jīng)營性純收入構成的羅倫次曲線

圖2.5.11999年農(nóng)戶家庭經(jīng)

營性純收入構成的羅倫60結果分析:羅倫次曲線的上凸程度,表示農(nóng)戶家庭經(jīng)營性純收入的部門集中化程度。上凸程度越大,就表示農(nóng)戶家庭經(jīng)營性純收入越是集中于某些產(chǎn)業(yè)部門。如果各個產(chǎn)業(yè)部門的收入是均等的,則羅倫次曲線正好就變成了正方形的對角線。比較圖2.5.1和圖2.5.2,可以看出該地區(qū)1999年農(nóng)戶家庭經(jīng)營性純收入的部門集中化程度高于2004年。

結果分析:羅倫次曲線的上凸程度,表示農(nóng)戶家庭經(jīng)營性純收入的部61(二)集中化指數(shù)集中化指數(shù),是一個描述地理數(shù)據(jù)分布的集中化程度的指數(shù)。

假若羅倫次曲線的解析式為:顯然,該曲線下方區(qū)域的面積為:當數(shù)據(jù)均勻分布時,A就變成了對角線以下三角形的面積(R);當數(shù)據(jù)集中于一點時,A就變成了整個正方形的面積(M)。(2.5.3)(二)集中化指數(shù)集中化指數(shù),是一個描述地理數(shù)據(jù)分布的集中化程62顯然,I越大,就說明數(shù)據(jù)分布的集中化程度越高;反之,I越小,就說明數(shù)據(jù)分布的集中化程度越低(越均衡)。常采用如下近似取值方法:A——實際數(shù)據(jù)的累計百分比總和R——均勻分布時的累計百分比總和M——集中分布時的累計百分比總和

集中化指數(shù)在[0,1]區(qū)間上取值。只有數(shù)據(jù)的個數(shù)相同而且橫坐標劃分一致時,才有可比性。

顯然,I越大,就說明數(shù)據(jù)分布的集中化程度越高;反之,I越小,63二、基尼系數(shù)

基尼系數(shù)(Ginicoefficient),就是通過兩組數(shù)據(jù)的對比分析,縱、橫坐標均以累計百分比表示,從而做出羅倫次曲線,然后再計算得出的集中化指數(shù)。它是通過對人口和收入兩組數(shù)據(jù)進行比較分析,然后將縱、橫坐標均以累計百分比表示,作出羅倫次曲線,再計算集中化指數(shù)而得到的一個判斷收入分配不平等程度的指標。二、基尼系數(shù)基尼系數(shù)(Ginicoefficient),64其原理方法如下:列出每一個區(qū)域(部門)的人口與收入占全區(qū)(各部門總計)的比重p與w;計算每一區(qū)域(部門)的比率w/p;根據(jù)w/p值,由小到大將每一地區(qū)(部門)排序;按照上述順序分別計算p和w的累計值X和Y;以X為橫坐標,以Y為縱坐標,在直角坐標系中依次連接各點,得到一條下凸的羅倫次曲線。其原理方法如下:列出每一個區(qū)域(部門)的人口與收入占全區(qū)(各65基尼系數(shù)(G)就可以按照如下公式計算:

假若羅倫次曲線的解析式為:顯然,該曲線下方區(qū)域的面積為:對應于絕對均衡分布,其羅倫次曲線就是正方形的對角線,其下方區(qū)域的面積為R=1/2。(2.5.6)基尼系數(shù)(G)就可以按照如下公式計算:假若羅倫次曲線的66根據(jù)中國大陸1978-2002年各?。ㄖ陛犑小⒆灾螀^(qū))的人口數(shù)和按照可比價格折算的GDP數(shù)據(jù),計算基尼系數(shù),結果如下圖??梢钥闯?,在1978-1990年期間,基尼系數(shù)雖然出現(xiàn)過幾次上升和下降的微小波動,但基本趨勢是緩慢地下降的;而在1991-2002年期間,基本上呈現(xiàn)上升趨勢。這一結論,與上節(jié)計算的加權變異系數(shù)是相互印證的。

根據(jù)中國大陸1978-2002年各?。ㄖ陛犑小⒆灾螀^(qū))的人口67圖2.5.41978—2002年中國大陸省際收入差異的基尼系數(shù)

圖2.5.41978—2002年中國大陸省際收入差異的基68三、錫爾系數(shù)

基尼系數(shù)(Ginicoefficient),用于對經(jīng)濟發(fā)展、收入分配等均衡(不均衡)狀況,進行定量化的描述。錫爾系數(shù)又稱錫爾熵,有兩個錫爾系數(shù)指標,即錫爾系數(shù)T和錫爾系數(shù)L。兩者的不同之處在于錫爾系數(shù)T以收入比重加權計算,而錫爾系數(shù)L則以人口比重加權計算。三、錫爾系數(shù)基尼系數(shù)(Ginicoefficient),69如果以人口比重加權,錫爾系數(shù)L的計算公式為:

式中:n為區(qū)域(部門)個數(shù);為地區(qū)(部門)收入占全區(qū)(各部門總計)的份額;為i地區(qū)(部門)的人口占全區(qū)(各部門總計)的份額。

(2.5.9)如果以人口比重加權,錫爾系數(shù)L的計算公式為:式中:(270如果以收入比重加權,則錫爾系數(shù)T的計算公式為:錫爾系數(shù)越大,就表示收入分配差異越大;反之,錫爾系數(shù)越小,就表示收入分配越均衡。(2.5.10)如果以收入比重加權,則錫爾系數(shù)T的計算公式為:錫爾系數(shù)越71根據(jù)各?。ㄖ陛犑小⒆灾螀^(qū))的人口和按照可比價格折算的GDP數(shù)據(jù),計算1978—2002年中國大陸省際差異的錫爾系數(shù)T值,結果如下圖所示??梢钥闯觯?978—1990年期間,錫爾系數(shù)雖然有微小波動,但基本上呈下降趨勢;而在1991—2002年期間,基本上呈顯出上升趨勢。這一結論,與前面計算出的基尼系數(shù)也是相互印證的。

根據(jù)各省(直轄市、自治區(qū))的人口和按照可比價格折算的GDP數(shù)72圖2.5.51978-2002年中國大陸省際收入差異的錫爾系數(shù)圖2.5.51978-2002年中國大陸省際收入差異的錫73作業(yè):

對于下表中的數(shù)據(jù),分別計算平均值、中位數(shù)、眾數(shù)、極差、離差、離差平方和、方差、標準差、標準差的無偏估計,以及變異系數(shù)。(上交的作業(yè)包括:程序+結果)作業(yè):對于下表中的數(shù)據(jù),分別計算平均值、中位數(shù)74第二章地理數(shù)據(jù)及其

采集與預處理第二章地理數(shù)據(jù)及其

采集與預處理75本章主要內容:

地理數(shù)據(jù)的類型地理數(shù)據(jù)的基本特征地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的統(tǒng)計處理地理數(shù)據(jù)分布的集中化與均衡度指數(shù)

本章主要內容:地理數(shù)據(jù)的類型76第一節(jié)地理數(shù)據(jù)的類型空間數(shù)據(jù):用于描述地理實體、地理要素、地理現(xiàn)象、地理事件及地理過程產(chǎn)生、存在和發(fā)展的地理位置、區(qū)域范圍及空間聯(lián)系。屬性數(shù)據(jù):用于描述地理實體、地理要素、地理現(xiàn)象、地理事件、地理過程的有關屬性特征。兩個概念:第一節(jié)地理數(shù)據(jù)的類型空間數(shù)據(jù):用于描述地理實體、地理要素77一、空間數(shù)據(jù)的表達點——由一個獨立的坐標點(x,y)定位,是空間上不可再分的幾何實體。線——由若干個(至少兩個,理論上是無窮個)坐標點(xi,yi)(i=1,2,…)定義,有一定的長度和走向,表示線狀地物或點實體之間的聯(lián)系。面——表示在空間上連續(xù)分布的地理景觀或區(qū)域。點、線、面之間的拓撲關系。

一、空間數(shù)據(jù)的表達點——由一個獨立的坐標點(x,y)定位,是78三種基本的地理幾何實體及其組合點線面地域類型網(wǎng)絡地帶區(qū)域圖2.1.1三種基本的地理幾何實體及其組合

三種基本的地理幾何實體及其組合點線面地域類型網(wǎng)絡地帶區(qū)域圖279二、屬性數(shù)據(jù)的類型

數(shù)量標志數(shù)據(jù)①間隔尺度數(shù)據(jù):以有量綱的數(shù)據(jù)形式表示測度對象在某種單位(量綱)下的絕對量。②比例尺度數(shù)據(jù):以無量綱的數(shù)據(jù)形式表示測度對象的相對量。

二、屬性數(shù)據(jù)的類型數(shù)量標志數(shù)據(jù)80品質標志數(shù)據(jù)①有序數(shù)據(jù):當測度標準不是連續(xù)的量,只是表示其順序關系的數(shù)據(jù)。②二元數(shù)據(jù):用0、1兩個數(shù)據(jù)表示地理事物、地理現(xiàn)象或地理事件的是非判斷問題。③名義尺度數(shù)據(jù):用數(shù)字表示地理實體、地理要素、地理現(xiàn)象或地理事件的狀態(tài)類型。品質標志數(shù)據(jù)81幾種屬性數(shù)據(jù)舉例:年平均氣溫(°C)年降水量(mm)土地面積(ha)人口(人)國內生產(chǎn)總值(萬元)區(qū)域18.0500.2245.612102678.28區(qū)域27.6498.61064.10232015.47區(qū)域36.5550.9894.38481754.56區(qū)域38.5586.4668.76541365.46表2.1.1間隔尺度數(shù)據(jù)間隔尺度數(shù)據(jù)幾種屬性數(shù)據(jù)舉例:年平均氣溫(°C)年降水量土地面積人口國82比例尺度數(shù)據(jù)年

份19961997199819992000耕地復種指數(shù)120.40113.56126.54132.76121.43農(nóng)業(yè)發(fā)展指數(shù)100115.68124.50135.69129.56表2.1.2某地區(qū)耕地復種指數(shù)和農(nóng)業(yè)發(fā)展指數(shù)比例尺度數(shù)據(jù)年份1996199719981999283有序尺度數(shù)據(jù)城市A城市B城市C城市D城市E城市F規(guī)模等級123443人口位次124653表2.1.3城市等規(guī)模等級與人口數(shù)量的排位次序

有序尺度數(shù)據(jù)城市A城市B城市C城市D城市E城市F規(guī)模等級1284

二元數(shù)據(jù)

城市A城市B城市C城市D城市E城市A—1101城市B1—110城市C11—10城市D011—1城市E1001—表2.1.4二元數(shù)據(jù)其中:1表示兩城市之間通航

0表示兩城市之間不通航二元數(shù)據(jù)

城市A城市B城市C城市D城市E城市A—1101城85名義尺度數(shù)據(jù)地塊序列號123456土地利用類型131521141431表2.1.5土地利用類型名義尺度數(shù)據(jù)地塊序列號123456土地利用類型131586第二節(jié)地理數(shù)據(jù)的基本特征

數(shù)量化、形式化與邏輯化不確定性多種時空尺度多維性第二節(jié)地理數(shù)據(jù)的基本特征數(shù)量化、形式化與邏輯化87一、數(shù)量化、形式化與邏輯化定量化的地理數(shù)據(jù)是建立地理數(shù)學模型的基礎,其作用為:①確定模型的參數(shù)、給定模型運行的初值條件;②檢驗模型的有效性。形式化、邏輯化與數(shù)量化,是所有地理數(shù)據(jù)的共同特征。地理計算學,對于地理數(shù)據(jù)的形式化、邏輯化提出了更高的要求,要求“整體”和“大容量”的地理數(shù)據(jù)具有統(tǒng)一的數(shù)據(jù)形式和交換標準。一、數(shù)量化、形式化與邏輯化定量化的地理數(shù)據(jù)是建立地理數(shù)學模型88不確定性是地理數(shù)據(jù)的基本特征之一。地理數(shù)據(jù)不確定性的來源:地理系統(tǒng)本身的復雜性從本質上決定著地理數(shù)據(jù)的不確定性。各種原因所導致的數(shù)據(jù)誤差。二、不確定性不確定性是地理數(shù)據(jù)的基本特征之一。地理數(shù)據(jù)不確定性的89三、地理數(shù)據(jù)的多時空尺度:從空間尺度上來看,描述地理區(qū)域的各種地理數(shù)據(jù),具有多種空間尺度—既有全球尺度的、洲際尺度的、國家尺度的,也有流域尺度的、地區(qū)尺度的、城市尺度的、社區(qū)尺度的。從時間尺度上來看,描述地理過程的各種地理數(shù)據(jù)具有多種時間尺度,如歷史年代、天、月、季度、年等。

三、地理數(shù)據(jù)的多時空尺度:從空間尺度上來看,描述地理區(qū)域的各90四、多維性

對于一個地理對象的具體意義要從空間、屬性、時間三個方面綜合描述。

空間方面,描述該地理對象所處的地理位置和空間范圍,一般需要2~3個變量;屬性方面,描述該地理對象的具體內容,至少需要1個以上,多則需要十幾個、甚至幾十個變量;四、多維性對于一個地理對象的具體意義91時間方面,描述該地理對象產(chǎn)生、發(fā)展和存在的時間范圍,需要1個變量;地理數(shù)據(jù)的這種多維性,被人們描述為地理數(shù)據(jù)立方體(TheGeographicalDataCube)。時間方面,描述該地理對象產(chǎn)生、發(fā)展和存在的時間范圍,需要192地理數(shù)據(jù)立方體1,2,…m區(qū)域

要素1,2,3,……,nt1t2…tk時間圖2.2.1地理數(shù)據(jù)立方體

地理數(shù)據(jù)立方體1,2,…m區(qū)要素1,2,3,……,nt1t293第三節(jié)地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集地理數(shù)據(jù)處理第三節(jié)地理數(shù)據(jù)的采集與處理地理數(shù)據(jù)的采集94一、地理數(shù)據(jù)的采集

地理數(shù)據(jù)的渠道來源:(1)來自于觀測、測量部門的有關專業(yè)數(shù)據(jù)。(2)來自于統(tǒng)計年鑒、統(tǒng)計公報中的有關自然資源及社會經(jīng)濟發(fā)展數(shù)據(jù)。(3)來自于有關單位或個人的不定期的典型調查數(shù)據(jù)、抽樣調查數(shù)據(jù)。(4)來自于政府公報、政府文件中的有關數(shù)據(jù)。一、地理數(shù)據(jù)的采集地理數(shù)據(jù)的渠道來源:95(5)來自于檔案、圖書等文獻資料中的有關數(shù)據(jù)。(6)來自于互聯(lián)網(wǎng)(Internet)的有關共享數(shù)據(jù)。(7)地圖圖件。主要包括各種比例尺的地形圖、影像地圖、專題地圖等。(8)遙感數(shù)據(jù)。主要包括各種航空遙感數(shù)據(jù)和衛(wèi)星遙感數(shù)據(jù)。(9)其它來源的有關數(shù)據(jù)。(5)來自于檔案、圖書等文獻資料中的有關數(shù)據(jù)。96采集地理數(shù)據(jù)的過程中需要注意的問題:

(1)數(shù)據(jù)的完備性和可靠性。(2)在數(shù)據(jù)采集過程中,最大限度地減小數(shù)據(jù)的誤差。(3)在數(shù)據(jù)采集完畢后,進行檢驗,進行比較、辨別真?zhèn)?,通過數(shù)據(jù)篩選,去粗存精、去偽存真。采集地理數(shù)據(jù)的過程中需要注意的問題:(1)數(shù)據(jù)的完備性和可97二、地理數(shù)據(jù)處理

地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)。從理論上講,在地理學中,數(shù)學方法的運用主要有兩個目的:(1)運用數(shù)學語言對地理問題的描述,建立地理數(shù)學模型,從更高、更深層次上揭示地理問題的機理;(2)運用有關數(shù)學方法,通過定量化的計算和分析,對地理數(shù)據(jù)進行處理,從而揭示有關地理現(xiàn)象的內在規(guī)律。因此,從一定意義上來說,地理數(shù)據(jù)處理也是計量地理學的任務之一。二、地理數(shù)據(jù)處理地理數(shù)據(jù)處理,是所有地理問題研究的核心環(huán)節(jié)98地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它實現(xiàn)了空間數(shù)據(jù)與屬性數(shù)據(jù)的完美結合。數(shù)學方法確是其強有力支撐。地理計算學(Geocomputation)的實質是借助于現(xiàn)代化的計算理論、計算方法和計算技術,通過對“整體”和“大容量”的地理數(shù)據(jù)進行處理,揭示復雜地理系統(tǒng)的運行機制,探索和尋求新的地理系統(tǒng)理論。地理信息系統(tǒng)的核心功能是地理數(shù)據(jù)處理,它實現(xiàn)了空間數(shù)據(jù)與屬性99地理數(shù)據(jù)的采集、處理及其與數(shù)學方法、地理信息系統(tǒng)、地理計算學之間的相互關系圖:

地理數(shù)據(jù)的數(shù)據(jù)源地理數(shù)據(jù)采集數(shù)學方法GISGeocomputation地理處理數(shù)據(jù)圖2.3.1地理數(shù)據(jù)采集與處理

地理數(shù)據(jù)的采集、處理及其與數(shù)學方法、地理信息系統(tǒng)、地理計算學100第四節(jié)地理數(shù)據(jù)的統(tǒng)計處理統(tǒng)計整理幾種常用的統(tǒng)計指標與參數(shù)變異系數(shù)的一個應用實例:中國經(jīng)濟發(fā)展水平的省際差異分析第四節(jié)地理數(shù)據(jù)的統(tǒng)計處理統(tǒng)計整理101一、統(tǒng)計整理統(tǒng)計整理的基本步驟:(1)統(tǒng)計分組所謂統(tǒng)計分組,就是根據(jù)研究目的,按照一定的分組標志將地理數(shù)據(jù)分成若干組。(2)計算各組數(shù)據(jù)的頻數(shù)、頻率,編制統(tǒng)計分組表。(3)作分布圖。一、統(tǒng)計整理統(tǒng)計整理的基本步驟:102例:對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調查數(shù)據(jù),步驟如下:以地塊面積作為統(tǒng)計分組標志進行分組;計算各組數(shù)據(jù)的頻數(shù)、頻率,編制成如下的統(tǒng)計分組表;例:對于黃土高原西部地區(qū)某山區(qū)縣的人工造林地調查數(shù)據(jù),步驟如103分組序號1234567891011分組標志(0,1](1,2](2,3](3,4](4,5](5,6](6,7](7,8](8,9](9,10](10,11)組中值0.51.52.53.54.55.56.57.58.59.510.5頻數(shù)25961362142532862602031548524頻率1.445.537.8312.3314.5716.4714.9811.698.874.901.38向上累計頻數(shù)25121257471724101012701473162717121736向下累計頻數(shù)17361711161514791265101272646626310924表2.4.1某縣人工造林地面積的統(tǒng)計分組數(shù)據(jù)

分組序號1234567891011分組標志(0,1](1,104做出頻數(shù)分布的直方圖:圖2.4.1頻數(shù)分布柱狀圖做出頻數(shù)分布的直方圖:圖2.4.1頻數(shù)分布柱狀圖105將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布的曲線圖:圖2.4.2頻數(shù)分布曲線圖

將上圖各組的頻數(shù)分布從組中值位置用折線連接起來,得到頻數(shù)分布106二、幾種常用的統(tǒng)計指標與參數(shù)描述地理數(shù)據(jù)一般水平的指標描述地理數(shù)據(jù)分布的離散程度的指標描述地理數(shù)據(jù)分布特征的參數(shù)二、幾種常用的統(tǒng)計指標與參數(shù)描述地理數(shù)據(jù)一般水平的指標107(一)描述地理數(shù)據(jù)一般水平的指標平均值,反映了地理數(shù)據(jù)一般水平。計算方法:

①未分組的地理數(shù)據(jù)

②分組的地理數(shù)據(jù)

(2.4.1)(2.4.2)(一)描述地理數(shù)據(jù)一般水平的指標平均值,反映了地理數(shù)據(jù)一般108中位數(shù)

①對于未分組的地理數(shù)據(jù),樣本數(shù)n為奇數(shù)時,中位數(shù)是位置排在第(n+1)/2位的數(shù)據(jù);樣本數(shù)n為偶數(shù)時,中位數(shù)是排在中間位置的兩個數(shù)據(jù)的平均值。②分組的地理數(shù)據(jù),中位數(shù)的計算方法:確定中位數(shù)所在的組位置,按下述公式計算中位數(shù):

或(2.4.3)(2.4.4)中位數(shù)或(2.4.3)(2.4.4)109在式(2.4.3)和(2.4.4)中,Me代表中位數(shù);L為中位數(shù)所在組的下限值;U為中位數(shù)所在組的上限值;fm為中位數(shù)所在組的頻數(shù);Sm-1為中位數(shù)所在組以下的累計頻數(shù);Sm+1為中位數(shù)所在組以上的累計頻數(shù);d為中位數(shù)所在組的組距。在式(2.4.3)和(2.4.4)中,110眾數(shù):眾數(shù)就是出現(xiàn)頻數(shù)最多的那個數(shù),計算方法分為以下兩種情況:①未分組的地理數(shù)據(jù),可以根據(jù)每一個數(shù)據(jù)出現(xiàn)的頻數(shù)大小直接確定眾數(shù)。②對于已經(jīng)分組的地理數(shù)據(jù),中位數(shù)的計算步驟如下:a.確定頻數(shù)最多的組為眾數(shù)所在組。b.按以下公式計算眾數(shù):

或(2.4.5)(2.4.6)眾數(shù):眾數(shù)就是出現(xiàn)頻數(shù)最多的那個數(shù),計算方法分為以下兩種情況111在式(2.4.5)和(2.4.6)中,M0代表眾數(shù);L為眾數(shù)所在組的下限值;U為眾數(shù)所在組的上限值;?1為眾數(shù)組頻數(shù)與下一組頻數(shù)之差;?2為眾數(shù)組頻數(shù)與上一組頻數(shù)之差;d為眾數(shù)所在組的組距。在式(2.4.5)和(2.4.6)中,112例1:下表給出了某農(nóng)場各農(nóng)田地塊的面積,試計算其平均值、中位數(shù)和眾數(shù)。

地塊編號

123456789101112平均值中位數(shù)眾數(shù)面積(ha)

12835035555072408529657554.2552.550應按照未分組數(shù)據(jù)計算其平均值、中位數(shù)和眾數(shù),計算結果見上表最后三列。

表2.4.2某農(nóng)場各農(nóng)田地塊的面積(單位:ha)例1:下表給出了某農(nóng)場各農(nóng)田地塊的面積,試計算其平均值、中位113例2:下表給出了中國西部地區(qū)某城市2000年家庭月收入的抽樣調查結果,試計算其平均值、中位數(shù)和眾數(shù)。家庭月收入分組(元)戶數(shù)向上累計頻數(shù)向下累計頻數(shù)2000~300030030021303000~40001300160018304000~500020018005305000~600015019503306000~700010020501807000~8000502100808000~900030213030合

計2130——表2.4.3中國西部地區(qū)某城市2000年家庭月收入的抽樣調查結果(單位:元)

例2:下表給出了中國西部地區(qū)某城市2000年家庭月收入的抽樣114解題步驟:用公式(2.4.2)計算平均數(shù):

計算中位數(shù)。先確定中位數(shù)所在組的位置,再按照公式(2.4.3)或者(2.4.4)計算中位數(shù)。

Me=3588.46(元)=3899.06(元)解題步驟:=3899.06(元)115計算眾數(shù)。先確定眾數(shù)所在組,再按照公式(2.4.5)或(2.4.6)計算眾數(shù)。顯然,眾數(shù)所在組應該在第二組。眾數(shù)M0

=3476.19(元)。計算眾數(shù)。先確定眾數(shù)所在組,再按照公式(2.4.5)或(2.116(二)描述地理數(shù)據(jù)分布的離散程度的指標

極差,指所有數(shù)據(jù)中最大值與最小值之差:離差,指每一個地理數(shù)據(jù)與平均值的差,計算公式為:離差平方和。它從總體上衡量一組地理數(shù)據(jù)與平均值的離散程度,其計算公式為:

(2.4.9)(2.4.8)

(2.4.7)(二)描述地理數(shù)據(jù)分布的離散程度的指標

極差,指所有數(shù)據(jù)中最117方差與標準差,從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度。方差計算公式為:

標準差為方差的平方根,計算公式為:(2.4.10)(2.4.11)

方差與標準差,從平均概況衡量一組地理數(shù)據(jù)與平均值的離散程度。118如果以樣本方差對標準差進行無偏估計,則計算公式為:(2.4.12)如果以樣本方差對標準差進行無偏估計,則計算公式為:119變異系數(shù),表示了地理數(shù)據(jù)的相對變化(波動)程度,其計算公式:(2.4.13)(2.4.13)120例如:對于下表中的數(shù)據(jù),分別計算極差、離差、離差平方和、方差、標準差、標準差的無偏估計,以及變異系數(shù)。

地塊編號

123456789101112平均值中位數(shù)眾數(shù)面積(ha)

12835035555072408529657554.2552.550表2.4.2某農(nóng)場各農(nóng)田地塊的面積(單位:ha)例如:對于下表中的數(shù)據(jù),分別計算極差、離差、離差平方和、方差121步驟:按照公式(2.4.7)計算極差:按照公式(2.4.8)計算離差,結果見下表。

序號123456789101112面積128350355550724085296575離差-42.2528.75-4.25-19.250.75-4.2517.75-14.2530.75-25.2510.7520.75表2.4.4地理數(shù)據(jù)的離差步驟:序號123456789101112面積1283503122按照公式(2.4.9)計算離差平方和:按照公式(2.4.10)計算方差:

按照公式(2.4.11)計算標準差:按照公式(2.4.12)計算標準差的無偏估計:按照公式(2.4.13)計算變異系數(shù):

按照公式(2.4.9)計算離差平方和:123(三)描述地理數(shù)據(jù)分布特征的參數(shù)

偏度系數(shù),測度地理數(shù)據(jù)分布的不對稱性情況,刻畫以平均值為中心的偏向情況,計算公式為:

g1<0,表示負偏,即均值在峰值的左邊;g1>0,表示正偏,即均值在峰值的右邊;g1=0,表示對稱分布(如下圖)。

(2.4.14)(三)描述地理數(shù)據(jù)分布特征的參數(shù)偏度系數(shù),測度地理數(shù)據(jù)分布124圖2.4.3偏度系數(shù)的三種情形圖2.4.3偏度系數(shù)的三種情形125峰度系數(shù)。它測度了地理數(shù)據(jù)在均值附近的集中程度,其計算公式為標準正態(tài)分布的峰度系數(shù)g2=0;g2>0,表示地理數(shù)據(jù)分布的集中程度高于正態(tài)分布;g2<0,表示地理數(shù)據(jù)分布的集中程度低于正態(tài)分布(見下圖)。

g2>0g2=0g2<0圖2.4.4標準峰度系數(shù)的三種情形(2.4.15)g2>0g2=0g2<0圖2.4.4標準峰度系數(shù)的三種126三、應用實例:中國大陸省份人均GDP的變異系數(shù)

我們知道變異系數(shù)測度的是地理數(shù)據(jù)分布的相對差異。為了分析中國大陸經(jīng)濟發(fā)展的省際差異及其演化過程,我們首先把1978-2002年各?。ㄖ陛犑?、自治區(qū))的GDP數(shù),按照可比價格進行折算,再除以人口數(shù),計算出按照可比價衡量的人均GDP數(shù)據(jù),然后再用公式(2.4.13)式計算變異系數(shù),結果如下圖。三、應用實例:中國大陸省份人均GDP的變異系數(shù)127圖2.4.51978—2002年中國大陸省份人均GDP的變異系數(shù)

圖2.4.51978—2002年中國大陸省份人均GDP的變128從圖中可以看出,在1978-2002年期間,人均GDP的變異系數(shù),以1990年為轉折點,呈現(xiàn)出一個U形曲線。即:人均GDP的變異系數(shù),在1978-1990年期間基本上呈現(xiàn)下降趨勢,而在1990-2002年期間則基本上呈現(xiàn)上升趨勢。這說明,在1978-1990年期間,中國大陸經(jīng)濟發(fā)展的省際差異,基本上呈縮小趨勢,而1990-2001年期間則基本上呈擴大趨勢。這一變化與國家宏觀經(jīng)濟政策變動的時間、趨勢大體一致。

從圖中可以看出,在1978-2002年期間,人均GDP的變異129第五節(jié)地理數(shù)據(jù)分布的集中化

與均衡度指數(shù)

羅倫次曲線與集中化指數(shù)基尼系數(shù)錫爾系數(shù)第五節(jié)地理數(shù)據(jù)分布的集中化

與均衡度指數(shù)羅倫次曲線與集中130(一)羅倫次曲線20世紀初,意大利統(tǒng)計學家羅倫次(M.Lorenz),首先使用累計頻率曲線研究工業(yè)化的集中化程度。后來,這種曲線就被稱之為羅倫次曲線。

一、羅倫次曲線與集中化指數(shù)(一)羅倫次曲線20世紀初,意大利統(tǒng)計學家羅倫次(M.Lo131繪制羅倫次曲線實例:

(1)將表2.5.1各產(chǎn)業(yè)部門的收入及其占總收入比重(百分比),從大到小重新排序;(2)從大到小,逐次計算累計百分比;(3)以自然序號為橫坐標(x),累計百分比為縱坐標(y);以(部門代碼,累計百分比)為坐標點,連成一個上凸的曲線(圖2.5.1和圖2.5.2),即羅倫次曲線。繪制羅倫次曲線實例:(1)將表2.5.1各產(chǎn)業(yè)部門的收入及132表2.5.1某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構成

表2.5.1某地區(qū)農(nóng)戶家庭經(jīng)營性純收入水平及其構成133圖2.5.11999年農(nóng)戶家庭經(jīng)

營性純收入構成的羅倫次曲線圖2.5.22004年農(nóng)戶家庭經(jīng)營性純收入構成的羅倫次曲線

圖2.5.11999年農(nóng)戶家庭經(jīng)

營性純收入構成的羅倫1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論