相關分析課件_第1頁
相關分析課件_第2頁
相關分析課件_第3頁
相關分析課件_第4頁
相關分析課件_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

相關分析

相關分析的任務,是揭示地理要素之間相互關系的密切程度。而地理要素之間相互關系密切程度的測定,主要是通過對相關系數的計算與檢驗來完成的。一、兩要素之間相關程度的測定相關系數的計算與檢驗秩相關系數的計算與檢驗

相關系數的計算

定義:

和為兩要素的平均值。(3.1.1)(一)相關系數的計算與檢驗②說明:-1<=<=1,大于0時正相關,小于0時負相關。的絕對值越接近于1,兩要素的關系越密切;越接近于0,兩要素的關系越不密切。

③簡化:

公式(3.1.1)可簡化為(3.1.2)

表3.1.1倫敦的月平均氣溫與降水量

資料來源:.tw/V4/climate/wta_station/wta20.htm

相關分析實例(1)根據表3.1.1中的數據,我們可以利用公式(3.1.1),計算倫敦市月平均氣溫(t)與降水量(p)之間的相關系數

(2)計算結果表明,倫敦市的月平均氣溫(t)與降水量(p)之間呈負相關,即異向相關。

又如:根據甘肅省53個氣象臺站的多年平均數據(見教材表3.1.2),可以利用公式(3.1.1)對降水量(p)和緯度(y)之間的相關系數以及蒸發(fā)量(v)和緯度(y)之間的相關系數進行計算,結果如下

==

計算結果表明,降水量(p)和緯度(y)之間異向相關,而蒸發(fā)量(v)與緯度(y)之間同向相關。

相關系數的檢驗

相關系數是根據要素之間的樣本值計算出來,它隨著樣本數的多少或取樣方式的不同而不同,因此它只是要素之間的樣本相關系數,只有通過檢驗,才能知道它的可信度。檢驗是通過在給定的置信水平下,查相關系數檢驗的臨界值表來實現的。f

0.100.050.020.010.0011234567891011120.987690.900000.80540.72930.66940.62150.58220.54940.52140.49730.47620.45750.996920.950000.87830.81140.75450.70670.66640.63190.60210.57600.55290.5324

0.9995070.980000.934330.88220.83290.78870.74930.71550.68510.65810.63390.6120

0.9998770.990000.958730.917200.87450.83430.79770.76460.73480.70790.68350.66140.9999980.9990000.9911600.974060.950740.924930.89820.87210.84710.82330.80100.7800表3.1.3檢驗相關系數的臨界值()表

在表3.1.3中,f稱為自由度,其數值為

f=n-2,n為樣本數;上方的代表不同的置信水平;表內的數值代表不同的置信水平下相關系數的臨界值,即;公式的意思是當所計算的相關系數的絕對值大于在水平下的臨界值

rα時,兩要素不相關(即)的可能性只有。

對倫敦市月平均氣溫(t)與降水量(p)之間的相關系數,f=12-2=10,在顯著性水平上,查表3.1.3,得知:。因為,所以,倫敦市月平均氣溫(t)與降水量(p)之間的相關性并不顯著。

對于甘肅省53個氣象臺站降水量(p)和緯度(y)之間的相關系數,以及蒸發(fā)量(v)和緯度(y)之間的相關系數,f=53-2=51,表中沒有給出相應樣本個數下的臨界值,但是我們發(fā)現,在同一顯著水平下,隨著樣本數的增大,臨界值

減少。在顯著性水平α=0.001上,取f=50,查表3.1.3得知:=0.4433。顯然,和

的絕對值都遠遠大于=0.4433,這說明甘肅省53個氣象臺站降水量(p)和緯度(y)之間,以及蒸發(fā)量(v)和緯度(y)之間都是高度相關的。秩相關系數又稱等級相關系數,或順序相關系數,是將兩要素的樣本值按數據的大小順序排列位次,以各要素樣本值的位次代替實際數據而求得的一種統計量。

(3.1.4)

(二)秩相關系數的計算與檢驗

教材中表3.1.4給出了2003年中國大陸各?。ㄖ陛犑?、自治區(qū))的GDP(x)和總人口(y)數據及其位次,將數據代入公式(3.1.4),就可以計算它們之間的秩相關系數即:GDP(x)與總人口(y

)之間的等級相關系數為0.7847。

示例:n

顯著水平α

n

顯著水平α

0.05

0.01

0.050.0141.000--

160.4250.60150.9001.000180.3990.56460.8290.943200.3770.53470.7140.893220.3590.50880.6430.833240.3430.48590.6000.783260.3290.465100.5640.746280.3170.448120.4560.712

30

0.3060.432140.4560.645------注:n代表樣本個數,α代表不同的置信水平,也稱顯著水平,表中的數值為臨界值。

秩相關系數的檢驗

表3.1.5秩相關系數檢驗的臨界值

在上例中,n=31,表中沒有給出相應的樣本個數下的臨界值,但是同一顯著水平下,隨著樣本數的增大,臨界值減少。在n=30時,查表得:=0.432,由于=0.7847>=0.432,所以在α=0.01的置信水平上來看,中國大陸各?。ㄖ陛犑?、自治區(qū))人口規(guī)模與GDP是等級相關的。二、多要素間相關程度的測定偏相關系數的計算與檢驗復相關系數的計算與檢驗

(一)偏相關系數的計算與檢驗①

定義:在多要素所構成的地理系統中,先不考慮其他要素的影響,而單獨研究兩個要素之間的相互關系的密切程度,這稱為偏相關。用以度量偏相關程度的統計量,稱為偏相關系數。偏相關系數的計算②

計算:3個要素的偏相關系數(3.1.5)

(3.1.6)

(3.1.7)

4個要素的偏相關系數(3.1.8)

(3.1.9)

(3.1.10)

(3.1.11)

例如:對于某4個地理要素x1,x2,x3,x4的23個樣本數據,經過計算得到了如下的單相關系數矩陣:

利用公式計算一級偏向關系數,如表3.1.6所示:r12·34r13·24r14·23r23·14r24·13r34·12-0.1700.8020.635-0.1870.821-0.337r12·3r13·2r14·2r14·3r23·1r24·1r24·3r24·1r34·20.8210.8080.6470.895-0.8630.9560.945-0.8750.371

利用公式計算二級偏相關系數,如表3.1.7所示:4個要素的一級偏相關系數有12個,這里給出了9個;二級偏相關系數有6個,這里全部給出來了。表3.1.6一級偏相關系數

表3.1.7二級偏相關系數

偏相關系數的性質

偏相關系數分布的范圍在-1到1之間;

偏相關系數的絕對值越大,表示其偏相關程度越大;

偏相關系數的絕對值必小于或最多等于由同一系列資料所求得的復相關系數,即R1·23≥|r12·3|。偏相關系數的顯著性檢驗

偏相關系數的顯著性檢驗,一般采用t檢驗法。其統計量計算公式為

式中:為偏相關系數;n為樣本數;m為自變量個數。

(3.1.14)

查t分布表,在自由度為23-3-1=19時,t0.001=3.883,顯然,這表明在置信度水平=0.001上,偏相關系數r24·13是顯著的。

譬如,對于上例計算得到的偏相關系數

,由于n=23,m=3,故(二)復相關系數的計算與檢驗

復相關系數:反映幾個要素與某一個要素之間的復相關程度。復相關系數的計算當有兩個自變量時當有三個自變量時(3.1.15)

(3.1.16)當有k個自變量時(3.1.17)

復相關系數的性質

復相關系數介于0到1之間,即

復相關系數越大,則表明要素(變量)之間的相關程度越密切。復相關系數為1,表示完全相關;復相關系數為0,表示完全無關。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論