版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)統(tǒng)計(jì)模型多變量統(tǒng)計(jì)分析主要用于數(shù)據(jù)分類和綜合評(píng)價(jià)。綜合評(píng)價(jià)是區(qū)劃和規(guī)劃的基礎(chǔ)。從人類認(rèn)識(shí)的角度來(lái)看有精確的和模糊的兩種類型,因?yàn)榻^大多數(shù)地理現(xiàn)象難以用精確的定量關(guān)系劃分和表示,因此模糊的模型更為實(shí)用,結(jié)果也往往更接近實(shí)際,模糊評(píng)價(jià)一般經(jīng)過(guò)四個(gè)過(guò)程:評(píng)(價(jià)1因)子的選擇與簡(jiǎn)化;多(因2子)重要性指標(biāo)(權(quán)重)的確定;因(子3內(nèi))各類別對(duì)評(píng)價(jià)目標(biāo)的隸屬度確定;選(用4某)種方法進(jìn)行多因子綜合。.主成分分析地理問(wèn)題往往涉及大量相互關(guān)聯(lián)的自然和社會(huì)要素,眾多的要素常常給模型的構(gòu)造帶來(lái)很大困難,為使用戶易于理解和解決現(xiàn)有存儲(chǔ)容量不足的問(wèn)題,有必要減少某些數(shù)據(jù)而保留最必要的信息。主成分分析是通過(guò)數(shù)理統(tǒng)計(jì)
2、分析,求得各要素間線性關(guān)系的實(shí)質(zhì)上有意義的表達(dá)式,將眾多要素的信息壓縮表達(dá)為若干具有代表性的合成變量,這就克服了變量選擇時(shí)的冗余和相關(guān),然后選擇信息最豐富的少數(shù)因子進(jìn)行各種聚類分析,構(gòu)造應(yīng)用模型。設(shè)有個(gè)樣本,個(gè)變量。將原始數(shù)據(jù)轉(zhuǎn)換成一組新的特征值主成分,主成分是原變量的線性組合且具有正交特征。即將,綜合成V個(gè)指標(biāo),即這樣決定的綜合指標(biāo),分別稱做原指標(biāo)的第一,第二,第主成分,且,在總方差中占的比例依次遞減。而實(shí)際工作中常挑選前幾個(gè)方差比例最大的主成分,從而簡(jiǎn)化指標(biāo)間的關(guān)系,抓住了主要矛盾。從幾何上看,找主成分的問(wèn)題,就是找多維空間中橢球體的主軸問(wèn)題,從數(shù)學(xué)上容易得到它們是,的相關(guān)矩陣中個(gè)較大特征
3、值所對(duì)應(yīng)的特征向量,通常用雅可比法計(jì)算特征值和特征向量。主成分分析這一數(shù)據(jù)分析技術(shù)是把數(shù)據(jù)減少到易于管理的程度,也是將復(fù)雜數(shù)據(jù)變成簡(jiǎn)單類別便于存儲(chǔ)和管理的有力工具。地理研究和生態(tài)研究的用戶常使用上述技術(shù),因而應(yīng)把這些變換函數(shù)作為的組成部分。層次分析法是等在年代提出和廣泛應(yīng)用的是系統(tǒng)分析的數(shù)學(xué)工具之一,它把人的思維過(guò)程層次化、數(shù)量化,并用數(shù)學(xué)方法為分析、決策、預(yù)報(bào)或控制提供定量的依據(jù)。方法把相互關(guān)聯(lián)的要素按隸屬關(guān)系分為若干層次,請(qǐng)有經(jīng)驗(yàn)的專家對(duì)各層次各因素的相對(duì)重要性給出定量指標(biāo),利用數(shù)學(xué)方法綜合專家意見給出各層次各要素的相對(duì)重要性權(quán)值,作為綜合分析的基礎(chǔ)。例如要比較個(gè)因素=y,對(duì)目標(biāo)的影響,確
4、定它們?cè)谥械谋戎?每次取兩個(gè)因素和,用表示與對(duì)的影響之比,全部比較結(jié)果可用矩陣二表示,叫成對(duì)比矩陣,它應(yīng)滿足:使上式成立的矩陣稱互反陣,必有=。在旅游問(wèn)題中,假設(shè)某人考慮個(gè)因素:費(fèi)用、景色,居住條件飲食條件、旅途條件。他用成對(duì)比較法得到的正互反陣是:中.y-i旳127551/2L4331/71/441/21/3:1/51/321小1/3311-在上式中二表示與景色對(duì)選擇旅游點(diǎn)目標(biāo)的重要性之比為;=,表示費(fèi)用與居住條件之比為:=、則表示景色與居住條件之比為:。如果不是一致陣即、2不等于,需求正互友陣最大特征值對(duì)應(yīng)的特征向量,作為權(quán)向量。.系統(tǒng)聚類分析60年代末到70年代初人們把大量精力集中于發(fā)展
5、和應(yīng)用數(shù)字分類法,且將這類方法應(yīng)用于自然資源、土壤剖面、氣候分類、環(huán)境生態(tài)等數(shù)據(jù),形成“數(shù)字分類學(xué)”學(xué)科。目前聚類分析已成為標(biāo)準(zhǔn)的分類技術(shù),在許多大型計(jì)算機(jī)中都存儲(chǔ)了這種分析程序,從數(shù)據(jù)庫(kù)中將點(diǎn)數(shù)據(jù)傳送到聚類分析程序也不困難。聚類分析的主要依據(jù)是把相似的樣本歸為一類,而把差異大的樣本區(qū)分開來(lái)。在由個(gè)變量組成為維的空間中可以用多種方法定義樣本之間的相似性和差異性統(tǒng)計(jì)量。例:用表示第個(gè)樣本第個(gè)指標(biāo)的數(shù)據(jù)表示第個(gè)樣本第個(gè)指標(biāo)數(shù)據(jù);表示第個(gè)樣本和第個(gè)樣本之間的距離根據(jù)不同的需要,距離可以定義為許多類型,最常見、最直觀的距離是歐幾里德距離,其定義如下:d=I占(心一可aF/航依次求出任何兩個(gè)點(diǎn)的距離系數(shù)
6、,=,,以后,則可形成一個(gè)距離矩陣:rn知.小它反映了地理單元的差異情況,在此基礎(chǔ)上就可以根據(jù)最短距離法或最長(zhǎng)距離法或中位線法等。進(jìn)行逐步歸類,最后形成一張聚類分析譜系圖,如圖4.判別分析判別分析是根據(jù)表明事物特點(diǎn)的變量值和它們所屬的類求出判別函數(shù),根據(jù)判別函數(shù)對(duì)未知所屬類別的事物進(jìn)行分類的一種分析方法,與聚類分析不同,它需要已知一系列反映事物特性的數(shù)值變量值及其變量值。判別分析就是在已知研究對(duì)象分為若干類型(組別)并已經(jīng)取得各種類型的一批已知樣品的觀測(cè)數(shù)據(jù)基礎(chǔ)上,根據(jù)某些準(zhǔn)則,建立起盡可能把屬于不同類型的數(shù)據(jù)區(qū)分開來(lái)的判別函數(shù),然后用它們來(lái)判別未知類型的樣品應(yīng)該屬于哪一類。根據(jù)判別的組數(shù),判
7、別分析可以分為兩組判別分析和多組判別分析;根據(jù)判別函數(shù)的形式,判別分析可以分為線性判別和非線性判別;根據(jù)判別時(shí)處理變量的方法不同,判別分析可以分為逐步判別、序貫判別等;根據(jù)判別標(biāo)準(zhǔn)的不同,判別分析有距離判別、Fisher判別、Bayes判別等。判別分析與聚類分析同屬分類問(wèn)題,所不同的是,判別分析是預(yù)先根據(jù)理論與實(shí)踐確定等級(jí)序列的因子標(biāo)準(zhǔn),再將待分析的地理實(shí)體安排到序列的合理位置上的方法,對(duì)于諸如水土流失評(píng)價(jià)、土地適宜性評(píng)價(jià)等有一定理論根據(jù)的分類系統(tǒng)定級(jí)問(wèn)題比較適用。判別分析依其判別類型的多少與方法的不同,可分為兩類判別:多類判別和逐步判別。判別分析要求根據(jù)已知的地理特征值進(jìn)行線性組合,構(gòu)成一個(gè)
8、線性判別函數(shù),即式中,二l2,為判別系數(shù),它可反映各要素或特征值作用方向、分辨能力和貢獻(xiàn)率的大小。只要確定了,判別函數(shù)也就確定了。為已知各要素變量的特征值。為了使判別函數(shù)能充分地反映出、兩種地理類型的差別,就要使兩類之間均值差一盡可能大,而各類內(nèi)部的離差平方和盡可能小。只有這樣,其比值才能達(dá)到最大,從而能將兩類清楚地分開。其表達(dá)式為:1=號(hào)込-予孑*自匕-予F判別函數(shù)求出以后,還需要計(jì)算出判別臨界值,然后進(jìn)行歸類。不難看出,經(jīng)過(guò)二級(jí)判別所作的分類是符合區(qū)內(nèi)差異小而區(qū)際差異大的劃區(qū)分類原則的。目前在地理信息系統(tǒng)中發(fā)展了一種多因素模糊評(píng)價(jià)模型,相當(dāng)于模糊評(píng)判分析.該方法首先根據(jù)標(biāo)準(zhǔn)類別參數(shù)的指標(biāo)空
9、間確定各因素各類別對(duì)目標(biāo)的隸屬度,作為判別距離的度量,再結(jié)合要素的權(quán)重指數(shù),采用適當(dāng)?shù)哪:惴?,?jì)算各地理實(shí)體的歸屬等級(jí)類別,作為評(píng)價(jià)的基礎(chǔ)。該方法通過(guò)隸屬度表達(dá)人們對(duì)目標(biāo)與因素之間關(guān)系的模糊性認(rèn)識(shí),用適當(dāng)?shù)乃惴▽⑦@種認(rèn)識(shí)量化并反映到結(jié)果的分類中,對(duì)于地理學(xué)中的評(píng)價(jià)與規(guī)劃問(wèn)題非常有效。第一章:緒論在經(jīng)濟(jì)生活中,受多種指標(biāo)(隨機(jī)變量)共同作用和影響的現(xiàn)象大量存在。有兩種方法可同時(shí)對(duì)多個(gè)隨機(jī)變量的觀測(cè)數(shù)據(jù)進(jìn)行有效地分析和研究。一種做法是把多個(gè)隨機(jī)變量分開分析,一次處理一個(gè)去分析研究。但是,由于變量多,無(wú)法避免地存在變量之間的相關(guān)性,如果分開處理不僅會(huì)丟失很多信息,往往也不容易取得好的研究結(jié)論。另一
10、種做法是同時(shí)進(jìn)行分析研究。即用多元統(tǒng)計(jì)分析方法來(lái)解決,通過(guò)對(duì)多個(gè)隨機(jī)變量觀測(cè)數(shù)據(jù)的分析,來(lái)研究變量之間的相互關(guān)系以及揭示變量的內(nèi)在規(guī)律。所以,多元統(tǒng)計(jì)分析就是研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系以及內(nèi)在統(tǒng)計(jì)規(guī)律性的一門統(tǒng)計(jì)學(xué)科。多元分析包括的主要內(nèi)容有:多元正態(tài)總體的參數(shù)估計(jì)和假設(shè)檢驗(yàn)以及常用的統(tǒng)計(jì)方法。這些方法是多元數(shù)據(jù)圖表示法、聚類分析、判別分析、主成分分析、因子分析、對(duì)應(yīng)分析、多重多元回歸分析、典型相關(guān)分析、路徑分析、多維標(biāo)第二章:多元正態(tài)分布第三章:多元數(shù)據(jù)圖表示法多元數(shù)據(jù)的圖形表示方法有兩種:一類是使高維空間的點(diǎn)與平面上的某種圖形對(duì)應(yīng),以反映高維數(shù)據(jù)的某些特點(diǎn)或數(shù)據(jù)間的某些關(guān)系;另一類是
11、在盡可能多地保留原數(shù)據(jù)信息的原則下進(jìn)行降維,若能使數(shù)據(jù)維數(shù)降至2或1,則可在平面上作圖。第一類方法有:輪廓圖雷達(dá)圖調(diào)和曲線圖星座圖第二類方法有:主成分法因子分析法第四章:聚類分析聚類分析的目的是把分類對(duì)象按一定規(guī)則分成若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的。在同一類中這些對(duì)象在某種意義上趨向于彼此相似,而在不同類中對(duì)象趨向于不相似。聚類分析根據(jù)對(duì)象不同可分為型聚類分析(對(duì)樣本進(jìn)行聚類)和型聚類(對(duì)變量進(jìn)行聚類)。一、距離和相似系數(shù)對(duì)樣品或變量進(jìn)行分類時(shí),我們常用距離和相似系數(shù)來(lái)對(duì)樣品或變量之間的相似性進(jìn)行度量。距離常用來(lái)度量樣品之間的相似性,而相似系數(shù)常用來(lái)度量變量間的相似性。
12、變量的類型有:間隔尺度:指變量用連續(xù)的量來(lái)表示有序尺度:變量度量時(shí)沒(méi)有明確的數(shù)量表示,而是劃分一些有次序關(guān)系的等級(jí)名義尺度:變量度量時(shí)既沒(méi)有數(shù)量表示,也沒(méi)有次序關(guān)系第五章:判別分析判別分析要解決的問(wèn)題是在已知?dú)v史上用某些方法已把研究對(duì)象分成若干組的情況下,來(lái)判定新的觀測(cè)樣品應(yīng)歸屬的組別。距離判別距離判別的基本思想是:首先根據(jù)已知分類的數(shù)據(jù),分別計(jì)算各類的重心即分組(類)的均值,判別準(zhǔn)則是對(duì)任給的一次觀測(cè),若它與第類的重心距離最近,就認(rèn)為它來(lái)自第類。第六章:主成分分析基本思想主成分分析就是一種通過(guò)降維技術(shù)把多個(gè)指標(biāo)約化為少數(shù)幾個(gè)綜合指標(biāo)的統(tǒng)計(jì)分析方法。其基本思想是:設(shè)法將原來(lái)眾多具有一定相關(guān)性的
13、指標(biāo)(設(shè)為個(gè)),重新組合成一組新的相互無(wú)關(guān)的綜合指標(biāo)來(lái)代替原來(lái)指標(biāo)。數(shù)學(xué)上的處理就是將原來(lái)個(gè)指標(biāo)作線性組合,作為新的指標(biāo)。第一個(gè)線性組合,即第一個(gè)綜合指標(biāo)記為,為了使該線性組合具有唯一性,要求在所有的線性組合中的方差最大,即越大,那么包含的信息越多。如果第一個(gè)主成分不足以代表原來(lái)個(gè)指標(biāo)的信息,再考慮選取第二個(gè)主成分,并要求已有的信息不出現(xiàn)在中,即。第七章:因子分析因子分析是主成分分析的推廣,它也是一種把多個(gè)變量化為少數(shù)幾個(gè)綜合變量的多元分析方法,其目的是用有限個(gè)不可觀測(cè)的隱變量來(lái)解釋原始變量之間的相關(guān)關(guān)系。第八章:典型相關(guān)分析概念及基本思想典型相關(guān)分析是研究?jī)山M變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)分析方法,它能夠真正反映兩組變量之間的相互線性依賴關(guān)系。設(shè)兩組變量用及表示,采用類似主成分分析的做法,在每一組變量中都選擇若干個(gè)有代表性的綜合指標(biāo)(變量的線性組合),通過(guò)研究?jī)山M的綜合指標(biāo)之間的關(guān)系
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同 仲裁訴訟條款
- 大班音樂(lè)繪本《月光長(zhǎng)廊》課件
- 2024上海市非定期集裝箱道路貨物運(yùn)輸合同
- 三年級(jí)語(yǔ)文上冊(cè)第一單元測(cè)試卷-基礎(chǔ)知識(shí)與綜合能力篇 含答案 部編版
- 2024家庭水電裝修合同書
- 2024收銀員聘用合同
- 2024標(biāo)準(zhǔn)銷售代理合同格式
- 深圳大學(xué)《哲學(xué)經(jīng)典與人生》2021-2022學(xué)年第一學(xué)期期末試卷
- 深圳大學(xué)《形體訓(xùn)練(流行舞蹈)》2022-2023學(xué)年第一學(xué)期期末試卷
- 合同樣本-土建合同范本8篇
- 2023年人民法院電子音像出版社招聘筆試題庫(kù)及答案解析
- 大學(xué)生心理健康優(yōu)秀說(shuō)課-比賽課件
- 收款賬戶變更的聲明
- 九年級(jí)道德與法治中考復(fù)習(xí)資料
- 《化學(xué)發(fā)展簡(jiǎn)史》學(xué)習(xí)心得
- 班組建設(shè)與班組長(zhǎng)管理技巧課件
- 簽派員執(zhí)照考試題庫(kù)匯總-8簽派和實(shí)踐應(yīng)用
- 銷售人員十大軍規(guī)課件
- 人類學(xué)研究方法課件
- 醫(yī)學(xué)課件老年共病概述及處理策略
- 安全風(fēng)險(xiǎn)評(píng)價(jià)風(fēng)險(xiǎn)矩陣法L-S、LEC法
評(píng)論
0/150
提交評(píng)論