判別分析法預(yù)測演示文稿_第1頁
判別分析法預(yù)測演示文稿_第2頁
判別分析法預(yù)測演示文稿_第3頁
判別分析法預(yù)測演示文稿_第4頁
判別分析法預(yù)測演示文稿_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

判別分析法預(yù)測演示文稿目前一頁\總數(shù)六十八頁\編于五點優(yōu)選判別分析法預(yù)測目前二頁\總數(shù)六十八頁\編于五點YOURSITEHERE第一節(jié)引言目前三頁\總數(shù)六十八頁\編于五點YOURSITEHERE預(yù)處理特征提取桔子橙子訓(xùn)練(學(xué)習(xí))這是一個學(xué)習(xí)和預(yù)測的過程。目前四頁\總數(shù)六十八頁\編于五點YOURSITEHERE回歸分析——定量預(yù)報判別分析——定性預(yù)報模式識別在許多自然科學(xué)和社會科學(xué)問題的研究中,我們所關(guān)心的不是樣品的某一指標(biāo)數(shù)值的多少,而是其類別、歸屬。生物學(xué):各類性狀→物種類別醫(yī)學(xué):各類癥狀→SAS、豬流感地質(zhì)學(xué):巖石分類、地層時代、斷層性質(zhì)、有礦無礦預(yù)測氣象學(xué):天氣預(yù)報是晴、陰、雨?目前五頁\總數(shù)六十八頁\編于五點YOURSITEHERE在地學(xué)領(lǐng)域中,經(jīng)常面臨著大量的分類問題,即對一定量的事物(如地質(zhì)體、樣品或變量)按其屬性進(jìn)行歸類。由于地質(zhì)對象的復(fù)雜性,單靠定性標(biāo)志或少數(shù)定量標(biāo)志進(jìn)行分類,常常不能揭示客觀事物內(nèi)在本質(zhì)的差別和聯(lián)系,難以確定地質(zhì)體本質(zhì)屬性的歸屬。同時也造成很多分類計算具有很大的主觀性和任意性,而且所得的結(jié)果因人而異,常不能反映客觀實際情況。目前六頁\總數(shù)六十八頁\編于五點YOURSITEHERE在對地質(zhì)對象的類型研究中,有兩大類方法。一類是聚類分析(或稱點群分析,群分析)另一類就是判別分析。判別分析的主要思想是用統(tǒng)計方法將待判的未知樣品與已知類型的樣品進(jìn)行(定量)類比,以確定待判樣品應(yīng)歸屬于其中哪一類。目前七頁\總數(shù)六十八頁\編于五點YOURSITEHERE全堿-硅圖解(TAS)目前八頁\總數(shù)六十八頁\編于五點YOURSITEHERE目前九頁\總數(shù)六十八頁\編于五點YOURSITEHERE最簡單的情形下,單就一個變量的值就可區(qū)分不同的類別。但是,通常情況下,一個變量往往難于區(qū)分不同的分類,只有利用多個變量,才能比較全面從各個不同的角度刻畫個母體間的差異。在傳統(tǒng)的地質(zhì)學(xué)研究中,四元以上的系統(tǒng)用幾何圖形表示變得十分困難。用適當(dāng)?shù)臄?shù)學(xué)方法從多個變量中提出有關(guān)判別分類的有效信息,綜合成一個像單變量那樣好用的判別標(biāo)準(zhǔn)。目前十頁\總數(shù)六十八頁\編于五點YOURSITEHERE判別分析法所要解決的問題是對樣品的分類,其特點為:在已知研究對象的條件下,確定未知對象屬于已知分類中的哪一類。在包括礦床預(yù)測在內(nèi)的各類地質(zhì)研究中,經(jīng)常遇到這類問題。判別分析中的“類比法”思想與傳統(tǒng)地質(zhì)學(xué)中所用類別法的不同:①定量;②綜合考慮多種因素或標(biāo)志;③以某種最優(yōu)化準(zhǔn)則作分類基礎(chǔ)目前十一頁\總數(shù)六十八頁\編于五點YOURSITEHERE目前十二頁\總數(shù)六十八頁\編于五點YOURSITEHERE磁異常指數(shù)對數(shù)值→x1x2↑訓(xùn)練樣本閃長玢巖出露面積比A總體,有礦B總體,無礦有礦否?目前十三頁\總數(shù)六十八頁\編于五點YOURSITEHERE磁異常指數(shù)對數(shù)值閃長玢巖出露面積比→x1x2↑目前十四頁\總數(shù)六十八頁\編于五點YOURSITEHERE判別分析也是一種類比法,它是從定量角度,綜合考慮多種地質(zhì)變量或標(biāo)志,按照某種最優(yōu)化判別準(zhǔn)則作為分類基礎(chǔ),來進(jìn)行分析的。其判別準(zhǔn)則分為兩類:費歇準(zhǔn)則(,1936)和貝葉斯準(zhǔn)則。判別分析特點:定量類比、定性預(yù)報目前十五頁\總數(shù)六十八頁\編于五點YOURSITEHERE第二節(jié)費歇兩組判別目前十六頁\總數(shù)六十八頁\編于五點YOURSITEHERE費歇判別思想是投影,使多維問題簡化為一維問題來處理。選擇一個適當(dāng)?shù)耐队拜S,使所有的樣品點都投影到這個軸上得到一個投影值。對這個投影軸的方向的要求是:使每一類內(nèi)的投影值所形成的類內(nèi)離差盡可能小,而不同類間的投影值所形成的類間離差盡可能大。費歇判別的基本思想目前十七頁\總數(shù)六十八頁\編于五點YOURSITEHERER0尋找一個方向,也就是圖上的虛線方向,沿著這個方向朝和這個虛線垂直的一條直線進(jìn)行投影會使得這兩類分得最清楚??梢钥闯?,如果向其他方向投影,判別效果不會比這個好。所謂Fisher判別法,是一種先投影,后用距離判別的方法。R=c1x1+c2x2目前十八頁\總數(shù)六十八頁\編于五點YOURSITEHERE考慮指標(biāo)與p個自變量有關(guān)的兩類判別:設(shè)指標(biāo)y按其取值范圍只分為A、B兩類,對A、B兩類分別有nA,nB個樣品數(shù)據(jù)。Fisher提出,建立p個因子的一個線性判別函數(shù)其中判別系數(shù)cj(j=1,2,..,p)的選擇應(yīng)使得y值滿足:(1)A類與B類這兩類點群盡可能地遠(yuǎn)離,即兩類點群重心間距離盡可能達(dá)到最大;(2)同一類的樣品點盡可能集中。[(1)(2)兩點統(tǒng)稱為Fisher準(zhǔn)則]一、費歇準(zhǔn)則準(zhǔn)則與準(zhǔn)則下的兩類判別線性模型目前十九頁\總數(shù)六十八頁\編于五點YOURSITEHERE其中組間離差平方和(盡可能大)樣本總離差平方和(盡可能小)目前二十頁\總數(shù)六十八頁\編于五點YOURSITEHERE要同時滿足費歇判別準(zhǔn)則的兩個條件,要求達(dá)到最大目前二十一頁\總數(shù)六十八頁\編于五點YOURSITEHERE二、兩類判別函數(shù)的參數(shù)估計I是y的函數(shù),也是cj的函數(shù)。根據(jù)極值原理,I取極大值的條件是I對系數(shù)cj的偏導(dǎo)數(shù)為0,即:(j=1,2,3,…,p)等價于:(因為lnI=lnG

–lnH)目前二十二頁\總數(shù)六十八頁\編于五點YOURSITEHERE=L-1D

(i,j=1,2,…,p)(j=1,2,3,…p)其中,于是,可得線性判別函數(shù)為:目前二十三頁\總數(shù)六十八頁\編于五點YOURSITEHERE三、確定臨界值及對新樣品作出判別當(dāng)判別函數(shù)求出后,可進(jìn)一步求得:類平均值于是,判別臨界值可進(jìn)一步可導(dǎo)出目前二十四頁\總數(shù)六十八頁\編于五點YOURSITEHERE將新樣品的各變量觀測值代入判別函數(shù),求得相應(yīng)的函數(shù)值y(判別得分)目前二十五頁\總數(shù)六十八頁\編于五點YOURSITEHERE四、判別效果的分析和檢驗所建立的判別函數(shù)是否有實際意義,判別效果有無實用價值,準(zhǔn)確度如何,同樣需用作檢驗分析。(1)總體差異的顯著性檢驗判別分析中,首先要求假定兩類樣品來自有顯著差異、可區(qū)別的總體,兩總體的均值應(yīng)有顯著差異。(2)各因子(判別變量)的重要性檢驗為消除因子量綱的影響,通常在求得判別系數(shù)后,可將其標(biāo)準(zhǔn)化后再檢驗cj*=cj/sj可以通過其兩類樣本均值之差來衡量目前二十六頁\總數(shù)六十八頁\編于五點YOURSITEHERE馬氏距離(Mahalanobis馬哈拉諾比斯距離)設(shè)xi,xj是服從均值為μ,協(xié)方差為Σ>0的總體Xpx1抽取的樣品,則稱為p維空間上點xi,xj之間的廣義(統(tǒng)計)距離,亦稱馬氏距離目前二十七頁\總數(shù)六十八頁\編于五點YOURSITEHERE特別地,當(dāng)當(dāng)Σ=Ip,有(方差加權(quán))(歐式距離)目前二十八頁\總數(shù)六十八頁\編于五點YOURSITEHERE總體差異的顯著性檢驗?zāi)壳岸彭揬總數(shù)六十八頁\編于五點YOURSITEHERE用所建立的判別函數(shù)對兩總體的已知樣本進(jìn)行回判,并將判別結(jié)果,與已知結(jié)果對比,計算判錯率,當(dāng)判錯率<20%,認(rèn)為判別函數(shù)有效。實際中常用回判法來評價判別函數(shù)的有效性。誤判率(A)=誤判率(B)=目前三十頁\總數(shù)六十八頁\編于五點YOURSITEHERE實例目前三十一頁\總數(shù)六十八頁\編于五點目前三十二頁\總數(shù)六十八頁\編于五點目前三十三頁\總數(shù)六十八頁\編于五點目前三十四頁\總數(shù)六十八頁\編于五點YOURSITEHERE基于GIS技術(shù)的礦產(chǎn)資源評價分析系統(tǒng)目前三十五頁\總數(shù)六十八頁\編于五點YOURSITEHEREGIS技術(shù)支持下單元劃分目前三十六頁\總數(shù)六十八頁\編于五點YOURSITEHERE對各單元進(jìn)行編號116234567891011121314151923217177各單元變量取值與處理控制區(qū)GIS技術(shù)支持下控制區(qū)確定、變量取值與處理目前三十七頁\總數(shù)六十八頁\編于五點YOURSITEHERE自變量:各種控礦地質(zhì)因素或找礦標(biāo)志

因變量:礦床值(礦化強(qiáng)度優(yōu)劣、礦床儲量)控制區(qū)(模型區(qū))單元預(yù)測區(qū)單元②建立模型→估算模型參數(shù)

→模型檢驗與修改(包括:a.模型地質(zhì)意義檢驗;b.統(tǒng)計上的假設(shè)檢驗和)→預(yù)測已知含礦單元已知無礦單元③模型應(yīng)用①確定目標(biāo)→設(shè)置指標(biāo)變量→收集數(shù)據(jù)→對實際問題進(jìn)行多元統(tǒng)計的建模過程目前三十八頁\總數(shù)六十八頁\編于五點YOURSITEHERE4.應(yīng)用實例。研究區(qū):寧蕪盆地北段預(yù)測對象:玢巖型鐵礦。預(yù)測比例尺:1:50,000單元劃分:全區(qū)劃分為3×單元100個。(1)根據(jù)研究區(qū)的地質(zhì)勘探情況,該區(qū)有8個單元為已知有礦單元,14個單元為已知無礦單元,另外78個單元為未知待判單元。因此,令已知有礦單元為A總體,NA=8目前三十九頁\總數(shù)六十八頁\編于五點YOURSITEHERE

令已知無礦單元為B總體,NB=8,剩余6個作為回判檢驗.(2)建立數(shù)學(xué)模型,即判別分析函數(shù),經(jīng)過控礦地質(zhì)因素分析,選出7個與成礦關(guān)系密切的變量參加建模,

x1——接觸帶長度,

x2——單元中心與斷裂噴發(fā)帶的距離。

x4——閃長玢巖出露面積,

x5——圍巖蝕變組合的相對熵值,

x9——磁異常特征值,目前四十頁\總數(shù)六十八頁\編于五點YOURSITEHERE

x10——重力異常特征值,

x12——巖層組合的相對熵。最終建立判別函數(shù):R=0.0247X1-1.2246X2-0.036X4+0.041X5+0.1540X9-0.008X10-0.0267X12(3)確定判別臨界值。

A總體的判別得分

B總體的判別得分∴R0=-1.5885目前四十一頁\總數(shù)六十八頁\編于五點YOURSITEHERE(4)顯著性檢驗。

i)對已知單元進(jìn)行回判,判對率93.3%,說明R0是顯著的,所建立的判別函數(shù)有效。

ii)馬氏檢驗。

F=2.833,而∴∴判別函數(shù)在α=0.1的顯著性水平上有效。目前四十二頁\總數(shù)六十八頁\編于五點YOURSITEHERE(5)對未知單元進(jìn)行判別,預(yù)測。結(jié)果,有22個單元的R>R0,判為A類,為有礦遠(yuǎn)景單元。(6)對22個有利遠(yuǎn)景單元的控礦條件和找礦潛力進(jìn)行評價,分析。通過分析發(fā)現(xiàn),這些單元多數(shù)位于NE向斷裂和NW向斷裂火山噴發(fā)帶內(nèi)。而這兩個帶已被證明是本區(qū)重要的成礦條件,另外,這22個單元之中,有的已經(jīng)發(fā)現(xiàn)了礦點,有些在空間上與已知礦床相鄰,因而,認(rèn)為這些單元具有良好的成礦條件和較大的成礦潛力。目前四十三頁\總數(shù)六十八頁\編于五點多組判別分析問題的提出:實際工作中需要對多種類型的樣品進(jìn)行判別,如:油層、氣層、水層、干層等,這就需要多組判別分析來解決了。設(shè)有m個總體,第g個總體的樣品個數(shù)為ng(g=1,2,…,m),每個樣品測定了P個指標(biāo),此時,可寫成:第g類,第j個樣品第k個指標(biāo)的觀測值。目前四十四頁\總數(shù)六十八頁\編于五點總共取了N個樣品目前四十五頁\總數(shù)六十八頁\編于五點仿兩組判別,求出判別函數(shù),兩組求一個判別函數(shù),三組就要求三個判別函數(shù)(即:1~2;2~3;1~3);四組就要求6個,一般地說,若有m組,就要求這樣計算量太大,對一個新樣品也得計算多個判別值,比較起來,十分困難。因此,求判別函數(shù)的方法對多組判別不適用。目前四十六頁\總數(shù)六十八頁\編于五點

在多組判別分析中,是這樣考慮的:在判別中,可能犯這樣的錯誤,即把本應(yīng)屬于g組的樣品錯分到n組,或者把n組的樣品錯分到了g組,這種錯誤是在所難免的,只希望由此造成的平均損失盡可能的小。目前四十七頁\總數(shù)六十八頁\編于五點YOURSITEHERE第三節(jié)貝葉斯多組判別和逐步判別的基本概念目前四十八頁\總數(shù)六十八頁\編于五點YOURSITEHERE假定為所研究的對象(總體)在抽樣前已有一定的認(rèn)識,常用先驗概率分布來描述這種認(rèn)識,然后基于抽取的樣本再對先驗認(rèn)識作修正,得到后驗概率分布,再基于后驗概率分布作各種統(tǒng)計推斷。貝葉斯統(tǒng)計的基本思想將貝葉斯統(tǒng)計的思想應(yīng)用于判別分析,就得到貝葉斯判別方法。目前四十九頁\總數(shù)六十八頁\編于五點YOURSITEHERE費歇準(zhǔn)則是對p維空間兩點群尋找最優(yōu)分割面(選擇一個適當(dāng)?shù)耐队拜S,使多維問題簡化為一維問題來處理);而貝葉斯準(zhǔn)則是為p維空間兩(多個)點群尋找最優(yōu)的空間劃分方法。尋找最優(yōu)的空間劃分方法,實際上也是要建立一個判別函數(shù),但這函數(shù)應(yīng)能滿足誤判平均損失最小的原則。PatternClassificationByR.O.Duda,etal.目前五十頁\總數(shù)六十八頁\編于五點YOURSITEHEREk個p維總體:

G1,G2,…,Gk分別具有不同的p維概率密度函數(shù):

f1(x),f2(x),..,fk(x)。在進(jìn)行判別之前,確定先驗概率分布:q1,q2,…,qk,有誤判損失:c(j|i)表示將實際屬于Gi的樣品判歸為Gj所造成的損失度量。誤判的損失通常在判別分析前就可以估計。一個合理的判別準(zhǔn)則應(yīng)該考慮到每個總體出現(xiàn)的可能性大小(即先驗概率分布),還應(yīng)考慮誤判造成的損失問題。目前五十一頁\總數(shù)六十八頁\編于五點YOURSITEHERE一個判別準(zhǔn)則(對Rp空間的一個劃分):D=(D1,D2,…,Dk)。誤判概率:P(j|i,D)表示在判別準(zhǔn)則D下將事實來自Gi的樣品誤判為來自Gj的概率。由此誤判而造成的損失為c(j|i)(j=1,2,…,k,j≠i)(誤判損失),因此,在一個給定的判別準(zhǔn)則D之下,對Gi而言所造成的損失,應(yīng)該誤判為G1,…,Gi-1,Gi+1,..,Gk的所有損失。目前五十二頁\總數(shù)六十八頁\編于五點YOURSITEHERE按照各誤判概率加權(quán)求和,即在此判別準(zhǔn)則D下,將來自Gi的樣品錯判為其他總體的期望損失為(注意c(i|i)=0)又由于各總體Gi出現(xiàn)的先驗概率為qi(i=1,2,…,k),故在判別準(zhǔn)則D之下總的期望損失為平均誤判損失函數(shù)ECM(ExpectedCostofMisclassification)目前五十三頁\總數(shù)六十八頁\編于五點YOURSITEHERE平均誤判損失函數(shù)L與判別準(zhǔn)則D有關(guān),貝葉斯判別即選擇D=(D1,D2,…,Dk),使L達(dá)到最小。目前五十四頁\總數(shù)六十八頁\編于五點YOURSITEHERE將樣品空間Rp劃分為k個兩兩互斥的子空間,存在各種劃分方法,任何一種劃分都可能存在著錯分現(xiàn)象,錯分就會造成損失。顯然,人們希望在某種空間劃分下,使總的錯分損失最小。在給定母體先驗概率時,劃分空間使錯分平均損失最小的原則。貝葉斯準(zhǔn)則又稱為以指定具有較高后驗概率的母體作為判別個體X歸屬的準(zhǔn)則。貝葉斯準(zhǔn)則目前五十五頁\總數(shù)六十八頁\編于五點YOURSITEHERE兩種準(zhǔn)則下的判別分析的選擇貝葉斯準(zhǔn)則費歇準(zhǔn)則判別類型多用于多組判別多用于兩組判別數(shù)學(xué)模型所要求條件較嚴(yán)格①各組變量必須服從多維正態(tài)分布;②各組方差-協(xié)方差矩陣相等;③各組變量的均值有顯著的差異;較寬松對判別變量的分布類型并無特定要求,只要求各類總體的二階矩存在,各組變量的均值有顯著的差異目前五十六頁\總數(shù)六十八頁\編于五點YOURSITEHERE有時,一些變量對于判別并沒有什么作用,為了得到對判別最合適的變量,可以使用逐步判別。也就是,一邊判別,一邊引進(jìn)判別能力最強(qiáng)的變量。這個過程可以有進(jìn)有出。一個變量的判別能力的判斷方法有很多種,主要利用各種檢驗,例如:Wilks’Lambda、Rao’sV、TheSquaredMahalanobisDistance、SmallestFratio或TheSumofUnexplainedVariations等檢驗。這些不同方法可由統(tǒng)計軟件的各種選項來實現(xiàn)。逐步判別的其他方面和前面的無異。(僅僅是在前面的方法中加入變量選擇的功能)逐步判別法目前五十七頁\總數(shù)六十八頁\編于五點YOURSITEHERE一些有關(guān)問題(1)建立判別函數(shù)時應(yīng)有足夠多的已知

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論