經(jīng)典的數(shù)學(xué)地質(zhì)學(xué)_第1頁
經(jīng)典的數(shù)學(xué)地質(zhì)學(xué)_第2頁
經(jīng)典的數(shù)學(xué)地質(zhì)學(xué)_第3頁
經(jīng)典的數(shù)學(xué)地質(zhì)學(xué)_第4頁
經(jīng)典的數(shù)學(xué)地質(zhì)學(xué)_第5頁
已閱讀5頁,還剩609頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)地質(zhì)講義,資源與土木工程學(xué)院 侯根群,緒 論,一、數(shù)學(xué)地質(zhì)的定義 是地質(zhì)學(xué)科中的一個分支學(xué)科、邊緣學(xué)科。 邊緣學(xué)科:數(shù)學(xué) 、地質(zhì)學(xué)。 自然科學(xué)發(fā)展的趨勢:各學(xué)科之間相互滲透。 地質(zhì)學(xué)、物理學(xué)-地球物理學(xué)-地球物理勘探; 地質(zhì)學(xué)、化學(xué)-地球化學(xué)-地球化學(xué)找礦; 地質(zhì)學(xué)、數(shù)學(xué) -數(shù)學(xué)地質(zhì)。 傳統(tǒng)地質(zhì)學(xué)-定性描述為主,數(shù)學(xué)地質(zhì)學(xué)科的出現(xiàn)是地質(zhì)學(xué)發(fā)展史上的重要進(jìn)展。,分支學(xué)科: 作為一個獨(dú)立的學(xué)科形成于上世紀(jì)60年代,標(biāo)志為:1968年在巴黎召開的國際地質(zhì)大會上正式成立了“國際數(shù)學(xué)地質(zhì)學(xué)會(IAMG)”,開始出版geomathmatics雜志。 數(shù)學(xué)地質(zhì)方法在地質(zhì)研究中得到廣泛應(yīng)用。取得了好的地質(zhì)

2、效果,但不是成熟的學(xué)科。 數(shù)學(xué)地質(zhì)發(fā)展遲緩的原因: 1、地質(zhì)學(xué)科定性描述為主; 2、地質(zhì)學(xué)研究對象復(fù)雜; 時空跨度大;地質(zhì)事件的不可逆性。,兩種觀點(diǎn): 1、狹義觀點(diǎn):“數(shù)學(xué)地質(zhì)是建立、檢驗(yàn)和解釋地質(zhì)過程概念的隨機(jī)模型科學(xué)?!?2、廣義觀點(diǎn):“地質(zhì)科學(xué)中全部數(shù)學(xué)的應(yīng)用”,趙鵬大教授給出的定義: 數(shù)學(xué)地質(zhì)是研究地質(zhì)運(yùn)動數(shù)量規(guī)律的科學(xué)。它以數(shù)學(xué)為工具、以計算機(jī)為手段、以解決地質(zhì)問題為目的。 一般模式: 地質(zhì)問題 數(shù)學(xué)問題 結(jié)果 地質(zhì)解釋 合理的實(shí)現(xiàn)兩個“轉(zhuǎn)換”是取得好的地質(zhì)效果的關(guān)鍵。 (1)熟練掌握各種數(shù)學(xué)地質(zhì)方法的原理、應(yīng)用條件及可解決問題的類型; (2)熟悉相應(yīng)的地質(zhì)問題。,數(shù)學(xué)地質(zhì)的研究過程

3、 數(shù)學(xué)地質(zhì)的基本工作過程可以概括為:由地質(zhì)學(xué)家提出地質(zhì)問題,分析問題的地質(zhì)因素,建立相應(yīng)的地質(zhì)概念模型;選擇合適的數(shù)學(xué)方法,將定性的地質(zhì)概念模型轉(zhuǎn)化為定量的數(shù)學(xué)模型并研制相應(yīng)的應(yīng)用軟件;對計算機(jī)輸出的定量結(jié)果及地質(zhì)圖形資料進(jìn)行地質(zhì)解釋,并在此基礎(chǔ)上確定或修改給出的地質(zhì)概念模型及相應(yīng)的數(shù)學(xué)模型,以期解決所提出的地質(zhì)問題。,二、數(shù)學(xué)地質(zhì)產(chǎn)生的背景,1、數(shù)學(xué)在科學(xué)研究中扮演著非常重要的作用。 數(shù)學(xué)是探索各種科學(xué)規(guī)律的有效通用工具。凡是在研究量、量的變化、量的關(guān)系、量的關(guān)系的變化、量的變化的關(guān)系、關(guān)系的關(guān)系、變化的變化、主要關(guān)系和次要關(guān)系、共性、共性的共性等一系列復(fù)雜情況時沒有數(shù)學(xué)作為工具是不行的,只

4、是應(yīng)用程度和范圍有所不同而已。,2、地質(zhì)領(lǐng)域研究的發(fā)展需要數(shù)學(xué)工具的介入 (1)定性的描述滿足不了生產(chǎn)的需要。 (2)大量地質(zhì)數(shù)據(jù)的產(chǎn)生也需要數(shù)學(xué)工具的介入。 3、計算機(jī)技術(shù)的飛速發(fā)展促進(jìn)了數(shù)學(xué)和地質(zhì)的結(jié)合,三、數(shù)學(xué)地質(zhì)發(fā)展史(四個階段),1、孕育階段(1950年前) 1840年英國地質(zhì)學(xué)家Lyell首次以古生物化石的統(tǒng)計分析為論據(jù),對第三系地層進(jìn)行了劃分,確定了巖石地層次序,著述了定量動物學(xué)一書,開創(chuàng)了數(shù)學(xué)方法引入地質(zhì)學(xué)問題研究的先例。上世紀(jì)三十年代后期,Simpson(1939) 著述的分析地質(zhì)學(xué)一書中列舉了統(tǒng)計學(xué)在生物研究中的多方面應(yīng)用。Burma(1949)在“多元分析地質(zhì)學(xué)和古生物學(xué)

5、中的一種模型分析工具”一文中明確提出了多元統(tǒng)計方法是一種最有前景的生物計量方法。Krumbein和格里菲斯在沉積學(xué)研究中也使用了概率統(tǒng)計方法,為數(shù)學(xué)方法研究地質(zhì)現(xiàn)象和個別指標(biāo)的統(tǒng)計分析解決具體地質(zhì)問題奠定了基礎(chǔ)。這一階段也是統(tǒng)計分析在地質(zhì)學(xué)中應(yīng)用的可能性問題討論最為激烈的時期。,2、早期階段(1951-1960) Krumbein(1956)在研究巖石的礦物成分、巖性和化學(xué)成分時,應(yīng)用了多元統(tǒng)計方法,并把巖石成分作為n維空間中的一個點(diǎn)或向量進(jìn)行統(tǒng)計處理。尤其值得指出的是,1958年由Krumbein和斯洛斯公開發(fā)表了第一個面向地質(zhì)應(yīng)用的計算機(jī)程序,標(biāo)志著計算機(jī)技術(shù)在地質(zhì)研究中應(yīng)用的開端,加速了

6、地質(zhì)學(xué)的定量化研究進(jìn)程。1958年Sichel和Kridge編著的地質(zhì)統(tǒng)計學(xué)及Allais(1957)發(fā)表的單元中礦床數(shù)服從泊松分布的礦產(chǎn)資源定量評價等重要文獻(xiàn)奠定了地質(zhì)統(tǒng)計學(xué)分支學(xué)科的基礎(chǔ),是數(shù)學(xué)地質(zhì)早期發(fā)展的重要階段。,3、形成發(fā)展階段(1961-1980) 自1968年在布拉格第23屆國際地質(zhì)大會上成立國際數(shù)學(xué)地質(zhì)協(xié)會(IAMG)并由維斯捷列馬斯任第一屆國際數(shù)學(xué)地質(zhì)協(xié)會主席以來,數(shù)學(xué)地質(zhì)這一邊緣交叉學(xué)科得到了長足的發(fā)展。1969年出版了兩種專門的數(shù)學(xué)地質(zhì)刊物Mathematical Geology和Computers 方程顯著 接受假設(shè);方程不顯著,、相關(guān)系數(shù)檢驗(yàn)法,拒絕假設(shè),方程顯著

7、接受假設(shè),方程不顯著,第三次,有時不建立回歸方程,只計算相關(guān)系數(shù)。 相關(guān)分析。但注意要進(jìn)行顯著性檢驗(yàn)。 四、利用回歸方程預(yù)測: 還可給出預(yù)測精度。,五、計算步驟,1、建立回歸方程,2、檢驗(yàn),拒絕假設(shè);方程顯著 接受假設(shè);方程不顯著,相關(guān)系數(shù)檢驗(yàn)法,拒絕假設(shè),方程顯著 接受假設(shè),方程不顯著,3、利用回歸方程預(yù)測: 還可給出預(yù)測精度。,第二節(jié)一元非線性回歸,當(dāng)散點(diǎn)圖不接近直線時,可考慮用一元曲 線去表征X、Y的關(guān)系。-一元非線性回歸 常用的一元曲線有以下幾種: 1、指數(shù)函數(shù):,2、對數(shù)函數(shù):,3、另一中指數(shù)函數(shù):,4、冪函數(shù):,5、多項(xiàng)式: 用多元線性回歸分析的方法求系數(shù)。 非線性回歸,首先根據(jù)散

8、點(diǎn)圖選擇擬合函 數(shù),再轉(zhuǎn)換成線性回歸問題求回歸系數(shù)。,第三節(jié)多元線性回歸,研究一個因變量和多個自變量間的線性依 賴關(guān)系。 一、數(shù)學(xué)模型 和回歸方程的求法,由(2)得: 代入(1)得:,二、多元線性回歸的顯著性檢驗(yàn),拒絕假設(shè),回歸效果顯著 接受假設(shè),回歸效果不顯著,復(fù)相關(guān)系數(shù): 偏相關(guān)系數(shù):,三、對各自變量的顯著性檢驗(yàn)(第四次),標(biāo)準(zhǔn)回歸系數(shù): 對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,建立回歸方 程,此時的回歸系數(shù)變量標(biāo)準(zhǔn)回歸系數(shù)。 值的正負(fù)和大小,一定程度上反映與因變量 的關(guān)系。,四、預(yù)測,由回歸方程對因變量的值進(jìn)行預(yù)測。,計算實(shí)例,某矽卡巖型白鎢礦中鎢(wo3)對鉍(Bi)、鉬(Mo)的線性依賴關(guān)系研究

9、。,第四節(jié)逐步回歸分析簡介,一、基本思想 一個好的回歸方程,應(yīng)包含盡量多的與因 變量Y有關(guān)的自變量,尤其不能漏掉對Y有顯 著作用的變量;另一方面,方程中不宜包含 與Y關(guān)系不大的自變量。否則不但增加計算量 而且對預(yù)測結(jié)果形成干擾。所以在建立方程 時應(yīng)對自變量進(jìn)行篩選(地質(zhì)認(rèn)識、數(shù)學(xué))。 逐步回歸分析:在多元回歸分析的基礎(chǔ)上,增加了用數(shù)學(xué)方法篩選自變量的過程。一種 算法上的改進(jìn)。 大致步驟:在所考慮多個自變量中,根據(jù) 它們對Y的重要性的大小,逐個引進(jìn)方程。隨 著變量的不斷引入,先前引入方程的某個自 變量可能會失去重要性,則要根據(jù)標(biāo)準(zhǔn)剔除。 一直進(jìn)行,直到已引入的變量不能剔除,未引 入的變量不能引入

10、為止。-最優(yōu)方程。,逐步回歸分析:是指從眾多可供選擇的自變量中篩選出對因變量y影響顯著的變量xi(i=1,2,m),并確定y與xi之間相關(guān)關(guān)系的最優(yōu)化回歸方程的一種統(tǒng)計分析方法。,二、變量的引入與剔除標(biāo)準(zhǔn) 偏回歸平方和:,三、算法實(shí)現(xiàn) 求逐步回歸方程最終歸結(jié)為解線性方程組 的問題。用的是求解求逆的并行方案。 回歸分析中,樣品數(shù)至少要大于變量的個 數(shù)。,0、求出相關(guān)系數(shù)矩陣,第一步、選擇第一個變量進(jìn)入回歸方程,考察所有自變量的方差貢獻(xiàn),取其中最大者,記為,即:,作F檢驗(yàn),若,則變量,對y的變化起著重要作用,引變量進(jìn)入回歸,方程,并按右邊公式進(jìn)行緊湊消元變換,得到相關(guān)增廣矩陣 轉(zhuǎn)入第二步,若,則變

11、量,不能引入回歸方程,回歸就此結(jié)束,結(jié)果是方,程中沒引入任何變量,第二步、當(dāng)?shù)谝粋€變量已經(jīng)選入方程,繼續(xù)進(jìn)行回歸運(yùn)算。,(1)首先檢驗(yàn)進(jìn)入回歸方程的變量是否要剔除,由于回歸方程中只有一個變量,并且是剛引入的,因此不可能立即被剔除,這步檢驗(yàn)省略,(2) 檢驗(yàn)是否要選入變量,利用R(1)計算不在回歸方程中的變量的方差貢獻(xiàn):,取其中最大者,記為,即:,若,則把變量,再引入回歸方程,并對R(1)進(jìn)行緊湊消元變換,得到新的增廣矩陣R(2),若,則回歸結(jié)束。由R(1)得到:,標(biāo)準(zhǔn)回歸系數(shù),標(biāo)準(zhǔn)化變量回歸方程,剩余平方和,回歸平方和,復(fù)相關(guān)系數(shù),自由度,自由度,第三步 根據(jù)新得到R(2)做下一步回歸運(yùn)算,(

12、1)首先檢驗(yàn)已進(jìn)入的變量有無要剔除的,第五節(jié)回歸分析應(yīng)用實(shí)例,解決問題: 、研究變量間的相關(guān)關(guān)系; 、預(yù)測。 一、求某地黃河水中砷含量與懸浮性固體含 量之間的關(guān)系。 在黃河水系黑石關(guān)斷面處取12個水樣得到 數(shù)據(jù):(統(tǒng)一數(shù)量級較好),二、礦體剝蝕深度預(yù)測,地質(zhì)找礦中的兩個重要問題: 、評價地質(zhì)體的含礦性; 、評價礦體的剝蝕深度。 評價礦體的剝蝕深度轉(zhuǎn)換回歸分析 選擇模型礦體,以標(biāo)高為因變量,以垂向 分帶明顯的元素或元素比值為自變量組織原 始數(shù)據(jù),建立回歸方程。實(shí)現(xiàn)問題的轉(zhuǎn)換。 兩江銅礦:六個礦帶;其中一個有工程:,已知礦體下延500多米,采樣點(diǎn)在淺部。 對8號異常(CO、NI、MO)代入方程:

13、Y=75米;3號異常:Y=-10米。,說明:從元素組合的角度看,號異常地 表出露處,和已知礦體埋深90米左右處相 當(dāng),說明8號礦體剝蝕程度較大,同理3號異 常剝蝕程度較小,3號異常優(yōu)于剝8號異常。 本實(shí)例的問題是模型控制深度太淺。 注意:模型區(qū)和預(yù)測區(qū)的相似性。,三、地下水平均水位預(yù)測,研究地下水的水位和用水量的關(guān)系,控制 用水量,為制定用水計劃提供依據(jù)。 河北某地對一年的月采水量和月平均水位 進(jìn)行了統(tǒng)計:,可根據(jù)上月水位和計劃用水量預(yù)測本月的 水位,控制用水量。變量中可考慮加入月降 水量等與水位有關(guān)的因素。 注意“轉(zhuǎn)換”的思想。,四、在資源量估算及成礦預(yù)測中的應(yīng)用,YOUR SITE HER

14、E,實(shí)例 安徽地區(qū)玢巖鐵礦床礦石礦物為磁鐵礦,YOUR SITE HERE,已知n=32p=2,未知m=7,x1 磁異常指數(shù) x2 閃長玢巖出露面積比值 y 礦床經(jīng)濟(jì)價值(作對數(shù)變換) y 3.5 礦點(diǎn) 小礦 大中礦,UnitIDx1x2y 60.958 0.010 0.778 121.456 24.200 2.204 140.001 0.010 0.477 201.861 36.250 4.007 212.301 0.750 0.477 272.045 6.250 5.385 283.057 35.210 5.636 310.612 0.010 0.477 331.513 7.000 0.4

15、77 352.000 22.700 5.763 361.468 7.250 3.992 370.001 0.010 0.477 430.783 0.570 0.477 451.301 73.000 5.467 462.672 24.200 5.035 473.250 75.200 3.464 561.096 7.000 0.477 580.001 8.500 2.553 592.950 11.000 0.829 601.491 11.000 0.477 630.001 0.750 0.954 640.001 1.500 0.954 650.001 5.750 4.625 660.001 1.5

16、00 0.477 670.001 0.010 0.477 680.001 0.750 0.954 760.001 0.010 3.437 770.001 0.010 0.477 830.001 0.010 0.778 870.001 1.000 0.477 890.001 0.150 2.813 1000.001 0.010 0.477,UnitIDx1x2y 291.602 0.001 300.001 0.001 340.001 0.750 441.021 0.001 482.672 34.500 491.740 0.001 511.491 22.000,YOUR SITE HERE,X1,

17、y,y,X1,X2,X2,y,X2,X1,YOUR SITE HERE,y = 1.1921 + 0.3241*x1 + 0.0489*x2,yMean = 2.0572 SST = 117.8631 SSE = 73.2383 SSR = SST-SSE = 44.6248,YOUR SITE HERE,y,X2,X1,YOUR SITE HERE,UnitIDx1x2yyfity-yfit 60.958 0.010 0.778 1.503 -0.725 121.456 24.200 2.204 2.848 -0.644 140.001 0.010 0.477 1.193 -0.716 20

18、1.861 36.250 4.007 3.569 0.438 212.301 0.750 0.477 1.975 -1.498 272.045 6.250 5.385 2.161 3.224 283.057 35.210 5.636 3.906 1.731 310.612 0.010 0.477 1.391 -0.914 331.513 7.000 0.477 2.025 -1.548 352.000 22.700 5.763 2.951 2.812 361.468 7.250 3.992 2.023 1.969 370.001 0.010 0.477 1.193 -0.716 430.783

19、 0.570 0.477 1.474 -0.997 451.301 73.000 5.467 5.185 0.282 462.672 24.200 5.035 3.242 1.793 473.250 75.200 3.464 5.925 -2.461 561.096 7.000 0.477 1.890 -1.413 580.001 8.500 2.553 1.608 0.945 592.950 11.000 0.829 2.686 -1.857 601.491 11.000 0.477 2.214 -1.737 630.001 0.750 0.954 1.229 -0.275 640.001

20、1.500 0.954 1.266 -0.312 650.001 5.750 4.625 1.474 3.151 660.001 1.500 0.477 1.266 -0.789 670.001 0.010 0.477 1.193 -0.716 680.001 0.750 0.954 1.229 -0.275 760.001 0.010 3.437 1.193 2.244 770.001 0.010 0.477 1.193 -0.716 830.001 0.010 0.778 1.193 -0.415 870.001 1.000 0.477 1.241 -0.764 890.001 0.150

21、 2.813 1.200 1.613 1000.001 0.010 0.477 1.193 -0.716,y,yfit,YOUR SITE HERE,F0.01(2,29)=5.42 F0.05(2,29)=3.34 F0.1(2,29)=2.49,R2 = SSR/SST = 0.3786 F = (SSR/2)/(SSE/29) = 8.8350 p-value = 0.0010,= sqrt(SSE/29) = 1.5892,YOUR SITE HERE,YOUR SITE HERE,2,礦點(diǎn),小礦,大中礦,3.5,未知單元預(yù)測,預(yù)測臨界回歸估計值 = 2.5,已知單元8個,YOUR S

22、ITE HERE,本講介紹的線性回歸,僅僅是回歸的一種,也是歷史最悠久的一種。 但是,任何模型都是某種近似; 線性回歸當(dāng)然也不例外。 它被長期廣泛深入地研究主要是因?yàn)閿?shù)學(xué)上相對簡單。 它已經(jīng)成為其他回歸的一個基礎(chǔ)。 應(yīng)該用批判的眼光看待這些模型。,NOTES,第六節(jié) SPSS統(tǒng)計分析軟件的應(yīng)用,第三章趨勢分析,研究變量在空間上的變化規(guī)律的一種多元 統(tǒng)計分析方法。 如觀測某元素的含量: 、區(qū)域性變化部分:受區(qū)域巖性和深大地 質(zhì)構(gòu)造控制,反映指標(biāo)的區(qū)域性分布規(guī)律。 局部變化部分:受局部性地質(zhì)因素控制, 反映指標(biāo)的局部性分布規(guī)律。 、隨機(jī)性變化部分:反映隨機(jī)因素的影響,趨勢面分析的基本方法思路:就是

23、要對數(shù)據(jù)中所包含的趨勢值、局部異常值和隨機(jī)干擾值等三部分信息進(jìn)行分析,排除隨機(jī)干擾信息,找出區(qū)域性變化趨勢,突出局部異常。,(第五次),趨勢分析是用適當(dāng)?shù)臄?shù)學(xué)曲面(趨勢面)去 擬合觀測值,將觀測值分成兩部分: 趨勢值:反映區(qū)域性變化部分; 剩余值:反映局部變化和隨機(jī)性變化部分。 趨勢分析分為: 一維趨勢分析 二維趨勢分析 三維趨勢分析,趨勢面方程。 通常將趨勢面方程表示成觀測點(diǎn)坐標(biāo)的多 項(xiàng)式多項(xiàng)式趨勢分析。 將趨勢面方程表示成觀測點(diǎn)坐標(biāo)的調(diào)和函 數(shù)調(diào)和趨勢分析。,常見的各種趨勢函數(shù)的數(shù)學(xué)關(guān)系和示意圖,一、趨勢面方程的求法,二、趨勢面擬合程度檢驗(yàn),實(shí)例分析:有某油層18口井的鉆井資料,其中某層的

24、厚度變化如表4-3所示,求該層厚度變化的二次趨勢面,并檢驗(yàn)其顯著性,作出其剩余分布圖,指出正常場分布。,解:采用二次趨勢面方程:,1、求出的趨勢面系數(shù)滿足的方程組,2、解得系數(shù),3、計算剩余的平方和,4、計算統(tǒng)計量,擬合度,統(tǒng)計量,5、顯著性檢驗(yàn),若取顯著性水平,查F分布表,因此,在顯著性水平,下,趨勢面擬合是顯著的。,三、趨勢分析可解決的問題,1、擬合問題 要求方程擬合度要高; 2、分離區(qū)域異常和局部異常 3、在化探異常處理中,常用趨勢值作為異常 下限圈定異常。(發(fā)現(xiàn)低背景下的異常),四、幾點(diǎn)說明,1、測點(diǎn)要盡量分布均勻;測點(diǎn)少時方程的 次數(shù)不宜過高。 2、剔除特高(低)值; 3、趨勢分析的

25、結(jié)果不能外推;回歸分析可 以外推。 4、滑動平均趨勢分析。,5、剩余分析 第i點(diǎn)的剩余值是原始觀測值與趨勢值之差,即: 地質(zhì)變量的原始觀測數(shù)據(jù)包含趨勢值與剩余值兩部分。趨勢值反映區(qū)域性大范圍內(nèi)的變化情況,剩余值反映局部異常的變化特點(diǎn),二者結(jié)合起來可以幫助人們深入的作地質(zhì)分析。 地質(zhì)構(gòu)造觀測數(shù)據(jù)擬合求取的趨勢面圖反映區(qū)域構(gòu)造背景,剩余圖則反映在這一背景下的局部異常,從中可以發(fā)現(xiàn)低緩異常帶。 剩余圖零值線的區(qū)域走向往往反映了區(qū)域斷裂的分布。 趨勢面擬合物探資料和地球化學(xué)指標(biāo)時,利用剩余圖可以找出異常帶,這些異常帶往往與特定的地質(zhì)條件,特別是與許多成礦條件(比如生油、儲油條件等)有關(guān)。,正剩余、異常

26、分量與異常分布圖,剩余值并非完全等于局部異常,它是局部異常分量ui與隨機(jī)分量vi之和。即:,一般要從剩余值中減去隨機(jī)分量vi,將所有正剩余的平均值作為隨機(jī)分量:,各點(diǎn)的異常分量ui是各點(diǎn)的剩余值減去該點(diǎn)的隨機(jī)分量vi。從正剩余中去掉vi ,就可以得出該點(diǎn)的異常分量ui,,第四章 聚類分析(第六次),根據(jù)多個指標(biāo)對研究對象進(jìn)行數(shù)字分類的 一種多元統(tǒng)計分析方法。 原始數(shù)據(jù)的形式:,型聚類分析:根據(jù)變量在各樣品上的觀 測值對變量進(jìn)行分類。 型聚類分析:根據(jù)樣品在各變量上的取 值對樣品進(jìn)行分類。 基本思想:將變量(或樣品)看成多維空 間中的點(diǎn),根據(jù)變量點(diǎn)(或樣品點(diǎn))在空間 上的親疏關(guān)系實(shí)現(xiàn)定量分類。,

27、第一節(jié)原始數(shù)據(jù)的預(yù)處理,目的:使各變量統(tǒng)一量綱。 一、標(biāo)準(zhǔn)化處理,性質(zhì): 、變量的均值為0, 方差為1。,2、相關(guān)系數(shù)不變,二、正規(guī)化處理,性質(zhì): Q型聚類分析多用這種處理。,第二節(jié) 相似性統(tǒng)計量,聚類分析是根據(jù)變量(樣品)間的相似程 度實(shí)現(xiàn)對變量(樣品)分類的。為衡量變量 (樣品)間的相似程度一般采用如下幾種統(tǒng) 計量。 一、相似系數(shù) 考慮對樣品分類,每個樣品可看成維變 量空間的向量,兩樣品向量的夾角余弦 相似系數(shù)。,相似系數(shù)陣中包含樣品是否相似的信息。,類似的考慮,也可形成變量間的相似陣: 通常習(xí)慣于用相似系數(shù)做型聚類分析。,二、相關(guān)系數(shù),在型聚類分析中,通常用相關(guān)系數(shù)度量 變量間的相似性:

28、 矩陣中包含變量是否相似的信息,構(gòu)成了 型聚類分析的基礎(chǔ)。,三、距離系數(shù),為了度量樣品間的差異,用兩樣品點(diǎn)在M 維變量空間的歐氏距離:,各種系數(shù)的圖示,第三節(jié)分類譜系圖的建立,在相似性矩陣中,包含研究對象是否相似 的信息,構(gòu)成了分類的基礎(chǔ),但不直觀。 譜系圖:在相似性矩陣的基礎(chǔ)上,作出直 觀反應(yīng)分類結(jié)果的二維圖。 、一次計算成圖法 、逐次計算成圖法,形成原則 (1)若選出一對樣品在已經(jīng)分好的組中都未出現(xiàn)過,則把它們形成一個獨(dú)立的新組。 (2)若選出的一對樣品中,有一個出現(xiàn)在已經(jīng)分好的組里,則把另一個樣品也加入到該組中去。 (3)若選出兩個樣品,它們分別出現(xiàn)在已經(jīng)分好的兩個組中,則把這兩個組聯(lián)在

29、一起。 (4)若選出的一對樣品都出現(xiàn)在同一組中,則這對樣品就不再分組了。,第四節(jié)聚類分析的計算方法和步驟,一、原始數(shù)據(jù)準(zhǔn)備(鄂東某地七個巖體),二、對原始數(shù)據(jù)進(jìn)行預(yù)處理 型:標(biāo)準(zhǔn)化 型:正規(guī)準(zhǔn)化 三、形成相似陣 型:相關(guān)系數(shù),型:距離系數(shù);相似系數(shù),四、形成譜系圖,、一次計算成圖法:連圖表,如果用相似系數(shù)、相關(guān)系數(shù)為統(tǒng)計量時, 應(yīng)由大到小進(jìn)行連圖。 一次計算成圖法較簡單,但結(jié)果粗躁。 聚類分析是動態(tài)分類。,2、逐次計算成圖法(第七次),1)選出相似性最大的變量(樣品)對合成一類。 2)將合并的變量(樣品)看成一個變量 (樣品)重新組織原始數(shù)據(jù)、計算相似陣。 3)重復(fù)1)、2)步,直到所有對象合

30、并成 一類為止。,根據(jù)連圖表作出譜系圖,結(jié)果和一次計算結(jié)果類似。 R型:合并變量。 五、對分類結(jié)果給出解釋。,R型聚類分析計算實(shí)例,某火山巖型金礦區(qū)主要成礦成巖元素的聚類分析 在該礦區(qū)采集標(biāo)本6快,分別測定Cr、Ni、Sr、Au、Cu、S的含量。使用聚類分析對變量進(jìn)行分類,研究金礦化過程中,元素的地球化學(xué)分類特征及其地質(zhì)意義,(AuCu) 、S=2 (Au、Cu)+ S/3,(Ni Sr)、 Cr = 2 (Ni、Sr)+ Cr/3,在R=0.75水平,變量分為兩類:Au、 Cu、S為一類,為主要礦化元素; Cr、Ni、 Sr為一類,為火山巖中的微量元素,代表火山巖成分。,第五節(jié) 離差平方和法

31、(Q型的一種算法),原理:如果若干個樣品合并后,離差平方 和的增量較小,說明樣品點(diǎn)較集中,可以分 成一類;若離差平方和的增量較大,說明樣 品點(diǎn)較分散,不能分成一類。,形成各樣品間的離差平方和增量陣,形成各樣品間的離差平方和增量陣,第六節(jié) 有序樣品的聚類(最優(yōu)分割)(第八次 ),許多地質(zhì)數(shù)據(jù)是有序的 ,這些按一定順序排列的地質(zhì)樣品 ,叫做有序的地質(zhì)樣品 。如沿地層剖面采集的樣品;鉆孔中取出的巖心樣品;蝕變帶的研究中 ,從巖體中心到圍巖的蝕變剖面的樣品等等 ,它們都是有序地質(zhì)變量。這類數(shù)據(jù)的特點(diǎn)是樣品的前后次序不能變更。所以 ,一些不考慮樣品排列順序的數(shù)學(xué)處理方法 ,對此不適用。 有序樣品的聚類分

32、析就是對有序樣品進(jìn)行分段的統(tǒng)計方法。,第六節(jié) 有序樣品的聚類(最優(yōu)分割),對 n個有序樣品進(jìn)行分割 , 有多種劃分方法 ,每一種分法稱為一種分割。在所有這些分割中 ,有一種分割使得各段內(nèi)部樣品之間差異性最小 ,而段與段之間的差異性最大。這種對 n個樣品分段并使組內(nèi)離差平方和最小的分割方法 ,稱為最優(yōu)分割法。,最優(yōu)分割在地質(zhì)研究中是一個非常有用的手段 ,只要地質(zhì)體的某些地球化學(xué)特征存在規(guī)律性的差異 ,采用最優(yōu)分割的數(shù)學(xué)處理方法 ,就能按順序在最理想的地方進(jìn)行分段。通過對地層中采集的具某些地球化學(xué)特征樣品的最優(yōu)分割 ,能在地層的劃分對比中發(fā)揮重要的輔助作用;在找礦過程中 ,該方法更顯得天獨(dú)厚的優(yōu)勢

33、 ,它能進(jìn)行蝕變、礦化及礦體的準(zhǔn)確分帶.,第六節(jié) 有序樣品的聚類,一、最優(yōu)分割,把n個有序樣品分為k組,有多種分法,其中分后各組內(nèi)樣品差異最小,而各組之間差異最大的的分法稱為最優(yōu)k分割法,相應(yīng)的結(jié)果稱為最優(yōu)k分割。,求出總的離差平方和: I,J段的段內(nèi)離差平方和,第一段,第二段,第k段,段間離差平方和:,S為總離差平方和,段內(nèi)離差平方和,段間離差平方和,對于給定的有序數(shù)列,S是個確定的值,因此,若使段內(nèi)離差平方和S1為最小,則段間離差平方和S2必為最大。由此看來,使段內(nèi)離差平方和為最小的分割法就是最優(yōu)分割法。,二、最優(yōu)分割實(shí)現(xiàn),最優(yōu)二分割,最優(yōu)三分割,最優(yōu)兩段分割點(diǎn),S1=0;s=0;j=1

34、For i=1;i=n-1 S1=s s=d(1,i)+ d(i+1,n) if s=s1 j=i ,最優(yōu)三段分割點(diǎn),S1=0;s=0; For i=1;i=n-1 if i=j i=i+1 S1=s if ij s=d(1,i)+ d(i+1,j) )+ d(j+1,n) else s=d(1,j)+ d(j+1,i) )+ d(i+1,n) if s=s1 k=i ,二、最優(yōu)分割的計算步驟,1、數(shù)據(jù)正規(guī)化,2、計算段內(nèi)變差矩陣,3、最優(yōu)二分割、三分割、四分割,三、實(shí)例分析,多元有序地質(zhì)數(shù)據(jù)的最優(yōu)分割法在工程中的應(yīng)用,王生全 , 唐亦川 , 薛喜成 (西安科技學(xué)院 地質(zhì)與環(huán)境工程系 ,陜西

35、西安 710054) 摘 要: 采用數(shù)學(xué)地質(zhì)理論中的多元有序地質(zhì)數(shù)據(jù)的最優(yōu)分割方法對工程場地松散巖土層亞層進(jìn)行了劃分。實(shí)踐證明 ,在土樣物理力學(xué)性能評價指標(biāo)選取合理的前提下 ,該方法簡單方便 ,行之有效 ,可作為一種輔助手段幫助地質(zhì)人員開展對土層的詳細(xì)研究。,西安市某建筑場地厚層黃土的分層問題,例一:西安市某建筑場地厚層黃土的分層問題。 該場地地貌單元屬渭河 級階地。據(jù)鉆探及探井揭露,場地內(nèi)地層主要由第四紀(jì)全新世的人工填土 和中、上更新世的風(fēng)積黃土及殘積古土壤構(gòu)成。按地層成因及巖性特征,自上而下可劃分為 4 個大的地質(zhì) 層,即全新世的人工填土(Q4 ) ,厚 0.5 2.2 m;上更新世的風(fēng)積

36、黃土(Q3 ) ,厚 9 m 左右;上更新世的 殘積古土壤(Q3 ) ,厚4.905.40 m ;中更新世的風(fēng)積黃土(Q2 ) 厚3.03.30 m。由于第二層土即上 更新世的風(fēng)積黃土層(Q3 ) 在本區(qū)很厚 ,為了地基承載力及沉降量估算 ,按照對黃土評價經(jīng)常采用的主 4 ,5 要指標(biāo) ,對該層土進(jìn)行了亞層劃分。這些指標(biāo)包括:天然含水量( w) 、干重度( rd) 、飽和度(sr) 、液限孔 隙比( wL/ e) 、含水比( u) 、濕陷系數(shù)(s) 、壓縮系數(shù)( a0. 1- 0. 2) 、壓縮模量( Es0. 10. 2) 等。表 1 是該層黃土的 取樣及主要物理力學(xué)性質(zhì)指標(biāo)試驗(yàn)結(jié)果。將這些

37、數(shù)據(jù)輸入計算機(jī),采用編制的最優(yōu)分割BASIC程序 ,經(jīng)上 機(jī)運(yùn)算 ,得到最優(yōu) 2 段至最優(yōu) 7 段分割后的分割段數(shù)、分割點(diǎn)樣品號、分段結(jié)果與段直徑總和(表 2) 。將分 割段數(shù)與相應(yīng)段直徑總和繪成相關(guān)曲線圖(圖 1) 后發(fā)現(xiàn),曲線的明顯拐點(diǎn)在段數(shù) k = 3 處,而且分割點(diǎn) 4 號樣與 1 號樣在各級分割中出現(xiàn)的次數(shù)最多。因此將該黃土層細(xì)分為 3 個亞層較為合適。這一分段結(jié)果與 專家實(shí)際分層結(jié)果相一致。,徐州某工程場地較厚粘土層的分層問題,例二:徐州某工程場地較厚粘土層的分層問題,該場地地貌單元處于魯南低山丘陵南緣與沖積平原的過渡地帶。據(jù)鉆孔揭露和地質(zhì)調(diào)查 ,場地內(nèi)地 層自上而下分為 4 層:

38、第一層為第四紀(jì)全新世的沖積粉質(zhì)粘土(Q4 ) ,厚 03.0 m;第二層為第四紀(jì)上更 新世的沖積粘土層(Q ) ,厚 13.3 m左右;第三層為白堊系上統(tǒng)(k )全風(fēng)化至弱風(fēng)化的砂巖及泥巖層 ,厚度大于25 m;第四層為寒武系( )弱風(fēng)化的灰?guī)r及白云巖 ,厚度大于10 m。由于第二層粘土較厚 ,為準(zhǔn)確 估算地基承載力與沉降量 ,按照粘土工程性能評價指標(biāo) ,對該土層進(jìn)行了亞層劃分。表3 是該層土的取 樣及室內(nèi)物理力學(xué)性質(zhì)試驗(yàn)結(jié)果。同樣將這些數(shù)據(jù)輸入計算機(jī) ,采用最優(yōu)分割BASIC 程序進(jìn)行計算 ,得 到最優(yōu)2 段至最優(yōu)6 段分割的結(jié)果(表4) 。將分割段數(shù) k 與相應(yīng)的段直徑總和繪成相關(guān)圖形后(

39、圖2) ,發(fā) 現(xiàn)曲線的明顯拐點(diǎn)在段數(shù) k =4 處。因此 ,將該土層細(xì)分為 4 個亞層較為合適。這一劃分結(jié)果與地質(zhì)專 家實(shí)際分層結(jié)果相一致。,第七節(jié)聚類分析應(yīng)用實(shí)例,R型:對變量分類。研究元素的組合關(guān)系,確 定找礦的指示元素。 Q型:對樣品分類。物化探異常評價;地質(zhì)體 的分類等。 1、江西德興銅鉬礦: 在礦體和圍巖采集508個樣品,分析了14中 元素:Cu、Pb、Zn、Ag、Sn、W、Mo、 V、Co、Ni、Cr、Ti、Mn、Ba。,當(dāng)r=0.3時,元素分為兩類: ( Cu、Pb、Zn、Ag、Mo、 Mn、 Co ) (V、Ni、Cr、Ti、Mn、Ba 、W) 第一類:成礦作用中的活波組分,可

40、作為 地球化學(xué)找礦的指示元素,分成幾個亞類, 反映熱液礦床多次成礦作用的特點(diǎn)。 第二類: 圍巖的惰性組分。,2、遼寧排山樓金礦,NE向礦體聚類分析譜系圖,EW向礦體聚類分析譜系圖,、紅花溝金礦 石英脈型金礦,104條石英脈,生產(chǎn)礦脈6 條H2、L51、L10等。 R型:確定地球化學(xué)找礦的指示元素(用 礦石樣品)。 Q型:各脈作為樣品,指示元素為變量, 對未知脈進(jìn)行評價。,3、對不同類型的對象(不同類型的礦床)分別做R型聚類分析,得出各自的元素組合特征,根據(jù)其差異性,提供其成因討論的思路。 4、有文章表明:對學(xué)生成績進(jìn)行R型分析,總是數(shù)學(xué)、物理關(guān)系密切。,第八節(jié) SPSS統(tǒng)計分析軟件的應(yīng)用,第五

41、章判別分析,在已知研究對象分類的條件下,根據(jù)已知 研究對象的數(shù)字(變量)特征,建立判別函 數(shù),對未知對象進(jìn)行判別分類的一種多元統(tǒng) 計分析方法。 一般取多個判別變量,以減少重疊現(xiàn)象。 如某地已探明12個化探異常: 礦異常: Cu: 220-2000ppm 非礦異常: Cu: 85-800ppm,單變量:、判別標(biāo)準(zhǔn)容易確定; 、重疊現(xiàn)象。 多變量:、重疊現(xiàn)象減少; 、判別標(biāo)準(zhǔn)不容易確定。 判別分析可以解決這個矛盾。 多變量判別函數(shù)(綜合變量),判別函數(shù): 求判別函數(shù)就是求:C1, C2 ,.Cm,石灰?guī)r A,石灰?guī)r B,孔隙度 x1,滲透率 x2,例:設(shè)從總體A、B兩套石灰?guī)r中分別取了31、36個

42、樣品,并且每個樣品有x1()、x2(K)兩個變量。在x1、x2坐標(biāo)系中所有樣品的散點(diǎn)圖如右所示。對于一個來自于A或者B的一個新樣品X來說,如何判斷它的所屬總體?,一般情況下,若樣品有m個變量,那么新變量y形式為:,y是由xj(j1,2,m)線性組合而成的一個綜合性指標(biāo),它是m+維空間中的一個平面,稱為之為線性判別函數(shù),其中c1,c2,cm叫做判別系數(shù)。,第一節(jié) Fisher 準(zhǔn)則下的二類判別(第九次),一、判別函數(shù)的求法,Fisher準(zhǔn)則:,二、判別規(guī)則,三、判別效果檢驗(yàn),當(dāng)選定的兩母體(A、B)有差異時,建 立的判別函數(shù)才有意義,否則無意義。,當(dāng)檢驗(yàn)結(jié)果不好時: 1、母體(樣品)選擇不合適;

43、 2、變量選擇不合適。 四、變量選擇 1、I值最大法,2、變量貢獻(xiàn):,五、計算步驟(第十次),、原始數(shù)據(jù)準(zhǔn)備; 、求判別方程; 、求Y0值; 4、判別效果檢驗(yàn)(判別變量篩選;已知 樣品篩選); 5、對未知樣品進(jìn)行判別分類。,判別分析計算實(shí)例,某爆發(fā)火山角礫巖筒型銅礦區(qū)外圍標(biāo)本含礦性的判別分類 在礦區(qū)采集有代表性礦石標(biāo)本6快,在礦區(qū)外圍無礦區(qū)采集有代表性標(biāo)本6快。變量SiO2、Al2O3、Na2O、Cu。未知標(biāo)本兩塊。,現(xiàn)有表所示的若干個油層和水層的樣品的四個指標(biāo):巖性系數(shù)x1、孔隙度x2、侵入系數(shù)x3和含油氣飽和度x4,若油層為組A,水層為B,現(xiàn)要求依表中的數(shù)據(jù)建立油水層的判別函數(shù)并檢驗(yàn)其有效

44、性。,解: 1、計算各組指標(biāo)的平均值和均值差,2、計算兩組的綜合協(xié)方差矩陣并形成方程組:,得到方程組為:,式中,,3、解上述方程組的判別系數(shù),從而,判別函數(shù)為:,4、計算各組判別函數(shù)的平均值和判別指標(biāo),因而,顯然判別函數(shù)是高度顯著的。,5、計算馬氏距離和統(tǒng)計量,6、原樣品代回判別函數(shù)回判,檢驗(yàn)判對率,第二節(jié)Bayes準(zhǔn)則下的多類判別,Bayes準(zhǔn)則,Bayes公式:設(shè)有G個母體構(gòu)成事件的完備群,對于樣品X,已知X在第K個母體的條件概率為p(x/k)和先驗(yàn)概率p(k)。k=1,2,G 則對于給定樣品X來自第g個母體的后驗(yàn)概率為,后驗(yàn)概率: 設(shè)所選的g個類型構(gòu)成事件的完備群,在先 驗(yàn)概率相等的條件

45、下,待判樣品屬于第k類的 后驗(yàn)概率為:,Bayes準(zhǔn)則:后驗(yàn)概率最大準(zhǔn)則。 根據(jù)原始數(shù)據(jù)求出各母體的概率密度函數(shù),多類判別關(guān)鍵是求出各類的概率密度函數(shù)。 假設(shè): 、各母體服從多元正態(tài)分布; 、各母體的協(xié)方差陣相等。,后驗(yàn)概率: 設(shè)所選的g個類型構(gòu)成事件的完備群,在先 驗(yàn)概率相等的條件下,待判樣品屬于第k類的 后驗(yàn)概率為:,二、判別函數(shù)的求法,第k個母體(類別)的概率密度函數(shù):,得到各母體的概率密度函數(shù): (第十一次),三、判別效果檢驗(yàn),通常計算判對率檢驗(yàn)方程的判別效果。,四、計算步驟,、原始數(shù)據(jù)準(zhǔn)備; 、求判別方程; 3、判別效果檢驗(yàn)(變量選擇、樣品選 擇); 4、對未知樣品進(jìn)行判別分類。 5

46、、計算未知樣品屬于各類的后驗(yàn)概率; -檢驗(yàn)判別結(jié)果的可靠性。,多類判別計算實(shí)例,鄂東某地七個巖體,判別效果檢驗(yàn) 待判樣品判別,待判樣品判別的后驗(yàn)概率:,實(shí)例分析現(xiàn)有表4-9所示的若干個油層、水層、油水層的樣品的四個指標(biāo):巖性系數(shù)x1、孔隙度x2、侵入系數(shù)x3和含油氣飽和度x4,若油層為組A,水層為B,現(xiàn)要求根據(jù)表中的數(shù)據(jù)建立判別函數(shù)并檢驗(yàn)其有效性。,解: 1、計算各組指標(biāo)的平均值,2、計算協(xié)方差矩陣S并求出它的逆矩陣S-1,結(jié)果為,3、計算各組的判別函數(shù)(以第一組)為例。計算結(jié)果用矩陣表示。,于是得到第一組判別函數(shù)為:,同樣可以求出第二組和第三組判別函數(shù):,4、對未知樣品進(jìn)行判斷(以第一組第一

47、個樣品為例),因?yàn)镕1(X)的值最大,所以樣品應(yīng)該為第一組。還可以算出樣品1歸于各組的后驗(yàn)概率,檢驗(yàn)同學(xué)自己完成,第三節(jié) 逐步判別分析,逐步判別分析就是在多類判別分析的基礎(chǔ) 上增加了用數(shù)學(xué)方法篩選判別變量的功能。,這里介紹的逐步判別所依據(jù)的模型是貝葉斯線性判別模型。問題是這樣提出的,判別分析中我們自然希望考慮盡多的變懸來區(qū)分各個總體,但是,變量選得越多所用的人力和物力也就越大,同時,引入不重要的變量并不能提高判別效果,為此,應(yīng)對可供分組的變量進(jìn)行挑選,逐步判別就是解決這個問題的。 總的說來,逐步判別和逐步回歸的思想類似,都采用”有進(jìn)有出”的算法,即每一步都進(jìn)行檢驗(yàn),在把一個重要的變量引入判別式

48、后,同時也考慮較早進(jìn)入判別式的某些變量,如果其重要性隨著新變量的引入而喪失,則把它即時地從判別式中剔去,而最終的判別式僅保留“重要的”變量。因此,首先要討論如何檢驗(yàn)變量的判別能力。,一、基本含義,一、基本原理,1、Wilks統(tǒng)計量,W樣本內(nèi)離差矩陣 B樣本間離差矩陣 T總離差矩陣,2、逐步篩選變量,(1)引入變量x(r)的Wilks統(tǒng)計量,F1服從第一自由度為(G-1),第二自由度為()的F分布。對于給定的檢驗(yàn)水平,查Fa (G-1, N-G-P )分布表。如果F1 Fa ,則變量x(r)的判別能力強(qiáng),把它引入判別函數(shù)。,(2)剔除變量x(r)的Wilks統(tǒng)計量,設(shè)逐步判別分析進(jìn)行了P步,共引

49、入了P個變量,第P+1步擬剔除變量x(r),此時,變量x(r)的判別能力可視為第P步引入x(r)的判別能力,F2服從第一自由度為(G-1),第二自由度為()的F分布。對于給定的檢驗(yàn)水平,查Fa (G-1, N-G-P+1 )分布表。如果F2 Fa ,則變量x(r)的判別能力強(qiáng),把它引入判別函數(shù)。,(3)矩陣W和T的變換公式,(4)計算判別函數(shù)和分組判別,設(shè)逐步判別分析進(jìn)行了P步,共引入了v(v m)個變量,此時,按下式計算判別函數(shù)的系數(shù)。,第四節(jié)幾點(diǎn)說明,一、二類判別和多類判別的區(qū)別: 、建立方程的數(shù)學(xué)準(zhǔn)則不同; 、多類判別可解決二類判別的問題; 、兩類問題應(yīng)該用二類判別分析; 、二類判別一個

50、判別方程;多類判別時 g個判別方程。,二、判別分析和聚類分析的區(qū)別: 、建立分類標(biāo)準(zhǔn)的數(shù)學(xué)準(zhǔn)則不同; 、判別分析要求事先已知類別及有已知屬性的樣品;聚類分析無此要求; 、判別分析只能對樣品進(jìn)行分類,聚類分析既可對樣品進(jìn)行分類(Q型)也可對變量進(jìn)行分類(R型); 4、判別分析是唯一分類;聚類分析是動態(tài)分類;,三、應(yīng)有盡量多的已知樣品,滿足統(tǒng)計規(guī) 律。 四、注意判別變量的選擇。 五、注意模型區(qū)和預(yù)測區(qū)的相似性。,第五節(jié) 應(yīng)用,物、化探異常的評價;石英脈含礦性的評 價;巖體的分類;古生物的分群、頭尾暈的 判別。 一、攀枝花-西昌地區(qū)基性、超基性巖體的含礦性評價: 本區(qū)與基性、超基性巖有關(guān)的銅鎳硫化物

51、 礦床有兩類: 1、含銅、鎳、鉑巖體; 2、含銅、鎳(不含鉑)巖體。,將已知巖體化為四類: 1、銅、鎳含礦巖體(36個樣) 2、銅、鎳礦化巖體(36個樣) 3、銅、鎳、鉑含礦巖體(60個樣) 4、銅、鎳、鉑礦化巖體(27個樣) 8個變量:Cu、Co、Ni、S、 Cu/Ni、 Co/Ni、 Cu/S、 Ni/S。,對未知巖體采樣(多個樣),代入方程, 若大部分樣品(50%以上)歸為某類,則該 巖體判歸此類。取得了好的效果。,二、山東招掖金礦帶礦上暈、礦下暈的判別 在玲瓏礦田大開頭礦段52號脈采集了19個 已知礦上暈樣品、 11個已知礦下暈樣品;以 原生暈的經(jīng)驗(yàn)?zāi)P蜑橐罁?jù),確定:ln(AgAs)、

52、 Ln(AuTe)、ln(Cu)、ln(Mn)為判別變量,,(第十二次),用方程對玲瓏礦田、望兒山礦床的已知礦 體上部暈7個剖面、已知礦體下部暈5 個剖面 158個進(jìn)行判別,結(jié)果判對149個,判錯21個 正確率88%。,YOUR SITE HERE,4. 應(yīng)用實(shí)例。 研究區(qū):寧蕪盆地北段 預(yù)測對象:玢巖型鐵礦。 預(yù)測比例尺:1:50,000 單元劃分:全區(qū)劃分為3 單元100個。 (1)根據(jù)研究區(qū)的地質(zhì)勘探情況,該區(qū)有8個單元為已知有礦單元,14個單元為已知無礦單元,另外78個單元為未知待判單元。 因此,令已知有礦單元為A總體,NA=8,YOUR SITE HERE,令已知無礦單元為B總體,N

53、B=8,剩余6個作為回判檢驗(yàn). (2)建立數(shù)學(xué)模型,即判別分析函數(shù), 經(jīng)過控礦地質(zhì)因素分析,選出7個與成礦關(guān)系密切的變量參加建模, x1接觸帶長度, x2單元中心與斷裂噴發(fā)帶的距離。 x4閃長玢巖出露面積, x5圍巖蝕變組合的相對熵值, x9磁異常特征值,,YOUR SITE HERE,x10重力異常特征值, x12巖層組合的相對熵。 最終建立判別函數(shù): R=0.0247X1-1.2246X2-0.036X4+0.041X5+0.1540X9- 0.008X10-0.0267X12 (3) 確定判別臨界值。 A總體的判別得分 B總體的判別得分 R0=-1.5885,YOUR SITE HERE

54、,(4) 顯著性檢驗(yàn)。 i) 對已知單元進(jìn)行回判,判對率93.3%,說明R0是顯著的,所建立的判別函數(shù)有效。 ii)馬氏檢驗(yàn)。 F=2.833, 而 判別函數(shù)在=0.1的顯著性水平上有效。,YOUR SITE HERE,(5)對未知單元進(jìn)行判別,預(yù)測。 結(jié)果,有22個單元的RR0,判為A類,為有礦遠(yuǎn)景單元。 (6)對22個有利遠(yuǎn)景單元的控礦條件和找礦潛力進(jìn)行評價,分析。 通過分析發(fā)現(xiàn),這些單元多數(shù)位于NE向斷裂和NW向斷裂火山噴發(fā)帶內(nèi)。而這兩個帶已被證明是本區(qū)重要的成礦條件,另外,這22個單元之中,有的已經(jīng)發(fā)現(xiàn)了礦點(diǎn),有些在空間上與已知礦床相鄰,因而,認(rèn)為這些單元具有良好的成礦條件和較大的成礦

55、潛力。,第六章 因子分析,因子分析的基本概念 因子分析是研究變量間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一種多元統(tǒng)計分析方法。 1900年C.斯皮爾曼發(fā)表了對學(xué)生考試成績分析的著名文章,可認(rèn)為是因子分析的開始。1957年由Krumbein把該方法引入到地質(zhì)學(xué)研究,后來,又由Imbrie對該方法在地質(zhì)學(xué)中的應(yīng)用和發(fā)展作了大量的基礎(chǔ)工作。,因子分析方法幫助我們對大量的地質(zhì)觀測資料進(jìn)行分析并作出較為合理解釋的一種多變量統(tǒng)計方法,是研究系統(tǒng)分類、成因分類的重要手段。成因是地質(zhì)學(xué)研究極其重要的內(nèi)容。因子分析將從以下三方面為成因推理提供重大幫助。 第一、簡化

56、結(jié)構(gòu)壓縮原始數(shù)據(jù)。 第二、指示成因推理方向 第三、分解地質(zhì)疊加過程,由于以上的原因,因子分析在地質(zhì)的應(yīng)用十分廣泛,已有效應(yīng)用于沉積盆地的研究、沉積物粒度的分析、沉積相研究、地層分析、古環(huán)境與古生物研究、礦床成因研究、及化探資料分析等各個方面。 根據(jù)它們的研究對象,因子分析大致可分為R型因子分析、Q型因子分析二種類型。在此僅介紹基于相關(guān)系數(shù)的R型因子分析。,基本思想:通過研究變量間相關(guān)陣的內(nèi)部 結(jié)構(gòu),將原始變量組成少數(shù)幾個公因子(相互獨(dú)立的新變量),各公因子是不同的變量組合,代表一種相對獨(dú)立的作用。提取出公因子,有助于對問題的研究分析。簡化結(jié)構(gòu)。 碳酸巖類的成分:,因子分析的提出,為盡可能完整描

57、述一個事物,往往要收集它的許多指標(biāo) 多指標(biāo)產(chǎn)生的問題: 計算處理麻煩 信息重疊 從眾多的指標(biāo)中剔除一些指標(biāo)又會造成信息丟失,因子分析是研究以最少的信息丟失將眾多原有變量濃縮成少數(shù)幾個因子,并使因子具有一定的命名解釋性的多元統(tǒng)計分析方法.其核心是用較少的相互獨(dú)立的因子反映原有變量的絕大部分信息.,因子變量的特點(diǎn) 這些綜合指標(biāo)稱為因子變量,是原變量的重造 個數(shù)遠(yuǎn)遠(yuǎn)少于原變量個數(shù),但可反映原變量的絕大部分方差 不相關(guān)性 可命名解釋性,第一節(jié)因子分析的數(shù)學(xué)模型,一、原始數(shù)據(jù)和相關(guān)陣:,二、數(shù)學(xué)模型,、公因子,相互獨(dú)立的新變量; 、單因子; 、單因子負(fù)載; 、公因子負(fù)載,數(shù)值上為變量和公因子的相關(guān)系數(shù),反映第 個公因子代表第個變量的能力。,反應(yīng)第 t 個公因子的重要程度; 反應(yīng) p 個公因子代表該變量的能力;,因子負(fù)載陣;建立變量和公因子的聯(lián)系, 確定公因子的地質(zhì)含義。,因子變量的特點(diǎn) 這些綜合指標(biāo)稱為因子變量,是原變量的重造 個數(shù)遠(yuǎn)遠(yuǎn)少于原變量個數(shù),但可反映原變量的絕大部分方差 不相關(guān)性 可命名解釋性,100個學(xué)生的數(shù)學(xué)、物理、化學(xué)、語文、歷史、英語的成績?nèi)缦卤恚ú糠郑?三、初始因子陣A與相關(guān)系數(shù)陣R間的關(guān)系,第二節(jié) 用主成份分析法求主因子解,主成份分析:當(dāng)變量具有一定相關(guān)關(guān)系 時,用少數(shù)幾個 綜合變量代替原 始變量。綜合變 量主成份。 它反應(yīng)了多個變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論