經典的數學地質學_第1頁
經典的數學地質學_第2頁
經典的數學地質學_第3頁
經典的數學地質學_第4頁
經典的數學地質學_第5頁
已閱讀5頁,還剩609頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數學地質講義,資源與土木工程學院 侯根群,緒 論,一、數學地質的定義 是地質學科中的一個分支學科、邊緣學科。 邊緣學科:數學 、地質學。 自然科學發(fā)展的趨勢:各學科之間相互滲透。 地質學、物理學-地球物理學-地球物理勘探; 地質學、化學-地球化學-地球化學找礦; 地質學、數學 -數學地質。 傳統(tǒng)地質學-定性描述為主,數學地質學科的出現是地質學發(fā)展史上的重要進展。,分支學科: 作為一個獨立的學科形成于上世紀60年代,標志為:1968年在巴黎召開的國際地質大會上正式成立了“國際數學地質學會(IAMG)”,開始出版geomathmatics雜志。 數學地質方法在地質研究中得到廣泛應用。取得了好的地質

2、效果,但不是成熟的學科。 數學地質發(fā)展遲緩的原因: 1、地質學科定性描述為主; 2、地質學研究對象復雜; 時空跨度大;地質事件的不可逆性。,兩種觀點: 1、狹義觀點:“數學地質是建立、檢驗和解釋地質過程概念的隨機模型科學?!?2、廣義觀點:“地質科學中全部數學的應用”,趙鵬大教授給出的定義: 數學地質是研究地質運動數量規(guī)律的科學。它以數學為工具、以計算機為手段、以解決地質問題為目的。 一般模式: 地質問題 數學問題 結果 地質解釋 合理的實現兩個“轉換”是取得好的地質效果的關鍵。 (1)熟練掌握各種數學地質方法的原理、應用條件及可解決問題的類型; (2)熟悉相應的地質問題。,數學地質的研究過程

3、 數學地質的基本工作過程可以概括為:由地質學家提出地質問題,分析問題的地質因素,建立相應的地質概念模型;選擇合適的數學方法,將定性的地質概念模型轉化為定量的數學模型并研制相應的應用軟件;對計算機輸出的定量結果及地質圖形資料進行地質解釋,并在此基礎上確定或修改給出的地質概念模型及相應的數學模型,以期解決所提出的地質問題。,二、數學地質產生的背景,1、數學在科學研究中扮演著非常重要的作用。 數學是探索各種科學規(guī)律的有效通用工具。凡是在研究量、量的變化、量的關系、量的關系的變化、量的變化的關系、關系的關系、變化的變化、主要關系和次要關系、共性、共性的共性等一系列復雜情況時沒有數學作為工具是不行的,只

4、是應用程度和范圍有所不同而已。,2、地質領域研究的發(fā)展需要數學工具的介入 (1)定性的描述滿足不了生產的需要。 (2)大量地質數據的產生也需要數學工具的介入。 3、計算機技術的飛速發(fā)展促進了數學和地質的結合,三、數學地質發(fā)展史(四個階段),1、孕育階段(1950年前) 1840年英國地質學家Lyell首次以古生物化石的統(tǒng)計分析為論據,對第三系地層進行了劃分,確定了巖石地層次序,著述了定量動物學一書,開創(chuàng)了數學方法引入地質學問題研究的先例。上世紀三十年代后期,Simpson(1939) 著述的分析地質學一書中列舉了統(tǒng)計學在生物研究中的多方面應用。Burma(1949)在“多元分析地質學和古生物學

5、中的一種模型分析工具”一文中明確提出了多元統(tǒng)計方法是一種最有前景的生物計量方法。Krumbein和格里菲斯在沉積學研究中也使用了概率統(tǒng)計方法,為數學方法研究地質現象和個別指標的統(tǒng)計分析解決具體地質問題奠定了基礎。這一階段也是統(tǒng)計分析在地質學中應用的可能性問題討論最為激烈的時期。,2、早期階段(1951-1960) Krumbein(1956)在研究巖石的礦物成分、巖性和化學成分時,應用了多元統(tǒng)計方法,并把巖石成分作為n維空間中的一個點或向量進行統(tǒng)計處理。尤其值得指出的是,1958年由Krumbein和斯洛斯公開發(fā)表了第一個面向地質應用的計算機程序,標志著計算機技術在地質研究中應用的開端,加速了

6、地質學的定量化研究進程。1958年Sichel和Kridge編著的地質統(tǒng)計學及Allais(1957)發(fā)表的單元中礦床數服從泊松分布的礦產資源定量評價等重要文獻奠定了地質統(tǒng)計學分支學科的基礎,是數學地質早期發(fā)展的重要階段。,3、形成發(fā)展階段(1961-1980) 自1968年在布拉格第23屆國際地質大會上成立國際數學地質協(xié)會(IAMG)并由維斯捷列馬斯任第一屆國際數學地質協(xié)會主席以來,數學地質這一邊緣交叉學科得到了長足的發(fā)展。1969年出版了兩種專門的數學地質刊物Mathematical Geology和Computers 方程顯著 接受假設;方程不顯著,、相關系數檢驗法,拒絕假設,方程顯著

7、接受假設,方程不顯著,第三次,有時不建立回歸方程,只計算相關系數。 相關分析。但注意要進行顯著性檢驗。 四、利用回歸方程預測: 還可給出預測精度。,五、計算步驟,1、建立回歸方程,2、檢驗,拒絕假設;方程顯著 接受假設;方程不顯著,相關系數檢驗法,拒絕假設,方程顯著 接受假設,方程不顯著,3、利用回歸方程預測: 還可給出預測精度。,第二節(jié)一元非線性回歸,當散點圖不接近直線時,可考慮用一元曲 線去表征X、Y的關系。-一元非線性回歸 常用的一元曲線有以下幾種: 1、指數函數:,2、對數函數:,3、另一中指數函數:,4、冪函數:,5、多項式: 用多元線性回歸分析的方法求系數。 非線性回歸,首先根據散

8、點圖選擇擬合函 數,再轉換成線性回歸問題求回歸系數。,第三節(jié)多元線性回歸,研究一個因變量和多個自變量間的線性依 賴關系。 一、數學模型 和回歸方程的求法,由(2)得: 代入(1)得:,二、多元線性回歸的顯著性檢驗,拒絕假設,回歸效果顯著 接受假設,回歸效果不顯著,復相關系數: 偏相關系數:,三、對各自變量的顯著性檢驗(第四次),標準回歸系數: 對原始數據進行標準化處理后,建立回歸方 程,此時的回歸系數變量標準回歸系數。 值的正負和大小,一定程度上反映與因變量 的關系。,四、預測,由回歸方程對因變量的值進行預測。,計算實例,某矽卡巖型白鎢礦中鎢(wo3)對鉍(Bi)、鉬(Mo)的線性依賴關系研究

9、。,第四節(jié)逐步回歸分析簡介,一、基本思想 一個好的回歸方程,應包含盡量多的與因 變量Y有關的自變量,尤其不能漏掉對Y有顯 著作用的變量;另一方面,方程中不宜包含 與Y關系不大的自變量。否則不但增加計算量 而且對預測結果形成干擾。所以在建立方程 時應對自變量進行篩選(地質認識、數學)。 逐步回歸分析:在多元回歸分析的基礎上,增加了用數學方法篩選自變量的過程。一種 算法上的改進。 大致步驟:在所考慮多個自變量中,根據 它們對Y的重要性的大小,逐個引進方程。隨 著變量的不斷引入,先前引入方程的某個自 變量可能會失去重要性,則要根據標準剔除。 一直進行,直到已引入的變量不能剔除,未引 入的變量不能引入

10、為止。-最優(yōu)方程。,逐步回歸分析:是指從眾多可供選擇的自變量中篩選出對因變量y影響顯著的變量xi(i=1,2,m),并確定y與xi之間相關關系的最優(yōu)化回歸方程的一種統(tǒng)計分析方法。,二、變量的引入與剔除標準 偏回歸平方和:,三、算法實現 求逐步回歸方程最終歸結為解線性方程組 的問題。用的是求解求逆的并行方案。 回歸分析中,樣品數至少要大于變量的個 數。,0、求出相關系數矩陣,第一步、選擇第一個變量進入回歸方程,考察所有自變量的方差貢獻,取其中最大者,記為,即:,作F檢驗,若,則變量,對y的變化起著重要作用,引變量進入回歸,方程,并按右邊公式進行緊湊消元變換,得到相關增廣矩陣 轉入第二步,若,則變

11、量,不能引入回歸方程,回歸就此結束,結果是方,程中沒引入任何變量,第二步、當第一個變量已經選入方程,繼續(xù)進行回歸運算。,(1)首先檢驗進入回歸方程的變量是否要剔除,由于回歸方程中只有一個變量,并且是剛引入的,因此不可能立即被剔除,這步檢驗省略,(2) 檢驗是否要選入變量,利用R(1)計算不在回歸方程中的變量的方差貢獻:,取其中最大者,記為,即:,若,則把變量,再引入回歸方程,并對R(1)進行緊湊消元變換,得到新的增廣矩陣R(2),若,則回歸結束。由R(1)得到:,標準回歸系數,標準化變量回歸方程,剩余平方和,回歸平方和,復相關系數,自由度,自由度,第三步 根據新得到R(2)做下一步回歸運算,(

12、1)首先檢驗已進入的變量有無要剔除的,第五節(jié)回歸分析應用實例,解決問題: 、研究變量間的相關關系; 、預測。 一、求某地黃河水中砷含量與懸浮性固體含 量之間的關系。 在黃河水系黑石關斷面處取12個水樣得到 數據:(統(tǒng)一數量級較好),二、礦體剝蝕深度預測,地質找礦中的兩個重要問題: 、評價地質體的含礦性; 、評價礦體的剝蝕深度。 評價礦體的剝蝕深度轉換回歸分析 選擇模型礦體,以標高為因變量,以垂向 分帶明顯的元素或元素比值為自變量組織原 始數據,建立回歸方程。實現問題的轉換。 兩江銅礦:六個礦帶;其中一個有工程:,已知礦體下延500多米,采樣點在淺部。 對8號異常(CO、NI、MO)代入方程:

13、Y=75米;3號異常:Y=-10米。,說明:從元素組合的角度看,號異常地 表出露處,和已知礦體埋深90米左右處相 當,說明8號礦體剝蝕程度較大,同理3號異 常剝蝕程度較小,3號異常優(yōu)于剝8號異常。 本實例的問題是模型控制深度太淺。 注意:模型區(qū)和預測區(qū)的相似性。,三、地下水平均水位預測,研究地下水的水位和用水量的關系,控制 用水量,為制定用水計劃提供依據。 河北某地對一年的月采水量和月平均水位 進行了統(tǒng)計:,可根據上月水位和計劃用水量預測本月的 水位,控制用水量。變量中可考慮加入月降 水量等與水位有關的因素。 注意“轉換”的思想。,四、在資源量估算及成礦預測中的應用,YOUR SITE HER

14、E,實例 安徽地區(qū)玢巖鐵礦床礦石礦物為磁鐵礦,YOUR SITE HERE,已知n=32p=2,未知m=7,x1 磁異常指數 x2 閃長玢巖出露面積比值 y 礦床經濟價值(作對數變換) y 3.5 礦點 小礦 大中礦,UnitIDx1x2y 60.958 0.010 0.778 121.456 24.200 2.204 140.001 0.010 0.477 201.861 36.250 4.007 212.301 0.750 0.477 272.045 6.250 5.385 283.057 35.210 5.636 310.612 0.010 0.477 331.513 7.000 0.4

15、77 352.000 22.700 5.763 361.468 7.250 3.992 370.001 0.010 0.477 430.783 0.570 0.477 451.301 73.000 5.467 462.672 24.200 5.035 473.250 75.200 3.464 561.096 7.000 0.477 580.001 8.500 2.553 592.950 11.000 0.829 601.491 11.000 0.477 630.001 0.750 0.954 640.001 1.500 0.954 650.001 5.750 4.625 660.001 1.5

16、00 0.477 670.001 0.010 0.477 680.001 0.750 0.954 760.001 0.010 3.437 770.001 0.010 0.477 830.001 0.010 0.778 870.001 1.000 0.477 890.001 0.150 2.813 1000.001 0.010 0.477,UnitIDx1x2y 291.602 0.001 300.001 0.001 340.001 0.750 441.021 0.001 482.672 34.500 491.740 0.001 511.491 22.000,YOUR SITE HERE,X1,

17、y,y,X1,X2,X2,y,X2,X1,YOUR SITE HERE,y = 1.1921 + 0.3241*x1 + 0.0489*x2,yMean = 2.0572 SST = 117.8631 SSE = 73.2383 SSR = SST-SSE = 44.6248,YOUR SITE HERE,y,X2,X1,YOUR SITE HERE,UnitIDx1x2yyfity-yfit 60.958 0.010 0.778 1.503 -0.725 121.456 24.200 2.204 2.848 -0.644 140.001 0.010 0.477 1.193 -0.716 20

18、1.861 36.250 4.007 3.569 0.438 212.301 0.750 0.477 1.975 -1.498 272.045 6.250 5.385 2.161 3.224 283.057 35.210 5.636 3.906 1.731 310.612 0.010 0.477 1.391 -0.914 331.513 7.000 0.477 2.025 -1.548 352.000 22.700 5.763 2.951 2.812 361.468 7.250 3.992 2.023 1.969 370.001 0.010 0.477 1.193 -0.716 430.783

19、 0.570 0.477 1.474 -0.997 451.301 73.000 5.467 5.185 0.282 462.672 24.200 5.035 3.242 1.793 473.250 75.200 3.464 5.925 -2.461 561.096 7.000 0.477 1.890 -1.413 580.001 8.500 2.553 1.608 0.945 592.950 11.000 0.829 2.686 -1.857 601.491 11.000 0.477 2.214 -1.737 630.001 0.750 0.954 1.229 -0.275 640.001

20、1.500 0.954 1.266 -0.312 650.001 5.750 4.625 1.474 3.151 660.001 1.500 0.477 1.266 -0.789 670.001 0.010 0.477 1.193 -0.716 680.001 0.750 0.954 1.229 -0.275 760.001 0.010 3.437 1.193 2.244 770.001 0.010 0.477 1.193 -0.716 830.001 0.010 0.778 1.193 -0.415 870.001 1.000 0.477 1.241 -0.764 890.001 0.150

21、 2.813 1.200 1.613 1000.001 0.010 0.477 1.193 -0.716,y,yfit,YOUR SITE HERE,F0.01(2,29)=5.42 F0.05(2,29)=3.34 F0.1(2,29)=2.49,R2 = SSR/SST = 0.3786 F = (SSR/2)/(SSE/29) = 8.8350 p-value = 0.0010,= sqrt(SSE/29) = 1.5892,YOUR SITE HERE,YOUR SITE HERE,2,礦點,小礦,大中礦,3.5,未知單元預測,預測臨界回歸估計值 = 2.5,已知單元8個,YOUR S

22、ITE HERE,本講介紹的線性回歸,僅僅是回歸的一種,也是歷史最悠久的一種。 但是,任何模型都是某種近似; 線性回歸當然也不例外。 它被長期廣泛深入地研究主要是因為數學上相對簡單。 它已經成為其他回歸的一個基礎。 應該用批判的眼光看待這些模型。,NOTES,第六節(jié) SPSS統(tǒng)計分析軟件的應用,第三章趨勢分析,研究變量在空間上的變化規(guī)律的一種多元 統(tǒng)計分析方法。 如觀測某元素的含量: 、區(qū)域性變化部分:受區(qū)域巖性和深大地 質構造控制,反映指標的區(qū)域性分布規(guī)律。 局部變化部分:受局部性地質因素控制, 反映指標的局部性分布規(guī)律。 、隨機性變化部分:反映隨機因素的影響,趨勢面分析的基本方法思路:就是

23、要對數據中所包含的趨勢值、局部異常值和隨機干擾值等三部分信息進行分析,排除隨機干擾信息,找出區(qū)域性變化趨勢,突出局部異常。,(第五次),趨勢分析是用適當的數學曲面(趨勢面)去 擬合觀測值,將觀測值分成兩部分: 趨勢值:反映區(qū)域性變化部分; 剩余值:反映局部變化和隨機性變化部分。 趨勢分析分為: 一維趨勢分析 二維趨勢分析 三維趨勢分析,趨勢面方程。 通常將趨勢面方程表示成觀測點坐標的多 項式多項式趨勢分析。 將趨勢面方程表示成觀測點坐標的調和函 數調和趨勢分析。,常見的各種趨勢函數的數學關系和示意圖,一、趨勢面方程的求法,二、趨勢面擬合程度檢驗,實例分析:有某油層18口井的鉆井資料,其中某層的

24、厚度變化如表4-3所示,求該層厚度變化的二次趨勢面,并檢驗其顯著性,作出其剩余分布圖,指出正常場分布。,解:采用二次趨勢面方程:,1、求出的趨勢面系數滿足的方程組,2、解得系數,3、計算剩余的平方和,4、計算統(tǒng)計量,擬合度,統(tǒng)計量,5、顯著性檢驗,若取顯著性水平,查F分布表,因此,在顯著性水平,下,趨勢面擬合是顯著的。,三、趨勢分析可解決的問題,1、擬合問題 要求方程擬合度要高; 2、分離區(qū)域異常和局部異常 3、在化探異常處理中,常用趨勢值作為異常 下限圈定異常。(發(fā)現低背景下的異常),四、幾點說明,1、測點要盡量分布均勻;測點少時方程的 次數不宜過高。 2、剔除特高(低)值; 3、趨勢分析的

25、結果不能外推;回歸分析可 以外推。 4、滑動平均趨勢分析。,5、剩余分析 第i點的剩余值是原始觀測值與趨勢值之差,即: 地質變量的原始觀測數據包含趨勢值與剩余值兩部分。趨勢值反映區(qū)域性大范圍內的變化情況,剩余值反映局部異常的變化特點,二者結合起來可以幫助人們深入的作地質分析。 地質構造觀測數據擬合求取的趨勢面圖反映區(qū)域構造背景,剩余圖則反映在這一背景下的局部異常,從中可以發(fā)現低緩異常帶。 剩余圖零值線的區(qū)域走向往往反映了區(qū)域斷裂的分布。 趨勢面擬合物探資料和地球化學指標時,利用剩余圖可以找出異常帶,這些異常帶往往與特定的地質條件,特別是與許多成礦條件(比如生油、儲油條件等)有關。,正剩余、異常

26、分量與異常分布圖,剩余值并非完全等于局部異常,它是局部異常分量ui與隨機分量vi之和。即:,一般要從剩余值中減去隨機分量vi,將所有正剩余的平均值作為隨機分量:,各點的異常分量ui是各點的剩余值減去該點的隨機分量vi。從正剩余中去掉vi ,就可以得出該點的異常分量ui,,第四章 聚類分析(第六次),根據多個指標對研究對象進行數字分類的 一種多元統(tǒng)計分析方法。 原始數據的形式:,型聚類分析:根據變量在各樣品上的觀 測值對變量進行分類。 型聚類分析:根據樣品在各變量上的取 值對樣品進行分類。 基本思想:將變量(或樣品)看成多維空 間中的點,根據變量點(或樣品點)在空間 上的親疏關系實現定量分類。,

27、第一節(jié)原始數據的預處理,目的:使各變量統(tǒng)一量綱。 一、標準化處理,性質: 、變量的均值為0, 方差為1。,2、相關系數不變,二、正規(guī)化處理,性質: Q型聚類分析多用這種處理。,第二節(jié) 相似性統(tǒng)計量,聚類分析是根據變量(樣品)間的相似程 度實現對變量(樣品)分類的。為衡量變量 (樣品)間的相似程度一般采用如下幾種統(tǒng) 計量。 一、相似系數 考慮對樣品分類,每個樣品可看成維變 量空間的向量,兩樣品向量的夾角余弦 相似系數。,相似系數陣中包含樣品是否相似的信息。,類似的考慮,也可形成變量間的相似陣: 通常習慣于用相似系數做型聚類分析。,二、相關系數,在型聚類分析中,通常用相關系數度量 變量間的相似性:

28、 矩陣中包含變量是否相似的信息,構成了 型聚類分析的基礎。,三、距離系數,為了度量樣品間的差異,用兩樣品點在M 維變量空間的歐氏距離:,各種系數的圖示,第三節(jié)分類譜系圖的建立,在相似性矩陣中,包含研究對象是否相似 的信息,構成了分類的基礎,但不直觀。 譜系圖:在相似性矩陣的基礎上,作出直 觀反應分類結果的二維圖。 、一次計算成圖法 、逐次計算成圖法,形成原則 (1)若選出一對樣品在已經分好的組中都未出現過,則把它們形成一個獨立的新組。 (2)若選出的一對樣品中,有一個出現在已經分好的組里,則把另一個樣品也加入到該組中去。 (3)若選出兩個樣品,它們分別出現在已經分好的兩個組中,則把這兩個組聯(lián)在

29、一起。 (4)若選出的一對樣品都出現在同一組中,則這對樣品就不再分組了。,第四節(jié)聚類分析的計算方法和步驟,一、原始數據準備(鄂東某地七個巖體),二、對原始數據進行預處理 型:標準化 型:正規(guī)準化 三、形成相似陣 型:相關系數,型:距離系數;相似系數,四、形成譜系圖,、一次計算成圖法:連圖表,如果用相似系數、相關系數為統(tǒng)計量時, 應由大到小進行連圖。 一次計算成圖法較簡單,但結果粗躁。 聚類分析是動態(tài)分類。,2、逐次計算成圖法(第七次),1)選出相似性最大的變量(樣品)對合成一類。 2)將合并的變量(樣品)看成一個變量 (樣品)重新組織原始數據、計算相似陣。 3)重復1)、2)步,直到所有對象合

30、并成 一類為止。,根據連圖表作出譜系圖,結果和一次計算結果類似。 R型:合并變量。 五、對分類結果給出解釋。,R型聚類分析計算實例,某火山巖型金礦區(qū)主要成礦成巖元素的聚類分析 在該礦區(qū)采集標本6快,分別測定Cr、Ni、Sr、Au、Cu、S的含量。使用聚類分析對變量進行分類,研究金礦化過程中,元素的地球化學分類特征及其地質意義,(AuCu) 、S=2 (Au、Cu)+ S/3,(Ni Sr)、 Cr = 2 (Ni、Sr)+ Cr/3,在R=0.75水平,變量分為兩類:Au、 Cu、S為一類,為主要礦化元素; Cr、Ni、 Sr為一類,為火山巖中的微量元素,代表火山巖成分。,第五節(jié) 離差平方和法

31、(Q型的一種算法),原理:如果若干個樣品合并后,離差平方 和的增量較小,說明樣品點較集中,可以分 成一類;若離差平方和的增量較大,說明樣 品點較分散,不能分成一類。,形成各樣品間的離差平方和增量陣,形成各樣品間的離差平方和增量陣,第六節(jié) 有序樣品的聚類(最優(yōu)分割)(第八次 ),許多地質數據是有序的 ,這些按一定順序排列的地質樣品 ,叫做有序的地質樣品 。如沿地層剖面采集的樣品;鉆孔中取出的巖心樣品;蝕變帶的研究中 ,從巖體中心到圍巖的蝕變剖面的樣品等等 ,它們都是有序地質變量。這類數據的特點是樣品的前后次序不能變更。所以 ,一些不考慮樣品排列順序的數學處理方法 ,對此不適用。 有序樣品的聚類分

32、析就是對有序樣品進行分段的統(tǒng)計方法。,第六節(jié) 有序樣品的聚類(最優(yōu)分割),對 n個有序樣品進行分割 , 有多種劃分方法 ,每一種分法稱為一種分割。在所有這些分割中 ,有一種分割使得各段內部樣品之間差異性最小 ,而段與段之間的差異性最大。這種對 n個樣品分段并使組內離差平方和最小的分割方法 ,稱為最優(yōu)分割法。,最優(yōu)分割在地質研究中是一個非常有用的手段 ,只要地質體的某些地球化學特征存在規(guī)律性的差異 ,采用最優(yōu)分割的數學處理方法 ,就能按順序在最理想的地方進行分段。通過對地層中采集的具某些地球化學特征樣品的最優(yōu)分割 ,能在地層的劃分對比中發(fā)揮重要的輔助作用;在找礦過程中 ,該方法更顯得天獨厚的優(yōu)勢

33、 ,它能進行蝕變、礦化及礦體的準確分帶.,第六節(jié) 有序樣品的聚類,一、最優(yōu)分割,把n個有序樣品分為k組,有多種分法,其中分后各組內樣品差異最小,而各組之間差異最大的的分法稱為最優(yōu)k分割法,相應的結果稱為最優(yōu)k分割。,求出總的離差平方和: I,J段的段內離差平方和,第一段,第二段,第k段,段間離差平方和:,S為總離差平方和,段內離差平方和,段間離差平方和,對于給定的有序數列,S是個確定的值,因此,若使段內離差平方和S1為最小,則段間離差平方和S2必為最大。由此看來,使段內離差平方和為最小的分割法就是最優(yōu)分割法。,二、最優(yōu)分割實現,最優(yōu)二分割,最優(yōu)三分割,最優(yōu)兩段分割點,S1=0;s=0;j=1

34、For i=1;i=n-1 S1=s s=d(1,i)+ d(i+1,n) if s=s1 j=i ,最優(yōu)三段分割點,S1=0;s=0; For i=1;i=n-1 if i=j i=i+1 S1=s if ij s=d(1,i)+ d(i+1,j) )+ d(j+1,n) else s=d(1,j)+ d(j+1,i) )+ d(i+1,n) if s=s1 k=i ,二、最優(yōu)分割的計算步驟,1、數據正規(guī)化,2、計算段內變差矩陣,3、最優(yōu)二分割、三分割、四分割,三、實例分析,多元有序地質數據的最優(yōu)分割法在工程中的應用,王生全 , 唐亦川 , 薛喜成 (西安科技學院 地質與環(huán)境工程系 ,陜西

35、西安 710054) 摘 要: 采用數學地質理論中的多元有序地質數據的最優(yōu)分割方法對工程場地松散巖土層亞層進行了劃分。實踐證明 ,在土樣物理力學性能評價指標選取合理的前提下 ,該方法簡單方便 ,行之有效 ,可作為一種輔助手段幫助地質人員開展對土層的詳細研究。,西安市某建筑場地厚層黃土的分層問題,例一:西安市某建筑場地厚層黃土的分層問題。 該場地地貌單元屬渭河 級階地。據鉆探及探井揭露,場地內地層主要由第四紀全新世的人工填土 和中、上更新世的風積黃土及殘積古土壤構成。按地層成因及巖性特征,自上而下可劃分為 4 個大的地質 層,即全新世的人工填土(Q4 ) ,厚 0.5 2.2 m;上更新世的風積

36、黃土(Q3 ) ,厚 9 m 左右;上更新世的 殘積古土壤(Q3 ) ,厚4.905.40 m ;中更新世的風積黃土(Q2 ) 厚3.03.30 m。由于第二層土即上 更新世的風積黃土層(Q3 ) 在本區(qū)很厚 ,為了地基承載力及沉降量估算 ,按照對黃土評價經常采用的主 4 ,5 要指標 ,對該層土進行了亞層劃分。這些指標包括:天然含水量( w) 、干重度( rd) 、飽和度(sr) 、液限孔 隙比( wL/ e) 、含水比( u) 、濕陷系數(s) 、壓縮系數( a0. 1- 0. 2) 、壓縮模量( Es0. 10. 2) 等。表 1 是該層黃土的 取樣及主要物理力學性質指標試驗結果。將這些

37、數據輸入計算機,采用編制的最優(yōu)分割BASIC程序 ,經上 機運算 ,得到最優(yōu) 2 段至最優(yōu) 7 段分割后的分割段數、分割點樣品號、分段結果與段直徑總和(表 2) 。將分 割段數與相應段直徑總和繪成相關曲線圖(圖 1) 后發(fā)現,曲線的明顯拐點在段數 k = 3 處,而且分割點 4 號樣與 1 號樣在各級分割中出現的次數最多。因此將該黃土層細分為 3 個亞層較為合適。這一分段結果與 專家實際分層結果相一致。,徐州某工程場地較厚粘土層的分層問題,例二:徐州某工程場地較厚粘土層的分層問題,該場地地貌單元處于魯南低山丘陵南緣與沖積平原的過渡地帶。據鉆孔揭露和地質調查 ,場地內地 層自上而下分為 4 層:

38、第一層為第四紀全新世的沖積粉質粘土(Q4 ) ,厚 03.0 m;第二層為第四紀上更 新世的沖積粘土層(Q ) ,厚 13.3 m左右;第三層為白堊系上統(tǒng)(k )全風化至弱風化的砂巖及泥巖層 ,厚度大于25 m;第四層為寒武系( )弱風化的灰?guī)r及白云巖 ,厚度大于10 m。由于第二層粘土較厚 ,為準確 估算地基承載力與沉降量 ,按照粘土工程性能評價指標 ,對該土層進行了亞層劃分。表3 是該層土的取 樣及室內物理力學性質試驗結果。同樣將這些數據輸入計算機 ,采用最優(yōu)分割BASIC 程序進行計算 ,得 到最優(yōu)2 段至最優(yōu)6 段分割的結果(表4) 。將分割段數 k 與相應的段直徑總和繪成相關圖形后(

39、圖2) ,發(fā) 現曲線的明顯拐點在段數 k =4 處。因此 ,將該土層細分為 4 個亞層較為合適。這一劃分結果與地質專 家實際分層結果相一致。,第七節(jié)聚類分析應用實例,R型:對變量分類。研究元素的組合關系,確 定找礦的指示元素。 Q型:對樣品分類。物化探異常評價;地質體 的分類等。 1、江西德興銅鉬礦: 在礦體和圍巖采集508個樣品,分析了14中 元素:Cu、Pb、Zn、Ag、Sn、W、Mo、 V、Co、Ni、Cr、Ti、Mn、Ba。,當r=0.3時,元素分為兩類: ( Cu、Pb、Zn、Ag、Mo、 Mn、 Co ) (V、Ni、Cr、Ti、Mn、Ba 、W) 第一類:成礦作用中的活波組分,可

40、作為 地球化學找礦的指示元素,分成幾個亞類, 反映熱液礦床多次成礦作用的特點。 第二類: 圍巖的惰性組分。,2、遼寧排山樓金礦,NE向礦體聚類分析譜系圖,EW向礦體聚類分析譜系圖,、紅花溝金礦 石英脈型金礦,104條石英脈,生產礦脈6 條H2、L51、L10等。 R型:確定地球化學找礦的指示元素(用 礦石樣品)。 Q型:各脈作為樣品,指示元素為變量, 對未知脈進行評價。,3、對不同類型的對象(不同類型的礦床)分別做R型聚類分析,得出各自的元素組合特征,根據其差異性,提供其成因討論的思路。 4、有文章表明:對學生成績進行R型分析,總是數學、物理關系密切。,第八節(jié) SPSS統(tǒng)計分析軟件的應用,第五

41、章判別分析,在已知研究對象分類的條件下,根據已知 研究對象的數字(變量)特征,建立判別函 數,對未知對象進行判別分類的一種多元統(tǒng) 計分析方法。 一般取多個判別變量,以減少重疊現象。 如某地已探明12個化探異常: 礦異常: Cu: 220-2000ppm 非礦異常: Cu: 85-800ppm,單變量:、判別標準容易確定; 、重疊現象。 多變量:、重疊現象減少; 、判別標準不容易確定。 判別分析可以解決這個矛盾。 多變量判別函數(綜合變量),判別函數: 求判別函數就是求:C1, C2 ,.Cm,石灰?guī)r A,石灰?guī)r B,孔隙度 x1,滲透率 x2,例:設從總體A、B兩套石灰?guī)r中分別取了31、36個

42、樣品,并且每個樣品有x1()、x2(K)兩個變量。在x1、x2坐標系中所有樣品的散點圖如右所示。對于一個來自于A或者B的一個新樣品X來說,如何判斷它的所屬總體?,一般情況下,若樣品有m個變量,那么新變量y形式為:,y是由xj(j1,2,m)線性組合而成的一個綜合性指標,它是m+維空間中的一個平面,稱為之為線性判別函數,其中c1,c2,cm叫做判別系數。,第一節(jié) Fisher 準則下的二類判別(第九次),一、判別函數的求法,Fisher準則:,二、判別規(guī)則,三、判別效果檢驗,當選定的兩母體(A、B)有差異時,建 立的判別函數才有意義,否則無意義。,當檢驗結果不好時: 1、母體(樣品)選擇不合適;

43、 2、變量選擇不合適。 四、變量選擇 1、I值最大法,2、變量貢獻:,五、計算步驟(第十次),、原始數據準備; 、求判別方程; 、求Y0值; 4、判別效果檢驗(判別變量篩選;已知 樣品篩選); 5、對未知樣品進行判別分類。,判別分析計算實例,某爆發(fā)火山角礫巖筒型銅礦區(qū)外圍標本含礦性的判別分類 在礦區(qū)采集有代表性礦石標本6快,在礦區(qū)外圍無礦區(qū)采集有代表性標本6快。變量SiO2、Al2O3、Na2O、Cu。未知標本兩塊。,現有表所示的若干個油層和水層的樣品的四個指標:巖性系數x1、孔隙度x2、侵入系數x3和含油氣飽和度x4,若油層為組A,水層為B,現要求依表中的數據建立油水層的判別函數并檢驗其有效

44、性。,解: 1、計算各組指標的平均值和均值差,2、計算兩組的綜合協(xié)方差矩陣并形成方程組:,得到方程組為:,式中,,3、解上述方程組的判別系數,從而,判別函數為:,4、計算各組判別函數的平均值和判別指標,因而,顯然判別函數是高度顯著的。,5、計算馬氏距離和統(tǒng)計量,6、原樣品代回判別函數回判,檢驗判對率,第二節(jié)Bayes準則下的多類判別,Bayes準則,Bayes公式:設有G個母體構成事件的完備群,對于樣品X,已知X在第K個母體的條件概率為p(x/k)和先驗概率p(k)。k=1,2,G 則對于給定樣品X來自第g個母體的后驗概率為,后驗概率: 設所選的g個類型構成事件的完備群,在先 驗概率相等的條件

45、下,待判樣品屬于第k類的 后驗概率為:,Bayes準則:后驗概率最大準則。 根據原始數據求出各母體的概率密度函數,多類判別關鍵是求出各類的概率密度函數。 假設: 、各母體服從多元正態(tài)分布; 、各母體的協(xié)方差陣相等。,后驗概率: 設所選的g個類型構成事件的完備群,在先 驗概率相等的條件下,待判樣品屬于第k類的 后驗概率為:,二、判別函數的求法,第k個母體(類別)的概率密度函數:,得到各母體的概率密度函數: (第十一次),三、判別效果檢驗,通常計算判對率檢驗方程的判別效果。,四、計算步驟,、原始數據準備; 、求判別方程; 3、判別效果檢驗(變量選擇、樣品選 擇); 4、對未知樣品進行判別分類。 5

46、、計算未知樣品屬于各類的后驗概率; -檢驗判別結果的可靠性。,多類判別計算實例,鄂東某地七個巖體,判別效果檢驗 待判樣品判別,待判樣品判別的后驗概率:,實例分析現有表4-9所示的若干個油層、水層、油水層的樣品的四個指標:巖性系數x1、孔隙度x2、侵入系數x3和含油氣飽和度x4,若油層為組A,水層為B,現要求根據表中的數據建立判別函數并檢驗其有效性。,解: 1、計算各組指標的平均值,2、計算協(xié)方差矩陣S并求出它的逆矩陣S-1,結果為,3、計算各組的判別函數(以第一組)為例。計算結果用矩陣表示。,于是得到第一組判別函數為:,同樣可以求出第二組和第三組判別函數:,4、對未知樣品進行判斷(以第一組第一

47、個樣品為例),因為F1(X)的值最大,所以樣品應該為第一組。還可以算出樣品1歸于各組的后驗概率,檢驗同學自己完成,第三節(jié) 逐步判別分析,逐步判別分析就是在多類判別分析的基礎 上增加了用數學方法篩選判別變量的功能。,這里介紹的逐步判別所依據的模型是貝葉斯線性判別模型。問題是這樣提出的,判別分析中我們自然希望考慮盡多的變懸來區(qū)分各個總體,但是,變量選得越多所用的人力和物力也就越大,同時,引入不重要的變量并不能提高判別效果,為此,應對可供分組的變量進行挑選,逐步判別就是解決這個問題的。 總的說來,逐步判別和逐步回歸的思想類似,都采用”有進有出”的算法,即每一步都進行檢驗,在把一個重要的變量引入判別式

48、后,同時也考慮較早進入判別式的某些變量,如果其重要性隨著新變量的引入而喪失,則把它即時地從判別式中剔去,而最終的判別式僅保留“重要的”變量。因此,首先要討論如何檢驗變量的判別能力。,一、基本含義,一、基本原理,1、Wilks統(tǒng)計量,W樣本內離差矩陣 B樣本間離差矩陣 T總離差矩陣,2、逐步篩選變量,(1)引入變量x(r)的Wilks統(tǒng)計量,F1服從第一自由度為(G-1),第二自由度為()的F分布。對于給定的檢驗水平,查Fa (G-1, N-G-P )分布表。如果F1 Fa ,則變量x(r)的判別能力強,把它引入判別函數。,(2)剔除變量x(r)的Wilks統(tǒng)計量,設逐步判別分析進行了P步,共引

49、入了P個變量,第P+1步擬剔除變量x(r),此時,變量x(r)的判別能力可視為第P步引入x(r)的判別能力,F2服從第一自由度為(G-1),第二自由度為()的F分布。對于給定的檢驗水平,查Fa (G-1, N-G-P+1 )分布表。如果F2 Fa ,則變量x(r)的判別能力強,把它引入判別函數。,(3)矩陣W和T的變換公式,(4)計算判別函數和分組判別,設逐步判別分析進行了P步,共引入了v(v m)個變量,此時,按下式計算判別函數的系數。,第四節(jié)幾點說明,一、二類判別和多類判別的區(qū)別: 、建立方程的數學準則不同; 、多類判別可解決二類判別的問題; 、兩類問題應該用二類判別分析; 、二類判別一個

50、判別方程;多類判別時 g個判別方程。,二、判別分析和聚類分析的區(qū)別: 、建立分類標準的數學準則不同; 、判別分析要求事先已知類別及有已知屬性的樣品;聚類分析無此要求; 、判別分析只能對樣品進行分類,聚類分析既可對樣品進行分類(Q型)也可對變量進行分類(R型); 4、判別分析是唯一分類;聚類分析是動態(tài)分類;,三、應有盡量多的已知樣品,滿足統(tǒng)計規(guī) 律。 四、注意判別變量的選擇。 五、注意模型區(qū)和預測區(qū)的相似性。,第五節(jié) 應用,物、化探異常的評價;石英脈含礦性的評 價;巖體的分類;古生物的分群、頭尾暈的 判別。 一、攀枝花-西昌地區(qū)基性、超基性巖體的含礦性評價: 本區(qū)與基性、超基性巖有關的銅鎳硫化物

51、 礦床有兩類: 1、含銅、鎳、鉑巖體; 2、含銅、鎳(不含鉑)巖體。,將已知巖體化為四類: 1、銅、鎳含礦巖體(36個樣) 2、銅、鎳礦化巖體(36個樣) 3、銅、鎳、鉑含礦巖體(60個樣) 4、銅、鎳、鉑礦化巖體(27個樣) 8個變量:Cu、Co、Ni、S、 Cu/Ni、 Co/Ni、 Cu/S、 Ni/S。,對未知巖體采樣(多個樣),代入方程, 若大部分樣品(50%以上)歸為某類,則該 巖體判歸此類。取得了好的效果。,二、山東招掖金礦帶礦上暈、礦下暈的判別 在玲瓏礦田大開頭礦段52號脈采集了19個 已知礦上暈樣品、 11個已知礦下暈樣品;以 原生暈的經驗模型為依據,確定:ln(AgAs)、

52、 Ln(AuTe)、ln(Cu)、ln(Mn)為判別變量,,(第十二次),用方程對玲瓏礦田、望兒山礦床的已知礦 體上部暈7個剖面、已知礦體下部暈5 個剖面 158個進行判別,結果判對149個,判錯21個 正確率88%。,YOUR SITE HERE,4. 應用實例。 研究區(qū):寧蕪盆地北段 預測對象:玢巖型鐵礦。 預測比例尺:1:50,000 單元劃分:全區(qū)劃分為3 單元100個。 (1)根據研究區(qū)的地質勘探情況,該區(qū)有8個單元為已知有礦單元,14個單元為已知無礦單元,另外78個單元為未知待判單元。 因此,令已知有礦單元為A總體,NA=8,YOUR SITE HERE,令已知無礦單元為B總體,N

53、B=8,剩余6個作為回判檢驗. (2)建立數學模型,即判別分析函數, 經過控礦地質因素分析,選出7個與成礦關系密切的變量參加建模, x1接觸帶長度, x2單元中心與斷裂噴發(fā)帶的距離。 x4閃長玢巖出露面積, x5圍巖蝕變組合的相對熵值, x9磁異常特征值,,YOUR SITE HERE,x10重力異常特征值, x12巖層組合的相對熵。 最終建立判別函數: R=0.0247X1-1.2246X2-0.036X4+0.041X5+0.1540X9- 0.008X10-0.0267X12 (3) 確定判別臨界值。 A總體的判別得分 B總體的判別得分 R0=-1.5885,YOUR SITE HERE

54、,(4) 顯著性檢驗。 i) 對已知單元進行回判,判對率93.3%,說明R0是顯著的,所建立的判別函數有效。 ii)馬氏檢驗。 F=2.833, 而 判別函數在=0.1的顯著性水平上有效。,YOUR SITE HERE,(5)對未知單元進行判別,預測。 結果,有22個單元的RR0,判為A類,為有礦遠景單元。 (6)對22個有利遠景單元的控礦條件和找礦潛力進行評價,分析。 通過分析發(fā)現,這些單元多數位于NE向斷裂和NW向斷裂火山噴發(fā)帶內。而這兩個帶已被證明是本區(qū)重要的成礦條件,另外,這22個單元之中,有的已經發(fā)現了礦點,有些在空間上與已知礦床相鄰,因而,認為這些單元具有良好的成礦條件和較大的成礦

55、潛力。,第六章 因子分析,因子分析的基本概念 因子分析是研究變量間相關關系、樣品間相似關系、變量與樣品間成因聯(lián)系以及探索它們之間產生上述關系之內在原因的一種多元統(tǒng)計分析方法。 1900年C.斯皮爾曼發(fā)表了對學生考試成績分析的著名文章,可認為是因子分析的開始。1957年由Krumbein把該方法引入到地質學研究,后來,又由Imbrie對該方法在地質學中的應用和發(fā)展作了大量的基礎工作。,因子分析方法幫助我們對大量的地質觀測資料進行分析并作出較為合理解釋的一種多變量統(tǒng)計方法,是研究系統(tǒng)分類、成因分類的重要手段。成因是地質學研究極其重要的內容。因子分析將從以下三方面為成因推理提供重大幫助。 第一、簡化

56、結構壓縮原始數據。 第二、指示成因推理方向 第三、分解地質疊加過程,由于以上的原因,因子分析在地質的應用十分廣泛,已有效應用于沉積盆地的研究、沉積物粒度的分析、沉積相研究、地層分析、古環(huán)境與古生物研究、礦床成因研究、及化探資料分析等各個方面。 根據它們的研究對象,因子分析大致可分為R型因子分析、Q型因子分析二種類型。在此僅介紹基于相關系數的R型因子分析。,基本思想:通過研究變量間相關陣的內部 結構,將原始變量組成少數幾個公因子(相互獨立的新變量),各公因子是不同的變量組合,代表一種相對獨立的作用。提取出公因子,有助于對問題的研究分析。簡化結構。 碳酸巖類的成分:,因子分析的提出,為盡可能完整描

57、述一個事物,往往要收集它的許多指標 多指標產生的問題: 計算處理麻煩 信息重疊 從眾多的指標中剔除一些指標又會造成信息丟失,因子分析是研究以最少的信息丟失將眾多原有變量濃縮成少數幾個因子,并使因子具有一定的命名解釋性的多元統(tǒng)計分析方法.其核心是用較少的相互獨立的因子反映原有變量的絕大部分信息.,因子變量的特點 這些綜合指標稱為因子變量,是原變量的重造 個數遠遠少于原變量個數,但可反映原變量的絕大部分方差 不相關性 可命名解釋性,第一節(jié)因子分析的數學模型,一、原始數據和相關陣:,二、數學模型,、公因子,相互獨立的新變量; 、單因子; 、單因子負載; 、公因子負載,數值上為變量和公因子的相關系數,反映第 個公因子代表第個變量的能力。,反應第 t 個公因子的重要程度; 反應 p 個公因子代表該變量的能力;,因子負載陣;建立變量和公因子的聯(lián)系, 確定公因子的地質含義。,因子變量的特點 這些綜合指標稱為因子變量,是原變量的重造 個數遠遠少于原變量個數,但可反映原變量的絕大部分方差 不相關性 可命名解釋性,100個學生的數學、物理、化學、語文、歷史、英語的成績如下表(部分)。,三、初始因子陣A與相關系數陣R間的關系,第二節(jié) 用主成份分析法求主因子解,主成份分析:當變量具有一定相關關系 時,用少數幾個 綜合變量代替原 始變量。綜合變 量主成份。 它反應了多個變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論