![Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c6d01687-671c-42ac-a9d1-7bd6b36e17be/c6d01687-671c-42ac-a9d1-7bd6b36e17be1.gif)
![Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c6d01687-671c-42ac-a9d1-7bd6b36e17be/c6d01687-671c-42ac-a9d1-7bd6b36e17be2.gif)
![Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c6d01687-671c-42ac-a9d1-7bd6b36e17be/c6d01687-671c-42ac-a9d1-7bd6b36e17be3.gif)
![Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c6d01687-671c-42ac-a9d1-7bd6b36e17be/c6d01687-671c-42ac-a9d1-7bd6b36e17be4.gif)
![Chp.2 數(shù)據(jù)分布模型及其應(yīng)用_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c6d01687-671c-42ac-a9d1-7bd6b36e17be/c6d01687-671c-42ac-a9d1-7bd6b36e17be5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 1q問題的提出問題的提出兩個(gè)引子兩個(gè)引子地質(zhì)研究表明,鉻的含量與砷的含量存在一地質(zhì)研究表明,鉻的含量與砷的含量存在一定關(guān)系,某礦區(qū)取得一批礦樣,測(cè)得定關(guān)系,某礦區(qū)取得一批礦樣,測(cè)得Cr2O3與與As數(shù)據(jù),你用何種數(shù)學(xué)方法確定它們之間數(shù)據(jù),你用何種數(shù)學(xué)方法確定它們之間的數(shù)學(xué)表達(dá)式,來的數(shù)學(xué)表達(dá)式,來預(yù)測(cè)未知區(qū)域的鉻的分布預(yù)測(cè)未知區(qū)域的鉻的分布?Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 2油藏油藏含油飽和度含油飽和度與儲(chǔ)層的與儲(chǔ)層的滲透率滲透率、孔隙度孔隙度、排驅(qū)壓力排驅(qū)壓力、毛管壓力毛管壓力、孔喉半徑孔喉半徑、孔喉歪度孔喉歪度、孔
2、隙峰度孔隙峰度以及以及束縛水飽和度束縛水飽和度等因素相關(guān)。今等因素相關(guān)。今取得一批上述各項(xiàng)的分析數(shù)據(jù),如何通過數(shù)取得一批上述各項(xiàng)的分析數(shù)據(jù),如何通過數(shù)據(jù)分析,建立隨機(jī)因變量與多個(gè)隨機(jī)自變量據(jù)分析,建立隨機(jī)因變量與多個(gè)隨機(jī)自變量間的數(shù)量關(guān)系,間的數(shù)量關(guān)系,判斷油藏的好壞判斷油藏的好壞,以及,以及預(yù)測(cè)預(yù)測(cè)新的油氣藏位置新的油氣藏位置?Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 為了對(duì)地質(zhì)現(xiàn)象(包括地質(zhì)體本身)正確地進(jìn)行數(shù)為了對(duì)地質(zhì)現(xiàn)象(包括地質(zhì)體本身)正確地進(jìn)行數(shù)學(xué)抽象,需要充分認(rèn)識(shí)其學(xué)抽象,需要充分認(rèn)識(shí)其數(shù)學(xué)屬性數(shù)學(xué)屬性。一般地說,地質(zhì)現(xiàn)象的數(shù)學(xué)屬性可以大致地分為一般地說,地質(zhì)現(xiàn)象的數(shù)
3、學(xué)屬性可以大致地分為精精確性確性、隨機(jī)性隨機(jī)性和和模糊性模糊性三種。三種。地質(zhì)現(xiàn)象的隨機(jī)性源于其構(gòu)成復(fù)雜、干擾因素眾多,地質(zhì)現(xiàn)象的隨機(jī)性源于其構(gòu)成復(fù)雜、干擾因素眾多,事件的發(fā)展方向和結(jié)果有多種可能性。也就是說,地質(zhì)事件的發(fā)展方向和結(jié)果有多種可能性。也就是說,地質(zhì)運(yùn)動(dòng)或地質(zhì)過程是按運(yùn)動(dòng)或地質(zhì)過程是按隨機(jī)原理隨機(jī)原理構(gòu)成的,普遍地受構(gòu)成的,普遍地受概率法概率法則則的支配。的支配。3Chp.2 數(shù)據(jù)分布模型及其應(yīng)用數(shù)據(jù)分布模型及其應(yīng)用 為了更好地了解某一地質(zhì)過程,應(yīng)先確定其為了更好地了解某一地質(zhì)過程,應(yīng)先確定其模式,而這種模式既可以用概率論來描述,同時(shí)模式,而這種模式既可以用概率論來描述,同時(shí)還可以
4、用數(shù)理統(tǒng)計(jì)的方法檢驗(yàn)。還可以用數(shù)理統(tǒng)計(jì)的方法檢驗(yàn)。顯然,要妥善地處理上述各種問題,應(yīng)當(dāng)借顯然,要妥善地處理上述各種問題,應(yīng)當(dāng)借助研究隨機(jī)現(xiàn)象的數(shù)學(xué)工具助研究隨機(jī)現(xiàn)象的數(shù)學(xué)工具概率論及數(shù)理統(tǒng)概率論及數(shù)理統(tǒng)計(jì)計(jì)。4 2.1 基本概念基本概念 必然事件必然事件不可能事件不可能事件隨機(jī)事件隨機(jī)事件在一定條在一定條件下必然件下必然不會(huì)出現(xiàn)不會(huì)出現(xiàn)在一定條在一定條件下必然件下必然出現(xiàn)出現(xiàn)可以預(yù)知,具有確定性可以預(yù)知,具有確定性一定條件下可能一定條件下可能實(shí)現(xiàn),也可能不實(shí)現(xiàn),也可能不能成為現(xiàn)實(shí)能成為現(xiàn)實(shí)由于地質(zhì)作用的長期性和復(fù)雜性,地質(zhì)過程中產(chǎn)生由于地質(zhì)作用的長期性和復(fù)雜性,地質(zhì)過程中產(chǎn)生的大多數(shù)地質(zhì)現(xiàn)象都
5、可看作是隨機(jī)事件。的大多數(shù)地質(zhì)現(xiàn)象都可看作是隨機(jī)事件。 “鉆探鉆探到到100m深處見到礦體深處見到礦體”5 2.1 基本概念基本概念 現(xiàn)象:現(xiàn)象:當(dāng)我們?cè)谝欢ǖ臈l件下重復(fù)作某一觀測(cè)時(shí),會(huì)當(dāng)我們?cè)谝欢ǖ臈l件下重復(fù)作某一觀測(cè)時(shí),會(huì)發(fā)現(xiàn)一些現(xiàn)象出現(xiàn)的次數(shù)多些,另一些現(xiàn)象出現(xiàn)的次發(fā)現(xiàn)一些現(xiàn)象出現(xiàn)的次數(shù)多些,另一些現(xiàn)象出現(xiàn)的次數(shù)少些。表明各事件出現(xiàn)的可能性是有大有小的,這數(shù)少些。表明各事件出現(xiàn)的可能性是有大有小的,這自然會(huì)使人想到可以用一個(gè)數(shù)字來描繪事件出現(xiàn)的可自然會(huì)使人想到可以用一個(gè)數(shù)字來描繪事件出現(xiàn)的可能性。能性。概率:概率:設(shè)某一隨機(jī)事件設(shè)某一隨機(jī)事件A在在n次觀測(cè)中出現(xiàn)了次觀測(cè)中出現(xiàn)了m次,則次
6、,則稱稱m/n為事件為事件A出現(xiàn)的頻率。當(dāng)出現(xiàn)的頻率。當(dāng)n足夠大時(shí),事件足夠大時(shí),事件A的的頻率會(huì)穩(wěn)定在某一數(shù)值頻率會(huì)穩(wěn)定在某一數(shù)值P附近擺動(dòng),數(shù)值附近擺動(dòng),數(shù)值P即為事件即為事件A出現(xiàn)的概率,記作出現(xiàn)的概率,記作P(A)=P。在實(shí)際研究中,常用事件。在實(shí)際研究中,常用事件的頻率近似地表示該事件的概率。的頻率近似地表示該事件的概率。6 2.1 基本概念基本概念 區(qū)間號(hào)區(qū)間號(hào)123456789金含量金含量ppm0.10.20.20.50.5112255101020205050100-頻數(shù)頻數(shù)203055901358065205500頻率頻率%46111827161341100某礦脈金含量區(qū)間頻數(shù)
7、及頻率分布表某礦脈金含量區(qū)間頻數(shù)及頻率分布表7 2.1 基本概念基本概念 隨機(jī)事件概率的性質(zhì)和運(yùn)算公式隨機(jī)事件概率的性質(zhì)和運(yùn)算公式(1 1)對(duì)于任意事件)對(duì)于任意事件A A,有,有 0 0P(A)P(A)1 1,P()=1P()=1,P(P()=0)=0(2 2)概率加法公式。若事件)概率加法公式。若事件A A和事件和事件B B互不相容,則有互不相容,則有 P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B) P(A)+P(P(A)+P( )=1)=1(3 3)條件概率)條件概率A)()()(BPABPBAP8 2.1 基本概念基本概念 為考察某地?cái)嗔褬?gòu)造對(duì)金礦脈的控制作用,抽取具
8、有代為考察某地?cái)嗔褬?gòu)造對(duì)金礦脈的控制作用,抽取具有代表性的表性的120個(gè)已知單元進(jìn)行統(tǒng)計(jì),結(jié)果如下:個(gè)已知單元進(jìn)行統(tǒng)計(jì),結(jié)果如下:(1)有金礦脈出現(xiàn)的單元有)有金礦脈出現(xiàn)的單元有26個(gè),其中:伴隨有個(gè),其中:伴隨有北東北東向向斷裂的單元有斷裂的單元有17個(gè);伴隨有個(gè);伴隨有北西北西向斷裂的單元有向斷裂的單元有7個(gè);伴個(gè);伴隨有隨有東西東西向斷裂的單元有向斷裂的單元有2個(gè)。個(gè)。(2)只出現(xiàn))只出現(xiàn)北東北東向斷裂的單元有向斷裂的單元有3個(gè)。個(gè)。(3)只出現(xiàn))只出現(xiàn)北西北西向斷裂的單元有向斷裂的單元有9個(gè)。個(gè)。(4)只出現(xiàn))只出現(xiàn)東西東西向斷裂的單元有向斷裂的單元有6個(gè)。個(gè)。(5)沒有礦脈也沒有斷裂
9、的單元有)沒有礦脈也沒有斷裂的單元有76個(gè)。個(gè)。9 2.1 基本概念基本概念 1)P(礦脈出現(xiàn)礦脈出現(xiàn))=26/120=21.7%;2)P(北東向斷裂出現(xiàn)北東向斷裂出現(xiàn))=(17+3)/120=16.7%;3)P(北西向斷裂出現(xiàn)北西向斷裂出現(xiàn))=(7+9)/120=13.3%;4)P(東西向斷裂出現(xiàn)東西向斷裂出現(xiàn))=(2+6)/120=6.7%; P(北東向斷裂北東向斷裂|礦脈礦脈)=%4 .65%7 .21%2 .14)()(礦脈出現(xiàn)出現(xiàn)礦脈和北東向斷裂同時(shí)PP%8 . 7%7 .21%7 . 1)()(礦脈出現(xiàn)出現(xiàn)礦脈和東西向斷裂同時(shí)PP P(東西向斷裂東西向斷裂|礦脈礦脈)= P(礦脈礦
10、脈|北東向斷裂北東向斷裂)=%03.85%7 .16%2 .14)()(北東向斷裂出現(xiàn)出現(xiàn)礦脈和北東向斷裂同時(shí)PP詳見詳見P1510 2.1 基本概念基本概念 在數(shù)學(xué)及其它應(yīng)用研究中,常用隨機(jī)變量來表征隨在數(shù)學(xué)及其它應(yīng)用研究中,常用隨機(jī)變量來表征隨機(jī)事件的數(shù)量特征。機(jī)事件的數(shù)量特征。 隨機(jī)變量隨機(jī)變量(Random Variable) : 在觀測(cè)或試驗(yàn)中可能取這個(gè)或那個(gè)數(shù)值,但不能預(yù)在觀測(cè)或試驗(yàn)中可能取這個(gè)或那個(gè)數(shù)值,但不能預(yù)知一定取什么值的變量,被稱為知一定取什么值的變量,被稱為隨機(jī)變量隨機(jī)變量。當(dāng)隨機(jī)變量。當(dāng)隨機(jī)變量取某一個(gè)值或落入某個(gè)數(shù)值區(qū)間時(shí),便構(gòu)成一個(gè)隨機(jī)事取某一個(gè)值或落入某個(gè)數(shù)值區(qū)
11、間時(shí),便構(gòu)成一個(gè)隨機(jī)事件。件。 11 2.1 基本概念基本概念 分布率分布率(Distribution Law):R.V.所取的值與其概率形成的所取的值與其概率形成的對(duì)應(yīng)關(guān)系。對(duì)應(yīng)關(guān)系。 222)(21)(xexf122.1 基本概念基本概念R.V.的分類的分類: :(1)離散型離散型R.V.(Discrete R.V.) 只能取有限個(gè)或可列無窮個(gè)數(shù)值的隨機(jī)變量(礦田只能取有限個(gè)或可列無窮個(gè)數(shù)值的隨機(jī)變量(礦田中礦床的個(gè)數(shù)、礦床中的礦脈數(shù)、抽查樣品分析的合格中礦床的個(gè)數(shù)、礦床中的礦脈數(shù)、抽查樣品分析的合格率等)。常用的率等)。常用的D.R.V.的理論分布有的理論分布有: : 二項(xiàng)分布二項(xiàng)分布(
12、Binomial D.) 泊松分布泊松分布(Poisson D.) 幾何分布幾何分布(Geometric D.) 負(fù)二項(xiàng)分布負(fù)二項(xiàng)分布(Negative binomial D.)132.1 基本概念基本概念R.V.的分類的分類: :(2)連續(xù)型連續(xù)型R.V.(Continuous R.V.) 可以取得某一區(qū)間內(nèi)的一切實(shí)數(shù)(地球化學(xué)元素可以取得某一區(qū)間內(nèi)的一切實(shí)數(shù)(地球化學(xué)元素含量、礦石品位、厚度、地形高程等),它的取值范含量、礦石品位、厚度、地形高程等),它的取值范圍是一個(gè)實(shí)數(shù)區(qū)間,是不可列的。圍是一個(gè)實(shí)數(shù)區(qū)間,是不可列的。 常用的常用的C. R.V.理論分布有:理論分布有: 正態(tài)分布正態(tài)分布
13、(Normal D.) 對(duì)數(shù)正態(tài)分布對(duì)數(shù)正態(tài)分布(Lognormal D.) 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(Standard normal D.) 均勻分布均勻分布(Uniform D.) 指數(shù)分布指數(shù)分布(Exponential D.)142.1 基本概念基本概念為了研究為了研究C.R.V.,必須建立以下幾個(gè)概念:,必須建立以下幾個(gè)概念: 直方圖直方圖(Histogram): R.V.觀測(cè)值與該觀測(cè)值的出現(xiàn)觀測(cè)值與該觀測(cè)值的出現(xiàn)頻率的對(duì)應(yīng)關(guān)系圖(設(shè)頻率的對(duì)應(yīng)關(guān)系圖(設(shè)n=總次數(shù),總次數(shù),m=某值出現(xiàn)次數(shù),某值出現(xiàn)次數(shù),則則m/n=頻率),頻率),f(x)=m/n.15 頻率分布密度曲線頻率分布密
14、度曲線(Frequency Distribution Density Curve):):通過直方圖上各小長方形頂邊連接而成的通過直方圖上各小長方形頂邊連接而成的一條近似曲線。一條近似曲線。 概率分布密度函數(shù)概率分布密度函數(shù)(Probability Distribution Density Function):):簡稱密度函數(shù),從理論上推導(dǎo)出的與頻簡稱密度函數(shù),從理論上推導(dǎo)出的與頻率分布密度曲線相一致的函數(shù)關(guān)系,該函數(shù)稱之為率分布密度曲線相一致的函數(shù)關(guān)系,該函數(shù)稱之為P.D.D.F.。2.1 基本概念基本概念為了研究為了研究C.R.V.,必須建立以下幾個(gè)概念:,必須建立以下幾個(gè)概念:162.1
15、基本概念基本概念 概率分布函數(shù)概率分布函數(shù)(Probability Distribution Function):):簡稱分布函數(shù),當(dāng)已知簡稱分布函數(shù),當(dāng)已知P.D.D.F.時(shí),便可知時(shí),便可知R.V.落在任落在任一區(qū)間一區(qū)間x1,x2內(nèi)的概率,但它涉及內(nèi)的概率,但它涉及x1、x2兩個(gè)值,不便兩個(gè)值,不便研究,故引出分布函數(shù):研究,故引出分布函數(shù):xf(t)dtx)P( F(x) 則稱則稱F(x)為為的概率分布函數(shù),稱的概率分布函數(shù),稱f(x)為為的概率分布密度的概率分布密度函數(shù)。函數(shù)。 設(shè)設(shè)為一連續(xù)型為一連續(xù)型R.V.,x為任一實(shí)數(shù),若存在非負(fù)可積函為任一實(shí)數(shù),若存在非負(fù)可積函數(shù)數(shù)f(x)(
16、即概率分布密度函數(shù)),使得:(即概率分布密度函數(shù)),使得: 172.1 基本概念基本概念 從幾何意義上看,從幾何意義上看,F(xiàn)(x)是是f(x)從從-到到x區(qū)間的一個(gè)曲邊梯區(qū)間的一個(gè)曲邊梯形的面積,如下圖。形的面積,如下圖。 F(x)的圖形如右圖,可以近似地把累積頻率分布曲線看成的圖形如右圖,可以近似地把累積頻率分布曲線看成是概率分布函數(shù)曲線。是概率分布函數(shù)曲線。 當(dāng)知道當(dāng)知道F(x),可按下式求出,可按下式求出R.V.的任一區(qū)間的任一區(qū)間x1,x2上的概率上的概率P(x1x2)=F(x2)-F(x1)182.1 基本概念基本概念0)(lim)(xFFx1)(lim)(xFFx)()(lim0a
17、FbFab概率分布函數(shù)有下列性質(zhì):概率分布函數(shù)有下列性質(zhì): 概率分布函數(shù)概率分布函數(shù)F(x)是一個(gè)非負(fù)的增函數(shù),即對(duì)是一個(gè)非負(fù)的增函數(shù),即對(duì)于任何于任何xlx2均有均有F(x1)F(x2)。192.1 基本概念基本概念母體母體(總體,(總體,Population) 所研究對(duì)象的全體所構(gòu)成之集合(所研究對(duì)象的全體所構(gòu)成之集合(R.V.取值的全體)取值的全體) 樣本樣本(子樣,(子樣,Sample) 從總體中抽出的一部分個(gè)體之集合,子樣中的個(gè)體數(shù)從總體中抽出的一部分個(gè)體之集合,子樣中的個(gè)體數(shù)稱為子樣的大?。ㄈ萘?,稱為子樣的大小(容量,sample size)。)。樣品樣品(個(gè)體,(個(gè)體,speci
18、men) 組成總體的每個(gè)基本單元。組成總體的每個(gè)基本單元。 小子樣(容量小子樣(容量3050)。)。 202.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義當(dāng)頻率直方圖(當(dāng)頻率直方圖(frequency histogram)完成后,對(duì)其最)完成后,對(duì)其最基本的研究包括:基本的研究包括:單峰?多峰曲線?單峰?多峰曲線?對(duì)稱?偏斜?對(duì)應(yīng)的理論分布曲線?對(duì)稱?偏斜?對(duì)應(yīng)的理論分布曲線?計(jì)算各種統(tǒng)計(jì)分布特征,如均值(計(jì)算各種統(tǒng)計(jì)分布特征,如均值(mean)、方差)、方差(variance)、標(biāo)準(zhǔn)差()、標(biāo)準(zhǔn)差(standard V.)、變異系)、變異系數(shù)(數(shù)(coefficient of var
19、iation)等)等。這些研究在地質(zhì)方面對(duì)找礦、礦體預(yù)測(cè)、勘探方法、地這些研究在地質(zhì)方面對(duì)找礦、礦體預(yù)測(cè)、勘探方法、地質(zhì)特征研究等均具有重要意義。質(zhì)特征研究等均具有重要意義。 212.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(1)(1) 分布率是地質(zhì)體等研究對(duì)象最重要的數(shù)學(xué)特征之一,分布率是地質(zhì)體等研究對(duì)象最重要的數(shù)學(xué)特征之一,不同成因、不同類型的地質(zhì)體具有不同的分布函數(shù)。不同成因、不同類型的地質(zhì)體具有不同的分布函數(shù)。1 1) 把試驗(yàn)分布與理論分布相比,進(jìn)行資源預(yù)測(cè)等(某把試驗(yàn)分布與理論分布相比,進(jìn)行資源預(yù)測(cè)等(某區(qū)礦量分布率、實(shí)際分布率比較);區(qū)礦量分布率、實(shí)際分布率比較);2
20、2) 不同來源(如地層)、但屬同一現(xiàn)象(如元素)的不同來源(如地層)、但屬同一現(xiàn)象(如元素)的試驗(yàn)數(shù)據(jù)間的比較(地層對(duì)比、巖體特征)。試驗(yàn)數(shù)據(jù)間的比較(地層對(duì)比、巖體特征)。 顯然,分布率有重要的鑒別意義及成因意義。顯然,分布率有重要的鑒別意義及成因意義。 222.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(2)(2) 根據(jù)數(shù)據(jù)分布模型以及所研究問題的性質(zhì)進(jìn)行各根據(jù)數(shù)據(jù)分布模型以及所研究問題的性質(zhì)進(jìn)行各種概率估計(jì)種概率估計(jì)1 1) 評(píng)價(jià)各種因素對(duì)觀測(cè)數(shù)據(jù)的影響(各種變量對(duì)母評(píng)價(jià)各種因素對(duì)觀測(cè)數(shù)據(jù)的影響(各種變量對(duì)母體特征的影響);體特征的影響);2 2) 對(duì)未觀測(cè)到的變量中間值進(jìn)行內(nèi)
21、插;對(duì)未觀測(cè)到的變量中間值進(jìn)行內(nèi)插;3 3) 確定確定R.V.在在指定區(qū)域內(nèi)出現(xiàn)的概率(如富礦在所有指定區(qū)域內(nèi)出現(xiàn)的概率(如富礦在所有礦體中所占的比例)。礦體中所占的比例)。 232.2 研究分布率的(地質(zhì))意義研究分布率的(地質(zhì))意義(3) 查明分布率是進(jìn)一步進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)查明分布率是進(jìn)一步進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ) 1) 選擇適合的統(tǒng)計(jì)分析方法;選擇適合的統(tǒng)計(jì)分析方法; 2) 確定原始數(shù)據(jù)是否要進(jìn)行預(yù)處理;確定原始數(shù)據(jù)是否要進(jìn)行預(yù)處理; 3) 評(píng)價(jià)統(tǒng)計(jì)分析工作的效果。評(píng)價(jià)統(tǒng)計(jì)分析工作的效果。 242.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 隨機(jī)變量的某些特征可以用數(shù)字來表征,其中最隨機(jī)變量的
22、某些特征可以用數(shù)字來表征,其中最重要的是重要的是平均值平均值、方差方差和和協(xié)方差協(xié)方差。 (1 1)平均值)平均值 平均值是變量自身中心趨勢(shì)的一種度量,它反映平均值是變量自身中心趨勢(shì)的一種度量,它反映的是隨機(jī)變量的集中性質(zhì)。的是隨機(jī)變量的集中性質(zhì)。 設(shè)設(shè)離散型離散型隨機(jī)變量隨機(jī)變量的可能取值為的可能取值為x x1 1,x x2 2,x xn n,P(P(=x=xi i)=P)=Pi i,則,則 稱為稱為的平均值。不難看出,隨機(jī)變量的平均值是這的平均值。不難看出,隨機(jī)變量的平均值是這個(gè)變量所有可能取值個(gè)變量所有可能取值以概率為權(quán)的加權(quán)平均以概率為權(quán)的加權(quán)平均。iiiPxE252.3 隨機(jī)變量的數(shù)
23、字表征隨機(jī)變量的數(shù)字表征 對(duì)對(duì)連續(xù)型連續(xù)型隨機(jī)變量隨機(jī)變量,設(shè)它的概率分布密度為,設(shè)它的概率分布密度為P(xP(x) ),則,則dxxxPE)(稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 稱為稱為的平均值。的平均值。 概率論中,平均值也稱作數(shù)學(xué)期望。概率論中,平均值也稱作數(shù)學(xué)期望。 在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。的計(jì)算來估計(jì)總體
24、的平均值。262.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 1 1)算術(shù)平均值)算術(shù)平均值 設(shè)設(shè)x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測(cè)值,的一組觀測(cè)值,則則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 稱為該樣本的算術(shù)平均值。稱為該樣本的算術(shù)平均值。 不難看出,用以計(jì)算算術(shù)平均值的各個(gè)觀測(cè)值的不難看出,用以計(jì)算算術(shù)平均值的各個(gè)觀測(cè)值的權(quán)因子是相等的,并且都等于權(quán)因子
25、是相等的,并且都等于1/n1/n。niixnx11272.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 2 2)加權(quán)平均值)加權(quán)平均值 設(shè)設(shè)x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測(cè)值,的一組觀測(cè)值,f1,f2,fn是和每個(gè)觀測(cè)值相對(duì)應(yīng)的權(quán)因子,則是和每個(gè)觀測(cè)值相對(duì)應(yīng)的權(quán)因子,則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 稱為該樣本的加權(quán)平均值。稱為該樣本的加權(quán)平均值。n
26、iiniiifxfx11權(quán)282.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 3 3)幾何平均值)幾何平均值 x x1 1,x x2 2,x xn n是樣本容量為是樣本容量為n n的一組觀測(cè)值,則的一組觀測(cè)值,則 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 稱為該樣本的幾何平均值。稱為該樣本的幾何平均值。 對(duì)于變化較大的地質(zhì)體,同一個(gè)樣本的算術(shù)平對(duì)于變化較大的地質(zhì)體,同一個(gè)樣本的算術(shù)平均值和加權(quán)平均值之間相差
27、可達(dá)均值和加權(quán)平均值之間相差可達(dá)3080%。因而,計(jì)。因而,計(jì)算方法的選擇是影響精度的重要因素之一。算方法的選擇是影響精度的重要因素之一。nnxxxx21權(quán)292.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 還有其它一些表征隨機(jī)變量集中性質(zhì)的數(shù)字特征:還有其它一些表征隨機(jī)變量集中性質(zhì)的數(shù)字特征: 眾數(shù):眾數(shù):是具有最大頻數(shù)是具有最大頻數(shù)( (或頻率或頻率) )的隨機(jī)變量的值,的隨機(jī)變量的值,一般用一般用M M0 0表示。表示。 中位數(shù):中位數(shù):是把所有觀測(cè)值按大小次序排列,位于是把所有觀測(cè)值按大小次序排列,位于數(shù)列中間的數(shù)值,一般用數(shù)列中間的數(shù)值,一般用MeMe表示。表示。 當(dāng)觀測(cè)值為正態(tài)分布時(shí)
28、,當(dāng)觀測(cè)值為正態(tài)分布時(shí), ,當(dāng)觀測(cè)值為左,當(dāng)觀測(cè)值為左不對(duì)稱分布時(shí),不對(duì)稱分布時(shí), 。當(dāng)觀測(cè)值為右不對(duì)稱分布。當(dāng)觀測(cè)值為右不對(duì)稱分布時(shí),時(shí), 。 在實(shí)際應(yīng)用中,當(dāng)觀測(cè)值中有特大、特小值或數(shù)在實(shí)際應(yīng)用中,當(dāng)觀測(cè)值中有特大、特小值或數(shù)列兩邊的數(shù)值不夠精確時(shí),觀測(cè)值的眾數(shù)或中位數(shù)更列兩邊的數(shù)值不夠精確時(shí),觀測(cè)值的眾數(shù)或中位數(shù)更能反映隨機(jī)變量的分布特征。能反映隨機(jī)變量的分布特征。 稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的
29、平均值。 eMMx0 xMMe00MMxe302.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 (2)方差)方差 方差是變量自身變化幅度的一種度量,它反映的方差是變量自身變化幅度的一種度量,它反映的是隨機(jī)變量的離散性質(zhì)。是隨機(jī)變量的離散性質(zhì)。 對(duì)于隨機(jī)變量對(duì)于隨機(jī)變量,-E稱為稱為的離差,各離差平方的的離差,各離差平方的平均值平均值 D=E(-E)2稱為稱為的方差。的方差。 不難看出,方差是對(duì)隨機(jī)變量的取值與其平均值不難看出,方差是對(duì)隨機(jī)變量的取值與其平均值之間的偏差情況或分散程度的描述,方差越小,變量之間的偏差情況或分散程度的描述,方差越小,變量越集中分布于平均值附近。越集中分布于平均值附近。
30、在實(shí)際應(yīng)用中,用樣本的方差值估計(jì)總體的方差。在實(shí)際應(yīng)用中,用樣本的方差值估計(jì)總體的方差。稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 312.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 (3 3)協(xié)方差)協(xié)方差 設(shè)設(shè)和和是兩個(gè)隨機(jī)變量,則是兩個(gè)隨機(jī)變量,則 CoV(,)=E(-E)(-E) 稱為稱為和和的協(xié)方差。的協(xié)方差。 若若、是連續(xù)型變量,具有概率分布是連續(xù)型變量,具有概率分布P(x,y),則,則稱為稱為的
31、平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 在實(shí)際應(yīng)用中,用樣本的協(xié)方差估計(jì)總體的協(xié)方差。在實(shí)際應(yīng)用中,用樣本的協(xié)方差估計(jì)總體的協(xié)方差。 dxdyyxPEExCoV),()(),(322.3 隨機(jī)變量的數(shù)字表征隨機(jī)變量的數(shù)字表征 設(shè)設(shè)(x1,y1),(x2,y2),(xn,yn)是樣本容量為是樣本容量為n的的一組觀測(cè)值,則一組觀測(cè)值,則稱為稱為的平均值。的平均值。在概率論中,平均值也稱作數(shù)學(xué)期望。在概率論中,平均值也
32、稱作數(shù)學(xué)期望。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。在實(shí)際應(yīng)用中,經(jīng)常對(duì)樣本觀測(cè)值進(jìn)行不同方法的計(jì)算來估計(jì)總體的平均值。 稱為稱為x、y的協(xié)方差。它是對(duì)總體協(xié)方差的無偏估計(jì)值。的協(xié)方差。它是對(duì)總體協(xié)方差的無偏估計(jì)值。)(11)(111niiiiniixyyxnyxnyyxxn332.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布 正態(tài)分布是目前研究得最徹底的一種數(shù)據(jù)分布率,正態(tài)分布是目前研究得最徹底的一種數(shù)據(jù)分布率,許多統(tǒng)計(jì)方法多假設(shè)數(shù)據(jù)服從正態(tài)分布。許多統(tǒng)計(jì)方法多假設(shè)數(shù)據(jù)服從正態(tài)分布。當(dāng)數(shù)據(jù)不服從正態(tài)分布時(shí),常常將其當(dāng)數(shù)據(jù)不服從正態(tài)分布時(shí),常常將其: 1)變換
33、為正態(tài)分布,或)變換為正態(tài)分布,或 2)選擇穩(wěn)健的統(tǒng)計(jì)方法()選擇穩(wěn)健的統(tǒng)計(jì)方法(robust stat.)或非參數(shù)統(tǒng)計(jì))或非參數(shù)統(tǒng)計(jì)方法(方法(non-parameter, free-distribution)。)。 3435關(guān)于穩(wěn)健統(tǒng)計(jì)學(xué)關(guān)于穩(wěn)健統(tǒng)計(jì)學(xué)* *問題的提出:問題的提出: 經(jīng)典的統(tǒng)計(jì)方法大多以經(jīng)典的統(tǒng)計(jì)方法大多以正態(tài)分布假設(shè)及最正態(tài)分布假設(shè)及最小二乘法小二乘法為基礎(chǔ),可是在實(shí)際數(shù)據(jù)中特別是地為基礎(chǔ),可是在實(shí)際數(shù)據(jù)中特別是地質(zhì)數(shù)據(jù)(如油氣化探數(shù)據(jù))中的離散度大,質(zhì)數(shù)據(jù)(如油氣化探數(shù)據(jù))中的離散度大,偏偏離正態(tài)分布假設(shè)離正態(tài)分布假設(shè)的情況十分普遍。的情況十分普遍。36偏離的原因偏離的
34、原因: a.a.總體服從正態(tài)分布,由于各類誤差(總體服從正態(tài)分布,由于各類誤差(隨隨機(jī)誤差機(jī)誤差、系統(tǒng)誤差系統(tǒng)誤差、過失誤差過失誤差)或外總體的)或外總體的加入所致;加入所致; b.b.總體本來就不服從正態(tài)分布,如服從總體本來就不服從正態(tài)分布,如服從t t分布、分布、分布、分布、F F分布等。分布等。37后果后果: : 當(dāng)數(shù)據(jù)偏離正態(tài)假設(shè)較明顯時(shí),經(jīng)典的統(tǒng)當(dāng)數(shù)據(jù)偏離正態(tài)假設(shè)較明顯時(shí),經(jīng)典的統(tǒng)計(jì)方法常常計(jì)方法常常給出不容易覺察的歪曲的甚至錯(cuò)誤給出不容易覺察的歪曲的甚至錯(cuò)誤的結(jié)果的結(jié)果。 可見經(jīng)典統(tǒng)計(jì)學(xué)方法對(duì)偏離正態(tài)分布假設(shè)可見經(jīng)典統(tǒng)計(jì)學(xué)方法對(duì)偏離正態(tài)分布假設(shè)的情況是非常敏感的。的情況是非常敏感的
35、。 博克斯(博克斯(G GE EP PBoxBox,19531953)把這種現(xiàn)象把這種現(xiàn)象稱之為穩(wěn)健性問題。這就是穩(wěn)健性一詞的由來。稱之為穩(wěn)健性問題。這就是穩(wěn)健性一詞的由來。38 修改統(tǒng)計(jì)方法使之更穩(wěn)健,以適應(yīng)修改統(tǒng)計(jì)方法使之更穩(wěn)健,以適應(yīng)數(shù)據(jù)偏離統(tǒng)計(jì)假設(shè)的情況,是穩(wěn)健統(tǒng)計(jì)數(shù)據(jù)偏離統(tǒng)計(jì)假設(shè)的情況,是穩(wěn)健統(tǒng)計(jì)學(xué)產(chǎn)生和發(fā)展的一個(gè)主導(dǎo)思想。各種穩(wěn)學(xué)產(chǎn)生和發(fā)展的一個(gè)主導(dǎo)思想。各種穩(wěn)健統(tǒng)計(jì)方法的基礎(chǔ)是對(duì)位置(即數(shù)據(jù)點(diǎn)健統(tǒng)計(jì)方法的基礎(chǔ)是對(duì)位置(即數(shù)據(jù)點(diǎn)群的中心)及尺度(即數(shù)據(jù)點(diǎn)群的離散群的中心)及尺度(即數(shù)據(jù)點(diǎn)群的離散度)的穩(wěn)健估計(jì)。度)的穩(wěn)健估計(jì)。改進(jìn)方法改進(jìn)方法:39 采用中位數(shù)及中位絕對(duì)中位差,即采
36、用中位數(shù)及中位絕對(duì)中位差,即MADmedxi一一med(xi)0.6746來代替算來代替算術(shù)平均值及標(biāo)準(zhǔn)差作為數(shù)據(jù)平均值及離散術(shù)平均值及標(biāo)準(zhǔn)差作為數(shù)據(jù)平均值及離散度的估計(jì)值,可以獲得較好的穩(wěn)健性。度的估計(jì)值,可以獲得較好的穩(wěn)健性。 目前已提出目前已提出了了M估計(jì)估計(jì)(最大似然估計(jì)(最大似然估計(jì))、)、L估計(jì)估計(jì)(有序統(tǒng)計(jì)量的線性組合)(有序統(tǒng)計(jì)量的線性組合)及及R估計(jì)估計(jì)(秩估計(jì))。(秩估計(jì))。例如例如2.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布(1)正態(tài)分布)正態(tài)分布定義:若定義:若R.V.的概率密度函數(shù)為:的概率密度函數(shù)為: -x0 則稱則稱服從正態(tài)分布,簡記為服從正態(tài)分布,簡記為
37、N(,2) 222)(21)(xexf402.4 2.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布概率密度曲線正態(tài)分布概率密度曲線 正態(tài)分布累積概率曲線正態(tài)分布累積概率曲線412.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布的概率分布函數(shù)為:正態(tài)分布的概率分布函數(shù)為: (t 為(為(-,x)內(nèi))內(nèi)的任一取值的任一取值)dtexFxt222)(21)(42密度函數(shù)的圖形為鈴形,其特征為:密度函數(shù)的圖形為鈴形,其特征為:2.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布xf(x)1)單峰;)單峰;2)以)以x=為對(duì)稱軸的對(duì)稱曲線,當(dāng)為對(duì)稱軸的對(duì)稱曲線,當(dāng)x時(shí),時(shí), f(x
38、)=0,x=處是其拐點(diǎn);處是其拐點(diǎn);3)(-,+ )內(nèi)曲線與橫軸圍成的面積等于內(nèi)曲線與橫軸圍成的面積等于1;214)有兩個(gè)參數(shù)有兩個(gè)參數(shù)和和,若固定,若固定,改變,改變,則形狀不變,位,則形狀不變,位置改變;若置改變;若固定,固定,改變,則由最大值改變,則由最大值f() = 可知,可知,越小,峰值越大,曲線越陡,越小,峰值越大,曲線越陡,集中于集中于附近,附近,越大,峰值越小,曲線越平緩,越大,峰值越小,曲線越平緩,越分散。越分散。 432.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布(2)標(biāo)準(zhǔn)正態(tài)分布)標(biāo)準(zhǔn)正態(tài)分布當(dāng)當(dāng)=0,=1時(shí)的正態(tài)分布,即是我們平常所謂的標(biāo)準(zhǔn)時(shí)的正態(tài)分布,即是我們平
39、常所謂的標(biāo)準(zhǔn)正態(tài)分布,記為:正態(tài)分布,記為:N(0,1),此時(shí):密度函數(shù)和分布函),此時(shí):密度函數(shù)和分布函數(shù)分別為:數(shù)分別為:dte21x)P(x)e21(x)x2t2x22標(biāo)準(zhǔn)正態(tài)分布的變換方法:標(biāo)準(zhǔn)正態(tài)分布的變換方法:設(shè)設(shè)為非標(biāo)準(zhǔn)的正態(tài)變量,其平均值為為非標(biāo)準(zhǔn)的正態(tài)變量,其平均值為,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為,令令u=(x-)/,并以,并以u(píng)代替代替x,則新變量就具有,則新變量就具有N(0,1)分布,變分布,變量量u稱為標(biāo)準(zhǔn)化正態(tài)變量。稱為標(biāo)準(zhǔn)化正態(tài)變量。 442.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布 (2)標(biāo)準(zhǔn)正態(tài)分布)標(biāo)準(zhǔn)正態(tài)分布452.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)
40、分布(3)正態(tài)分布的實(shí)際應(yīng)用)正態(tài)分布的實(shí)際應(yīng)用現(xiàn)有一銅礦床,現(xiàn)有一銅礦床,Cu品位服從正態(tài)分布,且其平均品位為品位服從正態(tài)分布,且其平均品位為5%,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差2%,求礦床中,求礦床中Cu品位介于品位介于5.247.5%的概率為多少?的概率為多少?1) 先進(jìn)行標(biāo)準(zhǔn)化:先進(jìn)行標(biāo)準(zhǔn)化:u=(x-)/=(x-5)/2 u1=(5.24-5)/2=0.12 u2=(7.5-5)/2=1.25dxex5 . 724. 5222)5(217.5)P(5.24以上問題即求解:以上問題即求解:de25. 112. 022217.5)P(5.242) 求區(qū)間概率求區(qū)間概率: =F(1.25)-F(0.12)=
41、0.894-0.548=0.346=34.6%即礦床中即礦床中Cu品位介于品位介于5.247.5%的礦石量為的礦石量為34.6% 462.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布 (4)對(duì)數(shù)正態(tài)分布)對(duì)數(shù)正態(tài)分布 若若R.V.=ln呈正態(tài)分布,則稱呈正態(tài)分布,則稱R.V.服從對(duì)數(shù)正態(tài)分服從對(duì)數(shù)正態(tài)分布,即布,即 N(,2)且)且=ln,若對(duì)數(shù)正態(tài)變量,若對(duì)數(shù)正態(tài)變量的密度的密度函數(shù)為函數(shù)為(x),則,則ln的密度函數(shù)呈正態(tài)分布的密度函數(shù)呈正態(tài)分布f(y) 472.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布設(shè)設(shè)x1,x2,為為的觀測(cè)值,的觀測(cè)值,=ln,則,則)0(0)0(21)(
42、222)(lnxxexfx式中,式中,和和2分別是變量分別是變量=ln的平均值和方差。對(duì)的平均值和方差。對(duì)數(shù)正態(tài)分布有兩個(gè)參數(shù),即數(shù)正態(tài)分布有兩個(gè)參數(shù),即niixn1ln1niixn122)(ln11482.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布 現(xiàn)象:現(xiàn)象:大多數(shù)內(nèi)生有色、稀有及貴重金屬礦床中的有用大多數(shù)內(nèi)生有色、稀有及貴重金屬礦床中的有用組分,以及巖石中的微量元素,都具有對(duì)數(shù)正態(tài)分布的特征。組分,以及巖石中的微量元素,都具有對(duì)數(shù)正態(tài)分布的特征。 原因:原因:這類元素的含量往往受某些起顯著作用的地質(zhì)因這類元素的含量往往受某些起顯著作用的地質(zhì)因素所控制,使它們?cè)诳臻g上的分布極不均勻,
43、致使元素含量素所控制,使它們?cè)诳臻g上的分布極不均勻,致使元素含量在數(shù)學(xué)上因不能滿足中心極限定理的條件而趨于較大的正偏在數(shù)學(xué)上因不能滿足中心極限定理的條件而趨于較大的正偏斜,從而導(dǎo)致隨機(jī)變量服從或近似于對(duì)數(shù)正態(tài)分布。斜,從而導(dǎo)致隨機(jī)變量服從或近似于對(duì)數(shù)正態(tài)分布。 處理:處理:對(duì)這類地質(zhì)研究對(duì)象,就需要按上述思路和方法,對(duì)這類地質(zhì)研究對(duì)象,就需要按上述思路和方法,在對(duì)原始數(shù)據(jù)取對(duì)數(shù)之后,再按正態(tài)分布的概率分布密度函在對(duì)原始數(shù)據(jù)取對(duì)數(shù)之后,再按正態(tài)分布的概率分布密度函數(shù)和分布函數(shù)進(jìn)行計(jì)算。數(shù)和分布函數(shù)進(jìn)行計(jì)算。492.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布(5)三參數(shù)對(duì)數(shù)正態(tài)分布)三參數(shù)對(duì)
44、數(shù)正態(tài)分布 當(dāng)當(dāng)y=ln(x)所呈現(xiàn)的不是正態(tài)分布,而基于某個(gè)所呈現(xiàn)的不是正態(tài)分布,而基于某個(gè)參數(shù)參數(shù)b的的y=ln(x+b)呈正態(tài)分布,則稱該隨機(jī)變量服呈正態(tài)分布,則稱該隨機(jī)變量服從三參數(shù)正態(tài)分布。從三參數(shù)正態(tài)分布。 正態(tài)分布與對(duì)數(shù)正態(tài)分布的關(guān)系:正態(tài)分布與對(duì)數(shù)正態(tài)分布的關(guān)系: 設(shè)設(shè)x呈對(duì)數(shù)正態(tài)分布,且有呈對(duì)數(shù)正態(tài)分布,且有、, ln(x)=y呈正態(tài)分布,且有呈正態(tài)分布,且有e、e,則:,則: =ee+e/2 =2ee-1502.4 正態(tài)分布及對(duì)數(shù)正態(tài)分布正態(tài)分布及對(duì)數(shù)正態(tài)分布對(duì)數(shù)正態(tài)分布的成因:對(duì)數(shù)正態(tài)分布的成因:1) 某地質(zhì)變量受綜合因素影響,且某個(gè)因素相某地質(zhì)變量受綜合因素影響,且某個(gè)
45、因素相對(duì)突出;對(duì)突出;2) 多次地質(zhì)作用疊加;多次地質(zhì)作用疊加;3) 樣品大小有關(guān)。樣品大小有關(guān)。 512.5 二項(xiàng)分布二項(xiàng)分布(Binomial D.) 該分布專門用于描述非該分布專門用于描述非“成功成功”(A)即)即“失敗失敗”( )兩種試驗(yàn)結(jié)果的物理模型,它簡單而有用。)兩種試驗(yàn)結(jié)果的物理模型,它簡單而有用。(1)計(jì)算公式)計(jì)算公式 當(dāng)當(dāng)R.V.服從下式時(shí),稱服從下式時(shí),稱服從二項(xiàng)分布:服從二項(xiàng)分布: Pn(k)=CnkPk(1-P)n-k式中式中,Pn(k):n次試驗(yàn)中事件次試驗(yàn)中事件A出現(xiàn)出現(xiàn)k次的概率次的概率 P:1次試驗(yàn)中事件次試驗(yàn)中事件A出現(xiàn)的概率出現(xiàn)的概率 1-P:1次試驗(yàn)中
46、事件次試驗(yàn)中事件A不出現(xiàn)的概率不出現(xiàn)的概率 Cnk:為二項(xiàng)式系數(shù),:為二項(xiàng)式系數(shù),Cnk=n!/k!(n-k)!A522.5 二項(xiàng)分布二項(xiàng)分布(Binomial D.)1p)(1pCknkn0kkn當(dāng)當(dāng)k=0,1,2,n時(shí),構(gòu)成一必然事件,故有:時(shí),構(gòu)成一必然事件,故有: 53(2 2)二項(xiàng)分布的性質(zhì))二項(xiàng)分布的性質(zhì)平均數(shù)平均數(shù)=np 方差方差2=np(1-p)2.5 二項(xiàng)分布二項(xiàng)分布(Binomial D.)54(3) 二項(xiàng)分布的圖形二項(xiàng)分布的圖形 二項(xiàng)分布的圖形,取決于兩個(gè)方面,其一為事件發(fā)二項(xiàng)分布的圖形,取決于兩個(gè)方面,其一為事件發(fā)生的概率生的概率p ,其二為樣本量其二為樣本量n。當(dāng)當(dāng)p
47、=1-p =1/2時(shí),二項(xiàng)分布的圖形是對(duì)稱的;時(shí),二項(xiàng)分布的圖形是對(duì)稱的;當(dāng)當(dāng)p1/2時(shí),二項(xiàng)分布的圖形呈右偏態(tài);時(shí),二項(xiàng)分布的圖形呈右偏態(tài);當(dāng)當(dāng)p與與1-p不變時(shí),即使不變時(shí),即使p1-p ,但隨著但隨著n的增大,偏的增大,偏態(tài)程度會(huì)逐漸降低而趨于對(duì)稱。態(tài)程度會(huì)逐漸降低而趨于對(duì)稱。 2.5 二項(xiàng)分布二項(xiàng)分布(Binomial D.)55二項(xiàng)分布總體不同樣本數(shù)時(shí)的抽樣分布二項(xiàng)分布總體不同樣本數(shù)時(shí)的抽樣分布 2.5 二項(xiàng)分布二項(xiàng)分布(binomial D.)(4)應(yīng)用實(shí)例)應(yīng)用實(shí)例已知某鐵礦:已知某鐵礦:TFe45%(富礦)的礦樣占樣品總數(shù)的(富礦)的礦樣占樣品總數(shù)的10%,問,問若取若取3個(gè)樣
48、,其中個(gè)樣,其中3個(gè)、個(gè)、2個(gè)、個(gè)、1個(gè)、個(gè)、0個(gè)個(gè)TFe45%(富礦)的樣(富礦)的樣品的概率各為多少?(用于選廠入選品位的預(yù)測(cè)和研究)品的概率各為多少?(用于選廠入選品位的預(yù)測(cè)和研究)解:已知總樣品中,解:已知總樣品中,TFe45%的樣品占的樣品占10%,即,即P=10%(1次取次取樣中,樣中,TFe45%的概率為的概率為10%) 因而,因而,TFe45%的樣品,即的樣品,即k=3,2,1,0 按上式,按上式,Pn(k)=CnkPk(1-P)n-k 式中式中Cnk=n!/k!(n-k)!562.5 二項(xiàng)分布二項(xiàng)分布(binomial D.)所以所以:3個(gè)樣個(gè)樣全全為為TFe45%的概率的概
49、率P3(3)= C33 (0.1)3(0.9)3-3=0.001=0.1%3個(gè)樣中個(gè)樣中2個(gè)個(gè)TFe45%的概率的概率P3(2)= C23 (0.1)2(0.9)3-2=0.0243=2.43%3個(gè)樣中個(gè)樣中1個(gè)個(gè)TFe45%的概率的概率P3(1)= C13 (0.1)1(0.9)3-1=0.243=24.3%3個(gè)樣中個(gè)樣中0個(gè)個(gè)TFe45%的概率的概率P3(0)= C03 (0.1)0(0.9)3-0=0.729=72.9%且且 P3(3)+ P3(2)+ P3(1)+ P3(0)=1572.6 泊凇分布泊凇分布(Poissons D.)(1)計(jì)算公式)計(jì)算公式 設(shè)離散型隨機(jī)變量設(shè)離散型隨機(jī)
50、變量的可能取值為的可能取值為x x1 1,x x2 2,x xk k,;P P1 1,P P2 2,P Pk k,是是x xk k出現(xiàn)的概率,則出現(xiàn)的概率,則 上式表示,在一定時(shí)間(空間)內(nèi),某隨機(jī)事件的上式表示,在一定時(shí)間(空間)內(nèi),某隨機(jī)事件的發(fā)生概率是固定的(即發(fā)生概率是固定的(即),則在給定的時(shí)間(空間)內(nèi),),則在給定的時(shí)間(空間)內(nèi),該事件發(fā)生指定次數(shù)該事件發(fā)生指定次數(shù)k的概率為的概率為P(k)。ekkPkPk!)()((=npnp00,k=1k=1,2 2,)稱為離散型隨機(jī)變量稱為離散型隨機(jī)變量服從參數(shù)為服從參數(shù)為的泊凇分布。的泊凇分布。582.6 泊凇分布泊凇分布(Poisso
51、ns D.) 該分布是二項(xiàng)分布的特例,當(dāng)該分布是二項(xiàng)分布的特例,當(dāng)P很小,很小,n很大很大時(shí),用泊凇分布能很好地近似二項(xiàng)分布。時(shí),用泊凇分布能很好地近似二項(xiàng)分布。 泊凇分布的方差泊凇分布的方差DD=,=。 5960二項(xiàng)分布與泊松分布的比較二項(xiàng)分布與泊松分布的比較 由上表可見,二者計(jì)算結(jié)果非常接近,當(dāng)由上表可見,二者計(jì)算結(jié)果非常接近,當(dāng)n愈大其接近程度愈大其接近程度愈好,但泊松分布的愈好,但泊松分布的P(X)計(jì)算較為簡便。計(jì)算較為簡便。 XP(X) 二項(xiàng)分布二項(xiàng)分布 泊松分布泊松分布 0123456780.33600.36970.18490.06100.01490.00290.00050.000
52、10.00000.36790.36790.18390.06130.01530.00310.00050.00010.0000合計(jì)合計(jì)1.0000 1.0000 2.6 泊凇分布泊凇分布(Poissons D.)61(2)Poisson分布的圖形分布的圖形 泊松分布的圖形是由平均數(shù)泊松分布的圖形是由平均數(shù)來確定的。來確定的。當(dāng)當(dāng)較小時(shí),泊松分布不對(duì)稱的程度較為顯著,較小時(shí),泊松分布不對(duì)稱的程度較為顯著,通常呈左偏分布;通常呈左偏分布;隨著隨著值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而值逐漸增大,泊松分布逐漸趨向?qū)ΨQ,而且,和二項(xiàng)分布一樣,也逐漸趨向正態(tài)分布。且,和二項(xiàng)分布一樣,也逐漸趨向正態(tài)分布。一般說
53、來,當(dāng)平均數(shù)一般說來,當(dāng)平均數(shù)50時(shí)時(shí)(有人認(rèn)為有人認(rèn)為20),泊泊松分布就近似于正態(tài)分布。松分布就近似于正態(tài)分布。 622.6 泊凇分布泊凇分布(Poissons D.)(3)應(yīng)用實(shí)例)應(yīng)用實(shí)例 某火山巖盆地發(fā)育有與閃長玢巖有關(guān)的鐵礦床(點(diǎn)),某火山巖盆地發(fā)育有與閃長玢巖有關(guān)的鐵礦床(點(diǎn)),現(xiàn)將該盆地按現(xiàn)將該盆地按9km2大小劃分成等面積單元大小劃分成等面積單元93個(gè),并統(tǒng)計(jì)了含個(gè),并統(tǒng)計(jì)了含不同礦床(點(diǎn))數(shù)的單元的個(gè)數(shù)(頻數(shù)),如表所示,問有不同礦床(點(diǎn))數(shù)的單元的個(gè)數(shù)(頻數(shù)),如表所示,問有無發(fā)現(xiàn)新礦床(點(diǎn))的可能性?無發(fā)現(xiàn)新礦床(點(diǎn))的可能性?單元內(nèi)礦點(diǎn)數(shù)單元內(nèi)礦點(diǎn)數(shù)kFi觀測(cè)頻數(shù)觀測(cè)頻數(shù)fi*理論頻數(shù)理論頻數(shù)07268.211521.1243.3320.3400632.6 泊凇分布泊凇分布(Poissons D.) 計(jì)算統(tǒng)計(jì)量計(jì)算統(tǒng)計(jì)量 計(jì)算出每個(gè)單元平均所含礦床(點(diǎn))數(shù)計(jì)算出每個(gè)單元平均所含礦床(點(diǎn))數(shù): =(720+151+42+23+04)/93=0.3118 方差方差2=(0-0.31)272+(1-0.31)215+(2-0.31)214+/(93-1)=0.4342 進(jìn)行假設(shè):進(jìn)行假設(shè):即假定礦點(diǎn)分布服從泊凇分布:即假定礦點(diǎn)分布服從泊凇分布:實(shí)測(cè)值實(shí)測(cè)值( (含含0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 校園地貸款申請(qǐng)書范文
- DB37-T 4684-2023 海濱灘涂微塑料監(jiān)測(cè)技術(shù)規(guī)范
- 自主實(shí)習(xí)申請(qǐng)書格式
- 班級(jí)體育委員申請(qǐng)書
- 環(huán)境監(jiān)測(cè)技術(shù)在農(nóng)業(yè)可持續(xù)性中的作用
- 個(gè)人結(jié)算業(yè)務(wù)申請(qǐng)書
- 喪葬費(fèi)申請(qǐng)書范文
- 2024-2025學(xué)年高中歷史專題819世紀(jì)以來的文學(xué)藝術(shù)2碰撞與沖突練習(xí)含解析人民版必修3
- 2024-2025學(xué)年高中數(shù)學(xué)課時(shí)分層作業(yè)17常數(shù)與冪函數(shù)的導(dǎo)數(shù)導(dǎo)數(shù)公式表含解析新人教B版選修1-1
- 2024-2025學(xué)年高中地理第3章農(nóng)業(yè)地域的形成與發(fā)展第1節(jié)農(nóng)業(yè)的區(qū)位選擇鞏固練習(xí)新人教版必修2
- 電網(wǎng)工程設(shè)備材料信息參考價(jià)(2024年第四季度)
- 2025年江蘇農(nóng)牧科技職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年常考版參考題庫含答案解析
- 數(shù)據(jù)中心運(yùn)維服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 瑞幸對(duì)賭協(xié)議
- 幼兒園一日活動(dòng)流程教師培訓(xùn)
- 2025江蘇連云港市贛榆城市建設(shè)發(fā)展集團(tuán)限公司招聘工作人員15人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 征信入校園教育課件
- 2025年全年日歷-含農(nóng)歷、國家法定假日-帶周數(shù)豎版
- 《電子商務(wù)系統(tǒng)分析與設(shè)計(jì)》課件-電子商務(wù)系統(tǒng)規(guī)劃
- 《東北大學(xué)宣傳》課件
- 2025年山東鐵投集團(tuán)招聘筆試參考題庫含答案解析
評(píng)論
0/150
提交評(píng)論