第九章隨機(jī)數(shù)學(xué)模型_第1頁
第九章隨機(jī)數(shù)學(xué)模型_第2頁
第九章隨機(jī)數(shù)學(xué)模型_第3頁
第九章隨機(jī)數(shù)學(xué)模型_第4頁
第九章隨機(jī)數(shù)學(xué)模型_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第九章隨機(jī)數(shù)學(xué)模型 我們在處理實際問題時,往往會遇到許多不確定的因素引入隨機(jī)變量描述這種不確定的行為,通常是對實際問題最恰當(dāng)?shù)拿枋?。由此建立的?shù)學(xué)模型稱為隨機(jī)數(shù)學(xué)模型。9.1廣告中的數(shù)學(xué)在我們的現(xiàn)實生活中,廣告無所不在。廣告給商家?guī)砹素S厚的利潤,廣告中蘊藏著諸多學(xué)問。以房產(chǎn)銷售廣告為例,房產(chǎn)開發(fā)商為了擴(kuò)大銷售,提高銷售量,通常會印制精美的廣告分發(fā)給大家。雖然買房人的買房行為是隨機(jī)的,他可能買房,也可能暫時不買,可能買這家開發(fā)商的房子,也可能買另一家開發(fā)商的房子,但與各開發(fā)商的廣告投入有一定的關(guān)聯(lián)。一般地,隨著廣告費用的增加,潛在的購買量會增加,但市場的購買力是有一定限度的。表9.1給出了某開

2、發(fā)商以往9次廣告投入及預(yù)測的潛在購買力。 表9.1 廣告投入與潛在購買力統(tǒng)計(單位:百萬元) 廣告投入 0.2 0.4 0.5 0.52 0.56 0.65 0.67 0.69 1 購買力 1034 1058 1067 1069 1072 1078 1080 1081 1095下面從數(shù)學(xué)角度,通過合理的假設(shè)為開發(fā)商制定合理的廣告策略,并給出單位面積成本700元,售價為4000元條件下的廣告方案。模型假設(shè)(1)假設(shè)單位面積成本為元,售價為元,忽略其他費用,需求量是隨機(jī)變量,其概率密度為。(2)假設(shè)廣告投入為百萬元,潛在購買力是的函數(shù)記作,實際供應(yīng)量為。模型建立開發(fā)商制定策略的好壞主要由利潤來確定

3、,好的策略應(yīng)該獲得好的利潤(平均意義下),為此,必須計算平均銷售量。 上面第二式表示,當(dāng)需求量大于等于供應(yīng)量時,取需求量等于供應(yīng)量。因此,利潤函數(shù)為 利用得到 (9.1)上式中,第一項表示已售房毛利潤,第二項為廣告成本,第三項為未售出房的損失。模型求解 為了獲得最大利潤,只需對(9.1)式求導(dǎo)并令其為零,設(shè)獲得最大值時的最優(yōu)值為,則 因此,滿足關(guān)系式 (9.2)通過(9.2)式,在廣告投入一定的情況下,可以求出最優(yōu)的供應(yīng)量,但依賴于需求量的概率分布。為使問題更加明確,增加如下假設(shè):(3) 假設(shè)需求量服從分布,即 (9.3)將(9.3)代人(9.2)得到 (9.4)即最優(yōu)的供應(yīng)量等于毛利率與由廣

4、告費確定的潛在購買力的乘積。將(9.4)式代入(9.1)式,得到最大利潤為 (9.5)對(9.5)式關(guān)于求導(dǎo),得駐點滿足的方程為 (9.6)因此,只要知道了潛在購買力函數(shù),就可以給出最優(yōu)的廣告投入。 下面根據(jù)開發(fā)商獲得的相關(guān)數(shù)據(jù),來確定潛在購買力函數(shù)。通過對表9.1數(shù)據(jù)分析,得知其符合型曲線增長率,經(jīng)擬合得到 (9.7)記將(9.7)式代入(9.6)式,當(dāng)時,求得 (9.8)將代入(9.8)式得到(百萬元)。 9.2定崗定編問題 社會系統(tǒng)中,常常因為職務(wù)、地位等的不同,劃分出許多的等級,各等級的人數(shù)比例稱之為等級結(jié)構(gòu),定崗定編問題即是保持一個穩(wěn)定合理的等級機(jī)構(gòu),這類問題在許多單位都可以看到它的

5、縮影。那么等級結(jié)構(gòu)是怎樣隨時間變化的呢?等級結(jié)構(gòu)的變化依賴系統(tǒng)內(nèi)部的等級隨時間的轉(zhuǎn)移(即通常所說的職務(wù)升降,以及系統(tǒng)內(nèi)外部的交流(即通常所說的調(diào)入、調(diào)出、退休、死亡等)。通過數(shù)學(xué)語言將等級結(jié)構(gòu)隨時間變化關(guān)系恰當(dāng)?shù)乇硎境鰜恚蜆?gòu)成這個問題的數(shù)學(xué)模型。假設(shè)(1)將一個系統(tǒng)由低向高分成個等級,每隔年進(jìn)行一次正常的等級調(diào)整。(2 )表示第次調(diào)整時第個等級的人數(shù),記,不妨稱之為等級結(jié)構(gòu)。為系統(tǒng)第年的總?cè)藬?shù)。(3) 記,稱為等級結(jié)構(gòu)向量。(4) 記表示每次從等級升到等級的人數(shù)占等級中人數(shù)的比例;,表示每次從等級中退出人數(shù)的比例;,表示每次調(diào)入等級的人數(shù)占總調(diào)入人數(shù)的比例。記, 。一般地,分別稱為內(nèi)部轉(zhuǎn)移矩

6、陣、退出向量、調(diào)入向量。為簡便起見,不妨假設(shè)其與時間無關(guān)。模型建立 根據(jù)假設(shè),可以得到,且 (9.9)第次的系統(tǒng)總?cè)藬?shù)滿足方程 (9.10)每個等級人數(shù)的轉(zhuǎn)移方程為 (9.11)從到年總?cè)藬?shù)的增長量記為,則 (9.12)將(9.12)代入(9.11)得到 (9.13)記,則也是隨機(jī)矩陣,(9.13)可以表示為 (9.14)通常稱(9.14)為等級分布基本方程。假如系統(tǒng)的總?cè)藬?shù)每年以固定的比例增長,即,則 (9.15)特別地,如果每年進(jìn)出系統(tǒng)的人數(shù)大致相等,即系統(tǒng)總?cè)藬?shù)保持不變。那么,方程(9.15)可以簡化為 (9.16)具有形如(9.16)的方程稱為馬氏鏈。對于由(9.14)給出的等級分布基

7、本方程,下面考慮如下問題:給定初始等級結(jié)構(gòu),如何確定調(diào)入比例,使等級變化盡快達(dá)到或接近給定的理想等級結(jié)構(gòu)。需要指出的是,如果等級結(jié)構(gòu)滿足,則稱等級結(jié)構(gòu)為穩(wěn)定的。系統(tǒng)是否有穩(wěn)定的等級結(jié)構(gòu)是有條件的,如果存在,則必須滿足(9.9),且 (9.17)保證(9.17)成立的充分必要條件是存在非負(fù)向量(每個分量非負(fù)),使 (9.18)如果矩陣可逆,由(9.17)得到 (9.19)令 ,由于的各分量之和為1,即。利用(9.19)式得 (9.20)再將(9.20)式代入(9.19)式得到 (9.21)關(guān)于兩個等級接近程度的分析 在處理實際問題時,通常會比較兩個等級的接近程度,以便確定當(dāng)前等級的狀態(tài)。為此,我

8、們引入等級距離的概念。定義兩個等級之間的距離如下: (9.22)其中為加權(quán)因子,由對各等級的關(guān)注程度確定。一個滿意的等級分布應(yīng)該滿足如下優(yōu)化問題: (9.23)由于如果記 (9.24)則與呈正比,(9.23)等價于 (9.25)對于上面的優(yōu)化問題,在某種程度上,它只是條件極值問題,可以用拉格朗日乘子法求解。9.3零件的預(yù)防性更換 在生產(chǎn)設(shè)備或科學(xué)儀器中長期運行的零件都會發(fā)生故障或損壞,等到損壞時才更換零件可能會帶來一定的經(jīng)濟(jì)損失,比如產(chǎn)生廢品等。如果在零件運行一定時間后,就對尚屬正常的零件做預(yù)防性更換,就可以避免一些廢品、次品的損失。如果策略得當(dāng),或許可以將損失降到最低程度。解決這個問題的關(guān)鍵

9、在于恰當(dāng)?shù)毓烙嬃慵軌蛘_\行的時間,簡稱零件壽命。由于零件在制造及運行過程中受到多種因素的影響,零件的壽命是一隨機(jī)變量,可以通過試驗分析及理論分析來確定零件的壽命分布及其他數(shù)字特征。一般來說,不同的零件壽命分布不一樣,預(yù)防性更換的策略也不一樣。假設(shè):(1) 零件壽命服從某種已知的分布,其分布函數(shù)為,概率密度為,數(shù)學(xué)期望為。(2) 確定一個正常的時間間隔,當(dāng)時,對零件進(jìn)行故障更換,更換費用為,當(dāng)時,對仍然正常工作的零件進(jìn)行預(yù)防性更換,更換費用為。(3) 記,分別稱為零件的可靠度及失效率。建模與求解這是一個優(yōu)化問題,目標(biāo)函數(shù)為單位時間的損失費用最小。如果稱零件每更換一次為一個周期,則周期的平均長

10、度為 (9.26)一個周期內(nèi)的平均損失為 (9.27)單位時間的平均損失為 (9.28)通過求導(dǎo)運算可以得到使(9.28)式取得極小值的應(yīng)滿足 (9.29)方程(9.29)是否有解取決于式中的相關(guān)參數(shù)及零件的分布類型。如果記 (9.30)則有 考察(9.29)式及(9.30)式得知,如果為關(guān)于的單調(diào)遞增函數(shù),且 (9.31)則存在唯一的有限的正值使方程(9.29)成立,且(9.28)式的最小值為。 不同壽命分布的零件的最優(yōu)的更換策略存在較大差異。下面就幾個常用的壽命分布,分析最優(yōu)的零件更換策略。指數(shù)分布 設(shè)零件的壽命服從指數(shù)分布,即 經(jīng)計算得到 方程(9.29)不成立,即不存在預(yù)防性更換策略。

11、分布 設(shè)零件的壽命服從分布,即 經(jīng)計算得到 易見是的單調(diào)遞增函數(shù),且。考慮(9.31)式得知,當(dāng)時,存在唯一的有限的正值使方程(9.29)成立,即存在最優(yōu)的預(yù)防性更換策略。威布爾分布()分布設(shè)零件的壽命服從威布爾分布,即 經(jīng)計算得到 易見,當(dāng)時,是的單調(diào)遞增函數(shù),且。存在唯一的有限的正值使方程(9.29)成立,即存在最優(yōu)的預(yù)防性更換策略。9.4 零件的參數(shù)設(shè)計一件產(chǎn)品通常是由多個零部件組裝而成,標(biāo)志產(chǎn)品性能的某個參數(shù)取決于這些零件的參數(shù)。零件參數(shù)包括標(biāo)定值和容差兩部分。進(jìn)行批量生產(chǎn)時,標(biāo)定值表示一批零件該參數(shù)的平均值,容差則給出了參數(shù)偏離其標(biāo)定值的容許范圍。若將零件參數(shù)視為隨機(jī)變量,則標(biāo)定值代

12、表數(shù)學(xué)期望,在生產(chǎn)部門無特殊要求時,容差通常規(guī)定為均方差的3倍。 進(jìn)行零件參數(shù)設(shè)計,就是確定其標(biāo)定值和容差。需要考慮兩方面的因素:一是當(dāng)各零件組裝成產(chǎn)品時,如果產(chǎn)品參數(shù)偏離預(yù)先設(shè)定的目標(biāo)值,就會造成質(zhì)量損失,偏離越大,損失越大;二是零件容差的大小決定了零件的制造成本,容差設(shè)計得越小,成本越大。下面通過一個具體實例來介紹零件參數(shù)的設(shè)計方法。粒子分離器某參數(shù)(記為)有7個零件的參數(shù)(記作)決定,經(jīng)驗公式為 (9.32)的目標(biāo)值(記作)為1.5。當(dāng)偏離時,產(chǎn)品為次品,質(zhì)量損失為1000元;當(dāng)偏離時,產(chǎn)品為廢品,質(zhì)量損失為9000元。 零件參數(shù)的標(biāo)定值有一定的容許變化范圍;容差分為三個等級,用與標(biāo)定值

13、的相對值表示,等為,等為,等為。7個零件參數(shù)標(biāo)定值的容許范圍及不同容差等級零件的成本(元)如表9.2。 表9.2標(biāo)定值容許范圍等等等0.075,0.1250.225,0.375 0.075,0.1250.075,0.1250.125,1.87512,200.5625,0.9375/2020505010/255050100/2525/200500/100100 現(xiàn)在要進(jìn)行批量生產(chǎn),每批生產(chǎn)1000個。在原設(shè)計中7個零件參數(shù)的容差均取最便宜的等級,標(biāo)定值分別為 分析原方案的合理性,并給出最優(yōu)的設(shè)計方案。這是隨機(jī)優(yōu)化問題,目標(biāo)函數(shù)為單個零件的費用。假設(shè):(1)7個零件的參數(shù)均服從正態(tài)分布且相互獨立,

14、也即 (9.33)其中,是第零件參數(shù)的標(biāo)定值,記。(2)參數(shù)的容差記為,其關(guān)于標(biāo)定值的相對值記為,即 (9.34)(3)記第種零件的成本為,則每件產(chǎn)品的總成本為 。產(chǎn)品參數(shù)分布描述產(chǎn)品的質(zhì)量損失費用與產(chǎn)品的次品率、廢品率有關(guān),因此必須先確定產(chǎn)品參數(shù)的分布,盡管已經(jīng)有關(guān)于的經(jīng)驗公式,但如果利用這樣的公式確定其分布函數(shù)將是非常麻煩的,甚至是不可行的,有必要對其作適當(dāng)簡化,求其近似分布。如果可行的話,線性近似是最容易處理的。下面我們來對其作線性近似,并分析其合理性。若 則 (9.35)由(9.33)式得 的方差可以近似地表示為 (9.36)因此,可以近似地認(rèn)為 (9.37)可以通過隨機(jī)模擬進(jìn)一步驗證

15、(9.37)式的合理性。先在的標(biāo)定值允許范圍內(nèi)任取一組值,由計算機(jī)產(chǎn)生若干組相互獨立的正態(tài)分布隨機(jī)數(shù),畫出直方圖(見圖9.1),用分布擬合的檢驗法檢驗服從正態(tài)分布的合理性。 圖9.1線性近似合理性數(shù)值檢驗?zāi)繕?biāo)函數(shù)描述產(chǎn)品總費用=零件總成本+總的質(zhì)量損失費用,但在隨機(jī)問題中,應(yīng)該考慮的是平均意義下的費用,即期望總費用。質(zhì)量損失函數(shù)為 其中,。根據(jù)(9.37)式,可以得到的概率密度函數(shù)為 據(jù)此有正品的概率為 (9.38)次品的概率為 (9.39)廢品的概率為 (9.40) 大批生產(chǎn)的平均每件產(chǎn)品的質(zhì)量損失費用為 因此每個產(chǎn)品的總費用為 (9.41)模型建立與求解引入記號表示第零件參數(shù)取第個容差的成

16、本,=1表示第零件參數(shù)取第個容差,否則=0??紤](9.39)式及(9.40)式,引用標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù),得到 將之代入(9.41)式,則得到目標(biāo)函數(shù)為 該零件參數(shù)優(yōu)化設(shè)計問題可以歸結(jié)為如下的優(yōu)化問題 其中,分別為零件參數(shù)標(biāo)定值的下界與上界??梢越柚鶯ingo軟件給出該優(yōu)化問題的最優(yōu)結(jié)果。具體結(jié)果為 9.5航空公司超額預(yù)售的最優(yōu)策略我們經(jīng)常在一些媒體上看到旅客的抱怨,他們本已經(jīng)訂好了某天某次班機(jī)的機(jī)票,但到達(dá)機(jī)場后接受檢查時卻被告知:“先生,對不起,你的航班已經(jīng)滿員,我們將不得不讓你改乘其他航班了”。造成這種現(xiàn)象的原因是航空公司為了追求利潤最大化,通常會超額預(yù)售機(jī)票。發(fā)生這種事情自然會引起乘

17、客的不滿,因此在計算機(jī)輔助訂票的今天,應(yīng)該優(yōu)化訂票方案,既考慮航空公司的利潤,又盡可能減少乘客的抱怨。由于我們并不清楚航空公司的任何強(qiáng)制服務(wù)且缺失航空公司相關(guān)數(shù)據(jù),因此不能對某次飛機(jī)給出定性結(jié)論,下面只是一般性的結(jié)論。假設(shè):(1) 航班的飛行成本與乘客數(shù)無關(guān),航空公司的利潤只與收入與成本有關(guān),飛機(jī)最大容量記為。(2) 盡管不同機(jī)艙的票價不同,為了簡化模型,只考慮乘客的平均票價,每個乘客所付費用記為,預(yù)訂票乘客登機(jī)概率為。(3) 對于一次飛行,取消登機(jī)的人數(shù)記為,該事件發(fā)生的概率記為。(4) 某次航班訂票總數(shù)記為,因航班滿員被拒登機(jī)的補償費用記為。(5)某次航班出售的折價機(jī)票數(shù)記為,折價率記為。

18、(6) 客源豐富,不考慮訂票不滿的情況。必要時,可以改變某些假設(shè)。 模型建立模型一 不考慮任何形式補償) 個訂票者中有個取消登機(jī)時利潤 (9.42)每個航班的實際平均利潤 (9.43) 要使最大,應(yīng)該盡可能小,因此需要越大越好。這個模型的缺點是沒有考慮拒簽補償。更合理的模型需要將拒簽因素計入模型。對于不同的拒簽補償方式,我們可以建立不同的模型。模型二 現(xiàn)金補償模型 假設(shè)每位被拒簽的補償是, 個訂票者中有個取消登機(jī)時利潤 (9.44)每個航班的實際平均利潤 記 表示不登機(jī)乘客的期望值,則有 (9.45)下面考慮幾種特殊情況,驗證模型的有效性情形一: 結(jié)果表明,當(dāng)時,公司利潤最大,這與實際是相符的

19、。情形二:預(yù)訂票者實際登機(jī)的概率服從二項分布,因此個預(yù)定票者有個取消登機(jī)的概率為 (9.46) 假設(shè),記 (9.47)我們的目標(biāo)是尋找最優(yōu)的,使取最大值??梢酝ㄟ^數(shù)值模擬尋優(yōu)。(1) 分別為0.02,0.04,0.06,0.08,0.1,橫坐標(biāo)為,縱坐標(biāo)為,結(jié)果見圖9.2。 圖9.2 從圖9.2可以看出,對需要超額預(yù)定的票數(shù)有較大影響,這一點與實際也是相符的,因為越大,平均來說實際取消登機(jī)的人數(shù)越多。為了保證航班滿座,就必須多預(yù)售一些票。(2)分別為0.1,0.2,0.3,0.4,0.5,橫坐標(biāo)為。,縱坐標(biāo)為,結(jié)果見圖9.3。 圖9.3從圖9.3中可以看出,在實際登機(jī)率為96%的情況下,對于賠

20、付比率為0.10.5,一架200座的航班,超額預(yù)售的票數(shù)約為11張時,利潤最大。該圖也說明了,如果航空公司能準(zhǔn)確地知道預(yù)定票者的登機(jī)概率,只要適當(dāng)?shù)乜刂祁A(yù)售票數(shù),從平均意義上來說,即使航空公司制定較高的拒簽賠付率,也不會對其最大利潤產(chǎn)生多大影響。 模型三 混合補償模型模型二僅考慮了現(xiàn)金補償。在實際操作時,混合補償也是常見的補償方式,航空公司可以讓拒簽者自己選擇現(xiàn)金補償,或優(yōu)惠購買折價機(jī)票 。 假定個旅客以票價訂了折價機(jī)票,不考慮這部分人取消登機(jī)情況。對于一個航班,有個預(yù)訂票者取消登機(jī)的利潤為 (9.48) (9.49)據(jù)此得到 (9.50)類似于前面的分析,也可以得到最優(yōu)的預(yù)訂票方案。9.6

21、最佳進(jìn)貨策略一個小型的水族館專營各種規(guī)格的水族箱,每個周末,店老板都要清點存貨,確定下一周是否進(jìn)貨。老板的進(jìn)貨策略是:如果本周某種規(guī)格的水族箱存貨全部售出的話,下周初就再進(jìn)貨3個,否則便不再進(jìn)貨。這樣的策略可能會造成部分時間顧客買不到貨,造成一定的潛在利潤損失。表9.3給出了該店過去兩年的需求情況,根據(jù)這組統(tǒng)計數(shù)據(jù),確定該店的缺貨情況。 表9.3 水族館100周需求記錄周次 1 2 3 4 5 6 7 8 9 10需求量 1 2 1 1 1 1 1 0 3 3 周次 11 12 13 14 15 16 17 18 19 20需求量 1 0 2 0 1 3 3 4 1 2周次 21 22 23

22、24 25 26 27 28 29 30需求量 2 0 0 2 1 1 1 0 2 2周次 31 32 33 34 35 36 37 38 39 40需求量 1 4 1 0 1 1 0 1 1 1 周次 41 42 43 44 45 46 47 48 49 50需求量 1 0 2 1 1 2 1 1 0 0周次 51 52 53 54 55 56 57 58 59 60需求量 1 0 1 1 1 2 1 0 1 0周次 61 62 63 64 65 66 67 68 69 70需求量 2 0 1 2 0 0 2 1 2 1周次 71 72 73 74 75 76 77 78 79 80需求量

23、0 1 0 0 3 1 2 1 0 2周次 81 82 83 84 85 86 87 88 89 90需求量 3 0 0 2 1 0 0 2 0 1周次 91 92 93 94 95 96 97 98 99 100需求量 1 1 0 0 0 1 0 1 0 2 圖9.4 100周需求統(tǒng)計假設(shè)(1) 第周水族館的需求服從參數(shù)為1的泊松分布。(2) 第周水族館的存貨用隨機(jī)變量表示,且。根據(jù)假設(shè)得到 于是 , , 如果記 則有 下面進(jìn)一步計算缺貨概率。一般來說這個概率依賴于,為了得到關(guān)于缺貨的更一般的信息,我們需要對的信息再作一些分析。是一個遍歷的馬爾可夫鏈,其一定存在唯一的漸進(jìn)穩(wěn)定的單位長度概率向

24、量,它可以通過求解穩(wěn)定狀態(tài)方程計算出來。令得到 因此,對于充分大的,近似地有 =上式表明,每年約有10.49%的時間(約5周時間)水族館是缺貨的。9.7 分類問題人以類聚,物以群分。人們認(rèn)為某一批樣品屬于同一類,是因為它們之間有相同或相似之處,從指標(biāo)上來說就是大小比較接近。由于指標(biāo)往往不只一個,接近程度的衡量標(biāo)準(zhǔn)不一樣,結(jié)果會有差異。本節(jié)借助一個實際問題介紹兩類常用的分類方法。若已知兩類蠓共32個標(biāo)本,已由生物專家根據(jù)觸角長度及重量的數(shù)據(jù)分成類和類,具體數(shù)據(jù)見表9.4,根據(jù)這32個樣本的特征對未知的8個樣本進(jìn)行分類。 表9.4() 類蠓的觸角與重量數(shù)據(jù)序號 1 2 3 4 5 6 7 8 8.

25、70 5.00 10.38 10.86 6.560 13.57 13.57 9.89 32.94 16.64 37.14 46.24 23.08 38.58 42.54 14.02序號 9 10 11 12 13 14 15 16 10.98 10.52 9.44 12.18 8.24 16.55 9.59 10.34 15.59 35.71 26.00 36.90 38.16 37.12 42.90 36.69 表 9.4() 類蠓的觸角與重量數(shù)據(jù)序號 17 18 19 20 21 22 23 24 27.14 12.78 19.88 19.05 10.37 21.54 13.66 28.4

26、9 23.04 30.15 23.54 16.13 22.28 13.94 19.88 19.71序號 25 26 27 28 29 30 31 32 15.16 23.17 21.31 14.46 6.97 19.64 13.93 23.68 20.00 18.09 26.57 8.75 22.56 25.37 24.38 23.46 未知的8個樣本為 表9.4() 未知類別蠓的觸角與重量數(shù)據(jù)序號 33 34 35 36 37 38 39 40 10.12 12.03 11.70 9.23 20.71 21.88 28.66 17.89 26.22 27.04 15.24 27.66 23.

27、73 24.79 25.64 14.04已知的32個樣本及未知的8個樣本分布見圖9.5 圖9.5 40個樣本分布下面用三種方法來建立模型解決此問題。模型一 距離判別模型距離判別法是讓指標(biāo)大小比較接近的屬于一類,新樣本離誰近就判給誰。當(dāng)已經(jīng)給定了一些樣本的分類,一般有許多樣本屬于同一類,以誰作為這類的代表呢?以哪一個樣本作代表都不太合適,一個比較恰當(dāng)?shù)姆绞绞且詷颖镜膸缀沃行臑榇怼Mǔ5姆椒ㄊ峭ㄟ^計算樣本的均值向量及方差。根據(jù)樣本與均值的接近程度,判斷其類型。對于給定的蠓樣本,與哪組均值向量越接近,就認(rèn)為該樣本屬于此類。考慮32個樣本得到類的均值向量,均方差向量為,類的均值向量,均方差向量為。常

28、用的距離判別有歐氏距離與馬氏距離判別法。歐氏距離定義為 (9.51)馬氏距離定義為 (9.52)其中,表示兩類樣本的協(xié)方差陣。經(jīng)計算得 , 歐氏距離判別法可以看作為馬氏距離判別法的一個特例,即協(xié)方差陣為單位陣。利用(9.51)式及(9.52)式進(jìn)行回代,計算類蠓的歐氏距離及馬氏距離見表9.5。 表9.5類蠓回代距離統(tǒng)計序號 1 2 3 4 5 6 7 8 3.1 281.3 21.3 188.4 103.9 46.8 110.4 342.5 230.1 194.6 318.0 685.0 139.6 326.4 480.3 119.6 0.035 0.288 0.018 0.139 0.135

29、 0.088 0.104 0.257 0.006 0.711 0.053 0.473 0.261 0.116 0.279 0.860序號 9 10 11 12 13 14 15 16 286.9 10.19 43.43 22.35 36.48 58.98 108.40 7.39 82.9 272.0 100.7 285.4 389.8 258.8 548.7 304.4 0.267 0.007 0.027 0.029 0.113 0.359 0.120 0.015 0.715 0.026 0.110 0.056 0.084 0.131 0.268 0.043經(jīng)檢驗發(fā)現(xiàn):在歐氏距離意義下序號為2

30、,8,9的樣本出現(xiàn)誤判;在馬氏距離意義下序號為1,13,14的樣本出現(xiàn)誤判。利用(9.51)式及(9.52)式進(jìn)行回代,計算類蠓的歐氏距離及馬氏距離見表9.6。表9.6類蠓回代距離統(tǒng)計序號 17 18 19 20 21 22 23 24 370.1 11.3 170.5 343.5 104.9 469.3 170.4 491.3 83.4 111.0 8.6 25.6 62.8 62.6 22.2 107.7 0.845 0.536 0.024 0.040 0.714 0.234 0.217 1.224 0.161 0.243 0.021 0.062 0.114 0.142 0.044 0.1

31、95序號 25 26 27 28 29 30 31 32 179.4 371.3 154.4 581.5 111.0 136.5 78.7 258.4 10.6 33.8 39.3 167.1 128.4 20.1 28.9 35.4 0.095 0.325 0.084 0.150 1.460 0.020 0.253 0.302 0.021 0.064 0.097 0.423 0.233 0.051 0.056 0.073經(jīng)檢驗發(fā)現(xiàn):在歐氏距離意義下序號為18,29的樣本出現(xiàn)誤判;在馬氏距離意義下序號為20,27,28,30,樣本出現(xiàn)誤判。綜上分析發(fā)現(xiàn):對于32個已知樣本,用歐氏距離判別誤判率

32、為15.6%,用馬氏距離判別誤判率為21.9%。易見,距離判別法的誤判概率還是比較高的。將8個未知樣本數(shù)據(jù)分別代入(9.51)式及(9.52)式,得到相應(yīng)的歐氏距離及馬氏距離見下表9.7。 表9.7未知樣本歐氏距離與馬氏距離統(tǒng)計序號 33 34 35 36 37 38 39 40 6.3 5.7 17.3 5.0 13.5 13.8 19.5 19.9 9.6 8.6 8.8 11.1 3.6 5.2 11.4 7.1 0.028 0.080 0.328 0.019 1.510 1.780 4.124 1.302 0.100 0.077 0.743 0.063 0.361 0.365 0.69

33、4 0.915經(jīng)比較發(fā)現(xiàn):在歐氏距離意義下序號為 33, 34 ,36的樣本為類,序號為35,37,38,39,40的樣本為類;在馬氏距離意義下到序號為33,35,36,的樣本為類,序號為34,37,38,39,40的樣本為類。對于馬氏距離判別法,進(jìn)一步分析可知,如果兩類樣本的協(xié)方差陣相同,則 表示平面上的一條直線,它將平面分成兩個區(qū)域,分別表示兩類樣本區(qū),位于該直線上的點到兩個樣本中心距離相等,理論上該直線上的樣本點屬于無法判別的情況。如果兩類樣本的協(xié)方差陣不同,則 表示平面上的一條曲線,它將平面分成兩個區(qū)域,分別表示兩類樣本區(qū),位于該曲線上的點到兩個樣本中心距離相等,理論上該曲線上的樣本點

34、屬于無法判別的情況。我們在前面的回代中已經(jīng)發(fā)現(xiàn),馬氏距離判別法會出現(xiàn)誤判,那么怎樣估計誤判率呢?為此,不妨簡化假設(shè)蒙的觸角長度與重量服從正態(tài)分布,即 記 則類被誤判為類的概率為隨機(jī)變量落入?yún)^(qū)域內(nèi)的概率,類似地可以計算將類誤判為類的概率。模型二Fisher法多變量的判別分析有多個指標(biāo),它們對于判別樣本屬于哪一類一般都有影響,但影響程度一般不完全相同,總會有些指標(biāo)影響大,有些指標(biāo)影響程度小,因此按主要差異來進(jìn)行判別將會有比較好的效果。通常指標(biāo)間有一定的關(guān)聯(lián)性,因此主要差異不一定是某個指標(biāo),而是某些指標(biāo)的某種線性組合,在這個方向上,樣本點最容易區(qū)分。Fisher判別法就是這一思想的某種體現(xiàn)。借助多元統(tǒng)計中方差的思想,一般可以分類的樣本,應(yīng)該是類與類之間方差很大,而各類之間卻靠得狠近,方差較小。可否用一個指標(biāo)來表征這些特征呢?因為方差總是非負(fù)的,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論