運(yùn)籌學(xué)-決策分析_第1頁
運(yùn)籌學(xué)-決策分析_第2頁
運(yùn)籌學(xué)-決策分析_第3頁
運(yùn)籌學(xué)-決策分析_第4頁
運(yùn)籌學(xué)-決策分析_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第六章決策分析

----DecisionAnalysis決策——就是人們在從事各種活動過程中所采取的決定或者選擇。決策分析——就是分析在各種條件下不同的決策行動的合理性以及在多種可能方案中選擇最佳方案的過程。決策問題通常分為——確定性決策、風(fēng)險(xiǎn)性決策和不確定性決策。確定性決策——就是在決策環(huán)境完全確定的情況下進(jìn)行的決策,因而所作的決策應(yīng)是合理的。風(fēng)險(xiǎn)決策和不確定性決策是在決策環(huán)境不完全確定的情況下進(jìn)行的決策,其中:風(fēng)險(xiǎn)決策對于其面臨的自然狀態(tài)發(fā)生的概率,決策者可以預(yù)先計(jì)算或估計(jì)出來;不確定性決策對于其所面臨的自然狀態(tài)發(fā)生的概率,決策者完全不知,只能靠決策者的主觀傾向進(jìn)行決策。第一節(jié)決策分析問題及其一般性描述一、決策分析問題舉例例1

某食品店牛奶的月需求量為25至28箱,每箱牛奶的進(jìn)價(jià)為16元,售價(jià)為22元。若牛奶當(dāng)月為售完,則因過期而每箱損失16元。試制定食品店每月牛奶的訂購箱數(shù)。該問題的基本分析可用如下兩個(gè)表格來描述。(1)收益(利潤)此處的收益表示利潤。食品店在各種決策(訂貨25~28箱)下的收益如下表。

表1不同決策下的收益表單位:元需求訂貨25箱26箱27箱28箱25箱15015015015026箱13415615615627箱11814016216228箱102124146168

(2)損失食品店的損失分兩種情況。第一種情況是訂貨大于需求時(shí),牛奶因過期而損失,損失價(jià)值為損失的箱數(shù)乘以每箱進(jìn)價(jià);第二種情況是當(dāng)需求大于訂貨量時(shí),因失去獲取利潤機(jī)會的機(jī)會損失,其損失值為需求超過訂貨的箱數(shù)乘以每箱利潤。食品店在各種決策下的損失如下表。表2不同決策下的損失表單位:元

需求訂貨25箱26箱27箱28箱25箱06121826箱16061227箱32160628箱4832160例2某公司需要對某種新產(chǎn)品的批量作出決策。市場對該種產(chǎn)品的需求有三種可能,即需求量大、需求一般和需求量小?,F(xiàn)有三種決策方案,即大批量生產(chǎn)、中批量生產(chǎn)和小批量生產(chǎn)。經(jīng)估算,各行動方案在各種需求的情況下的收益值情況如下表,問哪種行動方案為最好?

表3收益表單位:萬元自然狀態(tài)損益值行動方案需求量大S1需求量一般S2需求量小S3大批量生產(chǎn)A13614-8中批量生產(chǎn)A220160小批量生產(chǎn)A314103二、決策問題的一般性描述(一)決策問題的基本要素從以上兩個(gè)例子可以總結(jié)出,決策問題一般包括三個(gè)基本要素:行動方案、自然狀態(tài)和損益函數(shù)(Alternative,StateofNature,Payoff)。首先,任何決策問題都必須具有兩個(gè)或兩個(gè)以上的行動方案。通常用Ai(i=1,…,m)表示某一具體的可行方案,用A={A1,A2,…,Am}表示方案集。其次,任何決策問題,無論采取何種方案,都面臨著一種或幾種自然狀態(tài)。自然狀態(tài)簡稱狀態(tài),也稱事件。決策問題中的自然狀態(tài)是不可控制因素,因而是隨機(jī)事件。通常用Si(j=1,…,n)表示某一具體的狀態(tài),用S={S1,S2,…,Sn}表示狀態(tài)集。第三,在某一具體的狀態(tài)下,作出某一具體的行動方案(決策),必然會生產(chǎn)相應(yīng)的效果,這種效果通常用損益函數(shù)來描述。設(shè)在狀態(tài)Sj下,作出決策為Ai,則其產(chǎn)生的效果可用函數(shù)rij=R(Ai,Sj)來表示。(二)決策問題的基本條件(1)決策者有一個(gè)明確的預(yù)期達(dá)到的目標(biāo),如收益最大或損失最??;(2)存在著兩個(gè)或兩個(gè)以上的可供選擇的行動方案;(3)各行動方案所面臨的可能的自然狀態(tài)完全可知;(4)各行動方案在不同的狀態(tài)下的損益值可以計(jì)算或能夠定量地估計(jì)出來。決策問題可以用損益矩陣或損益值表來描述,即決策問題的模型。(1)損益矩陣(PayoffMatrix):R=(rij)m×ni=1,2,…,m;j=1,2,…,n(2)損益值表(payofftable)上述是決策問題的一般性描述,決策者要作出滿意的決策必須分析問題的類型并確定正確的決策方法,這些是下面所要講述的內(nèi)容。自然狀態(tài)損益值行動方案

S1S2…SnA1r11r12…r1nA2r21r22…r2n┆┆┆

┆Amrm1rm2…rmn第二節(jié)不確定性決策

(DecisionMakingwithoutprobability)不確定性決策是在決策者已知決策可能面臨的自然狀態(tài),但各狀態(tài)出現(xiàn)的概率完全不知情況下的決策。由于缺乏自然狀態(tài)的進(jìn)一步信息,決策者只能根據(jù)自己的主觀判斷,采用某一準(zhǔn)則進(jìn)行決策。決策者可以根據(jù)具體情況,選用最為合適的準(zhǔn)則進(jìn)行決策。除特別說明外,以下所說損益值均為收益。若損益值為損失,則各決策準(zhǔn)則需要作相應(yīng)地調(diào)整。一、悲觀準(zhǔn)則(保守法,conservativeapproach)決策者總是從最不利的角度去考慮問題。認(rèn)為,不論作出什么決策,總會出現(xiàn)最不利的狀態(tài)與之對應(yīng)。這樣,決策者只能對各決策方案的最小損益值進(jìn)行比較,從中選擇最大者對應(yīng)的方案為滿意方案。因此,該準(zhǔn)則也稱最大最小準(zhǔn)則。這是一種萬無一失的保守型決策者的選擇準(zhǔn)則。其數(shù)學(xué)描述如下:則r*所對應(yīng)的方案為所選方案。

悲觀準(zhǔn)則舉例在各行中找出損益值最小的值,列于表中第五列,然后在該列中找出最大值,對應(yīng)方案為所選方案。故應(yīng)選方案A3自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3悲觀法大批量生產(chǎn)A13614-8-8中批量生產(chǎn)A2201600小批量生產(chǎn)A3141033二、樂觀準(zhǔn)則(optimisticapproach)與悲觀準(zhǔn)則相反,在該準(zhǔn)則下,決策者總是從最有利的角度去考慮問題,即認(rèn)為,無論采取何種決策,總會出現(xiàn)最有利的自然狀態(tài)與之對應(yīng)。這樣,決策者可以對各決策方案的最大損益值進(jìn)行比較,從種選擇最大值,相應(yīng)的方案為最優(yōu)方案。其數(shù)學(xué)描述如下:則r*所對應(yīng)的方案為所選方案。這種決策方法是一種偏于冒險(xiǎn)的決策方法,在客觀條件一無所知的情況下,一般不宜采用這種方法進(jìn)行決策。樂觀準(zhǔn)則舉例在各行中找出損益值最小的值,列于表中第五列,然后在該列中找出最大值,對應(yīng)方案為所選方案。故應(yīng)選方案A1自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3樂觀法大批量生產(chǎn)A13614-836中批量生產(chǎn)A22016020小批量生產(chǎn)A31410314三、樂觀系數(shù)準(zhǔn)則(Hurwiczdecisioncriterion)這是一種折中的準(zhǔn)則,即決策者對客觀條件的估計(jì)既不樂觀也不悲觀,主張一種平衡。通常用一個(gè)表示樂觀程度的系數(shù)來進(jìn)行這種平衡。其數(shù)學(xué)描述如下:則r*所對應(yīng)的方案為所選方案。其中,α為樂觀系數(shù)(0≤α≤1),當(dāng)α=1時(shí),就是樂觀準(zhǔn)則,當(dāng)α=0時(shí),就是悲觀準(zhǔn)則。di為第i方案的折中損益值。樂觀系數(shù)準(zhǔn)則舉例選樂觀系數(shù)為α=0.6,則有:

=18.4d2=0.6×20+0.4×0=12d3=0.6×14+0.4×3=9.6故選方案A1。自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3悲觀法樂觀法大批量生產(chǎn)A13614-8-836中批量生產(chǎn)A220160020小批量生產(chǎn)A314103314四、后悔值準(zhǔn)則(minimumregretapproach)該準(zhǔn)則認(rèn)為,決策者制定決策之后,如果實(shí)際情況沒有達(dá)到理想的結(jié)果,決策者必后悔。該準(zhǔn)則將各自然狀態(tài)下的最大損益值確定為理想目標(biāo),將該狀態(tài)下的各方案的損益值與理想值的差值稱為相應(yīng)方案的后悔值(或稱為機(jī)會損失值),然后在各方案的最大后悔值中選擇一個(gè)最小的,相應(yīng)的方案為最優(yōu)方案。因此,該原則也稱為最小后悔值準(zhǔn)則。其數(shù)學(xué)描述如下:則h*所對應(yīng)的方案為所選方案。式中,hij為在狀態(tài)Sj下采取方案Ai的后悔值;h*為最小最大后悔值。后悔值法舉例首先按公式(i=1,…,m;j=1,…,n)計(jì)算后悔值,結(jié)果如下表:表6后悔值決策表

根據(jù)表中數(shù)據(jù)有:=11,因此,按此方法應(yīng)選方案A1。自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3大批量生產(chǎn)A1021111中批量生產(chǎn)A2160316小批量生產(chǎn)A3226022五、等可能準(zhǔn)則(Laplacedecisioncriterion)等可能準(zhǔn)則的思想是:認(rèn)為各自然狀態(tài)發(fā)生的可能性均相同,即若有n各自然狀態(tài),則每個(gè)自然狀態(tài)出現(xiàn)的概率均為1/n。這樣,就可以求各方案損益值的期望值,取期望值最大所對應(yīng)的方案為最優(yōu)方案。其數(shù)學(xué)描述如下:則r*所對應(yīng)的方案為所選方案。若有幾個(gè)方案的期望損益值均為最大,則需要另用悲觀準(zhǔn)則在這幾個(gè)方案中選擇。式中,ER(Ai)為方案Ai的期望損益值。等可能準(zhǔn)則舉例因?yàn)樽匀粻顟B(tài)只有三個(gè),按各自然狀態(tài)出現(xiàn)的概率均為1/3來計(jì)算各方案的期望損益值,有故應(yīng)選方案A1。不確定性決策總結(jié)綜上所述,對于非確定性決策問題,采用不同的決策方法所得結(jié)果可能會不同,而且也難以判斷各方法的優(yōu)劣。之所以這樣,是因?yàn)檫@些方法之間沒有一個(gè)統(tǒng)一的評判標(biāo)準(zhǔn)。因此,實(shí)際應(yīng)用中選擇何種方法,取決于決策者對自然狀態(tài)所持的主觀態(tài)度。若態(tài)度悲觀,則選用悲觀法;若重視機(jī)會,則采用后悔值法;若認(rèn)為各狀態(tài)出現(xiàn)的機(jī)會相等,則可采用等可能準(zhǔn)則。第三節(jié)風(fēng)險(xiǎn)決策

(DecisionMakingwithProbability)為了提高決策的客觀性,決策者通常需要對決策所面臨的自然狀態(tài)所出的概率進(jìn)行統(tǒng)計(jì)分析。此時(shí),決策者雖然知道自然狀態(tài)出現(xiàn)的概率,但仍然不知道哪種自然狀態(tài)肯定會出現(xiàn),因此決策仍然具有一定的風(fēng)險(xiǎn)。所以這種條件下的決策稱為風(fēng)險(xiǎn)決策。決策問題的統(tǒng)計(jì)分析本章例1中,為了獲得每月牛奶不同需求量的概率,食品對過去20個(gè)月的牛奶需求進(jìn)行了統(tǒng)計(jì),結(jié)果如下表。

表7各種需求量的概率統(tǒng)計(jì)分析表每月需求量(箱數(shù))各種需求出現(xiàn)次數(shù)的統(tǒng)計(jì)各種需求出現(xiàn)的概率252次0.1266次0.32710次0.5282次0.1Σ20次1.0這樣,就得到如下表所示的決策信息(風(fēng)險(xiǎn)決策表)。狀態(tài)損益值方案25箱(S1)26箱(S2)27箱(S3)28箱(S4)P(S1)=0.1P(S2)=0.3P(S3)=0.5P(S4)=0.125箱(A1)15015015015026箱(A2)13415615615627箱(A3)11814016216228箱(A4)102124146168一、最大可能準(zhǔn)則由概率論的知識可知,一個(gè)事件的概率越大,則該事件發(fā)生的可能性就越大。最大可能準(zhǔn)則就是在風(fēng)險(xiǎn)決策的情況下,選擇一個(gè)概率最大的自然狀態(tài)進(jìn)行決策,而不考慮其它自然狀態(tài),這樣,就將風(fēng)險(xiǎn)決策問題變成了一個(gè)確定性的決策。該準(zhǔn)則的數(shù)學(xué)描述如下:則r*所對應(yīng)的方案為所選方案。例4用最大可能準(zhǔn)則對下表所表述的問題進(jìn)行決策。

故應(yīng)選方案A3。注意:該方法適用于有一個(gè)自然狀態(tài)的概率明顯大于其它狀態(tài)的概率,且收益矩陣中的元素相差不大的情況。當(dāng)各自然狀態(tài)的概率相差不大時(shí),不宜使用該方法。狀態(tài)損益值方案25箱(S1)26箱(S2)27箱(S3)28箱(S4)P(S1)=0.1P(S2)=0.3P(S3)=0.5P(S4)=0.125箱(A1)15015015015026箱(A2)13415615615627箱(A3)11814016216228箱(A4)102124146168二、期望值準(zhǔn)則(expectedvalueapproach)(一)最大期望收益準(zhǔn)則期望收益最大值所對應(yīng)的方案為最優(yōu)方案。其數(shù)學(xué)描述為則方案Ak為最優(yōu)方案。舉例用最大期望準(zhǔn)則對下表所表述的問題進(jìn)行決策。解:各方案的期望收益值計(jì)算如下ER(A1)=0.1×150+0.3×150+0.5×150+0.1×150=150.0(元)ER(A2)=0.1×134+0.3×156+0.5×156+0.1×156=153.8(元)ER(A3)=0.1×118+0.3×140+0.5×162+0.1×162=151.0(元)ER(A4)=0.1×102+0.3×124+0.5×146+0.1×168=137.2(元)

故方案A2為最優(yōu)方案。狀態(tài)損益值方案25箱(S1)26箱(S2)27箱(S3)28箱(S4)P(S1)=0.1P(S2)=0.3P(S3)=0.5P(S4)=0.125箱(A1)15015015015026箱(A2)13415615615627箱(A3)11814016216228箱(A4)102124146168(二)期望損失準(zhǔn)最小期望損失準(zhǔn)則就是先計(jì)算各方案的期望損失值,然后加以比較,期望損失最小值所對應(yīng)的方案為最優(yōu)方案。其數(shù)學(xué)描述為則方案Ak為最優(yōu)方案。式中hij為在狀態(tài)為Sj下作出決策為Ai的機(jī)會損失。解:各方案的期望損失值計(jì)算如下EL(A1)=0.1×0+0.3×6+0.5×12+0.1×18=9.6(元)EL(A2)=0.1×16+0.3×0+0.5×6+0.1×12=5.8(元)EL(A3)=0.1×32+0.3×16+0.5×0+0.1×6=8.6(元)EL(A4)=0.1×48+0.3×32+0.5×16+0.1×0=22.4(元)故方案A2為最優(yōu)方案,與最大期望收益準(zhǔn)則所得結(jié)論相同。舉例用期望損失準(zhǔn)則對下表所表述的問題進(jìn)行決策。狀態(tài)損益值方案25箱(S1)26箱(S2)27箱(S3)28箱(S4)P(S1)=0.1P(S2)=0.3P(S3)=0.5P(S4)=0.125箱(A1)06121826箱(A2)16061227箱(A3)32160628箱(A4)4832160可以證明,對于同一問題,用最大期望準(zhǔn)則和最小期望損失準(zhǔn)則進(jìn)行決策,其結(jié)果是完全相同的。具體如下由于對于某一具體的問題,為常數(shù),因此,當(dāng)ER(Ai)為最大時(shí),EL(Ai)必為最小。三、決策樹法(decisiontree)決策樹法就是用一種樹狀的網(wǎng)絡(luò)圖形(即決策樹)進(jìn)行決策分析,其決策準(zhǔn)則是期望值準(zhǔn)則,這就是決策樹法。(一)決策樹法步驟為了說明決策樹法的決策過程,我們用決策樹法對例2所提出的問題進(jìn)行決策。決策收益及各狀態(tài)的概率如表自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3ER(Ai)大批量生產(chǎn)A13614-816.2中批量生產(chǎn)A22016014小批量生產(chǎn)A3141039.8該問題的決策樹如下圖所示。需求量大S1(0.3)需求一般S2(0.5)需求量小S3(0.2)3614-8A1需求量大S1(0.3)需求一般S2(0.5)需求量小S3(0.2)20160A2需求量大S1(0.3)需求一般S2(0.5)需求量小S3(0.2)14103A3116.2149.8大批量生產(chǎn)A1中批量生產(chǎn)A2小批量生產(chǎn)A316.2圖1圖1所描述的是一個(gè)單級決策問題。有些決策問題包括兩級以上的決策,即所謂的多級決策(也稱序貫決策)問題。這類決策問題用決策樹法可以有效地加以解決(二)決策樹法舉例例7某企業(yè)需要在是否引進(jìn)新產(chǎn)品之間進(jìn)行決策,即開始時(shí)有引進(jìn)新產(chǎn)品和不引進(jìn)新產(chǎn)品兩種方案。若引進(jìn)新產(chǎn)品,又面臨其它企業(yè)的競爭。估計(jì)有其他企業(yè)參與競爭的概率為0.8,沒有企業(yè)參與競爭的概率為0.2。在無競爭的情況下,企業(yè)有給產(chǎn)品確定高價(jià)、中價(jià)和低價(jià)三種方案,其相應(yīng)的收益分別為500、300和100萬元。在有競爭情況下,企業(yè)也有給產(chǎn)品確定高價(jià)、中價(jià)和低價(jià)三種方案,但此時(shí)各方案的收益大小要受到競爭企業(yè)的產(chǎn)品定價(jià)的影響,有關(guān)數(shù)據(jù)如表11。試用決策樹法進(jìn)行決策。

表11競爭企業(yè)定價(jià)方案高價(jià)中價(jià)低價(jià)本企業(yè)定價(jià)方案高價(jià)

概率收益(萬元)0.31500.500.2-200中價(jià)概率收益(萬元)0.12500.61000.3-50低價(jià)概率收益(萬元)0.11000.2500.7-100解:首先畫出決策樹如圖2引進(jìn)產(chǎn)品156對手高價(jià)(0.3)對手中價(jià)(0.5)對手低價(jià)(0.2)51500-2005對手高價(jià)(0.1)對手中價(jià)(0.6)對手低價(jià)(0.3)6250100-5070對手高價(jià)(0.1)對手中價(jià)(0.2)對手低價(jià)(0.7)710050-100-50本企業(yè)高價(jià)本企業(yè)低價(jià)本企業(yè)中價(jià)370本企業(yè)高價(jià)本企業(yè)中價(jià)本企業(yè)低價(jià)5003001004有競爭(0.8)無競爭(0.2)50020不引進(jìn)產(chǎn)品1156圖2

決策樹法總結(jié)從上述討論可以看出,決策樹方法可以通過一個(gè)簡單的決策過程,使決策者可以有順序、有步驟地周密考慮各有關(guān)因素,從而進(jìn)行決策。對于較復(fù)雜的多級決策問題,可以畫出樹形圖,以便集體討論、集體決策。第四節(jié)信息的價(jià)值與貝葉斯決策一、全信息的價(jià)值(expectedvalueofperfectinformation,EVPI)所謂全信息就是關(guān)于自然狀態(tài)的準(zhǔn)確信息。當(dāng)決策者獲得了全信息,決策者就能正確地作出決策。例如:在下表中,當(dāng)決策者準(zhǔn)確知道會出現(xiàn)自然狀態(tài)S1時(shí),就會作出大批量生產(chǎn)的決策,同理,…自然狀態(tài)損益值行動方案需求量大S1需求一般S2需求量小S3ER(Ai)大批量生產(chǎn)A13614-816.2中批量生產(chǎn)A22016014小批量生產(chǎn)A3141039.8若決策者掌握了全信息,就會給決策者帶來額外的收益,這個(gè)額外的收益就是全信息的價(jià)值。全信息的價(jià)值來源于決策者總能作出正確的決策,從不會后悔。在這種情況下,決策者的期望收益稱為全信息期望收益,其數(shù)學(xué)描述為式中,rj*為在狀態(tài)Sj下作出正確決策的收益值。EPPI就是全信息期望收益。在決策者未獲得全信息的情況下,決策只能根據(jù)期望收益最大準(zhǔn)則來選擇方案。若所選方案的期望收益為ER*,則全信息的價(jià)值為EVPI=EPPI-ER*對于上表所描述生產(chǎn)規(guī)模的決策問題,計(jì)算其全信息的價(jià)值

r1*=36;r2*=16;r3*=3EPPI=0.3×36+0.5×16+0.2×3=19.4(萬元)在未獲得信息的情況下,只能作出方案A1的決策,其期望收益為

ER*=max{16.2,14,9.8}=16.2=ER(A1)這樣EVPI=EPPI-ER*=19.4-16.2=3.2(萬元)這3.2萬元就是本問題完全信息的價(jià)值,它一方面說明完全信息能給決策者帶來更大的收益,另一方面說明決策在現(xiàn)有情況下,無論怎樣去補(bǔ)充信息,最大能增加3.2萬元的收益。關(guān)于全信息的幾點(diǎn)結(jié)論信息可以給決策者帶來額外的收益,決策者當(dāng)然想盡可能的獲取全面的信息。獲取信息往往要付出代價(jià),若獲取完全信息的代價(jià)小于全信息價(jià)值,決策者就應(yīng)投資獲取全信息,反之,決策者就不應(yīng)投資獲取全信息。對于隨機(jī)事件,全信息實(shí)際上是不存在的。一般說來,研究或購買只能得到部分信息,然而這一部分信息也是有價(jià)值的。在具有部分信息的情況下應(yīng)如何決策,這就是下面要說的貝葉斯決策。二、貝葉斯決策(BayesDecision)在實(shí)際決策中人們往往采取各種“試驗(yàn)”手段(抽樣調(diào)查、抽樣檢驗(yàn)、購買信息、專家咨詢等)獲取信息——不完全信息或樣本信息(SampleInformation)。樣本信息也可以給決策者帶來額外收益,該額外收益就是樣本信息的價(jià)值(ExpectedValueofsampleinformation)。對于風(fēng)險(xiǎn)決策問題,由過去經(jīng)驗(yàn)或?qū)<夜烙?jì)所獲得的各自然狀態(tài)的概率稱為先驗(yàn)概率(priorprobabilities)。決策者通過“試驗(yàn)”等手段,獲得了自然狀態(tài)出現(xiàn)概率的新信息作為補(bǔ)充信息,用它來修正原來的先驗(yàn)概率估計(jì),得到修正后的各狀態(tài)的概率,這種概率稱之為后驗(yàn)概率(posteriorprobabilities)。后驗(yàn)概率通常要比先驗(yàn)概率準(zhǔn)確可靠,可作為決策者進(jìn)行決策分析的依據(jù)。由于這種概率的修正是借助于貝葉斯定理完成的,所以這種情況下的決策稱之為貝葉斯決策。貝葉斯決策的具體步驟:(1)先由過去的資料和經(jīng)驗(yàn)獲得狀態(tài)發(fā)生的先驗(yàn)概率;(2)根據(jù)調(diào)查或試驗(yàn)得到各狀態(tài)下試驗(yàn)事件的條件概率,并利用貝葉斯公式計(jì)算出各狀態(tài)的后驗(yàn)概率,即式中P(Sj)為狀態(tài)Sj的先驗(yàn)概率;P(Bk|Sj)為試驗(yàn)獲取的信息,其意義為在狀態(tài)為Sj條件下出現(xiàn)事件Bk的概率;P(Sj|Bk)為試驗(yàn)事件為Bk時(shí)狀態(tài)Sj的后驗(yàn)概率(條件概率)。為全概率公式。(3)利用后驗(yàn)概率代替先驗(yàn)概率進(jìn)行決策分析。概率論相關(guān)知識條件概率——設(shè)A為一個(gè)隨機(jī)事件,稱在“事件B出現(xiàn)”的條件下,事件A的概率為“事件B出現(xiàn)下事件A的條件概率。記為P(A|B)。條件概率舉例:一批零件共100個(gè),次品率10%。從中任取一個(gè)零件,取出后不放回去,再從余下的部分中任取一個(gè)零件。求在第一次取得次品的情況下,第二次取得正品的概率。解:事件A——第一次取得次品;事件B——第二次取得正品這樣:P(A)=10/100P(B|A)=90/99先驗(yàn)概率與后驗(yàn)概率舉例:對以往數(shù)據(jù)分析結(jié)果表明,當(dāng)機(jī)器調(diào)整良好時(shí),產(chǎn)品合格率為90%,而當(dāng)機(jī)器發(fā)生某一故障時(shí),其合格率為30%。每天早上機(jī)器開動時(shí),機(jī)器調(diào)整好的概率為75%。試求已知某日早上第一件產(chǎn)品合格時(shí),機(jī)器調(diào)整良好的概率是多少?解:事件S1—機(jī)器調(diào)整良好;事件S2—機(jī)器發(fā)生某一故障;事件B1——產(chǎn)品合格;事件B2——產(chǎn)品不合格;試驗(yàn)結(jié)果出現(xiàn)事件B1這樣:P(B1|S1)=90%;P(S1)=75%;P(S2)=25%;P(B1|S2)=30%

P(S1|B1)=0.9即為試驗(yàn)結(jié)果為產(chǎn)品合格情況下,機(jī)器調(diào)整良好的概率——后驗(yàn)概率。P(S1)=75%為先驗(yàn)概率。若試驗(yàn)結(jié)果為“第一件產(chǎn)品為次品,求機(jī)器調(diào)整良好”的概率解:事件S1——機(jī)器調(diào)整良好;事件S2——機(jī)器發(fā)生某一故障;事件B1——產(chǎn)品合格;事件B2——產(chǎn)品不合格;試驗(yàn)結(jié)果出現(xiàn)事件B2這樣:P(B2|S1)=10%;P(S1)=75%;P(S2)=25%;P(B2|S2)=70%

同理有:例9

對于表10所描述的決策問題,決策者為了掌握更多的信息,決定花費(fèi)1.5萬元請咨詢公司調(diào)查該新產(chǎn)品的銷路情況。調(diào)查結(jié)果為:在需求量大的情況下,該新產(chǎn)品銷路好與不好的概率分別為0.8和0.2;在需求量一般的情況下,該新產(chǎn)品銷路好與不好的概率各為0.5;在需求量小的情況下,該新產(chǎn)品銷路好與不好的概率分別為0.3和0.7。這些數(shù)據(jù)列于表12。問:(1)花費(fèi)1.5萬元進(jìn)行調(diào)查是否合算;(2)應(yīng)如何根據(jù)調(diào)查結(jié)果進(jìn)行決策。

SB需求量大S1需求量一般S2需求小S3銷路好B1P(B1|S1)=0.8P(B1|S2)=0.5P(B1|S3)=0.3銷路差B2P(B2|S1)=0.2P(B2|S2)=0.5P(B2|S3)=0.7

解:根據(jù)所獲信息,利用貝葉斯公式,可以得到修正后的各自然狀態(tài)的概率(后驗(yàn)概率)。在信息為銷路好時(shí),有

P(B1)=P(S1)×P(B1|S1)+P(S2)×P(B1|S2)+P(S3)×P(B1|S3)=0.3×0.8+0.5×0.5+0.2×0.3=0.55因此有在銷路差時(shí),有

P(B2)=P(S1)×P(B2|S1)+P(S2)×P(B2|S2)+P(S3)×P(B2|S3)=0.3×0.2+0.5×0.5+0.2×0.7=0.45因此有銷路好時(shí)的各方案的期望收益為

ER(A1)=P(S1|B1)×r11+P(S2|B1)×r12+P(S3|B1)×r13=0.4364×36+0.4545×14+0.1091×(-8)=21.2(萬元)ER(A2)=0.4364×20+0.4545×16+0.1091×0=16(萬元)ER(A3)=0.4364×14+0.4545×10+0.1091×3=10.98(萬元)ER*(B1)=max{21.2,16,10.98}=21.2(萬元)=ER(A1)即在銷路好時(shí),應(yīng)選方案A1。銷路差時(shí)的各方案的期望收益為

ER(A1)=P(S1|B2)×r11+P(S2|B2)×r12+P(S3|B2)×r13=0.1333×36+0.5556×14+0.3111×(-8)=10.09(萬元)ER(A2)=0.1333×20+0.5556×16+0.3111×0=11.56(萬元)ER(A3)=0.1333×14+0.5556×10+0.3111×3=8.36(萬元)ER*(B2)=max{10.09,11.56,8.36}=11.56(萬元)=ER(A2)即在銷路差時(shí),應(yīng)選方案A2。樣本信息的最大期望收益為

ERI=P(B1)×ER*(B1)+P(B2)×ER*(B2)=0.55×21.2+0.45×11.56=16.862(萬元)樣本信息的價(jià)值為

EVSI=ERI-ER*=16.862-16.2=0.662(萬元)因此,用1.5萬元的費(fèi)用獲取新的信息,遠(yuǎn)遠(yuǎn)超過其價(jià)值本身,因此花費(fèi)這筆咨詢費(fèi)并不合算。

數(shù)據(jù)、模型與決策案例

——匹茲堡發(fā)展公司(PDC)決策分析問題PDC購買了一塊地計(jì)劃開發(fā)高檔樓群。現(xiàn)有三個(gè)可供選擇的項(xiàng)目(方案):

(1)小規(guī)模樓群:30棟大樓;(2)中規(guī)模樓群:60棟大樓;(3)大規(guī)模樓群:90棟大樓;影響決策方案的主要因素之一就是對樓群需求的隨機(jī)性——高需求和低需求。經(jīng)估計(jì),各方案在兩種需求的情況下將會產(chǎn)生不同的收益,這些數(shù)據(jù)匯總在如下的損益表中;PDC樓群方案損益表單位:百萬美元自然狀態(tài)決策方案高需求(s1)低需求(s2)小規(guī)模樓群(d1)中規(guī)模樓群(d2)大規(guī)模樓群(d3)8142075-9一.無概率決策(不確定性決策)PDC樓群方案損益表單位:百萬美元自然狀態(tài)決策方案高需求(s1)低需求(s2)maxrijminrij小規(guī)模樓群(d1)中規(guī)模樓群(d2)大規(guī)模樓群(d3)8142075-98142075-91.樂觀法在上表中:maxmaxrij=r31=20

即,樂觀法得到的決策方案是方案d3:建造大規(guī)模樓群.2.悲觀法因?yàn)閙axminrij=r12=7即,悲觀法得到的決策方案是方案d1:建造小規(guī)模樓群.3.后悔值法PDC樓群方案損益表與后悔值表單位:百萬美元自然狀態(tài)決策方案損益值rij后悔值hijmaxhij高需求(s1)低需求(s2)高需求(s1)低需求(s2)小規(guī)模樓群(d1)中規(guī)模樓群(d2)大規(guī)模樓群(d3)8142075-91260021612616在上表中:minmaxhij=h22=6即,后悔值法得到的決策方案是方案d2:建造中規(guī)模樓群.二.有概率的決策(風(fēng)險(xiǎn)決策)

1.期望值法PDC非??春眠@一高檔樓群,因此,他們估計(jì):該樓群高需求的概率為0.8,而低需求的概率為0.2。于是三種方案的期望收益如下:ER(d1)=0.8×8+0.2×7=7.8ER(d2)=0.8×14+0.2×5=12.2ER(d3)=0.8×20+0.2×(-9)=14.2

即,期望值法得到的決策方案是方案d3:建造大規(guī)模樓群.PDC樓群方案收益期望值單位:百萬美元自然狀態(tài)決策方案高需求(s1)低需求(s2)ER(di)P(s1)=0.8P(s2)=0.2小規(guī)模樓群(d1)中規(guī)模樓群(d2)大規(guī)模樓群(d3)8142075-97.812.214.2PDC問題風(fēng)險(xiǎn)決策的決策樹描述14.214.212.27.8二.有概率的決策(風(fēng)險(xiǎn)決策)

2.完全信息價(jià)值(完美信息價(jià)值)如果決策者具有完全信息,在高需求時(shí)他會選擇大規(guī)模樓群方案,相應(yīng)收益為$20million.在低需求時(shí)他會選擇小規(guī)模樓群方案,相應(yīng)收益為$7million.因此,完全信息的期望收益如下:EPPI=0.8×20+0.2×7=17.4如果決策者不具有完全信息,他只能根據(jù)期望值法確定方案,而這時(shí)他所選擇的方案為d3:建造大規(guī)模樓群,期望收益為$14.2million.因此,完全信息的價(jià)值為:

EVPI=EPPI–ER*=17.4–14.2=3.2

1.樣本信息(indicators)完全信息是不可能獲得的,但通過市場調(diào)查,即通過對潛在對象的訪問獲得樣本信息(SampleInformation,orIndicator).PDC的管理者認(rèn)為,市場調(diào)查的結(jié)果可以獲得兩種樣本信息(twoindicators):I1=有利報(bào)告(favorablemarketresearchreport)(被調(diào)查對象對購買該高檔樓群有較高興趣)I2=不利報(bào)告(unfavorablemarketresearchreport)(被調(diào)查對象對購買該高檔樓群興趣不高)具體的信息在下表中以概率的形式給出三.有樣本信息的決策分析(樣本信息的價(jià)值)2.后驗(yàn)概率的計(jì)算在獲得樣本信息后,可以利用Bayes公式,計(jì)算高需求和低需求兩種自然狀態(tài)的后驗(yàn)概率.這里,我們采用如下表格的形式計(jì)算兩種信息下的自然狀態(tài)的后驗(yàn)概率.樣本信息的概率樣本信息自然狀態(tài)有利報(bào)告(I1)不利報(bào)告(I2)高需求(s1)低需求(s2)P(I1/s1)=0.9P(I1/s2)=0.25P(I1/s2)=0.10P(I2/s2)=0.75有利報(bào)告(I1)下的后驗(yàn)概率計(jì)算自然狀態(tài)Sj先驗(yàn)概率P(sj)樣本信息條件概率P(I1/sj)聯(lián)合概率P(I1∩sj)后驗(yàn)概率P(sj/I1)s1s20.80.20.90.250.720.05P(I1)=0.770.93510.0649不利報(bào)告(I2)下的后驗(yàn)概率計(jì)算自然狀態(tài)Sj先驗(yàn)概率P(sj)樣本信息條件概率P(I2/sj)聯(lián)合概率P(I2∩sj)后驗(yàn)概率P(sj/I2)s1s20.80.20.10.750.080.15P(I1)=0.230.34780.65223.決策樹(有市場調(diào)查)8.1315.8218.111.098.137.3518.1113.427.944.決策戰(zhàn)略從上述決策樹的結(jié)果可以看出:在有樣本信息的情況下,PDC可以獲得$15.82million.而在沒有樣本信息的情況下,他只能根據(jù)期望值法確定方案,而這時(shí)他所選擇的方案為d3:建造大規(guī)模樓群,期望收益為$14.2million.因此,PDC應(yīng)該采取如下決策戰(zhàn)略:

首先是開展市場調(diào)查,然后采取如下策略:

如果市場調(diào)查的結(jié)果是有利的,則建設(shè)大規(guī)模樓群;如果市場調(diào)查的結(jié)果是不利的,則建設(shè)中等規(guī)模樓群;

5.樣本信息的價(jià)值EVSI=15.82-14.2=1.60(million$)6.樣本信息的效率E=EVSI/EVPI×100%=1.60/3.2×100%=50%7.風(fēng)險(xiǎn)組合(riskprofile)風(fēng)險(xiǎn)組合就是組成最佳決策戰(zhàn)略的各可能損益值出現(xiàn)概率的組合.由上述決策數(shù)可知,組成最佳戰(zhàn)略決策的分支如下圖marketresearch12386Large(d3)favorable0.77unfavorable0.23Medium(d2)low0.65high0.94high0.35low0.06514-920損益值概率-9514200.77×0.06=0.050.23×0.65=0.150.23×0.35=0.080.77×0.94=0.728.PDC問題的計(jì)算機(jī)求解

第五節(jié)效用理論與決策

(utilityanddecisionmaking)一、效用的概念一般來說,期望收益大的方案其風(fēng)險(xiǎn)也越大;期望值準(zhǔn)則并沒有考慮決策者對風(fēng)險(xiǎn)的態(tài)度;由于經(jīng)濟(jì)實(shí)力的差異,不同的決策者對風(fēng)險(xiǎn)的承受能力就不同,因而對風(fēng)險(xiǎn)的態(tài)度也就不同,這樣同一數(shù)量的貨幣值對于不同的決策者就有不同的主觀價(jià)值。即使對于同一決策者,在不同的條件下,也可能有對同一貨幣值有不同的主觀價(jià)值。決策本身是決策者的具體行為,因此,決策必須考慮決策者的主觀價(jià)值。為了說明主觀價(jià)值在風(fēng)險(xiǎn)決策中的作用,現(xiàn)舉例如下。例10投資某項(xiàng)目有A、B兩方案,A方案成功與失敗的概率分別為0.7和0.3,B方案成功與失敗的概率分別為0.9和0.1,各方案在成功與失敗條件下的收益情況如表13,決策者用如何決策?表13單位:萬元自然狀態(tài)行動方案成功S1失敗S2ERA概率0.70.3

290收益500-200B概率0.90.188收益100-20A方案風(fēng)險(xiǎn)遠(yuǎn)大于B方案;冒險(xiǎn)者會選擇A方案;保守者會選擇B方案。為了度量人們對貨幣的主觀價(jià)值,經(jīng)濟(jì)學(xué)者引入了效用的概念。效用——就是度量決策者對風(fēng)險(xiǎn)的態(tài)度、對某種事物的傾向或?qū)δ撤N后果的偏愛等主觀因素的強(qiáng)弱程度的數(shù)量指標(biāo)(無量綱)。一般來說,貨幣值大的,其相應(yīng)效用值也越大,但二者的關(guān)系一般不是線性關(guān)系。二、效用曲線可用效用曲線來全面反映某決策者對風(fēng)險(xiǎn)的態(tài)度。規(guī)定:凡對決策者最愛好、最傾向、最愿意的事物(事件)的效用值賦予1,凡對決策者最不愛好、最不愿意的事物(事件)的效用值賦予0?;蛴闷渌鼣?shù)值范圍,如100—0。效用曲線的確定方法有兩種,即直接提問法和對比提問法。一般采用對比提問法。這里重點(diǎn)介紹對比提問法。設(shè)決策者面臨兩種可供選擇的方案A1、A2,A1表示他可在無任何風(fēng)險(xiǎn)的情況下獲得收益x2,A2表示他可以概率p獲得收益x1,或以概率(1-p)損失金額x3;且x1>x2>x3,設(shè)u(x1)表示金額x1的效用,若在某種條件下,決策者認(rèn)為A1、A2兩方案等價(jià)時(shí),則可表示為pu(x1)+(1-p)u(x3)=u(x2)即x2的效用值等價(jià)于x1和x3的期望效用值。上式中有4個(gè)變量,若已知其中3個(gè),用對比提問的方式就可確定第4個(gè)變量的取值,這種方式就包含決策者的主觀判斷因素。具體方式有以下三種:(1)每次固定x1、x2、x3的值,改變p,提問決策者:“p取何值,A1與A2兩等價(jià)”;(2)每次固定p、x1、x3的值,改變x2,提問決策者:“x2取何值,A1與A2兩等價(jià)”;(3)每次固定p、x2、x3的值(或x1),改變p,提問決策者:“x1(或x3)取何值,A1與A2兩等價(jià)”;實(shí)用中一般采用美國學(xué)者VonNeumann和Morgenstern提出的V—M方法,即每次取p=0.5,固定x1、x3的值,利用0.5u(x1)+0.5u(x3)=u(x2)改變x2三次,提問三次,確定三個(gè)點(diǎn),得到?jīng)Q策者的效用曲線。例11某投資者甲面臨一風(fēng)險(xiǎn)投資決策問題。該投資的最大收益為200萬元,最小收益為-50萬元,試用V—M法確定該投資者的效用曲線。解:首先u(200)=1;u(-50)=0;其它提問與回答列表如下:x1x3u(x1)u(x3)提問:x2取何值時(shí)0.5u(x1)+0.5u(x3)=u(x2)成立回答:x2的取值x2的效用計(jì)算200-50100.5u(200)+0.5u(-50)=u(x2)120u(120)=0.5×1+0.5×0=0.5120-500.500.5u(120)+0.5u(-50)=u(x2)60u(60)=0.5×0.5+0.5×0=0.2520012010.50.5u(200)+0.5u(120)=u(x2)170u(170)=0.5×1+0.5×0.5=0.75這樣,從表中就可以得到如下坐標(biāo)點(diǎn):(120,0.5)、(60,0.25)、(170,0.75)。加上(-50,0)和(200,1)共5個(gè)坐標(biāo)點(diǎn),就可繪制出該決策者(投資者甲)的效用曲線如圖3所示。0.51001502000.7510500.25-50收益值效用值風(fēng)險(xiǎn)型投資者乙效用曲線保守型中間型投資者甲效用曲線圖3同樣的風(fēng)險(xiǎn)投資問題對于另一個(gè)決策者(投資者乙)在回答提問時(shí),可能會得到完全不同的結(jié)果,如表15所示。根據(jù)該表中數(shù)據(jù)可繪制出如圖3中投資者乙的效用曲線。x1x3u(x1)u(x3)提問:x2取何值時(shí)0.5u(x1)+0.5u(x3)=u(x2)成立回答:x2的取值x2的效用計(jì)算200-50100.5u(200)+0.5u(-50)=u(x2)20u(20)=0.5×1+0.5×0=0.520-500.500.5u(20)+0.5u(-50)=u(x2)-30u(-30)=0.5×0.5+0.5×0=0.252002010.50.5u(200)+0.5u(20)=u(x2)100u(100)=0.5×1+0.5×0.5=0.75投資者甲和投資者乙的比較顯然,投資者甲對對資金的損失反映比較遲鈍,相反對收益的增加比較敏感,因此投資者甲屬于風(fēng)險(xiǎn)型(冒險(xiǎn)型)決策者。投資者乙對資金的損失比較敏感,而對收益的增加反映遲鈍,即不愿承擔(dān)損失的風(fēng)險(xiǎn),因此屬于保守型決策者。還有的決策者認(rèn)為,收入的增加金額與效用值的增長成等比關(guān)系,這種決策者則具有中間型效用曲線。當(dāng)需要用計(jì)算機(jī)來進(jìn)行計(jì)算時(shí),效用曲線還可以擬合成函數(shù)關(guān)系。常見的有線性函數(shù)、指數(shù)函數(shù)、雙指數(shù)函數(shù)、冪函數(shù)和對數(shù)函數(shù)等形式。三、效用曲線的應(yīng)用利用效用函數(shù)作為決策的原則稱為效用值準(zhǔn)則。對于一次性風(fēng)險(xiǎn)較大的決策,利用該準(zhǔn)則進(jìn)行決策較為方便。例12某公司需要對開發(fā)A、B兩種新產(chǎn)品進(jìn)行決策。已知,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論