決策理論與方法第三章 效用函數(shù)_第1頁(yè)
決策理論與方法第三章 效用函數(shù)_第2頁(yè)
決策理論與方法第三章 效用函數(shù)_第3頁(yè)
決策理論與方法第三章 效用函數(shù)_第4頁(yè)
決策理論與方法第三章 效用函數(shù)_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章效用函數(shù)

第一節(jié)效用的定義和公理系統(tǒng)一、引言·為什么要引入效用

決策問(wèn)題的特點(diǎn):自然狀態(tài)不確定——以概率表示;

后果價(jià)值待定:以效用度量。1.無(wú)形后果,非數(shù)字量(如信譽(yù)、威信、出門(mén)帶傘問(wèn)題的后果)需以數(shù)值度量;2.即使是數(shù)值量(例如貨幣)表示的后果,其價(jià)值仍有待確定,后果的價(jià)值因人而異。例一:同是100元錢(qián),對(duì)窮人和百萬(wàn)富翁的價(jià)值絕然不同;對(duì)同一個(gè)人,身無(wú)分文時(shí)的100元,與已有10000元再增加100元的作用不同,這是錢(qián)的邊際價(jià)值問(wèn)題。例2:2023/2/63:11禮品a1抽獎(jiǎng)a21.00.50.510萬(wàn)元25萬(wàn)元0元在各類(lèi)決策中,常常面臨著這種選擇:風(fēng)險(xiǎn)小但期望收益也??;期望收益大但風(fēng)險(xiǎn)也大!不同的決策人有不同的選擇,相同的決策人在不同的情境下選擇也不同。那么在決策中如何描述或表達(dá)后果對(duì)決策人的實(shí)際價(jià)值,以便反映決策人心目中對(duì)各種后果的偏好次序呢?*偏好次序是決策人的個(gè)性與價(jià)值觀(guān)的反映,與決策人所處的社會(huì)、經(jīng)濟(jì)地位,文化素養(yǎng),心理和生理(身體)狀態(tài)有關(guān)。*除風(fēng)險(xiǎn)偏好之外,還有時(shí)間偏好。

而效用(Utility)就是偏好的量化,是數(shù)(實(shí)值函數(shù)).DanielBernoulli在1738年指出:

若一個(gè)人面臨從給定行動(dòng)集(風(fēng)險(xiǎn)性展望集)中作選擇的決策問(wèn)題,如果他知道與給定行動(dòng)有關(guān)的將來(lái)的自然狀態(tài),且這些狀態(tài)出現(xiàn)的概率已知或可以估計(jì),則他應(yīng)選擇對(duì)各種可能后果的偏好的期望值最高的行動(dòng)。決策的目標(biāo)就是使期望效用極大化。二、效用基本概念及符號(hào)嚴(yán)格序>:a>b表示a優(yōu)于b。滿(mǎn)足傳遞性和非對(duì)稱(chēng)性。無(wú)差異~:a~b表示a與b無(wú)差異。滿(mǎn)足自反性、對(duì)稱(chēng)性和傳遞性。弱序≥:a≥b表示a不劣于b。滿(mǎn)足可比性、傳遞性、與無(wú)差異~的一致性和嚴(yán)格優(yōu)于的一致性。展望(prospect)(可能的前景):各種后果(r種)及后果出現(xiàn)的概率的組合,記為:Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>,(j=1,2,…,m;m為行動(dòng)的可能種數(shù))2023/2/63:11復(fù)合展望:當(dāng)無(wú)法確定采取某個(gè)行動(dòng)時(shí),可隨機(jī)選擇一種行動(dòng),設(shè)選擇行動(dòng)aj的概率為qj。則決策的展望就是一種復(fù)合展望,記為P=<q1,P1;q2,P2;…;qm,Pm>。所有展望(包括簡(jiǎn)單展望和復(fù)合展望)構(gòu)成展望空間。2023/2/63:11抽獎(jiǎng)(lottery)與確定當(dāng)量

(

;

)則稱(chēng)確定性后果

為抽獎(jiǎng)的確定當(dāng)量效用的定義若展望空間上的實(shí)值函數(shù)u對(duì)于展望空間P的任意兩個(gè)展望P1、P2,有P1≥P2

當(dāng)且僅當(dāng)

u(P1)≥u(P2),則稱(chēng)u為效用函數(shù)三、效用存在性公理(理性行為公理)連通性:任意兩個(gè)展望的優(yōu)劣都是可比的傳遞性:展望的優(yōu)劣滿(mǎn)足傳遞性復(fù)合保序性:展望的優(yōu)劣關(guān)系是可以復(fù)合的,且復(fù)合不會(huì)破壞原有的優(yōu)劣關(guān)系偏好的有界性:展望的優(yōu)劣是相對(duì)的,沒(méi)有無(wú)限優(yōu)的展望,也不存在無(wú)限劣的展望。理性行為公理認(rèn)為合乎理性的決策人在進(jìn)行價(jià)值判斷時(shí)一定能滿(mǎn)足這些公理。(實(shí)際決策中是否存在某種悖論呢?)2023/2/63:11Allais悖論2023/2/63:11抽獎(jiǎng)a1抽獎(jiǎng)a21.00.890.0150萬(wàn)元50萬(wàn)元0元0.10250萬(wàn)元抽獎(jiǎng)a1抽獎(jiǎng)a21.00.890.0150萬(wàn)元50萬(wàn)元0元0.10250萬(wàn)元決策A決策A抽獎(jiǎng)b1抽獎(jiǎng)b20.110.9050萬(wàn)元0元0.10250萬(wàn)元決策B實(shí)際上決策B是在決策A的基礎(chǔ)上同時(shí)減去了89%的機(jī)會(huì)獲得50萬(wàn)元,復(fù)合保序性沒(méi)有得到滿(mǎn)足0萬(wàn)元0.89效用的公理化定義:在上述公理系統(tǒng)中,若展望空間上存在實(shí)值函數(shù)u,有:對(duì)展望空間中的任意展望P1、P2,P1>P2

當(dāng)且僅當(dāng)

u(P1)>u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(復(fù)合展望的效用等于展望效用的復(fù)合)對(duì)滿(mǎn)足上述條件的實(shí)值函數(shù)u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1,b>0。(任意兩個(gè)決策人的效用是線(xiàn)性相關(guān)的)則效用函數(shù)u(P)為(基數(shù))效用函數(shù)2023/2/63:11四、效用函數(shù)—基數(shù)性和序數(shù)性前述定義的效用是一種基數(shù)效用,不僅能夠反映決策者的偏好次序,還能夠反映決策者的偏好強(qiáng)度。但在實(shí)際決策中,有時(shí)只需要偏好次序而不一定需要知道偏好強(qiáng)度就可以決策。此時(shí)只需要序數(shù)效用就可以了。有關(guān)序數(shù)效用的應(yīng)用在多屬性決策中介紹。Hicks對(duì)效用函數(shù)的基數(shù)性和序數(shù)性的比喻:如果知道兩個(gè)人的身高,那么我們可以把高個(gè)兒排在第一位;如果不知道他倆的身高也沒(méi)關(guān)系,讓他們比一下就可以了。2023/2/63:11第二節(jié)效用函數(shù)的構(gòu)造一、估計(jì)效用函數(shù)值的方法概率當(dāng)量法(VonNeumann,Morgenstern,N-M法):設(shè)決策系統(tǒng)的自然狀態(tài)集Θ={1,…,n}、行動(dòng)集A={a1,…,am}、后果集C={cij=c(ai,j)},最優(yōu)后果為c*=max{cij},最劣后果為c0=min{cij}。則對(duì)于任意后果cij的效用值u(cij),可按以下步驟獲得:設(shè)u(c*)=1,u(c0)=0;建立簡(jiǎn)單展望<p,c*;1-p,c0>,p可調(diào)反復(fù)向決策人提問(wèn),改變可調(diào)概率p,使得當(dāng)p=pij時(shí)得到如下的無(wú)差異關(guān)系:cij~<pij,c*;1-pij,c0>測(cè)得后果cij的效用值為:

u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij2023/2/63:11確定當(dāng)量法(修正N-M法):設(shè)u(c*)=1,u(c0)=0;建立簡(jiǎn)單展望<p,c*;1-p,c0>,p為0-1間的給定值,如p=0.5反復(fù)向決策人提問(wèn),改變cij得到如下的無(wú)差異關(guān)系:cij~<p,c*;1-p,c0>測(cè)得后果cij的效用值為:

u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益當(dāng)量法:已知u(cij)和u(c0),確定u(c*)的方法損失當(dāng)量法:已知u(cij)和u(c*),確定u(c0)的方法2023/2/63:11如何選擇估計(jì)方法使用確定當(dāng)量法時(shí)決策人對(duì)最優(yōu)后果(增益)的保守性和對(duì)損失的冒險(xiǎn)性都比概率當(dāng)量法嚴(yán)重(Hershey,1982)采用增益當(dāng)量法與損失當(dāng)量法時(shí)產(chǎn)生的誤差也比用概率當(dāng)量法大盡可能使用概率當(dāng)量法后果為離散型隨機(jī)變量時(shí),后果集中元素為有限個(gè),構(gòu)造后果集上的效用函數(shù)有兩個(gè)方面的內(nèi)容,一是確定各后果之間的優(yōu)先順序,二是確定后果之間的優(yōu)先程度。步驟:二、離散型后果的效用設(shè)定例:看球的效用函數(shù)構(gòu)造(不考慮經(jīng)濟(jì)成本)構(gòu)建問(wèn)題的決策樹(shù),根據(jù)一般偏好,四種后果的優(yōu)劣是C2>C3>C4>C1;令u(C1)=0,u(C2)=1;詢(xún)問(wèn)1:“下雨看電視轉(zhuǎn)播”的后果與“現(xiàn)場(chǎng)看球”時(shí)有多大的概率下雨被淋相當(dāng)?(例如:0.3,則u(C3)=0.7)詢(xún)問(wèn)2:“天晴看電視轉(zhuǎn)播”的后果與“現(xiàn)場(chǎng)看球”時(shí)有多大的概率下雨被淋相當(dāng)?(例如:0.6,則u(C4)=0.4)一致性檢驗(yàn):用C3,C4加上C1(或C2)進(jìn)行校驗(yàn),直至一致性得到滿(mǎn)足。2023/2/63:11現(xiàn)場(chǎng)看球a1電視看球a2C4:天晴看電視C3:下雨沒(méi)被淋C2:天晴未被淋C1:下雨被淋三、連續(xù)型后果效用函數(shù)的構(gòu)造若后果是連續(xù)型,則可通過(guò)分析u(c)的若干特征值,求出特征點(diǎn)的效用后再連成光滑曲線(xiàn)。例:試作出每天投入學(xué)習(xí)的時(shí)間t對(duì)應(yīng)的效用曲線(xiàn)。分析特征點(diǎn):u(t=0)=0;u(t>TM)=0(TM=?);狀態(tài)導(dǎo)入期(0~t0),效用增加較慢;狀態(tài)穩(wěn)定期(t0~t1),效用與投入學(xué)習(xí)的時(shí)間基本成比例關(guān)系;效率下降,效用增加期(t1~tm),效用是投入學(xué)習(xí)的時(shí)間的單調(diào)增函數(shù),但增長(zhǎng)率小于狀態(tài)穩(wěn)定期且隨著時(shí)間的增加越來(lái)越小,最終達(dá)到零(t=tm),此時(shí)效用達(dá)到最大;當(dāng)投入的學(xué)習(xí)時(shí)間大于tm時(shí),將會(huì)得不償失,學(xué)習(xí)效率急劇降低,效用減少。2023/2/63:112023/2/63:11t0t1tmtM024U(t)Umaxt四、效用曲線(xiàn)的解析函數(shù)近似適用于規(guī)范化的效用曲線(xiàn)規(guī)范化的效用函數(shù)是指0≦x≦1,且u(0)=0,u(1)=1的效用函數(shù)冪函數(shù)對(duì)數(shù)函數(shù)第三節(jié)風(fēng)險(xiǎn)與效用一、風(fēng)險(xiǎn)的概念風(fēng)險(xiǎn):遇到破壞或損失的機(jī)會(huì)或危險(xiǎn)?!帮L(fēng)險(xiǎn)”:以打魚(yú)捕撈為生的漁民們?cè)陂L(zhǎng)期的捕撈實(shí)踐中,深深的體會(huì)到“風(fēng)”給他們帶來(lái)的無(wú)法預(yù)測(cè)無(wú)法確定的危險(xiǎn),他們認(rèn)識(shí)到,在出海捕撈打魚(yú)的生活中,“風(fēng)”即意味著“險(xiǎn)”,因此有了“風(fēng)險(xiǎn)”一詞的由來(lái)。風(fēng)險(xiǎn)包含兩個(gè)方面的內(nèi)容:一是后果的損失嚴(yán)重程度;二是損失出現(xiàn)的可能性大小。參考:/view/156901.htm2023/2/63:112023/2/63:11二、風(fēng)險(xiǎn)的度量方差:設(shè)某決策方案a的后果為收益y,y的概率密度函數(shù)為f(y),期望值為E(y),則方差可用來(lái)度量風(fēng)險(xiǎn),方差越大風(fēng)險(xiǎn)越大。協(xié)方差:若期望收益為決策人設(shè)定的目標(biāo)收益c,則可用協(xié)方差度量風(fēng)險(xiǎn)。臨界概率:小于目標(biāo)收益的概率。三、效用包含的內(nèi)容1、對(duì)風(fēng)險(xiǎn)的一種態(tài)度。2023/2/63:11U(t)Umax=1C(萬(wàn)元)風(fēng)險(xiǎn)厭惡型風(fēng)險(xiǎn)中立型風(fēng)險(xiǎn)追求型0.50912.51425風(fēng)險(xiǎn)酬金k2、對(duì)后果的強(qiáng)度偏好3、可測(cè)價(jià)值函數(shù)四、相對(duì)風(fēng)險(xiǎn)態(tài)度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論