決策理論與方法第三章 效用函數(shù)_第1頁
決策理論與方法第三章 效用函數(shù)_第2頁
決策理論與方法第三章 效用函數(shù)_第3頁
決策理論與方法第三章 效用函數(shù)_第4頁
決策理論與方法第三章 效用函數(shù)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章效用函數(shù)

第一節(jié)效用的定義和公理系統(tǒng)一、引言·為什么要引入效用

決策問題的特點(diǎn):自然狀態(tài)不確定——以概率表示;

后果價值待定:以效用度量。1.無形后果,非數(shù)字量(如信譽(yù)、威信、出門帶傘問題的后果)需以數(shù)值度量;2.即使是數(shù)值量(例如貨幣)表示的后果,其價值仍有待確定,后果的價值因人而異。例一:同是100元錢,對窮人和百萬富翁的價值絕然不同;對同一個人,身無分文時的100元,與已有10000元再增加100元的作用不同,這是錢的邊際價值問題。例2:2023/2/63:11禮品a1抽獎a21.00.50.510萬元25萬元0元在各類決策中,常常面臨著這種選擇:風(fēng)險小但期望收益也??;期望收益大但風(fēng)險也大!不同的決策人有不同的選擇,相同的決策人在不同的情境下選擇也不同。那么在決策中如何描述或表達(dá)后果對決策人的實際價值,以便反映決策人心目中對各種后果的偏好次序呢?*偏好次序是決策人的個性與價值觀的反映,與決策人所處的社會、經(jīng)濟(jì)地位,文化素養(yǎng),心理和生理(身體)狀態(tài)有關(guān)。*除風(fēng)險偏好之外,還有時間偏好。

而效用(Utility)就是偏好的量化,是數(shù)(實值函數(shù)).DanielBernoulli在1738年指出:

若一個人面臨從給定行動集(風(fēng)險性展望集)中作選擇的決策問題,如果他知道與給定行動有關(guān)的將來的自然狀態(tài),且這些狀態(tài)出現(xiàn)的概率已知或可以估計,則他應(yīng)選擇對各種可能后果的偏好的期望值最高的行動。決策的目標(biāo)就是使期望效用極大化。二、效用基本概念及符號嚴(yán)格序>:a>b表示a優(yōu)于b。滿足傳遞性和非對稱性。無差異~:a~b表示a與b無差異。滿足自反性、對稱性和傳遞性。弱序≥:a≥b表示a不劣于b。滿足可比性、傳遞性、與無差異~的一致性和嚴(yán)格優(yōu)于的一致性。展望(prospect)(可能的前景):各種后果(r種)及后果出現(xiàn)的概率的組合,記為:Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>,(j=1,2,…,m;m為行動的可能種數(shù))2023/2/63:11復(fù)合展望:當(dāng)無法確定采取某個行動時,可隨機(jī)選擇一種行動,設(shè)選擇行動aj的概率為qj。則決策的展望就是一種復(fù)合展望,記為P=<q1,P1;q2,P2;…;qm,Pm>。所有展望(包括簡單展望和復(fù)合展望)構(gòu)成展望空間。2023/2/63:11抽獎(lottery)與確定當(dāng)量

(

;

)則稱確定性后果

為抽獎的確定當(dāng)量效用的定義若展望空間上的實值函數(shù)u對于展望空間P的任意兩個展望P1、P2,有P1≥P2

當(dāng)且僅當(dāng)

u(P1)≥u(P2),則稱u為效用函數(shù)三、效用存在性公理(理性行為公理)連通性:任意兩個展望的優(yōu)劣都是可比的傳遞性:展望的優(yōu)劣滿足傳遞性復(fù)合保序性:展望的優(yōu)劣關(guān)系是可以復(fù)合的,且復(fù)合不會破壞原有的優(yōu)劣關(guān)系偏好的有界性:展望的優(yōu)劣是相對的,沒有無限優(yōu)的展望,也不存在無限劣的展望。理性行為公理認(rèn)為合乎理性的決策人在進(jìn)行價值判斷時一定能滿足這些公理。(實際決策中是否存在某種悖論呢?)2023/2/63:11Allais悖論2023/2/63:11抽獎a1抽獎a21.00.890.0150萬元50萬元0元0.10250萬元抽獎a1抽獎a21.00.890.0150萬元50萬元0元0.10250萬元決策A決策A抽獎b1抽獎b20.110.9050萬元0元0.10250萬元決策B實際上決策B是在決策A的基礎(chǔ)上同時減去了89%的機(jī)會獲得50萬元,復(fù)合保序性沒有得到滿足0萬元0.89效用的公理化定義:在上述公理系統(tǒng)中,若展望空間上存在實值函數(shù)u,有:對展望空間中的任意展望P1、P2,P1>P2

當(dāng)且僅當(dāng)

u(P1)>u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(復(fù)合展望的效用等于展望效用的復(fù)合)對滿足上述條件的實值函數(shù)u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1,b>0。(任意兩個決策人的效用是線性相關(guān)的)則效用函數(shù)u(P)為(基數(shù))效用函數(shù)2023/2/63:11四、效用函數(shù)—基數(shù)性和序數(shù)性前述定義的效用是一種基數(shù)效用,不僅能夠反映決策者的偏好次序,還能夠反映決策者的偏好強(qiáng)度。但在實際決策中,有時只需要偏好次序而不一定需要知道偏好強(qiáng)度就可以決策。此時只需要序數(shù)效用就可以了。有關(guān)序數(shù)效用的應(yīng)用在多屬性決策中介紹。Hicks對效用函數(shù)的基數(shù)性和序數(shù)性的比喻:如果知道兩個人的身高,那么我們可以把高個兒排在第一位;如果不知道他倆的身高也沒關(guān)系,讓他們比一下就可以了。2023/2/63:11第二節(jié)效用函數(shù)的構(gòu)造一、估計效用函數(shù)值的方法概率當(dāng)量法(VonNeumann,Morgenstern,N-M法):設(shè)決策系統(tǒng)的自然狀態(tài)集Θ={1,…,n}、行動集A={a1,…,am}、后果集C={cij=c(ai,j)},最優(yōu)后果為c*=max{cij},最劣后果為c0=min{cij}。則對于任意后果cij的效用值u(cij),可按以下步驟獲得:設(shè)u(c*)=1,u(c0)=0;建立簡單展望<p,c*;1-p,c0>,p可調(diào)反復(fù)向決策人提問,改變可調(diào)概率p,使得當(dāng)p=pij時得到如下的無差異關(guān)系:cij~<pij,c*;1-pij,c0>測得后果cij的效用值為:

u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij2023/2/63:11確定當(dāng)量法(修正N-M法):設(shè)u(c*)=1,u(c0)=0;建立簡單展望<p,c*;1-p,c0>,p為0-1間的給定值,如p=0.5反復(fù)向決策人提問,改變cij得到如下的無差異關(guān)系:cij~<p,c*;1-p,c0>測得后果cij的效用值為:

u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益當(dāng)量法:已知u(cij)和u(c0),確定u(c*)的方法損失當(dāng)量法:已知u(cij)和u(c*),確定u(c0)的方法2023/2/63:11如何選擇估計方法使用確定當(dāng)量法時決策人對最優(yōu)后果(增益)的保守性和對損失的冒險性都比概率當(dāng)量法嚴(yán)重(Hershey,1982)采用增益當(dāng)量法與損失當(dāng)量法時產(chǎn)生的誤差也比用概率當(dāng)量法大盡可能使用概率當(dāng)量法后果為離散型隨機(jī)變量時,后果集中元素為有限個,構(gòu)造后果集上的效用函數(shù)有兩個方面的內(nèi)容,一是確定各后果之間的優(yōu)先順序,二是確定后果之間的優(yōu)先程度。步驟:二、離散型后果的效用設(shè)定例:看球的效用函數(shù)構(gòu)造(不考慮經(jīng)濟(jì)成本)構(gòu)建問題的決策樹,根據(jù)一般偏好,四種后果的優(yōu)劣是C2>C3>C4>C1;令u(C1)=0,u(C2)=1;詢問1:“下雨看電視轉(zhuǎn)播”的后果與“現(xiàn)場看球”時有多大的概率下雨被淋相當(dāng)?(例如:0.3,則u(C3)=0.7)詢問2:“天晴看電視轉(zhuǎn)播”的后果與“現(xiàn)場看球”時有多大的概率下雨被淋相當(dāng)?(例如:0.6,則u(C4)=0.4)一致性檢驗:用C3,C4加上C1(或C2)進(jìn)行校驗,直至一致性得到滿足。2023/2/63:11現(xiàn)場看球a1電視看球a2C4:天晴看電視C3:下雨沒被淋C2:天晴未被淋C1:下雨被淋三、連續(xù)型后果效用函數(shù)的構(gòu)造若后果是連續(xù)型,則可通過分析u(c)的若干特征值,求出特征點(diǎn)的效用后再連成光滑曲線。例:試作出每天投入學(xué)習(xí)的時間t對應(yīng)的效用曲線。分析特征點(diǎn):u(t=0)=0;u(t>TM)=0(TM=?);狀態(tài)導(dǎo)入期(0~t0),效用增加較慢;狀態(tài)穩(wěn)定期(t0~t1),效用與投入學(xué)習(xí)的時間基本成比例關(guān)系;效率下降,效用增加期(t1~tm),效用是投入學(xué)習(xí)的時間的單調(diào)增函數(shù),但增長率小于狀態(tài)穩(wěn)定期且隨著時間的增加越來越小,最終達(dá)到零(t=tm),此時效用達(dá)到最大;當(dāng)投入的學(xué)習(xí)時間大于tm時,將會得不償失,學(xué)習(xí)效率急劇降低,效用減少。2023/2/63:112023/2/63:11t0t1tmtM024U(t)Umaxt四、效用曲線的解析函數(shù)近似適用于規(guī)范化的效用曲線規(guī)范化的效用函數(shù)是指0≦x≦1,且u(0)=0,u(1)=1的效用函數(shù)冪函數(shù)對數(shù)函數(shù)第三節(jié)風(fēng)險與效用一、風(fēng)險的概念風(fēng)險:遇到破壞或損失的機(jī)會或危險?!帮L(fēng)險”:以打魚捕撈為生的漁民們在長期的捕撈實踐中,深深的體會到“風(fēng)”給他們帶來的無法預(yù)測無法確定的危險,他們認(rèn)識到,在出海捕撈打魚的生活中,“風(fēng)”即意味著“險”,因此有了“風(fēng)險”一詞的由來。風(fēng)險包含兩個方面的內(nèi)容:一是后果的損失嚴(yán)重程度;二是損失出現(xiàn)的可能性大小。參考:/view/156901.htm2023/2/63:112023/2/63:11二、風(fēng)險的度量方差:設(shè)某決策方案a的后果為收益y,y的概率密度函數(shù)為f(y),期望值為E(y),則方差可用來度量風(fēng)險,方差越大風(fēng)險越大。協(xié)方差:若期望收益為決策人設(shè)定的目標(biāo)收益c,則可用協(xié)方差度量風(fēng)險。臨界概率:小于目標(biāo)收益的概率。三、效用包含的內(nèi)容1、對風(fēng)險的一種態(tài)度。2023/2/63:11U(t)Umax=1C(萬元)風(fēng)險厭惡型風(fēng)險中立型風(fēng)險追求型0.50912.51425風(fēng)險酬金k2、對后果的強(qiáng)度偏好3、可測價值函數(shù)四、相對風(fēng)險態(tài)度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論