決策理論與方法第三章效用函數(shù)

上傳人：9*** IP屬地：湖北上傳時間：2023-02-06 格式：PPTX 頁數(shù)：28 大?。?69.74KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章效用函數(shù)

第一節(jié)效用的定義和公理系統(tǒng)一、引言·為什么要引入效用

決策問題的特點(diǎn)：自然狀態(tài)不確定——以概率表示；

后果價值待定：以效用度量。1.無形后果，非數(shù)字量(如信譽(yù)、威信、出門帶傘問題的后果)需以數(shù)值度量；2.即使是數(shù)值量(例如貨幣)表示的后果，其價值仍有待確定，后果的價值因人而異。例一：同是100元錢，對窮人和百萬富翁的價值絕然不同；對同一個人，身無分文時的100元，與已有10000元再增加100元的作用不同，這是錢的邊際價值問題。例2：2023/2/63:11禮品a1抽獎a21.00.50.510萬元25萬元0元在各類決策中，常常面臨著這種選擇：風(fēng)險小但期望收益也??；期望收益大但風(fēng)險也大！不同的決策人有不同的選擇，相同的決策人在不同的情境下選擇也不同。那么在決策中如何描述或表達(dá)后果對決策人的實際價值，以便反映決策人心目中對各種后果的偏好次序呢？*偏好次序是決策人的個性與價值觀的反映，與決策人所處的社會、經(jīng)濟(jì)地位，文化素養(yǎng)，心理和生理(身體)狀態(tài)有關(guān)。*除風(fēng)險偏好之外，還有時間偏好。

而效用(Utility)就是偏好的量化，是數(shù)(實值函數(shù)).DanielBernoulli在1738年指出：

若一個人面臨從給定行動集(風(fēng)險性展望集)中作選擇的決策問題，如果他知道與給定行動有關(guān)的將來的自然狀態(tài)，且這些狀態(tài)出現(xiàn)的概率已知或可以估計，則他應(yīng)選擇對各種可能后果的偏好的期望值最高的行動。決策的目標(biāo)就是使期望效用極大化。二、效用基本概念及符號嚴(yán)格序>：a>b表示a優(yōu)于b。滿足傳遞性和非對稱性。無差異~：a~b表示a與b無差異。滿足自反性、對稱性和傳遞性。弱序≥：a≥b表示a不劣于b。滿足可比性、傳遞性、與無差異~的一致性和嚴(yán)格優(yōu)于的一致性。展望(prospect)（可能的前景）：各種后果(r種)及后果出現(xiàn)的概率的組合，記為：Pj=<p1(j),c1;p2(j),c2;…;pr(j),cr>，(j=1,2,…,m;m為行動的可能種數(shù))2023/2/63:11復(fù)合展望：當(dāng)無法確定采取某個行動時，可隨機(jī)選擇一種行動，設(shè)選擇行動aj的概率為qj。則決策的展望就是一種復(fù)合展望，記為P=<q1,P1;q2,P2;…;qm,Pm>。所有展望（包括簡單展望和復(fù)合展望）構(gòu)成展望空間。2023/2/63:11抽獎(lottery)與確定當(dāng)量

若

(

;

)則稱確定性后果

為抽獎的確定當(dāng)量效用的定義若展望空間上的實值函數(shù)u對于展望空間P的任意兩個展望P1、P2，有P1≥P2

當(dāng)且僅當(dāng)

u(P1)≥u(P2)，則稱u為效用函數(shù)三、效用存在性公理（理性行為公理）連通性：任意兩個展望的優(yōu)劣都是可比的傳遞性：展望的優(yōu)劣滿足傳遞性復(fù)合保序性：展望的優(yōu)劣關(guān)系是可以復(fù)合的，且復(fù)合不會破壞原有的優(yōu)劣關(guān)系偏好的有界性：展望的優(yōu)劣是相對的，沒有無限優(yōu)的展望，也不存在無限劣的展望。理性行為公理認(rèn)為合乎理性的決策人在進(jìn)行價值判斷時一定能滿足這些公理。（實際決策中是否存在某種悖論呢？）2023/2/63:11Allais悖論2023/2/63:11抽獎a1抽獎a21.00.890.0150萬元50萬元0元0.10250萬元抽獎a1抽獎a21.00.890.0150萬元50萬元0元0.10250萬元決策A決策A抽獎b1抽獎b20.110.9050萬元0元0.10250萬元決策B實際上決策B是在決策A的基礎(chǔ)上同時減去了89%的機(jī)會獲得50萬元，復(fù)合保序性沒有得到滿足0萬元0.89效用的公理化定義：在上述公理系統(tǒng)中，若展望空間上存在實值函數(shù)u，有：對展望空間中的任意展望P1、P2，P1>P2

當(dāng)且僅當(dāng)

u(P1)>u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(復(fù)合展望的效用等于展望效用的復(fù)合)對滿足上述條件的實值函數(shù)u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1，b>0。（任意兩個決策人的效用是線性相關(guān)的）則效用函數(shù)u（P）為（基數(shù)）效用函數(shù)2023/2/63:11四、效用函數(shù)—基數(shù)性和序數(shù)性前述定義的效用是一種基數(shù)效用，不僅能夠反映決策者的偏好次序，還能夠反映決策者的偏好強(qiáng)度。但在實際決策中，有時只需要偏好次序而不一定需要知道偏好強(qiáng)度就可以決策。此時只需要序數(shù)效用就可以了。有關(guān)序數(shù)效用的應(yīng)用在多屬性決策中介紹。Hicks對效用函數(shù)的基數(shù)性和序數(shù)性的比喻：如果知道兩個人的身高，那么我們可以把高個兒排在第一位；如果不知道他倆的身高也沒關(guān)系，讓他們比一下就可以了。2023/2/63:11第二節(jié)效用函數(shù)的構(gòu)造一、估計效用函數(shù)值的方法概率當(dāng)量法(VonNeumann,Morgenstern，N-M法)：設(shè)決策系統(tǒng)的自然狀態(tài)集Θ={1,…,n}、行動集A={a1,…,am}、后果集C={cij=c(ai,j)}，最優(yōu)后果為c*=max{cij}，最劣后果為c0=min{cij}。則對于任意后果cij的效用值u(cij)，可按以下步驟獲得：設(shè)u(c*)=1,u(c0)=0；建立簡單展望<p,c*;1-p,c0>，p可調(diào)反復(fù)向決策人提問，改變可調(diào)概率p，使得當(dāng)p=pij時得到如下的無差異關(guān)系：cij~<pij,c*;1-pij,c0>測得后果cij的效用值為：

u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij2023/2/63:11確定當(dāng)量法（修正N-M法）：設(shè)u(c*)=1,u(c0)=0；建立簡單展望<p,c*;1-p,c0>，p為0-1間的給定值，如p=0.5反復(fù)向決策人提問，改變cij得到如下的無差異關(guān)系：cij~<p,c*;1-p,c0>測得后果cij的效用值為：

u(cij)=p*u(c*)+(1-p)*u(c0)=pij增益當(dāng)量法：已知u(cij)和u(c0)，確定u(c*)的方法損失當(dāng)量法：已知u(cij)和u(c*)，確定u(c0)的方法2023/2/63:11如何選擇估計方法使用確定當(dāng)量法時決策人對最優(yōu)后果（增益）的保守性和對損失的冒險性都比概率當(dāng)量法嚴(yán)重（Hershey,1982）采用增益當(dāng)量法與損失當(dāng)量法時產(chǎn)生的誤差也比用概率當(dāng)量法大盡可能使用概率當(dāng)量法后果為離散型隨機(jī)變量時，后果集中元素為有限個，構(gòu)造后果集上的效用函數(shù)有兩個方面的內(nèi)容，一是確定各后果之間的優(yōu)先順序，二是確定后果之間的優(yōu)先程度。步驟：二、離散型后果的效用設(shè)定例：看球的效用函數(shù)構(gòu)造（不考慮經(jīng)濟(jì)成本）構(gòu)建問題的決策樹，根據(jù)一般偏好，四種后果的優(yōu)劣是C2>C3>C4>C1；令u(C1)=0,u(C2)=1；詢問1：“下雨看電視轉(zhuǎn)播”的后果與“現(xiàn)場看球”時有多大的概率下雨被淋相當(dāng)？(例如：0.3，則u(C3)=0.7)詢問2：“天晴看電視轉(zhuǎn)播”的后果與“現(xiàn)場看球”時有多大的概率下雨被淋相當(dāng)？(例如：0.6，則u(C4)=0.4)一致性檢驗：用C3，C4加上C1(或C2)進(jìn)行校驗，直至一致性得到滿足。2023/2/63:11現(xiàn)場看球a1電視看球a2C4:天晴看電視C3:下雨沒被淋C2:天晴未被淋C1:下雨被淋三、連續(xù)型后果效用函數(shù)的構(gòu)造若后果是連續(xù)型，則可通過分析u(c)的若干特征值，求出特征點(diǎn)的效用后再連成光滑曲線。例：試作出每天投入學(xué)習(xí)的時間t對應(yīng)的效用曲線。分析特征點(diǎn)：u(t=0)=0;u(t>TM)=0(TM=?)；狀態(tài)導(dǎo)入期（0～t0），效用增加較慢；狀態(tài)穩(wěn)定期(t0～t1)，效用與投入學(xué)習(xí)的時間基本成比例關(guān)系；效率下降，效用增加期(t1~tm)，效用是投入學(xué)習(xí)的時間的單調(diào)增函數(shù)，但增長率小于狀態(tài)穩(wěn)定期且隨著時間的增加越來越小，最終達(dá)到零(t=tm)，此時效用達(dá)到最大；當(dāng)投入的學(xué)習(xí)時間大于tm時，將會得不償失，學(xué)習(xí)效率急劇降低，效用減少。2023/2/63:112023/2/63:11t0t1tmtM024U(t)Umaxt四、效用曲線的解析函數(shù)近似適用于規(guī)范化的效用曲線規(guī)范化的效用函數(shù)是指0≦x≦1，且u(0)=0，u(1)=1的效用函數(shù)冪函數(shù)對數(shù)函數(shù)第三節(jié)風(fēng)險與效用一、風(fēng)險的概念風(fēng)險：遇到破壞或損失的機(jī)會或危險?！帮L(fēng)險”：以打魚捕撈為生的漁民們在長期的捕撈實踐中，深深的體會到“風(fēng)”給他們帶來的無法預(yù)測無法確定的危險，他們認(rèn)識到，在出海捕撈打魚的生活中，“風(fēng)”即意味著“險”，因此有了“風(fēng)險”一詞的由來。風(fēng)險包含兩個方面的內(nèi)容：一是后果的損失嚴(yán)重程度；二是損失出現(xiàn)的可能性大小。參考：/view/156901.htm2023/2/63:112023/2/63:11二、風(fēng)險的度量方差：設(shè)某決策方案a的后果為收益y，y的概率密度函數(shù)為f(y)，期望值為E(y)，則方差可用來度量風(fēng)險，方差越大風(fēng)險越大。協(xié)方差：若期望收益為決策人設(shè)定的目標(biāo)收益c，則可用協(xié)方差度量風(fēng)險。臨界概率：小于目標(biāo)收益的概率。三、效用包含的內(nèi)容1、對風(fēng)險的一種態(tài)度。2023/2/63:11U(t)Umax=1C(萬元)風(fēng)險厭惡型風(fēng)險中立型風(fēng)險追求型0.50912.51425風(fēng)險酬金k2、對后果的強(qiáng)度偏好3、可測價值函數(shù)四、相對風(fēng)險態(tài)度

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

決策理論與方法第三章效用函數(shù)

文檔簡介

溫馨提示

最新文檔

評論

決策理論與方法第三章 效用函數(shù)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

決策理論與方法第三章效用函數(shù)