




已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1 2 第四章決策中的收益 損失與效用 4 1決策問題的三要素 4 2決策準則 4 3先驗期望準則 4 4損失函數 4 5常用損失函數 4 6效用函數 3 4 1決策問題的三要素 決策就是對一件事要作決定 它與推斷的差別在于是否涉及后果 統(tǒng)計學家在作推斷時是按統(tǒng)計理論進行的 很少考慮結論在使用后的損失 可決策者在使用推斷結果時必需與得失聯系在一起 能帶來利潤的就會用 使他遭受損失的就不會被采用 度量得失的尺度就是損失函數 它是著名的統(tǒng)計學家A Wald 1902 1950 在40年代引入的一個概念 從實際歸納出損失函數是決策的關鍵 貝葉斯決策 把損失函數加入貝葉斯推斷就形成貝葉斯決策論 損失函數被稱為貝葉斯統(tǒng)計中的第四種信息 一 決策的基本概念 4 例1設甲乙二人進行一種游戲 甲手中有三張牌 分別標以 乙手中也有三張牌 分別標以 游戲的規(guī)則是雙方各自獨立地出牌 按下表計算甲的得分與乙的得分 甲的得分矩陣 乙的失分矩陣 這是一個典型的雙人博弈 賭博 問題 不少實際問題可歸結為雙人博弈問題 把上例中的乙方改為自然或社會 就形成人與自然 或社會 的博弈問題 5 例2某農作物有兩個品種 產量高但抗旱能力弱的品種和抗旱能力強但產量低的品種 在明年雨量不知的情況下 農民應選播哪個品種可使每畝平均收益最大 這是人與自然界的博弈 以明年600mm雨量為界來區(qū)分雨量充足和雨量不充足 寫出收益矩陣 單位 元 6 例3一位投資者有一筆資金要投資 有以下幾個投資供他選擇 購買股票 根據市場情況 可凈賺5000元 但也可能虧損10000元 存入銀行 不管市場情況如何總可凈賺1000元 這位投資者在與金融市場博弈 未來的金融市場也有二種情況 看漲與看跌 可寫出投資者的收益矩陣 投資者將依據此收益矩陣決定他的資金投向何方 這種人與自然 或社會 的博弈問題稱為決策問題 7 二 決策問題的三要素 1 狀態(tài)集 其中每個元素表示自然界 或社會 可能出現的一種狀態(tài) 所有可能狀態(tài)的全體組成狀態(tài)集 如例2中的兩種狀態(tài) 雨水充足和雨水不充足 2 行動集 其中a表示人對自然界可能采取的一個行動 注意 一般行動集有兩個以上的行動供選擇 若有兩個行動無論對自然界的哪一個狀態(tài)出現 總比收益高 則就沒有存在的必要 可把它從行動集中去掉 使留在行動集中的行動總有可取之處 8 3 收益函數 函數值表示當自然界處于狀態(tài) 而人們選取行動時所得到的收益大小 收益函數的值可正可負 其正表示贏利 負表示虧損 單位常用貨幣單位 收益函數的建立不是件容易的事 要對所研究的問題有全面的了解才能建立起來 P125例4 收益矩陣 9 4 2決策準則 一 行動的容許性二 決策準則1 樂觀準則2 悲觀準則3 折中準則 10 一 行動的容許性 定義 在給定的決策問題中 A中的行動a1稱為是容許的 假如在A中不存在滿足如下兩個條件的行動a2 1 對所有的 有Q a2 Q a1 2 至少有一個 可使上式不等式嚴格成立 假如這樣的a2存在的話 則稱a1是非容許的 假如二個行動a1和a2的收益函數在 上處處相等 則稱行動a1與a2是相等的 11 兩點說明 1 一般情況下 行動集中只存在容許行動 2 上面的討論是對收益函數而言的 但我們還可以對支付函數 或虧損函數 成本函數 進行討論 此時需要支付函數 或虧損函數 成本函數 越少越好 例5 P126 12 13 二 決策準則 1 樂觀準則 1 定義 樂觀準則也稱 好中求好 決策準則 或稱 最大最大 決策準則 這種決策準則就是充分考慮可能出現的最大利益 在各最大利益中選取最大者 將其對應的方案作為最優(yōu)方案 這種決策準則的客觀基礎就是所謂的天時 地利和人和 決策者感到前途樂觀 有信心取得每一決策方案的最佳結果 14 2 樂觀準則決策方法的一般步驟 確定各種可行方案 確定決策問題將面臨的各種自然狀態(tài) 將各種方案在各種自然狀態(tài)下的收益值列于決策矩陣表中 表4 1 求每一方案在各自狀態(tài)下的最大收益值 將其填寫在決策矩陣表的最后一列 取中的最大值 所對應的方案為最佳決策方案 15 樂觀準則 決策矩陣表 表4 1 16 3 樂觀準則 決策方法的應用 假設某一決策問題的決策收益矩陣表如下 按樂觀準則選取最優(yōu)方案 17 假設某一決策問題的決策損失矩陣表如下 按樂觀準則選取最優(yōu)方案 18 2 悲觀準則 1 定義 悲觀準則又稱 小中取大 決策準則或叫 壞中求好 決策準則 這種決策準則的客觀依據是決策的系統(tǒng)功能欠佳 形勢對決策者不利 所以 決策者沒有理由希望獲得最理想的結果 面對這種情況 決策者必須從每一方案的最壞處著想 從每個方案的最壞結果中選擇一個最佳值 即在所有不利的收益中 選取一個收益最大的方案作為最優(yōu)決策方案 19 2 悲觀準則決策方法的一般步驟 若決策矩陣為收益矩陣 則先對每一行動選出最小的收益 再在所有選出的最小收益中選取最大值 此最大值對應的行動就是悲觀準則下的最優(yōu)行動 若決策矩陣為損失矩陣 則先對每一行動選出最大的損失 再在所有選出的最大損失中選取最小值 此最小值對應的行動就是悲觀準則下的最優(yōu)行動 20 3 悲觀準則 決策方法的應用 假設某一決策問題的決策收益矩陣表如下 按悲觀準則選取最優(yōu)方案 21 假設某一決策問題的決策損失矩陣表如下 按悲觀準則選取最優(yōu)方案 22 3 折中準則 1 定義 折中準則又稱 系數決策準則 是對悲觀準則和樂觀準則進行折中的一種決策準則 是一個依決策者認定情況樂觀還是悲觀而定的系數 稱為樂觀系數 若認定情況完全樂觀 則 1 若認定情況完全悲觀 則 0 一般情況下 則0 1 23 2 折中準則的基本步驟 第一步 確定系數 的值 第二步 對每一行動a計算 其中表示行動a的最大收益值 表示行動a的最小收益值 第三步 取行動a0 使H a0 達到最大 即此種a0就是這種準則下的最優(yōu)行動 24 3 折中準則決策方法應用案例 某工廠預備生產一種新型童車 根據市場需求分析和估計 產品銷路可分為三種狀態(tài) 1 銷路好 2 銷路一般 3 銷路差 可供選擇的行動方案也有三種 a1 大批量生產 a2 中批量生產 a3 小批量生產 根據產量多少和銷售情況 工廠的盈利情況也有所不同 可能獲利也可能虧損 將此數值稱為損益值 獲利時稱為收益值 虧損時稱為損失值 用負號表示 現調查得本月的損益值見下表 試用 系數法作出決策 25 新型童車損益值表 26 解 第一步 確定系數 的值 0 6第二步 計算H a H a1 0 6 max 30 23 15 0 4 min 30 23 15 12 萬元 H a2 0 6 max 25 20 0 0 4 min 25 20 0 15 萬元 H a3 0 6 max 12 12 12 0 4 min 12 12 12 12 萬元 第三步 計算收益中的最大者H a0 max 12 15 12 15 萬元 所以最佳方案應為中批量生產 即為a2 27 4 3先驗期望準則 一 先驗期望準則 1 定義 對給定的決策問題 若在狀態(tài)集 上有一個正常的先驗分布 則收益函數Q 對 的期望與方差分別稱為先驗期望收益和收益的先驗方差 使先驗平均收益達到最大的行動a 稱為先驗期望準則下的最優(yōu)行動 若此種最優(yōu)行動不止一個 其中先驗方差達到最小的行動稱為二階矩準則下的最優(yōu)行動 28 幾點說明 1 定義中的先驗分布只能用正常先驗分布 而不能采用廣義先驗分布 2 如果在比較先驗期望收益的大小時 有兩個或兩個以上的行動使先驗期望收益達到最大 這時才需要比較先驗方差的大小做出決策 3 使用合理的先驗信息 按照先驗期望準則和二階矩準則進行決策 所得結果更加可信 29 2 案例分析 例1某廠準備開發(fā)一種新產品 有三種方案供選擇 a1 a2和a3 預計一年后市場對該種產品的需求量可分為較高 一般和較低 且預計一年后市場需求量是高 中 低的主觀概率為 1 0 6 2 0 3 3 0 1 同時算得收益矩陣如下 試用先驗期望準則確定最佳行動方案 30 先驗期望準則和其他準則的關系 31 例2 P125例題4 4 例3一賣花姑娘每天從花市按每棵5元購進 而按每棵10元賣出 當天若賣不完則剩下的花只能當垃圾 問該姑娘每天購進多少花 32 二 兩個性質 定理4 1在先驗分布不變的情況下 收益函數的線性變換不會改變先驗期望準則下的最優(yōu)行動 定理4 2設 1為狀態(tài)集 的一個非空子集 假如在 1上的收益函數Q a 都加上一個常數c 而在 上的先驗分布不變 則在先驗期望準則下的最優(yōu)行動不變 例4 P138例題4 11 33 4 4損失函數 1 損失函數的含義 這里的損失函數不是負的收益 也不是虧損 例如 某商店一個月的經營收益為 1000元 即虧1000元 這是對成本而言 我們不稱為損失 而稱其為虧損 我們講的損失是指 該賺而沒有賺到的錢 例如該商店本可以賺2000元 但由于某種原因虧了1000元 那我們說該商店損失了3000元 用這種觀點認識損失對提高決策意識是有好處的 按上述觀點從收益函數可以很容易獲得損失函數 34 例5某公司購進某種貨物可分大批 中批和小批三種行動 記為 未來市場需求量可分為高 中 低三種狀態(tài) 記為 三個行動在不同市場的利潤如下 這是一個收益矩陣 我們把它改寫成損失矩陣如下 由此可見 決策者在做決策時 要盡量避免大損失 追求小損失甚至無損失 35 2 損失函數 構成決策問題的三要素 由收益函數容易獲得損失函數 例6某公司購進一批貨物投放市場 若購進數量低于市場需求量 每噸可賺15萬元 若購進數量超過市場需求量 超過部分每噸反而要虧35萬元 由此可寫出收益函數 顯然 當購進數量等于市場需求量時 收益達到最大為15 則立即可得損失函數 36 3 損失函數下的悲觀準則 第一步 對每個行動 選出最大損失值 記為 第二步 在所有選出的最大損失中再選出最小者 則滿足 則稱為悲觀準則下的最優(yōu)行動 這是一種保守策略 不求零損失 但愿少損失 37 例7某公司購進某種貨物可分大批 中批和小批三種行動 記為 未來市場需求量可分為高 中 低三種狀態(tài) 記為 三個行動在不同市場的收益矩陣和損失矩陣如下 試比較在Q與L下的最優(yōu)行動 思考 為什么所選行動不一樣 38 例8某股票投資者對金融市場上的兩種資產進行投資 其收益矩陣如Q 請幫助作出合適的決策 按悲觀準則 用Q做決策 按悲觀準則 結果為a2是最佳行動 顯然該決策不好 用L做決策 按悲觀準則 結果為a1 說明這樣一個道理 用損失函數做決策要比用收益函數做決策更合理 P143 39 4 損失函數下的先驗期望準則 1 定義 對給定的決策問題 若在狀態(tài)集 上有一個正常的先驗分布 則損失函數L 對 的期望與方差分別稱為先驗期望損失和損失的先驗方差 使先驗期望損失達到最小的行動a 稱為先驗期望準則下的最優(yōu)行動 若此種最優(yōu)行動不止一個 其中先驗方差達到最小的行動稱為二階矩準則下的最優(yōu)行動 40 注意事項 1 定義中的先驗分布只能用正常先驗分布 而不能采用廣義先驗分布 2 損失的先驗方差有著特別的意義 1 可以作為挑選最優(yōu)行動的標準 在平均先驗損失相等或者相差不大時 2 衡量風險的大小 3 使用合理的先驗信息 按照先驗期望準則和二階矩準則進行決策 所得結果更加可信 41 2 例題 例9若有一決策問題如下 試用損失函數下的先驗期望準則選出最優(yōu)行動 例10P146例題4 18 42 4 5常用損失函數 1 平方損失函數 這是在統(tǒng)計決策中用得最多的損失函數 2 線性損失函數 3 0 1損失函數 4 多元二次損失函數 43 5 二行動線性決策問題的損失函數 定義 若某一決策問題只有兩個行動a1 a2 而在每個行動下的收益函數都是狀態(tài) 連續(xù)或離散 的線性函數 即則稱此決策問題為二行動線性決策問題 下列函數稱為該決策問題對應的損失函數 44 例題11甲乙兩廠生產同一種產品 其質量相同 零售價也相同 現兩廠都在招聘推銷員 但所付報酬不同 甲廠每公斤給報酬3 5元 乙廠每公斤給報酬3元 還另給每天10元的津貼 應聘人如何選擇 收益函數 損失函數 QQ a2 0 0 Q a1 45 4 6效用函數 46 博弈論基本知識 一 太多的疑惑1 為什么腐敗現象這么猖獗 怎樣懲治才有效 2 為什么治理假冒偽劣現象如此困難 3 為什么三個和尚沒水吃 4 為什么長街上的商店常擠在一塊 5 為什么各種考試舞弊屢禁不止 6 老師怎樣促使學生全面復習 7 為什么老年人投保很困難 8 為什么總統(tǒng)競選人總是花很大氣力推出自己的綱領 47 二 什么是博弈論 1 海灘占位問題設較長的海灘上比較均勻地散布著許多日光浴者 太陽的照射使人們需要補充水分 假如有A與B兩個小販來到海灘 以同樣的價格 相同的質量向日光浴者提供同一品牌的礦泉水 或啤酒 問在直線上的海灘上他們如何設置自己的攤位 2 狩獵游戲 兩個獵人圍住了一頭鹿 他們各卡住鹿的可能逃跑的兩個關口中的一個 只要他們齊心協力 鹿就會成為他們的獵物 如果此時周圍跑過一群兔子 兩位獵人中的任何一個只要去抓兔子一定會獲得成功 他會抓到一只兔子 但鹿卻從他把守的關口逃跑 現在他們必須同時作出決定 是獵鹿還是抓兔子 48 以上兩例的共同特點 1 每個游戲常有兩個以上的參與者 他們在游戲中都有著自己的切身利益 今后我們稱他們?yōu)榫种腥?2 每個局中人都有著自己的可行行動集供自己選擇 這種選擇毫無疑問地會影響到其他局中人的切身利益 3 游戲中的各個局中人理性地采取或選擇自己的策略行為 使得在這種相互制約 相互影響的依存關系中 盡可能地提高自己的利益所得 這正是游戲理論的關鍵所在 博弈 一些個人 隊組或其他組織 面對一定的環(huán)境條件 在一定的規(guī)則下 同時或先后 一次或多次 從各自允許的行為或策略中進行選擇并加以實施 各自取得相應結果的過程 博弈論 英文為gametheory 是系統(tǒng)研究各種博弈問題 尋求博弈方合理的策略和合理選擇策略時博弈的結果 并分析結果的經濟 效率意義的理論和方法 49 三 博弈的分類 1 博弈的三要素 1 局中人 2 局中人的策略空間 3 每個局中人的盈利函數 2 博弈論的基本概念 局中人 行動 信息 戰(zhàn)略 支付函數 結果 均衡 50 局中人 指的是博弈中選擇行動以最大化自己效用的決策主體 行動 是局中人的決策變量 信息 指局中人在博弈中的知識 戰(zhàn)略 是局中人選擇行動的規(guī)則 它告訴局中人在什么時候選擇什么行動 支付函數 是局中人從博弈中獲得的效用水平 它是所有局中人戰(zhàn)略或行動的函數 是每個局中人真正關心的東西 結果 是博弈分析者感興趣的要素組合 均衡 是所有局中人的最優(yōu)戰(zhàn)略或行動的組合 51 3 博弈的分類 從兩個不同的角度進行劃分 1 從信息 指對其他局中人的特征 戰(zhàn)略空間及支付函數的知識 的角度 分為完全信息博弈與不完全信息博弈 2 從局中人行動的先后次序 分為靜態(tài)博弈和動態(tài)博弈 按以上兩種進行交叉組合共有4種情形 完全信息靜態(tài)博弈 完全信息動態(tài)博弈 不完全信息靜態(tài)博弈 不完全信息動態(tài)博弈 52 靜態(tài)博弈 是指博弈中 局中人同時選擇行動或雖非同時但后行動者并不知道先行動者采取了什么具體行動 動態(tài)博弈 指的是局中人的行動有先后順序 且后行動者能夠觀察到先行動者所選擇的行動 53 博弈的分類及對應的均衡概念 54 四 博弈論的基本模型及應用 1 囚徒困境模型 prisoner sdilemma 應用 兩個寡頭企業(yè)選擇產量的博弈 公共產品的供給 軍備競賽 經濟改革2 智豬博弈模型 boxedpigs 應用 股東監(jiān)督經理 股票市場上的小戶跟大戶 小企業(yè)模仿大企業(yè)等3 性別戰(zhàn) battleofthesexes 4 斗雞博弈 chickengame 55 1 囚徒困境模型 prisoner sdilemma 兩個嫌疑犯作案后被警察抓住 被分別關在不同的房間里審訊 警察知道兩人有罪 但缺乏足夠的證據定罪 除非兩人當中至少有一人坦白 警察告訴他們 如果兩人都不承認 每人判刑一年 如果兩人都坦白 各判刑8年 如果兩人中一人坦白一人抵賴 坦白的無罪釋放 抵賴的判刑15年 問兩個囚徒各自的最優(yōu)策略是什么 56 1 結果的解釋 坦白 坦白 均衡但不有效 抵賴 抵賴 有效但不均衡 2 模型反映的深刻問題 個人理性與團體理性的矛盾 3 模型的應用 兩個寡頭企業(yè)選擇產量的博弈 公共產品的供給 軍備競賽 經濟改革等 57 2 智豬博弈模型 boxedpigs 大豬與小豬喂養(yǎng)在同一個豬圈中 豬圈的一頭安裝有一杠桿 只要一踩杠桿 豬圈的另一頭固有的食物槽里將會流出飼料 踩杠桿需要花費能量 相當于消耗2份飼料 大小豬都不踩的話 他們雖然不耗費熱量但吃不到任何東西 設食物槽內一次流出的飼料共有10份 如果小豬踩杠桿 等它跑到食物槽跟前時 將發(fā)現不勞而獲的大豬已經吃了8份飼料 小豬只能分享2份飼料 而若大豬踩杠桿后再跑到食物槽跟
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安醫(yī)學高等??茖W校《汽車文化》2023-2024學年第二學期期末試卷
- 廣州鐵路職業(yè)技術學院《語言學導論》2023-2024學年第二學期期末試卷
- 陜西電子信息職業(yè)技術學院《新媒體概論》2023-2024學年第二學期期末試卷
- 濰坊環(huán)境工程職業(yè)學院《圖片攝影創(chuàng)作》2023-2024學年第二學期期末試卷
- 安全教育快樂廚房
- 2024年攝影燈泡項目資金籌措計劃書代可行性研究報告
- 危險品管理培訓
- 沙金獎牌設計軟件介紹
- 2025年福建泉州經濟技術開發(fā)區(qū)市政服務有限公司招聘筆試參考題庫含答案解析
- 2025年黑龍江哈電集團哈爾濱電機廠有限責任公司招聘筆試參考題庫含答案解析
- 中國特色社會主義期中測試題-2023-2024學年中職高教版
- 學習康復科常見物理治療法課件
- 蘆丁雞怎么養(yǎng)
- 幽門螺桿菌預防措施及治療
- 2024年浙江首考高考英語卷試題真題及答案解析(含聽力原文+作文范文)
- 無人機測試與評估標準
- MOOC 單片機原理與應用-北京交通大學 中國大學慕課答案
- 2018年10月自考00372公安信息學試題及答案含解析
- 煙草行業(yè)安全風險分級管控和事故隱患排查治理雙重預防機制
- 師承指導老師學術思想
- 2016-2023年西安職業(yè)技術學院高職單招(英語/數學/語文)筆試歷年考點試題甄選合集含答案解析
評論
0/150
提交評論