博弈論與領導干部決策思維(ppt 131頁).ppt_第1頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第2頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第3頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第4頁
博弈論與領導干部決策思維(ppt 131頁).ppt_第5頁
已閱讀5頁,還剩125頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

張?zhí)┏?博弈論與領導干部決策思維 引言 20世紀90年代至2003年 諾貝爾經(jīng)濟學獎三次 1994 1996 2001 授予了與博弈論相關的研究領域 總共有八位經(jīng)濟學家獲獎 是獲獎人數(shù)最多的領域 排在第二位的是金融 博弈論研究的最大特點一般決策研究 數(shù)學表達 Y f x1 x2 xn 博弈論的決策研究 數(shù)學表達 Y f x1 x2 xn z z為他人行為 特點 決策者目標函數(shù)的自變量中包含他人行為 嚴格地講 博弈論是一種方法 應用范圍不僅包括經(jīng)濟學 政治學 軍事 外交 國際關系 公共選擇 還有犯罪學 都涉及到博弈論 實際上 不少人把博弈論看成是數(shù)學的一個分支 納什1951年的奠基性文章就是發(fā)表在數(shù)學雜志上 夏普里1953年的文章本身也是一篇數(shù)學手稿 一 博弈論基礎知識 1 博弈論的基本概念 博弈論 譯自英文 GameTheory 直譯 游戲理論 游戲有下列特征 1 都有規(guī)則 2 都有結(jié)果 贏 輸 平 結(jié)果能折算成數(shù)值 3 都有策略或者說計謀 選擇不同的策略或計謀往往帶來不同的結(jié)果 4 策略和利益有相互依存性 即每一個游戲者所得結(jié)果的好壞 不僅取決于自身的策略選擇 也取決于其他參加者的策略選擇 策略本身常常沒有絕對的好壞之分 只有相對于他方策略的相對好壞 博弈論也稱為 對策論 其實并不是很恰當 因為 對策 在實際中常被用來表示具體的針對性反應方案 或站在某個決策方的立場上找針對其他方的對策 博弈論所研究的決策問題卻是有開始 有次序 有結(jié)果的整個過程 博弈 的通俗含意不過是弈棋 賭勝 但由于它是帶有文言性質(zhì)的詞 因而顯得學術味濃一些 既能反映這門學科的特點和實質(zhì) 又給人一種高深莫測的感覺 博弈的簡明定義 博弈即一些個人或其他組織 面對一定的環(huán)境條件 在一定的規(guī)則下 同時或先后 一次或多次 從各自允許選擇的行為或策略中進行選擇并加以實施 各自取得相應結(jié)果的過程 博弈論 是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題 博弈論研究的對象是理性的參與者如何選擇策略或如何作出行動的決定 使自己的目標最大化 2 構(gòu)成一個博弈的基本要素 博弈的七要素參與人 行動 信息 戰(zhàn)略 支付函數(shù) 結(jié)果 均衡 參與人是博弈中選擇行動以最大化自己效用的決策主體 可以是個人 團體等 行動是參與人的決策變量 戰(zhàn)略是參與人選擇行動的規(guī)則 它告訴參與人在什么時候選擇什么行動 信息指的是參與人在博弈中的知識 特別是有關其他參與人 對手 的特征和行動的知識 支付函數(shù)是參與人從博弈中獲得的效用水平 是每個參與人真正關心的東西 結(jié)果是指博弈分析者感興趣的要素的集合 均衡是所有參與人的最優(yōu)戰(zhàn)略或行動的組合 博弈的三要素1 博弈的參加者2 博弈方各自可選擇的全部策略或行動的集合3 博弈方的得益 3 博弈的表述形式 1 標準形式 策略形式 守城 棄城 攻城 退兵 諸葛亮 司馬懿 華容道 大路 華容道 大路 諸葛亮 曹操 2 擴展形式 博弈樹 3 聯(lián)盟形式 特殊函數(shù)形式 4 博弈的類別 博弈分類可依不同的判據(jù)進行 博弈人數(shù) 單人博弈 兩人博弈 多人博弈 策略的數(shù)量 有限博弈 無限博弈 得益情況 零和博弈 常和博弈 變和博弈 博弈過程 靜態(tài)博弈 動態(tài)博弈 重復博弈 信息結(jié)構(gòu) 完全信息博弈 靜 動態(tài) 不完全信息博弈 靜 動態(tài) 完美信息動態(tài)博弈 不完美信息動態(tài)博弈 博弈方的理性和行為邏輯 完全理性博弈 有限理性博弈 合作博弈 非合作博弈 常見的博弈分類 從這個角度 博弈可以分為靜態(tài)博弈和動態(tài)博弈 靜態(tài)博弈指的是博弈參與人同時行動 或雖非同時但后行動者不知道前行動者采取了什么具體行動 動態(tài)博弈指的是參與人的行動有先后順序 且后行動者能觀察到先行動者所選擇的行動 1 參與人行動的先后順序 2 參與人的信息 從這個角度 博弈可以分為完全信息博弈和不完全信息博弈 完全信息指的是每一個參與人對所有其他參與人 對手 的特征 戰(zhàn)略空間及支付函數(shù)有準確的知識 否則 就是不完全信息 將上述兩個角度的劃分結(jié)合起來 共有四種不同類型的博弈 即 完全信息靜態(tài)博弈 完全信息動態(tài)博弈 不完全信息靜態(tài)博弈 不完全信息動態(tài)博弈 博弈的分類表 二 博弈論中的經(jīng)典分析及啟示 1 囚徒困境 囚徒困境 博弈是1950年圖克 Tucker 提出的 它非常簡單 卻反映了博弈的根本特征 是闡釋眾多經(jīng)濟社會問題的經(jīng)典范式 警察抓住兩個罪犯 分別關押 并與罪犯講清 如果一人坦白 一人抗拒 坦白者立即釋放 抗拒者判刑8年 若兩人都坦白 按律從輕各判5年 罪犯知道 他們?nèi)艨咕?警察掌握的證據(jù)只能各判1年 最后的結(jié)果會怎樣 乙 抗拒 坦白 甲 抗拒 坦白 博弈 完全信息 分析方法 上策均衡 嚴格下策反復消去法 畫線法 箭頭法等 乙 抗拒 坦白 甲 抗拒 坦白 此博弈的 均衡 為 坦白 坦白 該均衡就是大名鼎鼎的 納什均衡 納什均衡 在對方策略確定的情況下 每個參與者的策略都是最好的 沒有人愿意先改變自己的策略 假如博弈中的所有參與人事先達成一項協(xié)議 這個協(xié)議是否可以自動實施 若當事人都會自覺遵守這個協(xié)議 這個協(xié)議就構(gòu)成納什均衡 沒有人有積極性偏離協(xié)議 換句話說 如果一個協(xié)議不構(gòu)成納什均衡 它就不可能自動實施 因為至少有一個參與人會違背這個協(xié)議 結(jié)論 一種制度安排要生效 必須是納什均衡 不滿足納什均衡要求的制度沒有意義 類似囚徒困境應試教育公共產(chǎn)品供給不足 修路 公寓樓道的路燈 卡特爾的內(nèi)在不穩(wěn)定性產(chǎn)量限制 價格限制 商業(yè)誠信 此博弈的納什均衡為 3 3 乙誠信欺詐 誠信甲欺詐 交通規(guī)則 乙守規(guī)違規(guī) 守規(guī)甲違規(guī) 啟示 個人理性與集體理性的矛盾 冤假錯案是怎樣產(chǎn)生的 個人的最優(yōu)決策不一定帶來集體的最優(yōu)結(jié)果 集體的最優(yōu)結(jié)果未必來源于個人的最優(yōu)決策 領導的政績 改變博弈結(jié)果的根本方法是改變博弈的支付矩陣 囚徒困境的解脫 有這樣一個博弈 此時 兩者的納什均衡為 不合作 不合作 獎勵 假如對采取 合作 策略的博弈方獎勵3 獎勵矩陣為 最終結(jié)果為上述兩個矩陣相加 博弈的納什均衡為 合作 合作 解開了囚徒困境 懲罰 思拉恩 埃格特森在 新制度經(jīng)濟學 中舉的例子 非洲努埃爾人部落間有兩個大家庭X Y 每家擁有同樣的武力潛能和侵犯傾向 每家擁有相當于10頭牛的財產(chǎn) 每家都擁有兩種策略 侵犯對方 不侵犯對方 博弈表述為 納什均衡為 侵犯 侵犯 雙方的收益為 4 4 通過聯(lián)姻 努埃爾人引入了一個懲罰矩陣 由于親戚關系 侵犯者遭受成本 包括心理成本 的損失 此時 X Y就由非合作均衡變?yōu)楹献骶?上述方陣變?yōu)?2 賭勝博弈 賭勝博弈屬于 零和博弈 的范疇 是具有某種對稱性的零和博弈 猜硬幣博弈 正面反面 拋硬幣方 正面反面 猜硬幣方 石頭 剪子 布博弈 石頭剪子布 博弈方1 石頭剪子布 博弈方2 齊威王 田忌賽馬 齊威王 上中下 田忌 上下中 中上下 中下上 下上中 下中上 上中下 下中上 上下中 中上下 中下上 下上中 以上三個博弈是零和博弈 沒有純策略納什均衡 純策略 單一的確定的策略 石頭剪子布 博弈方1 石頭剪子布 博弈方2 取勝原則 保密 不泄漏自己的策略 避免自己的決策有傾向性 讓對方琢磨不透 混合策略 以一定的概率分布在備選策略中隨機選取 啟示 當博弈是零和博弈時 只有混合策略均衡 什么樣的決策是科學決策 隨機決策 當面對零和博弈時 科學嗎 3 警衛(wèi)與小偷 案例1兩地巡邏 警衛(wèi)負責A B兩地保安 A地財產(chǎn)2萬元 B地1萬元 警衛(wèi)一次只能在一個地方巡邏 小偷一次也只能去一個地方 警衛(wèi)在某地巡邏 小偷也去了該地 便不會失竊 小偷去了警衛(wèi)沒去的地方 則偷盜成功 警衛(wèi)怎么巡邏效果最好 巡邏A地 巡邏B地 盜竊A地 盜竊B地 警衛(wèi) 小偷 這個博弈是零和博弈 沒有純策略納什均衡點 但有混合策略均衡點 當警衛(wèi)去A地巡邏時 小偷有的機會去A地 的機會去B地 此時 A的得益為 3 2 萬元 當警衛(wèi)去B地時 同樣小偷有的機會去A地 的機會去B地 此時 B的得益為 1 3 萬元 警衛(wèi)總的得益為 萬元 同理 我們可得小偷的總的得益為萬元 警衛(wèi)的最優(yōu)策略是 擲骰子決定去A地還是B地巡邏 擲l 4點去A地 擲5 6兩點去B地 這樣警衛(wèi)有2 3的機會去A地 1 3的機會去B地 警衛(wèi)的期望得益是 7 3大于2 小偷的最優(yōu)策略是 同樣擲骰子決定去A地還是B地偷盜 擲到1 4點去B地 擲5 6兩點去A地 即小偷有l(wèi) 3的機會去A地 2 3的機會去B地 期望收益為2 3萬元 啟示 當博弈是零和博弈時 即一方所得是另外一方的所失時 只有混合策略均衡 博弈方的策略應當是隨機的 不能讓對方知道自己的策略 哪怕是 傾向性 的策略 如果對方知道你出其中一個策略的 可能性 大 你失敗的可能性就大 案例2小偷和守衛(wèi) 此案例為塞爾頓 1994年諾貝爾經(jīng)濟學獎得主 1996年3月在上海講演中舉的例子 有一倉庫 小偷行竊時守衛(wèi)睡覺 可獲價值V的財物 小偷行竊時守衛(wèi)沒睡覺 則被抓 被抓后要坐牢 效用為 P 守衛(wèi)睡覺而未遭偷竊有S的效用 因睡覺被竊遭解雇 得益為 D 小偷不偷 守衛(wèi)無得也無失 守衛(wèi)不睡 出一份力掙一份錢 也無得失 小偷 不偷 偷 守衛(wèi) 睡 不睡 分析 這個博弈不存在純策略納什均衡 小偷的策略 D Pt Pt S 0 守衛(wèi)得益 睡 小偷偷的概率 1 小偷有 偷 與 不偷 兩種策略 圖中橫軸表示小偷選擇 偷 的概率Pt 不偷 的概率等于1 Pt 守衛(wèi)的策略 P Pg Pg S 0 小偷得益 偷 守衛(wèi)睡的概率 1 V 守衛(wèi)有 睡 與 不睡 的策略 其概率分布也可用圖表示 激勵悖論 政策目標和政策結(jié)果的意外關系 P Pg Pg S 0 小偷得益 偷 守衛(wèi)睡的概率 1 V Pg P 加重對小偷的懲罰 相當于 P向下移動到 P 短期內(nèi)小偷會停止 偷 竊 但長期中 小偷減少 偷 竊會使守衛(wèi)更多地選擇 睡 覺 加重對小偷懲罰的主要作用是守衛(wèi)可以更多地偷懶 D Pt Pt S 0 守衛(wèi)得益 睡 小偷偷的概率 1 Pt D 加重對失職守衛(wèi)的處罰 意味著D增大到D 短期效果是守衛(wèi)更加盡職 長期中的真正作用 恰恰是會降低盜竊發(fā)生的概率 啟示 怎樣避免激勵悖論 4 情侶博弈 性別戰(zhàn) 一對情侶 男的愛看足球 女的愛看芭蕾 都愿共度周末 其博弈表述為 有兩個納什均衡 足球 足球 芭蕾 芭蕾 究竟哪一個會發(fā)生 不知道 男 足球 芭蕾 足球 芭蕾 女 啟示 先動優(yōu)勢 后動優(yōu)勢 甲有先動優(yōu)勢 先選B策略 穩(wěn)得10 乙有后動優(yōu)勢 最好讓A先選 樂得100 甲 A B C D 乙 斗雞博弈 兩只斗雞相遇 或進或退 雙方都前進 兩敗俱傷 一方前進 一方后退 前進者勝利 后退者丟面子 都后退 都丟面子 博弈表述為 雞甲 前進 后退 前進 后退 雞乙 此博弈有兩個納什均衡 一方前進 一方后退 結(jié)果無法預測 例子 20世紀60年代的古巴導彈危機夫妻矛盾 5 智豬博弈 豬圈里有一大一小兩頭豬 食槽在一頭 按鈕在另一頭 按一次有10個單位食品進入食槽 但按者要支付2個單位 若同時按 同時跑向食槽 各支付2個單位 大豬吃7個單位 小豬吃3個單位 大豬按 小豬坐吃 大豬吃6個單位 支付2個單位 小豬吃4個單位 小豬按 大豬坐吃 大豬吃9 小豬吃1 支付2個單位 都坐等 都沒吃 小豬 等 按 大豬 等 按 智豬博弈 扣除支付 此博弈的納什均衡 大豬按 小豬坐吃 4 4 啟示 多勞并不多得 要推動工作 就要想辦法找到 大豬 若你是 大豬 做了好不僅不要想得好 還要能受委屈 大德無名 6 海灘占位博弈 霍特林模型 有一海灘日光浴場 均勻地散布著許多日光浴者 有A與B兩個小販 以同樣的價格 質(zhì)量向日光浴者提供同一品牌的礦泉水 在直線狀的海灘上他們會如何選擇自己的攤位點呢 海灘占位 設海灘的長度為l 圖中 0 1 線段表示海灘 號代表日光浴者 由于日光浴者總是到距自己最近的攤位購買礦泉水 理想的攤位點如下 A在1 4處 B在3 4處 這樣既方便了日光浴者 A B兩人又平分市場 可謂皆大歡喜 然而 理性的小販A會想 如果我將攤位往B那兒挪動至A 位置 那么從0至A 范圍內(nèi)的人顯然是我的顧客 而A 與B之間的中點將從原來的1 2處移至1 2右邊的C處 從A 至C范圍內(nèi)的人也將成為我的顧客 即從B那兒 奪 走了一部分生意 這當然是個好主意 B也是一個理性的商人 A的想法也是B想法 0 1 A B A C 雙方 斗智斗勇 博弈 的結(jié)果 A B的攤位都定在海灘中點 1 2處 相安無事地做買賣 西方大國為什么都是兩黨政治 為什么第三個政黨難成氣候 兩黨政治的穩(wěn)定性和欺騙性 西方兩黨政治的博弈論解讀 保守黨 7 先來后到博弈 廠商A先占領了一個容量有限的市場 廠商B也想進入該市場 廠商B知道一旦自己進入 廠商A可能采取降價等競爭手段打擊他 如果廠商A采取打擊行動 廠商B肯定會虧損 那么 廠商B要不要進入這個市場 如果廠商B真的進入 廠商A是否真會打擊 先來后到博弈 完全信息 分析 假設A獨占市場時利潤為10 與B分享市場則各得5 如B進入市場A打擊 則B虧損2 A的利潤降為3 我們可以用擴展形表示該動態(tài)博弈 高成本 低成本 在位者的類型有高成本 低成本之分 高成本的最優(yōu)策略是默許 低成本則是打擊 在位者知道自己的真實類型 進入者雖不知在位者的真實類型 但知道各種可能類型的概率分布 設 高成本的可能性為x 低成本的可能性則為 1 X 進入者不進入的期望利潤為0 進入的期望利潤為 4x 1 1 x 即 x 0 2時 進入的期望利潤大于不進入的期望利潤 先來后到博弈 不完全信息 啟示 怎樣的威脅和承諾是可信的 言語博弈 信號博弈 高等教育的功能 8 求愛博弈 有人向你求愛 接受還是拒絕 若求愛者品德優(yōu)良 你接受 若求愛者品德惡劣 則拒絕 但你并不準確知道求愛者的品德 你接受與否就取決于你對求愛者品德類型的概率判斷 即你在多大程度上相信他是一個品德優(yōu)良的人 求愛博弈 品德優(yōu)良 求愛者 求愛 不求愛 接受 拒絕 你 求愛博弈 品德惡劣 求愛者 求愛 不求愛 接受 拒絕 你 假如你認為求愛者品德優(yōu)良的概率為X 不接受求愛的期望效用為0 接受則為100X 100 1 X 解之 當X 1 2時 接受求愛 啟示 信息不完全帶來決策風險 諸葛亮和司馬懿相互知道類型 公共知識 空城計 9 財產(chǎn)分配博弈 你的權(quán)力有多大 權(quán)力指數(shù) 有A B C三人委員會 A有兩票 B C各一票 表決采取 多數(shù) 原則 一項議案獲得3票及3票以上則通過 他們各自的權(quán)力有多大 權(quán)力是什么 決策者的權(quán)力體現(xiàn)在他在形成 獲勝聯(lián)盟 中是否 關鍵加入者 若決策者作為 關鍵加入者 出現(xiàn) 權(quán)力就大 反之則小 決策者作為 關鍵加入者 的個數(shù)即為 權(quán)力指數(shù) 三人委員會的獲勝聯(lián)盟有 AB AC ABC A在AB AC和ABC中均是關鍵加入者 A的權(quán)力指數(shù)是3 B是聯(lián)盟AB的關鍵加入者 B的權(quán)力指數(shù)為l C與B一樣只是聯(lián)盟AC的關鍵加入者 權(quán)力指數(shù)是1 A B C的權(quán)力指數(shù)之比是3 1 l 群體中可能的權(quán)力結(jié)構(gòu)有多少 A B兩人的群體 邏輯上有16種決策結(jié)構(gòu) 以下4種最常見或在現(xiàn)實中有意義 F A 2 F B 3 F A B 4 F AB 1 2 表示A B說了算 3 4 中A B權(quán)力相等 但在 3 中 一人同意就行 在 4 中 要A B兩人同時同意才行 夫婦間的決策無非是這4種方式 3個人組成的群體 邏輯上可能的權(quán)力結(jié)構(gòu)有256種之多 但現(xiàn)實中的權(quán)力結(jié)構(gòu) 不含 邏輯非 為13種 當人數(shù)超過3人或者人數(shù)很多時 可能的權(quán)力結(jié)構(gòu)非常多 很難列舉 這就是為什么社會形態(tài)多種多樣 權(quán)爭總是無止無息 三人財產(chǎn)分配 案例 在三人之間分配100萬元財產(chǎn) A有50 的票 B有40 的票 C有10 的票 規(guī)定超過50 的票認可某種方案時 才能分配整個財產(chǎn) 分析 任何單獨一個人的票都不超過50 從而不能單獨決定財產(chǎn)的分配要超過50 的票必須結(jié)成聯(lián)盟 若按票力分配 即A B C的財產(chǎn)分配為 50 40 10 C可以提這樣的方案 A 70 B 0 C 30 這個方案能被A C接受 盡管B被排除 但是A C的票構(gòu)成大多數(shù) 60 B會提出新方案 A 80 B 20 C 0 此時A和B所得增加 C一無所有 A B的票力總和為 90 這樣的過程可以一直進行下去 夏普里 L S Shapley 1955年提出了一種計算權(quán)力的度量 根據(jù)他的理論求得的聯(lián)盟者的實力稱為Shapley值 夏普里值 夏普里值是 在各種可能的聯(lián)盟次序下 參與者對聯(lián)盟的邊際貢獻 聯(lián)盟的 關鍵加入者 之和除以各種可能的聯(lián)盟組合 如果說納什均衡是非合作博弈中的核心概念的話 夏普里值 shapleyvalue 是合作博弈 或聯(lián)盟博弈 中的最重要的概念 財產(chǎn)分配中各種排列下的關鍵加入者 由此得A B C的夏普里值分別為 A 4 6 B 1 6 C 1 6按照夏普里值 可將財產(chǎn) 100萬元 分給A 4 6 66 7 B 1 6 16 67 C 1 6 16 67 啟示 權(quán)力指數(shù)和票數(shù)不是一回事 票數(shù)指標是虛假的實力表示 在設計投票制度時 票數(shù)的分配要考慮權(quán)力指數(shù) 票數(shù)的分配要與權(quán)力指數(shù)和人數(shù)成大致相同的比例 S國的權(quán)力分配 S國有六個省 A B C D E F 實行代議民主政治 所有立法決策由這些省的代表投票實施 各省按人口比例分配的票數(shù)為 A 10 B 9 C 7 D 3 E 1 F 1 總票數(shù)為31 該國法律規(guī)定 一項決議擁有半數(shù)以上票 16票或16票以上 即獲得通過 總統(tǒng)選舉 兩位候選人 也一樣 獲半數(shù)以上票即當選 該國的體制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論