博弈論與領導干部決策思維(ppt 131頁).ppt

上傳人：朱*** IP屬地：江西上傳時間：2020-03-14 格式：PPT 頁數：130 大小：1.18MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩125頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

張?zhí)┏?博弈論與領導干部決策思維引言 20世紀90年代至2003年諾貝爾經濟學獎三次 1994 1996 2001 授予了與博弈論相關的研究領域總共有八位經濟學家獲獎是獲獎人數最多的領域排在第二位的是金融博弈論研究的最大特點一般決策研究數學表達 Y f x1 x2 xn 博弈論的決策研究數學表達 Y f x1 x2 xn z z為他人行為特點決策者目標函數的自變量中包含他人行為嚴格地講博弈論是一種方法應用范圍不僅包括經濟學政治學軍事外交國際關系公共選擇還有犯罪學都涉及到博弈論實際上不少人把博弈論看成是數學的一個分支納什1951年的奠基性文章就是發(fā)表在數學雜志上夏普里1953年的文章本身也是一篇數學手稿一博弈論基礎知識 1 博弈論的基本概念博弈論譯自英文 GameTheory 直譯游戲理論游戲有下列特征 1 都有規(guī)則 2 都有結果贏輸平結果能折算成數值 3 都有策略或者說計謀選擇不同的策略或計謀往往帶來不同的結果 4 策略和利益有相互依存性即每一個游戲者所得結果的好壞不僅取決于自身的策略選擇也取決于其他參加者的策略選擇策略本身常常沒有絕對的好壞之分只有相對于他方策略的相對好壞博弈論也稱為對策論其實并不是很恰當因為對策在實際中常被用來表示具體的針對性反應方案或站在某個決策方的立場上找針對其他方的對策博弈論所研究的決策問題卻是有開始有次序有結果的整個過程博弈的通俗含意不過是弈棋賭勝但由于它是帶有文言性質的詞因而顯得學術味濃一些既能反映這門學科的特點和實質又給人一種高深莫測的感覺博弈的簡明定義博弈即一些個人或其他組織面對一定的環(huán)境條件在一定的規(guī)則下同時或先后一次或多次從各自允許選擇的行為或策略中進行選擇并加以實施各自取得相應結果的過程博弈論是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題博弈論研究的對象是理性的參與者如何選擇策略或如何作出行動的決定使自己的目標最大化 2 構成一個博弈的基本要素博弈的七要素參與人行動信息戰(zhàn)略支付函數結果均衡參與人是博弈中選擇行動以最大化自己效用的決策主體可以是個人團體等行動是參與人的決策變量戰(zhàn)略是參與人選擇行動的規(guī)則它告訴參與人在什么時候選擇什么行動信息指的是參與人在博弈中的知識特別是有關其他參與人對手的特征和行動的知識支付函數是參與人從博弈中獲得的效用水平是每個參與人真正關心的東西結果是指博弈分析者感興趣的要素的集合均衡是所有參與人的最優(yōu)戰(zhàn)略或行動的組合博弈的三要素1 博弈的參加者2 博弈方各自可選擇的全部策略或行動的集合3 博弈方的得益 3 博弈的表述形式 1 標準形式策略形式守城棄城攻城退兵諸葛亮司馬懿華容道大路華容道大路諸葛亮曹操 2 擴展形式博弈樹 3 聯盟形式特殊函數形式 4 博弈的類別博弈分類可依不同的判據進行博弈人數單人博弈兩人博弈多人博弈策略的數量有限博弈無限博弈得益情況零和博弈常和博弈變和博弈博弈過程靜態(tài)博弈動態(tài)博弈重復博弈信息結構完全信息博弈靜動態(tài) 不完全信息博弈靜動態(tài) 完美信息動態(tài)博弈不完美信息動態(tài)博弈博弈方的理性和行為邏輯完全理性博弈有限理性博弈合作博弈非合作博弈常見的博弈分類從這個角度博弈可以分為靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈指的是博弈參與人同時行動或雖非同時但后行動者不知道前行動者采取了什么具體行動動態(tài)博弈指的是參與人的行動有先后順序且后行動者能觀察到先行動者所選擇的行動 1 參與人行動的先后順序 2 參與人的信息從這個角度博弈可以分為完全信息博弈和不完全信息博弈完全信息指的是每一個參與人對所有其他參與人對手的特征戰(zhàn)略空間及支付函數有準確的知識否則就是不完全信息將上述兩個角度的劃分結合起來共有四種不同類型的博弈即完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈博弈的分類表二博弈論中的經典分析及啟示 1 囚徒困境囚徒困境博弈是1950年圖克 Tucker 提出的它非常簡單卻反映了博弈的根本特征是闡釋眾多經濟社會問題的經典范式警察抓住兩個罪犯分別關押并與罪犯講清如果一人坦白一人抗拒坦白者立即釋放抗拒者判刑8年若兩人都坦白按律從輕各判5年罪犯知道他們若抗拒警察掌握的證據只能各判1年最后的結果會怎樣乙抗拒坦白甲抗拒坦白博弈完全信息分析方法上策均衡嚴格下策反復消去法畫線法箭頭法等乙抗拒坦白甲抗拒坦白此博弈的均衡為坦白坦白該均衡就是大名鼎鼎的納什均衡納什均衡在對方策略確定的情況下每個參與者的策略都是最好的沒有人愿意先改變自己的策略假如博弈中的所有參與人事先達成一項協(xié)議這個協(xié)議是否可以自動實施若當事人都會自覺遵守這個協(xié)議這個協(xié)議就構成納什均衡沒有人有積極性偏離協(xié)議換句話說如果一個協(xié)議不構成納什均衡它就不可能自動實施因為至少有一個參與人會違背這個協(xié)議結論一種制度安排要生效必須是納什均衡不滿足納什均衡要求的制度沒有意義類似囚徒困境應試教育公共產品供給不足修路公寓樓道的路燈卡特爾的內在不穩(wěn)定性產量限制價格限制商業(yè)誠信此博弈的納什均衡為 3 3 乙誠信欺詐誠信甲欺詐交通規(guī)則乙守規(guī)違規(guī) 守規(guī)甲違規(guī) 啟示個人理性與集體理性的矛盾冤假錯案是怎樣產生的個人的最優(yōu)決策不一定帶來集體的最優(yōu)結果集體的最優(yōu)結果未必來源于個人的最優(yōu)決策領導的政績改變博弈結果的根本方法是改變博弈的支付矩陣囚徒困境的解脫有這樣一個博弈此時兩者的納什均衡為不合作不合作獎勵假如對采取合作策略的博弈方獎勵3 獎勵矩陣為最終結果為上述兩個矩陣相加博弈的納什均衡為合作合作解開了囚徒困境懲罰思拉恩埃格特森在新制度經濟學中舉的例子非洲努埃爾人部落間有兩個大家庭X Y 每家擁有同樣的武力潛能和侵犯傾向每家擁有相當于10頭牛的財產每家都擁有兩種策略侵犯對方不侵犯對方博弈表述為納什均衡為侵犯侵犯雙方的收益為 4 4 通過聯姻努埃爾人引入了一個懲罰矩陣由于親戚關系侵犯者遭受成本包括心理成本的損失此時 X Y就由非合作均衡變?yōu)楹献骶?上述方陣變?yōu)?2 賭勝博弈賭勝博弈屬于零和博弈的范疇是具有某種對稱性的零和博弈猜硬幣博弈正面反面拋硬幣方正面反面猜硬幣方石頭剪子布博弈石頭剪子布博弈方1 石頭剪子布博弈方2 齊威王田忌賽馬齊威王上中下田忌上下中中上下中下上下上中下中上上中下下中上上下中中上下中下上下上中以上三個博弈是零和博弈沒有純策略納什均衡純策略單一的確定的策略石頭剪子布博弈方1 石頭剪子布博弈方2 取勝原則保密不泄漏自己的策略避免自己的決策有傾向性讓對方琢磨不透混合策略以一定的概率分布在備選策略中隨機選取啟示當博弈是零和博弈時只有混合策略均衡什么樣的決策是科學決策隨機決策當面對零和博弈時科學嗎 3 警衛(wèi)與小偷案例1兩地巡邏警衛(wèi)負責A B兩地保安 A地財產2萬元 B地1萬元警衛(wèi)一次只能在一個地方巡邏小偷一次也只能去一個地方警衛(wèi)在某地巡邏小偷也去了該地便不會失竊小偷去了警衛(wèi)沒去的地方則偷盜成功警衛(wèi)怎么巡邏效果最好巡邏A地巡邏B地盜竊A地盜竊B地警衛(wèi) 小偷這個博弈是零和博弈沒有純策略納什均衡點但有混合策略均衡點當警衛(wèi)去A地巡邏時小偷有的機會去A地的機會去B地此時 A的得益為 3 2 萬元當警衛(wèi)去B地時同樣小偷有的機會去A地的機會去B地此時 B的得益為 1 3 萬元警衛(wèi)總的得益為萬元同理我們可得小偷的總的得益為萬元警衛(wèi)的最優(yōu)策略是擲骰子決定去A地還是B地巡邏擲l 4點去A地擲5 6兩點去B地這樣警衛(wèi)有2 3的機會去A地 1 3的機會去B地警衛(wèi)的期望得益是 7 3大于2 小偷的最優(yōu)策略是同樣擲骰子決定去A地還是B地偷盜擲到1 4點去B地擲5 6兩點去A地即小偷有l(wèi) 3的機會去A地 2 3的機會去B地期望收益為2 3萬元啟示當博弈是零和博弈時即一方所得是另外一方的所失時只有混合策略均衡博弈方的策略應當是隨機的不能讓對方知道自己的策略哪怕是傾向性的策略如果對方知道你出其中一個策略的可能性大你失敗的可能性就大案例2小偷和守衛(wèi) 此案例為塞爾頓 1994年諾貝爾經濟學獎得主 1996年3月在上海講演中舉的例子有一倉庫小偷行竊時守衛(wèi)睡覺可獲價值V的財物小偷行竊時守衛(wèi)沒睡覺則被抓被抓后要坐牢效用為 P 守衛(wèi)睡覺而未遭偷竊有S的效用因睡覺被竊遭解雇得益為 D 小偷不偷守衛(wèi)無得也無失守衛(wèi)不睡出一份力掙一份錢也無得失小偷不偷偷守衛(wèi) 睡不睡分析這個博弈不存在純策略納什均衡小偷的策略 D Pt Pt S 0 守衛(wèi)得益睡小偷偷的概率 1 小偷有偷與不偷兩種策略圖中橫軸表示小偷選擇偷的概率Pt 不偷的概率等于1 Pt 守衛(wèi)的策略 P Pg Pg S 0 小偷得益偷守衛(wèi)睡的概率 1 V 守衛(wèi)有睡與不睡的策略其概率分布也可用圖表示激勵悖論政策目標和政策結果的意外關系 P Pg Pg S 0 小偷得益偷守衛(wèi)睡的概率 1 V Pg P 加重對小偷的懲罰相當于 P向下移動到 P 短期內小偷會停止偷竊但長期中小偷減少偷竊會使守衛(wèi)更多地選擇睡覺加重對小偷懲罰的主要作用是守衛(wèi)可以更多地偷懶 D Pt Pt S 0 守衛(wèi)得益睡小偷偷的概率 1 Pt D 加重對失職守衛(wèi)的處罰意味著D增大到D 短期效果是守衛(wèi)更加盡職長期中的真正作用恰恰是會降低盜竊發(fā)生的概率啟示怎樣避免激勵悖論 4 情侶博弈性別戰(zhàn) 一對情侶男的愛看足球女的愛看芭蕾都愿共度周末其博弈表述為有兩個納什均衡足球足球芭蕾芭蕾究竟哪一個會發(fā)生不知道男足球芭蕾足球芭蕾女啟示先動優(yōu)勢后動優(yōu)勢甲有先動優(yōu)勢先選B策略穩(wěn)得10 乙有后動優(yōu)勢最好讓A先選樂得100 甲 A B C D 乙斗雞博弈兩只斗雞相遇或進或退雙方都前進兩敗俱傷一方前進一方后退前進者勝利后退者丟面子都后退都丟面子博弈表述為雞甲前進后退前進后退雞乙此博弈有兩個納什均衡一方前進一方后退結果無法預測例子 20世紀60年代的古巴導彈危機夫妻矛盾 5 智豬博弈豬圈里有一大一小兩頭豬食槽在一頭按鈕在另一頭按一次有10個單位食品進入食槽但按者要支付2個單位若同時按同時跑向食槽各支付2個單位大豬吃7個單位小豬吃3個單位大豬按小豬坐吃大豬吃6個單位支付2個單位小豬吃4個單位小豬按大豬坐吃大豬吃9 小豬吃1 支付2個單位都坐等都沒吃小豬等按大豬等按智豬博弈扣除支付此博弈的納什均衡大豬按小豬坐吃 4 4 啟示多勞并不多得要推動工作就要想辦法找到大豬若你是大豬做了好不僅不要想得好還要能受委屈大德無名 6 海灘占位博弈霍特林模型有一海灘日光浴場均勻地散布著許多日光浴者有A與B兩個小販以同樣的價格質量向日光浴者提供同一品牌的礦泉水在直線狀的海灘上他們會如何選擇自己的攤位點呢海灘占位設海灘的長度為l 圖中 0 1 線段表示海灘號代表日光浴者由于日光浴者總是到距自己最近的攤位購買礦泉水理想的攤位點如下 A在1 4處 B在3 4處這樣既方便了日光浴者 A B兩人又平分市場可謂皆大歡喜然而理性的小販A會想如果我將攤位往B那兒挪動至A 位置那么從0至A 范圍內的人顯然是我的顧客而A 與B之間的中點將從原來的1 2處移至1 2右邊的C處從A 至C范圍內的人也將成為我的顧客即從B那兒奪走了一部分生意這當然是個好主意 B也是一個理性的商人 A的想法也是B想法 0 1 A B A C 雙方斗智斗勇博弈的結果 A B的攤位都定在海灘中點 1 2處相安無事地做買賣西方大國為什么都是兩黨政治為什么第三個政黨難成氣候兩黨政治的穩(wěn)定性和欺騙性西方兩黨政治的博弈論解讀保守黨 7 先來后到博弈廠商A先占領了一個容量有限的市場廠商B也想進入該市場廠商B知道一旦自己進入廠商A可能采取降價等競爭手段打擊他如果廠商A采取打擊行動廠商B肯定會虧損那么廠商B要不要進入這個市場如果廠商B真的進入廠商A是否真會打擊先來后到博弈完全信息分析假設A獨占市場時利潤為10 與B分享市場則各得5 如B進入市場A打擊則B虧損2 A的利潤降為3 我們可以用擴展形表示該動態(tài)博弈高成本低成本在位者的類型有高成本低成本之分高成本的最優(yōu)策略是默許低成本則是打擊在位者知道自己的真實類型進入者雖不知在位者的真實類型但知道各種可能類型的概率分布設高成本的可能性為x 低成本的可能性則為 1 X 進入者不進入的期望利潤為0 進入的期望利潤為 4x 1 1 x 即 x 0 2時進入的期望利潤大于不進入的期望利潤先來后到博弈不完全信息啟示怎樣的威脅和承諾是可信的言語博弈信號博弈高等教育的功能 8 求愛博弈有人向你求愛接受還是拒絕若求愛者品德優(yōu)良你接受若求愛者品德惡劣則拒絕但你并不準確知道求愛者的品德你接受與否就取決于你對求愛者品德類型的概率判斷即你在多大程度上相信他是一個品德優(yōu)良的人求愛博弈品德優(yōu)良求愛者求愛不求愛接受拒絕你求愛博弈品德惡劣求愛者求愛不求愛接受拒絕你假如你認為求愛者品德優(yōu)良的概率為X 不接受求愛的期望效用為0 接受則為100X 100 1 X 解之當X 1 2時接受求愛啟示信息不完全帶來決策風險諸葛亮和司馬懿相互知道類型公共知識空城計 9 財產分配博弈你的權力有多大權力指數有A B C三人委員會 A有兩票 B C各一票表決采取多數原則一項議案獲得3票及3票以上則通過他們各自的權力有多大權力是什么決策者的權力體現在他在形成獲勝聯盟中是否關鍵加入者若決策者作為關鍵加入者出現權力就大反之則小決策者作為關鍵加入者的個數即為權力指數三人委員會的獲勝聯盟有 AB AC ABC A在AB AC和ABC中均是關鍵加入者 A的權力指數是3 B是聯盟AB的關鍵加入者 B的權力指數為l C與B一樣只是聯盟AC的關鍵加入者權力指數是1 A B C的權力指數之比是3 1 l 群體中可能的權力結構有多少 A B兩人的群體邏輯上有16種決策結構以下4種最常見或在現實中有意義 F A 2 F B 3 F A B 4 F AB 1 2 表示A B說了算 3 4 中A B權力相等但在 3 中一人同意就行在 4 中要A B兩人同時同意才行夫婦間的決策無非是這4種方式 3個人組成的群體邏輯上可能的權力結構有256種之多但現實中的權力結構不含邏輯非為13種當人數超過3人或者人數很多時可能的權力結構非常多很難列舉這就是為什么社會形態(tài)多種多樣權爭總是無止無息三人財產分配案例在三人之間分配100萬元財產 A有50 的票 B有40 的票 C有10 的票規(guī)定超過50 的票認可某種方案時才能分配整個財產分析任何單獨一個人的票都不超過50 從而不能單獨決定財產的分配要超過50 的票必須結成聯盟若按票力分配即A B C的財產分配為 50 40 10 C可以提這樣的方案 A 70 B 0 C 30 這個方案能被A C接受盡管B被排除但是A C的票構成大多數 60 B會提出新方案 A 80 B 20 C 0 此時A和B所得增加 C一無所有 A B的票力總和為 90 這樣的過程可以一直進行下去夏普里 L S Shapley 1955年提出了一種計算權力的度量根據他的理論求得的聯盟者的實力稱為Shapley值夏普里值夏普里值是在各種可能的聯盟次序下參與者對聯盟的邊際貢獻聯盟的關鍵加入者之和除以各種可能的聯盟組合如果說納什均衡是非合作博弈中的核心概念的話夏普里值 shapleyvalue 是合作博弈或聯盟博弈中的最重要的概念財產分配中各種排列下的關鍵加入者由此得A B C的夏普里值分別為 A 4 6 B 1 6 C 1 6按照夏普里值可將財產 100萬元分給A 4 6 66 7 B 1 6 16 67 C 1 6 16 67 啟示權力指數和票數不是一回事票數指標是虛假的實力表示在設計投票制度時票數的分配要考慮權力指數票數的分配要與權力指數和人數成大致相同的比例 S國的權力分配 S國有六個省 A B C D E F 實行代議民主政治所有立法決策由這些省的代表投票實施各省按人口比例分配的票數為 A 10 B 9 C 7 D 3 E 1 F 1 總票數為31 該國法律規(guī)定一項決議擁有半數以上票 16票或16票以上即獲得通過總統(tǒng)選舉兩位候選人也一樣獲半數以上票即當選該國的體制

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論與領導干部決策思維(ppt 131頁).ppt

文檔簡介

溫馨提示

最新文檔

評論

博弈論與領導干部決策思維(ppt 131頁).ppt

文檔簡介

溫馨提示

最新文檔

評論

相關文檔