




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、南京航空航天大學經濟管理學院南京航空航天大學經濟管理學院精品課程群建設組精品課程群建設組非合作博弈的產生:博弈論始于博弈論始于1944年,它是以馮年,它是以馮諾伊曼(諾伊曼(Von Neumann) 和摩根斯坦恩(和摩根斯坦恩(Oskar Morgenstern)合)合作的作的博弈論與經濟行為博弈論與經濟行為一書的出版為標志。一書的出版為標志。到到20世紀世紀50年代,合作博弈發(fā)展到鼎盛期,非合年代,合作博弈發(fā)展到鼎盛期,非合作博弈也開始產生。納什(作博弈也開始產生。納什(Nash. J. F.)的)的N人博人博弈的均衡點弈的均衡點(1950),),非合作博弈非合作博弈(1951)明)明確提出
2、了納什均衡(確提出了納什均衡(Nash Equilibrium),圖克),圖克(Tucker)則定義了囚徒困境()則定義了囚徒困境(Prisoners Dilemma, 1950)。兩人的著作奠定現代非合作博弈論的基石。)。兩人的著作奠定現代非合作博弈論的基石。 -8,-80,-10-10,0-1,-1坦白坦白坦白坦白抵賴抵賴抵賴抵賴囚囚徒徒A囚徒囚徒B本例中,納什均衡就是(坦白,坦白):給定B坦白的情況下,A的最優(yōu)戰(zhàn)略就是坦白;同樣,給定A坦白的情況下,B的最優(yōu)戰(zhàn)略就是坦白。事實上 , ( 坦 白 , 坦 白 ) 還 是 一 個 占 優(yōu) 戰(zhàn) 略(Dominant strategy)均衡:就是
3、說,不論對方如何選擇,個人的最優(yōu)選擇就是坦白。 靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈:納什均衡(1950,1951)完全信息動態(tài);子博弈精練納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動態(tài)博弈;精練貝葉斯納什均衡;澤爾騰(1975),Kreps和Wilson(1982), Fudenberg和Tirole(1991)博弈論的分類回顧博弈理論的研究與應用的發(fā)展歷史,今天,我們可以這樣說,博弈理論不僅在經濟學而且在許多其它領域都得到了成功的應用并產生了深遠的影響,如:“囚徒困境”問題的定義與解決對經濟學、社會學、政治學和犯罪心理學等多
4、個學科和領域都產生了重要的影響。“雙層次博弈” 理論(TwoLevel Games, Robert D. Putnam, 1988)是有關國際談判中國內與國際因素互動的一種理論,它對國際上的局部沖突、經濟與政治等關系中許多問題的解決所發(fā)揮的作用是不可低估的。博弈理論在管理領域里也產生了深刻的影響并有可能形成一門新興的交叉學科(或稱改寫管理學)(管理博弈論:一門新興的交叉學科,侯光明,李存金,北京理工大學學報(社科版),2001)。非合作博弈理論極有可能為社會科學之間的統(tǒng)一整合提供一種理論上的支持(Roger B. Myerson,1999)。博弈論不僅已經改造了整個經濟學,而且還將改造社會學(
5、理性、均衡與演進博弈論:一個關于博弈理論發(fā)展的評述,南開經濟研究,李軍林,2000.4)。我們知道,主流經濟學的理性主義假設已經成為主流經濟學家極為便利的分析前提,作為經濟學的一個分支博弈論,它是以行為主體行為作為自己的主要研究對象的一種理論,而其對行為主體的邏輯出發(fā)點與主流學并無二致,也認為行為主體的行為是符合理性原則的(事實上,博弈論對行為主體的理性要求比主流經濟學的理性行為人的假設更高、更嚴格,上海財經大學學報有限理性條件下的進化博弈理論,謝識予,2001.10)。也正因為如此,以理性假設為基礎發(fā)展起來的非合作博弈理論不僅有著優(yōu)美、嚴密的數學推理與數學模型,而且經濟學家們發(fā)現幾乎所有的經
6、濟問題都可以被理解為行為人之間的互動問題(理性、均衡與演進博弈論一個關于博弈理論發(fā)展的評述,南開經濟研究,李軍林,2000.4)?,F實中,人的行為是否是完全理性的卻引起了人們普遍的懷疑。在博弈論的發(fā)展過程中,為了驗證理論同現實的一致性,有的學者設計了一些由許多人參加的博弈實驗,對他們的實際策略選擇加以觀察,看其是否符合博弈論的理論預測,即實驗博弈論(Experimental Game Theory)。但實驗結果往往并不和理論預測完全一致。就其原因而言,問題主要出在博弈論對行為主體的理性行為的假設上。 博弈論中的一個重要的假設就是博弈雙方行為人的共同知識的假設,例如,假設所有行為人的理性是共同知
7、識,即“所有參與人都是理性的,所有參與人知道所有參與人都是理性的,所有參與人知道所有參與人知道所有參與人都是理性的”如此類推,以致無限。這是一個令人難以想象的無限過程,就行為人對現實世界的認識能力而言,這是一條非常嚴格的假設。很顯然,現實世界這種假設通常是得不到保證的,這正是經典博弈論所遇到的最大的困惑之一。事實上,人們在大多數比較復雜的決策問題中表現出來的理性,都無法滿足博弈論的完全理性的要求。不僅人們的個人選擇會經常犯錯誤,集體決策同樣也經常會犯錯誤。人類社會頻繁發(fā)生的各種戰(zhàn)爭沖突,企業(yè)選擇領導人的盲目性和低效率等,都是人類集體選擇決策理性不完全的證據。這是A、B兩個博弈方,進行下列形狀像
8、蜈蚣似的擴展性表示的多階段動態(tài)博弈。如果兩個博弈方都是理性的和追求自己最大利益的,運用逆推歸納法進行分析,應該是博弈方A在第一個選擇節(jié)點就選擇D,結束博弈,雙方得益都為1。 (100,100)(98,101)(99,99)(97,100)(98,98)(2,2)(0,3)(1,1)DdDDdDdrrrRRRRAAAABBB因為如果A放棄選擇,博弈方B一旦選擇d結束博弈,則B的得益為3,而A的得益為0。作為理性經濟人A是不愿看到這樣的結局的。但很遺憾,A一旦在第一個選擇點就選擇D,這個逆推歸納法預言的結果是令人悲傷的,因為與該博弈的其它可能的結果相比,這個結果幾乎是最差的一個。因此,從追求經濟利
9、益最大化的理性經濟人為出發(fā)點的最優(yōu)選擇,最終會導致幾乎是極差的結果。這個事實表明:或 者 是 推 理 有 問 題 , 或 者 是 邏 輯 起 點 有 問 題 。由于逆推歸納法在邏輯上是經得起檢驗的,那么,這就不得不使人們會對納什均衡的邏輯前提“我相信我的競爭者同我一樣是理性的和追求它們的最大利益”(即理性經濟人)表示懷疑(吳德勤,納什均衡的內涵、問題和前景讀納什均衡論,上海大學學報(社會科學版),2001.2)。正是由于經典博弈理論中的這一無法圓滿解決的理性困惑問題,卻摧生了進化博弈理論(它放棄了經典博弈論的充分理性假說,將生物視為有限理性的當局者,它們在相互競爭的同時完成自身的進化,合理解釋
10、了某些生物習性的形成。Maynard Smith, J. 1982)。20世紀60年代生物學家們就已經用進化博弈理論來解釋生態(tài)現象了,特別是Maynard和Price(1973)及Maynard(1974)提出進化穩(wěn)定策略(Evolutionarily Stable Strategy, ESS)這一進化博弈的基本概念之后,該理論逐漸被廣泛地運用生態(tài)學、社會學和經濟學等領域。近年來,在國外有關進化博弈的理論研究與應用方面的文章已經占據了博弈論文獻中的一個較大的份額,而且越來越大(On economy applications of evolutionary game theory,Evoluti
11、onary Economics, J Evol Econ (1998)8: 15-34, Daniel Friedman,1998)。目前,國外主要用于刊載進化博弈及其相關內容文章的英文版雜志主要:Evolutionary Economics, Journal of Mathematical Biology, International Journal of Game Theory, Review of Economic Design 等等。如果說經典博弈理論的發(fā)展對經濟、社會和其它各相關領域所產生的影響是人們始料不及的。那么,今天,人們對進化博弈理論寄予了更高的期望。4.1經典博弈理論所涉及
12、的研究與應用的主要領域從整個博弈論的發(fā)展過程來看,博弈理論是在回答了一個個的現實向其提出的問題同時,而使其自身不斷地走向完善。今天,應該可以說,博弈理論獲得了驚人的發(fā)展。前不久,我們在相關網站對近幾年來有關博弈理論研究與應用方面的文章進行了檢索,共檢索到有關中文文章近2000多篇。這些文獻涉及到博弈理論與應用研究的各個方面。從對這些文獻的初步研究中,我們發(fā)現:無論是經典博弈理論還是進化博弈理論都是建立在經典數學基礎之上的,所解決的博弈問題主要涉及到,完全信息靜態(tài)、完全信息動態(tài)、不完全信息靜態(tài)、不完全信息動態(tài)和基于有限理性的進化博弈問題等。4.2經典博弈理論存在的主要缺陷現實世界除了不完全信息(
13、博弈論中的不完全信息有著特定的含義,即:滿足支付函數是所有參與人的共同知識這一假定的博弈,稱為完全信息博弈;否則,則稱之為不完全信息博弈)和有限理性(完全理性是指:博弈過程中的行為主體始終以自身最大利益為目標,具有在確定和不確定環(huán)境中追求自身利益最大化的判斷和決策能力,還要求他們具有在存在交互作用的博弈環(huán)境中完美的判斷和預測能力;不僅要求人們自身有完美理性,還要求人們相互信任對方的理性,有理性的共同知識(有限理性條件下的進化博弈理論,上海財經大學學報,謝識予,2001.10);我們把不滿足這一假設條件的理性,稱之為有限理性)等之外,還有未來的不確定性、有限知識(或稱有限信息、貧信息,灰色系統(tǒng)理
14、論及其應用,劉思峰等著,科學出版社,1999)等等許多問題。然而遺憾的是,對于這些問題,在目前的博弈理論中涉及的極少,尤其是有限知識等問題,就更是如此。4.3博弈過程中灰信息產生的原因我們知道,由于人的認識能力、知識水平和時間等等多種因素的限制,有限知識(灰信息)是普遍存在的,這就導致了人們對系統(tǒng)的認識不可能部是十分完全的,也就是說,展現在人們面前的系統(tǒng)往往不是“白”的,而是“灰”的。一般認為在以下四種情況下,系統(tǒng)信息表現為不完全,或稱為灰的(灰色系統(tǒng)理論及其應用,劉思峰等著,科學出版社,1999):(1)元素(參數)信息不完全;(2)結構信息的不完全;(3)邊界信息的不完全;(4)運行行為信
15、息的不完全。由此可以推斷,博弈理論中所涉及到的許多問題幾乎都是灰的,然而,目前的博弈理論對這些現實中的灰系統(tǒng)幾乎都采用了過份簡化的方法(將這些灰系統(tǒng)簡單的看作白系統(tǒng))進行處理,而這樣做的必然結果是導致了博弈論的預測對現實的指導作用大打折扣。4.4經典博弈論中的灰思想事實上,在經典博弈理論的某些不確定信息問題的處理上,就已經表現出了灰系統(tǒng)思想的應用。例如,在一個不完全信息的抓錢博弈(博弈論與信息經濟學張維迎者,上海人民出版社,1996.6)中,就引入了參與人的類型 ,且假定 在 的區(qū)間上均勻分布,其損益值矩陣如表1所示。然而,到目前為止,系統(tǒng)地運用灰系統(tǒng)理論解決博弈問題的文獻卻極為少見。表1 不
16、完全信息抓錢博弈抓不抓抓1,1不抓0,0參與人2參與人111,020,14.5灰系統(tǒng)理論博弈論中的應用我們知道,灰系統(tǒng)理論與其它一些不確定性數學(概率統(tǒng)計,模糊數學等)相比,它有著自己的獨特的研究對象、研究領域和研究方法。在一定的程度上,我們可以這樣說,灰系統(tǒng)理論可以為處理博弈論中的有限理性和有限知識等問題提供豐富的思想營養(yǎng)和一定的方法手段。如果我們能夠將灰系統(tǒng)理論與博弈(經典博弈與進化博弈)問題相結合,那么它將能夠使博弈模型更加符合人們的社會和經濟生活的實際、更加符合人們的直觀感覺、從而使其模型具有更強的適用性。4.5我的研究方向我的博士論文選題灰色博弈理論及其經濟應用研究,就是相借用灰系統(tǒng)
17、理論的豐富的思想營養(yǎng)與相關的方法手段來研究和解決博弈論中的有限理性和有限知識等問題。創(chuàng)建與現實經濟問題結合更加緊密的灰矩陣、灰雙矩陣和灰進化博弈模型,并設計出簡潔、高效的解的概念及其結構體系,完成其一些基礎性的研究工作,創(chuàng)建與設計灰矩陣、灰雙矩陣和灰進化博弈理論的框架(體系),從而為解決現實經濟問題提供一種有力的工具灰矩陣、灰雙矩陣和灰進化博弈理論。 5、基于區(qū)間數大小可以直接判定的灰矩陣博弈的純策略解研究事實上,在二人有限零和博弈過程中,博弈雙方所依據的損益值矩陣大部分都是局中人的事先判斷的。然而,由于人的認知水平的限制、信息的不完全因素、系統(tǒng)的結構性和隨機性波動等因素的影響,使得人們在事先
18、無法對其博弈結果值做出十分精確的判斷。而且,從二人有限零和博弈的事后博弈結果來看,盡管其實際的博弈結果是,各局中人的所得之和為零,也就是說,其事后值是清楚的。然而,現實中,由于各種隨機因素和非隨機因素的影響,使得這種博弈,既使在純策略意義下,在下一次被完全重復,其實際博弈結果所表現的各局中人的損益值未必與上一次完全一致?;也┺膯栴}的一個現實的例子例如,在一個相對封閉的彩電市場上,有1、2兩家寡頭壟斷廠商瓜分了市場,他們?yōu)榱藫屨几嗟氖袌龇蓊~而采取各種策略(降價、高質量的服務、增加產品功能、提高產品質量等)相互博弈競爭;但是由于各種原因,局中人對其各種可能的局勢所產生的損益值事先無法做出精確的估
19、計;事實上,既使在較嚴格的限制條件下,由于各種隨機因素和非隨機因素的影響,使得這種博弈的任意兩次的博弈損益值也不可能完全一致。也就是說,在現實中,有些二人有限零和博弈的損益值矩陣不可能是完全清楚和準確的,從而可以用一個準確的白數來表示的。該問題的純策略問題的求解是簡單的,可以模仿經典矩陣博弈問題進行,只是其解(鞍點)不再是一個點,而是一個可能的灰數區(qū)間,我們稱其為灰鞍點。6、基于區(qū)間數大小不能直接判定的灰矩陣博弈的純策略解研究對于區(qū)間灰數大小不能直接判定的灰矩陣博弈 問題,它的純策略解的求解問題的關鍵在于 中區(qū)間灰數大小判定準則的設定與判定方法的設計。本文運用灰色系統(tǒng)思想和系統(tǒng)工程的理論,揭示
20、了人們在灰信息條件下的博弈心理與博弈決策規(guī)則,提出了區(qū)間灰數的優(yōu)勢、均勢和劣勢的概念,證明了某一區(qū)間相對于另一區(qū)間灰數而言,它們的各種勢之和為1,且區(qū)間灰數的勢之間具有良好的傳遞性;在此基礎上,定義了灰數勢意義下的純策略解,且證明了這一純策略解(或稱灰勢鞍點)存在的充要條件。最后,以某單位在煤價在一定范圍內波動情況下冬季取暖用煤的貯量決策問題為例,對其灰勢意義下的純策略解問題進行了研究。7、基于灰區(qū)間數表征的矩陣博弈的混合策略解研究運用灰系統(tǒng)的思想和系統(tǒng)工程理論,本文建立了灰矩陣博弈的混合策略解、策略的“直接大(小)化”、“間接大(小)化”、局中人的最樂觀與最悲觀損益值矩陣和最優(yōu)灰博弈值等概念
21、;證明了局中人策略的直接大(?。?、間接大(小)化的引理和局中人某策略的最大、最小概率解的定理。在此基礎上,本文進一步的定義了的最優(yōu)博弈值解的概念,并給出了相應的求解方法及其證明。最后,本文以某單位采購員在秋天要決定冬季取暖用煤的貯量這一實際問題為背景,運用灰矩陣博弈理論對該問題進行了研究,取得了良好的效果。 )(G8、基于灰區(qū)間數矩陣博弈的勢最優(yōu)純策略解風險問題研究本文運用灰數的均勢度、劣勢度和優(yōu)勢度判定規(guī)則和方法,揭示了人們在有限理性和有限知識背景下進行灰博弈決策的規(guī)律,設計了人們在灰博弈過程中的決策規(guī)則,即:局中人均從各自可能出現的灰博弈值的勢最?。ㄗ畈焕┑那樾沃羞x擇一種灰博弈值的勢最大
22、(最有利)的情形進行決策(這也是灰博弈雙方都能接受的一種穩(wěn)妥的辦法)。在此基礎上,本文對灰矩陣博弈問題的勢最優(yōu)純策略解的高估、低估風險進行了識別與定義,設計了灰矩陣博弈中勢最優(yōu)純策略意義下的局中人1和2的最大高估與低估風險的測定算法,能對其勢最優(yōu)純策略解的風險大小進行測定。8、基于灰區(qū)間數矩陣博弈的勢最優(yōu)純策略解風險問題研究問題?8、基于灰區(qū)間數矩陣博弈的勢最優(yōu)純策略解風險問題研究9、基于灰區(qū)間數矩陣博弈其它相關問題的研究(1)灰矩陣博弈的最優(yōu)混合策略解及其風險分析 (2)灰矩陣博弈的滿意策略及其局勢控制問題研究(3)灰矩陣博弈的策略優(yōu)超問題研究(4)一種基于多種群的鏈結構矩陣進化博弈互動學習
23、模型算法研究10、基于有限理性的一級密封價格拍賣灰博弈模型研究-1-基于準確的價值和經驗理想報價估價的最優(yōu)灰報價模型 運用灰系統(tǒng)理論的思想,對目前的一級密封價格拍賣博弈模型進行檢驗和驗證,并對其存在的一些缺陷進行了剖析,認為這些經典模型對條件的限制過于嚴格,與現實的吻合性較差。基于有限理性假設,設計了經驗理想報價灰修正系數,建立了基于準確的價值和經驗理想報價估價的有限理性最優(yōu)灰報價模型。對該模型灰系數進行第一標準灰數變換,找到了投標人的威脅反應灰系數;發(fā)現了投標人的最優(yōu)灰報價不僅取決于其自身的價值,而且還取決于他人的價值及其威脅反應灰系數;投標人的最優(yōu)灰報價不僅僅剛好為其對被拍物品所認可價值的
24、一半,而要視情而定,一般情況下均高于其所認可價值的一半。對該模型進行了數據仿真,得到一些與經典模型有較大差異的有價值的結論,并建議了投標人的最佳投標模式。10、基于有限理性的一級密封價格拍賣灰博弈模型研究-基于準確的價值和經驗理想報價估價的最優(yōu)灰報價模型 00.210.20.50.500.510.20.2860.2850.30.210.20.50.50.30.4550.8170.20.350.2860.60.210.20.50.50.60.410.4830.140.4140.20.90.210.20.50.50.90.3650.3720.1250.4790.17900.310.10.250.2
25、500.5510.150.2140.2140.30.270.4330.0560.3250.140.30.490.70.1470.30.210.60.240.2670.0430.40.1080.60.430.450.1220.3860.1740.90.210.2110.040.4750.10.90.370.3670.1210.4710.173表1 投標人的最優(yōu)灰報價及其相對應的最大效用數值仿真0.40.80.20.6*0.4 (0.5 ) Pr *vBuiiivbvob BBWHijjjiiivvii*0.7 (0.5 ) Pr *v Buiiivbvob BBWHijjjiiivviivjj*BiPr ob *uiWiHivjj*BiPr ob *uiWiHi10、基于有限理性的一級密封價格拍賣灰博弈模型研究-基于準確的價值和經驗理想報價估價的最優(yōu)灰報價模型 10、基于有限理性的一級密封價格拍賣灰博弈模型研究-基于準確的價值和經驗理想報價估價的最優(yōu)灰報價模型 11、基于有限理性的一級密封價格拍賣灰博弈模型研究研究-2-基于非精確價值和經驗理想報價估價的最優(yōu)灰報價模型運用灰系統(tǒng)理論的思想,并考慮到信息的不確定性,從投標者對被拍物品的價值估計和其經驗理想報價均為區(qū)間灰數這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 資產全生命周期管理中的風險管理創(chuàng)新
- 貴州2025年01月2025年貴州省市兩級機關遴選公務員(451人)國家公務員考試消息筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 高效能自動化灌裝機的研發(fā)與生產流程
- 門急診信息傳達設計的有效性與便捷性
- 高校與新能源投資的合作關系探討與挑戰(zhàn)分析
- 跨區(qū)域學校合作的政策支持與激勵機制研究
- 資產托管服務在教育領域的實踐應用
- 零售業(yè)供應鏈管理與成本控制技巧分享
- 2025遼寧沈陽地鐵三號線招安檢員和安保員筆試參考題庫附帶答案詳解
- 高效行政從時間管理開始
- 2024年甘肅省公務員錄用考試《行測》真題卷及答案解析
- 2024版Visio入門到精通完整教程
- 2024年團校考試入團考試題庫及答案
- 西鐵城手表H149機芯中文使用說明書
- 2024年執(zhí)業(yè)藥師繼續(xù)教育專業(yè)答案
- 非ST段抬高型急性冠脈綜合征診斷和治療指南(2024)解讀
- 報廢汽車拆解項目可行性研究報告
- 小學三年級下冊英語(牛津上海一起點)全冊語法知識點總結
- 2024年計算機考試-ISTQB認證考試近5年真題附答案
- 云南省2021年中考生物真題試卷(+答案+解析)
- 腦出血中醫(yī)診療方案
評論
0/150
提交評論