版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論與納什均衡一、本文概述博弈論,又被稱為對(duì)策論或賽局理論,是現(xiàn)代數(shù)學(xué)的一個(gè)重要分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。它主要研究游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,以及這些行為的優(yōu)化策略。博弈論不僅在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)、生物學(xué)、心理學(xué)以及等領(lǐng)域有著廣泛的應(yīng)用,也是理解人類行為和社會(huì)現(xiàn)象的重要工具。納什均衡是博弈論中的一個(gè)核心概念,由美國(guó)數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家約翰·納什在1950年提出。它描述了在給定其他玩家策略的情況下,每個(gè)玩家都選擇最優(yōu)策略的一種狀態(tài)。換句話說,如果其他玩家不改變策略,那么任何單個(gè)玩家都無法通過改變策略來提高自己的收益。納什均衡的存在性和唯一性,對(duì)理解和預(yù)測(cè)博弈結(jié)果具有重要意義。本文旨在深入探討博弈論的基本概念、理論框架以及納什均衡的理論和應(yīng)用。我們將首先介紹博弈論的基本元素和分類,然后詳細(xì)闡述納什均衡的定義、性質(zhì)和求解方法。我們還會(huì)通過一些具體的案例和模型,展示博弈論和納什均衡在現(xiàn)實(shí)世界中的應(yīng)用,如市場(chǎng)競(jìng)爭(zhēng)、拍賣、合作與競(jìng)爭(zhēng)、社會(huì)規(guī)范的形成等。希望通過本文的閱讀,讀者能夠更深入地理解博弈論和納什均衡,從而更好地應(yīng)用這些理論來分析和解決現(xiàn)實(shí)生活中的問題。二、博弈論基礎(chǔ)知識(shí)博弈論,又稱為對(duì)策論或賽局理論,是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。它主要研究游戲中的決策過程,以及這種決策的均衡問題。博弈論不僅廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)、政治學(xué)、軍事學(xué)等領(lǐng)域,還深刻影響了人們的日常生活。博弈論的基本概念包括局中人、策略、得益和均衡。局中人指的是參與博弈的各方,他們可以是個(gè)人、團(tuán)體或組織。策略是局中人在博弈中可能采取的行動(dòng)方案。得益則是局中人在各種策略組合下所獲得的利益或效用。均衡則是博弈論的核心概念,它指的是在所有局中人都采取最優(yōu)策略的情況下,博弈的結(jié)果。博弈論可以分為合作博弈和非合作博弈兩大類。合作博弈強(qiáng)調(diào)的是局中人之間的利益共享和協(xié)同,而非合作博弈則更側(cè)重于局中人之間的競(jìng)爭(zhēng)和對(duì)抗。在實(shí)際應(yīng)用中,非合作博弈更為常見,因?yàn)樗犀F(xiàn)實(shí)世界中大多數(shù)情況下的情形。納什均衡是博弈論中的一個(gè)重要概念,它描述了在非合作博弈中,每個(gè)局中人都選擇自己的最優(yōu)策略,從而使整個(gè)博弈達(dá)到一種穩(wěn)定的狀態(tài)。納什均衡的存在性和唯一性是博弈論研究的重要問題之一。如果博弈中存在納什均衡,那么我們就可以預(yù)測(cè)博弈的結(jié)果,從而為決策提供科學(xué)依據(jù)。博弈論還包括了許多其他的概念和模型,如零和博弈、非零和博弈、完全信息博弈、不完全信息博弈等。這些概念和模型為我們提供了豐富的工具來分析和解決各種實(shí)際問題。博弈論是一門非常有用的學(xué)科,它為我們提供了一種全新的視角來看待世界中的各種問題和挑戰(zhàn)。通過學(xué)習(xí)和應(yīng)用博弈論,我們可以更好地理解人類行為和社會(huì)現(xiàn)象,從而做出更加明智和有效的決策。三、納什均衡理論納什均衡理論是博弈論中的一個(gè)核心概念,由美國(guó)數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家約翰·納什提出。納什均衡描述的是在一個(gè)博弈中,當(dāng)所有參與者都了解其他參與者的策略和可能的選擇時(shí),每個(gè)參與者都會(huì)選擇自己的最優(yōu)策略,而這些策略的組合就是納什均衡。換句話說,納什均衡是一個(gè)穩(wěn)定的狀態(tài),在這個(gè)狀態(tài)下,沒有任何參與者可以通過改變自己的策略來獲得更大的利益。納什均衡理論的重要性在于它提供了一種預(yù)測(cè)和分析博弈結(jié)果的方法。通過納什均衡,我們可以了解在給定的情況下,各個(gè)參與者可能的選擇和結(jié)果,以及這些選擇和結(jié)果如何影響整個(gè)博弈的均衡狀態(tài)。納什均衡還為我們提供了一種理解復(fù)雜經(jīng)濟(jì)和社會(huì)現(xiàn)象的工具,如市場(chǎng)競(jìng)爭(zhēng)、政策制定、社會(huì)規(guī)范等。納什均衡的存在性和唯一性問題是博弈論研究的重要課題。在某些情況下,納什均衡可能不存在,或者存在多個(gè)納什均衡。這時(shí),我們需要進(jìn)一步分析博弈的結(jié)構(gòu)和規(guī)則,以及參與者的策略和偏好,來確定最可能的均衡狀態(tài)。納什均衡理論的應(yīng)用非常廣泛,不僅在經(jīng)濟(jì)學(xué)中有著重要的地位,還在政治學(xué)、社會(huì)學(xué)、心理學(xué)等領(lǐng)域中得到了廣泛的應(yīng)用。通過納什均衡理論,我們可以更好地理解各種復(fù)雜系統(tǒng)中的相互作用和影響,為決策和規(guī)劃提供科學(xué)依據(jù)。然而,納什均衡理論也存在一些局限性和挑戰(zhàn)。納什均衡假設(shè)參與者具有完全理性和完全信息,這在現(xiàn)實(shí)世界中往往難以實(shí)現(xiàn)。納什均衡理論主要關(guān)注靜態(tài)均衡狀態(tài),而忽略了動(dòng)態(tài)過程和演化變化。因此,在實(shí)際應(yīng)用中,我們需要結(jié)合具體情況和實(shí)際需求,對(duì)納什均衡理論進(jìn)行適當(dāng)?shù)男拚屯卣?。納什均衡理論是博弈論中的核心概念之一,為我們提供了一種預(yù)測(cè)和分析博弈結(jié)果的有效工具。通過深入研究和應(yīng)用納什均衡理論,我們可以更好地理解復(fù)雜系統(tǒng)中的相互作用和影響,為決策和規(guī)劃提供科學(xué)依據(jù)。我們也需要認(rèn)識(shí)到納什均衡理論的局限性和挑戰(zhàn),并在實(shí)際應(yīng)用中加以注意和應(yīng)對(duì)。四、納什均衡的應(yīng)用領(lǐng)域納什均衡作為博弈論的核心概念,已經(jīng)廣泛滲透到了多個(gè)學(xué)科和實(shí)際應(yīng)用領(lǐng)域中,為我們理解和分析復(fù)雜系統(tǒng)中的決策和互動(dòng)提供了有力的工具。在經(jīng)濟(jì)學(xué)領(lǐng)域,納什均衡被廣泛應(yīng)用于市場(chǎng)競(jìng)爭(zhēng)、價(jià)格制定、產(chǎn)業(yè)組織等多個(gè)方面。例如,在寡頭市場(chǎng)中,企業(yè)之間的價(jià)格競(jìng)爭(zhēng)和產(chǎn)量決策可以通過納什均衡來分析。每個(gè)企業(yè)都試圖最大化自己的利潤(rùn),但在考慮競(jìng)爭(zhēng)對(duì)手的反應(yīng)時(shí),會(huì)形成一個(gè)均衡的產(chǎn)量和價(jià)格組合,這就是納什均衡。在社會(huì)科學(xué)領(lǐng)域,納什均衡也為我們理解個(gè)體間的互動(dòng)和社會(huì)現(xiàn)象提供了視角。例如,在社交網(wǎng)絡(luò)中,個(gè)體的信息傳播和決策會(huì)受到其他個(gè)體的影響,通過納什均衡分析,可以揭示這種互動(dòng)背后的深層次機(jī)制和規(guī)律。納什均衡在生物學(xué)、計(jì)算機(jī)科學(xué)等領(lǐng)域也有廣泛的應(yīng)用。在生態(tài)系統(tǒng)中,物種之間的競(jìng)爭(zhēng)和共存可以通過納什均衡來分析;在計(jì)算機(jī)科學(xué)中,納什均衡被用于分析網(wǎng)絡(luò)中的路由選擇、資源分配等問題。值得注意的是,納什均衡的應(yīng)用并不僅限于理論層面,它也被廣泛應(yīng)用于實(shí)際問題的求解和決策支持。例如,在交通擁堵管理中,通過納什均衡分析,可以制定合理的交通規(guī)則和策略,以減少擁堵和提高交通效率。納什均衡作為博弈論的核心概念,其應(yīng)用領(lǐng)域廣泛而深遠(yuǎn)。它不僅為我們理解復(fù)雜系統(tǒng)中的決策和互動(dòng)提供了有力的工具,也為實(shí)際問題的求解和決策支持提供了重要的指導(dǎo)。隨著研究的深入和應(yīng)用領(lǐng)域的拓展,納什均衡將在更多領(lǐng)域發(fā)揮重要作用。五、納什均衡的爭(zhēng)議與挑戰(zhàn)盡管納什均衡理論在經(jīng)濟(jì)學(xué)和博弈論中占據(jù)了重要地位,但它也面臨著一系列爭(zhēng)議和挑戰(zhàn)。這些爭(zhēng)議和挑戰(zhàn)主要來自于理論的局限性、實(shí)際應(yīng)用的困難以及對(duì)公平性和倫理道德的考量。納什均衡理論的一個(gè)主要局限在于其假設(shè)的完全理性和完全信息條件。在現(xiàn)實(shí)世界中,參與者往往受到有限理性和信息不對(duì)稱的限制,這可能導(dǎo)致他們的決策偏離納什均衡。因此,納什均衡理論在解釋現(xiàn)實(shí)世界的復(fù)雜博弈現(xiàn)象時(shí)可能存在一定的局限性。納什均衡的存在性和唯一性也備受爭(zhēng)議。在某些博弈中,可能存在多個(gè)納什均衡,這使得預(yù)測(cè)結(jié)果變得困難。即使存在唯一的納什均衡,也不一定意味著該均衡是穩(wěn)定和可持續(xù)的。因此,對(duì)于納什均衡的穩(wěn)定性和可持續(xù)性需要進(jìn)行更深入的研究。再者,納什均衡理論在應(yīng)用過程中也面臨一些實(shí)際困難。例如,在實(shí)際博弈中,參與者可能需要根據(jù)對(duì)手的策略進(jìn)行實(shí)時(shí)調(diào)整,而納什均衡理論往往只提供了靜態(tài)的分析框架。納什均衡的計(jì)算復(fù)雜度也較高,對(duì)于大型博弈來說,找到納什均衡可能是一項(xiàng)艱巨的任務(wù)。納什均衡理論還面臨著公平性和倫理道德的考量。在某些情況下,納什均衡可能導(dǎo)致不公平的結(jié)果,例如貧富差距的擴(kuò)大或資源分配的不平等。因此,在應(yīng)用納什均衡理論時(shí),需要充分考慮其對(duì)社會(huì)公平和倫理道德的影響。盡管納什均衡理論在博弈論中具有重要的地位,但它也面臨著多方面的爭(zhēng)議和挑戰(zhàn)。為了更好地理解和應(yīng)用納什均衡理論,我們需要不斷探索其局限性、拓展其應(yīng)用范圍,并在實(shí)踐中充分考慮公平性和倫理道德的因素。六、結(jié)論與展望本文詳細(xì)探討了博弈論與納什均衡的概念、原理以及應(yīng)用。博弈論作為現(xiàn)代數(shù)學(xué)和經(jīng)濟(jì)學(xué)的重要分支,為我們提供了一種理解和分析競(jìng)爭(zhēng)、合作與決策過程的強(qiáng)大工具。納什均衡作為博弈論中的核心概念,更是為研究者揭示了在復(fù)雜系統(tǒng)中,理性參與者如何通過策略選擇達(dá)到均衡狀態(tài)的深層規(guī)律。然而,雖然博弈論與納什均衡理論已經(jīng)取得了豐富的理論成果,但仍有許多未解決的問題和挑戰(zhàn)。在現(xiàn)實(shí)世界中,參與者的決策往往受到諸多非理性因素的影響,如情感、習(xí)慣、信息不對(duì)稱等。因此,如何將博弈論擴(kuò)展到非完全理性的參與者,是當(dāng)前和未來研究的重要方向。博弈論的應(yīng)用范圍仍需進(jìn)一步拓寬。目前,博弈論主要被應(yīng)用于經(jīng)濟(jì)學(xué)、政治學(xué)、生物學(xué)等領(lǐng)域,但在社會(huì)學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)等其他領(lǐng)域的應(yīng)用相對(duì)較少。隨著學(xué)科交叉融合的深入,我們期待看到博弈論在更多領(lǐng)域中的應(yīng)用。隨著和大數(shù)據(jù)技術(shù)的快速發(fā)展,博弈論在機(jī)器學(xué)習(xí)和決策支持系統(tǒng)等領(lǐng)域的應(yīng)用也呈現(xiàn)出廣闊的前景。例如,博弈論可以用于設(shè)計(jì)智能算法,使機(jī)器能夠在復(fù)雜的競(jìng)爭(zhēng)環(huán)境中進(jìn)行自主學(xué)習(xí)和決策。博弈論與納什均衡理論為我們理解復(fù)雜系統(tǒng)中的競(jìng)爭(zhēng)與合作提供了有力的工具。然而,面對(duì)現(xiàn)實(shí)世界中的諸多挑戰(zhàn)和問題,我們?nèi)孕枰粩嗌钊胙芯亢屯晟七@一理論。展望未來,我們期待博弈論能夠在更多領(lǐng)域中得到應(yīng)用,為解決現(xiàn)實(shí)問題提供新的思路和方法。參考資料:納什均衡是博弈論中一種解的概念,它是指滿足下面性質(zhì)的策略組合:任何一位玩家在此策略組合下單方面改變自己的策略(其他玩家策略不變)都不會(huì)提高自身的收益。納什均衡(Nashequilibrium),又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語,以約翰·納什命名。在一個(gè)博弈過程中,無論對(duì)方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個(gè)組合就被定義為納什均衡。一個(gè)策略組合被稱為納什均衡,當(dāng)每個(gè)博弈者的均衡策略都是為了達(dá)到自己期望收益的最大值,與此同時(shí),其他所有博弈者也遵循這樣的策略。關(guān)于納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發(fā)展基礎(chǔ)的重要成果,是約翰·納什在普林斯頓大學(xué)攻讀博士學(xué)位時(shí)完成的。實(shí)際上,博弈論的研究起始于1944年約翰·馮·諾依曼(VonNeumann)和奧斯卡·摩根斯特恩(OscarMorgenstern)合著的《博弈論和經(jīng)濟(jì)行為》。然而卻是納什首先用嚴(yán)密的數(shù)學(xué)語言和簡(jiǎn)明的文字準(zhǔn)確地定義了納什均衡這個(gè)概念,并在包含“混合策略(mixedstrategies)”的情況下,證明了納什均衡在n人有限博弈中的普遍存在性,從而開創(chuàng)了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperativeGame)”理論,進(jìn)而對(duì)“合作博弈(CooperativeGame)”和“非合作博弈”做了明確的區(qū)分和定義。阿爾伯特·塔克(Alberttucker)教授評(píng)價(jià)其論文,“這是對(duì)博弈理論的高度原創(chuàng)性和重要的貢獻(xiàn)。它發(fā)展了本身很有意義的n人有限非合作博弈的概念和性質(zhì)。并且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨(dú)立創(chuàng)造?!奔{什均衡可以分成兩類:“純策略納什均衡”和“混合策略納什均衡”。要說明純策略納什均衡和混合策略納什均衡,要先說明純策略和混合策略。所謂純策略是提供給玩家要如何進(jìn)行博弈的一個(gè)完整的定義。特別地是,純策略決定在任何一種情況下要做的移動(dòng)。策略集合是由玩家能夠施行的純策略所組成的集合。而混合策略是對(duì)每個(gè)純策略分配一個(gè)概率而形成的策略?;旌喜呗栽试S玩家隨機(jī)選擇一個(gè)純策略?;旌喜呗圆┺木庵幸酶怕视?jì)算,因?yàn)槊恳环N策略都是隨機(jī)的,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)收益最優(yōu)。因?yàn)楦怕适沁B續(xù)的,所以即使策略集合是有限的,也會(huì)有無限多個(gè)混合策略。當(dāng)然,嚴(yán)格來說,每個(gè)純策略都是一個(gè)“退化”的混合策略,某一特定純策略的概率為1,其他的則為0。故“純策略納什均衡”,即參與之中的所有玩家都使用純策略;而相應(yīng)的“混合策略納什均衡”,之中至少有一位玩家使用混合策略。并不是每個(gè)博弈都會(huì)有純策略納什均衡,例如“錢幣問題"就只有混合策略納什均衡,而沒有純策略納什均衡。不過,還是有許多博弈有純策略納什均衡(如協(xié)調(diào)博弈,囚徒困境和獵鹿博弈)。甚至,有些博弈能同時(shí)有純策略和混合策略均衡。(1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。)假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會(huì)懷疑對(duì)方會(huì)出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過程:假如他坦白,如果我抵賴,得坐10年監(jiān)獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會(huì)被判一年,如果我坦白就可以被釋放,而他會(huì)坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對(duì)我而言都是坦白了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期?;诮?jīng)濟(jì)學(xué)中“理性的經(jīng)濟(jì)人”的前提假設(shè),兩個(gè)囚犯符合自己利益的選擇是坦白招供,原本對(duì)雙方都有利的策略不招供從而均被判處一年就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。你正在圖書館枯坐,一位陌生美女主動(dòng)過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了?!蹦敲丛摬辉摵瓦@位姑娘玩這個(gè)游戲呢?這基本是廢話,當(dāng)然該。問題是,這個(gè)游戲公平嗎?每一種游戲依具其規(guī)則的不同會(huì)存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個(gè)游戲中,便應(yīng)該采用混合策略納什均衡。假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)該在對(duì)手出什么的時(shí)候我們的收益都相等(不然在這個(gè)游戲中,對(duì)方可以改變正反面出現(xiàn)的概率讓我們的期望收入減少),由此列出方程就是解得x也等于3/8,而美女每次的期望收益則是元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。其實(shí)只要美女采取了(3/8,5/8)這個(gè)方案,不論你再采用什么方案,都是不能改變局面的。納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建?!芬粫囊灾兴f,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場(chǎng)溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營(yíng)銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。2.?dāng)U展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。4.形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。5.?dāng)U大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。6.改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的日本經(jīng)濟(jì)學(xué)家神取道宏(KandoriMichihiro,1997)對(duì)保羅·薩繆爾森(PaulSamuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過一個(gè)幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。納什均衡是博弈論中一種解的概念,它是指滿足下面性質(zhì)的策略組合:任何一位玩家在此策略組合下單方面改變自己的策略(其他玩家策略不變)都不會(huì)提高自身的收益。納什均衡(Nashequilibrium),又稱為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語,以約翰·納什命名。在一個(gè)博弈過程中,無論對(duì)方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,則該策略被稱作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個(gè)組合就被定義為納什均衡。一個(gè)策略組合被稱為納什均衡,當(dāng)每個(gè)博弈者的均衡策略都是為了達(dá)到自己期望收益的最大值,與此同時(shí),其他所有博弈者也遵循這樣的策略。關(guān)于納什均衡的普遍意義和存在性定理的證明等奠定非合作博弈理論發(fā)展基礎(chǔ)的重要成果,是約翰·納什在普林斯頓大學(xué)攻讀博士學(xué)位時(shí)完成的。實(shí)際上,博弈論的研究起始于1944年約翰·馮·諾依曼(VonNeumann)和奧斯卡·摩根斯特恩(OscarMorgenstern)合著的《博弈論和經(jīng)濟(jì)行為》。然而卻是納什首先用嚴(yán)密的數(shù)學(xué)語言和簡(jiǎn)明的文字準(zhǔn)確地定義了納什均衡這個(gè)概念,并在包含“混合策略(mixedstrategies)”的情況下,證明了納什均衡在n人有限博弈中的普遍存在性,從而開創(chuàng)了與諾依曼和摩根斯坦框架路線均完全不同的“非合作博弈(Non-cooperativeGame)”理論,進(jìn)而對(duì)“合作博弈(CooperativeGame)”和“非合作博弈”做了明確的區(qū)分和定義。阿爾伯特·塔克(Alberttucker)教授評(píng)價(jià)其論文,“這是對(duì)博弈理論的高度原創(chuàng)性和重要的貢獻(xiàn)。它發(fā)展了本身很有意義的n人有限非合作博弈的概念和性質(zhì)。并且它很可能開拓出許多在兩人零和問題以外的,至今尚未涉及的問題。在概念和方法兩方面,該論文都是作者的獨(dú)立創(chuàng)造?!奔{什均衡可以分成兩類:“純策略納什均衡”和“混合策略納什均衡”。要說明純策略納什均衡和混合策略納什均衡,要先說明純策略和混合策略。所謂純策略是提供給玩家要如何進(jìn)行博弈的一個(gè)完整的定義。特別地是,純策略決定在任何一種情況下要做的移動(dòng)。策略集合是由玩家能夠施行的純策略所組成的集合。而混合策略是對(duì)每個(gè)純策略分配一個(gè)概率而形成的策略?;旌喜呗栽试S玩家隨機(jī)選擇一個(gè)純策略?;旌喜呗圆┺木庵幸酶怕视?jì)算,因?yàn)槊恳环N策略都是隨機(jī)的,達(dá)到某一概率時(shí),可以實(shí)現(xiàn)收益最優(yōu)。因?yàn)楦怕适沁B續(xù)的,所以即使策略集合是有限的,也會(huì)有無限多個(gè)混合策略。當(dāng)然,嚴(yán)格來說,每個(gè)純策略都是一個(gè)“退化”的混合策略,某一特定純策略的概率為1,其他的則為0。故“純策略納什均衡”,即參與之中的所有玩家都使用純策略;而相應(yīng)的“混合策略納什均衡”,之中至少有一位玩家使用混合策略。并不是每個(gè)博弈都會(huì)有純策略納什均衡,例如“錢幣問題"就只有混合策略納什均衡,而沒有純策略納什均衡。不過,還是有許多博弈有純策略納什均衡(如協(xié)調(diào)博弈,囚徒困境和獵鹿博弈)。甚至,有些博弈能同時(shí)有純策略和混合策略均衡。(1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。)假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌疑人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。關(guān)于案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會(huì)懷疑對(duì)方會(huì)出賣自己以求自保、其次才是亞當(dāng)·斯密的理論,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過程:假如他坦白,如果我抵賴,得坐10年監(jiān)獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會(huì)被判一年,如果我坦白就可以被釋放,而他會(huì)坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對(duì)我而言都是坦白了劃算。兩個(gè)人都會(huì)動(dòng)這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期?;诮?jīng)濟(jì)學(xué)中“理性的經(jīng)濟(jì)人”的前提假設(shè),兩個(gè)囚犯符合自己利益的選擇是坦白招供,原本對(duì)雙方都有利的策略不招供從而均被判處一年就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn):按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。但是我們可以從“納什均衡”中引出“看不見的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。你正在圖書館枯坐,一位陌生美女主動(dòng)過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)游戲。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那么我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了?!蹦敲丛摬辉摵瓦@位姑娘玩這個(gè)游戲呢?這基本是廢話,當(dāng)然該。問題是,這個(gè)游戲公平嗎?每一種游戲依具其規(guī)則的不同會(huì)存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠采取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個(gè)游戲中,便應(yīng)該采用混合策略納什均衡。假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)該在對(duì)手出什么的時(shí)候我們的收益都相等(不然在這個(gè)游戲中,對(duì)方可以改變正反面出現(xiàn)的概率讓我們的期望收入減少),由此列出方程就是解得x也等于3/8,而美女每次的期望收益則是元。這告訴我們,在雙方都采取最優(yōu)策略的情況下,平均每次美女贏1/8元。其實(shí)只要美女采取了(3/8,5/8)這個(gè)方案,不論你再采用什么方案,都是不能改變局面的。納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟(jì)理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟(jì)建?!芬粫囊灾兴f,“在過去的一二十年內(nèi),經(jīng)濟(jì)學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場(chǎng)溫和的革命,非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會(huì)計(jì)、營(yíng)銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?!奔{什均衡的重要影響可以概括為以下六個(gè)方面1.改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動(dòng)經(jīng)濟(jì)學(xué)、國(guó)際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域,改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu),成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。2.?dāng)U展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動(dòng)環(huán)境因素以及經(jīng)濟(jì)個(gè)體之間的交互作用模式化的有效辦法,因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法,包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。3.加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個(gè)體之間直接的交互作用,不滿足于對(duì)經(jīng)濟(jì)個(gè)體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡(jiǎn)單化處理,分析問題時(shí)不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強(qiáng)調(diào)從微觀個(gè)體行為規(guī)律的角度發(fā)現(xiàn)問題的根源,因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。4.形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系,按照經(jīng)典博弈的類型或特征進(jìn)行分類,并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究,將一個(gè)領(lǐng)域所取得的經(jīng)驗(yàn)方便地移植到另一個(gè)領(lǐng)域。5.?dāng)U大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大,就因?yàn)樗胀?,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運(yùn)動(dòng)和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟(jì)學(xué)與其他社會(huì)科學(xué)、自然科學(xué)的聯(lián)系更加緊密,形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。6.改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的日本經(jīng)濟(jì)學(xué)家神取道宏(KandoriMichihiro,1997)對(duì)保羅·薩繆爾森(PaulSamuelson)的名言“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是‘供給’和‘需求’”,曾做過一個(gè)幽默的引申,他說,“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是‘納什均衡’”。博弈論是一種研究決策過程中各種策略相互影響的理論。在博弈論中,每個(gè)參與者都希望通過選擇最佳策略來獲取最大利益。然而,其他參與者的策略也會(huì)影響自身利益,因此博弈論涉及到一種相互依存的科學(xué)。納什均衡則是博弈論中一個(gè)重要的概念,它是指在一個(gè)博弈中,所有參與者都會(huì)選擇一種最優(yōu)策略,使得每個(gè)參與者的利益達(dá)到最大化。本文將介紹博弈論與納什均衡的基本概念、原則、應(yīng)用場(chǎng)景以及局限性。博弈論最初是由匈牙利數(shù)學(xué)家馮·諾依曼和美國(guó)經(jīng)濟(jì)學(xué)家約翰·納什共同創(chuàng)立的。它旨在研究決策過程中各種策略的相互作用,為人們?cè)诮?jīng)濟(jì)、政治和軍事等領(lǐng)域的決策提供理論支持。博弈論中最基本的概念是策略和支付,其中策略是指參與者在博弈中可以選擇的行動(dòng)方案,而支付則是指參與者在策略組合下的收益。納什均衡是一種特殊的博弈均衡,它要求所有參與者都選擇一種最優(yōu)策略,使得每個(gè)參與者的利益達(dá)到最大化。在一個(gè)納什均衡中,每個(gè)參與者都清楚其他參與者的策略,并且會(huì)根據(jù)其他參與者的策略來選擇自己的最優(yōu)策略。理性原則:在博弈論中,每個(gè)參與者都是理性的,即每個(gè)參與者都會(huì)選擇對(duì)自己最有利的策略。在納什均衡中,每個(gè)參與者都會(huì)選擇最優(yōu)策略,使得自己的利益最大化?;セ菰瓌t:在博弈論中,每個(gè)參與者都希望獲得最大利益,但是其他參與者的利益也會(huì)影響自身利益。因此,一個(gè)好的博弈論策略應(yīng)該考慮到其他參與者的利益,尋求一種互惠的均衡狀態(tài)。經(jīng)濟(jì)學(xué):在經(jīng)濟(jì)學(xué)中,博弈論與納什均衡被廣泛應(yīng)用于市場(chǎng)壟斷、價(jià)格戰(zhàn)、勞資談判等領(lǐng)域。這些領(lǐng)域的決策過程都涉及到多個(gè)利益相關(guān)方的相互影響和依存關(guān)系。政治學(xué):在政治學(xué)中,博弈論與納什均衡被用于分析國(guó)際關(guān)系、選舉競(jìng)爭(zhēng)和軍備競(jìng)賽等。這些領(lǐng)域的決策過程都涉及到多個(gè)國(guó)家或政治實(shí)體的相互影響和制約。生物學(xué):在生物學(xué)中,博弈論與納什均衡被用于解釋生物種群演化、生態(tài)系統(tǒng)平衡以及生物之間的競(jìng)爭(zhēng)與合作等現(xiàn)象。這些領(lǐng)域的決策過程都涉及到多個(gè)生物個(gè)體的相互影響和適應(yīng)環(huán)境的能力。博弈論與納什均衡的優(yōu)點(diǎn)在于它們提供了一種系統(tǒng)的分析框架,用于研究決策過程中各種策略的相互作用以及如何實(shí)現(xiàn)最優(yōu)決策。然而,它們也存在一些局限性:假設(shè)局限:博
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)用高頻儀器設(shè)備相關(guān)行業(yè)投資方案范本
- 科學(xué)探究精神的培養(yǎng)策略計(jì)劃
- 家庭與學(xué)校合作共育的重要性計(jì)劃
- 酒店新員工入職培訓(xùn)
- 圖書館書籍保護(hù)與修復(fù)工作的重要性計(jì)劃
- 糖尿病患者血脂管理中國(guó)專家共識(shí)(2024版)解讀
- 教師培訓(xùn)課件:個(gè)體輔導(dǎo)咨詢理論與技術(shù)
- 2024年浙江省嘉興市中考英語三模試卷
- 《敦煌旅游資源分析》課件
- 《項(xiàng)目經(jīng)理培訓(xùn)教程》課件
- TCBA 220-2021遠(yuǎn)程銀行人工智能客服評(píng)價(jià)指標(biāo)規(guī)范
- 相位生成載波(PGC)調(diào)制與解調(diào)(包含MATLAB代碼)
- 發(fā)動(dòng)機(jī)低溫啟動(dòng)技術(shù)
- 八年級(jí)親子共評(píng)
- 國(guó)開電大行管本科《城市管理學(xué)》期末考試考試總題庫2024珍藏版
- 父親的露珠-閱讀附答案(2019浙江紹興中考試題)-記敘文閱讀及答案
- 精裝房裝修開發(fā)營(yíng)銷策劃
- 培養(yǎng)孩子的品德與人格塑造
- 《售后提升滿意度》課件
- 南宋官窯教學(xué)課件
- 種子銷售計(jì)劃書
評(píng)論
0/150
提交評(píng)論