版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、University of Science and Technology of China戰(zhàn)略博弈理論簡(jiǎn)介戰(zhàn)略博弈理論簡(jiǎn)介博弈定義博弈定義: :博弈(博弈(gamegame),又譯對(duì)策、游戲或競(jìng)賽,最早由德國(guó)數(shù)學(xué)),又譯對(duì)策、游戲或競(jìng)賽,最早由德國(guó)數(shù)學(xué)家、哲學(xué)家萊布尼茲于家、哲學(xué)家萊布尼茲于17101710年提出,它是對(duì)若干個(gè)人在年提出,它是對(duì)若干個(gè)人在“策略相互依存策略相互依存”情形下相互作用狀態(tài)的抽象表述。情形下相互作用狀態(tài)的抽象表述。University of Science and Technology of China博弈論的基本概念博弈論的基本概念 博弈核心特征博弈核心特征: :
2、有一些規(guī)則,我們叫做博弈規(guī)有一些規(guī)則,我們叫做博弈規(guī)則則 有一個(gè)結(jié)果有一個(gè)結(jié)果 策略策略 策略有相互依賴性策略有相互依賴性 University of Science and Technology of China博弈的要素博弈的要素 局中人(局中人(playersplayers) 策略(策略(strategiesstrategies) 信息(信息(informationinformation) 得益(得益(payoffpayoff) 均衡(均衡(equilibriumequilibrium) 行動(dòng)(行動(dòng)(actions or movesactions or moves) 結(jié)果(結(jié)果(outc
3、omeoutcome) University of Science and Technology of China博弈的組成要素博弈的組成要素 1 1、參與人指的是博弈中選擇行動(dòng)以最大化自、參與人指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體己效用的決策主體( (可以是個(gè)人,也可以是團(tuán)體可以是個(gè)人,也可以是團(tuán)體) ); 2 2、行動(dòng)是指參與人在博弈進(jìn)程中輪到自己選擇、行動(dòng)是指參與人在博弈進(jìn)程中輪到自己選擇時(shí)所作的某個(gè)具體決策;時(shí)所作的某個(gè)具體決策; 3 3、策略是指參與人選擇行動(dòng)的規(guī)則,即在博弈進(jìn)、策略是指參與人選擇行動(dòng)的規(guī)則,即在博弈進(jìn)程中,什么情況下選擇什么行動(dòng)的預(yù)先安排;程中,什么情況下
4、選擇什么行動(dòng)的預(yù)先安排;University of Science and Technology of China 4 4、信息指的是參與人在博弈中所知道的關(guān)于自、信息指的是參與人在博弈中所知道的關(guān)于自己以及其他參與人的行動(dòng)、策略及其得益函數(shù)等己以及其他參與人的行動(dòng)、策略及其得益函數(shù)等知識(shí);知識(shí); 5 5、得益是參與人在博弈結(jié)束后從博弈中獲、得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動(dòng)的函得的效用,一般是所有參與人的策略或行動(dòng)的函數(shù),這是每個(gè)參與人最關(guān)心的東西;數(shù),這是每個(gè)參與人最關(guān)心的東西; 6 6、均衡是所有參與人的最優(yōu)策略或行動(dòng)的、均衡是所有參與人的最優(yōu)策略或
5、行動(dòng)的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動(dòng)或效用集合。作用下,各參與人最終的行動(dòng)或效用集合。 University of Science and Technology of China博弈的分類博弈的分類 根據(jù)參與人的多少,可將博弈分為兩人博弈或多根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈;人博弈; 根據(jù)參與人是否合作,可將博弈分為合作博弈或根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈;非合作博弈; 根據(jù)博弈結(jié)果的不同,又可
6、分為零和博弈、常和根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。博弈與變和博弈。 University of Science and Technology of China 1 1、從行動(dòng)的先后次序來分,博弈可以分為靜態(tài)博、從行動(dòng)的先后次序來分,博弈可以分為靜態(tài)博弈和動(dòng)態(tài)博弈。弈和動(dòng)態(tài)博弈。靜態(tài)博弈指在博弈中,參與人同時(shí)選擇行動(dòng),或靜態(tài)博弈指在博弈中,參與人同時(shí)選擇行動(dòng),或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取了什雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);么具體行動(dòng);動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行
7、動(dòng)者所選擇的行動(dòng)的博弈。行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)的博弈。 University of Science and Technology of China 2 2、從參與人對(duì)其他參與人的各種特征信息的獲、從參與人對(duì)其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全得差異來分,博弈可分為完全信息博弈和不完全信息博弈。信息博弈。 完全信息指的是每一個(gè)參與人對(duì)所有其他完全信息指的是每一個(gè)參與人對(duì)所有其他參與人的特征,如策略集合及得益函數(shù)都有準(zhǔn)確參與人的特征,如策略集合及得益函數(shù)都有準(zhǔn)確完備的知識(shí);否則就是不完全信息。完備的知識(shí);否則就是不完全信息。 將上述兩個(gè)角度的劃分結(jié)合
8、起來,我們就將上述兩個(gè)角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動(dòng)態(tài)博弈。弈和不完全信息動(dòng)態(tài)博弈。University of Science and Technology of China行動(dòng)次序行動(dòng)次序信息信息靜態(tài)靜態(tài)動(dòng)態(tài)動(dòng)態(tài)完全信息完全信息納什均衡納什均衡納什納什子博弈精練子博弈精練納什均衡納什均衡澤爾騰澤爾騰不完全信息不完全信息貝葉斯均衡貝葉斯均衡海薩尼海薩尼精煉貝葉斯均精煉貝葉斯均衡衡澤爾騰等澤爾騰等 博弈的分類和均衡博弈
9、的分類和均衡University of Science and Technology of China博弈研究的四類問題博弈研究的四類問題1.1.合作問題合作問題2.2.競(jìng)爭(zhēng)問題競(jìng)爭(zhēng)問題3.3.共存問題共存問題4.4.承諾問題承諾問題University of Science and Technology of China博弈研究的典型問題博弈研究的典型問題1.1.囚徒困境囚徒困境2.2.智豬博弈智豬博弈3.3.斗雞博弈斗雞博弈4.4.情侶博弈情侶博弈5.5.強(qiáng)龍與地頭蛇博弈強(qiáng)龍與地頭蛇博弈6.6. 鷹鷹- -鴿博弈與種群進(jìn)化鴿博弈與種群進(jìn)化University of Science and
10、Technology of China囚徒困境囚徒困境 19501950年,由就職于蘭德公司的梅里爾年,由就職于蘭德公司的梅里爾弗勒德和梅爾文弗勒德和梅爾文德德雷希爾擬定出相關(guān)困境的理論,后來由顧問艾伯特雷希爾擬定出相關(guān)困境的理論,后來由顧問艾伯特塔克以塔克以囚徒方式闡述,并命名為囚徒方式闡述,并命名為“囚徒困境囚徒困境”。經(jīng)典的囚徒困境。經(jīng)典的囚徒困境如下:如下: 警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇:向雙方提供以
11、下相同的選擇: 若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語稱若一人認(rèn)罪并作證檢控對(duì)方(相關(guān)術(shù)語稱“背叛背叛”對(duì)對(duì)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)方),而對(duì)方保持沉默,此人將即時(shí)獲釋,沉默者將判監(jiān)1010年。年。 若二人都保持沉默(相關(guān)術(shù)語稱互相若二人都保持沉默(相關(guān)術(shù)語稱互相“合作合作”),則),則二人同樣判監(jiān)二人同樣判監(jiān)1 1年。年。 若二人都互相檢舉(相關(guān)術(shù)語稱互相若二人都互相檢舉(相關(guān)術(shù)語稱互相“背叛背叛”),則),則二人同樣判監(jiān)二人同樣判監(jiān)8 8年。年。 University of Science and Technology of China-8, -80, -10-10,
12、 0-1, -1坦 白不坦白坦 白不坦白兩個(gè)罪犯的得益矩陣嫌疑人嫌疑人 2嫌嫌疑疑人人1嫌疑人1:坦白嫌疑人2:坦白University of Science and Technology of China智豬博弈智豬博弈 假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會(huì)有的按鈕,按一下按鈕會(huì)有1010個(gè)單位的豬食進(jìn)個(gè)單位的豬食進(jìn)槽,但是誰按按鈕就會(huì)首先付出槽,但是誰按按鈕就會(huì)首先付出2 2個(gè)單位的個(gè)單位的成本,若大豬先到槽邊,大小豬吃到食物的成本,若大豬先到槽邊,大小豬
13、吃到食物的收益比是收益比是9191;同時(shí)到槽邊,收益比是;同時(shí)到槽邊,收益比是7373;小豬先到槽邊,收益比是小豬先到槽邊,收益比是6464。那么,在兩。那么,在兩頭豬都有智慧的前提下,最終結(jié)果是小豬選頭豬都有智慧的前提下,最終結(jié)果是小豬選擇等待,大豬去按鈕擇等待,大豬去按鈕 University of Science and Technology of ChinaUniversity of Science and Technology of China斗雞博弈斗雞博弈 即電影中的汽車博弈:兩個(gè)年輕人分別從一條街的兩即電影中的汽車博弈:兩個(gè)年輕人分別從一條街的兩頭,駕車筆直地是向?qū)Ψ?。第一個(gè)轉(zhuǎn)
14、向的人會(huì)顏面盡頭,駕車筆直地是向?qū)Ψ健5谝粋€(gè)轉(zhuǎn)向的人會(huì)顏面盡失,但如果沒有人轉(zhuǎn)向,將會(huì)撞在一起。其收益矩陣失,但如果沒有人轉(zhuǎn)向,將會(huì)撞在一起。其收益矩陣如下圖:如下圖: 存在兩個(gè)納什均衡:(存在兩個(gè)納什均衡:(不轉(zhuǎn)向,轉(zhuǎn)向)和(轉(zhuǎn)向,不不轉(zhuǎn)向,轉(zhuǎn)向)和(轉(zhuǎn)向,不轉(zhuǎn)向)。轉(zhuǎn)向)。A偏好第一個(gè),偏好第一個(gè),B偏好第二個(gè)。但這兩個(gè)都比偏好第二個(gè)。但這兩個(gè)都比撞車好。它和保證博弈有所區(qū)別,雙方做不相同的事撞車好。它和保證博弈有所區(qū)別,雙方做不相同的事情比做相同的事情好。情比做相同的事情好。University of Science and Technology of China年輕人年輕人A年輕人年輕
15、人B轉(zhuǎn)向轉(zhuǎn)向不轉(zhuǎn)向不轉(zhuǎn)向轉(zhuǎn)向轉(zhuǎn)向不轉(zhuǎn)向不轉(zhuǎn)向0,0-1,11,1-2,-2University of Science and Technology of China情侶博弈情侶博弈 女女 足球足球 音樂音樂 足球足球男男 音樂音樂 1 2 0 0 0 0 2 1University of Science and Technology of China強(qiáng)龍與地頭蛇博弈強(qiáng)龍與地頭蛇博弈 市場(chǎng)原經(jīng)營(yíng)者(地頭蛇)市場(chǎng)原經(jīng)營(yíng)者(地頭蛇) 商戰(zhàn)商戰(zhàn) 沉默沉默 進(jìn)入進(jìn)入 900900,1100 -20001100 -2000,600600進(jìn)入者(強(qiáng)龍)進(jìn)入者(強(qiáng)龍) 不進(jìn)入不進(jìn)入 0 0,3000 0300
16、0 0,30003000 University of Science and Technology of China鷹鷹-鴿博弈與種群進(jìn)化鴿博弈與種群進(jìn)化例如,當(dāng)兩只豺狗同時(shí)遇到一塊食物時(shí),他們必須決定例如,當(dāng)兩只豺狗同時(shí)遇到一塊食物時(shí),他們必須決定是爭(zhēng)斗還是共享食物。爭(zhēng)斗是鷹派的策略:一方將獲是爭(zhēng)斗還是共享食物。爭(zhēng)斗是鷹派的策略:一方將獲勝,另一方將敗落。共享食物是鴿派的策略:在對(duì)方勝,另一方將敗落。共享食物是鴿派的策略:在對(duì)方也是鴿派時(shí),這個(gè)策略將發(fā)揮很好的功效;但當(dāng)對(duì)方也是鴿派時(shí),這個(gè)策略將發(fā)揮很好的功效;但當(dāng)對(duì)方是鷹派時(shí),共享食物的提議則會(huì)遭到拒絕,并且,鴿是鷹派時(shí),共享食物的提議則會(huì)
17、遭到拒絕,并且,鴿派參與人將一無所獲。派參與人將一無所獲。 其收益矩陣為:其收益矩陣為: 參與人參與人參與人參與人鷹派鷹派鴿派鴿派鷹派鷹派鴿派鴿派-2,-24,00,42,2University of Science and Technology of China鷹鷹-鴿博弈的納什均衡鴿博弈的納什均衡 假定鷹派的比例是假定鷹派的比例是p。同時(shí),一個(gè)鷹派遇見另一個(gè)鷹。同時(shí),一個(gè)鷹派遇見另一個(gè)鷹派的比例是派的比例是p,而遇見一個(gè)鴿派的概率為,而遇見一個(gè)鴿派的概率為1-p。因此,。因此,鷹派的期望收益為:鷹派的期望收益為:H=-2p+4(1-p)。鴿派的期望收。鴿派的期望收益為:益為:D=2(1-p)。 假定具有較高收益的類型的繁殖速度更快一些,并假定具有較高收益的類型的繁殖速度更快一些,并且他們會(huì)將其采取策略的傾向遺傳給后一代。那么,且他們會(huì)將其采取策略的傾向遺傳給后一代。那么,我們可以預(yù)期,如果我們可以預(yù)期,如果HD,種群中鷹派的比例將會(huì),種群中鷹派的比例將會(huì)上升;如果上升;如果H1/2,鷹派的收益將小于鴿派的收益,鴿,鷹派的收益將小于鴿派的收益,鴿派的繁殖將加快,得派的繁殖將加快,得p下降。類似地,如果下降。類似地,如果P1/2,鷹派的收益將大于鴿派的收益,鷹派的繁殖速度加鷹派的收益將大于鴿派的收益,鷹派的繁殖速度加快,快,P將上升,重新回到均衡。將上升,重新回到均衡。 因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【全程復(fù)習(xí)方略】2020年人教A版數(shù)學(xué)理(廣東用)課時(shí)作業(yè):第十章-第五節(jié)古-典-概-型
- 陜西省寶雞市2025屆高三上學(xué)期高考模擬檢測(cè)(一)物理試卷(含答案)
- 【高考解碼】2021屆高三生物二輪復(fù)習(xí)專題-現(xiàn)代生物科技-基因工程、細(xì)胞工程
- 【2021屆備考】2020全國(guó)名校數(shù)學(xué)試題分類解析匯編(12月第一期):E2絕對(duì)值不等式的解法
- 北京市石景山區(qū)2024-2025學(xué)年九年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 安徽省阜陽市阜南縣大塘中學(xué)2024~2025學(xué)年八年級(jí)上學(xué)期期末模擬測(cè)生物學(xué)試卷(含答案)
- 遼寧省撫順市省重點(diǎn)高中六校2025屆高三上學(xué)期期末考試 生物(含答案)
- 《倉(cāng)儲(chǔ)經(jīng)濟(jì)效益分析》課件
- 【金版學(xué)案】2014-2021學(xué)年高中地理(人教版必修3)達(dá)標(biāo)鞏固-第三章-第二節(jié)-遙感技術(shù)的應(yīng)用
- 【師說】2022高考物理(新課標(biāo))一輪全程復(fù)習(xí)構(gòu)想檢測(cè):課時(shí)訓(xùn)練5力的合成與分解
- 《鐵路旅客運(yùn)輸規(guī)程》考試復(fù)習(xí)題及答案
- 2024初中數(shù)學(xué)競(jìng)賽真題訓(xùn)練(學(xué)生版+解析版)(共6個(gè))
- 江蘇省南通市崇川區(qū)2023-2024學(xué)年八上期末數(shù)學(xué)試題(原卷版)
- 河南省鄭州市2023-2024學(xué)年高二上學(xué)期期末考試歷史試題(解析版)
- 遼寧省沈陽市沈河區(qū)2024-2025學(xué)年九年級(jí)上學(xué)期期末道德與法治試題(含答案)
- 江西省贛州市南康區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 2023年考研(英語一)真題與答案解析
- 《制造業(yè)成本核算》課件
- 【MOOC】數(shù)學(xué)建模與創(chuàng)新實(shí)踐-西安科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 蘇教版(2024新版)七年級(jí)上冊(cè)生物期末學(xué)情評(píng)估模擬試卷(含答案)
- JBT 1306-2024 電動(dòng)單梁起重機(jī)(正式版)
評(píng)論
0/150
提交評(píng)論