




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、博弈論與信息經(jīng)濟(jì)學(xué)(Game Theory and Information Economics )張玲玲中國科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動(dòng)態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟(jì)學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡三 應(yīng)用舉例博弈的戰(zhàn)略表述案例
2、- 房地產(chǎn)開發(fā)項(xiàng)目-假設(shè)有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時(shí),每棟售價(jià)1.4億,需求小時(shí),售價(jià)7千萬;如果市場上只有一棟樓需求大時(shí),可賣1.8億需求小時(shí),可賣1.1億博弈戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一 博弈擴(kuò)展式表述博弈的擴(kuò)展式表述包括三個(gè)要素:參與人集合每個(gè)參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個(gè)參與人的支付進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場進(jìn)入阻撓博
3、弈樹不可置信威脅合作(40,50)斗爭(-10,0)房地產(chǎn)開發(fā)博弈4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié)
4、,終點(diǎn)結(jié)枝結(jié),初始結(jié) 信息集一 博弈擴(kuò)展式表述博弈的基本構(gòu)造結(jié): 包括決策結(jié)和終點(diǎn)結(jié)兩類;決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿足傳遞性和非對稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。枝: 枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.信息集: 每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):1 每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2 該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開
5、發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時(shí)不確切地知道自然的選擇; B的決策結(jié)由4個(gè)變?yōu)?個(gè)房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) 房地產(chǎn)開發(fā)博弈一 博弈擴(kuò)展式表述只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后
6、行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀測到自然的行動(dòng)。不同的博弈樹可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。 B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) A既不知道N也不知道B的選擇 N開發(fā)不開發(fā)AA大小1/21/2BBBA開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)N開發(fā)不開發(fā)BB大小1/21/2AAAA開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,
7、1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) A? 房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)二 占優(yōu)戰(zhàn)略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的擴(kuò)展式表述囚徒困境博弈的擴(kuò)展式表述智豬博弈的擴(kuò)展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡擴(kuò)展
8、式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例博弈的劃分博弈的劃分:從參與人行動(dòng)的先后順序:靜態(tài)博弈和動(dòng)態(tài)博弈靜態(tài)博弈:參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈:參與人行動(dòng)有先后順序,且后行動(dòng)者能夠觀察先行動(dòng)者選擇的行動(dòng)。博弈的劃分參與人對其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí):完全信息博弈和不完全信息博弈。完全信息:每一個(gè)參與人對所有其他參與人的(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的 知識(shí),否則為不完全信息。博弈的劃分: 行動(dòng)順序
9、信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)完全信息靜態(tài)博弈的特點(diǎn)?占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)考慮下列問題:一個(gè)博弈可能有多個(gè)(甚至無窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最
10、優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動(dòng)有先有后,后行動(dòng)者的選擇空間依賴于前行動(dòng)者的選擇,前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對后行動(dòng)者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開。一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述擴(kuò)展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結(jié)果:存
11、在三個(gè)純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個(gè)均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個(gè)均衡結(jié)果將最終出現(xiàn)?需求小的情況完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。承諾行動(dòng)與子博弈精練納什均衡承諾行動(dòng)與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參
12、與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動(dòng).完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒有可能.承諾行動(dòng)與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈 如果在A決策之前,B與某客戶簽定了一個(gè)合同,規(guī)定B若不在特定時(shí)期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個(gè)合同就是承諾行動(dòng).(1,-3.5)完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1
13、965) 曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計(jì),令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什
14、么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則,戰(zhàn)略必須是完備的。擴(kuò)展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動(dòng)的相機(jī)行動(dòng)方案。在擴(kuò)展式博弈里,參與人是相機(jī)行事,即“等待”博弈到達(dá)一個(gè)自己的信息集
15、(包含一個(gè)或多個(gè)決策結(jié)后,再采取行動(dòng)方案。什么是動(dòng)態(tài)博弈?擴(kuò)展式表述博弈的納什均衡若A先行動(dòng),B在知道A的行動(dòng)后行動(dòng),則A有一個(gè)信息集,兩個(gè)可選擇的行動(dòng),戰(zhàn)略空間為:(開發(fā),不開發(fā));B有兩個(gè)信息集,四個(gè)可選擇的行動(dòng),B有四個(gè)純戰(zhàn)略:開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā);追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā);對抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā);不開發(fā)策略不論A開發(fā)不開發(fā)我不開發(fā),簡寫為:(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號內(nèi)的第一個(gè)元素對應(yīng)A選擇“開發(fā)”時(shí)B的選擇,第二個(gè)元素對應(yīng)A選擇“不開發(fā)”時(shí)B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-
16、3)(1,0)(0,1)(0,0)不開發(fā)xx什么是參與人的戰(zhàn)略?擴(kuò)展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx開發(fā),(開發(fā),不開發(fā))納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個(gè)均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果擴(kuò)展式-3, -3-3, -31, 01, 00, 10, 00, 10
17、, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx開發(fā),(開發(fā),不開發(fā))路徑在擴(kuò)展式博弈中,所有n個(gè)參與人的一個(gè)純戰(zhàn)略組合決定了博弈樹上的一個(gè)路徑。(開發(fā),不開發(fā),開發(fā))決定了博弈的路徑為A開發(fā)B不開發(fā)-(1,0)(不開發(fā),開發(fā),開發(fā))決定了路徑:?第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題
18、三 應(yīng)用舉例子博弈精煉納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟(jì)學(xué)透視里發(fā)表文章,提出一個(gè)例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個(gè)關(guān)起來,關(guān)起來比沒有玩具更可怕。現(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸
19、。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會(huì)使你的境遇變得更壞,所以你不會(huì)告狀,因此哥哥對弟弟的警告置之不理。的確,如果弟弟是會(huì)算計(jì)自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好。可見,弟弟是理性人,他的告狀威脅是不可置信的。擴(kuò)展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡: (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))兩個(gè)均衡結(jié)果: (開發(fā),不開發(fā)) (不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個(gè)均衡結(jié)果將最終出現(xiàn)?子
20、博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)) 如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開發(fā),A預(yù)測到自己的選擇對B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A選擇開發(fā),B選擇不開發(fā)。xx 對于(不開發(fā),(開發(fā),開發(fā)),這個(gè)組合之所以構(gòu)成納什均衡,是因?yàn)锽威脅不論A開發(fā)還是不開發(fā),他都將選擇開發(fā),A相信了B的威脅,不開發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢? 畢竟,如果A真開發(fā),B選擇開發(fā)得-3,不開發(fā)得0,所以B的最
21、優(yōu)選擇是不開發(fā)。如果A知道B是理性的,A將選擇開發(fā),逼迫B選擇不開發(fā)。自己得1,B得0,即納什均衡(不開發(fā),(開發(fā),開發(fā))是不可置信的。因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅。 同樣: (不開發(fā),不開發(fā))也是一個(gè)不可置信威脅,納什均衡(開發(fā),(不開發(fā),不開發(fā))是不合理的。子博弈精練納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。什么是子博弈,什么是子博弈精練納什均衡?有沒有更好的方法找到子博弈精練納什均衡?完全信息動(dòng)態(tài)博弈-子博弈精練納什均
22、衡澤爾騰(1965)子博弈:是原博弈的一部分,它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析:(1)子博弈必須從一個(gè)單結(jié)信息點(diǎn)開始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié),則這兩個(gè)都不可以作為子博弈的初始結(jié)(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x和x在原博弈中屬于同一信息集時(shí),他們在子博弈中才屬于同一信息集。習(xí)慣上,任何博弈的本身稱為自身的一個(gè)子博弈。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不
23、開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0)(-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個(gè)子博弈,否則的話,參與人B的信息將被切割。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)子博弈精練
24、納什均衡: 擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)成 在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)不開發(fā) 判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈精練納什均衡?不開發(fā)bc完全信息動(dòng)態(tài)博弈-子博弈精
25、練納什均衡澤爾騰(1965)如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)戰(zhàn)略是參與人行動(dòng)規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個(gè)決策結(jié))上選擇什么行動(dòng),即使這種情況實(shí)際上沒有發(fā)生(甚至參與人并不預(yù)期它會(huì)發(fā)生)。因此,只有當(dāng)一個(gè)戰(zhàn)略規(guī)定
26、的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個(gè)合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動(dòng)規(guī)則。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)2(2,2)R 給定博弈達(dá)到最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡 倒數(shù)第二個(gè)決策
27、結(jié),找倒數(shù)第二個(gè)的最優(yōu)選擇,這個(gè)最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)成一個(gè)納什均衡。 如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個(gè)納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個(gè)過程的最后一步得到整個(gè)博弈的納什均衡完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個(gè)最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)1UDL(1,1)22,0RU(3,0)(0,
28、2)2D 子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。如果博弈由多個(gè)階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場進(jìn)入阻撓博弈樹不可置信威脅支付函數(shù)行動(dòng)合作(40,5
29、0)斗爭(-10,0)作業(yè)強(qiáng)盜分贓(向前展望,倒后推理)有5個(gè)強(qiáng)盜搶得10枚硬幣,在如何分贓上爭論不休,于是他們決定:(1)抽簽決定個(gè)人的號碼(1,2,3,4,5)(2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同于就通過,否則他被扔進(jìn)大海喂鯊魚;(3)1號死后,2號提方案,4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意時(shí)方案通過,否則2號被扔進(jìn)大海;(4)依次類推,知道找到一個(gè)每個(gè)人都接受的方案(當(dāng)然,如果只剩5號,他獨(dú)吞)結(jié)果會(huì)如何?作業(yè)強(qiáng)盜1234501001000098011970120970102完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)練習(xí):-作業(yè)6參與人1(丈夫)和參與人2(
30、妻子)必須獨(dú)立決定出門時(shí)是否帶傘。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘,下雨時(shí)帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會(huì)下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對方的決策);(2)兩人在出門前都不知道是否會(huì)下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會(huì)下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,
31、丈夫后決策.第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三 應(yīng)用舉例承諾行動(dòng)與子博弈精練納什均衡承諾行動(dòng)與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動(dòng).完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒有可能(破釜沉舟).不完
32、全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒有可能.承諾行動(dòng)與子博弈精練納什均衡 曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計(jì),令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。承諾行動(dòng)與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈 如果在A決策之前,B與某客戶簽定了一個(gè)合同,規(guī)定B若不在特定時(shí)期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個(gè)合同就是
33、承諾行動(dòng).(1,-3.5)承諾行動(dòng)與子博弈精練納什均衡經(jīng)常有這樣的情況,非理性-通常是自動(dòng)的而不是策略性的-是一個(gè)優(yōu)勢。在電影怪愛博士中的末日機(jī)器就是一個(gè)例子。前蘇聯(lián)認(rèn)為不可能在一場理性的軍備競賽中超過更富有的美國,所以,他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動(dòng)炸毀整個(gè)世界。著部電影描述了這樣一個(gè)細(xì)節(jié),你必須告訴對方你有這么一個(gè)末日機(jī)器。據(jù)說前美國總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對這個(gè)策略更復(fù)雜的看法:我稱為瘋子理論,我要讓北越相信我已經(jīng)到了無論付出多少都要結(jié)束戰(zhàn)爭的地步,我們只要他聽到這樣的傳聞:“看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時(shí)候,我們沒法制止他,他的手
34、已經(jīng)按在核按紐上了。”胡志明兩天之后會(huì)到巴黎求和的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟(jì)學(xué)透視里發(fā)表文章,提出一個(gè)例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個(gè)關(guān)起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會(huì)使你的境遇變得更壞,所以你不會(huì)告狀,因此哥哥對弟弟的警告置之不理。的確,如果弟弟是
35、會(huì)算計(jì)自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,弟弟是理性人,他的告狀威脅是不可置信的。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題多個(gè)參與人的情況蜈蚣博弈四 重復(fù)博弈和無名氏定理五 應(yīng)用舉例逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識(shí)。因此,在有多個(gè)參
36、與人或每個(gè)參與人有多次行動(dòng)機(jī)會(huì)的情況下,逆向歸納法的結(jié)果可能并非如此。多個(gè)參與人的情況(2,2)如果n很小,逆向歸納法的結(jié)果逆向歸納法與子搏弈精練納什均衡的存在問題如果n很大,結(jié)果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多個(gè)參與人的情況(2,2)如果n很大 對于參與人1,獲得2單位支付前提是所有n-1個(gè)參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個(gè)參與人選擇A的概率是p=1/2,則無限次重復(fù)博弈的納什均衡為: 廠商從生產(chǎn)高質(zhì)量的產(chǎn)品開始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,
37、之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品。 第一個(gè)消費(fèi)者選擇購買,只要廠商不曾生產(chǎn)過低質(zhì)量的產(chǎn)品,隨后消費(fèi)者繼續(xù)購買,如果廠商曾件生產(chǎn)過低質(zhì)量的產(chǎn)品,之后消費(fèi)者不再購買。重復(fù)博弈的均衡結(jié)果貼現(xiàn)因子:下一期的一單位支付在這一期的價(jià)值。重復(fù)博弈參與人不固定時(shí)的重復(fù)博弈1,1-1,20,00,0廠商消費(fèi)者購買不購買高質(zhì)量低質(zhì)量質(zhì)量博弈 廠商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤是2,但之后每階段利潤為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤,貼現(xiàn)值為1/(1- ) =2,廠商將不會(huì)生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費(fèi)者。 消費(fèi)者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時(shí),才會(huì)購買。消費(fèi)者預(yù)期不曾生產(chǎn)過
38、低質(zhì)量產(chǎn)品的廠商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選擇購買,反之亦然廠商生產(chǎn)過高質(zhì)量的產(chǎn)品.重復(fù)博弈的均衡結(jié)果 克萊因等認(rèn)為這個(gè)例子可以解釋為什么消費(fèi)者偏好去大商店購買東西而不信賴走街串巷的小商販。 西蒙等用類似博弈解釋雇傭關(guān)系,認(rèn)為,企業(yè)存在的原因之一正式創(chuàng)造一個(gè)“長期的參與人”,這樣一個(gè)參與人由于對未來利益的考慮而更講信用。重復(fù)博弈未來影響現(xiàn)在對未來的預(yù)期,是影響我們行為的重要因素。一種是預(yù)期的收益,一種是預(yù)期的風(fēng)險(xiǎn)。地?cái)?、車站、旅游點(diǎn)不但服務(wù)質(zhì)量差,而且假貨橫行公共汽車上,兩個(gè)陌生人會(huì)為座位而爭吵,但是如果他們互相認(rèn)識(shí)為什么現(xiàn)代城市人的關(guān)系如此冷漠?為什么不文明行為屢禁不止?第三章 完全信息動(dòng)態(tài)搏
39、弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡斯坦克爾伯的寡頭競爭模型企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2;行動(dòng)順序:企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀測到q1,然后選 擇自己的產(chǎn)量q2。支付: 利潤,利潤是兩個(gè)企業(yè)產(chǎn)量的函數(shù)斯坦克爾伯的寡頭競爭模型qi :第i個(gè)企業(yè)的產(chǎn)量C:代表單位不變成本假定逆需求函數(shù)為:第i個(gè)企業(yè)的利潤函數(shù)為:企業(yè)1企業(yè)2斯坦克爾伯的寡頭競爭模型用你向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的
40、最優(yōu)選擇。企業(yè)2的問題是:最優(yōu)化一階條件意味著:因?yàn)槠髽I(yè)1預(yù)測到企業(yè)2將根據(jù)S2(q1)來選擇q2,企業(yè)1在第1階段的問題是:斯坦克爾伯的寡頭競爭模型均衡結(jié)果比較壟斷情況下庫諾特寡頭競爭模型斯坦克爾伯寡頭競爭模型產(chǎn)量A:A:B:B:總產(chǎn)量利潤A:A:B:B:總利潤斯坦克爾伯的寡頭競爭模型從上述計(jì)算可以看出:斯坦克爾伯的均衡總產(chǎn)量大于庫諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯的均衡產(chǎn)量小于庫諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤大于在庫諾特博弈中的利潤,企業(yè)2的利潤卻有所下降,這就是所謂的“先動(dòng)優(yōu)勢”。 擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)
41、1先行動(dòng)的承諾價(jià)值 :企業(yè)1之所以獲得斯坦克爾伯利潤而不是庫諾特利潤,是因?yàn)樗漠a(chǎn)品一旦生產(chǎn)出來就變成了一種積淀成本,無法改變,從而使企業(yè)2不得不承認(rèn)它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會(huì)相信她的威脅的。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境輪流出價(jià)的討價(jià)還價(jià)模型分蛋糕的動(dòng)態(tài)博弈游戲規(guī)則:第一輪由第一個(gè)參與人(小鵑)提出條件,第二個(gè)參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進(jìn)入第二輪;小明提
42、出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進(jìn)入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個(gè)人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會(huì)怎樣?輪流出價(jià)的討價(jià)還價(jià)模型第二種情況:桌上放了一個(gè)冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何? 博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若論述是奇數(shù),則小鵑得到(n+1)/2
43、n;小明得到(n-1)/(2n)輪流出價(jià)的討價(jià)還價(jià)模型通常情況下,在一個(gè)漫長的多輪的討價(jià)還價(jià)過程匯總,誰第一個(gè)提出條件并不重要?!巴讌f(xié)”的幾乎一半對一半的解決方案看來還是難以避免的。如果談判長時(shí)間陷入僵持狀態(tài),“勝方”大概什么也得不到,“敗方”自然也不會(huì)更好。最后一個(gè)提出條件的人可以得到“全部”,而全部有可能是什么也沒有,所謂“贏得戰(zhàn)役而輸?shù)魬?zhàn)爭”。參與人應(yīng)該把握第一個(gè)提出條件的機(jī)會(huì),提出一個(gè)剛好足以引誘對方接受的條件。思考:如果討價(jià)還價(jià)過程真象上面那樣,為什么罷工還會(huì)出現(xiàn)?第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重
44、復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境囚徒的救贖好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個(gè)被冤屈的囚犯如何憑著堅(jiān)定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過好的策略合作,擺脫“困境”的詛咒。囚徒的救贖 什么是最好的策略? 在“囚徒困境”中表現(xiàn)最好的策略直接取決于對方采用的策略,特別是取決于這個(gè)策略為發(fā)展雙方合作留出了多大的余地。這個(gè)原則的基礎(chǔ)是下一步相對于當(dāng)前一步的權(quán)重足夠大,即未來是重要的。重復(fù)博弈-囚徒困境-冷酷戰(zhàn)略無限次重復(fù)博弈囚徒困境博弈重復(fù)無窮次,結(jié)果如何?證明得出,如果參與人有足夠的耐心,(抵賴,抵賴)是一個(gè)子博弈
45、精練納什均衡結(jié)果)。冷酷戰(zhàn)略(1)開始選擇抵賴;(2)選擇抵賴一直到有一方選擇了坦白,然后永遠(yuǎn)選擇坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴 無限次重復(fù)博弈使其走出了囚徒困境,背后的原因是: 如果博弈重復(fù)無窮次而且每個(gè)人有足夠的耐心,任何短期機(jī)會(huì)主義行為的所得都是微不足道的,參與人有積極性為自己建立一個(gè)樂于合作的聲譽(yù),同時(shí)也有積極性懲罰對方的機(jī)會(huì)主義的行為。囚徒的救贖-一報(bào)還一報(bào)一報(bào)還一報(bào)如果重復(fù)博弈多次,就有報(bào)復(fù)的機(jī)會(huì),這種懲罰的規(guī)則是:人家對你怎么做,你就對他怎么做:如果他上次背叛了你,你這次背叛他;如果上次他與你合作,你這次就選擇與他合作。一報(bào)還一報(bào)能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。囚徒的救贖-一報(bào)還一報(bào)艾克謝羅德認(rèn)為,一報(bào)還一報(bào)體現(xiàn)了這個(gè)策略符
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國核酸保存試劑行業(yè)市場前景預(yù)測及投資價(jià)值評估分析報(bào)告
- 2025秋五年級語文上冊統(tǒng)編版-【22 鳥的天堂】交互課件
- 文具店計(jì)劃書
- 汽修學(xué)徒安全合同協(xié)議書
- 中國泡沫塑料項(xiàng)目商業(yè)計(jì)劃書
- 2025年中國細(xì)胞灌注培養(yǎng)基行業(yè)市場占有率及投資前景預(yù)測分析報(bào)告
- 環(huán)保項(xiàng)目計(jì)劃書
- 資金入股投資合同協(xié)議書
- 洗臉吧項(xiàng)目計(jì)劃書
- 合作盈利合同協(xié)議書模板
- 高中生物必修一實(shí)驗(yàn)通知單
- 運(yùn)動(dòng)員健康證明表
- 課件:第四章 社會(huì)工作項(xiàng)目的執(zhí)行(《社會(huì)工作項(xiàng)目策劃與評估》課程)
- 冷庫施工組織設(shè)計(jì)施工方案
- 咯血診斷與治療課件
- 醫(yī)學(xué)影像專業(yè)個(gè)人簡歷
- 檢驗(yàn)科 醫(yī)院感染管理質(zhì)量督查評分表
- 獨(dú)立性檢驗(yàn) 公開課比賽一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件
- 網(wǎng)絡(luò)信息系統(tǒng)癱瘓演練PDCA改進(jìn)
- 高分子材料成型加工基礎(chǔ)添加劑及配方設(shè)計(jì)課件
- 水泥水化熱實(shí)驗(yàn)原始記錄
評論
0/150
提交評論