第五講 完全信息 動態(tài)_第1頁
第五講 完全信息 動態(tài)_第2頁
第五講 完全信息 動態(tài)_第3頁
第五講 完全信息 動態(tài)_第4頁
第五講 完全信息 動態(tài)_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五講完全信息動態(tài)博弈 前面講述的納什均衡有三個問題:第一,納什均衡的多重性,但這并不是納什均衡最嚴(yán)重的問題;第二,在納什均衡中,參與人在選擇自己的策略時,把其他參與人的策略當(dāng)作是給定的,不考慮自己的選擇如何影響對手的策略。動態(tài)博弈時這就有問題了。當(dāng)一個人行動在先,另一個人行動在后時,后者自然會理性地預(yù)期這一點(diǎn),所以不可能不考慮自己的選擇對其對手選擇的影響。第三,這由第二個問題引發(fā)來,由于不考慮自己選擇對別人選擇的影響,納什均衡允許了不可置信威脅的存在。 威脅是指一個參與人承諾一旦其他參與人偏離均衡,他將采取的某種行動,威脅是有 一定影響力的,盡管可能它從未被實施過。 在位者 默許 斗爭 進(jìn)入

2、 40,50 -10,0進(jìn)入者 不進(jìn)入 0,300 0,300 市場進(jìn)入博弈中,如若進(jìn)入者真的進(jìn)入,在位者的最優(yōu)行動顯然是默許而不是斗爭,因為默許帶來50的利潤,所以斗爭就是一種不可置信的威脅。但納什均衡概念承認(rèn)了這種不可置信的威脅,所以(不進(jìn)入,斗爭)就成為一個納什均衡。 R (0,0) U L (3,1) D (2,2) 修改的市場進(jìn)入博弈12 試說明上述不可置信的威脅是什么? 現(xiàn)實生活中的例子:父親堅決不同意女兒的婚事,威脅說,如果女兒不與相愛的人斷絕關(guān)系,他就與女兒斷絕父女關(guān)系。逆向歸納法 逆向歸納法可以排除不可置信的威脅。之所以可以如此,根本原因在于采用了一種分析動態(tài)博弈的有效方法逆

3、向歸納法,即從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法。一般方法是:從最后一階段開始分析,每一次確定出所分析階段博弈方的選擇和路徑,然后再確定前一階段的博弈方選擇和路徑。借錢投資問題 設(shè)甲準(zhǔn)備投資開采一個價值4萬元的金礦,但缺1萬元資金,而乙正好有1萬元可以投入。甲向乙借這1萬元用于開礦,并承諾收益雙方平分。假設(shè)金礦的價值經(jīng)權(quán)威探測,是確實的。乙是否應(yīng)該借錢給甲呢? 乙最關(guān)心的是甲得到金子后是否履行諾言跟乙平分收益。萬一甲采到金子后不分收益,甚至賴賬,乙連本錢都收不回來 。 我們用下面的擴(kuò)展形的方法分析:借款投資的擴(kuò)展形(

4、博弈樹) 乙甲借不借分不分(2,2)(0,4)(1,0)分析 乙先決策:不借,則博弈結(jié)束,乙保住自己的1萬元,但得不到投資利潤。若乙選擇借,則到博弈的另一階段,由甲決策:分或是不分。不論分與不分,博弈都將結(jié)束。分,則皆大歡喜,甲得到了2萬元采金收益,乙的1萬元投資也增值到2萬元。不分,則甲獨(dú)得4萬元,而乙則一無所有。 乙清楚自己的處境,他決策完全取決于甲的分錢承諾是否可信。不考慮道德因素,甲的分錢承諾并不可信。因為,甲不分才能使自己收益最大化。所以,本博弈以乙不借錢而結(jié)束。改進(jìn) 本博弈因為甲的不可信的分錢承諾而使甲乙的合作沒有成功,開礦帶來的3萬元的社會效益也沒能實現(xiàn)。能否改進(jìn)措施,使甲的承諾

5、變?yōu)榭尚??我們增加一個對甲的行為的制約。 當(dāng)甲選擇分錢時,雙方達(dá)到最佳結(jié)局。當(dāng)甲選擇不分時,讓乙通過打官司來保護(hù)自己的利益,打官司乙肯定能贏,但要耗費(fèi)財力物力,假設(shè)乙除掉打官司的花費(fèi),正好收回1萬元投資,而甲的全部采金收入將被沒收。這樣,就變成了三階段的動態(tài)博弈。有可信的諾言和威脅時的博弈樹乙甲乙不借借分不分打不打(2,2)(1,0)(0,4)(1,0)分析 加上了第三博弈階段,結(jié)果就不同了。當(dāng)甲選擇不分時,乙不打官司,則什么都沒有了,但打官司可以收回自己的1萬元投資,即使不以懲罰甲帶來的心理效用來考慮,乙的打官司威脅是可信的。則甲的分錢承諾就是可信的了。所以本博弈的解應(yīng)是乙先選擇借,當(dāng)甲選擇

6、不分時選擇打官司。均衡路徑是借分。達(dá)到最佳結(jié)果。 可見,完善的法律制度,不僅能保障社會公平,還能提高社會經(jīng)濟(jì)效率。 但是要充分保障社會公平和經(jīng)濟(jì)活動的效率,法律制度必須要有足夠的震懾作用,而且法律制度要充分發(fā)揮作用,必須和人們的公平觀等價值觀、習(xí)俗等非正式制度相一致,為人們接受才能發(fā)揮作用。這樣,如果發(fā)生糾紛,人們就會求諸于法律制度,而不是私下解決。 現(xiàn)實中的法律制度總不是那么理想,贏了官司反而虧了錢的事有一定的普遍性。法律保障不足時的博弈樹乙甲乙不借借分不分打不打(2,2)(-1,0)(0,4)(1,0)市場占領(lǐng)有可信威脅的情形后進(jìn)者先到者進(jìn)不進(jìn)打擊不打擊(-3,6)(5,5)(0,10)市

7、場占領(lǐng)有不可信威脅的情形先到者進(jìn)不進(jìn)打擊不打擊(-3,6)(5,8)(0,10)后進(jìn)者分析 前一個圖中,當(dāng)后來者選擇進(jìn)入市場時,先到者打擊的收益是6,不打擊的收益是5,因此,打擊是一個可信的威脅,那么后來者選擇進(jìn)得-3,不進(jìn)得0,當(dāng)然應(yīng)選擇不進(jìn)。 后一個圖中,當(dāng)后來者選擇進(jìn)入市場時,先到者打擊的收益是6,不打擊的收益是8,因此,打擊是一個不可信的威脅,那么后來者選擇進(jìn)得5,不進(jìn)得0,當(dāng)然應(yīng)選擇進(jìn)。 后一種情形是可能的。當(dāng)后進(jìn)者進(jìn)入市場后,進(jìn)一步開拓了市場,其得益并非從前者手中奪取的。子博弈完美納什均衡 澤爾騰(1965)提出了“子博弈完美納什均衡”(sub-game perfect Nash

8、equilibrium)概念的目的就是要將那些包含不可置信威脅策略的納什均衡從均衡中剔除,從而給出動態(tài)博弈結(jié)果的一個合理預(yù)測。 子博弈是一個對于所有參與人的信息集來說都是單結(jié)的結(jié),這個結(jié)的后續(xù)結(jié)以及在相應(yīng)的終點(diǎn)結(jié)處的支付這三個要素所組成的博弈。 一個策略組合是一個完美子博弈納什均衡,如果:1它是整個博弈的納什均衡;2它是每個子博弈的納什均衡。 跟隨領(lǐng)頭羊表明只要添加一點(diǎn)復(fù)雜性,就使得策略式表述變得晦澀難懂,幾無用武之地。策略式如下。 瓊斯 L/L,L/S L/L,S/S S/L,L/S S/L,S/S 大 2,2 2,2 -1,-1 -1,-1 史密斯 小 -1,-1 1,1 -1,-1 1,

9、1 均衡 策略 結(jié)果 E1 大,(L/L,L/S) 雙方都選擇大 E2 大,( L/L,S/S) 雙方都選擇大 E3 小, (S/L,S/S) 雙方都選擇小 在以后的分析中我們將討論均衡E1和E3可以被我們通過納什均衡的精煉所排除。 小 (1,1) 小 大 (-1,-1) 小 (-1,-1) 大 大 (2,2) 圖1擴(kuò)展式下的跟隨領(lǐng)頭羊SJ1J2 跟隨領(lǐng)頭羊有三個子博弈:(1)整個博弈;(2)從結(jié)J1開始的子博弈;(3)從結(jié)J2開始的子博弈。 E1只能在子博弈(1)和(3)上達(dá)到納什均衡; E3只能在子博弈(1)和(2)上達(dá)到納什均衡;所以只有E2在所有的子博弈上是納什均衡下面分析房地產(chǎn)開發(fā)博

10、弈 開發(fā) (-3,-3) 開發(fā) 不開發(fā) (1,0) 開發(fā) (0,1) 不開發(fā) 不開發(fā) (0,0) 房地產(chǎn)開發(fā)博弈AB1B2 1寫出房地產(chǎn)開發(fā)商博弈的策略式表達(dá) 2找出有哪幾個純策略納什均衡 3找出子博弈完美納什均衡 開發(fā)商A 開發(fā),開發(fā) 開發(fā),不開發(fā) 不開發(fā),開發(fā) 不開發(fā),不開發(fā) 開發(fā) -3,-3 -3,-3 1,0 1,0 B 不開發(fā) 0,1 0,0 0,1 0,0 有三個純策略納什均衡,(開發(fā),不開發(fā),開發(fā)), (開發(fā),不開發(fā),不開發(fā)), (不開發(fā),開發(fā),開發(fā))。 唯一的子博弈完美納什均衡是開發(fā),不開發(fā),不開發(fā))。找出子博弈完美納什均衡121UDLRDU(0,2)(0,1)(1,3)(2,

11、0) 在第三階段,參與人1的最優(yōu)選擇是U;在第二階段,因為參與人2知道,如果自己選擇R,參與人將在第三階段選擇U,因此參與人2在第二階段最優(yōu)選擇是L;在第一階段,參與人1知道,如果博弈進(jìn)入第二階段,參與人2的最優(yōu)選擇是L,因此參與人在第一階段的最優(yōu)選擇是U。 這樣均衡結(jié)果是參與人在第一階段選擇U結(jié)束。 子博弈完美納什均衡是(U, U ,L) 這里的U和L分別是參與人1和參與人2在非均衡路徑上的選擇。承諾行動與子博弈完美納什均衡 如果參與人能在博弈之前采取某種措施改變自己的行動空間或支付函數(shù),原來不可置信的承諾或威脅就可能變得可置信,博弈的精煉均衡就會相應(yīng)改變。我們將這些為改變博弈結(jié)果而采取的措

12、施稱為“承諾行動”(commitmment) 將承諾行動納入房地產(chǎn)開發(fā)博弈,如果在A決策之前,B 與某個客戶簽訂一個合同,規(guī)定B在某一時刻交付若干面積的寫字樓辦公室,如果B不履約,將賠償客戶3.5。這個合同就是一個承諾行動。有了這個承諾行動,B的開發(fā)就不再是個不可置信的威脅,而是可置信的威脅,因為此時B的最優(yōu)選擇是開發(fā),不管A的選擇是什么。子博弈納什均衡是(不開發(fā),開發(fā),開發(fā))。 在許多情況下,承諾行動對當(dāng)事人是很有價值的。特別地,有些情況下,一個參與人可以通過減少自己的選擇機(jī)會使自己受益,原因在于保證自己不選擇某些行動可以改變對手的最優(yōu)選擇。承諾行動的一個典型例子就是項羽的“破釜沉舟”。 序

13、貫理性(sequential rationality)是這樣一種概念:一個參與人在博弈的每一個點(diǎn)上都重新優(yōu)化自己的選擇并且把自己在將來會重新優(yōu)化其選擇這一點(diǎn)考慮在內(nèi)了,也就是說考慮了別人的選擇和自己的選擇的互相影響。這是忽略沉沒成本和理性預(yù)期這兩種經(jīng)濟(jì)學(xué)觀點(diǎn)的結(jié)合。如今序貫理性已經(jīng)成為均衡的標(biāo)準(zhǔn)準(zhǔn)則。子博弈完美納什均衡存在的問題 逆推歸納法最大的問題是對博弈方理性的要求太高,不僅要求所有博弈方都有高度的理性,不允許犯任何錯誤,而且要求博弈方相互了解和信任對方的理性,或者說有“理性的共同知識”。而現(xiàn)實生活中的決策者通常達(dá)不到這樣的理性高度。 這樣的話,如果其他博弈方偏離子博弈完美納什均衡,應(yīng)該怎

14、么樣進(jìn)行后面的博弈呢?121LRMNST(0,2)(0,1)(1,3)(2,0) 用逆推法可以找出該博弈的子博弈納什完美均衡為“博弈方1在第一階段選擇L,第三階段選擇T;博弈方2在第二階段選擇N”,相應(yīng)博弈路徑是博弈方1第一階段選擇L。 如果考慮到博弈方的有限理性(Bounded Rationality),博弈方1就有可能在第一階段犯錯誤,采用R而不是L。如果博弈方2是理性的,他應(yīng)該如何選擇呢? 這樣博弈方2在第二階段的選擇就出現(xiàn)了問題,博弈方2還應(yīng)該相信博弈方1是理性的嗎?或者說博弈方2應(yīng)該認(rèn)為博弈方1的錯誤是偶然發(fā)生的嗎? 澤爾滕(Selten)為了捍衛(wèi)逆推歸納法理論,將偏離行為解釋為均衡

15、的“顫抖” (trembles)他認(rèn)為,擴(kuò)展式隱含了參與人犯錯誤的可能;如果參與人在每個信息集上犯錯誤的概率是獨(dú)立的小概率(因而參與人不會犯系統(tǒng)性錯誤),那么不論過去的行為與逆推歸納法有如何的不同,參與人應(yīng)該繼續(xù)使用逆推歸納法。顫抖手均衡 博弈方相互怎樣理解對方的錯誤? 如果不相信犯錯誤的博弈方的理性,后面怎樣進(jìn)行自己的判斷?澤爾頓提出的“顫抖手均衡”思想是解決這類問題的重要思想。先用一個簡單的靜態(tài)博弈問題來說明。 2 L R U 1 D10,06,210,12,0 這里(U,R)和(D,L)都是納什均衡。如果不考慮偏差,兩個均衡都是穩(wěn)定的。 如果考慮偏差,不論多小,博弈方1選擇U都比選D好。

16、因此(D,L)就變成不穩(wěn)定的了。組合(U,R) 則不同,不論博弈方2是否偏離R,博弈方1都不必要偏離U,反過來,雖然博弈方1從U偏離到D對他的支付有不利影響,只要博弈方1偏離的可能性不超過2/3,博弈方2就不必選L,因此(U,R)是穩(wěn)定的。就是說(U,R)對于有較小的偏差來說,具有穩(wěn)定性,象這樣的策略組合稱為“顫抖手均衡”顫抖手均衡 博弈方相互怎樣理解對方的錯誤? 如果我們把上面這個博弈中博弈方1的支付作少量的改變。就使得原來的兩個納什均衡都變成了顫抖手均衡。 2 L R U 1 D9,06,210,12,0 這樣(D,L)也變成了顫抖手均衡。因為即使博弈方1仍然會考慮博弈方2偏離L錯誤選擇R

17、的可能性,但只要這種可能性小于1/5,那么博弈方1堅持選擇D,而不是選擇U 。 從上不難看出,一個策略組合要是一個顫抖手均衡,首先必須是納什均衡,其次不能包括任何“弱劣均衡”,也就是偏離對偏離者沒有損失的策略。包括弱劣策略的納什均衡不可能是顫抖手均衡,因為它經(jīng)不起任何非完全理性的“擾動”,缺乏在有限理性條件下的穩(wěn)定性,就象經(jīng)不起考驗的“愛情”,真正的“愛情” 應(yīng)該是滿足顫抖手均衡或者說是真正的“愛情” “顫抖手的愛情”。順推歸納法 顫抖手均衡只是理解博弈方錯誤和完美均衡的方法之一,現(xiàn)實中也有用順推歸納法來處理這樣的問題。 所謂順推歸納法,就是博弈方根據(jù)前面階段的行為,包括偏離特定均衡路徑的行為

18、,推斷他們的思路并為后面階段的博弈提供依據(jù)的分析方法。它考慮的是博弈方有意識偏離子博弈完美納什均衡的可能性,而不是偶然的錯誤。 2 s w 1 s w 這是一個第二階段為靜態(tài)博弈的動態(tài)博弈問題。如果第一階段1選d,則博弈結(jié)束,雙方各得2;如果1選r則第二階段有三個納什均衡:純策略的(s,w)和混合策略的雙方以1/4和3/4選s和w。rd2,20,03,11,30,0 三個均衡的平均得益都小于1選D的得益2. 博弈的均衡之一是1在第一階段選D,如果到了第二階段選w.(Dw,s)是子博弈完美納什均衡,也是顫抖手均衡。 但這個均衡是不穩(wěn)定的。第一階段1選R就是為了在第二階段選s實現(xiàn)更大收益。如果1是

19、有意這樣做,那么2在第二階段就只能選w,這樣在這個博弈中更可能實現(xiàn)的就是另一個子博弈完美納什均衡(R s,w). 這種分析的方法就是順推歸納法。作為博弈方的2要考慮的是1的有意識選擇,而不是無意的錯誤。 把上面的問題簡化為下面的靜態(tài)博弈博弈的簡化形式: 2 s w d 1 r s r w2,22,20,03,11,30,0 前面討論的主要問題是現(xiàn)實中決策者理性的局限對逆推歸納法和子博弈完美納什均衡分析預(yù)測能力的影響。似乎隱含著如果決策者滿足完全理性的假設(shè),那么博弈的結(jié)果就一定可以通過逆推歸納法和子博弈完美納什均衡分析預(yù)測,如果進(jìn)一步運(yùn)用顫抖手均衡和順推歸納法等思想,就可以得出更精確的預(yù)測。但這

20、不完全是事實,因為在動態(tài)博弈中還有其他意想不到的困難。蜈蚣博弈蜈蚣博弈 前面討論了現(xiàn)實中決策者的理性局限和逆推歸前面討論了現(xiàn)實中決策者的理性局限和逆推歸納法、子博弈完美納什均衡,如果進(jìn)一步考慮納法、子博弈完美納什均衡,如果進(jìn)一步考慮顫抖手均衡和順推歸納法,是否就可以完美的顫抖手均衡和順推歸納法,是否就可以完美的解決此類的博弈問題?解決此類的博弈問題? 12112DdDDdRrRR(1,1)(0,3)(2,2)(99,99)(98,101)r(100,100) 這是一個完全且完美信息的動態(tài)博弈。這是一個完全且完美信息的動態(tài)博弈。 如果用逆推歸納法,得到的子博弈完美納如果用逆推歸納法,得到的子博弈

21、完美納什均衡是第一階段什均衡是第一階段1選選D,博弈結(jié)束,雙方,博弈結(jié)束,雙方得益都是得益都是1。 在這里可以看出,從個體理性出發(fā)的最優(yōu)在這里可以看出,從個體理性出發(fā)的最優(yōu)選擇卻可能導(dǎo)出極差的結(jié)果。但蜈蚣博弈選擇卻可能導(dǎo)出極差的結(jié)果。但蜈蚣博弈受到重視,是直覺上的結(jié)論和分析的結(jié)果受到重視,是直覺上的結(jié)論和分析的結(jié)果不一致。不一致。 人們曾經(jīng)進(jìn)行實驗,絕大多數(shù)隨意選擇的人們曾經(jīng)進(jìn)行實驗,絕大多數(shù)隨意選擇的博弈方在進(jìn)行博弈時,都不會出現(xiàn)上述逆博弈方在進(jìn)行博弈時,都不會出現(xiàn)上述逆推歸納法給出的預(yù)測結(jié)果。推歸納法給出的預(yù)測結(jié)果。 問題在哪里?從問題在哪里?從1第一階段選第一階段選R把主動權(quán)交給把主動權(quán)交給2這一點(diǎn),可以知道,這一點(diǎn),可以知道,1的損失是的損失是1,即使,即使2選擇了選擇了d,自己的損失也不大。自己第一階段選自己的損失也不大。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論