博弈論教程(3)_第1頁
博弈論教程(3)_第2頁
博弈論教程(3)_第3頁
博弈論教程(3)_第4頁
博弈論教程(3)_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、簡明博弈論教程博弈論知 己 知 彼 百 戰(zhàn) 不 殆2第二講第二講完全信息靜態(tài)博弈完全信息靜態(tài)博弈1.1.占優(yōu)均衡占優(yōu)均衡2.2.納什均衡及應(yīng)用納什均衡及應(yīng)用3.3.零和博弈零和博弈4.4.混合策略納什均衡混合策略納什均衡5.5.納什均衡的存在性與多重性納什均衡的存在性與多重性2.2.納什均衡及應(yīng)用納什均衡及應(yīng)用.顫抖的手完美均衡納什多重均衡1994年諾貝爾經(jīng)濟(jì)學(xué)獎得主澤爾騰,利用人類行為包括非理性因素(局中人會犯錯誤)這一特點(diǎn),1975年提出的一個策略組合是顫抖的手完美均衡是,要有如下性質(zhì):各局中人要采用的策略,不僅在其他局中人不犯錯誤時是最優(yōu)的,而且在其他局中人偶爾犯錯誤時還是最優(yōu)的,是一種

2、穩(wěn)定的均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆3顫抖的手完美均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆41 存在占優(yōu)均衡?存在納什均衡?2 用劃線法求納什均衡乙乙甲B1B2B3A13, 0-1,-16,-1A2-1,-10, 3-1,-2A3-1, 6-2,-14, 4顫抖的手完美均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆52 用劃線法求納什均衡 (A1,B1),(A2,B2)乙乙甲B1B2B3A13, 0-1,-16,-1A2-1,-10, 3-1,-2A3-1, 6-2,-14, 4顫抖的手完美均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆6乙乙甲B1B2B3A13, 0-1,-16,-1A2-1,

3、-10, 3-1,-2A3-1, 6-2,-14, 42 用劃線法求納什均衡 (A1,B1),(A2,B2)3 比較(A3,B3)與(A1,B1),(A2,B2)顫抖的手完美均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆7乙乙甲B1B2B3A13, 0-1,-16,-1A2-1,-10, 3-1,-2A3-1, 6-2,-14, 43比較(A3,B3)與(A1,B1),(A2,B2)A3與A1比較,A3嚴(yán)格劣策略,B3與B1比較,B3嚴(yán)格劣策略, (A3,B3)應(yīng)該被剔除顫抖的手完美均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆8乙乙甲B1B2B3A13, 0-1,-16,-1A2-1,-10, 3-1,

4、-2A3-1, 6-2,-14, 44 如果乙選擇了?甲怎么選?甲選.如果乙選擇了?甲怎么選?甲選.博弈論知 己 知 彼 百 戰(zhàn) 不 殆9.Cournot寡頭競爭模型寡頭競爭模型 CournotCournot,18381838,完全信息靜態(tài)博弈。完全信息靜態(tài)博弈。參與人:參與人:企業(yè)企業(yè)1 1和企業(yè)和企業(yè)2 2;企業(yè)策略:企業(yè)策略:選擇產(chǎn)量;選擇產(chǎn)量;支付:支付:利潤,是兩個企業(yè)產(chǎn)量的函數(shù)。利潤,是兩個企業(yè)產(chǎn)量的函數(shù)。 注:注:每個企業(yè)的最優(yōu)策略(產(chǎn)量)是另一個企業(yè)產(chǎn)量的函數(shù)。分析雙寡頭(任意數(shù)量)廠商的市場均衡博弈論知 己 知 彼 百 戰(zhàn) 不 殆10第第i i個企業(yè)的產(chǎn)量:個企業(yè)的產(chǎn)量: 成

5、本函數(shù):成本函數(shù):價格函數(shù):價格函數(shù):第第i i個企業(yè)的利潤函數(shù):個企業(yè)的利潤函數(shù): ),0iq)(iiqC)(21qqPP2 , 1),()(),(2121iqCqqPqqqiiii博弈論知 己 知 彼 百 戰(zhàn) 不 殆11考慮上述模型的簡單情況:考慮上述模型的簡單情況:設(shè),設(shè),價格函數(shù)取線性形式:價格函數(shù)取線性形式:最優(yōu)化最優(yōu)化一階一階條件條件分別為:分別為:222111)(,)(qcqCqcqC)(21qqaP0)(12111cqqqaq0)(22122cqqqaq2 , 1),()(),(11211211iqCqqPqqq2 , 1,.)(),(1211211iqcqqaqqq博弈論知

6、己 知 彼 百 戰(zhàn) 不 殆12反應(yīng)函數(shù)為:反應(yīng)函數(shù)為:解兩個反應(yīng)函數(shù),得納什均衡為:解兩個反應(yīng)函數(shù),得納什均衡為:每個企業(yè)的納什均衡利潤分別為:每個企業(yè)的納什均衡利潤分別為:)(21)(),(21)(11222211cqaqRqcqaqRq)(3121caqq2212211)(91),(),(caqqqq博弈論知 己 知 彼 百 戰(zhàn) 不 殆13兩個反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡:兩個反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡: ),(21qqq博弈論知 己 知 彼 百 戰(zhàn) 不 殆14與壟斷情況作比較:與壟斷情況作比較:壟斷企業(yè)的問題:壟斷企業(yè)的問題:壟斷企業(yè)的最優(yōu)產(chǎn)量:壟斷企業(yè)的最優(yōu)產(chǎn)量:壟斷利潤:壟斷利潤:

7、)(cQaQMaxQ)(32)(2121caqqcaQ2212)(92)(41cacam博弈論知 己 知 彼 百 戰(zhàn) 不 殆15結(jié)論:結(jié)論:(1 1)寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因,在)寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因,在于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時,只考慮對本于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時,只考慮對本企業(yè)利潤的影響,而忽視對另一個企業(yè)的企業(yè)利潤的影響,而忽視對另一個企業(yè)的外部負(fù)效外部負(fù)效應(yīng)應(yīng)。(2 2)從總體最優(yōu)的目標(biāo)出發(fā),既節(jié)省了資源,有)從總體最優(yōu)的目標(biāo)出發(fā),既節(jié)省了資源,有取得了更優(yōu)的效益取得了更優(yōu)的效益 石油輸出國組織規(guī)定的生產(chǎn)限額不斷被突破?石油輸出國組織規(guī)定的生產(chǎn)限額

8、不斷被突破?練習(xí)假設(shè)寡頭市場上只有兩個廠商生產(chǎn)完全相同的產(chǎn)品,兩廠商同時決定各自的產(chǎn)量,(各廠商在決定自己生產(chǎn)多少時,無法知道其它廠商的決定)。假設(shè)廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2,則總產(chǎn)量為Q= q1+ q2。市場出清價格是總產(chǎn)量的函數(shù):p(Q)=10-Q.假設(shè)沒有固定成本,邊際成本相等,即c1=c2=4.在此情況下,兩個廠商該如何進(jìn)行產(chǎn)量決策?博弈論知 己 知 彼 百 戰(zhàn) 不 殆16答案兩個廠商的收益函數(shù)為:U1(q1, q2)=q1p(Q)-c1q1 =q1 10-(q1+q2)-4q1=6q1-q1q2-q12U2(q1, q2)=q2p(Q)-c2q2 =q2 10-(q1+q

9、2)-4q2=6q2-q1q2-q22對 U1 , U2 求導(dǎo)求極值,聯(lián)立方程得q1=3-1/2* q2 q2=3-1/2* q1 q1* = q2 * =2 博弈論知 己 知 彼 百 戰(zhàn) 不 殆17博弈論知 己 知 彼 百 戰(zhàn) 不 殆183 3. . 零和博弈零和博弈 兩人零和有限策略博弈兩人零和有限策略博弈 可用矩陣形式表述??捎镁仃囆问奖硎觥?矩陣元素為局中人矩陣元素為局中人A A的贏得,亦即的贏得,亦即B B的損失。的損失。 3.1俾斯麥海之戰(zhàn)博弈論知 己 知 彼 百 戰(zhàn) 不 殆19博弈論知 己 知 彼 百 戰(zhàn) 不 殆20博弈論知 己 知 彼 百 戰(zhàn) 不 殆21零和博弈:在每種局勢下,

10、雙方收益之和為零俾斯麥海之戰(zhàn)博弈論知 己 知 彼 百 戰(zhàn) 不 殆22 日軍日軍 min 盟軍北線南線北線222南線131max232盟軍:贏得盡可能多,對方會阻止贏 選擇每個策略時,至少能贏多少,然后從中 選擇最有利的,max mina 俾斯麥海之戰(zhàn)博弈論知 己 知 彼 百 戰(zhàn) 不 殆23 日軍日軍 min 盟軍北線南線北線222南線131max232日軍: 選擇每個策略時,最多損失多少,然后從中 選擇損失最少的 min maxa俾斯麥海之戰(zhàn)博弈論知 己 知 彼 百 戰(zhàn) 不 殆24 日軍日軍 min 盟軍北線南線北線222南線131max232從最壞處著想,爭取最好的結(jié)果博弈論知 己 知 彼

11、百 戰(zhàn) 不 殆25博弈論知 己 知 彼 百 戰(zhàn) 不 殆26博弈論知 己 知 彼 百 戰(zhàn) 不 殆27例:用矩陣形式表述田忌賽馬博弈(?)博弈論知 己 知 彼 百 戰(zhàn) 不 殆28博弈論知 己 知 彼 百 戰(zhàn) 不 殆29練習(xí)練習(xí) :有:有鞍點(diǎn)情形鞍點(diǎn)情形:存在最優(yōu)純策略存在最優(yōu)純策略例:例:表中數(shù)據(jù)為表中數(shù)據(jù)為I I的贏得的贏得 II III I 12316182324391104 306博弈哲學(xué)博弈哲學(xué):從最壞處考慮,爭取最好結(jié)果從最壞處考慮,爭取最好結(jié)果博弈論知 己 知 彼 百 戰(zhàn) 不 殆30練習(xí)練習(xí) :有:有鞍點(diǎn)情形鞍點(diǎn)情形:存在最優(yōu)純策略存在最優(yōu)純策略例:例:表中數(shù)據(jù)為表中數(shù)據(jù)為I I的贏得

12、的贏得 II III I 123min161882324239110104 3063max962博弈哲學(xué)博弈哲學(xué):從最壞處考慮,爭取最好結(jié)果從最壞處考慮,爭取最好結(jié)果練習(xí)判斷下列矩陣是否有純策略均衡? 9 -6 -3A= 5 6 4 (a2,b3)博弈值v=4 7 4 3 0 4 1 3B= -1 3 0 2 (a1,b1) 博弈值v=0 -1 -1 4 1博弈論知 己 知 彼 百 戰(zhàn) 不 殆31博弈論知 己 知 彼 百 戰(zhàn) 不 殆32l “包袱剪刀錘包袱剪刀錘”游戲中,如何出手才能贏?游戲中,如何出手才能贏?l 網(wǎng)球選手為什么苦練反手?網(wǎng)球選手為什么苦練反手?l 乒乓球比賽中,為什么發(fā)球一方

13、會有優(yōu)勢?乒乓球比賽中,為什么發(fā)球一方會有優(yōu)勢?3.2 無鞍點(diǎn)情形:最優(yōu)混合策略無鞍點(diǎn)情形:最優(yōu)混合策略無無鞍點(diǎn)情形:鞍點(diǎn)情形:最優(yōu)混合策略最優(yōu)混合策略本節(jié)主要內(nèi)容猜謎游戲“石頭剪子布”博弈33博弈論知 己 知 彼 百 戰(zhàn) 不 殆猜謎游戲2正面反面1正面-1,11,-1反面1,-1-1,134博弈論知 己 知 彼 百 戰(zhàn) 不 殆“石頭剪子布”博弈2石頭剪子布1石頭0,01,-1-1,1剪子-1,10,01,-1布1,-1-1,10,035博弈論知 己 知 彼 百 戰(zhàn) 不 殆博弈論知 己 知 彼 百 戰(zhàn) 不 殆363.2 無無鞍點(diǎn)情形:鞍點(diǎn)情形:最優(yōu)混合策略最優(yōu)混合策略例:例: II III I

14、 12min111552797max11?yyxx1 ,(),();1 ,(),(2121設(shè)最設(shè)最優(yōu)優(yōu)混合策略混合策略:博弈論知 己 知 彼 百 戰(zhàn) 不 殆37對局中人對局中人I:博弈論知 己 知 彼 百 戰(zhàn) 不 殆38I I的最優(yōu)混合策略為的最優(yōu)混合策略為 同理,同理,IIII的最優(yōu)混合策略為的最優(yōu)混合策略為G G8 8同理可求局中人同理可求局中人IIII的最優(yōu)混合策略(的最優(yōu)混合策略(?))21,21(),(21)43,41(),(21 在完全信息博弈中,如果在每個給定信息下,只能選擇一種特定策略,這個策略為純策略(pure strategy)。如果在每個給定信息下只以某種概率選擇不同策略

15、,稱為混合策略(mixed strategy)。 混合策略是純策略在空間上的概率分布,純策略是混合策略的特例。純策略的收益可以用效用表示,混合策略的收益只能以預(yù)期效用表示。39博弈論知 己 知 彼 百 戰(zhàn) 不 殆 定義3.1 如果人和參與人在給定的其他參與人的混合策略下選擇的混合策略都是最大化自己平均支付的混合策略,則構(gòu)成一個混合策略納什均衡。40博弈論知 己 知 彼 百 戰(zhàn) 不 殆策略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機(jī)行動方案”。純策略:如果一個策略規(guī)定參與人在每一個給定的信息情況下只選擇一種特定的行動,稱為純策略,簡稱“策略”

16、 ,即參與人在其策略空間中選取唯一確定的策略?;旌喜呗裕喝绻粋€策略規(guī)定參與人在給定的信息情況下以某種概率分布隨機(jī)地選擇不同的行動,稱為混合策略。參與人采取的不是明確唯一的策略,而是其策略空間上的一種概率分布。41博弈論知 己 知 彼 百 戰(zhàn) 不 殆42 對于任意混合策略組合: 若各參與人最終確定的組合(純策略組合)為 參與人的支付為 發(fā)生此情況的概率為參與人的期望效用:121(,),(,)iniiimipp pppppP12121(,),)nijjnjiiimsssSss1212(,)nijjnju sss1212njjnjppp121212121212111( )(,)nnnnmmmijjnjijjnjjjjE pppp u sss 博弈論知 己 知 彼 百 戰(zhàn) 不 殆2正面反面1正面-1,11,-1反面1,-1-1,143博弈論知 己 知 彼 百 戰(zhàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論