




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈論主講施錫銓2004年3月第一章引論應(yīng)用及例題基本理論博弈論關(guān)注的是互相依存(interdependence)
每一個體猜測其他個體的選擇是什么?每個人將采取什么樣的行動?(當(dāng)最優(yōu)的行動依賴于其他人的所作所為時,這個問題尤其令人關(guān)注。)
這些行動產(chǎn)生什么樣的結(jié)局?對于整個群體,這個結(jié)局好嗎?如果群體不止一次地互相作用,會有任何差異嗎?如果每一個體對群體內(nèi)其他個體的特性沒有把握,答案將發(fā)生怎樣的變化?取自經(jīng)濟學(xué),政治學(xué),財政金融,法律,甚至日常生活中的若干相互依存性事例
藝術(shù)品拍賣(諸如在克里斯蒂(Christie)或索士比(Sotheby)拍賣行,那里待售出自布拉克(Braque)直至維羅內(nèi)塞(Veronese)的藝術(shù)品)和債券拍賣(美國財政部為籌措聯(lián)邦預(yù)算支出,以這種方式出售政府公債)。聯(lián)合國的選舉(例如,選舉新的聯(lián)合國秘書長)。動物爭斗(爭奪良好的棲息地以及種類中稀少的發(fā)情期雌性動物,等等)。自然資源的可持續(xù)使用(像石油那樣的可耗盡資源或像森林那樣的可重建資源的提取形式)。運動會和工作場所的隨機藥物檢測(選取少量運動員和工作人員進行核實使用違禁藥物的測試)。破產(chǎn)法(詳細說明在什么時候和有多少債權(quán)人可以從已破產(chǎn)的公司那兒收賬)。“毒藥”條款(該條款給予管理部門一定的權(quán)限以抵制不受歡迎者試圖接管或兼并他們的公司)
R&D開支(譬如,制藥公司的研究開發(fā)費用)
第一次世界大戰(zhàn)的壕溝戰(zhàn)(在法德之間的邊界地區(qū),當(dāng)軍隊連續(xù)數(shù)月地互相對峙時,掘進到敵方的戰(zhàn)壕里去)
OPEC(石油卡特爾,控制著世界石油產(chǎn)量的一半,因此,在決定人們支付油價方面擁有重要的發(fā)言權(quán)
群體項目(諸如為你們的博弈論課程準(zhǔn)備案例研究)
博弈論——分析在一群舉止行為頗具策略的理性人之間的相互作用的正規(guī)方法。博弈論是考慮以下每一項條款的正規(guī)方法:群體——在任何博弈中有不止一個決策者;每一個決策者稱為局中人相互作用——任何單個局中人的行為直接影響到群體內(nèi)至少一個其他的局中人。策略——單個局中人在決定自己所取的行動時,會考慮到相互依存性。理性——在考慮到這種相互依存性時,每一個局中人會選擇自己的最優(yōu)行動。
來自日常生活中的例子
致力于一項群體項目,為博弈論課程準(zhǔn)備案例研究:“群體”包括一起做案例的學(xué)生。他們之間的“相互作用”來自于這樣的事實:為了寫一篇論文,需要付出一定的工作量;因此,如果一個學(xué)生偷懶,另外的某個人在論文到期前的夜晚不得不投入額外的幾個小時。“策略”運用包含了估計群體內(nèi)總想占別人便宜者的可能性,“理性”參與需要對較好分?jǐn)?shù)的好處與額外工作的成本仔細地進行比較。
(奧林匹克運動會中)中隨機藥物檢測:“群體”由比賽運動員和國際奧林匹克委員會(IOC)組成?!跋嗷プ饔谩笔莾煞矫娴?,一方面是運動員之間的相互作用——他們做出在訓(xùn)練安排中和不管什么情況下一樣服禁藥的決策;另一方面是在運動員與IOC之間的相互作用,后者需要維護運動的聲譽?!袄硇圆呗浴钡膽?yīng)用需要運動員根據(jù)獲勝的機會以及如果服用了興奮劑之后被逮到的機會之間進行比較而作出決策。類似地,它要求IOC根據(jù)檢測成本和清白聲譽的價值而制定藥物檢測的程序和相應(yīng)的懲罰措施。
經(jīng)濟與財政金融的例子
制藥公司的R&D效果:某些評估表明,研究與開發(fā)(R&D)經(jīng)費支出占美國制藥公司年銷售額的20%之多。以及平均來說,一種新藥的開發(fā)成本大約為3億5千萬美元。公司自然關(guān)心諸如資金投入哪一條生產(chǎn)線,新藥定價應(yīng)多高,如何縮減與新藥開發(fā)相伴的風(fēng)險,等等問題。在這個例子中,“群體”是藥物公司全體組成的集合?!跋嗷プ饔谩逼鹨蛴谒幍淖钕乳_發(fā)者將獲得最大的收益(由于專利權(quán)的緣故)。如果R&D經(jīng)費的選取大小使得在確知競爭者對這條新藥生產(chǎn)線進行投資的前提下能最大化從新藥開發(fā)中得到收益,那么“R&D”經(jīng)費是策略性的和是理性的。
債券拍賣:正常情況下,美國財政部通過拍賣形式處理政府證券*。主要的投標(biāo)人是投資銀行,如萊曼兄弟(LehmanBrothers)
或摩里爾林奇(MerrillLynch)等(他們轉(zhuǎn)而將證券出售給他們的客戶)。因此,“群體”就是投資銀行組成的集合。(實際上,從一次拍賣到又一次拍賣,這些投標(biāo)人極少發(fā)生改變。)他們“互相作用和影響”著,因為其他人的標(biāo)價決定了一個投標(biāo)人是否分配到任何債券,也可能決定了投標(biāo)人支付的價錢。如果投標(biāo)基于可能的競爭上和在支付太多與得不到任何債券的風(fēng)險之間達到適當(dāng)?shù)钠胶?,那么,“出價”是“理性的”和“策略的”。
*
這些證券是公債和國庫債券,以及公共部門(或者他們的代理人,例如共同基金信托公司或養(yǎng)老基金等)所擁有的準(zhǔn)金融債券。這些證券承諾在一個固定的周期(譬如,三個月,一年,或五年)后支付一筆錢。另外,他們也可能承諾在證券有效期內(nèi)定期地支付固定額的錢款。來自生物學(xué)與法律方面的例子
動物習(xí)性:剛過去的25年里,博弈論更吸引人的應(yīng)用之一已經(jīng)深入生物學(xué)領(lǐng)域,特別是關(guān)于動物之間爭斗和競爭的分析。通常野生動物不得不為了稀少資源(諸如具繁殖能力的雌性動物或者動物的尸體)而競爭;于是,為了發(fā)現(xiàn)這些資源——或者為了從發(fā)現(xiàn)者那兒奪取資源,它們會有所付出。問題在于這種做法會導(dǎo)致代價昂貴的爭斗。這里,“局中人群體”是眼睛盯著同一獵物的所有動物。由于資源的有限性,它們互相影響著。假如它們考慮競爭對手做出反應(yīng),選擇就是“策略”,如果由于這種“策略”滿足了它們的短期目標(biāo),譬如解決了饑餓,或者滿足了它們的長期目標(biāo),譬如保持了物種的繁衍不絕,這樣的選擇是“理性的”。
破產(chǎn)法:在美國,一旦公司宣告破產(chǎn),它的財產(chǎn)不再由單獨的債權(quán)人扣押,而代之以安全保管,直至公司與它的債權(quán)人達成某種程度的諒解。但是,債權(quán)人可以在破產(chǎn)宣告之前促使法庭去收帳(雖然通過這種做法債權(quán)人可能逼迫公司陷入破產(chǎn))。這里,債權(quán)人“群體”內(nèi)的“相互作用”來自于這樣的事實:個別債權(quán)人能夠成功地依法占有的錢就不再可能屬于其他任何一個人。“策略”的選取需要估計其他債權(quán)人可能有多大耐心,而“理性的”選擇包含了在早收賬與逼迫公司不必要的破產(chǎn)之間的權(quán)衡。
例題
1.拿子游戲(Nim和Marienbad)
這是兩個室內(nèi)游戲,玩法如下。有兩堆火柴,和兩個局中人。游戲從局中人1開始,此后局中人輪流行動。在每個局中人的輪次里,他可以從兩堆火柴的任一堆中拿走任何數(shù)量的火柴。只要任何一堆中尚有剩余的火柴,則要求每個局中人拿走一定數(shù)量且不能空手而返,但每個輪次只能從一堆中取火柴。在“拿子游戲”Nim中,無論那個局中人,取走最後火柴者算贏。而在Marienbad,誰拿走最后的火柴,那么這個局中人就算輸。
2.投票
假設(shè)有兩個競爭議案,這里表示為A與B,3個議員,投票人1,2和3,他們投票決定是否通過這些議案。結(jié)局可能會是兩種中的某一個:要么通過A和B中的一個,要么議員們沒有通過任何一項議案(延緩而以原來法律代替)。投票過程如下:首先,讓議案A與議案B互相競爭;然后,競爭的獲勝方與原來法律互相競爭,為簡便起見,我們將原法律稱為“都不贊成”(或者N)。在兩輪投票中的每一輪,獲多數(shù)票的法案算勝出。三個議員在可適用的選擇中有如下偏好:
投票人1:投票人2:投票人3:(這里,表示“喜歡議案A甚于喜歡議案B”)
3.囚徒困境
克雷\卡爾文
認罪
不認罪
認罪 5,5 0,15
不認罪 15,0 1,1總
結(jié)
博弈論是研究相互依存性的。它研究局中人群體中的互相作用,這些局中人根據(jù)策略地分析群體內(nèi)其他人可能做什么而進行理性的選擇。博弈論可以應(yīng)用于諸如自然資源的使用,選取聯(lián)合國秘書長,動物習(xí)性,和OPEC的生產(chǎn)策略等廣泛不同的問題。博弈論的創(chuàng)建追溯到150年前。但是,學(xué)科的主要發(fā)展是近代的,大約在最近50年期間,使得博弈論成為經(jīng)濟學(xué)與數(shù)學(xué)范圍內(nèi)最年輕的學(xué)科之一。如拿子游戲和囚徒困境這種博弈的策略分析可以揭示理性局中人將達到的結(jié)局。對于整個局中人群體來說,這些結(jié)局并不總是稱心的。博弈的規(guī)則:
每個博弈通過一組規(guī)則進行,規(guī)則必須說明四件事:“誰”(Who)在參與——策略地互相作用的局中人群體。
他們以“什么”(What)來參與——每個局中人可使用的策略供替代的行動或選擇。
每個局中人“何時”(When)行動(以什么順序)從參與博弈所作的選擇中,他們得到(或失去)“多少”(Howmuch)關(guān)于規(guī)則的共同知識每一個局中人知道博弈的規(guī)則,并且這一現(xiàn)象是眾所周知的。
“誰”,“什么”,和“何時”:展開型
展開型規(guī)則的一種圖形表示式。主要的畫圖形式稱為博弈樹,是由一個根和若干枝依次排列組成。
信息集和策略
在展開型里怎樣表示同時行動
局中人1局中人2cnccnn信息集決策結(jié)的集合,局中人不能區(qū)分這些決策結(jié)策略局中人的策略是指在局中人需要做出選擇的信息集處可采取的行動。
策略是行動的藍圖,在每一個決策結(jié)告訴局中人如何去選擇。由于局中人在任何一個信息集里不能區(qū)分決策結(jié),策略詳細說明了在每一個結(jié)所做的行動。
正則(或策略)型
博弈規(guī)則中另一種表示方式稱為正則型或策略型策略型有關(guān)“局中人,他們每一個人可使用的策略,和每人的得益”的完整的一覽表。
sss
ssb
ssc
bbs … ccb
ccs
cccb N,T N,T N,T T,N N,T N,T N,Tc T,N T,N T,N T,N T,N T,N T,Ns T,N T,N N,T T,N T,N T,N N,T局中人2局中人1馮諾伊曼——摩根斯坦效用函數(shù)
拿子游戲Nim
假設(shè)在一堆中有2根火柴,在另一堆中有1根火柴。記這個布局為(2,1)。與贏相聯(lián)的盈利數(shù)必定高于對應(yīng)于輸?shù)挠麛?shù);假設(shè)這些數(shù)分別為1與-1。局中人1局中人11,-11,-1-1,1局中人2(0,0)-1,11,-1(2,1)(0,1)l局中人2(1,0)(0,1)(1,1)(1,0)(2,0)rLuRdm策略型表示式如下:
1/2 lL lR rL rRu 1,-1 1,-1 1,-1 1,-1m -1,1 -1,1 -1,1 -1,1d 1,-1 -1,1 1,-1 -1,1投票博弈
假如一個投票人所贊成的議案通過,她得到的盈利為1。如果她的第二個選擇通過,則盈利為0,如果她最不贊同的抉擇通過,此時她的盈利是-1。
投票人2投票人3投票人1ABBBBBABAAABAA投票人1投票人2投票人3ANNNNNAAAANANA0,-1,11,0,0囚徒困境
局中人1局中人2cnnc-5,-50,-15nc-15,0-1,-1博弈的展開型
策略型
1\2 c
n
c -5,-5 0,-15
n -15,0 -1,-1總
結(jié)
1.博弈規(guī)則必須明確說明局中人是“誰”,每個局中人可使用的選擇是“什么”,和從局中人群體所作的一組選擇中,每個局
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新能源分包項目管理辦法
- 售后服務(wù)年終工作總結(jié)
- 2025屆河南省新鄉(xiāng)七中物理高二第二學(xué)期期末預(yù)測試題含解析
- 合伙開店協(xié)議書
- 農(nóng)作物種子預(yù)約生產(chǎn)合同
- 應(yīng)急消防工作總結(jié)
- 石場安全生產(chǎn)許可證
- 食品安全的會議記錄
- 深海酶學(xué)功能-洞察及研究
- 安全生產(chǎn)法律法規(guī)和規(guī)章制度
- 2024屆河北省唐山市玉田縣物理高一第二學(xué)期期末質(zhì)量檢測試題含解析
- 第三方醫(yī)療消毒供應(yīng)中心項目可行性研究報告
- 貨架安裝施工方案
- 美羅培南課件
- 128個常用自然拼讀發(fā)音規(guī)則和1000句生活口語
- 異口同音公開課
- 專利代理人資格考試實務(wù)試題及參考答案
- 運用信息技術(shù)助力勞動教育創(chuàng)新發(fā)展 論文
- GB/T 602-2002化學(xué)試劑雜質(zhì)測定用標(biāo)準(zhǔn)溶液的制備
- GB/T 4074.8-2009繞組線試驗方法第8部分:測定漆包繞組線溫度指數(shù)的試驗方法快速法
- 2023年涉縣水庫投資管理運營有限公司招聘筆試模擬試題及答案解析
評論
0/150
提交評論