




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
博弈論中文版目錄\h第1部基·礎(chǔ)·篇\h第1章通過單階段博弈理解基本概念\h第1章前言\h第1節(jié):囚徒困境\h第2節(jié):納什均衡與夫妻博弈\h第3節(jié):猜硬幣博弈與混合策略\h第4節(jié):連續(xù)策略、連續(xù)收益與寡頭壟斷下的競爭理論\h第2章通過多階段博弈來磨煉應(yīng)用力\h第2章前言\h第1節(jié):序貫博弈與子博弈精煉均衡\h第2節(jié):有限重復(fù)博弈\h第3節(jié):無限重復(fù)博弈\h第2部應(yīng)·用·篇\h第3章加入信息的不確定性\h第3章前言\h第1節(jié):非對稱信息博弈\h第2節(jié):連續(xù)非對稱信息博弈與信息操作\h第3節(jié):委托人與代理人的博弈和道德風(fēng)險(xiǎn)\h第4節(jié):拍賣理論\h第5節(jié):討價還價理論與合作博弈\h第4章博弈論的發(fā)展\h第1節(jié):博弈論的課題與今后的發(fā)展\h第2節(jié):博弈論的歷史第1部基·礎(chǔ)·篇第1章通過單階段博弈理解基本概念第1章前言在日常生活或者商務(wù)活動之中,我們都會遇到因?yàn)椴恢缹Ψ綍扇∈裁礃拥男袆?,而遲遲無法決定自己采取什么行動的情況。比如在開車的時候,經(jīng)驗(yàn)豐富的司機(jī)就能夠根據(jù)自身的經(jīng)驗(yàn)以及交流獲得的信息,大致把握哪些路段什么時間點(diǎn)比較擁堵。然后根據(jù)這些信息來選擇擁堵概率比較小的路線。在商業(yè)活動中,如何避免企業(yè)之間簽訂的協(xié)議有名無實(shí),保證相互之間都能實(shí)現(xiàn)利益最大化也是一個非常值得思考的問題(具體來說包括維持價格協(xié)議、不搶先招人的君子協(xié)議、不獨(dú)占稀缺資源的協(xié)議等)。在某些情況下,這樣的協(xié)議都不能發(fā)揮其應(yīng)有的作用。如果能夠搞清楚有效的協(xié)議和無效的協(xié)議之間存在怎樣的差異,那么就可以采取有效的手段避免出現(xiàn)協(xié)議有名無實(shí)的情況。盡管我們會頻繁遇到類似的問題,但在絕大多數(shù)情況下都是沒有經(jīng)過仔細(xì)思考,僅憑直覺做出判斷。就算最后取得了預(yù)想中的結(jié)果,但也很少有人能解釋清楚整個過程。一旦被別人問到原因,恐怕只能給出“我一直都是這樣做的”或者“我感覺這樣做會有效果”之類的回答。對于存在上述煩惱的商務(wù)人士來說,博弈論是最可靠的伙伴。博弈論能夠利用框架,對對方的思考和行動中存在的不確定性進(jìn)行系統(tǒng)化的分析和解釋,從而給自己的決策提供參考。事實(shí)上,很多憑借經(jīng)驗(yàn)和直覺采取行動并最終取得理想成果的事例,都能用博弈論來加以解釋。本章的構(gòu)成本章通過單次且各參與者同時采取行動的最簡單的博弈,來幫助大家先熟悉博弈論的思考方法——通過將事物數(shù)值模型化,將可能發(fā)生的情況分別表現(xiàn)出來。在第1節(jié)和第2節(jié)中,我將首先為大家介紹幾個在學(xué)習(xí)博弈論上必不可少(甚至可以說是博弈論的代名詞)的重要概念:囚徒困境、占優(yōu)策略、納什均衡等。在第3節(jié)和第4節(jié)中,我會為大家介紹稍微復(fù)雜的混合策略和持續(xù)策略。雖然本章中介紹的都是簡單的模型,但在解決類似前文中提到的“交通擁堵”和“有名無實(shí)協(xié)議”等難以得出明確結(jié)論的問題時,這些模型能夠給我們提供非常有效的啟示。本章內(nèi)容對于對博弈論有一定程度理解的讀者來說可能比較簡單,但能夠幫助讀者朋友加深對博弈論的理解,希望無論是不是博弈論的初學(xué)者,都能夠仔細(xì)地閱讀本章內(nèi)容。第1節(jié):囚徒困境要點(diǎn)在被稱為“囚徒困境”的一對一單次同時博弈(單階段同時兩人博弈)之中,如果各參與者都選擇占優(yōu)策略,就會導(dǎo)致比合作更壞的結(jié)果。但在現(xiàn)實(shí)的商業(yè)活動之中,為了自身的利益而出賣對方的情況十分常見。即便是同時博弈,也存在沒有占優(yōu)策略的情況。案例一、案例1:X汽車選擇技術(shù)開發(fā)委托方歐洲大型汽車生產(chǎn)企業(yè)X汽車打算委托其他企業(yè)開發(fā)一種安全裝置?,F(xiàn)在候選企業(yè)有安德森公司、布什公司、庫克公司和戴爾公司四家。最終采用的安全裝置技術(shù)肯定是在安德森公司的安德森方式和布什公司的布什方式之中二選一。但在X汽車看來,不管是安德森公司還是布什公司,其資金和技術(shù)都不足以單獨(dú)完成開發(fā)。因此還需要至少一家企業(yè)加入開發(fā)中來。而這個補(bǔ)充企業(yè)的候選就是庫克公司和戴爾公司。這兩家企業(yè)都擁有一定的資金和技術(shù)實(shí)力,完全能夠彌補(bǔ)安德森公司和布什公司的不足之處。安德森公司表示將在這項(xiàng)技術(shù)的開發(fā)上投入20億日元的經(jīng)費(fèi),布什公司則表示將投資30億日元。X汽車向庫克公司和戴爾公司咨詢后得知,這兩家企業(yè)都準(zhǔn)備了15億日元的開發(fā)資金。從技術(shù)難度和這四家企業(yè)的綜合實(shí)力來看,他們的投資額都不會再發(fā)生太大的變化。安德森方式和布什方式在技術(shù)上難分伯仲,而且完成開發(fā)所需的資金規(guī)?;鞠嗤?。產(chǎn)品化后所需的制造成本也不相上下。因此,X汽車希望庫克公司和戴爾公司進(jìn)行一場“投票”,最終選擇合計(jì)投資額最多的一方。庫克公司和戴爾公司需要在限定期限之內(nèi)告訴X汽車自己究竟是支持安德森方式還是支持布什方式。至于庫克公司和戴爾公司是各自做出決定還是事先商量之后再做出決定,X汽車不予追究。根據(jù)上述規(guī)則,可能出現(xiàn)如下的情況。兩家公司都支持安德森方式、X汽車采用安德森方式。安德森方式合計(jì)50億日元VS布什方式合計(jì)30億日元。兩家公司都支持布什方式、X汽車采用布什方式。安德森方式合計(jì)20億日元VS布什方式合計(jì)60億日元。庫克公司支持安德森方式、戴爾公司支持布什方式、X汽車采用布什方式。安德森方式合計(jì)35億日元VS布什方式合計(jì)45億日元。庫克公司支持布什方式、戴爾公司支持安德森方式、X汽車采用布什方式。安德森方式合計(jì)35億日元VS布什方式合計(jì)45億日元。不管采用哪種方式,將來通過該技術(shù)獲得的收益,都按照開發(fā)投資額,也就是各企業(yè)投入的開發(fā)資金所占的比例進(jìn)行分配。X汽車將上述信息全都傳達(dá)給了庫克公司和戴爾公司。***距離給X汽車答復(fù)的最終期限還有不到一個星期,但庫克公司的董事長庫克還是遲遲無法做出選擇。安德森公司和布什公司都對庫克發(fā)起了猛烈攻勢,雙方都明確表示“只要你選擇我們公司,必將給你最大限度的回報(bào)”。庫克公司最重要的課題是要選擇能夠被X汽車采用的技術(shù),同時也要盡可能使自己獲得更多的收益。最理想的情況是庫克公司支持布什方式而戴爾公司支持安德森方式。在這種情況下,庫克公司的投資額占三分之一(45億日元中的15億日元),能夠獲得最多的收益。反之,如果庫克公司支持安德森方式而戴爾公司支持布什方式,那么庫克公司將一無所得。對X汽車提供的資料進(jìn)行分析后可知,不管采用安德森公司還是布什公司的安全裝置技術(shù),該項(xiàng)目的總凈現(xiàn)值固定為150億日元。因此,在前者的情況下庫克公司能夠得到50億日元(=150÷3)的收益,而后者的情況則為零。庫克公司和戴爾公司都支持相同方式的情況下,選擇安德森方式和選擇布什方式所能夠獲得的收益也是不同的。兩家公司都支持安德森方式的話,庫克公司的投資為50億日元中的15億日元。兩家公司都支持布什方式的話,庫克公司投資則為60億日元中的15億日元。也就是說,在前者的情況下,庫克公司能夠獲得45億日元的收益,后者的情況下則只能獲得37.5億日元的收益。很顯然,如果兩家公司都支持相同的方式,選擇兩家所占投資比重大的方式最為有利。庫克在思考這個問題的時候,嘗試將所有的情況都整理出來,最后得出圖表1-1。圖表1-1庫克整理的情況通過這個圖表可以看出,庫克不僅考慮了自身的情況,還將戴爾公司的情況也考慮了進(jìn)來。比如庫克公司支持布什方式,而戴爾公司支持安德森方式的話,那么庫克公司將獲得最多的收益50億日元,而戴爾公司則一無所獲。因?yàn)閹炜斯竞痛鳡柟镜耐顿Y額剛好相同,所以圖標(biāo)呈對稱的形式。令庫克感到煩惱的是,最終的結(jié)果很有可能是情況4。從庫克公司所能夠獲得的收益來看,這是排在第三位的選擇。如果能夠與戴爾公司共同合作,那么就應(yīng)該以實(shí)現(xiàn)情況1為目標(biāo),共同支持安德森方式。但若采用這一策略,戴爾公司遵守約定的話當(dāng)然皆大歡喜,萬一戴爾公司臨時改變了主意,那么就會出現(xiàn)最壞的情況(從情況1變成情況2)。當(dāng)然,對于庫克公司來說,背叛戴爾公司選擇支持布什方式的誘惑(從情況1變成情況3)也令人非常難以拒絕。最終,庫克認(rèn)為選擇支持布什方式是最沒有風(fēng)險(xiǎn)的明智決定。大概戴爾公司也是這樣想的吧。當(dāng)然,因?yàn)楹ε略獾奖撑讯郾牨牭乜粗?.5億日元(=45-37.5)白白溜走,也實(shí)在是讓人心有不甘。所以庫克的腦海中有那么一瞬間也閃過了“對方背叛的概率有多少”的想法,但遭到背叛的話所要付出的代價實(shí)在是太大,還是應(yīng)該盡可能避免這樣的情況發(fā)生。就在這個時候,庫克辦公桌上的電話響了起來。是戴爾公司的董事長戴爾打來的。戴爾開門見山地說道。“庫克先生,這次我們一起支持安德森方式吧。關(guān)鍵在于我們要通力合作。想必庫克先生也很清楚,一起支持安德森方式對我們雙方來說都有利。”“但是,我怎么知道你肯定不會背叛我呢。在這種情況下我怎么能接受你的提議?”“要這么說的話,我也一樣。如果你不遵守約定的話我也會很被動。而且就算我們兩人之間簽訂了協(xié)議,也不具備任何法律效力,我們只能相信彼此?!薄半m然我也很想信任你,但還是怕有‘萬一’啊?!薄霸谶@個行業(yè),信用不是擺在第一位的嗎。我們誰都不想被貼上‘背叛者’的標(biāo)簽吧。說不定以后還有合作的機(jī)會呢?!薄澳阏f的沒錯,但眼下最重要的是這個項(xiàng)目。將來的事情誰知道呢?!薄翱磥砦沂钦f服不了你了。希望你能夠再考慮考慮,如果你不想眼睜睜地看著幾億日元白白溜走,就給我打電話。好不容易有個大賺一筆的機(jī)會,錯過了豈不是很可惜?!狈畔码娫捄螅瑤炜讼萑肓松钌畹乃伎?。“戴爾先生的葫蘆里究竟賣的是什么藥。他說的是真心話嗎,還是故意迷惑我?他應(yīng)該也知道最壞的情況是什么。”***最終,庫克公司和戴爾公司并沒有選擇合作。他們都無法相信“對方一定能夠遵守約定”。所以,結(jié)果和庫克當(dāng)初預(yù)計(jì)的一樣,庫克公司和戴爾公司都支持布什方式,X汽車也選擇了布什公司作為技術(shù)委托方。雖然庫克用“盡管并不是最好的結(jié)果,但總算賺到了一些。少賺總比不賺強(qiáng)?!眮戆参孔约海闹袇s總感覺有些難以釋懷。理論二、占優(yōu)策略前文中提到的案例1,是以博弈論中最著名的模型“囚徒困境”為基礎(chǔ)改編的。雖然囚徒困境是博弈論中最古典的模型,但在現(xiàn)實(shí)的商務(wù)活動中十分常見。比如新技術(shù)的開發(fā)競爭、在媒體上的廣告競爭、環(huán)境問題的成本負(fù)擔(dān)、零售業(yè)的價格競爭等。在這些情況下,每個參與者都難以預(yù)先獲得競爭對手的行動和信息,而且一旦自身不采取某種行動,競爭對手采取了這一行動的話,自己就會單方面受到損害。那么,為了更深入地了解囚徒困境,讓我們對案例1進(jìn)行一下整理。(一)參與者“庫克公司”與“戴爾公司”兩個。這里用參與者1代表“庫克公司”,參與者2代表“戴爾公司”。(二)策略兩個參與者都可以采取“支持安德森方式”或者“支持布什方式”的策略。將所有可能采取的策略進(jìn)行排列組合,會得出以下4種情況(括號內(nèi)順序?yàn)閰⑴c者1的策略,參與者2的策略)。(支持安德森方式,支持安德森方式)(支持安德森方式,支持布什方式)(支持布什方式,支持安德森方式)(支持布什方式,支持布什方式)(三)收益在上述4種情況下,庫克公司和戴爾公司所能夠獲得的收益如下。(支持安德森方式,支持安德森方式)(+45,+45)(支持安德森方式,支持布什方式)(0,+50)(支持布什方式,支持安德森方式)(+50,0)(支持布什方式,支持布什方式)(+37.5,+37.5)(四)收益矩陣像上述內(nèi)容這樣,只是將博弈的策略和收益羅列出來,還是很難理解這個博弈的本質(zhì)、也難以預(yù)測各參與者究竟會采取怎樣的行動。在這個時候,我們就需要將各參與者的行動整理成圖表。本節(jié)介紹的單階段同時兩人博弈(參與者同時采取行動的兩人博弈)一般可以整理為如圖表1-2這樣的收益矩陣。在收益矩陣中,一般將參與者1的行動作為縱軸,參與者2的行動作為橫軸。括號內(nèi)的收益也按照參與者1,參與者2的順序標(biāo)記。圖表1-2庫克公司與戴爾公司的收益矩陣接下來,讓我們通過收益矩陣中的數(shù)字來對這個博弈進(jìn)行一下分析。對于庫克公司來說,“支持安德森方式”和“支持布什方式”哪一個更有利呢?我們先來看一看參與者1和參與者2分別能夠獲得多少收益。(五)參與者1的收益:參與者2支持安德森方式的情況首先比較參與者2選擇“支持安德森方式”的情況下,參與者1的收益(括號內(nèi)第一個數(shù)字)。如果庫克公司也表明“支持安德森方式”,那么X汽車就會采用安德森方式,這樣庫克和戴爾公司都能參與到這個項(xiàng)目中來。在這種情況下,庫克公司的收益是45億日元。但如果庫克公司支持布什方式,X汽車采用布什方式,那么戴爾公司就被排除到項(xiàng)目外。在這種情況下,庫克公司能夠得到50億日元的最大收益。(六)參與者1的收益:參與者2支持布什方式的情況假設(shè)戴爾公司同樣選擇支持布什方式。那么我們就需要比較收益矩陣中“支持布什方式”的縱列。如果庫克公司支持安德森方式,那么X汽車就會采用合計(jì)投資額較高的布什方式。結(jié)果是戴爾公司參與到項(xiàng)目中去,庫克公司被排除到項(xiàng)目外。在這種情況下,庫克公司的收益為零。另一方面,如果庫克公司支持布什方式,X汽車也采用布什方式的話,庫克公司和戴爾公司都能夠參與到項(xiàng)目中來。在這種情況下,兩家公司都能獲得37.5億日元的收益。綜上所述,不管參與者2支持安德森方式還是支持布什方式,參與者1都應(yīng)該支持布什方式,這樣能夠保證獲得更多的收益。(七)參與者2的收益戴爾公司在考慮自身收益的時候,可以參照收益矩陣,比較括號內(nèi)第二個數(shù)字(戴爾公司的收益)。經(jīng)過分析可以發(fā)現(xiàn),不管庫克公司如何選擇,戴爾公司都應(yīng)該支持布什方式,這樣能夠保證獲得更多的收益。類似這種不管博弈的其他參與者采用何種策略,自己只要采取特定策略就能夠獲得較高收益的情況下,這種策略就被稱為“占優(yōu)策略”。在本節(jié)的這個案例中,庫克公司和戴爾公司都擁有占優(yōu)策略。那就是不管對方采取何種策略,自己都選擇“支持布什方式”。這樣一來,雙方都采用“支持布什方式”的策略,就是這個博弈的解。最終,兩家企業(yè)分別獲得37.5億日元的收益。(八)囚徒困境本節(jié)的案例是以博弈論中最著名的“囚徒困境”模型為基礎(chǔ)制作的。在原版的囚徒困境中,兩名共同犯案的強(qiáng)盜是參與者。這兩個人分別被捕并且被關(guān)押在不同的房間中接受審問。警方并沒有兩人共同犯案的證據(jù),如果兩名強(qiáng)盜都不承認(rèn)共同犯案的罪行,那么就只能按照他們當(dāng)前所犯的罪行各自判處1年有期徒刑。但如果其中一方坦白,而另一人抵賴的話,那么坦白的人就會被無罪釋放,抵賴的人則被判處20年有期徒刑。如果兩個人都坦白的話,那么他們都會被處以10年有期徒刑。將上述情況整理成收益矩陣如圖表1-3所示。括號內(nèi)的數(shù)字之所以用了負(fù)數(shù),是因?yàn)閷Ψ缸镎邅碚f,刑期越短收益越高(年數(shù)增加收益就是負(fù)數(shù))。圖表1-3囚徒困境在這個原版的“囚徒困境”之中,兩名強(qiáng)盜都選擇“坦白”這一占優(yōu)策略,結(jié)果就是兩人都被判處10年有期徒刑。三、使占優(yōu)策略失效的方法存在占優(yōu)策略的情況下,博弈的解只有一個。也就是說,在本節(jié)這個案例之中,兩家公司都會選擇“支持布什方式”的策略,沒有其他的可能性。但正如我們在收益矩陣中看到的那樣,對于參與者來說這個解并不是最優(yōu)解。如果兩家公司都選擇“支持安德森方式”,那么兩家公司都能多獲得7.5億日元的收益。在類似這樣的案例中,兩個參與者都想獲得更多收益并不容易。因?yàn)殡p方都對事前協(xié)議持不信任的態(tài)度。比如在案例1中戴爾公司就提出“一起支持安德森方式”的建議,但庫克公司并沒有接受。就算兩家公司事前達(dá)成了協(xié)議,也很難一直互相信任直到最后。如果兩家公司事前達(dá)成了“一起支持安德森方式”的合作協(xié)議,但其中一方背叛選擇了“支持布什方式”,那么遵守協(xié)議選擇“支持安德森方式”的一方就一點(diǎn)收益也得不到,而背叛的一方則將賺取巨額收益。在像這樣只進(jìn)行一次同時博弈的情況下,只要有占優(yōu)策略存在,參與者就很難做出其他的選擇。類似于囚徒困境的情況在現(xiàn)實(shí)的商業(yè)活動中也十分常見。特別是在雙方只進(jìn)行一次博弈(交易)的情況下,背叛對方讓自己獲取更多收益的誘惑非常大,當(dāng)然任何人都能想到這一點(diǎn)。因?yàn)殡p方都害怕遭到背叛,所以即便明知道獲得的收益較少,也只能選擇占優(yōu)策略。在面對“囚徒困境”的時候,雙方要想獲取更多的收益,可以采取以下的方法。(一)對背叛者施加懲罰通過對背叛者施加懲罰,可以降低損人利己帶來的誘惑。在本節(jié)的案例中,雙方可以簽訂一份合作協(xié)議,規(guī)定如果任何一方違反合作協(xié)議,選擇“支持布什方式”,那么就要向受損害的一方支付巨額的賠償。在不考慮這份協(xié)議是否具備法律效力的情況下,這樣做可以改變這次博弈的收益,使占優(yōu)策略失去效果。假設(shè)背叛的一方要支付給受損害的一方15億日元賠償金,那么這次博弈的收益矩陣就會變成圖表1-4那樣。如果雙方全都選擇了背叛,都支持布什方式,那么雙方相互賠償15億日元就自動抵消了,最終的結(jié)果和之前的收益(+37.5,+37.5)相同。圖表1-4有懲罰情況下的收益矩陣在圖表1-4所示的博弈中就不存在占優(yōu)策略了。假設(shè)我們站在庫克公司的立場上。如果我們背叛對方選擇“支持布什方式”,那么最終獲得的收益(35億日元)比“支持安德森方式”獲得的收益(45億日元)更低。因此,不管是庫克公司還是戴爾公司,都從囚徒困境中擺脫了出來,可以選擇對雙方都更加有利的“支持安德森方式”。這種簽訂合作協(xié)議后的博弈,實(shí)際上與我在下一節(jié)中即將為大家介紹的“夫妻博弈”十分相似。這種解決方法通過“改變現(xiàn)有博弈”使結(jié)果更符合雙方的期望。(二)增加博弈(交易)次數(shù)另一種解決方法就是增加庫克公司和戴爾公司之間的交易次數(shù)。如果兩家企業(yè)今后還有繼續(xù)合作的可能性,那么為了追求眼前的收益而背叛對方,可能會對今后的合作造成影響。遭到背叛的一方在今后的合作之中肯定會采取相應(yīng)的報(bào)復(fù)行動??紤]到這一點(diǎn)的話,“追求眼前的收益而背叛對方”就不是最好的選擇。也就是說,通過將博弈從“單階段”變成“重復(fù)”,可能會得出不同的解決方法。關(guān)于這部分內(nèi)容我將在第2章中為大家做詳細(xì)的說明。比如日本的汽車生產(chǎn)企業(yè)和零件供應(yīng)商之間的連續(xù)交易。即便一家從未合作過的供應(yīng)商給出的價格很低,汽車生產(chǎn)企業(yè)也更愿意選擇自己比較熟悉的供應(yīng)商。盡管類似于這樣的交易習(xí)慣經(jīng)常被美國當(dāng)作表現(xiàn)日本市場封閉性的反面教材加以批判,但換一個角度來看的話,這也是對雙方來說風(fēng)險(xiǎn)都比較小的商業(yè)選擇。對于汽車生產(chǎn)企業(yè)來說,避免了遭到零件供應(yīng)商背叛使汽車出現(xiàn)故障的風(fēng)險(xiǎn),對零件供應(yīng)商來說,避免了遭到汽車生產(chǎn)企業(yè)背叛強(qiáng)行壓低采購價格的風(fēng)險(xiǎn)。也就是說,通過增加參與者進(jìn)行博弈(交易)的次數(shù),降低出現(xiàn)雙方不愿看到的結(jié)果的風(fēng)險(xiǎn)。第2節(jié):納什均衡與夫妻博弈要點(diǎn)納什均衡指的是所有參與者“在考慮到其他參與者采取策略的前提下選擇自己最合適的策略”的狀態(tài)。這種均衡并非只有一個,往往存在多個。在滿足納什均衡的狀態(tài)下,任何參與者打破均衡采取其他的策略都會使自身收益受到損害,因此這種穩(wěn)定的狀態(tài)會一直持續(xù)下去。案例一、案例2:選擇兩家銀行合并后的系統(tǒng)某年春,櫻花盛開的時節(jié),位于東京CBD一角的A銀行總部中,系統(tǒng)科長吉田接到了一項(xiàng)特殊的命令。這項(xiàng)命令要求他針對即將到來的與B銀行的合并,提出信息系統(tǒng)的整合方案。日本金融界在金融大爆炸的影響下進(jìn)入開放競爭時代。日本的金融機(jī)構(gòu)遲遲未能解決泡沫經(jīng)濟(jì)時期的不良債權(quán)問題,外資金融機(jī)構(gòu)趁此機(jī)會收購走投無路的日本金融機(jī)構(gòu),或者與迫切需求全新金融領(lǐng)域技術(shù)和經(jīng)驗(yàn)的日本金融機(jī)構(gòu)展開合作,從而在日本市場站穩(wěn)了腳跟。A銀行和B銀行都是在泡沫經(jīng)濟(jì)時期稱霸資本市場的大型銀行,但如今收益率大幅下滑,資金量也無法與那些通過不斷合并而發(fā)展壯大的歐美大金融集團(tuán)相抗衡,如果繼續(xù)這樣下去最終必將一敗涂地。為了解決上述危機(jī),A銀行和B銀行決定合并,并且都在暗中對存在的課題和問題點(diǎn)展開了討論,A銀行的經(jīng)營層要求吉田秘密分析合并后的系統(tǒng)整合能夠?qū)Τ杀鞠鳒p起到哪些作用。***近10年來,金融業(yè)已經(jīng)轉(zhuǎn)變?yōu)橐粋€龐大的信息產(chǎn)業(yè)。在線服務(wù)與內(nèi)部管理等系統(tǒng)網(wǎng)絡(luò)已經(jīng)成為當(dāng)今金融機(jī)構(gòu)業(yè)務(wù)中的核心。金融信息系統(tǒng)所涉及的內(nèi)容非常廣泛,從顧客的存款和借貸信息到顧客間的資金流動,以及顧客的資產(chǎn)和運(yùn)用情況應(yīng)有盡有。此外,金融信息系統(tǒng)還對包括海外分行在內(nèi)的各部門的利息、匯率以及信用等各種風(fēng)險(xiǎn)情況都進(jìn)行實(shí)時的分析和管理。各銀行都在金融信息系統(tǒng)上投入了大量的資金。也就是說,在兩家銀行合并后,選擇哪種信息系統(tǒng)將對今后的系統(tǒng)成本造成巨大的影響。吉田在接到命令后,首先想到的是曾經(jīng)因?yàn)楣ぷ麝P(guān)系結(jié)識的B銀行系統(tǒng)科長野村。“大概野村科長也從上司那里接到了同樣的命令吧。雖然今后有可能要和他一起共事,但現(xiàn)在還不能挑明合并的事情。不過,在宣布合并的時候,應(yīng)該也會同時宣布繼續(xù)采用哪家銀行的系統(tǒng)吧。”吉田經(jīng)過調(diào)查發(fā)現(xiàn),現(xiàn)在A銀行使用的是外資企業(yè)D公司的金融信息系統(tǒng),而B銀行使用的則是國內(nèi)信息處理公司E公司的金融信息系統(tǒng)。如果兩家銀行都采用A銀行使用的D公司的系統(tǒng),那么A銀行的收益能夠增加2億日元。在這種情況下B銀行為了保證系統(tǒng)的統(tǒng)一性,需要將系統(tǒng)換成和A銀行一樣的D公司的系統(tǒng),收益只能增加1億日元。反之,如果兩家銀行都采用B銀行使用的E公司的系統(tǒng),那么A銀行的收益增加1億日元,B銀行增加2億日元。最糟糕的情況是兩家銀行繼續(xù)沿用各自的系統(tǒng)。在這種情況下兩家銀行實(shí)現(xiàn)了合并,但系統(tǒng)遲遲無法統(tǒng)一,無法通過合作使業(yè)務(wù)得到改善,反而都會出現(xiàn)1億日元的損失。只要系統(tǒng)能夠統(tǒng)一,那么兩家銀行能夠合計(jì)取得3億日元的收益。但從公司高層的角度來看,不管最后結(jié)果怎樣,都希望自身能夠取得最高的收益。況且兩家銀行最終可能并不能真正實(shí)現(xiàn)合并,只是停留在合作的層面上。吉田開始努力尋找讓兩家銀行都統(tǒng)一采用D公司信息系統(tǒng)的方法。最壞的情況就是野村科長堅(jiān)持采用E公司的信息系統(tǒng),結(jié)果兩家銀行無法實(shí)現(xiàn)系統(tǒng)的統(tǒng)一。吉田一邊回憶對野村科長的印象,一邊思考自己應(yīng)該采取什么樣的策略。***就在吉田制定信息系統(tǒng)統(tǒng)一計(jì)劃的時候,C銀行的行長來到A銀行總部的行長辦公室,秘密提出也想?yún)⑴c到A銀行與B銀行的合作中來,而吉田對此一無所知。理論在上一節(jié)中我為大家介紹過,如果各參與者存在“占優(yōu)策略”,那么博弈的解就只有一個。占優(yōu)策略是博弈論中非常強(qiáng)大的概念,參與者很難選擇占優(yōu)策略之外的其他策略。比如案例1中的庫克公司和戴爾公司,他們都很清楚一起選擇支持安德森方式對雙方來說是最有利的,而且戴爾公司也對庫克公司提出了共同支持安德森方式的建議。即便如此,雙方還是難以擺脫對遭到背叛的恐懼,最終選擇了對雙方來說都不是最佳結(jié)果的支持布什方式。二、納什均衡在現(xiàn)實(shí)的博弈之中,不一定總是存在滿足占優(yōu)策略條件的策略,本節(jié)中的案例2就是這種情況。雖然不存在占優(yōu)策略,但對雙方參與者來說都能夠接受的均衡選擇卻很多。這種均衡被稱為“納什均衡”。納什均衡是博弈論中最重要的概念之一。這是由諾貝爾獎得主約翰·納什提出的概念。在本節(jié)之中,我將主要為大家介紹什么是納什均衡,并且以商業(yè)活動現(xiàn)場的案例為基礎(chǔ)給大家說明納什均衡選擇的策略特征。首先,讓我們利用案例2中出現(xiàn)的參與者、策略以及收益來制作一個簡單的收益矩陣(圖表1-5)。(一)參與者參與者有“A銀行”和“B銀行”兩個。這里用參與者1代表“A銀行”,參與者2代表“B銀行”。(二)策略兩個參與者都可能選擇D公司的系統(tǒng)或者E公司的系統(tǒng)。排列組合后得出以下4種結(jié)果。(D公司,D公司)(D公司,E公司)(E公司,D公司)(E公司,E公司)(三)收益(單位為億日元)(D公司,D公司)(+2,+1)(D公司,E公司)(-1,-1)(E公司,D公司)(-1,-1)(E公司,E公司)(+1,+2)讓我們通過收益矩陣中的數(shù)字來對這次博弈進(jìn)行以下分析。A銀行應(yīng)該怎樣選擇才能提高自身的收益呢?首先假設(shè)B銀行選擇D公司(選擇D公司的縱列),那么A銀行選擇D公司的話自身的收益較高(+2)。但如果B銀行選擇E公司的話(選擇E公司的縱列),A銀行就應(yīng)該選擇收益更高(+1)的E公司。在這種情況下,對方的選擇會對A銀行的策略造成影響。也就是說,從A銀行的角度來看,不存在不管對方如何選擇都對自身有利的占優(yōu)策略。圖表1-5案例2的收益矩陣同樣的情況也適用于B銀行。不管A銀行選擇D公司還是E公司,B銀行都要保持和A銀行相同的選擇才能獲取較高的收益。對于B銀行來說同樣不存在占優(yōu)策略。在這種情況下,參與者應(yīng)該如何選擇策略呢?納什均衡將告訴我們答案。三、存在多個納什均衡用一句話來概括納什均衡,就是“所有參與者都在‘以其他參與者的策略為前提的情況下,選擇自己最合適的策略’的狀態(tài)”。也就是說,一旦參與者們選擇了滿足納什均衡的策略(以下簡稱為納什均衡策略),那么不管博弈中的任何參與者選擇其他任何策略,都不能使自身的收益增加。在這種情況下,所有參與者都只能維持現(xiàn)狀,從而實(shí)現(xiàn)一種“均衡”。與其他的策略組合相比,參與者實(shí)際選擇納什均衡策略的可能性更高,而且納什均衡策略比占優(yōu)策略出現(xiàn)的頻率更高,所以是博弈的參與者都會優(yōu)先考慮的策略。不過,在一次博弈中并非只有一種納什均衡策略。一次博弈中存在多種納什均衡策略的情況也很常見。比如案例2的情況。假設(shè)實(shí)現(xiàn)了(D公司,D公司)的策略組合,而A銀行卻故意采取了選擇E公司的策略,那么A銀行的收益就會從+2變成-1。對于B銀行來說也一樣,如果只有B銀行選擇E公司,那么其收益就會從+1變成-1。在納什均衡策略中,如果只有自己改變策略并不能使收益得到提高。但這個博弈中的納什均衡策略并不是唯一的。假設(shè)實(shí)現(xiàn)了(E公司,E公司)的策略組合,A銀行或B銀行單方面改變自己的策略也不會使收益得到提高。在這里需要注意的問題是,占優(yōu)策略也滿足納什均衡策略的條件。比如上一節(jié)中的案例1,占優(yōu)策略(支持布什方式,支持布什方式)也滿足納什均衡策略的條件。如果其中一名參與者單方面選擇支持安德森方式,并不會使自身的收益得到提高。四、夫妻博弈與發(fā)現(xiàn)納什均衡策略的方法本節(jié)中案例的原型是被稱為“夫妻博弈”的著名博弈模型。在原版的夫妻博弈之中,夫妻二人需要決定是去看拳擊比賽還是去看歌劇。對丈夫來說,看拳擊(+2)比看歌?。?1)的收益更大,而對妻子來說看歌?。?2)比看拳擊(+1)的收益更大。但是,兩人都不想自己一個人去(-1)。在這種情況下,(拳擊,拳擊)(歌劇,歌?。┻@兩種策略組合都滿足納什均衡的條件(圖表1-6)。有一個簡單的方法可以幫助我們通過收益矩陣來發(fā)現(xiàn)納什均衡策略。圖表1-6夫妻博弈的收益模型首先沿縱列比較參與者1的收益,在最高的數(shù)值下劃線(如果最高值有多個,則在所有最高值下面都劃線)。其次沿橫軸比較參與者2的收益,同樣在最高值下劃線。以圖表1-5為例,劃線后的結(jié)果如圖表1-7所示。如果在一個括號內(nèi)有兩個下劃線,那么這個策略組合就是納什均衡策略(圖內(nèi)灰色的部分)。即便有三個以上備選項(xiàng)的情況下,也同樣可以使用這個方法來發(fā)現(xiàn)納什均衡策略。假設(shè)在參與者不變的情況下,可選的策略又增加了一個F公司。那么各策略組合的收益矩陣如圖表1-8所示。通過這個收益矩陣可以看出,兩個參與者都有下劃線的策略組合分別是(D公司,D公司)(E公司,E公司)(F公司,F(xiàn)公司)。因此在這種情況下,存在三種納什均衡策略。圖表1-7發(fā)現(xiàn)納什均衡策略的方法①圖表1-8發(fā)現(xiàn)納什均衡策略的方法①五、搞清楚實(shí)現(xiàn)納什均衡的機(jī)制是今后的重要課題雖然納什均衡是博弈論中非常重要的概念,但并不意味著納什均衡就是完美無缺的。其中最重要的課題就是人們尚不清楚實(shí)現(xiàn)納什均衡的機(jī)制。比如本節(jié)的案例2,A銀行和B銀行如果必須在事先沒有任何交流,而且在不知道對方所選策略的情況下同時做出選擇的話(同時博弈),要怎樣才能實(shí)現(xiàn)納什均衡策略呢?納什均衡策略一旦實(shí)現(xiàn),任何參與者都不能再選擇其他策略,這一點(diǎn)是毋庸置疑的,但實(shí)現(xiàn)納什均衡策略的機(jī)制又是什么呢?在案例2中,如果A銀行無法準(zhǔn)確預(yù)測B銀行的策略,就無法選擇滿足納什均衡的策略。對于B銀行來說也一樣。如果想預(yù)測對方的策略,就必須掌握諸如“B銀行的態(tài)度一向很強(qiáng)硬,所以肯定會選擇對自身有利的E公司”“A銀行和D公司之間的關(guān)系非常密切,所以他們肯定會選擇D公司”之類的其他信息。在沒有掌握這些信息的情況下,兩家銀行很有可能選擇納什均衡之外的策略,也就是出現(xiàn)兩家銀行各自選擇不同系統(tǒng)的情況。這也是導(dǎo)致納什均衡遭到批判的主要原因。從這個意義上來說,同樣作為對各參與者的行動進(jìn)行分析的概念,納什均衡策略與占優(yōu)策略相比存在著不確定性。而這種不確定性在一次博弈存在多個納什均衡策略或者存在多個參與者的情況下又會有所提高。比如像圖表1-8那樣,包括(F公司,F(xiàn)公司)的策略在內(nèi)共有三個納什均衡策略存在,參與者很難決定應(yīng)該從這么多均衡中選擇哪一個。另外在有兩個以上參與者的情況下,想預(yù)測各參與者都會選擇哪個均衡策略也非常困難。接下來讓我們以有三名參與者的三人博弈為例進(jìn)行一下思考。六、三人之間的“夫妻博弈”如果參與者從兩個變成三個會發(fā)生怎樣的變化呢?讓我們在案例2中加入第三名參與者(參與者3)C銀行再進(jìn)行一下思考。三家銀行的系統(tǒng)統(tǒng)一博弈狀況如下。(一)參與者參與者有“A銀行”“B銀行”“C銀行”三個。參與者1代表“A銀行”、參與者2代表“B銀行”、參與者3代表“C銀行”。(二)策略與最開始的情況相同,各參與者從D公司和E公司之中二選一。排列組合后得出以下8種結(jié)果。(D公司,D公司,D公司)(D公司,D公司,E公司)(D公司,E公司,D公司)(D公司,E公司,E公司)(E公司,D公司,D公司)(E公司,D公司,E公司)(E公司,E公司,D公司)(E公司,E公司,E公司)(三)收益(D公司,D公司,D公司)(+2,+1,+1)(E公司,E公司,E公司)(+1,+2,+1)其他情況下全為(-1,-1,-1)先說結(jié)論,即便參與者變成三個,同時博弈的基本概念仍然有效。與兩人博弈之間的區(qū)別在于,隨著參與者的增加,博弈模型變得更加復(fù)雜,分析起來更加困難。而且在參與者不以合作為前提的博弈中,參與者數(shù)量越多,“納什均衡”的不確定性就越大。(四)三人博弈中建立收益矩陣的方法當(dāng)參與者變成三個之后,一個收益矩陣就無法表示全部參與者的策略了。于是只能通過多個矩陣來對三家銀行的策略進(jìn)行整理,如圖表1-9所示。收益矩陣中括號內(nèi)的數(shù)字順序依次代表A銀行、B銀行、C銀行的收益。存在三個參與者的情況下,需要制作兩個收益矩陣對更加復(fù)雜的收益狀況進(jìn)行整理。具體來說,就是用一個矩陣表示C銀行選擇D公司時各參與者的收益情況,用另一個矩陣表示C銀行選擇E公司時各參與者的收益情況。圖表1-9三人博弈的收益矩陣比如A銀行、B銀行、C銀行選擇(D公司,E公司,D公司)時的收益情況,相當(dāng)于上方收益矩陣中右上角的部分,選擇(E公司,E公司,E公司)時的收益情況則相當(dāng)于下方收益矩陣中右下角的部分。只有在三家銀行全都選擇D公司(或者全都選擇E公司)的情況下,收益矩陣?yán)ㄌ杻?nèi)的數(shù)字全部為正,除此以外(三家銀行沒有選擇相同系統(tǒng))的情況,全部為負(fù)。(五)在三人博弈中實(shí)現(xiàn)納什均衡策略的方法在這個收益矩陣中,可以根據(jù)和二人博弈相同的方法來發(fā)現(xiàn)納什均衡策略。首先在兩個收益矩陣中比較參與者1和參與者2的收益。也就是首先沿著縱列對參與者1的收益進(jìn)行比較,在數(shù)值高的下方劃線,然后沿著橫軸對參與者2的收益進(jìn)行比較,在數(shù)值高的下方劃線。收益相同的時候在所有相同的數(shù)值下劃線。然后比較參與者3的收益,在上下兩個矩陣的相同格子(比如D公司,D公司的格子)中代表參與者3收益的數(shù)值(括號內(nèi)最后一個數(shù)字)較大的下方劃線。比如對(D公司,D公司)的格子進(jìn)行比較,參與者3的收益分別是+1和-1,那么就在數(shù)值較大的+1下方劃線(圖中用虛線表示)。其他格子中也用同樣的方法劃線。在所有格子中,存在三條下劃線的策略就是這個博弈的納什均衡策略。對于這個案例來說,三家銀行選擇同一家公司的情況(D公司,D公司,D公司)以及(E公司,E公司,E公司)就是納什均衡策略。正如收益矩陣所顯示的那樣,一旦三家銀行選擇同一家公司,那么任何一家銀行做出不同的選擇都會使自身的收益受到損害。也就是說(D公司,D公司,D公司)以及(E公司,E公司,E公司)的策略組合,滿足“所有參與者在只有自己選擇其他策略的情況下都會使自身的收益受到損害”這一納什均衡成立的條件。在這個三人博弈的案例中,納什均衡中的最大問題——實(shí)現(xiàn)機(jī)制尚不明確表現(xiàn)得更加明顯。在需要對其他參與者可能采取的策略進(jìn)行預(yù)測的情況下,A銀行的負(fù)責(zé)人不但要預(yù)測B銀行的行動,還要預(yù)測C銀行的行動。而且如果無法獲得其他參與者相關(guān)信息的話,做出納什均衡策略之外選擇的可能性就變得更高了。七、事實(shí)標(biāo)準(zhǔn)也是納什均衡的一種參與者采取同樣的行動能夠獲得較多的收益,如果只有一人采取不同的行動則收益降低,這種情況在商業(yè)活動的現(xiàn)場可以說屢見不鮮。比如betamax和VHS之間的錄像格式之爭,手機(jī)之間的摩托羅拉和NTT之爭,電腦之間的IBM和MAC之爭,HDTV的格式之爭等。事實(shí)標(biāo)準(zhǔn)實(shí)際上也是一種納什均衡狀況。特別是在沒有法律規(guī)定的情況下,某種格式成為市場標(biāo)準(zhǔn)——比如電腦系統(tǒng)中的Windows——使用其他格式的消費(fèi)者就很難增加自身的收益。事實(shí)上,IOS系統(tǒng)的軟件價格一般都比Windows系統(tǒng)的軟件價格更高。因此消費(fèi)者只能屈從于事實(shí)標(biāo)準(zhǔn)。專欄:日常生活中的納什均衡在我們的日常生活中,也時常能夠發(fā)現(xiàn)納什均衡的存在。比如在車站搭乘自動扶梯的時候。為了給趕時間的人讓開一條快速的通道,搭乘自動扶梯的人都會自覺站在同一側(cè)。如果每個人都按照自己的喜好隨意站的話,那么趕時間的人就沒辦法快速通過。如果在其他人都站在同一側(cè)的情況下,只有自己一個人站在另一側(cè),會讓人感覺很不好意思,最終自己也會和其他人站到同一側(cè)去。這就是納什均衡。至于在自動扶梯上究竟應(yīng)該站在哪一側(cè),不同的國家和地區(qū)都有不同的習(xí)慣。東京地區(qū)乘客在左側(cè)站立,行人在右側(cè)通行,而大阪地區(qū)則是行人在左側(cè)通行。英國也是左側(cè)通行、右側(cè)站立。從全世界范圍來看,似乎采用英國方式的國家居多。為什么只有東京地區(qū)的習(xí)慣不同呢?原因至今尚未解明。但不管怎樣,一旦這種均衡的狀態(tài)實(shí)現(xiàn),那么就沒有人愿意打破這種均衡。順帶一提,最先進(jìn)的演化博弈論(第2部第4章)正在嘗試解明實(shí)現(xiàn)這種穩(wěn)定狀態(tài)的過程。第3節(jié):猜硬幣博弈與混合策略要點(diǎn)在不存在純策略納什均衡的博弈中,隨機(jī)選擇策略的混合策略往往能夠發(fā)揮出效果。另外,不管對方如何隨機(jī)選擇,自己的期望收益都固定不變的狀況被稱為混合策略納什均衡。即便在存在純策略納什均衡的博弈中,也可能存在混合策略納什均衡。與純策略納什均衡相比,混合策略納什均衡的期待收益更低。在多個均衡策略中做選擇的時候,可以將收益劣勢和對稱均衡作為選擇基準(zhǔn)。案例一、案例3:晚報(bào)的市場份額之爭歐洲D(zhuǎn)國的首都B市白天人口與夜晚人口差異極大,在B市工作的人幾乎都住在郊區(qū),每天坐地鐵上下班。因此,很多人都習(xí)慣下班回家時順便在車站的報(bào)刊亭買一份晚報(bào)。在種類繁多的晚報(bào)中,將尖銳的政治評論和社會新聞以及體育娛樂新聞完美綜合在一起的“評論報(bào)”最受歡迎。B市有兩家報(bào)社出版這種“評論報(bào)”,一個是老牌報(bào)社“B時事”另一個是新興報(bào)社“B郵報(bào)”。B時事比較保守且言辭犀利,B郵報(bào)則比較新潮且評論相對溫和,但兩份報(bào)紙的讀者群體并沒有明顯的區(qū)別。在B市通勤工作的人中,大約有20萬人會在回家的路上購買評論報(bào)。但這些讀者都是為了消磨坐車的時間,所以很少有人會一起買兩份報(bào)紙。至于兩份報(bào)紙的內(nèi)容質(zhì)量,讀者普遍認(rèn)為老牌報(bào)社“B時事”要更勝一籌。這一點(diǎn)從兩份報(bào)紙的市場份額上就能夠看得出來,現(xiàn)在兩份報(bào)紙的市場份額分別是B郵報(bào)40%、B時事60%。但兩份報(bào)紙的銷售比例并不總是4比6。在頭版刊登某些特別報(bào)道的時候,B郵報(bào)的銷量反而更高。因?yàn)轭^版的內(nèi)容很容易吸引讀者的目光,所以看到頭版內(nèi)容的顧客可能會改變自己的購買行動。***B郵報(bào)的新任主編施密特命令部下艾倫對過去兩份報(bào)紙的特別報(bào)道和當(dāng)時的銷量進(jìn)行分析。施密特的目標(biāo)是將現(xiàn)在4比6的銷售比例變成5比5。為了實(shí)現(xiàn)這一目標(biāo),腳踏實(shí)地的做法是招募和培養(yǎng)優(yōu)秀的作者和編輯,當(dāng)然施密特也很清楚這一點(diǎn)。不過他也希望能夠通過對特別報(bào)道的調(diào)整,盡量提高自身的市場份額。根據(jù)他的經(jīng)驗(yàn),當(dāng)兩份報(bào)紙都刊登同樣種類的特別報(bào)道時,B郵報(bào)的銷量就比平時更好一些。反之,如果兩份報(bào)紙刊登不同種類的特別報(bào)道,那么B郵報(bào)的銷量就遠(yuǎn)遠(yuǎn)不及B時報(bào)。奉命調(diào)查10天后,艾倫提交了一份調(diào)查報(bào)告?!笆┟芴刂骶?,我對過去的數(shù)據(jù)進(jìn)行調(diào)查之后發(fā)現(xiàn)了一個非常有趣的情況?!薄芭??什么情況?”“正如主編您所說的那樣,如果B郵報(bào)和B時報(bào)刊登同樣種類的特別報(bào)道,我們的銷量就會增加。”“果然如此嗎。那么具體的數(shù)字是多少呢?”“B時報(bào)在頭版刊登政治社會相關(guān)專題的時候,如果我們也刊登政治社會相關(guān)專題,那么就能夠獲得6成的市場份額。如果B時報(bào)在頭版刊登娛樂體育相關(guān)專題,我們也同樣刊登娛樂體育相關(guān)專題,則能夠獲得4成的市場份額。反之,如果對方刊登政治社會專題我們卻刊登娛樂體育專題,或者對方刊登娛樂體育專題我們卻刊登政治社會專題,那么我們的市場份額就非常少?;蛟S在刊登同種類專題的時候,我們因?yàn)楦有鲁焙驮u論相對溫和,所以更受讀者的喜愛吧?!薄胺粗?,在刊登不同種類專題的時候,取材能力更強(qiáng)的B時報(bào)比我們更有吸引力對吧。原來如此,辛苦你了艾倫,回去好好休息休息吧?!笔┟芴刈屑?xì)地閱讀了艾倫提交的報(bào)告,然后將艾倫整理出來的數(shù)據(jù)制成了一張圖表。通過將狀況圖表化,可以更加清楚地看出采取什么策略對自己最有好處。(圖表1-10)圖表1-10施密特制作的圖表這個圖表顯示的是當(dāng)B郵報(bào)和B時報(bào)刊登相應(yīng)種類的特別報(bào)道時B郵報(bào)和B時報(bào)的期待份額。比如當(dāng)B郵報(bào)和B時報(bào)都在頭版刊登政治社會特別報(bào)道的時候,B郵報(bào)的市場份額為60%,B時報(bào)的市場份額則為40%。施密特感到有些頭疼。因?yàn)锽郵報(bào)沒有絕對優(yōu)于其他的選項(xiàng),策略的效果會隨著對方的選擇而發(fā)生改變。對于B郵報(bào)來說最好的策略組合是B時報(bào)刊登政治社會專題,B郵報(bào)也刊登政治社會專題,但對方可不會聽?wèi){施密特的擺布。同時施密特也注意到,娛樂體育專題并非總是B時報(bào)的最優(yōu)策略。也就是說,在B時報(bào)刊登娛樂體育專題而B郵報(bào)也刊登娛樂體育專題的情況下,B時報(bào)的收益還不如“B郵報(bào)政治社會,B時報(bào)娛樂體育”的策略組合。進(jìn)行了上述分析之后,施密特終于意識到了這個問題的本質(zhì)。那就是在無法根據(jù)對方的選擇來采取相應(yīng)對策的前提下,B郵報(bào)和B時報(bào)就像是某種賭博中的莊家與閑家的關(guān)系,誰也沒有占據(jù)絕對優(yōu)勢的戰(zhàn)術(shù),只能推測對方的行動。施密特本身還經(jīng)營著一家賭場,精于此道的他得出了如下的結(jié)論?!皻w根到底還是概率的問題。關(guān)鍵在于選擇能夠讓期待值最大化的策略組合。”他取出紙筆,試著將這個策略組合計(jì)算出來。B郵報(bào)刊登政治社會專題的概率=PB郵報(bào)刊登娛樂體育專題的概率=(1-P)B時報(bào)刊登政治社會專題的概率=QB時報(bào)刊登娛樂體育專題的概率=(1-Q)在這種情況下B郵報(bào)的期待份額如下。0.6PQ+0.3(1-P)Q+0.2P(1-Q)+0.4(1-P)(1-Q)=0.5PQ-0.1Q-0.2P+0.4=0.5(P-0.2)(Q-0.4)+0.36由此可見,如果B郵報(bào)以20%的概率刊登政治社會專題,那么不管B時報(bào)按照何種比例來對專題進(jìn)行排列組合,從長時間的期待值來看,B郵報(bào)都能夠得到36%的市場份額。如果B郵報(bào)選擇“政治社會專題20%”以外的比例來對專題進(jìn)行排列組合,那么市場份額的期待值將隨著B時報(bào)的選擇而出現(xiàn)波動,可能比36%更高也可能更低。施密特又看了看艾倫提交的報(bào)告。根據(jù)他整理的數(shù)據(jù)可以看出,最近兩份報(bào)紙的專題內(nèi)容都是“政治社會占60%,娛樂體育占40%”。將這個數(shù)據(jù)帶入到上述公式中可以計(jì)算出B郵報(bào)的市場份額如下。0.5×(0.6-0.2)×(0.6-0.4)+0.36=0.40這個數(shù)字與實(shí)際的數(shù)字完全一致,施密特心中想道?!霸瓉砣绱恕H绻麑Ψ讲扇∽顑?yōu)策略的話我們只能獲得36%的市場份額,現(xiàn)在多虧對方?jīng)]注意到這一點(diǎn),所以我們才能維持40%的市場份額。與其貿(mào)然增加政治社會專題的比例刺激對方,不如維持現(xiàn)狀更好?!笔┟芴夭唤麑ψ约旱穆斆鞑胖茄笱笞缘闷饋??!俺弥鴮Ψ竭€沒意識到這個問題的時候,我們要抓緊時間提高自身的取材能力和編輯能力了?!?**就在這個時候,B時報(bào)的副主編盧津斯基結(jié)束外派工作回到編輯部,他在分析了近期兩份報(bào)紙的相關(guān)數(shù)據(jù)后,也得出了和施密特完全相同的結(jié)論?!叭绻凑照紊鐣n}40%、娛樂體育專題60%的比例,我們能夠獲得64%的市場份額,比現(xiàn)在的60%更高。如果以此作為底線,假設(shè)對方維持當(dāng)前的比率,那么我們可以將娛樂體育專題的比重提到最高,反之如果對方將政治社會專題的比率減少到20%以下的話,那么我們只要提高政治社會專題的比率就可以了?!眻?jiān)信自己已經(jīng)完全把握了狀況的盧津斯基立刻打開電腦給主編發(fā)送了一封郵件。理論在前面兩節(jié)中,我通過占優(yōu)策略和納什均衡策略這兩個概念,為大家說明了參與者在博弈中會采取怎樣的行動。但在某些博弈狀況下,有可能出現(xiàn)即便根據(jù)納什均衡的概念也無法確定策略(純策略)的情況。比如本節(jié)中介紹的案例,即便通過納什均衡的概念也找不出純策略。在這種情況下,就需要用到混合策略納什均衡的概念了。二、猜硬幣博弈“猜硬幣博弈”是最具代表性的不存在純策略納什均衡的博弈模型。在這個博弈中,兩個參與者各使用一枚硬幣進(jìn)行如下規(guī)則的博弈。兩人同時將硬幣放在桌子上,如果兩枚硬幣同為正面或者同為反面,那么參與者2獲勝,從參與者1處拿100日元。反之如果兩枚硬幣不是同一面,那么參與者1獲勝,從參與者2處拿100日元。這個博弈非常簡單,只是為了說明純策略納什均衡與混合策略納什均衡的區(qū)別而虛構(gòu)出來的博弈。將這個博弈的策略與收益整理成收益矩陣的話如圖表1-11。圖表1-11猜硬幣博弈的收益矩陣正如我在上一節(jié)中說明過的一樣,要想找出納什均衡,首先各參與者要在考慮對方可能采取的策略的前提下,在自己認(rèn)為能夠獲得更多收益的策略下方劃線。但在這個收益矩陣中,沒有任何一格出現(xiàn)兩名參與者都有下劃線的收益。也就是說,在這個博弈中不但不存在占優(yōu)策略,甚至也不存在滿足納什均衡的策略組合。這意味著不管參與者選擇矩陣中的哪一個策略組合,只要收益較少的參與者改變策略,那么改變策略的參與者就能夠獲得更多的收益。以(正面,正面)的策略組合為例。在這個狀況下,參與者2將獲得100日元的收益,但如果參與者1改變策略選擇(反面,正面)的策略組合,那么參與者1的收益就將從-100變成+100。如果當(dāng)前的策略組合是(正面,背面),那么參與者2單獨(dú)改變策略選擇使其變成(正面,正面)的話,那么就可以使自己的收益從-100變成+100。圖表1-11的收益矩陣中全部4種策略組合(正面,正面)(正面,反面)(反面,正面)(反面,反面)全都不符合納什均衡的條件。在博弈論中,能夠讓參與者做出確定行動的策略被稱為“純策略”。因此,在這個猜硬幣博弈中,可以說不存在純策略納什均衡。那么,這就意味著在這個博弈中不存在均衡策略嗎?三、隨機(jī)化與混合策略事實(shí)上,很多博弈都不存在純策略納什均衡。比如猜拳博弈,“石頭”“剪刀”“布”(這些都是純策略)不管哪一個都不是能夠保證一直取勝的策略。在猜拳的時候,如果想戰(zhàn)勝對方首先必須考慮什么呢?答案是絕對不能讓對方摸清自己的習(xí)慣。如果被對方發(fā)現(xiàn)“(即便是在無意識之中)自己有出石頭的習(xí)慣”,那么對方就會相應(yīng)地多出布來提高自身的勝率。猜硬幣博弈和猜拳非常相似。唯一的區(qū)別就是猜硬幣博弈只有正面和反面兩種純策略。從這個角度來說,在進(jìn)行猜硬幣博弈的時候首先應(yīng)該注意的一點(diǎn)就是不要讓對方發(fā)覺到自己出正面和出反面的習(xí)慣,采取完全隨機(jī)的方式。像這樣不采取純策略,而是根據(jù)一定的概率進(jìn)行隨機(jī)選擇的策略被稱為“混合策略”?;旌喜呗越酉聛砦覍⒂脭?shù)學(xué)的概念來對混合策略進(jìn)行說明。將參與者1選擇正面的概率設(shè)為P1(因此選擇反面的概率就是1-P1),參與者2選擇正面的概率設(shè)為P2(選擇反面的概率是1-P2),而且每個參與者都知道這個數(shù)字。因?yàn)榛旌喜呗允请S機(jī)選擇策略,所以每個參與者都能夠事先計(jì)算“自己能夠獲得多少收益”。這種預(yù)先估算出來的收益被稱為期待收益。在這個博弈中,期待收益就是將對方選擇正面或者反面的情況下所獲得的收益乘以對方這樣做的概率。期待收益就是數(shù)學(xué)概率論中“期待值”的一種。讓我們再次以圖表1-11的猜硬幣博弈為例進(jìn)行一下思考。假設(shè)參與者1選擇正面,在這種情況下如果參與者2也選擇正面那么參與者1的期待收益就是-100,而參與者2選擇反面的話參與者1的期待收益就是+100,將上述收益分別乘以參與者2選擇正面和反面的概率,得出以下算式。但因?yàn)閰⑴c者1自己選擇正面和反面的概率也是隨機(jī)的P1和1-P1,所以參與者1的總計(jì)期待收益如下。將算式①和②帶入算式③之中,經(jīng)整理后得出如下算式。用同樣的方法還可以計(jì)算出參與者2的期待收益。四、混合策略納什均衡及發(fā)現(xiàn)方法那么在這種情況下,各參與者應(yīng)該選擇怎樣的策略呢?在博弈論中,“在所有參與者都維持當(dāng)前隨機(jī)化概率的前提下,只有一名參與者改變隨機(jī)化概率無法增加自身收益的狀態(tài)”被稱為均衡狀態(tài)。也就是說,不管參與者2選擇怎樣的P2(隨機(jī)化概率),參與者1都會選擇不讓參與者2的期待收益發(fā)生變化的P1,而不管參與者1選擇怎樣的P1(隨機(jī)化概率),參與者2也會選擇不讓參與者1的期待收益發(fā)生變化的P2。在這種情況下,從參與者2的角度出發(fā),就必須選擇能夠使“參與者1選擇正面時的期待收益”和“參與者1選擇反面時的期待收益”相等的P2。如果上述兩個算式相等,那么可以整理成如下算式。計(jì)算后得出P2=0.5。這樣一來我們就可以根據(jù)算式③計(jì)算出參與者1的總計(jì)期待收益。在這種情況下,不管參與者1選擇的P1(隨機(jī)化概率)是多少,其總計(jì)期待收益都為零。同樣,不管參與者2選擇的P2是多少,其總計(jì)期待收益也是零。這種狀態(tài)被稱為混合策略納什均衡。在這種狀態(tài)下,只要其他參與者都保持隨機(jī)化概率不變,那么任何參與者單獨(dú)改變自身的隨機(jī)化概率,都無法使自身的期待收益增加。在這個猜硬幣博弈中,P1=0.5、P2=0.5的組合就是混合策略納什均衡。在第2節(jié)中為大家說明的納什均衡策略是以純策略為對象,因此準(zhǔn)確地說應(yīng)該稱之為純策略納什均衡?;旌喜呗约{什均衡這一概念實(shí)際上就是將純策略納什均衡應(yīng)用在混合策略上而已。所有參與者在只有自身采取不同策略的情況下無法獲取更多的收益的狀態(tài)就是納什均衡?;旌喜呗约{什均衡也一樣,如果只有自身選擇不同的隨機(jī)化概率也無法獲取更多的收益。從這個意義上來說,混合策略納什均衡也是滿足納什均衡條件的均衡狀態(tài)。綜上所述,在猜硬幣博弈之中,雖然不存在純策略納什均衡,卻存在混合策略納什均衡。而且混合策略納什均衡對于這個博弈中各參與者來說都是最優(yōu)策略。那么在實(shí)際操作中要如何執(zhí)行這種策略呢?從參與者1的角度來說,為了保持P1=0.5的隨機(jī)化概率,就必須讓對方知道自己會按照相同的概率選擇正面和反面。但這就出現(xiàn)了一個問題,如果參與者1有更多選擇正面(或者反面)的習(xí)慣,而且這個習(xí)慣還被參與者2發(fā)現(xiàn)了,那么均衡狀態(tài)就會被打破。也就是說,參與者1的行為模式被參與者2識破,那么參與者1就將遭受損失。人類自以為隨機(jī)的行動和選擇,實(shí)際上往往存在某種行為模式。一旦這種行為模式被其他擁有敏銳洞察力的參與者發(fā)現(xiàn),并且對自身的策略做出相應(yīng)的調(diào)整,那么這名參與者就能夠獲得更多的收益。擅長賭博的人往往能夠憑借某種本能的直覺來摸清對方的行為模式。因此,博弈的參與者要想不被這樣的人鉆空子,只能嚴(yán)格地按照隨機(jī)化概率來進(jìn)行選擇。幸運(yùn)的是,有一個非常簡單的實(shí)現(xiàn)隨機(jī)化概率的方法。那就是直接扔硬幣,讓硬幣自己掉落在桌面上。只要桌面和硬幣都沒有任何形狀上的缺損,那么硬幣出現(xiàn)正面和反面的概率一定是五五開。五、案例3中的隨機(jī)化接下來我將對本節(jié)中介紹的案例3“晚報(bào)的市場份額之爭”中存在的博弈做簡單的說明。首先請看這個博弈的收益矩陣(圖表1-12)。這里的收益或者期待收益就是兩份報(bào)紙各自的市場份額(銷售比例)。為便于計(jì)算,此處的百分比用小數(shù)點(diǎn)表示。正如圖表1-12所示,這是一個和猜硬幣博弈一樣不存在純策略納什均衡的博弈。我們按照案例中介紹的前提條件,在B郵報(bào)和B時報(bào)分別按照P和Q的概率隨機(jī)化刊登“政治社會”與“娛樂體育”專題的情況下,計(jì)算出滿足混合策略納什均衡的P和Q。圖表1-12晚報(bào)的市場份額之爭從B郵報(bào)的角度來看,肯定會選擇不管B時報(bào)選擇何種Q都無法增加B時報(bào)自身收益的P。當(dāng)兩者相等時,算式如下所示。計(jì)算可得P=0.2,此時B時報(bào)的總計(jì)期待收益為64%(Q相互抵消)。經(jīng)同樣方式的計(jì)算可以得出Q=0.4的時候,B郵報(bào)不管選擇何種P都無法提高自身的期待收益(市場份額),在這種情況下B郵報(bào)的總計(jì)期待收益(市場份額)為36%。綜上所述,當(dāng)混合策略納什均衡在這個案例中成立的情況下,就會出現(xiàn)如下的狀態(tài)。B郵報(bào):按照政治社會專題20%、娛樂體育專題80%的概率隨機(jī)化刊登。B時報(bào):按照政治社會專題40%、娛樂體育專題60%的概率隨機(jī)化刊登。在這種混合策略下,B郵報(bào)能夠獲得36%的市場份額、B時報(bào)則能夠獲得64%的市場份額。不管B郵報(bào)還是B時報(bào),如果單方面選擇其他的隨機(jī)化概率刊登專題,都無法提高自身的收益。六、案例2中的混合策略納什均衡在本節(jié)中,我通過猜硬幣博弈和案例3,為大家介紹了在不存在純策略納什均衡的博弈中,利用混合策略納什均衡選擇均衡策略的方法。不過在存在純策略納什均衡的博弈中,也可能存在混合策略納什均衡。接下來讓我們一起來看一看案例2的博弈中是否存在混合策略納什均衡。首先請看圖表1-13,這是案例2的收益矩陣。正如前文中說明過的那樣,在這個博弈中有(D公司,D公司)(E公司,E公司)兩個純策略納什均衡。圖表1-13選擇銀行系統(tǒng)的收益矩陣但在這個博弈中,也可以使用前文中提到的方法來發(fā)現(xiàn)混合策略納什均衡。將A銀行選擇D公司的概率設(shè)為P1(選擇E公司的概率為1-P1),B銀行選擇D公司的概率設(shè)為P2(選擇E公司的概率為1-P2)。因?yàn)锽銀行會選擇使前兩個數(shù)值相等的P2,因此計(jì)算可得P2=0.4。此時不管A銀行選擇的P1是多少,其總計(jì)期待收益都是固定的0.2億日元。同樣A銀行為了不管B銀行選擇D公司還是E公司都得到同樣的期待收益,選擇的P1=0.6。在這種情況下,不管B銀行選擇的P2是多少,都固定得到0.2億日元的期待收益。綜上所述,這個博弈中存在混合策略納什均衡,其概率的組合為P1=0.6、P2=0.4。那么要怎么做才能實(shí)現(xiàn)這個混合策略納什均衡呢?因?yàn)楦怕什⒎?.5,所以不能像猜硬幣博弈那樣靠扔硬幣來實(shí)現(xiàn)隨機(jī)化,但可以用抽簽來實(shí)現(xiàn)隨機(jī)化。比如A銀行可以準(zhǔn)備10個紙條,6個紅色的4個藍(lán)色的,然后閉上眼睛隨機(jī)抽選,抽中紅色的就選擇D公司,抽中藍(lán)色的則選擇E公司。B銀行剛好和A銀行相反,抽中紅色的選擇E公司,抽中藍(lán)色的選擇D公司。當(dāng)然,A銀行和B銀行互相都不知道對方抽中了什么顏色。七、從多個納什均衡策略中選出最佳策略的基準(zhǔn)這個混合策略的期待收益(0.2,0.2)與純策略的期待收益(2,1)或者(1,2)相比要少得多。這究竟是為什么呢?原因在于兩家銀行都是用抽簽決定采取什么行動,所以兩家銀行偶然選擇相同系統(tǒng)(D公司,D公司)(E公司,E公司)的概率是0.6×0.4=0.48。而抽簽還會導(dǎo)致出現(xiàn)(D公司,E公司)(E公司,D公司)這種兩家銀行最不希望看到的結(jié)果。出現(xiàn)(D公司,E公司)的概率是0.6×0.6=0.36,出現(xiàn)(E公司,D公司)的概率是0.4×0.4=0.16,合計(jì)是0.36+0.16=0.52。也就是說,通過抽簽來決定的混合策略有52%的概率導(dǎo)致兩家銀行選擇不同的系統(tǒng)。出現(xiàn)這種兩敗俱傷結(jié)果的概率超過一半,期待收益當(dāng)然會下降。在這種混合策略納什均衡的狀態(tài)下,兩個參與者獲得的收益(期待收益)比純策略納什均衡獲得的收益更少。像這樣存在多個均衡狀態(tài)的情況下,與其他均衡相比獲得收益(期待收益)更少的均衡策略被稱為收益劣勢策略。另外,任何參與者通過這個混合策略獲得的期待收益都是相同的(0.2,0.2)。這種所有參與者獲得的收益(期待收益)都相同的均衡被稱為對稱均衡。對于存在多個均衡的博弈來說,收益劣勢和對稱均衡就是選擇博弈解的基準(zhǔn)。至于應(yīng)該采取哪種基準(zhǔn)則需要具體問題具體分析。比如A銀行和B銀行的策略重點(diǎn)是希望獲得相同的收益,那么兩家銀行就應(yīng)該選擇滿足對稱均衡條件的混合策略納什均衡,但如果雙方都想獲得更多的收益,那就應(yīng)該避免選擇滿足收益劣勢的混合策略納什均衡,盡量在兩種純策略納什均衡之間做出選擇。在實(shí)際應(yīng)用中,即便兩家銀行獲取的收益不同,一般來說都更傾向于選擇純策略納什均衡。但如果參與者之間的收益差距非常懸殊,那么也會出現(xiàn)參與者更重視對稱均衡的情況。看到這里相信大家都已經(jīng)發(fā)現(xiàn),在博弈中存在多個均衡的情況并不是什么稀奇的事情。在商業(yè)活動的現(xiàn)場,像案例2那樣存在多個參與者都能夠接受的選擇的情況十分常見。至于參與者如何在多個均衡策略中選出最適合自己的策略并且使之實(shí)現(xiàn),不管對博弈論的研究者還是對博弈論的應(yīng)用者來說,都是非常重要的課題。八、多人博弈中的混合策略納什均衡最后讓我們來看一看當(dāng)存在三個以上參與者的情況下,發(fā)現(xiàn)混合策略納什均衡的方法。讓我們繼續(xù)用第2節(jié)案例2的三人博弈版來對混合策略納什均衡進(jìn)行解說(圖表1-14)。想更詳細(xì)了解混合策略納什均衡的讀者可以參閱本節(jié)最后的專欄。圖表1-14三人博弈的收益矩陣先說結(jié)論,在三人博弈的情況下,A銀行、B銀行、C銀行選擇D公司的概率分別是0.6、0.4、0.5。這時A銀行和B銀行的期待收益是-0.4億日元,C銀行的期待收益是-0.52億日元。讓我們對比一下三人博弈與二人博弈的混合策略納什均衡所取得的期待收益。A銀行和B銀行在三人博弈中采用和二人博弈同樣的概率進(jìn)行隨機(jī)化選擇\h\h[1]。但他們從混合策略中獲得的期待收益卻比二人博弈時的0.2億日元相比下降了許多。這究竟是為什么呢?答案其實(shí)很簡單。因?yàn)樵诨旌喜呗灾懈鲄⑴c者都隨機(jī)做出選擇,所以三個參與者全都選擇同一家公司的概率比二人博弈的時候更低。接下來讓我們再用前文中提到過的猜硬幣博弈來思考一下混合策略納什均衡。在二人博弈中,只要各參與者都以0.5的概率選擇正面和反面,那么兩人同時出現(xiàn)(正面,正面)或者(反面,反面)的概率各為0.25。也就是合計(jì)0.5(二分之一)。但如果博弈的參與者變成三個,那么所有參與者都選擇正面或者反面的概率就變成了0.5×0.5×0.5=0.125。合計(jì)只有0.25,概率降低到了四分之一。順帶一提,如果參與者變成四個,那么選擇同一面的概率是八分之一。參與者變成十個的話概率更會低到可憐的0.002。這個數(shù)字意味著需要進(jìn)行500次博弈才可能出現(xiàn)一次這樣的情況。正如前文中說明過的那樣,如果將混合策略看作是“隨機(jī)抽簽策略”,那么博弈的參與者越多,出現(xiàn)期望結(jié)果的概率就越低。在案例2的三人博弈中,出現(xiàn)(D公司,D公司,D公司)和(E公司,E公司,E公司)的概率分別是0.6×0.4×0.5=0.12,合計(jì)0.24。這個概率剛好是二人博弈時的二分之一。反之,剩下0.76也就是大約四分之三的概率,會出現(xiàn)三家銀行沒有選擇相同系統(tǒng)這個大家都不希望看到的結(jié)果。綜上所述,從期待收益的角度考慮的話,在這個三人博弈中如果選擇混合策略納什均衡,導(dǎo)致收益降低的可能性比二人博弈的時候更高。至于多人博弈中的純策略納什均衡,正如第2節(jié)中介紹過的那樣,“目前人們尚不清楚實(shí)現(xiàn)納什均衡的機(jī)制”,在思考應(yīng)該選擇何種策略的時候必須意識到這一點(diǎn)。與只有兩個參與者相比,要預(yù)測三個參與者各自會采取什么策略顯然更加困難。在這種各參與者相互之間存在利害關(guān)系的多人博弈之中,如何避免參與者隨機(jī)化選擇導(dǎo)致選中收益劣勢策略,以及促使參與者都選擇能夠獲得最高收益的純策略納什均衡,對于所有參與者來說都至關(guān)重要。專欄:混合策略的思考方法按照和第3節(jié)同樣的方法將ABC三家銀行選擇D公司的概率分別設(shè)為P1、P2、P3(因此選擇E公司的概率就是1-P1、1-P2、1-P3)。那么對于A銀行來說,當(dāng)A銀行選擇D公司的情況下,只有在B銀行和C銀行都選擇D公司,即此概率為P2×P3時,收益才是+2,除此之外的其他情況收益都是-1。而當(dāng)A銀行選擇E公司的情況下,只有在B銀行和C銀行都選擇E公司,即概率為(1-P2)×(1-P3)時,收益才是+1,除此之外的其他情況收益都是-1。同樣可以算出B銀行和C銀行的期待收益。A銀行、B銀行、C銀行不管選擇D公司還是E公司都得到同樣的收益狀態(tài)下的P1、P2、P3滿足混合策略納什均衡的條件,所以滿足以下三個等式的P1、P2、P3就是混合納什均衡。A①=A②B①=B②C①=C②這部分的計(jì)算稍微有些復(fù)雜,需要用三個方程來求出三個未知數(shù)的解。最后計(jì)算出的結(jié)果是P1=0.6、P2=0.4、P3=0.5。第4節(jié):連續(xù)策略、連續(xù)收益與寡頭壟斷下的競爭理論要點(diǎn)在市場處于寡頭壟斷下且擁有無限多個(連續(xù)的)純策略的情況下,可以用古諾競爭模型和伯川德競爭模型來對策略進(jìn)行分析。在這種情況下,自身的收益會受到對方策略的影響。納什均衡的思考方法也適用于這種存在連續(xù)策略的場合。案例一、案例4:面包店老板的競爭F面包是偏僻的C鎮(zhèn)的一家面包生產(chǎn)企業(yè)。C鎮(zhèn)還有一家面包生產(chǎn)企業(yè)叫作G烘焙,兩家企業(yè)相互競爭,市場份額不相上下。F面包的老板山田先生和G烘焙的老板白河女士多年以來一直是競爭對手,因此關(guān)系惡劣,即便在這個面積并不大的小鎮(zhèn)子里偶然相遇也互不理睬。不久之前,有一家汽車企業(yè)在小鎮(zhèn)附近動工建造汽車工廠。由于工廠位于一片廣闊的農(nóng)田之中,附近不但沒有食堂甚至連個便利店都沒有,于是這家汽車企業(yè)委托A餐飲集團(tuán)在工廠建成后為食堂提供食材。A餐飲集團(tuán)的老板石川找到山田,希望他能夠提供一些面包。當(dāng)然,石川同樣也向G烘焙的白河提出了同樣的請求。***面對和競爭對手之間的正面競爭,山田當(dāng)然不想輸給白河。但就在他冥思苦想如何比對方獲得更多訂單的時候,石川忽然發(fā)來一封奇怪的郵件。郵件上寫明了采購面包的條件?!拔掖蛩阆騀面包和G烘焙訂購面包。要求每袋裝10片的切片面包,重量、品質(zhì)、切片數(shù)必須完全一致。包裝袋上不要打印商標(biāo)。訂購價格為200減去兩家企業(yè)供應(yīng)的面包總數(shù)。比如兩家企業(yè)合計(jì)供應(yīng)了70袋面包,那么一袋面包的價格就是130日元,如果兩家企業(yè)合計(jì)供應(yīng)了100袋面包,那么一袋面包的價格就是100日元。但考慮到生產(chǎn)成本,訂購價格最低不會少于70日元。也就是說,如果兩家企業(yè)合計(jì)供應(yīng)了130袋以上的面包,那么我將以70日元一袋的價格全部收購。請兩家企業(yè)在上述條件下適當(dāng)調(diào)整供應(yīng)數(shù)量,盡可能地保證自身利益。不過,兩家企業(yè)事先不能對供應(yīng)數(shù)量進(jìn)行協(xié)商?!笨赐赀@封郵件之后山田不由得露出苦笑的表情?!笆赡懿恢牢腋缀邮撬缹︻^吧,我怎么可能跟她協(xié)商。不過在這個小鎮(zhèn)上,人人都知道我跟白河的關(guān)系,石川大概也是聽說了什么才故意設(shè)置了這么一個對他自己有利的訂購條件??傊还茉鯓?,我都要想出一個比G烘焙更賺錢的對策來,這是個打擊對方的大好機(jī)會?!钡ㄋ坪踔肋@種面包的生產(chǎn)成本最低也要80日元。而且F面包和G烘焙因?yàn)樯a(chǎn)技術(shù)和原料都基本相同,在生產(chǎn)成本上根本拉不開差距,這也是眾所周知的事實(shí)。石川將最低訂購價格定在70日元,或許也是為了從成本上限制兩家企業(yè)的供應(yīng)數(shù)量,避免出現(xiàn)過度競爭的局面。***山田感到有些煩惱。如果他害怕壓低價格而減少供應(yīng)量,但白河供應(yīng)的數(shù)量比他多,那么利潤就都被白河賺去了。但如果他大批量供貨,而白河也大批量供貨,訂購價格就會降低到70日元,導(dǎo)致入不敷出。在這種情況下,減少供應(yīng)數(shù)量的企業(yè)反而能降低損失。山田給自己在大學(xué)專攻經(jīng)營學(xué)的兒子打了個電話,向他詢問自己應(yīng)該供應(yīng)多少數(shù)量才能實(shí)現(xiàn)利益的最大化。理論二、連續(xù)策略與連續(xù)收益前文中介紹的博弈,純策略的數(shù)量都是有限的。比如案例1中只有“支持安德森方式”和“支持布什方式”兩個,第1章第2節(jié)圖表1-8中只有“D公司”“E公司”“F公司”三個。類似這樣的情況用收益矩陣表現(xiàn)出來之后,選擇什么策略會得到什么收益就一目了然。但存在無數(shù)個純策略的時候應(yīng)該怎么辦呢?在實(shí)際的商業(yè)活動之中,類似價格和產(chǎn)量等存在無限多個選擇的情況十分常見。比如企業(yè)可以自由地設(shè)定商品的價格和生產(chǎn)數(shù)量。在這種情況下策略的選項(xiàng)就不止兩個或者三個,而是無限個(連續(xù)的)。對于選項(xiàng)較少的博弈,只要通過收益矩陣就可以簡單地進(jìn)行說明,因此在博弈論的入門書中十分常見。但博弈論并非只能對簡單的商業(yè)案例進(jìn)行分析。當(dāng)選項(xiàng)連續(xù)出現(xiàn)的時候,分析也會變得更加復(fù)雜。本書介紹的博弈論概念同樣適用于這種存在連續(xù)策略選擇的情況。本節(jié)將對市場處于寡頭壟斷狀態(tài)下,企業(yè)應(yīng)該采取何種生產(chǎn)方針和價格方針才能使自身收益最大化,以及博弈論如何在這種存在連續(xù)選擇的博弈中發(fā)揮作用進(jìn)行說明。前文中為大家介紹過的均衡概念在這種連續(xù)的策略下仍然適用。三、古諾競爭本節(jié)案例中出現(xiàn)的這種情況是被稱為“古諾競爭”的微觀經(jīng)濟(jì)學(xué)經(jīng)典寡頭壟斷模型。古諾競爭模型是在博弈論問世之前,法國經(jīng)濟(jì)學(xué)家古諾于1838年提出的模型。在這個模型中,多個寡頭企業(yè)進(jìn)行生產(chǎn),這些企業(yè)的總生產(chǎn)量會對產(chǎn)品的價格造成影響。具體來說,古諾競爭包括以下幾個要素?!つ呈袌鎏幱趲准移髽I(yè)的寡頭壟斷狀態(tài)下?!な袌鲋挟a(chǎn)品的價格由幾家企業(yè)的總產(chǎn)量決定?!榱耸故找孀畲蠡?,生產(chǎn)者需要決定自己的產(chǎn)量。在本節(jié)的案例4之中,兩家面包生產(chǎn)企業(yè)要競爭面包供應(yīng)的市場。古諾競爭的關(guān)鍵在于,當(dāng)供應(yīng)商品時,商品價格由兩家企業(yè)供應(yīng)的總數(shù)量決定。也就是說,除了自身的供應(yīng)量之外,商品的價格還會受競爭對手供應(yīng)數(shù)量的影響,從而影響到自身的收益。因此,自身必須在預(yù)測對方行動的前提下,采取對自身最為有利的行動。這也是古諾競爭被歸于博弈論的原因。在這里F面包就是參與者1、G烘焙就是參與者2。兩家企業(yè)都想盡可能多地獲取收益,而且他們的面包在質(zhì)量上完全不相上下,價格也相同。我們將價格設(shè)為P,F(xiàn)面包的供貨數(shù)量設(shè)為Q1、G烘焙的供貨數(shù)量設(shè)為Q2(如果Q1=1就代表F面包供貨數(shù)量為1袋)。A餐飲集團(tuán)提出條件是“訂購價格為200減去兩家企業(yè)供應(yīng)的面包總數(shù)”,如果P(日元)是訂購價格,那么P=200-(Q1+Q2)。但如果兩家企業(yè)的合計(jì)供貨數(shù)量超過130袋(也就是Q1+Q2>130)的情況下,P等于70日元。兩家企業(yè)的利潤就是訂購價格減去生產(chǎn)成本80日元再乘以供貨數(shù)量(袋數(shù))。整理成算式如下。將P=200-(Q1+Q2)帶入上述算式,得出如下算式。將兩家企業(yè)的收益整理成如上算式后收益就一目了然了。假設(shè)參與者1和參與者2都能夠事先得知競爭對手的供貨數(shù)量,并且根據(jù)這一信息來決定自己的產(chǎn)量,那么他們各自的生產(chǎn)數(shù)量如下。這就是高中數(shù)學(xué)二次函數(shù)取最大值的問題。簡單來說,兩家企業(yè)選擇這個產(chǎn)量就能夠保證收益算式最初的部分為零,除此之外的其他產(chǎn)量則都為負(fù)數(shù),也就是說總計(jì)收益一定比這個產(chǎn)量更少。綜上所述,當(dāng)參與者2的產(chǎn)量為Q2時,參與者1的產(chǎn)量應(yīng)該是(120-Q2)÷2。比如以下兩種情況。參與者2也應(yīng)該采取同樣的方法,預(yù)測參與者1的產(chǎn)量然后決定自己的產(chǎn)量。將參與者1的產(chǎn)量設(shè)為橫軸,參與者2的產(chǎn)量設(shè)為縱軸整理后如圖表1-15所示。圖表1-15參與者的產(chǎn)量比較那么在這個博弈中要如何發(fā)現(xiàn)納什均衡策略呢?從結(jié)論來說,圖表1-15中兩條產(chǎn)量線相交的點(diǎn)就是納什均衡策略。也就是說,兩個參與者都應(yīng)該選擇40袋(Q1=Q2=40)的策略。在這個情況下,兩家企業(yè)的收益都是1600日元,面包的訂購價格為120日元。為什么這個策略是納什均衡策略呢?讓我們回憶一下納什均衡策略的定義。納什均衡策略指的是“任何參與者單方面選擇納什均衡策略之外的其他策略,都無法提高自身的收益”。假設(shè)在這個博弈中其中一方參與者選擇了其他的策略,會不會增加自身的收益呢?讓我們來驗(yàn)證一下。比如參與者1將供應(yīng)量增加到50袋(Q1=50),而參與者2仍然保持40袋(Q2=40)的供應(yīng)量不變,那么訂購價格就變成P=200-(50+40)=110日元,降低了10日元(每袋面包的利潤從40日元降低到30日元)。在這種情況下,參與者1的收益為30×50=1500,比生產(chǎn)40袋時的1600日元更低。同樣如果參與者1將供應(yīng)量減少到30袋(Q1=30),那么訂購價格就變成P=200-(30+40)=130日元,上漲了10日元(每袋面包的利潤從40日元上漲到50日元)。在這種情況下,參與者1的收益為50日元×30袋=1500日元,仍然比生產(chǎn)40袋時的1600日元更低。上述情況對參與者2來說也一樣??偠灾?,在兩家企業(yè)都選擇供應(yīng)40袋的策略時,任何一家單方面改變策略都無法使自身的收益增加。綜上所述,在策略連續(xù)的博弈中納什均衡同樣能夠發(fā)揮作用。任何參與者都無法通過單獨(dú)采取不同的行動來增加自身的收益,這一點(diǎn)不管可選策略是有限還是無限都沒有任何改變。但與一目了然的收益矩陣相比,這種必須假設(shè)其他參與者的行動,通過算式來計(jì)算自身選擇何種策略才能取得最大收益的方法在技術(shù)上稍微有些難度。當(dāng)然,古諾競爭是一個非常復(fù)雜且精密的模型,在實(shí)際的商業(yè)活動中不可能存在如此簡單地決定商品價格的情況。但對難以通過品質(zhì)來實(shí)現(xiàn)差異化的商品(比如農(nóng)產(chǎn)品)的生產(chǎn)者來說,幾乎每天都處于古諾競爭的狀態(tài)之下。很多日常商品都會因?yàn)槭袌錾仙唐房倲?shù)的影響而出現(xiàn)價格波動,商品數(shù)量多價格就會下降,商品數(shù)量少價格則會上升。但產(chǎn)量過多的話雖然銷量增加但因?yàn)閮r格降低所以最終收益也會減少,而就算價格很高如果產(chǎn)量跟不上的話也無法提高收益。像水果這種經(jīng)常出現(xiàn)大豐收的商品之所以經(jīng)常遭到果農(nóng)的大量銷毀,就是因?yàn)檫@些商品的生產(chǎn)者處于古諾競爭的狀況之中。四、伯川德競爭在博弈論中還有一個和古諾競爭齊名的寡頭壟斷博弈模型,那就是伯川德競爭。伯川德競爭是1883年由法國人伯川德提出的。伯川德競爭與古諾競爭最大的區(qū)別在于決定因素不是產(chǎn)量而是價格。也就是說,能夠提供最低價格的生產(chǎn)者將獨(dú)占整個市場。伯川德競爭包括以下幾個要素?!つ呈袌鎏幱趲准移髽I(yè)的寡頭壟斷狀態(tài)下?!ぬ峁┳畹蛢r格的生產(chǎn)者將獨(dú)占整個市
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CARSA 1.1-2022基于低空無人機(jī)的高分衛(wèi)星遙感產(chǎn)品真實(shí)性檢驗(yàn)第1部分:總則
- T/CAPMA 7-2021土種綿羊原毛交易技術(shù)指南
- T/CAPE 12002-2021氣柜密封油
- 電子工程師面試題及答案
- 伊利面試題及答案
- 環(huán)保面試題及答案
- 軍工產(chǎn)品定價管理制度
- 家長會英語老師發(fā)言稿模版
- 小學(xué)語文《橋》教案
- 快畢業(yè)后離開學(xué)校協(xié)議書
- 中醫(yī)護(hù)理如何做好健康宣教
- 燃?xì)庑袠I(yè)數(shù)字化轉(zhuǎn)型趨勢分析-全面剖析
- 醫(yī)院手術(shù)室操作流程及評分標(biāo)準(zhǔn)
- 班級學(xué)生基本情況調(diào)查
- 《小麥在人類膳食中的重要性:歷史與現(xiàn)代視角》論文
- 【西安交通大學(xué)】2025年電力人工智能多模態(tài)大模型創(chuàng)新技術(shù)及應(yīng)用報(bào)告
- 分賬管理制度
- 電動汽車車網(wǎng)互動規(guī)?;l(fā)展策略與標(biāo)準(zhǔn)體系規(guī)劃
- 餐飲服務(wù)流程與標(biāo)準(zhǔn)操作指引
- (一模)石家莊市2025年高三年級教學(xué)質(zhì)量檢測(一)物理試卷(含標(biāo)準(zhǔn)答案)
- 產(chǎn)品供應(yīng)鏈合作協(xié)議與分銷合同簽訂備忘錄
評論
0/150
提交評論