




免費預覽已結束,剩余5頁可下載查看
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
博弈論與納什均衡第22卷第4期哈爾濱師范大學自然科學Vo1.22,No.42006NATURALSCIENCESJOURNALOFHARBINNORMALUNIVERSITY博弈論與納什均衡郭鵬楊曉琴(中國礦業(yè)大學)(雞西大學)【摘要】納什均衡的提出和不斷完善,為博弈論廣泛應用于經(jīng)濟學,管理學,社會學,政治學,軍事科學等領域奠定了堅實的理論基礎.關鍵詞:博弈論;納什均衡;非合作博弈0引言博弈論又稱對策論,是使用嚴謹?shù)臄?shù)學模型研究現(xiàn)實世界中沖突對抗條件下最優(yōu)決策問題的理論.兩千多年前,孫臏利用博弈論原理幫助田忌賽馬取勝,就是早期博弈論的萌芽.作為-FJ正式學科,博弈論是在2O世紀4O年代形成并發(fā)展起來的,合作型博弈在2O世紀5O年代達到了巔峰期.然而,它過于抽象,實用性不強,其局限性日益暴露出來.5O年代以來,納什(Nash),澤爾騰(Selten),海薩尼(Harsanyi)等人使博弈論成熟并最終進入實用.最近三四十年,經(jīng)濟學經(jīng)歷了一場博弈論革命,引入博弈論的概念和方法改造經(jīng)濟學的思維,推進經(jīng)濟學的研究.1994年諾貝爾經(jīng)濟學獎授予3位博弈論專家納什,澤爾騰和海薩尼,可以看作是一個標志,這也激發(fā)了人們了解博弈論的熱情.博弈論作為現(xiàn)代經(jīng)濟學的前沿領域,已成為占據(jù)主流地位的基本分析工具.簡單地說,博弈論研究決策主體在給定信息結構下如何決策以最大化自己的效用,以及不同決策主體之間決策的均衡.博弈論由3個基本要素組成:一是決策主體(Player),又可以譯為參與人或局中人;-是給定的信息結構,可以理解為參與人可選擇的策略和行動空間,又叫策略集;三是收稿日期:2oo60215效用(Utility),是可以定義或量化的參與人的利益,也是所有參與人真正關心的東西,又稱偏好或支付函數(shù).參與人,策略集和效用構成了一個基本的博弈.1博弈論的主要思想一個完整的博弈應當包括五個方面的內(nèi)容:第一,博弈的參加者,即博弈過程中獨立決策,獨立承擔后果的個人和組織t第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失.博弈論模型可以用五個方面來描述:G=P,A,S,U)P:為局中人,博弈的參與者,也稱為博弈方,局中人是能夠獨立決策,獨立承擔責任的個人或組織,局中人以最終實現(xiàn)自身利益最大化為目標.A:為各局中人的所有可能的策略或行動的集合.根據(jù)該集合是有限還是無限,可分為有限博弈和無限博弈,后者表現(xiàn)為連續(xù)對策,重復博弈和微分對策等.哈爾濱師范大學自然科學2006筢.S:博弈的進程,也是博弈進行的次序.局中人同時行動的一次性決策的博弈,稱為靜態(tài)博弈;局中人行動有先后次序,稱為動態(tài)博弈.,:博弈信息,能夠影響最后博弈結局的所有局中人的情報.信息在博弈中占重要的地位,博弈的贏得很大程度上依賴于信息的準確度與多寡.得益信息是博弈中的重要信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚,稱之為完全信息博弈.反之為不完全信息博弈.在動態(tài)博弈中還有一類信息:輪到行動的博弈方是否完全了解此前對方的行動.如果完全了解則稱之為具有完美信息的博弈.反之稱為不完美信息的動態(tài)博弈.由于信息不完美,博弈的結果只能是概率期望,而不能像完美信息博弈那樣有確定的結果.:為局中人獲得利益,也是博弈各方追求的最終目標.根據(jù)各方得益的不同情況,分為零和博弈與變和博弈.零和博弈中各方利益之間是完全對立的.變和博弈有可能存在合作關系,爭取雙贏的局面.博弈論根據(jù)其所采用的假設不同而分為合作博弈理論和非合作博弈理論.前者主要強調的是團體理性;而后者主要研究人們在利益相互影響的局勢中如何選擇策略使得自己的收益最大,即策略選擇問題,強調的是個人理性.兩者的區(qū)別在于參與人在博弈過程中是否能夠達成一個具有約束力的協(xié)議.倘若不能,則稱非合作博弈,非合作博弈是現(xiàn)代博弈論的研究重點.博弈的劃分可以從參與人行動的次序和參與人對其他參與人的特征,戰(zhàn)略空間和支付的知識(信息)是否了解兩個角度進行.把兩個角度結合就得到了4種博弈:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈.嚴格地講,博弈論并不是經(jīng)濟學的一個分支,它只是一種方法,這也是為什么許多人將其看成數(shù)學的一個分支的緣故.博弈論已經(jīng)在政治,經(jīng)濟,外交和社會學領域有了廣泛的應用,它為解決不同實體的沖突和合作提供了一個寶貴的方法.目前談到博弈論主要指的是非合作博弈,也就是各方在給定的約束條件下如何追求各自利益最大化,最后達到力量均衡.在這一點上,博弈論和經(jīng)濟學家的研究模式是完全一樣的.經(jīng)濟學越來越轉向人與人關系的研究,特別是人與人之間行為的相互影響和相互作用,人與人之間利益和中突,競爭與合作,而這正是博弈論的研究對象.2博弈論的代表人物博弈論主要是由馮?諾依曼(19031957)所創(chuàng)立的.他是一位出生于匈牙利的天才的數(shù)學家.他不僅創(chuàng)立了經(jīng)濟博弈論,而且發(fā)明了計算機.早在20世紀初,塞梅魯(Zermelo),鮑羅(Bore1)和馮?諾伊曼(VonNeumann)已經(jīng)開始研究博弈的準確的數(shù)學表達,直到1939年,馮?諾依曼遇到經(jīng)濟學家奧斯卡?摩根斯坦思(OskarMorgenstem)并與其合作才使博弈論進入經(jīng)濟學的廣闊領域.1944年他與奧斯卡?摩根斯坦恩合著的巨作博弈論與經(jīng)濟行為出版,標志著現(xiàn)代系統(tǒng)博弈理論的初步形成.書中提出的標準型,擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎.合作型博弈在20世紀50年代達到了巔峰期.然而,諾依曼博弈論的局限性也日益暴露出來,它過于抽象,應用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學家的專利,影響力很有限.正是在這個時候,非合作博弈納什均衡應運而生了,它標志著博弈論的新時代的開始.納什是一位天才式的人物,上大學時就開始從事純數(shù)學的博弈論研究,特別是在經(jīng)濟博弈論領域,他做出了劃時代的貢獻,是繼馮?諾依曼之后最偉大的博弈論大師之一.他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用.后續(xù)的研究者對博弈論的貢獻,都是建立在這一概念之上的.由于納什均衡的提出和不斷完善,為博弈論廣泛應用于經(jīng)濟學,管理學,社會學,政治學,軍事科學等領域奠定了堅實的理論基礎.納什博士1950年11月刊登在美國全國科學院每月公報上的兩篇論文將馮?諾依曼的最小最大原理推廣到非合作博弈領域,找到了普遍化的方法和均衡點,比馮?諾伊曼的合作博弈理論更能反映現(xiàn)實的情況.20世紀50年代以后,澤爾騰,海薩尼等人對博弈論作了進一步的完善,使之更為實用.近20年來,博弈論作為分析和解決沖突和合作的工具,在管理科學,國際政治,生態(tài)學等領域得到廣泛的應用.3納什均衡與博弈論的應用囚徒困境(PrisonergDilemma)至今仍然是博弈研究的重要課題.兩個嫌疑犯作案后被警察第4期博弈論與納什均衡逮捕,分別關在不同的屋子里審訊,警察告訴他們,如果兩個人都坦白,那么每人判刑8年;如果兩個人都抵賴,每人各判刑1年;如果其中一人坦白,另一人抵賴的話,坦白的人釋放,抵賴的人判刑1O年.這里每個囚徒都有兩種戰(zhàn)略:坦白或抵賴;在這個博弈中,納什均衡是(坦白,坦白),盡管從總體上看,(抵賴,抵賴)是對兩個人都有益的結果,但由于不構成納什均衡,所以不是該博弈的解,給定坦白的情況下,A.的最優(yōu)戰(zhàn)略是坦白;同樣,A坦白的前提下,的最優(yōu)戰(zhàn)略是坦白,AU最優(yōu)戰(zhàn)略的組合卻不是總體最優(yōu)的選擇,有沒有可能其中一個選:擇抵賴呢?按照人是理性的假設,沒有人會積極地這么做,因為如果對方坦白的話,自己就可能判刑lO年,理性的人是不會冒這種險的.囚徒困境反映了一個深刻的哲學問題:個人理性和集體理性的矛盾.個體為了自己的利益最大,而不愿意改變決策(改變決策的結果是不劃算,招了之后懲罰嚴重),導致整體利益最小.這樣的情景就是個體與環(huán)境博弈的結果,這種狀態(tài)就是博弈論中所講的獺什均衡,又叫做全局博弈均衡.納什均衡是局中人理智選擇的結果.在現(xiàn)代經(jīng)濟生活中,納什均衡的思想經(jīng)常被應用,如投資,消費和雇用關系分析,生產(chǎn),庫存和維修關系分析,標價,拍賣和談判策略制訂,自然資源和污染關系分析,委托與代理關系分析等都涉及到納什均衡的概念囚徒困境在生活中最常見的表現(xiàn)就是擠公共汽車.從集體理性的角度來看,按次序上車是最有效率的做法,但是你擠我不擠,我就可能上得慢,所以每個人的最優(yōu)戰(zhàn)略都是擠,納什均衡就是大家都擠,結果上車就更慢了,每個人采取的都是最優(yōu)的戰(zhàn)略,但是結果卻是最劣,原因在于個人理性和集體理性的沖突.囚徒困境在企業(yè)間最典型的例子就是竟相殺價,在某種產(chǎn)品市場容量一定的前提下,A,B企業(yè)本可以訂一個協(xié)議價格來維護共同的長期利潤,但A會為自己的近期利益而采取低價傾銷策略,也會效仿降價,不遵守事先達成的價格協(xié)定,結果使市場過早枯竭,A,都沒有出路了.但是如果A事先獲知的產(chǎn)量和價格這類競爭情報,就可以采取保護措施(如動用反傾銷法案,甚至可以威脅用更低的價格報復),這樣就能避免兩敗俱傷,形成新的協(xié)定.在囚徒困境中我們得到一個重要的結論:一種制度(體制)安排,要發(fā)生效力,必須是一種納什均衡,否則這種制度安排便不能成立.兩家企業(yè)A,B合作建設一條VCD的生產(chǎn)線,協(xié)議由A方提供生產(chǎn)VCD的技術,方則提供廠房和設備在對技術和設備進行資產(chǎn)評估時就形成非合作博弈,因為每一方都試圖最大化己方的評估值,這時方如果能夠獲得A方關于技術的真實估價或參考報價這類競爭情報,則可以使自己在評估中獲得優(yōu)勢;同理,A方也是一樣.至于自己的資產(chǎn)評估是否會影響合作企業(yè)的總體運行效率這樣的集體利益,則不會非常重視.這就是非合作博弈,參與人在選擇自己的行動時,優(yōu)先考慮的是如何維護自己的利益.合作博弈強調的是集體主義,團體理性(CollectiveRaflionality),是效率,公平,公正;而非合作博弈則強調個人理性,個人最優(yōu)決策,其結果是有時有效率,有時則不然.現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn),冰箱大戰(zhàn),空調大戰(zhàn),微波爐大戰(zhàn)這些大戰(zhàn)的受益者首先是消費者.廠家價格大戰(zhàn)的結局也是一個納什均衡,而且價格戰(zhàn)的結果是誰都沒錢賺.因為博弈雙方的利潤正好是零.競爭的結果是穩(wěn)定的,即是一個納什均衡.這個結果可能對消費者是有利的,但對廠商而言是災難性的.所以,價格戰(zhàn)對廠商而言意味著自殺.從這個案例中我們可以引伸出兩個問題,一是競爭削價的結果或納什均衡可能導致一個有效率的零利潤結局.二是如果不采取價格戰(zhàn),作為一種敵對博弈其結果會如何呢?每一個企業(yè),都會考慮是采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤.如果壟斷可以形成,則博弈雙方的共同利潤最大.這種情況就是壟斷經(jīng)營所做的,通常會抬高價格.另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤.從這一點,我們又引出一條基本準則:把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎上.事實上,完全競爭的均衡就是納什均衡或非合作博弈均衡.在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策.在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結果導致了零利潤,也就是說價格等于邊際成本.在完全競爭的情況下,非合作行為導致了社會所期望的經(jīng)濟效率狀態(tài).如果廠商采取合作行動并決定轉向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞.這就是為什么WTO和各國政府要加強反壟斷的意義所在.哈爾濱師范大學自然科學2006矩除了囚徒困境以外,博弈論學者還總結出許多博弈的模型.如智豬博弈(BoxedPigs)來解釋多勞者不多得;性別戰(zhàn)(BattleofSexes)來解釋互動博弈;斗雞博弈(ChickenGame)來解釋一方的妥協(xié)等等.博弈論在現(xiàn)實中的應用很多.首先,它是一種數(shù)學理論,可以用于經(jīng)濟學等領域;再者,它作為一種理論,并非產(chǎn)生直接具體的影響,而是理論指導學科,進而影響某些方面.博弈論對人類的貢獻是加強了國際間的交流合作機會和人類社會文明的發(fā)展.此外,博弈論的哲學思維方式推動了人類思維模式向前發(fā)展,這一點是博弈論對人類的最大貢獻.參考文獻張維迎.博弈論和信息經(jīng)濟學.上海:三聯(lián)書社,1996.趙景柱.葉天祥.對策論理論和應用.北京:科學出版社.1995.謝識予.經(jīng)濟博弈論.復旦大學出版社.2001.王貝柯.新編博弈論平話.中信出版社.2O03.ONTHEGAMETHEORYANDTHENASHEQUmmRIUMGuoPengYangXiaoqin(ChinaUniversityofMiningandTechnology)(JixiUniversi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省煙臺市招遠市2024-2025學年物理八上期末統(tǒng)考模擬試題含解析
- 廣東省深圳市南山區(qū)南山中學英文學校2025屆物理八上期末教學質量檢測試題含解析
- 西藏達孜縣2024年九上化學期末檢測試題含解析
- 天津市寧河縣蘆臺五中2024年九上化學期末監(jiān)測模擬試題含解析
- 山東省臨沂經(jīng)濟開發(fā)區(qū)四校聯(lián)考2025屆八上數(shù)學期末質量檢測試題含解析
- 餐飲連鎖股東合作協(xié)議及市場拓展與品牌推廣
- 金融投資入門:基礎知識與規(guī)范操作
- 游戲直播平臺運營策略分析
- 2025至2030全球及中國鎖匠軟件行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 幼兒園教師必 備彈唱技巧詳解
- 2025年廣東高考政治試卷真題答案詳解講評(課件)
- 卡口及道路交通智能監(jiān)控系統(tǒng)方案設計
- 2025年家庭照護師職業(yè)資格考試試題及答案
- 呼吸機相關性肺炎的預防和護理
- 2025年綏化市中考化學試題卷(含答案解析)
- 門診口腔院感基礎知識培訓
- 危重病人觀察和護理要點
- 砌體工程培訓課件
- 國家開放大學2024年春季學期期末統(tǒng)一考試《中文學科論文寫作》試題(試卷代號11332)
- AS9100D體系標準中文版
- 固井工藝技術培訓教學課件(77p)
評論
0/150
提交評論