博弈論之囚徒困境.doc

上傳人：x*** IP屬地：河南上傳時間：2020-01-28 格式：DOC 頁數(shù)：5 大?。?4KB 積分：20 舉報 版權(quán)申訴

免費預覽已結(jié)束，剩余1頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

博弈論之囚徒困境阿普頓是普林斯大學的高材生，畢業(yè)后被安排在愛迪生身邊工作，他對依靠自學而沒有文憑的愛迪生很不以為然。一次，愛迪生要阿普頓算出梨形玻璃泡的容積，阿普頓點點頭，心想：這么簡單的事一會幾就行了。只見他拿來梨形玻璃泡，用尺上下量了幾遍，再按照武樣在紙上畫好革田，列出了一道算式，算來算去，算得滿頭大汗仍沒算出來。一連換了幾十個公式，還是沒結(jié)果，阿普頓惠得滿臉通紅，狼狽不堪。愛迪生在實驗室等了很久，覺得奇怪，便走到阿普頓的工作問，看到幾張白紙上密密麻麻的算式便笑莢說：“您這樣計算太浪費時間了。”只見愛迪生將一杯水倒連玻璃泡內(nèi)，交給阿普頓說：“再找個量筒來就知道答案了?！卑⑵疹D茅塞頓開，終于對愛迪生敬服最后成為愛迪生事業(yè)上的好助手。有時候?？茖W并不一定意味著煩瑣的計算與剝量，而是一種有濃厚藝術氣息的思維方式。前者固然可以得出正確的結(jié)論，但是后者同樣可以用一種出入意表的方式曲徑通幽。這種方式，與我們在生活中運用博弈科學有異曲同工之妙。大量的教學模型嚇不倒我們，因為我們可以對它們置之不理。有一個腦筋息轉(zhuǎn)彎問題是這樣的：在什么情況下零大干二，二大干五，五又大干零答案是：在玩“石頭剪刀布”游戲的時候。博弈就是用這種游戲思維來突破看似無法改變的局面，解決現(xiàn)實的嚴肅問題的策略。在博弈中，每個參與者都在特定條件下爭取其最大利益，強差一者來必勝券在握，弱者也未必永無出頭之日。因為在博弈中，特別是多十參與者的博弈中，結(jié)果不僅取決干參與者的實力與策略，而且還取決于其他參與者的制約和策略。事實上，博弈過程本來就不過是一種日?，F(xiàn)象。我們在日常生活中經(jīng)常薷要先分析他人的意田從而做出合理的行為選擇，而所謂博弈就是行為者在一定環(huán)境條件和規(guī)則下，選擇一定的行為或策略加以實施并取得相應結(jié)果的過程。博弈論首先是我們思索現(xiàn)實世界的一套邏輯，其次才是把這套邏輯嚴密化的數(shù)學形式。博弈論的目的在于巧妙的策略，而不是解法。我們學習博弈論的目的不是為了享受博弈分析的過程，而在于贏得更好的結(jié)局。說到底，博弈論畢竟只是一個分析問題的工具，用這個工具來簡化問題，使問題的分析清晰明了也就夠了。博弈的思想既然來自現(xiàn)實生活，它就既可以高度抽象化地用教學工具來表述，也可以用日常事例來說明，并運用到生活中去。在斯大林時代的蘇聯(lián)，有一位樂隊指揮坐火車前往下一個演出地點。正當他在車看當晚就要指揮演奏的作品樂譜時。兩名克格勃(KGB，蘇聯(lián)國家安全警察。實際是政治特務將他作為間諜逮捕了。他們以為那樂譜是某種密碼，這位樂隊指揮爭辯說那只是柴可夫斯基的小提琴協(xié)奏曲，卻無濟于事。在樂隊指揮被投入牢房的第二天，審問者自鳴得意地走進來說：“我看你最好還是老實招了吧，我們已經(jīng)抓住你的朋友柴可夫斯基了他這會兒正向我們交代呢。你如果再不招就槍斃了你。如果交代了，只判你10年?！?笑過之后，每個人都會思考其中所蘊涵的東西。但是如果認為這個笑話僅僅諷刺了克格勃特務的無知與無恥，那是不夠的。事實上，克格勃們的花招，是想運用博弈論中囚徒困境理論，達到自己的目的。雖然他們未必知道博弈論，但是他們明顯企圖運用其中的布局，使樂隊指揮被迫選擇招供。 i950年，擔任斯坦福大學客座教授的數(shù)學家圖克(Tucker)，給一些心理學家解釋他正在研究的完全信息靜態(tài)博弈問題，為r更形象地說明博弈過程他用兩個犯罪嫌疑人的故事構(gòu)造了一個博弈模型即囚徒嗣境模型。這一模型的過程具體是這樣的：兩個共同偷竊的犯罪嫌疑人甲和乙被帶進警察局警方對兩名犯罪嫌疑人實行隔離關押隔離審訊，每個犯罪嫌疑人都無法觀察到司伴的選擇警方懷疑他們作案，但手中并沒有掌握確鑿證據(jù)，于是明確地分別告知兩名犯罪嫌疑人：對他們犯罪事實的認定及相應的量刑完全取決于他們自己的供認如果其中一方與警方合作，供認偷竊之事而對方抵賴供認打?qū)⒉皇軕土P，無罪釋放另一方則會被判重刑10年；如果雙方都與警方合作共同供認，各被判刑5年；而如果雙方均不認罪因為警察找不到其他證據(jù)則無罪釋放。每個犯罪嫌疑人都有兩種可供選擇的策略：供認或不供認而且，每個犯罪嫌疑人選擇的最優(yōu)策略不依賴于其同伙的策略選擇。如果甲選擇抵賴那么就可能會出現(xiàn)兩種情況：如果乙選擇供認那么甲將被加重懲罰判刑10年而乙則無罪釋放：如果乙也同樣選擇抵賴，那么他們兩個都將因證據(jù)不足而被釋放。很顯然這第二種結(jié)果對于兩個人都是最有利的但是因為警方?jīng)]有把兩名嫌疑人放在一間囚室里因而這種合作難以順利進行使得結(jié)果預測的不確定性加大或者說增加了抵賴合作的風險性因此基于人是理性的這一前提由于犯罪嫌疑人不知道對方的想法最理性的博弈策略就是選擇供認。在囚徒困境中“甲供認，乙供認”的占優(yōu)策略均衡中，不論所有其他參與人選擇什么繁略，一個參與人的優(yōu)勢策略都是他的最優(yōu)策略。不管甲乙兩人誰供認都將得到減輕懲罰的結(jié)果：如果甲供認了，乙抵賴，甲將免于懲罰如果乙也供認了，那么罪名各擔一半，從甲個人看來。也減輕了懲罰；甲乙互換位置，結(jié)果依然是一樣。顯然，這一策略一定是所有其他參與人選擇某一特定策略時該參與人的占優(yōu)策略。博弈模型是生活的濃縮和簡化，比如在囚徒困境模型里。兩個囚犯都十分清醒地意識到自己所處的環(huán)境，以及每一種策略可能得到的結(jié)果，因此其策略選擇是可以預知的。而在現(xiàn)實生活中，這種完全信息的理想模式是無法實現(xiàn)的，因為存在大量的干擾因素。但也正是這些干擾因紊的存在，我們就可以通過巧妙的布局設計，人為創(chuàng)造出一種囚徒困境的環(huán)境當囚徒困境中的各方在博弈之中處于不對等地位的時候，博弈的局勢很容易發(fā)生偏移，即從合作型的博弈走向非臺作型博弈。不過，這種偏移并非巋然發(fā)生，因為影響博弈走向的，不但是雙方的地位對

人人文庫> 全部分類> 應用文書 > 技術指導

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論之囚徒困境.doc

文檔簡介

溫馨提示

最新文檔

評論

博弈論之囚徒困境.doc

文檔簡介

溫馨提示

最新文檔

評論

相關文檔