決策理論與方法物流_第1頁(yè)
決策理論與方法物流_第2頁(yè)
決策理論與方法物流_第3頁(yè)
決策理論與方法物流_第4頁(yè)
決策理論與方法物流_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二節(jié)決策分析的分類(lèi)及其基本原則第二節(jié)決策分析的分類(lèi)及其基本原則第三節(jié)決策分析的步驟與追蹤決策第三節(jié)決策分析的步驟與追蹤決策第三節(jié)決策分析的步驟與追蹤決策第三節(jié)決策分析的步驟與追蹤決策第四節(jié)決策分析的定性與定量方法概述本章小結(jié)決策分析是人們?yōu)榱藢?shí)現(xiàn)某一特定目標(biāo),根據(jù)主客觀條件的可能性,提出各種可行方案,采用科學(xué)的方法對(duì)各方案進(jìn)行比較、分析和評(píng)價(jià),按照決策準(zhǔn)則,從中篩選出最滿意的方案,并加以實(shí)施的過(guò)程。它包括決策者、決策目標(biāo)、決策方案、自然狀態(tài)、決策結(jié)果和決策準(zhǔn)則等幾個(gè)基本要素。本章結(jié)合其要素對(duì)決策分析從不同角度進(jìn)行了較為詳細(xì)的分類(lèi)。決策分析是一個(gè)包括分析問(wèn)題、確定目標(biāo)、擬定方案、評(píng)價(jià)方案、實(shí)施

2、方案直至目標(biāo)實(shí)現(xiàn)的系統(tǒng)過(guò)程。在決策分析的過(guò)程中,我們應(yīng)遵循如下基本原則:信息準(zhǔn)全原則、效益原則、系統(tǒng)原則、科學(xué)原則、可行原則、選優(yōu)原則、行動(dòng)原則、反饋原則等。在方案實(shí)施的過(guò)程中,當(dāng)主客觀情況發(fā)生重大變化或原決策方案存在重大失誤時(shí),要進(jìn)行追蹤決策。要做好追蹤決策應(yīng)掌握其基本特征,如回溯分析、非零起點(diǎn)、雙重優(yōu)化、心理效應(yīng)等。在決策分析的過(guò)程中,我們應(yīng)采用定性分析與定量分析相結(jié)合的綜合決策方法。這種方法對(duì)能夠量化的指標(biāo)建立起精確的數(shù)學(xué)模型,而且同時(shí)考慮不能量化的因素,是一種切合實(shí)際的較優(yōu)的決策分析方法。第二節(jié)完全信息靜態(tài)博弈一、博弈的標(biāo)準(zhǔn)式表述定義7.1在一個(gè)n人博弈的標(biāo)準(zhǔn)式表述中,參與者的策略空間

3、分別為,收益函數(shù)分別為則表示此博弈。二、納什均衡定義7.2在博弈中,如果策略組合中任一博弈方i的策略都是對(duì)其余博弈方的策略組合的最佳對(duì)策,也即:對(duì)任意都成立,則稱(chēng)為G的一個(gè)“納什均衡”。納什均衡有強(qiáng)弱之分,以上是弱納什均衡,也是最常用的納什均衡概念,強(qiáng)納什均衡是指每個(gè)博弈方對(duì)于對(duì)手的策略有唯一的最佳反應(yīng),即為嚴(yán)格納什均衡,當(dāng)且僅當(dāng)對(duì)所有i,所有其他,均有:三、兩人有限零和博弈(一)兩人有限零和博弈模型兩人有限零和博弈是指只有兩個(gè)局中人,每個(gè)局中人都有有限個(gè)可選擇的策略,而且在任一局勢(shì)中兩個(gè)局中人得失之和總是等于零。第二節(jié)完全信息靜態(tài)博弈如果我們用和表示兩人有限零和博弈的兩個(gè)局中人,并設(shè)他們的策

4、略集分別為,。局中人的支付矩陣可記作:根據(jù)局中人的支付矩陣A,結(jié)合博弈的一般式表述,我們可將這種博弈記作。(二)最優(yōu)純策略與納什均衡定義7.3對(duì)于博弈,如果則稱(chēng)分別為局中人和的最優(yōu)純策略,稱(chēng)局勢(shì)()為博弈G的鞍點(diǎn),v稱(chēng)博弈的博弈值。不難驗(yàn)證鞍點(diǎn)()是博弈的納什均衡,鞍點(diǎn)又稱(chēng)純策略納什均衡。兩人有限零和博弈存在的鞍點(diǎn)的充要條件是支付矩陣中存在一個(gè)元素,使對(duì)于一切,總有:第二節(jié)完全信息靜態(tài)博弈(三)最優(yōu)混合策略與納什均衡局中人只能以一定的概率在其策略集中隨機(jī)選擇每個(gè)策略,這種在純策略空間上的概率分布為混合策略。設(shè)博弈,令分別為局中人和在各自的策略集和中選擇策略和的概率,則稱(chēng)分別為局中人和的一個(gè)混合

5、策略。稱(chēng)為局中人的期望獲得,為的期望獲得,而()為博弈的混合局勢(shì)。又記分別為局中人和的混合策略集合。定義7.4如果則稱(chēng)為局中人和的最優(yōu)混合策略,稱(chēng))為G的最優(yōu)混合局勢(shì),稱(chēng)為博弈方的期望所得。最優(yōu)混合局勢(shì)構(gòu)成了混合意義上的納什均衡,任何一方,單獨(dú)背離這個(gè)局勢(shì),則它的期望所得將不會(huì)優(yōu)于最優(yōu)混合局勢(shì)下的所得。第二節(jié)完全信息靜態(tài)博弈(四)最優(yōu)混合策略的求解方法博弈有混合意義下的解的充要條件是:存在滿足下列兩個(gè)不等式組:(1)(2)為了求解上述不等式組,可將它們變?yōu)榫€性規(guī)劃而求出博弈G的最優(yōu)混合策略。不妨設(shè)(否則令,則一定可大于零)。令,則不等式組(1)等價(jià)于下面的線形規(guī)劃:(3)同理,令,問(wèn)題(2)就

6、變?yōu)榫€形規(guī)劃(4):(4)第二節(jié)完全信息靜態(tài)博弈四、應(yīng)用舉例圖7-4市場(chǎng)進(jìn)入阻撓博弈例7-3市場(chǎng)進(jìn)入阻擾博弈。一種市場(chǎng)上存在一個(gè)壟斷企業(yè),另一個(gè)企業(yè)希望進(jìn)入這一市場(chǎng),壟斷者為了保持自己的地位需要對(duì)進(jìn)入者進(jìn)行阻撓。這種博弈中,進(jìn)入者有兩種策略可以選擇:“進(jìn)入”與“不進(jìn)入”;壟斷者也有兩種策略:“容忍”與“反擊”。他們的支付函數(shù)用以下雙變量矩陣表示(見(jiàn)圖7-4)。例7-4產(chǎn)量決策的古諾模型。古諾模型是博弈論中最經(jīng)典的例子。古諾首先提出了這一模型。由于他采用了分析企業(yè)各自的最優(yōu)反應(yīng)函數(shù)從而形成均衡的思路,與納什均衡非常相似,因此納什均衡也稱(chēng)古諾一納什均衡。它描述的是所謂廠商進(jìn)行數(shù)量競(jìng)爭(zhēng)的形勢(shì),以下是

7、最常見(jiàn)的一種較為簡(jiǎn)化的版本。生產(chǎn)同質(zhì)產(chǎn)品的兩個(gè)企業(yè)同時(shí)選擇各自的產(chǎn)量,市場(chǎng)需求決定價(jià)格。單位成本均為常數(shù)Go求解其中的納什均衡。例7-5公共地悲劇模型。假設(shè)有n個(gè)人共同擁有的一個(gè)公共牧場(chǎng),每個(gè)人要決定自己放牧羊的數(shù)目,總的羊數(shù)因此為。購(gòu)買(mǎi)和照看1只羊的成本為常數(shù)Go設(shè)每只羊的價(jià)值為,隨著羊的增加,草地會(huì)越來(lái)越擁擠,食物也會(huì)更緊張,因此會(huì)造成羊的價(jià)值下降,另一方面,羊的供給增加也會(huì)造成羊的價(jià)值下降,求此博弈中的納什均衡。第三節(jié)完全信息動(dòng)態(tài)博弈一、博弈的擴(kuò)展式表述在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者在自己行動(dòng)之前能觀測(cè)到先行動(dòng)者的行動(dòng)且對(duì)各博弈方的策略空間及支付有充分的了解,我們稱(chēng)這種

8、博弈為完全信息動(dòng)態(tài)博弈。動(dòng)態(tài)博弈有不同與靜態(tài)博弈的特征,習(xí)慣于用擴(kuò)展式來(lái)描述和分析動(dòng)態(tài)博弈。博弈的擴(kuò)展式表述包括以下要素:(1)參與人集合;(2)行動(dòng)次序,即參與人參與行動(dòng)的次序;(3)收益,即參與人所采取行動(dòng)的函數(shù);(4)行動(dòng),即輪到次序的參與人的選擇;(5)信息集,它表示參與人在每次行動(dòng)時(shí)所知道的信息;(6)每一個(gè)外生事件的概率分布。二、多階段可觀察行動(dòng)博弈與子博弈完美納什均衡多階段可觀察行動(dòng)博弈,這種博弈有著多個(gè)“階段”,通常記為k,行動(dòng)的歷史通常記為,從而(1)在每一個(gè)階段k,每一個(gè)參與人都知道所有行為情況,包括自然的行為以及過(guò)去各階段所有參與人的行為;(2)在任一給定階段中,每一個(gè)參

9、與人最多只能行動(dòng)一次;(3)階段k的信息集不會(huì)提供有關(guān)這一階段的任何信息。由于這種博弈存在多個(gè)階段,它與只有一個(gè)階段的完全信息博弈有著本質(zhì)的區(qū)別,因此如果我們?nèi)杂眉{什均衡思想分析這種博弈問(wèn)題就難免存在局限性。澤爾滕(Selten,1965)提出了子博弈完美納什均衡的思想。澤爾滕子博弈完美納什均衡是指在一個(gè)多階段可觀察的博弈中,由各博弈方的策略構(gòu)成的一個(gè)策略組合,這個(gè)策略組合滿足在整個(gè)動(dòng)態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡。第三節(jié)完全信息動(dòng)態(tài)博弈三、完美信息博弈與逆向歸納法在多階段可觀察行動(dòng)博弈中,如果我們對(duì)條件(2)稍加限制,即在任一給定階段中,每一個(gè)參與人最多只能行動(dòng)一次而且只有一個(gè)參與人

10、采取行動(dòng),就得到完美信息博弈。由于多階段可觀察行動(dòng)博弈中,引入了子博弈完美納什均衡的概念,借助這種概念的思想,多階段可觀察行動(dòng)博弈通常采用逆向歸納法?!澳嫦驓w納法”這一思路是通過(guò)逆向歸納的方法,先解決參與人在面臨任何可能情況下的最終行為策略,然后逐步向前推導(dǎo)計(jì)算前一步最優(yōu)選擇。逆向歸納法可以在任何完美信息下的多階段博弈中應(yīng)用,這一方法從最終階段k在每一歷史情況下最優(yōu)選擇開(kāi)始,即在給定歷史情況條件下,通過(guò)最大化參與人在面臨歷史情況條件的收益確定其最優(yōu)行動(dòng),從而向前推算到階段k-1,并確定這一階段中采取行動(dòng)的參與人的最優(yōu)行為,只要給定階段中采取行動(dòng)的參與人在歷史情況下將采取我們之前推導(dǎo)出來(lái)的最優(yōu)行

11、動(dòng)即可。用這一方法不斷地向前推算下去,直至初始階段,這樣我們就可以建立一個(gè)策略組合。第四節(jié)不完全信息靜態(tài)博弈一、概念如果在一個(gè)博弈中,某些參與人不知道其他參與人的收益,我們就說(shuō)這個(gè)博弈是不完全信息博弈。海薩尼(Harsanyi,19671968)首先給出了一種模擬和處理這一類(lèi)不完全信息博弈的方法,即引入一個(gè)虛擬參與人一一“自然”,“自然”首先選擇參與人1的類(lèi)型(這里是他的成本)。在這個(gè)轉(zhuǎn)換博弈中,參與人2關(guān)于參與人1成本的不完全信息就變成了關(guān)于“自然”的行動(dòng)的不完全信息,從而這個(gè)轉(zhuǎn)換博弈可以用標(biāo)準(zhǔn)的技術(shù)來(lái)分析。從不完全信息博弈到不完美信息博弈的轉(zhuǎn)換如圖7-3所示,這個(gè)圖是首先由海薩尼給出的。N

12、代表“自然”,“自然”選擇參與人1的類(lèi)型。這里有一個(gè)標(biāo)準(zhǔn)假設(shè),即所有參與人對(duì)自然行動(dòng)的概率分布具有一致的判斷。一旦采用這一假設(shè),我們就得到一個(gè)標(biāo)準(zhǔn)博弈,從而可以使用納什均衡的概念。海薩尼的貝葉斯均衡(或貝葉斯納什均衡)正是指不完美信息博弈的納什均衡。二、策略和類(lèi)型參與人的“類(lèi)型”一一他的私人信息一一就是他的成本。在通常情況下,一個(gè)參與人的類(lèi)型可能包括與其決策相關(guān)的任何私人信息參與人的收益函數(shù)就相當(dāng)于它的類(lèi)型。如果參與人的類(lèi)型過(guò)于復(fù)雜,模型就可能很難處理,在實(shí)際運(yùn)用中,通常假定參與人關(guān)于對(duì)手的判斷完全由他自己的收益函數(shù)決定。海薩尼考慮了更一般的情形。假定參與人的類(lèi)型取自某一客觀概率分布,這里屬于

13、某一空間。簡(jiǎn)單起見(jiàn),假定存在有限個(gè)元素。只能被參與人i觀察到。令代表給定是參與人i關(guān)于其他參與人類(lèi)型的條件概率。假定對(duì)于每一個(gè),邊際分布是嚴(yán)格正的。第四節(jié)不完全信息靜態(tài)博弈我們通常把博弈的外生因素如策略空間、收益函數(shù)、可能類(lèi)型、先驗(yàn)分布等視為共同知識(shí)。一般來(lái)說(shuō),這些策略空間都比較抽象,有些還包括如擴(kuò)展式博弈中的相機(jī)行動(dòng)策略。但在這里,為簡(jiǎn)單起見(jiàn),我們假定策略空間Si是參與人i的(非相機(jī))行動(dòng)集??梢杂么眍?lèi)型為的參與人i的策略選擇(可能是混合策略)。如果參與人i知道其他參與人的策略是其相應(yīng)類(lèi)型的函數(shù),參與人1就可以用條件概率來(lái)計(jì)算對(duì)應(yīng)于每一個(gè)選擇的期望效用從而找出最優(yōu)反應(yīng)策略。三、貝葉斯均衡定

14、義7.4在一個(gè)不完全信息博弈中,如果每一參與人i的類(lèi)型有限;且參與人類(lèi)型的先驗(yàn)分布為p,相應(yīng)純策略空間為,則該博弈的一個(gè)貝葉斯均衡是其“展開(kāi)博弈”的一個(gè)納什均衡,在這個(gè)“展開(kāi)博弈”中,每一個(gè)參與人i的純策略空間是由從到的映射構(gòu)成的集合。給定策略組合,和,令代表當(dāng)參與人i選而其他人選擇,且令代表策略組合在的值那么策略組合是一個(gè)(純策略)貝葉斯均衡,如果對(duì)于每一個(gè)參與人i均有第四節(jié)不完全信息靜態(tài)博弈四、貝葉斯均衡的舉例例7-8不完全信息下的古諾模型??紤]雙寡頭壟斷古諾模型(產(chǎn)量競(jìng)爭(zhēng))。假定企業(yè)的利潤(rùn),這里是線性需求函數(shù)的截距與企業(yè)i的不變單位成本之差,是企業(yè)i選擇的產(chǎn)量。企業(yè)1的類(lèi)型是共同知識(shí)(即

15、企業(yè)2完全知道關(guān)于企業(yè)1的信息,或者說(shuō)企業(yè)1只有一種可能類(lèi)型)。但企業(yè)2擁有關(guān)于其單位成本的私人信息。企業(yè)1認(rèn)為的概率是,的概率也是,而且企業(yè)1的判斷是共同知識(shí)。這樣,企業(yè)2有兩種可能類(lèi)型,我們分別將其成為“低成本型”()和“高成本型”()。兩個(gè)企業(yè)同時(shí)選擇產(chǎn)量。下面來(lái)看這個(gè)博弈的純策略均衡。即企業(yè)1的產(chǎn)量為,企業(yè)2在時(shí)產(chǎn)量為,在時(shí)的產(chǎn)量為。企業(yè)2的均衡產(chǎn)量必須滿足企業(yè)1不知道企業(yè)2是那種類(lèi)型,因此他的收益只能是對(duì)企業(yè)2的類(lèi)型取期望:將和代入中,我們得到貝葉斯均衡解為()(事實(shí)上,這也是惟一的均衡)。第五節(jié)不完全信息動(dòng)態(tài)博弈一、不完全信息動(dòng)態(tài)博弈問(wèn)題信號(hào)博弈的基本特征是博弈方分為信號(hào)發(fā)出方和信

16、號(hào)接受方兩類(lèi),先行為的信號(hào)發(fā)出方的行為對(duì)后行為的信號(hào)接受方來(lái)說(shuō)具有傳遞信息的作用。信號(hào)博弈其實(shí)是一類(lèi)具有信息傳遞機(jī)制的動(dòng)態(tài)貝葉斯博弈的總稱(chēng)。許多博弈或信息經(jīng)濟(jì)學(xué)問(wèn)題都可以歸結(jié)為信號(hào)博弈。一個(gè)信號(hào)博弈可表示為:1博弈方0以概率為信號(hào)發(fā)出方S選擇類(lèi)型;2發(fā)出方S選擇行為;3接收方R看到后選擇行為;4雙方得益和都取決于和。完美貝葉斯均衡的條件是:(1)接收方R在觀察到發(fā)出方的信號(hào)后,必須有關(guān)于發(fā)出方的類(lèi)型判斷,即發(fā)出方選擇行為時(shí),發(fā)出方S是類(lèi)型的后驗(yàn)概率:(2)對(duì)于發(fā)出方給出的信號(hào)和對(duì)發(fā)出方類(lèi)型判斷即后驗(yàn)概率,接收方R選擇的行動(dòng)必須是接收方收益最大,即(3)給定R的策略時(shí),S的選擇必須使S的得益最大

17、,即是最大化問(wèn)題的解。滿足上述要求的雙方策略和接收方判斷構(gòu)成信號(hào)博弈的完美貝葉斯均衡。第五節(jié)不完全信息動(dòng)態(tài)博弈二、類(lèi)型和海薩尼轉(zhuǎn)換靜態(tài)貝葉斯博弈中處理不完全信息的方法是將博弈方得益的不同可能理解為博弈方有不同的類(lèi)型,并引進(jìn)一個(gè)為博弈方選擇類(lèi)型的虛擬博弈方,從而把不完全信息博弈轉(zhuǎn)化成完全但不完美信息動(dòng)態(tài)博弈,這樣的處理方法稱(chēng)為海薩尼轉(zhuǎn)換。這種處理方法同樣適用于動(dòng)態(tài)貝葉斯博弈,二者的差別是動(dòng)態(tài)貝葉斯博弈轉(zhuǎn)化的不是兩階段有同時(shí)選擇的不完美信息動(dòng)態(tài)博弈,而是更一般的不完美信息動(dòng)態(tài)博弈。既然通過(guò)海薩尼轉(zhuǎn)換可以很容易地將動(dòng)態(tài)貝葉斯博弈轉(zhuǎn)化為完全但不完美信息動(dòng)態(tài)博奔,那么動(dòng)態(tài)貝葉斯博弈分析就可以主要利用貝葉

18、斯均衡、合并均衡和分開(kāi)均衡等概念和相應(yīng)的分析方法。三、完美貝葉斯均衡完美貝葉斯均衡要求:(1)在每個(gè)信息集上,局中人必須有一個(gè)定義在屬于該信息集的所有節(jié)點(diǎn)上的概率分布,這就是局中人的信念,信息集包含了局中人類(lèi)型的信息,這一信念也相當(dāng)于在該信息集上對(duì)其他局中人類(lèi)型的概率判斷;(2)給定該信息集上的信念和其他局中人的后續(xù)策略,局中人的后續(xù)策略必須是最優(yōu)的;(3)局中人根據(jù)貝葉斯法則和均衡策略修正后驗(yàn)信念。定義7.5完美貝葉斯均衡是一種策略組合與一種后驗(yàn)概率組合,滿足:對(duì)于所有的局中人i,在每個(gè)信息集h,;由先驗(yàn)概率、所觀測(cè)的和最優(yōu)策略通過(guò)貝葉斯法則形成。第五節(jié)不完全信息動(dòng)態(tài)博弈四、舉例(一)2X2聲明博弈2X2聲明博弈中聲明能有效傳遞信息的幾個(gè)必要條件:1不同類(lèi)型的聲明方必須偏好行為方的不同行為。2對(duì)應(yīng)聲明方的不同類(lèi)型,行為方必須偏好不同的行為。3行為方的偏好必須與聲明方的偏好具有一致性。(二)離散型聲明博弈模型(1)自然抽取聲明方的類(lèi)型,抽取的方法是從類(lèi)型集合中以概率分布隨機(jī)抽取,其中。(2)聲明方了解到自己的以后,從中選擇,作為自己聲明的類(lèi)型。當(dāng)然可以與相同說(shuō)真話,也可以與不同說(shuō)假話。(3)行為方在聽(tīng)到聲明力的聲明后,在可選擇的行為集合中選擇行為。(4)聲明方的得益為,行為方的得益為。第四節(jié)DEA方法2.生產(chǎn)可能集生產(chǎn)可

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論