




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《人工智能導(dǎo)論:模型與算法》習(xí)題參考答案
第一章緒論
1.B
2.D
3.B
4.D
5.C
6.B
7.略
8.略
9.略
10.參考答案:
強(qiáng)化學(xué)習(xí)有環(huán)境、智能體、狀態(tài)、獎(jiǎng)勵(lì)、決策等諸多要素,涉及序列決策
過(guò)程,智能體之前作出的決策會(huì)影響智能體當(dāng)前的狀態(tài),從而影響“未來(lái)”的決
策過(guò)程。而監(jiān)督學(xué)習(xí)中,對(duì)每一個(gè)樣本輸入做出的決策不會(huì)影響到“未來(lái)”的決
策。
監(jiān)督學(xué)習(xí)的每次決策后得到的反饋是“最終反饋”,它包含了最佳決策的信
息。而強(qiáng)化學(xué)習(xí)每次決策后得到的反饋只是當(dāng)前步的反饋。
11.略
第二章邏輯與推理
1.c
2.D
3.D
4.D
5.參考答案:
a)不是命題,因?yàn)闊o(wú)法判斷真假;
b)不是命題,因?yàn)椴皇顷愂鼍洌?/p>
c)是命題,其真值為真。
6.參考答案:
應(yīng)用歸結(jié)法:
(1)aV/?(已知);
(2)「0Vy(b進(jìn)行蘊(yùn)涵消除);
(3)aVy(由1和2);
(4)-i(aVy)(c使用DeMorgan定律)
(5)3和4矛盾,因此原命題集是不可滿足的。
7.參考答案:
>
a)-i(\fx')(<Basketball_player(<x)->HigherJ:han(x,l.Smy)a其中,
Bas/cetbaplayer(x)表示久是籃球運(yùn)動(dòng)員,Higher_than(x,1.8m)表示%的身高
超過(guò)1米80
b)(Vx)(/?ea/(x)More_than(Square(x'),0))o其中,Rea/(x)表示》是實(shí)數(shù),
Square(x)表示為的平方,More_than(Square(x'),0)表示》的平方大于等于0。
8.參考答案:
(1)-.(Vx)(F(x)tG(x))
⑵。%)「(F(%)-G(尤))
(3)RxAJFCOvGQ))
(4)(3X)(F(X)A-,G(%))
(5)F(a)A-1G(a)(存在量詞消去)
(6)F(a)(由5知)
(7)—iG((z)(由5知)
(8)(Vx)(F(x)-?G(x)V//(%))
(9)E(a)-G(a)V”(a)(全稱量詞消去)
(10)G(a)VH(a)(6和9的假言推理)
(11)H(a)(由7和10知)
(12)F(a)AH(a)(由6和11知)
(13)a%)(F(%)A“(%))(存在量詞引入)
9.參考答案:
在給定目標(biāo)謂詞Mother。,y)之后,可如下表來(lái)構(gòu)造背景知識(shí)樣例和訓(xùn)練樣
例。
Mother(James,Mike)
Sibling(Ann,Mike)
目標(biāo)謂詞-\Mother(James,David)
背景知識(shí)Coup/e(James,David)
訓(xùn)練樣例-iMother(David,Ann)
樣例集合Father(David,Ann)
集合-iMot/ier(David,Mike)
Fat/ier(David,Mike)
-iMot/ier(Ann,Mike)
按照表2.3.1中FOIL算法所列步驟依次將每個(gè)候選前提約束謂詞加入到推
理規(guī)則中,并計(jì)算所得新的推理規(guī)則對(duì)應(yīng)的FOIL增益值?;谟?jì)算所得FOIL
增益值來(lái)確定最佳前提約束謂詞。下表給出了添加前提約束謂詞后信息增益的
計(jì)算結(jié)果。
推理規(guī)則涵」盒的正例和反FOIL信息增益
推理規(guī)則
伊數(shù)值
前提約束謂
目標(biāo)謂詞正例反例信息增益值
詞
Mother(x,y)
空集m=1=4/
<—+
Father(xfy}ntj.=0mL=2NA
Father(x,z)二0ml=2NA
Fatherfy,%)房二0ml=0NA
Father(y,z)m^.=0ml=1NA
Father{z,x)西二0ml=1NA
Father{z,y)ntj.=1ml=30.32
Sibling(x,y)自二0mL=1NA
Sibling(x,z)=0mL=1NA
Mother(x,y)Sibling(y,x)西二0ml=0NA
<—Sibling(y,z)m^.=0ml=1NA
Sibling(z,x)西=0ml=0NA
Sibling(z,y)二1mL=20.74
Couple(x,y)m^.=0mL=1NA
Couple(x,z)m+=1tn_=11.32
CoupleQy,%)m+二0ml=0NA
Couple(yfz)西=0ml=0NA
Couple(z,%)nfj.=0mL=2NA
Couple(z,y)自二0mL=1NA
由于Coap/e(x,z)的FOIL增益值最大,因此選擇Coap/e(%,z)加入推理規(guī)
則,得到Coup/e(%,z)-Mot/ier(x,y)這一新的推理規(guī)則,并將訓(xùn)練樣例集合中
與該推理規(guī)則不符樣例去掉。此時(shí),背景知識(shí)樣例和訓(xùn)練樣本如下表:
Sibling(Ann,Mike)
目標(biāo)謂詞
背景知識(shí)Coup/e(James,David)Mother(James,Mike)
訓(xùn)練樣例
樣例集合Father(David,Ann)-\Mother(James,David)
集合
Fat/ier(David,Mike)
接著,再用相同方法繼續(xù)將其他謂詞逐一作為前提約束謂詞加入推理規(guī)則
進(jìn)行考察,用FOIL增益值來(lái)判斷選取最優(yōu)推理規(guī)則。
推理規(guī)則涵蓋的FOIL信息增
推理規(guī)則
正例和反例數(shù)益值
擬加入前提
現(xiàn)有規(guī)則正例反例信息增益值
約束謂詞
m+
Mother(x,y)<—Couple(x,z)m_=1/
=1
自
AFather{xy)ml=0NA
f=0
歷;
AFather{x,z)m_=0NA
=0
歷;
AFather(y,x)mL=0NA
=0
西
AFatherly,z)ml=0NA
=0
沅;
AFather(z,%)ml=0NA
=0
m+ml
AFather(z,y)1
=1=0
歷;
ASibling(x,y)ml=0NA
=0
Mother(x,y)歷;
ASibling(x,z)ml=0NA
<—Couple(x,z)=0
沅;
ASibling(y,%)ml=0NA
=0
歷;
ASibling(y,z)ml=0NA
=0
自
ASibling(z,%)ml=0NA
=0
吊+
ASibling(z,y)ml=0NA
=0
自
ACouple(x,y)m_=1NA
=0
自
ACouple^x,z)ml=10
=1
自
ACoupleQy,%)ml=0NA
=0
沅;
ACouple(yz)ml=0NA
f=0
西
ACouple{z,x)m_=0NA
=0
歷;
ACouple{z,y)ml=0NA
=0
當(dāng)Fatherdy)作為前提約束謂詞加入到推理規(guī)則后FO/L_Ga沅值最大,因
此將Father(z,y)加入,得到新的推理規(guī)則Father(z,y)ACouple(xfz)t
Mother(x,y)o當(dāng)%=James、y二Mike和2=口@丫1(1時(shí),該推理規(guī)則覆蓋訓(xùn)練樣本
集合的正例Mot/ier(James,Mike)>且不覆蓋任意反例,因此算法學(xué)習(xí)結(jié)束。
當(dāng)學(xué)習(xí)得到(V%)(Vy)(Vz)(尸ather(z,y)ACouple(x,z)-Mother(%,y))這
一推理規(guī)則后,由題意可知Father(David,Ann)和Coap加(James,David),因此可
推理得到新的知識(shí)Mother(James,Ann),即James和Ann的關(guān)系為Mother關(guān)
系O
10.參考答案:
(1)目標(biāo)關(guān)系:Mother
(2)對(duì)于目標(biāo)關(guān)系Mother,生成四組訓(xùn)練樣例,一個(gè)為正例、三個(gè)為負(fù)例:
正例:(James,Mike)
負(fù)例:(James,David),(David,Ann),(David,Mike)
(3)從知識(shí)圖譜采樣得到路徑,每一路徑鏈接上述每個(gè)訓(xùn)練樣例中兩個(gè)實(shí)體:
(James,Mike)對(duì)應(yīng)路徑:Couple—Father
(James,David)對(duì)應(yīng)路徑:Mother->Father1(Father-'與尸ather為相反關(guān)
系)
(David,Ann)對(duì)應(yīng)路徑:FathertSibling
(David,Mike)對(duì)應(yīng)路徑:CoupletMother
(4)對(duì)于每一個(gè)正例/負(fù)例,判斷上述四條路徑可否鏈接其包含的兩個(gè)實(shí)體,將
可鏈接(記為1)和不可鏈接(記為0)作為特征,于是每一個(gè)正例/負(fù)例得到
一個(gè)四維特征向量:
(James,Mike):{[1,0,0,0],1}
(James,David):{[0,1,0,0],—1)
(David,Ann):{[0,0,1,0],—1}
(David,Mike):{[0,0,1,1],-1}
(5)依據(jù)(4)中的訓(xùn)練樣本,訓(xùn)練分類器M。
(6)預(yù)測(cè)。對(duì)于樣例(James,Ann),得到其特征值為[1,0,0,0],將特征向量輸入
到分類器M中,分類器M給出分類結(jié)果為1,Mot%r(David,Ann)成立。
11.參考答案:
下面我們用本章節(jié)式2.4.4(調(diào)整公式)來(lái)求解是否存在“女性歧視”問(wèn)題。
用X=1表示男性,X=0表示女性;丫=1表示錄??;Z=0,1,2,3分別表示英
語(yǔ)、俄語(yǔ)、西班牙語(yǔ)和意大利語(yǔ),則有:
p(y=i\do(x=i))
=P(Y=1\X=1,Z=0)P(Z=0)+P(Y=l\x=1,Z=1)P(Z=1)
+P(Y=1\X=1,Z=2)P(Z=2)+P(Y=1\X=1,Z=3)P(Z=3)
帶入表1中數(shù)據(jù),可得男性被錄取的因果效應(yīng)為:
P(Y=l|do(X=1))
(825+108)(560+25)
=0.62X———r4-0.63X
(2175+849)(2175+849)
(417+375)
+0.33!X白---------白+0.06
(2175+849)
(373+341)
X之--——=0.41376
(21754-849)
類似地,可以求得女性被錄取的因果效應(yīng)為:
p(y=i\do(x=o))
(825+108)(560+25)
=0.82x^――—―<-+0.68X
(2175+849)(2175+849)
(417+375)(373+341)
+0.35x------------+0.07x-----------
(2175+849)(2175+849)
=0.49274
最后,我們發(fā)現(xiàn)女性錄取率(0.49274)比男性錄取率(0.41376)要高,即
不存在所謂的“女性歧視”。
12.參考答案:
使用乘積分解規(guī)則:
P(X1,X2,X3,X4,X5,X6,Xi,Xj)
=P(X1)XP(X2|X4,X5)xP(X3|Xi)xP(X4|X1,X3,X5)xP(X5)
xP(X6|X3)xP(X7\X4,X6,X8)xP(X8|X5)
外生變量:Xi,x5;內(nèi)生變量:x2,x3,x4,x6,x7,x8
13*.參考答案:
為了阻塞節(jié)點(diǎn)X6和節(jié)點(diǎn)Xg,我們需要讓從節(jié)點(diǎn)X6到節(jié)點(diǎn)Xg的所有路徑滿足
D-分離性質(zhì)。從節(jié)點(diǎn)X6到節(jié)點(diǎn)X8共有以下7條路徑:
PlX6^X7<-X8(基于定義2.18(2),節(jié)點(diǎn)*7不能在限定集Z中)
P2X6<rX3^X4^X7^X8(基于定義2.18,節(jié)點(diǎn)X3或或X7需要出現(xiàn)在限定
集Z中)
P3X6(X39X46X5fX8(基于定義2.18,節(jié)點(diǎn)X3或Xs出現(xiàn)在Z中,或者節(jié)點(diǎn)
X4不出現(xiàn)在Z中)
P4X6(X39X4fX26X59X8(基于定義2.18,節(jié)點(diǎn)X3或X4或Xs出現(xiàn)在Z中,
或者節(jié)點(diǎn)X2不出現(xiàn)在Z中)
P5X6<-X3<rXx^>X4-^X7-^X8(基于定義2.18,節(jié)點(diǎn)X3或X1或或X7出現(xiàn)在Z
中即可)
P6X6<-X3-^X44-X5-^X8(基于定義2.18,節(jié)點(diǎn)X3或Xi或X5出現(xiàn)在Z中,
或者節(jié)點(diǎn)X4不出現(xiàn)在Z中)
P7X6<-X3^^4-^X2<-Xs-^x8(基于定義2.18,節(jié)點(diǎn)X3或X1或X4或Xs出現(xiàn)
在Z中,或者節(jié)點(diǎn)X2不出現(xiàn)在Z中)
P8:X6^X7<rX4<rX5^X8
P9:X69X76X4^X26X59X8
綜上,能讓從節(jié)點(diǎn)X6到節(jié)點(diǎn)X8的所有路徑滿足D-分離性質(zhì)的限定集為:
所有包含節(jié)點(diǎn)X3或{X4,X5}且不包含節(jié)點(diǎn)X7的限定集,例如{X3},{X3,X4}
等。
第三章搜索與求解
1.B
A如果圖不連通,則可能不存在路徑。如果圖中存在負(fù)值回路(當(dāng)然還有其他
情況),則可能不存在最短路徑。
B顯然不是最優(yōu)的。
C在這種情況下,節(jié)點(diǎn)所在層數(shù)和其路徑長(zhǎng)度是成正比的,因此優(yōu)先擴(kuò)展淺層
節(jié)點(diǎn)等價(jià)于優(yōu)先擴(kuò)展路徑代價(jià)小的節(jié)點(diǎn),這在圖搜索中是最優(yōu)的(可參見
Dijkstra算法)。
D因?yàn)閳D搜索是在樹搜索的基礎(chǔ)上進(jìn)一步剪枝,因此擴(kuò)展的節(jié)點(diǎn)數(shù)量通常更
少。
2.D
A只有可容的啟發(fā)函數(shù)才不會(huì)過(guò)高估計(jì)從當(dāng)前節(jié)點(diǎn)到目標(biāo)結(jié)點(diǎn)之間的實(shí)際代
價(jià)。
B如果存在負(fù)值邊,則很容易構(gòu)造反例。
C啟發(fā)函數(shù)通常是對(duì)當(dāng)前節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)距離的估計(jì),評(píng)價(jià)函數(shù)不一定有實(shí)際
意義。
D根據(jù)對(duì)A*算法的分析,不難證明。
3.A
A只需要重新定義黑方的動(dòng)作為每次落兩子即可。
B導(dǎo)致問(wèn)題中信息不完全,因此Minimax算法無(wú)法求解。
C導(dǎo)致問(wèn)題不再是兩人對(duì)抗問(wèn)題,每個(gè)人的目標(biāo)不能再簡(jiǎn)單地用最大化/最小化
某一個(gè)人的分?jǐn)?shù)來(lái)衡量。
D使該問(wèn)題不是零和博弈。白方最大化自己的分?jǐn)?shù)不一定必須最小化黑方的分
數(shù)。
4.D
A、B、C顯然正確。
D中置信上界的含義是樣本取值以極大的概率不會(huì)超過(guò)置信上界,并不是說(shuō)不
可能超過(guò)。
5.B
A選擇過(guò)程中UCB1算法即體現(xiàn)了探索與利用的平衡。
B只栗有一個(gè)子節(jié)點(diǎn)未被擴(kuò)展,算法就會(huì)進(jìn)入擴(kuò)展步驟。
C模擬步驟的策略不一定要和選擇步驟相同,模擬步驟通常會(huì)采取更簡(jiǎn)單的策
略。
D對(duì)。更新當(dāng)前路徑上的節(jié)點(diǎn),且不在搜索樹中的當(dāng)然不用更新。
6.參考答案:
下圖中粗線表示路徑,節(jié)點(diǎn)旁的數(shù)字表示擴(kuò)展順序。
(1)
A)1
⑵
7.參考答案:
下圖中紅線表示路徑,節(jié)點(diǎn)旁的數(shù)字表示擴(kuò)展順序。
(1)
8.參考答案:
(1)不矛盾。貪婪最佳優(yōu)先搜索并不具有最優(yōu)性,本題中的例子只是它能找到
最優(yōu)解的一個(gè)特例。"A*搜索是在已知信息下同類搜索策略中最優(yōu)的“,其
含義是:額外信息僅包括當(dāng)前的啟發(fā)函數(shù)時(shí),所有能夠保證最優(yōu)性(即在
任意有最短路徑的問(wèn)題中都能找到最短路徑)的算法中,A*算法擴(kuò)展的節(jié)
點(diǎn)數(shù)量是最少的。
(2)啟發(fā)函數(shù)在滿足可容性或一致性的基礎(chǔ)上,其值越接近當(dāng)前節(jié)點(diǎn)到終止節(jié)
點(diǎn)的最小代價(jià),搜索的效率越高。當(dāng)啟發(fā)函數(shù)值等于當(dāng)前節(jié)點(diǎn)到終止節(jié)點(diǎn)
的最小代價(jià)時(shí),算法每一步都會(huì)朝著最優(yōu)的方向探索,以0(m)的復(fù)雜度
得到最優(yōu)解。
9.參考答案:
擴(kuò)展情況如下。顯然擴(kuò)展順序會(huì)影響最終擴(kuò)展的節(jié)點(diǎn)數(shù)量(算法時(shí)間效
率)。
(1)擴(kuò)展節(jié)點(diǎn)數(shù)量為20。
10.參考答案:
(1)第一步三個(gè)節(jié)點(diǎn)的UCB值從左到右分別為2+—=2.97,—+—
1V14V4
6.24,5+J等=4.89,因此第一步選擇第二層中間的節(jié)點(diǎn)。第二步三個(gè)
7
節(jié)點(diǎn)的UCB值從左到右分別為恒亙=7.67,-+回亙-+
1
1yl1yl3..67,
誓=8,67,因此第二步選擇獎(jiǎng)勵(lì)為7的節(jié)點(diǎn)。如下圖所示。
獎(jiǎng)勵(lì)
(2)由于此時(shí)已經(jīng)到達(dá)葉子節(jié)點(diǎn),因此不需要進(jìn)行擴(kuò)展和模擬過(guò)程,反向傳播
后結(jié)果如下圖所示
獎(jiǎng)勵(lì)
(3)算法在很長(zhǎng)一段時(shí)間內(nèi)都會(huì)選擇獎(jiǎng)勵(lì)為7的節(jié)點(diǎn),而不會(huì)探索獎(jiǎng)勵(lì)為9的
節(jié)點(diǎn)。當(dāng)實(shí)驗(yàn)次數(shù)足夠多時(shí),第二層左側(cè)的節(jié)點(diǎn)的UCB值最終會(huì)超過(guò)第
二層中間節(jié)點(diǎn)的UCB值,因此只要實(shí)驗(yàn)次數(shù)足夠多,算法是有可能探索
到獎(jiǎng)勵(lì)為9的節(jié)點(diǎn)的。如果希望提高算法的效率,可考慮加大探索的力度,
即取一個(gè)更大的超參數(shù)C。不難驗(yàn)證,在原題中的狀態(tài)下,取C=10即可
令算法選擇第二層左側(cè)的節(jié)點(diǎn)。
11.參考答案:
假設(shè)S]T…TSj的代價(jià)為G,Sj->…TSk的代價(jià)為,由于S1->S2T…T
Sk是一條最短路徑,因此從S1到Sk的最小代價(jià)C*=Q+C2o已知路徑P是從Si到
國(guó)的最短路徑,因此P的代價(jià)CjWG,所以C*=Cl++。2,即路徑PT
Sj+1->???->Sk的代價(jià)小于等于從Si到外最短路徑的代價(jià),因此P->si+1—
Sk必然也為一條最短路徑。
12.參考答案:
(1)因?yàn)橛涗浽摲謹(jǐn)?shù)是為了讓當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)選擇一個(gè)置信上界最大的孩
子節(jié)點(diǎn),由于要最大化父節(jié)點(diǎn)玩家的收益相當(dāng)于最小化當(dāng)前玩家的收益,
因此此處需要減去當(dāng)前玩家的而收益。如果要修改為加上終局得分,該得
分應(yīng)該從當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)或子節(jié)點(diǎn)玩家的角度來(lái)計(jì)算。
(2)關(guān)鍵在于修改BackPropagate函數(shù)的第三行,由于不存在兩個(gè)玩家對(duì)抗,
此處只要加上終局獎(jiǎng)勵(lì)得分(或代價(jià)的相反數(shù))即可。
13*.參考答案:
當(dāng)搜索樹的高度(最長(zhǎng)路徑長(zhǎng)度)為小且是一棵滿b叉樹時(shí),假設(shè)alpha-beta
剪枝擴(kuò)展的最少節(jié)點(diǎn)數(shù)量為f(m)。如本章正文中圖3.3.11所示,觀察其第二層
的節(jié)點(diǎn),不難發(fā)現(xiàn):因?yàn)榈诙幼钭髠?cè)節(jié)點(diǎn)繼承了根節(jié)點(diǎn)(-8,+8)的范圍,因
此對(duì)該節(jié)點(diǎn)所在的子樹進(jìn)行搜索等價(jià)于樹的高度為6-1的原問(wèn)題,因此擴(kuò)展節(jié)
點(diǎn)數(shù)量最少為考慮第二層的其余b-l個(gè)節(jié)點(diǎn)所在的子樹,最優(yōu)情況
下這些高度為m-1的子樹的每個(gè)第一層節(jié)點(diǎn)擴(kuò)展1個(gè)子節(jié)點(diǎn),每個(gè)第二層節(jié)點(diǎn)
擴(kuò)展b個(gè)子節(jié)點(diǎn),每個(gè)第三層節(jié)點(diǎn)擴(kuò)展1個(gè)子節(jié)點(diǎn),每個(gè)第四層節(jié)點(diǎn)擴(kuò)展b個(gè)子
節(jié)點(diǎn),如此循環(huán)。因此每棵子樹擴(kuò)展節(jié)點(diǎn)數(shù)為
im-2|i?n-l|
l+l+b+b+…+從2I+21
d)
用+】
<2b
2
=4b1叫
由此可得遞推關(guān)系
1)+4(b-l)bl21+1
/(m)<f(jn-
2)+4(/?-l)b121+1
f(jn-1)<f(m-
不等式左右兩邊同時(shí)求和,可得
-1)(調(diào)+調(diào)+…+4*)
/(m)</(0)+m+4(b
)(1+6+…+b用)
<1+m+8(b—1
bl*+i_1
=1+m+8(b—1)b-1
im+l|
=8-2J+m—7
|7n+l|
=0(b'21+m)
在b和m足夠大時(shí),顯然4笑斗>TH,因此算法在最優(yōu)情況下的時(shí)間復(fù)雜度為
|tn+l|
O(bE)。
14*.參考答案:
(1)令啟發(fā)函數(shù)九何)=0,則圖搜索的A*算法退化為Dijkstra算法。對(duì)于任意一
個(gè)節(jié)點(diǎn)凡假設(shè)通過(guò)動(dòng)作a能得到后繼節(jié)點(diǎn)以,當(dāng)圖中沒(méi)有負(fù)值邊,即單步代價(jià)
c(n,a,nz)20時(shí),有九(n‘)+c(n,a,n')=c(n,a,n')>0=h(n),可知恒為0的啟
發(fā)函數(shù)滿足一致性。因此此時(shí)的圖搜索A*算法——Dijkstra算法——是最優(yōu)的。
(2)跟據(jù)原狀態(tài)轉(zhuǎn)移圖G,構(gòu)造一個(gè)新的狀態(tài)轉(zhuǎn)移圖G',其中狀態(tài)和狀態(tài)轉(zhuǎn)移關(guān)
系不變,只對(duì)狀態(tài)轉(zhuǎn)移代價(jià)進(jìn)行調(diào)整。新的單步代價(jià)定義為c'(n,a,n'):=
c(n,a,n')+h(nr)-h(n),若啟發(fā)函數(shù)滿足一致性,則顯然c'5,a,7i')>0。根據(jù)
(1)中結(jié)論,可知在Dijkstra算法在G'能夠找到最優(yōu)解。
首先證明,給定起始和終止?fàn)顟B(tài)Si和Sk,則在圖G'中找到的任意一條最短路
徑,必然也是G中的最短路徑??紤]G'中的最短路徑叫,電,…,(按照本章中
的定義,嚴(yán)格來(lái)說(shuō)這不是一條路徑,但通過(guò)這些節(jié)點(diǎn)的狀態(tài)能找到一條路徑。
以下為了方便說(shuō)明,將節(jié)點(diǎn)序列也稱為路徑。),其代價(jià)為
以電卬電)+c'(n2,a2,n3)+-+c'(_nk_1,ak_1,nk')
=[c(n1,a1,n2)+h(n2)--%)]+…
+[cg-i,aL)+h(nk)-八(心_。]
=c(%,%,電)+c(n2,a2^3)+…+。(心-1,%-1,幾卜)+h(n。-"陽(yáng))
當(dāng)初始狀態(tài)和終止?fàn)顟B(tài)給定時(shí),/1(以)一/1(九1)與路徑本身無(wú)關(guān),因此可以
認(rèn)為路徑在G'中的代價(jià)是它在G中代價(jià)加上一個(gè)與路徑無(wú)關(guān)的常數(shù),因此G'中
的最短路徑必然也是G中的最短路徑。
接著證明,給定起始和終止?fàn)顟B(tài)Si和Sk,對(duì)于任意一個(gè)在G上搜索的A*算
法流程,必然存在一個(gè)在G'上的Dijkstra算法流程與其擁有相同的節(jié)點(diǎn)擴(kuò)展順
序(稱在不同算法中對(duì)應(yīng)路徑相同的節(jié)點(diǎn)為同一個(gè)節(jié)點(diǎn)),因此這兩個(gè)算法會(huì)
找到同一條從Si到Sk的路徑。不妨稱G上的A*算法為算法41,G'上的Dijkstra
算法為算法42。對(duì)于/I搜索樹中的任意節(jié)點(diǎn)小可找到A2搜索樹中對(duì)應(yīng)相同路
徑的節(jié)點(diǎn)n',根據(jù)上一段中的論證過(guò)程,可知g(n')=g(/i)+八(九)—h(7ii),其
中?11為根節(jié)點(diǎn)。那么算法41(A*算法)中評(píng)價(jià)函數(shù)為f(九)=g(九)+42
算法(Dijkstra算法)中評(píng)價(jià)函數(shù)f(以)=g("),因此可得等式f(n)=f(川)+
h(n^a即,當(dāng)根節(jié)點(diǎn)確定時(shí),算法41和算法A2中對(duì)應(yīng)同一路徑的節(jié)點(diǎn)其評(píng)價(jià)
函數(shù)值只相差一個(gè)常數(shù)。根據(jù)這個(gè)性質(zhì),不難用數(shù)學(xué)歸納法證明,對(duì)于任意一
個(gè)算法A1可能導(dǎo)致的節(jié)點(diǎn)擴(kuò)展順序(此處強(qiáng)調(diào)任意是因?yàn)樵u(píng)價(jià)函數(shù)相同的節(jié)點(diǎn)
擴(kuò)展順序可能不確定),都存在一個(gè)42算法的擴(kuò)展順序與之相同。由于篇幅限
制,此處省略具體的數(shù)學(xué)歸納法證明。
綜上所述,給定起始和終止?fàn)顟B(tài)si和Sk,若A*算法找到了一條路徑P,則
該路徑必然也能在圖G'上被Dijkstra算法找到。根據(jù)問(wèn)題(1)中的結(jié)論,路徑P是
圖G'上從Si到%的最短路徑。又根據(jù)上述證明,路徑P也是圖G上從狀態(tài)Si和外
的最短路徑,至此A*算法的最優(yōu)性得證。
第四章監(jiān)督學(xué)習(xí)
1.A
2.B
3.F
4.C
5.A
6.A
7.參考答案(A圖是正確的):
1.對(duì)于每個(gè)數(shù)據(jù)集,隨著模型復(fù)雜度增大,模型在訓(xùn)練集上的錯(cuò)誤率會(huì)不
斷下降,而在測(cè)試集上的錯(cuò)誤率會(huì)先下降后上升。
2.隨著模型復(fù)雜度增大,在更大的數(shù)據(jù)集A上模型更難擬合,因此也就不
容易過(guò)擬合,但具有更好的泛化性。所以合理的猜測(cè)是,曲線(A,
Train)會(huì)在(B,Train)的上方,曲線(A,Test)會(huì)在(B,Test)的下
方,而曲線(A,Test)達(dá)到過(guò)擬合的轉(zhuǎn)折點(diǎn)會(huì)比而曲線(B,Test)更靠
后一些。
8.略
10.參考答案:
(1)該標(biāo)準(zhǔn)化項(xiàng)與參數(shù)w無(wú)關(guān),該項(xiàng)對(duì)w的導(dǎo)數(shù)永遠(yuǎn)為0,對(duì)w的優(yōu)化求解沒(méi)有
作用。
(2)L2標(biāo)準(zhǔn)化項(xiàng)通過(guò)懲罰過(guò)大的參數(shù)w來(lái)避免過(guò)擬合,之小于0意味著該損失
函數(shù)傾向于更大的w,從而激勵(lì)過(guò)擬合,失去了標(biāo)準(zhǔn)化的作用。
11.參考答案:
(1)心情指數(shù)大于1出去玩,等于1不出去玩。
(2)
迭代前:
1/101/101/101/101/101/101/101/101/101/10
迭代后:
1/161/164/161/161/161/161/161/161/164/16
(3)有同伴就出去玩,沒(méi)同伴不出去玩
1
-In3
2
(4)三次迭代的分類器分別為:
Q:心情指數(shù)大于1出去玩,等于1不出去玩
C2:有同伴出去玩,沒(méi)同伴不出去玩
C3:天氣好出去玩,天氣不好不出去玩
強(qiáng)分類器可表示為:
111
sig九份In(4)G+-In(3)C2+-ln
12*.參考答案:
P-ly=l)P(y=1)
0gp(%|y=0)P(y=0)
p(y=1)11
oclog-----—+-(x-〃i)TzT(x-41)-5-〃0)上-1(%-Mo)
p(y=U),L
P(%|y=l)P(y=1)
°gp(%|y=0)P(y=0)
p(y=1)11
0clog-7(〃I)T£T(%)+5OOAETQO)
p.riy”—_umj乙L
+婷工-1(〃1一〃o)
=b+wTx
T1
其中b=log-101)Z-(Mi)+2(〃0尸工-1(〃0)是一個(gè)常量,w=
£一1(生-的)是一個(gè)線性參數(shù)向量。證畢。
第五章無(wú)監(jiān)督學(xué)習(xí)
1.D
2.C
3.D
4.D
5.C
6.略
7.參考答案:
在每一次聚類過(guò)程中,每個(gè)數(shù)據(jù)點(diǎn)都被分配到與其距離最近聚類中心所在集
合,即argmin|E—q|『,因此在聚類步驟中£3巳的一.|產(chǎn)中的每一項(xiàng)都
Cjec
保持不變或減小,僅當(dāng)算法收斂時(shí)才會(huì)每一項(xiàng)都保持不變。因此,只要算法沒(méi)有
收斂,在每一次聚類后目標(biāo)函數(shù)都會(huì)減小。
設(shè)一組數(shù)據(jù)點(diǎn)的聚類中心為Z,則對(duì)于該組數(shù)據(jù){%?,££1(%—z)2=
?3((x—元)2+2(%—x)(x—z)+(%—z)2)=£皂(%—x)2+2(x—
Z)2£1(久一元)+?3(%-Z)2=2X1(%-X)2+?3(%-Z)2,當(dāng)Z=土?xí)r取最小
值。因此在更新聚類中心的步驟中,對(duì)每組數(shù)據(jù)取均值為新的中心將最小化每
一個(gè)2獲611%-01|2。同樣,只要算法沒(méi)有收斂,在每一次更新聚類中心后目
標(biāo)函數(shù)都會(huì)減小。
綜上,在算法收斂前目標(biāo)函數(shù)都將嚴(yán)格遞減。因此,k-means算法不可能兩
次訪問(wèn)完全相同的聚類情況。而將有限數(shù)量的數(shù)據(jù)點(diǎn)分為k類的總可能是有限
的,能保證不循環(huán)的k-means算法一定能夠收斂。
8.參考答案:
初始化兩枚硬幣的概率為0.30和0.70
迭代硬幣A硬幣A硬幣B硬幣B硬幣A投硬幣B投
次數(shù)為正面次為反面次為正面為反面擲正面概率擲正面概率
數(shù)數(shù)次數(shù)次數(shù)0A%
16.8218.1917.187.810.270.69
21.8921.1222.114.870.080.82
31.5215.1622.4810.830.090.67
41.0910.3622.9115.640.090.59
51.019.7922.9916.210.090.59
9.參考答案:
k-means算法可以被看做EM算法的一種特殊實(shí)現(xiàn),其隱變量即為各聚類中
心。在E步驟中,通過(guò)歐氏距離來(lái)估計(jì)各數(shù)據(jù)點(diǎn)最有可能歸屬于哪個(gè)聚類中心;
在M步驟中,通過(guò)計(jì)算均值更新聚類中心位置來(lái)最大化這些數(shù)據(jù)點(diǎn)屬于該聚類
中心的可能性。
10.參考答案:
a)樣本均值是對(duì)總體均值無(wú)偏估計(jì)的證明過(guò)程
證明:
r1石+冷+--HX
E[x]=E———-------------n
''Ln
1
=-£"[^1+%2+---1"
1
=一(£1[%/+E[X]+…+E[x])
n2n
1
二一(〃+4H-----Ffl)
n
n/j.
n
=〃
可見,樣本均值是對(duì)總體均值的無(wú)偏估計(jì)。
b)E臣仁心-/丹=/小
證明:
n1rn
E[W(土一修)2=E12((無(wú)一“)一3一"))2
-i=l--i=l-
-n[
=E-Y((x-M)2-2(x-〃)(/-〃)+(%i-4)2)
i=l」
-nn
=E------------2/左一〃)+^2(項(xiàng)-〃)2
.i=li=l
二E(元一〃)2一2(無(wú)一4)2+1、(勺一〃)2
71乙」
i=l
-n
=E-V(%i-M)2-F[(x-/z)2]
nZ-j
i=l
n—19
=--------G乙
n
在上面的證明過(guò)程中,利用了如下的結(jié)果:
由于E(X2)=[E(X)]2+Var(X)、Var(a+X)=Par(X)、Var^aX)=
c^Var{X}
因此
E[(x—ft)2]=[E(x—ft)]2+Var(x—/z)=Var(x)
(X、+x+—Fx\na2a2
=Var----2--------n--=一—二—
\n/nzn
從E[;2X13—陽(yáng))2]=、1/可知,;2仁1(三一項(xiàng))2是對(duì)總體方差的一個(gè)低
估,因此在用樣本方差來(lái)代替總體方差時(shí),需要將樣本方差定義為
±2憶1(/一4)2,這才能從樣本方差出發(fā),得到總體方差。2,這是一個(gè)無(wú)
偏估計(jì)。
答案:
nn
n12(元-陽(yáng))2nX71-1^2=o-2
K=E
n—1n—1n
i=li=l
第六章深度學(xué)習(xí)
1.D
2.i和iii
3.D
4.D
5.C
6.C
7.A
8.參考答案:
數(shù)據(jù):深度學(xué)習(xí)適合處理大數(shù)據(jù),機(jī)器學(xué)習(xí)算法更適用于小數(shù)據(jù);
硬件:深度學(xué)習(xí)由于巨大的計(jì)算量,需要大量計(jì)算資源,比如GPU,機(jī)器
學(xué)習(xí)算法對(duì)計(jì)算資源的需求相對(duì)較低;
特征構(gòu)建:深度學(xué)習(xí)試圖從數(shù)據(jù)中學(xué)習(xí)特征,機(jī)器學(xué)習(xí)中許多特征都需要由
行業(yè)專家確定,并手工構(gòu)造;
解決問(wèn)題方式:深度學(xué)習(xí)通常利用“端到端'’的方式構(gòu)建模型,機(jī)器學(xué)習(xí)通常
將問(wèn)題分為幾個(gè)步驟,每個(gè)步驟逐一解決,然后將結(jié)果組合。
9.參考答案:
(1)根據(jù)圖62可知,在異或操作中,點(diǎn)(0,0)與(1,1)為0,點(diǎn)(0,1)
和(1,0)為1,由于感知機(jī)是線性分類器,無(wú)法構(gòu)建超平面可以將這兩類分
開。
(2)輸入層維度為2,用于接收兩個(gè)操作數(shù);至少有一層隱藏層,且隱藏
層中的神經(jīng)元需要包含非線性激活函數(shù);輸出層維度為1,用于輸出結(jié)果。
10.參考答案:
不能初始化為0,也不能被同時(shí)初始化為其他相同的值。
如果參數(shù)被初始化為相同的值后,在誤差反向傳播過(guò)程中,同一層的神經(jīng)元
所接收到的誤差都相同,更新后這些參數(shù)的值仍然相同。不管經(jīng)過(guò)多少輪迭
代,同一層神經(jīng)元的參數(shù)保持相同,因此不同的神經(jīng)元無(wú)法學(xué)習(xí)到不同特征
的重要程度,失去了深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征的能力。
11.參考答案:
(1)L=,售1-%*logy-
(2)in+i=-%+i*,ogyZ+i
?n=-yn*logy'
_^=+駕*%
aw—dyn+1dhn+1dhndwn-!dyndhndwn^
12*.參考答案:
RNN的計(jì)算公式可以寫為:
ct=W-[xt,+b
假設(shè)時(shí)序長(zhǎng)度為T,則在梯度反向傳播過(guò)程中,T時(shí)刻的誤差I(lǐng)T對(duì)W的梯度
為:
T
dlTdlT1~~rdCjdcT
麗=乙=1購(gòu)*(]lj=i+1dcj_^dW
n:=i+i^中每一項(xiàng)都時(shí)介于o-i之間的小數(shù),當(dāng)T很大時(shí),n}=i+i券;
值趨近于0,從而產(chǎn)生梯度消失問(wèn)題。
在LSTM中,和=4?c1+i-tanh(W-[h_x]+b),因此3-=f,
tctvtcdCjt
由于ft通常為1或者為0,當(dāng)為1時(shí),所有梯度能夠在LSTM中傳遞,當(dāng)為0
時(shí),說(shuō)明上一時(shí)刻的信息對(duì)當(dāng)前時(shí)刻沒(méi)有影響,因此沒(méi)有必要傳回梯度更新參
數(shù)。這樣,LSTM解決了RNN的梯度消失問(wèn)題。
第七章強(qiáng)化學(xué)習(xí)
1.A
2.D
3.A
4.B
5.B;C
6.參考答案:
根據(jù)公式(7.1.5)所示的價(jià)值函數(shù)的貝爾曼方程聯(lián)立方程組:
'4G1)=R(S1,上,S3)+y/($3)=0+0.99x%(53)
%。2)=R(S2,上,S4)+丫/。4)=1+0.99X/GJ
'/(S3)=R(S3,上,sQ+y/6d)=-1+0.99X/(sQ
4(S4)=0
、/(Sd)=0
解得:
|%(S1)=-0.99
%⑸)=1
</⑸)=-1
%⑸)=0
<%(Sd)=0
7.參考答案
由于機(jī)器人每一步只能向上或者向右移動(dòng)一個(gè)方格,首先計(jì)算狀態(tài)S3選擇這兩
個(gè)不同動(dòng)作后分別所得動(dòng)作-價(jià)值函數(shù)取值:
9兀($3,上)=2P(s1s3,上)囚⑸,上,s')+y/G')]
sres
=1x(-1+0.99x0)+0x???=-1
%($3,右)=WP(S[S3,右)[R(S3,右,s')+y/S)]
sres
=1x(1+0.99x0)+0x???=1
可見,智能體在狀態(tài)S3選擇“向上移動(dòng)一個(gè)方格”行動(dòng)所得回報(bào)《兀國(guó),上)值
為-1、選擇“向右移動(dòng)一個(gè)方格”行動(dòng)所得回報(bào)《式$3,右)值為1。顯然,智能體
在狀態(tài)S3應(yīng)該選擇“向右移動(dòng)一個(gè)方格”行動(dòng),這樣能夠獲得更大的回報(bào)。
于是,經(jīng)過(guò)策略優(yōu)化后,狀態(tài)S3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2026學(xué)年惠東縣三年級(jí)數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 2024年南陵縣三年級(jí)數(shù)學(xué)第一學(xué)期期末監(jiān)測(cè)試題含解析
- 2024年凌海市數(shù)學(xué)三上期末教學(xué)質(zhì)量檢測(cè)模擬試題含解析
- 2025年執(zhí)業(yè)醫(yī)師考試實(shí)戰(zhàn)試題及答案
- 文化的傳播與傳播學(xué)試題及答案
- 2025年主管護(hù)師考試的答題技巧試題及答案
- 行政法學(xué)考點(diǎn)速記分享:試題及答案
- 藥物經(jīng)濟(jì)學(xué)的應(yīng)用與執(zhí)業(yè)藥師試題及答案
- 環(huán)境變化對(duì)文化傳承的影響試題及答案
- 2025年衛(wèi)生資格考試的市場(chǎng)需求試題及答案
- 廣州大學(xué)《PKPM結(jié)構(gòu)軟件應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 中共東莞市委辦公室公開招考勞務(wù)派遣人員高頻重點(diǎn)模擬試卷提升(共500題附帶答案詳解)
- 2025年焊工(高級(jí)技師)職業(yè)技能鑒定理論考試指導(dǎo)題庫(kù)(含答案)
- 高標(biāo)準(zhǔn)農(nóng)田建設(shè)項(xiàng)目驗(yàn)收技術(shù)方案
- 解讀《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024-2035年)》課件
- UFIDA-U9項(xiàng)目制造解決方案介紹
- 醫(yī)院新媒體管理辦法
- 全國(guó)粵教清華版初中信息技術(shù)八年級(jí)下冊(cè)第1單元第1節(jié)《從互聯(lián)網(wǎng)到物聯(lián)網(wǎng)》說(shuō)課稿
- 2025年中天合創(chuàng)煤炭分公司面向社會(huì)公開招聘煤炭專業(yè)技術(shù)人員管理單位筆試遴選500模擬題附帶答案詳解
- 基于OBE理念的古代漢語(yǔ)教學(xué)大綱設(shè)計(jì)
- 體育賽事自然災(zāi)害應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論