


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、中國科學(xué)院大學(xué) 課程編號:712008Z 試 題 專 用 紙 課程名稱:機(jī)器學(xué)習(xí) 任課教師:卿來云 姓名 學(xué)號 成績 一、基礎(chǔ)題(共36分)1、請描述極大似然估計(jì)MLE和最大后驗(yàn)估計(jì)MAP之間的區(qū)別。請解釋為什么MLE比MAP更容易過擬合。(10分)ABCy00100100110000111111100111012、在年度百花獎評獎揭曉之前,一位教授問80個電影系的學(xué)生,誰將分別獲得8個獎項(xiàng)(如最佳導(dǎo)演、最佳男女主角等)。評獎結(jié)果揭曉后,該教授計(jì)算每個學(xué)生的猜中率,同時也計(jì)算了所有80個學(xué)生投票的結(jié)果。他發(fā)現(xiàn)所有人投票結(jié)果幾乎比任何一個學(xué)生的結(jié)果正確率都高。這種提高是偶然的嗎?請解
2、釋原因。(10分)3、假設(shè)給定如右數(shù)據(jù)集,其中A、B、C為二值隨機(jī)變量,y為待預(yù)測的二值變量。(a) 對一個新的輸入A=0, B=0, C=1,樸素貝葉斯分類器將會怎樣預(yù)測y?(10分)(b) 假設(shè)你知道在給定類別的情況下A、B、C是獨(dú)立的隨機(jī)變量,那么其他分類器(如Logstic回歸、SVM分類器等)會比樸素貝葉斯分類器表現(xiàn)更好嗎?為什么?(注意:與上面給的數(shù)據(jù)集沒有關(guān)系。)(6分)二、回歸問題。(共24分)現(xiàn)有N個訓(xùn)練樣本的數(shù)據(jù)集,其中為實(shí)數(shù)。1 我們首先用線性回歸擬合數(shù)據(jù)。為了測試我們的線性回歸模型,我們隨機(jī)選擇一些樣本作為訓(xùn)練樣本,剩余樣本作為測試樣本?,F(xiàn)在我們慢慢增加訓(xùn)練樣本的數(shù)目,
3、那么隨著訓(xùn)練樣本數(shù)目的增加,平均訓(xùn)練誤差和平均測試誤差將會如何變化?為什么?(6分)平均訓(xùn)練誤差:A、增加 B、減小平均測試誤差:A、增加 B、減小2 給定如下圖(a)所示數(shù)據(jù)。粗略看來這些數(shù)據(jù)不適合用線性回歸模型表示。因此我們采用如下模型: ,其中。假設(shè)我們采用極大似然估計(jì)w,請給出log似然函數(shù)并給出w的估計(jì)。(8分)3 給定如下圖(b)所示的數(shù)據(jù)。從圖中我們可以看出該數(shù)據(jù)集有一些噪聲,請?jiān)O(shè)計(jì)一個對噪聲魯棒的線性回歸模型,并簡要分析該模型為什么能對噪聲魯棒。(10分)(a) (b)三、SVM分類。(第15題各4分,第6題5分,共25分)下圖為采用不同核函數(shù)或不同的松弛因子得到的SVM決策邊
4、界。但粗心的實(shí)驗(yàn)者忘記記錄每個圖形對應(yīng)的模型和參數(shù)了。請你幫忙給下面每個模型標(biāo)出正確的圖形。1、其中。2、其中。3、其中。4、其中。5、其中。6、考慮帶松弛因子的線性SVM分類器:下面有一些關(guān)于某些變量隨參數(shù)C的增大而變化的表述。如果表述總是成立,標(biāo)示“是”;如果表述總是不成立,標(biāo)示“否”;如果表述的正確性取決于C增大的具體情況,標(biāo)示“不一定”。 共 3 頁 第2 頁(1) 不會增大(2) 增大(3) 不會減小(4) 會有更多的訓(xùn)練樣本被分錯(5) 間隔(Margin)不會增大四、一個初學(xué)機(jī)器學(xué)習(xí)的朋友對房價進(jìn)行預(yù)測。他在一個N=1000個房價數(shù)據(jù)的數(shù)據(jù)集上匹配了一個有533個參數(shù)的模型,該模型能解釋數(shù)據(jù)集上99%的變化。1、請問該模型能很好地預(yù)測來年的房價嗎?簡單解釋原因。(5分)2、如果上述模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新高一班干部培訓(xùn)
- 幼兒園傳染病防控培訓(xùn)
- 節(jié)后員工安全培訓(xùn)
- 護(hù)理管理工作制度
- 中學(xué)食堂建設(shè)項(xiàng)目商業(yè)計(jì)劃書
- 幼兒園建設(shè)項(xiàng)目投資計(jì)劃書
- 污水處理廠項(xiàng)目初步設(shè)計(jì)
- 山地生態(tài)治理修復(fù)項(xiàng)目初步設(shè)計(jì)
- 2025年常州機(jī)動車駕駛員教練員從業(yè)資格考試題庫
- 選礦工程師培訓(xùn)
- 2025-2030進(jìn)口肉類市場發(fā)展分析及行業(yè)投資戰(zhàn)略研究報告
- 2025至2030中國壓縮空氣儲能產(chǎn)業(yè)現(xiàn)狀調(diào)查及項(xiàng)目投資策略建議報告
- 智慧醫(yī)院建設(shè)項(xiàng)目實(shí)施方案
- 項(xiàng)目協(xié)作與溝通過程中的沖突管理試題及答案
- 三臺縣2024-2025學(xué)年小學(xué)六年級數(shù)學(xué)畢業(yè)檢測指導(dǎo)卷含解析
- 2025年軌道車司機(jī)(中級)職業(yè)技能鑒定參考試題庫(含答案)
- 生物必修1教師用書
- 宅基地互換合同協(xié)議書范本
- 2024版壓力容器設(shè)計(jì)審核機(jī)考題庫-多選3-3
- 2025人教版數(shù)學(xué)四年級下冊 第一單元《四則運(yùn)算》單元分層作業(yè)
- 慢性阻塞性肺疾病急性加重期合并II型呼吸衰竭個案護(hù)理
評論
0/150
提交評論