




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
關(guān)聯(lián)規(guī)則試題及答案
一、單項(xiàng)選擇題(每題2分,共10題)1.以下哪個(gè)是衡量關(guān)聯(lián)規(guī)則重要性的指標(biāo)?()A.支持度B.置信度C.提升度D.以上都是2.關(guān)聯(lián)規(guī)則挖掘主要用于發(fā)現(xiàn)數(shù)據(jù)中的()A.分類關(guān)系B.聚類關(guān)系C.因果關(guān)系D.關(guān)聯(lián)關(guān)系3.支持度的計(jì)算公式是()A.包含項(xiàng)集的事務(wù)數(shù)/總事務(wù)數(shù)B.包含前件和后件的事務(wù)數(shù)/包含前件的事務(wù)數(shù)C.包含前件和后件的事務(wù)數(shù)/包含后件的事務(wù)數(shù)D.以上都不對(duì)4.置信度為0.8的關(guān)聯(lián)規(guī)則意味著()A.80%的事務(wù)包含前件B.80%的事務(wù)包含后件C.在前件出現(xiàn)的事務(wù)中,80%的事務(wù)也出現(xiàn)后件D.后件出現(xiàn)的概率是80%5.提升度大于1表示()A.前件和后件相互獨(dú)立B.前件和后件負(fù)相關(guān)C.前件和后件正相關(guān)D.沒有意義6.Apriori算法的核心思想是()A.基于頻繁項(xiàng)集性質(zhì)的逐層搜索的迭代方法B.隨機(jī)搜索C.貪心算法D.動(dòng)態(tài)規(guī)劃7.頻繁項(xiàng)集是指()A.支持度大于等于最小支持度的項(xiàng)集B.置信度大于等于最小置信度的項(xiàng)集C.提升度大于等于1的項(xiàng)集D.以上都不對(duì)8.關(guān)聯(lián)規(guī)則A→B的支持度為0.1,意味著()A.10%的事務(wù)同時(shí)包含A和BB.10%的事務(wù)包含AC.10%的事務(wù)包含BD.A出現(xiàn)時(shí)B有10%的概率出現(xiàn)9.以下哪個(gè)不是關(guān)聯(lián)規(guī)則挖掘的應(yīng)用場(chǎng)景?()A.購物籃分析B.疾病診斷C.圖像識(shí)別D.推薦系統(tǒng)10.最小支持度閾值的作用是()A.控制規(guī)則的數(shù)量B.控制規(guī)則的質(zhì)量C.篩選出頻繁項(xiàng)集D.以上都對(duì)二、多項(xiàng)選擇題(每題2分,共10題)1.關(guān)聯(lián)規(guī)則挖掘中常用的評(píng)估指標(biāo)有()A.支持度B.置信度C.提升度D.準(zhǔn)確率2.以下屬于關(guān)聯(lián)規(guī)則挖掘算法的有()A.Apriori算法B.FP-growth算法C.K-means算法D.DBSCAN算法3.影響關(guān)聯(lián)規(guī)則質(zhì)量的因素有()A.支持度B.置信度C.數(shù)據(jù)集大小D.項(xiàng)集數(shù)量4.關(guān)聯(lián)規(guī)則挖掘在哪些領(lǐng)域有應(yīng)用()A.市場(chǎng)營銷B.金融風(fēng)險(xiǎn)預(yù)測(cè)C.醫(yī)療保健D.教育5.關(guān)于支持度和置信度,下列說法正確的是()A.支持度衡量項(xiàng)集在數(shù)據(jù)集中出現(xiàn)的頻繁程度B.置信度衡量規(guī)則的可靠性C.支持度高的規(guī)則置信度一定高D.置信度高的規(guī)則支持度一定高6.頻繁項(xiàng)集的性質(zhì)有()A.頻繁項(xiàng)集的所有非空子集一定是頻繁項(xiàng)集B.非頻繁項(xiàng)集的超集一定是非頻繁項(xiàng)集C.頻繁項(xiàng)集的超集一定是頻繁項(xiàng)集D.非頻繁項(xiàng)集的子集一定是非頻繁項(xiàng)集7.挖掘關(guān)聯(lián)規(guī)則的步驟包括()A.生成頻繁項(xiàng)集B.生成候選集C.由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則D.評(píng)估關(guān)聯(lián)規(guī)則8.在購物籃分析中,關(guān)聯(lián)規(guī)則可以幫助商家()A.了解顧客購買行為B.優(yōu)化商品擺放C.制定促銷策略D.提高顧客忠誠度9.提升度的意義在于()A.衡量前件和后件之間的依賴程度B.大于1表示正相關(guān)C.小于1表示負(fù)相關(guān)D.等于1表示相互獨(dú)立10.關(guān)聯(lián)規(guī)則挖掘中,處理大數(shù)據(jù)集時(shí)可能面臨的挑戰(zhàn)有()A.計(jì)算量過大B.內(nèi)存不足C.生成大量低質(zhì)量規(guī)則D.難以確定合適的閾值三、判斷題(每題2分,共10題)1.支持度越高的關(guān)聯(lián)規(guī)則一定越有價(jià)值。()2.Apriori算法在生成候選集時(shí)會(huì)產(chǎn)生大量冗余。()3.置信度為1的關(guān)聯(lián)規(guī)則一定是有意義的。()4.頻繁項(xiàng)集的子集一定是頻繁項(xiàng)集。()5.提升度小于1說明前件和后件是正相關(guān)。()6.FP-growth算法比Apriori算法效率更高。()7.關(guān)聯(lián)規(guī)則挖掘只能發(fā)現(xiàn)數(shù)據(jù)中的簡單關(guān)系。()8.最小支持度和最小置信度閾值設(shè)置越高,生成的規(guī)則質(zhì)量越高。()9.關(guān)聯(lián)規(guī)則挖掘在推薦系統(tǒng)中可以用于推薦相關(guān)商品。()10.數(shù)據(jù)集的大小對(duì)關(guān)聯(lián)規(guī)則挖掘的結(jié)果沒有影響。()四、簡答題(每題5分,共4題)1.簡述關(guān)聯(lián)規(guī)則挖掘的概念。關(guān)聯(lián)規(guī)則挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。通過支持度、置信度等指標(biāo)衡量規(guī)則的重要性和可靠性,找出數(shù)據(jù)中經(jīng)常一起出現(xiàn)的項(xiàng)集組合以及它們之間的關(guān)聯(lián)關(guān)系,廣泛應(yīng)用于多個(gè)領(lǐng)域。2.說明支持度和置信度在關(guān)聯(lián)規(guī)則中的作用。支持度衡量項(xiàng)集在數(shù)據(jù)集中出現(xiàn)的頻繁程度,反映項(xiàng)集的普遍程度;置信度衡量關(guān)聯(lián)規(guī)則的可靠性,即在前件出現(xiàn)的事務(wù)中后件出現(xiàn)的概率,兩者從不同角度評(píng)估關(guān)聯(lián)規(guī)則的價(jià)值。3.簡述Apriori算法的基本步驟。首先生成1-項(xiàng)集,根據(jù)最小支持度篩選出頻繁1-項(xiàng)集;然后基于頻繁k-項(xiàng)集生成候選k+1-項(xiàng)集,再根據(jù)最小支持度篩選出頻繁k+1-項(xiàng)集,重復(fù)此過程直到無法生成新的頻繁項(xiàng)集,最后由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。4.舉例說明關(guān)聯(lián)規(guī)則在購物籃分析中的應(yīng)用。比如在超市購物籃分析中,發(fā)現(xiàn)規(guī)則“購買啤酒→購買尿布”支持度和置信度較高,說明很多購買啤酒的顧客也會(huì)購買尿布。超市可將這兩種商品擺放在相近位置,或進(jìn)行聯(lián)合促銷,提高銷售額。五、討論題(每題5分,共4題)1.討論如何確定合適的最小支持度和最小置信度閾值。需綜合多方面因素。數(shù)據(jù)集大小、特點(diǎn)不同,閾值不同。若數(shù)據(jù)集大且項(xiàng)集分布均勻,可適當(dāng)降低閾值;若想獲取高質(zhì)量規(guī)則,可提高閾值。還需結(jié)合業(yè)務(wù)需求,如購物籃分析中,關(guān)注頻繁購買組合,支持度閾值可稍高;關(guān)注潛在關(guān)聯(lián),閾值可低些,要通過實(shí)驗(yàn)和業(yè)務(wù)經(jīng)驗(yàn)不斷調(diào)整。2.分析關(guān)聯(lián)規(guī)則挖掘在醫(yī)療保健領(lǐng)域可能面臨的問題及解決方法。面臨問題:數(shù)據(jù)隱私保護(hù)、數(shù)據(jù)質(zhì)量參差不齊、醫(yī)學(xué)知識(shí)與挖掘結(jié)果結(jié)合難。解決方法:采用隱私保護(hù)技術(shù),如加密;對(duì)數(shù)據(jù)進(jìn)行清洗、預(yù)處理提高質(zhì)量;加強(qiáng)醫(yī)學(xué)專家與數(shù)據(jù)挖掘人員合作,讓醫(yī)學(xué)知識(shí)指導(dǎo)挖掘過程、解讀結(jié)果。3.探討關(guān)聯(lián)規(guī)則挖掘與機(jī)器學(xué)習(xí)其他算法的結(jié)合應(yīng)用??膳c分類算法結(jié)合,如利用關(guān)聯(lián)規(guī)則挖掘的頻繁項(xiàng)集作為特征,輸入到?jīng)Q策樹等分類算法中,提高分類準(zhǔn)確性。也可與聚類算法結(jié)合,通過關(guān)聯(lián)規(guī)則分析聚類結(jié)果中不同簇內(nèi)項(xiàng)集的關(guān)聯(lián)關(guān)系,更好理解簇的特性,進(jìn)一步優(yōu)化聚類。4.闡述在電商推薦系統(tǒng)中,關(guān)聯(lián)規(guī)則挖掘相比其他推薦方法的優(yōu)勢(shì)與局限性。優(yōu)勢(shì):能發(fā)現(xiàn)商品間潛在關(guān)聯(lián),推薦相關(guān)商品,挖掘用戶未被發(fā)現(xiàn)的需求;基于歷史交易數(shù)據(jù),挖掘簡單直接。局限性:依賴歷史數(shù)據(jù),對(duì)新商品和新用戶推薦效果差;挖掘的關(guān)聯(lián)可能是表面的,缺乏語義理解;計(jì)算量大,處理實(shí)時(shí)性推薦有挑戰(zhàn)。答案一、單項(xiàng)選擇題1.D2.D3.A4.C5.C6.A7.A8.A9.C10.D
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物多樣性保護(hù)與可持續(xù)發(fā)展閱讀材料題
- 工人安全考試題庫及答案
- 地質(zhì)安全考試試題及答案
- 2025年信息檢索與利用能力考試試題及答案
- 2025年信息安全技術(shù)專業(yè)考試試卷及答案
- 2025年心理健康教育專業(yè)畢業(yè)生考試試卷及答案
- 2025年心理健康干預(yù)措施知識(shí)測(cè)試卷及答案
- 德育論考試試題及答案
- 德興高中面試題庫及答案
- 2025年食品科學(xué)與技術(shù)專業(yè)入學(xué)考試卷及答案
- 參考食品加工操作流程圖
- 山東省普通高中學(xué)生發(fā)展報(bào)告
- 高新區(qū)孵化器亮化工程投標(biāo)文件商務(wù)標(biāo)格式
- 國家開放大學(xué)《水力學(xué)(B)》形考任務(wù)1-10參考答案
- 國家開放大學(xué)《C語言程序設(shè)計(jì)》綜合測(cè)試題參考答案
- 老年人生活自理能力評(píng)估表
- 火電機(jī)組能耗指標(biāo)分析指導(dǎo)性意見
- 我國各類型扣件技術(shù)說明
- 現(xiàn)澆混凝土構(gòu)件含模量參考表(浙江03、10定額砼含模量對(duì)照表)
- DB45∕T 2418-2021 水運(yùn)工程交工檢測(cè)與竣工檢測(cè)規(guī)范
- 旋流風(fēng)口、球型噴口選型參數(shù)表
評(píng)論
0/150
提交評(píng)論