




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、- -昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院學(xué)生實(shí)驗(yàn)報(bào)告(20162017學(xué)年第學(xué)期)課程名稱:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘開課實(shí)驗(yàn)室:信自樓4442017年06月01日年級(jí)、專業(yè)、班軟件141班學(xué)號(hào)2014104131XX姓名陳*成績實(shí)驗(yàn)項(xiàng)目名稱數(shù)據(jù)挖掘及決策樹指導(dǎo)教師賈連印教師評(píng)語該同學(xué)是否了解實(shí)驗(yàn)原理:兒了解口B.基本了解口CJ、了解口該同學(xué)的實(shí)驗(yàn)?zāi)芰Γ篈.強(qiáng)口B.中等口C.差口該同學(xué)的實(shí)驗(yàn)是否達(dá)到要求:A.達(dá)到口B.基本達(dá)到口C.未達(dá)到口實(shí)驗(yàn)報(bào)告是否規(guī)范:A.規(guī)范口B.基本規(guī)范口C.不規(guī)范口實(shí)驗(yàn)過程是否詳細(xì)記錄:A.詳細(xì)口B.一般口C.沒有口教師簽名:年月日、上機(jī)目的及內(nèi)容目的:1理解數(shù)據(jù)挖掘的基本概
2、念及其過程;2.理解數(shù)據(jù)挖掘與數(shù)據(jù)倉庫、OLAP之間的關(guān)系3理解基本的數(shù)據(jù)挖掘技術(shù)與方法的工作原理與過程,掌握數(shù)據(jù)挖掘相關(guān)工具的使用。內(nèi)容:給定AdventureWorksDW數(shù)據(jù)倉庫,構(gòu)建“Microsoft決策樹”模型,分析客戶群中購買自行車的模式。要求:利用實(shí)驗(yàn)室和指導(dǎo)教師提供的實(shí)驗(yàn)軟件,認(rèn)真完成規(guī)定的實(shí)驗(yàn)內(nèi)容,真實(shí)地記錄實(shí)驗(yàn)中遇到的二、實(shí)驗(yàn)原理及基本技術(shù)路線圖(方框原理圖或程序流程圖)請(qǐng)描述數(shù)據(jù)挖掘及決策樹的相關(guān)基本概念、模型等。1.數(shù)據(jù)挖掘:從大量的、不完全的、有噪音的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又潛在有用的信息和知識(shí)的過程。2.數(shù)據(jù)挖掘的功能:功能
3、概念或作用概念描述對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征關(guān)聯(lián)分析從大量的數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的聯(lián)系、相關(guān)關(guān)系或因果結(jié)構(gòu),以及項(xiàng)集的頻繁模式分類與預(yù)測(cè)分類:提出一個(gè)分類函數(shù)或者分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中的一個(gè);預(yù)測(cè):利用歷史數(shù)據(jù)建立模型,再運(yùn)用最新數(shù)據(jù)作為輸入值,獲得未來變化趨勢(shì)或者評(píng)估給定樣本可能具有的屬性值或值的范圍聚類分析根據(jù)數(shù)據(jù)的不同特征,將其劃分為不同數(shù)據(jù)類偏差分析對(duì)差異和極端特例的描述,揭示事物偏離常規(guī)的異?,F(xiàn)象,其基本思想是尋找觀測(cè)結(jié)果與參照值之間有意義的差別3.決策樹:是一種預(yù)測(cè)模型,它代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。樹中每個(gè)節(jié)
4、點(diǎn)表示某個(gè)對(duì)象,而每個(gè)分叉路徑則代表的某個(gè)可能的屬性值,而每個(gè)葉結(jié)點(diǎn)則對(duì)應(yīng)從根節(jié)點(diǎn)到該葉節(jié)點(diǎn)所經(jīng)歷的路徑所表示的對(duì)象的值。決策樹僅有單一輸出,若欲有復(fù)數(shù)輸出,可以建立獨(dú)立的決策樹以處理不同輸出。4.常用決策樹算法:算法概念I(lǐng)D3在實(shí)體世界中,每個(gè)實(shí)體用多個(gè)特征來描述。每個(gè)特征限于在一個(gè)離散集中取互斥的值C4.5對(duì)ID3算法進(jìn)行了改進(jìn):用信息增益率來選擇屬性,克服了用信息增益選擇屬性時(shí)偏向選擇取值多的屬性的不足;在樹構(gòu)造過程中進(jìn)行剪枝;能夠完成對(duì)連續(xù)屬性的離散化處理;能夠?qū)Σ煌暾麛?shù)據(jù)進(jìn)行處理。三、所用儀器、材料(設(shè)備名稱、型號(hào)、規(guī)格等或使用軟件)1臺(tái)PC及MicrosoftSQLServer套件
5、四、實(shí)驗(yàn)方法、步驟(或:程序代碼或操作過程)(一)準(zhǔn)備AnalysisServices數(shù)據(jù)庫1.AnalysisServices項(xiàng)目創(chuàng)建成功解決方案黃源管理器-疝嬴三斗X隔箱口AdventureWorks|晶|匕會(huì)源視圓i匕鑫融翼集,I.匕匕角色;匕叫集:&詢2.更改存儲(chǔ)數(shù)據(jù)挖掘?qū)ο蟮膶?shí)例H目標(biāo)司率扳本1適步丑|l&calhot頻AdvcnturcWark造日闞牛認(rèn)但專行部署False造心僅部里更逑竭用s袈尋頂E弗生到其中的Anal/sisServices室周S?i=(C);SiftCDevelopmeiit)*平白色;不可用樂取消SEih&5=KiO).SEih&5=KiO).3.創(chuàng)建數(shù)據(jù)源
6、4.修改數(shù)據(jù)源視圖(二)生成目標(biāo)郵件方案.創(chuàng)建用于目標(biāo)郵件方案的挖掘結(jié)構(gòu)ai_jAdv&ntur&WorkDUV$-口舞據(jù)源j-&數(shù)據(jù)源視圖CnistumerKeyGeuaphyKuyChie+amerA_tpCnistumerKeyGeuaphyKuyChie+amerA_tprnat.TitleFirmttT:如曰Middl&Nam&La5-LK:jjTieN:diii嘲StyleEirtKDatet:=JEt:ktnETargetedMail沁gdmm程序集匕雜項(xiàng).修改目標(biāo)郵件模型創(chuàng)建聚類分析挖掘模型NaiveBayes模型處理挖掘模型(三)決策樹H.lJhiLuuqr./hFILaHrLpJUdMlOMM;NfaFL?JKi-OM耳ICEO?rlv.(四)依賴關(guān)系網(wǎng)絡(luò)五、實(shí)驗(yàn)結(jié)果(測(cè)試數(shù)據(jù)、圖表、計(jì)算等)決策樹六、分析和結(jié)論(誤差分析與數(shù)據(jù)處理、成果總結(jié)等。其中,繪制曲線圖時(shí)必須用計(jì)算紙或程序運(yùn)行結(jié)果、改進(jìn)、收獲)在本次實(shí)驗(yàn)中,在建立數(shù)據(jù)源視圖時(shí),多次出現(xiàn)錯(cuò)誤,后來發(fā)現(xiàn)是因?yàn)槲锤郊訑?shù)據(jù)庫的原因,附加數(shù)據(jù)庫后解決了。因?yàn)閷?shí)驗(yàn)沒有完成就關(guān)閉了電腦,重啟電腦后,出現(xiàn)無法連接的錯(cuò)誤,后通過管理界面啟動(dòng)服務(wù)后解決。在部署時(shí),出現(xiàn)由于“創(chuàng)建用于目標(biāo)郵件方案的挖掘結(jié)構(gòu)”中“內(nèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 化工儀表入職試題及答案
- 急性心衰考核試題及答案
- 探討紡織品產(chǎn)業(yè)鏈各環(huán)節(jié)的質(zhì)量控制試題及答案
- 神華歷年實(shí)操試題及答案
- 探索紡織品復(fù)合材料的應(yīng)用試題及答案
- 2024國際商業(yè)美術(shù)設(shè)計(jì)師的風(fēng)險(xiǎn)應(yīng)對(duì)策略試題及答案
- 幼兒文學(xué)考試題及答案
- 服裝設(shè)計(jì)的市場(chǎng)需求分析試題及答案
- 2024年廣告設(shè)計(jì)師考試品牌策略試題及答案
- 2024年商業(yè)設(shè)計(jì)師考試的真題解讀試題及答案
- 情境學(xué)習(xí)理論在教育中的應(yīng)用
- 血糖監(jiān)測(cè)操作流程及考核標(biāo)準(zhǔn)(100分)
- 初中體育課堂學(xué)生體質(zhì)發(fā)展及體能鍛煉有效措施優(yōu)秀獲獎(jiǎng)科研論文
- 部編版語文二年級(jí)下冊(cè)第6單元奇妙的大自然大單元整體作業(yè)設(shè)計(jì)
- 2023年住院醫(yī)師考試-康復(fù)醫(yī)學(xué)住院醫(yī)師考試題庫(含答案)
- 高中音樂鑒賞 《黃河大合唱》
- 2022年貴州貴陽市中考英語真題
- FZ/T 32001-2018亞麻紗
- 《大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)安全問題探討(論文)8000字》
- 粵教科技版科學(xué)六年級(jí)下冊(cè)第14課《生物生存的環(huán)境》教學(xué)課件
- 高考語文作文素材:《典籍里的中國》課件33張
評(píng)論
0/150
提交評(píng)論