




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
國家開放大學(xué)
2023-2024學(xué)年《大數(shù)據(jù)技術(shù)導(dǎo)論》模擬試卷及答案解析
一、選擇題
1
可視分析是一種()?
(A.1交互式用戶界面模型
[B.1結(jié)構(gòu)化用戶界面模型
[C.1非結(jié)構(gòu)化用戶界面模型
[D.]獨(dú)立式用戶界面模型
【答案】A
2
數(shù)據(jù)科學(xué)的研究對象是()?
[A.]藥品成分
[B.]文學(xué)作品
[C.1數(shù)據(jù)界的數(shù)據(jù)
[D.]人類歷史
【答案】C
3
下面不是研究數(shù)據(jù)方法的是()?
[A.]統(tǒng)計(jì)學(xué)
[B.1機(jī)器學(xué)習(xí)
[C.1心理分析
[D.]數(shù)據(jù)挖掘
【答案】C
4
卜面是數(shù)據(jù)科學(xué)的主要研究內(nèi)容的是()?
(A.1數(shù)據(jù)泄露
[B.]數(shù)據(jù)交易
(C.1數(shù)據(jù)盜竊
[D.]數(shù)據(jù)分析
第1頁共74頁
【答案】D
5
下面不是數(shù)據(jù)產(chǎn)品開發(fā)的特征的是()?
[A.]多樣性
[B.]無競爭性
[C.1增值性
[D.]層次性
【答案】B
6
下面不屬于互聯(lián)網(wǎng)大數(shù)據(jù)的是()?
[A.]視頻
[B.]圖片
[C.1音頻
(D.)心情
【答案】D
7
下面不屬于大數(shù)據(jù)的特性是O?
[A.]數(shù)據(jù)量大
【B.】多樣性
[C.1真實(shí)性差
[D.]具有價(jià)值
【答案】C
8
下面屬于結(jié)構(gòu)化數(shù)據(jù)的是()?
[A.]表格數(shù)據(jù)
(B.1圖形
[CJ圖像
[D.]HTML文檔
【答案】A
9
第2頁共74頁
下面不屬于大數(shù)據(jù)的處理過程的是()?
[A.]數(shù)據(jù)獲取、儲存
[B.]數(shù)據(jù)清洗
[C.1數(shù)據(jù)分析
[D.]數(shù)據(jù)安全
【答案】D
10
下面不屬于大數(shù)據(jù)離線處理特點(diǎn)的是()?
[A.]數(shù)據(jù)保存時(shí)間短
[B.]數(shù)據(jù)不會(huì)發(fā)生改變
[C.1可進(jìn)行復(fù)雜的批審計(jì)算
[D.]方便查詢計(jì)算結(jié)果
【答案】A
11
下面不屬于大數(shù)據(jù)處理模式的是()?
[A.]離線處理
[B.]在線處理
[C.1手動(dòng)計(jì)算
【DJ交互處理
【答案】C
12
下面僅屬于大數(shù)據(jù)在線處理模式的是()?
[A.]批量計(jì)算
[B.]流式計(jì)算
[C.1手動(dòng)計(jì)算
[D.]交互處理
【答案】B
13
下面不屬于流式數(shù)據(jù)源的是()?
[A.]硬盤數(shù)據(jù)
[B.]傳感器數(shù)據(jù)
第3頁共74頁
18
基于任務(wù)的定義和分類,下列不屬于可視分析關(guān)注點(diǎn)的是()?
[A.]以用戶價(jià)值為關(guān)注點(diǎn)
[B.]以用戶意圖為關(guān)注點(diǎn)
[C.1以同戶行為為關(guān)注點(diǎn)
[DJ以軟件操作為關(guān)注點(diǎn)
【答案】A
19
下面不屬于企業(yè)大數(shù)據(jù)應(yīng)用成功的考慮因素是(>?
[A.]成本
[B.]客戶滿意度
[C.1附加收益
[D.]工人滿意度
【答案】D
20
下面不屬于大數(shù)據(jù)在通訊行業(yè)的應(yīng)用是O?
【A.】預(yù)測客戶行為
[B.]市場監(jiān)控
[C.1智能電表
[D.]市場預(yù)警
【答案】C
21
MapReduce以什么方式進(jìn)行分布式計(jì)算()?
[A.]文本
[B.]函數(shù)
[C.1數(shù)據(jù)集
[D.]矩陣
【答案】B
22
第5頁共74頁
在Hadoop中,將每一次計(jì)算請求稱為一個(gè)()?
[A.]文本
[B.]函數(shù)
(C.1數(shù)據(jù)集
[D.]作業(yè)
【答案】D
23
在Hadoop中,將每個(gè)作業(yè)拆分為若干個(gè)()?
[A.]文本
[B.]Map任務(wù)
[C.J數(shù)據(jù)集
[D.]Reduce任務(wù)
【答案】B
24
在Hadoop中,作業(yè)服務(wù)器被稱為()?
[A.]Job
[B.]Map
[C.JMaster
[D.]Reduce
【答案】C
25
下列不屬于一個(gè)作業(yè)的計(jì)算流程的是O?
[A.]作業(yè)開始
[B.]作業(yè)修改
[C.JMap任務(wù)分配
[D.]Reduce任務(wù)執(zhí)行
【答案】B
26
下列不屬于Map任務(wù)的執(zhí)行的子步驟的是()?
[A.]輸入準(zhǔn)備
[B.]輸入修改
[C.1算法執(zhí)行
第6頁共74頁
[D.]輸出生成
【答案】B
27
在MapReduce模型編程中,不屬于其步驟的是()?
[A.]遍歷數(shù)據(jù)
[BJ映射鍵值
[C.J數(shù)據(jù)分組
[D.]數(shù)據(jù)插補(bǔ)
【答案】D
28
Hadoop的核心是()和MapReduce。
[A.]NTFS
[B.]GFS
[C.lHDFS
[D.]FS
【答案】C
29
下列不屬于單詞計(jì)數(shù)的Map過程的是()?
【A.】按列分割文件
[B.]分詞處理
[C.1按行分割文件
[D.]排序與合并
【答案】A
30
WordCount完成的功能是統(tǒng)計(jì)()?
[A.]按列分割文件數(shù)
[B.1輸入文件中單詞頻數(shù)
[C.J按行分割文件數(shù)
[D.]輸入文件中單詞頻率
【答案】B
第7頁共74頁
31
Hadoop開發(fā)環(huán)境部署內(nèi)容不包括()?
[A.]安裝SSH協(xié)議
[B.]Hadoop系統(tǒng)部署
[C.1偽分布式Hadoop環(huán)境部署
[D.]電腦斷網(wǎng)
【答案】D
32
Reduce任務(wù)目標(biāo)是()?
[A.]輸入文件
(B.1輸入數(shù)據(jù)
[C.1輸入圖表
[D.]將若干個(gè)Map任務(wù)生成的中間文件匯總到最后的輸出文件
【答案】D
33
Hadoop作業(yè)服務(wù)器不負(fù)責(zé)()?
[A.]接受用戶提交的作業(yè)
[B.]任務(wù)的分配
[C.1執(zhí)行具體的任務(wù)
【D.】管理所有的任務(wù)服務(wù)器
【答案】C
34
下列不屬于文本數(shù)據(jù)語義特征的是O?
[A.]詞頻
[B.]邏輯結(jié)構(gòu)
[C.1動(dòng)態(tài)演化規(guī)律
[D.]數(shù)據(jù)結(jié)構(gòu)
【答案】D
35
文本數(shù)據(jù)是典型的O?
第8頁共74頁
[A.]結(jié)構(gòu)化數(shù)據(jù)
[B.J半結(jié)構(gòu)化數(shù)據(jù)
[C.1非結(jié)構(gòu)化數(shù)據(jù)
[D.]混合結(jié)構(gòu)數(shù)據(jù)
【答案】C
36
MapReduce模型將數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)將已完成的工作
和狀態(tài)更新,周期性地報(bào)告給()。
[A.]作業(yè)
[B.J任務(wù)
(C.J作業(yè)服務(wù)器
[D.]任務(wù)服務(wù)器
【答案】C
37
MapReduce模型的最大優(yōu)點(diǎn)體現(xiàn)在()?
[A.]輸入方便
[B.]分布式處理
[C.1各類型數(shù)據(jù)輸入
[D.]算法簡單
【答案】B
38
MapReduce模型適用場景的特點(diǎn)()?
[A.]數(shù)據(jù)可實(shí)時(shí)處理
[B.]任務(wù)不可分解
[C.1任務(wù)可分解
[D.]任務(wù)需要順序執(zhí)行
【答案】C
39
MapReduce將計(jì)算過程分解的最大好處是()?
[A.]復(fù)雜化
[B.]快捷化
第9頁共74頁
[C.1并行化
[D.]低成本
【答案】C
40
下列不屬于MapReduce模型的限制因素的是()?
[AJ任務(wù)要求
[B.]數(shù)據(jù)不可無限分割
[CJ通信開銷
[D.]集群規(guī)模
【答案】A
41
下列不屬于信息可視化的分類的是()?
[A.]一維信息可視化
【B.】三維信息可視化
[C.1截面數(shù)據(jù)可視化
(D.1時(shí)序信息可視化
【答案】C
42
下列屬于傳統(tǒng)數(shù)據(jù)獲取的特點(diǎn)的是O?
[A.]數(shù)據(jù)源多種多樣
[B.1數(shù)據(jù)量巨大
[C.1結(jié)構(gòu)單一
[D.]結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
【答案】C
43
下列不屬于大數(shù)據(jù)獲取的特點(diǎn)的是()?
[A.]數(shù)據(jù)源多種多樣
[B.]數(shù)據(jù)量巨大
(C.)結(jié)構(gòu)單一
[D.]結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
【答案】C
第10頁共74頁
44
下列屬于大數(shù)據(jù)獲取的特點(diǎn)的是O?
[A.]數(shù)據(jù)源單一
[B.]數(shù)據(jù)量較小
[C.J結(jié)構(gòu)單一
[DJ包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
【答案】D
45
氣泡圖由什么演化而來是O?
(A.]直方圖
[B.]條形圖
[C.J散點(diǎn)圖
[D.)折線圖
【答案】C
46
下列不屬于文本數(shù)據(jù)的是O?
[A.]廣告
[B.]音頻
[C.]雜志
[D.]圖書
【答案】B
47
下列不屬于文本數(shù)據(jù)的獲取特點(diǎn)的是O?
[A.]靈活度高
[B.]速度快
[C.1按需獲取
[D.]易處理
【答案】D
48
下列屬于意見建議類用戶反饋的特點(diǎn)的是O?
第11頁共74頁
[A.]反饋量大
[B.]反饋速度快
[C.1針對性強(qiáng)
[D.]傳播快
【答案】C
下列不屬于空間數(shù)據(jù)的特性的是()?
[A.]定位
[B.1定量
[C.J定性
[D.]時(shí)空關(guān)系
【答案】B
下列不屬于網(wǎng)站內(nèi)部數(shù)據(jù)庫中的數(shù)據(jù)的是()?
【A.】用戶信息數(shù)據(jù)
[B.]野外實(shí)測數(shù)據(jù)
[C.1網(wǎng)站產(chǎn)品數(shù)據(jù)
[DJ網(wǎng)站運(yùn)營數(shù)據(jù)
【答案】B
下列不屬于網(wǎng)站數(shù)據(jù)采集的數(shù)據(jù)的是()?
[A.]非結(jié)構(gòu)化數(shù)據(jù)
[B.1半結(jié)構(gòu)化數(shù)據(jù)
[C.1結(jié)構(gòu)化數(shù)據(jù)
[D.]實(shí)驗(yàn)測試數(shù)據(jù)
【答案】D
下列不屬于網(wǎng)絡(luò)爬蟲工作過程的是O?
(A.1獲取網(wǎng)頁
[B.]修改網(wǎng)頁
[C.1解析網(wǎng)頁
【D.】儲存數(shù)據(jù)
第12頁共74頁
【答案】B
53
下列不屬于通用網(wǎng)絡(luò)爬蟲為特點(diǎn)及要求的是()?
[A.]數(shù)量巨大
[B.]范圍較小
[C.J存儲空間要大
[D.]爬行速度要快
【答案】B
54
下列不屬于通用網(wǎng)絡(luò)爬蟲的結(jié)構(gòu)的是O?
【A.】頁面爬行模塊
[B.]頁面分析模塊
[C.1頁面數(shù)據(jù)庫
(D.)頁面修改模塊
【答案】D
55
下列不屬于網(wǎng)頁的爬蟲策略的是O?
LA.]深度優(yōu)先搜索策略
(B.1精確選擇搜索策略
1C.1廣度優(yōu)先搜索策略
[D.]最佳優(yōu)先搜索策略
【答案】B
56
下列不屬于通用網(wǎng)絡(luò)爬蟲的局限性的是()?
[A.]無用網(wǎng)頁較多
[B.]對非結(jié)構(gòu)化數(shù)據(jù)獲取相對?容易
[CJ難以支持基于語義信息的查詢
[D.)有限的網(wǎng)絡(luò)爬蟲服務(wù)器資源與無限的網(wǎng)絡(luò)數(shù)據(jù)資源之間的沖突
【答案】B
57
第13頁共74頁
下列屬于聚焦網(wǎng)絡(luò)爬蟲的特點(diǎn)的是()?
[A.]數(shù)量巨大
[B.]范圍較大
[C.1精準(zhǔn)篩選
[D.]爬行速度慢
【答案】C
58
下列屬于淺聚焦網(wǎng)絡(luò)爬蟲的核心特點(diǎn)的是O?
[A.]數(shù)量巨大
[B.]范圍較大
(CJ精準(zhǔn)篩選
[D.]選定URL種子
【答案】D
59
下列不屬于爬蟲對抓取目標(biāo)的定義原則的是()?
[A.]目標(biāo)網(wǎng)頁特征
[B.]目標(biāo)數(shù)據(jù)量
(C.1目標(biāo)數(shù)據(jù)模式
[D.]領(lǐng)域概念
【答案】B
60
下列不屬于網(wǎng)絡(luò)爬蟲的數(shù)據(jù)抓取方式的是()?
[A.]預(yù)先給定的初始抓取種子樣本
[B.]預(yù)先給定的網(wǎng)頁分類目錄和與分類目錄對應(yīng)的種子樣本
[C.1通過用戶行為確定的抓取目標(biāo)樣例
[D.]自行編寫種子樣本
【答案】D
61
下列不屬于NoSQL數(shù)據(jù)庫的特點(diǎn)的是()?
[A.]需預(yù)定義數(shù)據(jù)模型
【B.】支持透明橫向擴(kuò)展
第14頁共74頁
[C.1將數(shù)據(jù)進(jìn)行分區(qū)
【D.】保證最終一致性
【答案】A
62
下列不屬于NoSQL數(shù)據(jù)庫的存儲方式的是()?
[A.]行式存儲
[B.1鍵值式存儲
[C.1圖形式存儲
[D.]文檔式存儲
【答案】A
63
下列不屬于NoSQL數(shù)據(jù)庫的鍵值式存儲的常見形式的是()?
[A.]臨時(shí)型
[B.]附加型
【C.】混合型
[D.]永久型
【答案】B
64
下列不屬于數(shù)據(jù)庫架構(gòu)混合應(yīng)用模式的是O?
[A.]OldSQL+NewSQL混合模式
[B.]OldSQL+NoSQL+NewSQL混合模式
[C.1OldSQL+NoSQL混合模式
[D.)NewSQLd-NoSQL混合模式
【答案】B
65
下列不屬于大數(shù)據(jù)抽取方式的是O?
[A.]同構(gòu)同質(zhì)數(shù)據(jù)抽取
[B.]異構(gòu)同質(zhì)數(shù)據(jù)抽取
[C.1同構(gòu)異質(zhì)數(shù)據(jù)抽取
(D.)文件型數(shù)據(jù)抽取
【答案】B
第15頁共74頁
66
F列不屬于增量數(shù)據(jù)抽取特點(diǎn)的是O?
[A.]抽取發(fā)生變化的數(shù)據(jù)
[B.]快捷
[C.J處理量更多
[D.]需要與數(shù)據(jù)裝載時(shí)的更新策略相對應(yīng)
【答案】C
67
下列不屬于地域空間可視化展現(xiàn)的功能的是()?
[A.]認(rèn)識功能
[B.]模擬功能
[C.1載負(fù)功能
[D.]學(xué)習(xí)功能
【答案】D
68
時(shí)間戳是能表示一份數(shù)據(jù)在某個(gè)特定時(shí)間之前已經(jīng)存在的、完整的、可驗(yàn)證的一個(gè)數(shù)據(jù),
其通常是()?
[A.]一個(gè)數(shù)據(jù)集
[B.]一個(gè)字符序列
[C.]一個(gè)日志文件
[D.]一段儲存代碼
【答案】B
69
下列不屬于基于時(shí)間戳的增量數(shù)據(jù)抽取方式的優(yōu)點(diǎn)的是O?
[A.]性能優(yōu)異
[B.]系統(tǒng)設(shè)計(jì)清晰
[C.J數(shù)據(jù)抽取簡單
[D.]對業(yè)務(wù)系統(tǒng)無其他要求
【答案】D
第16頁共74頁
70
卜.列不屬于MD5(消息摘要算法)的特點(diǎn)的()?
[A.]對源系統(tǒng)的傾入性較小
[B.]被動(dòng)地進(jìn)行全表數(shù)據(jù)的比對
[CJ性能優(yōu)異
[D.]準(zhǔn)確性不穩(wěn)定
【答案】C
71
下列不屬于數(shù)據(jù)清洗的是()?
【A.】檢查數(shù)據(jù)的完整性
【BJ修改數(shù)據(jù)
[C.1填補(bǔ)數(shù)據(jù)
[D.]消除重復(fù)
【答案】B
72
下列不屬于數(shù)據(jù)質(zhì)量的要素的是O?
[A.]準(zhǔn)確性
[B.]完整性
[C.1異質(zhì)性
【D.】及時(shí)性
【答案】C
73
下列不屬于數(shù)據(jù)質(zhì)量一致性的是()?
[A.]數(shù)據(jù)編碼一致性
[B.]數(shù)據(jù)大小一致性
[C.1指標(biāo)統(tǒng)計(jì)一致性
[D.]指標(biāo)計(jì)算一致性
【答案】B
74
【答案】D
第17頁共74頁
75
下列不屬于數(shù)據(jù)清洗算法標(biāo)準(zhǔn)的是O?
[A.]返回率
[B.]錯(cuò)誤返回率
[C.1正確返回率
[D.]精確度
【答案】C
76
下列不會(huì)造成文本記錄重復(fù)相似的是O?
[A.]插入
[B.]交換
[C.J等價(jià)表述
【D.】刪除冗余
【答案】D
77
下列不屬于文本相似度計(jì)算的應(yīng)用領(lǐng)域的是()?
[A.]信息檢索
[B.]數(shù)據(jù)挖掘
【C.】文檔修改
[D.]機(jī)器翻譯
【答案】C
78
下列不屬于文本相似度計(jì)算流程的是O?
[A.]文本排序
[B.]文本分詞
[C.J統(tǒng)計(jì)詞頻
[D.]寫出詞頻向量
【答案】A
79
增量數(shù)據(jù)抽取方式只抽取O?
第18頁共74頁
[A.]PB級數(shù)據(jù)
[Bl不變數(shù)據(jù)
[C.l變化數(shù)據(jù)
[D.]有價(jià)值數(shù)據(jù)
【答案】C
80
數(shù)據(jù)清洗算法的衡量標(biāo)準(zhǔn)主要包含()、錯(cuò)誤返回率和精確度。
[A.]冗余度
[B.]返回率
[C.J可用性
[D.]一致性
【答案】B
81
下列不屬于數(shù)據(jù)轉(zhuǎn)換中適合對數(shù)轉(zhuǎn)換的數(shù)據(jù)是()?
【A.】部分正偏態(tài)數(shù)據(jù)
[B.]等比數(shù)據(jù)
[C.J等差數(shù)據(jù)
[D.]數(shù)值相差不大的數(shù)據(jù)
【答案】C
82
下列不屬于數(shù)據(jù)轉(zhuǎn)換中適合平方根轉(zhuǎn)換的數(shù)據(jù)是()?
[A.]泊松分布數(shù)據(jù)
[B.]輕度偏態(tài)數(shù)據(jù)
[CJ樣本方差和平均數(shù)呈現(xiàn)正相關(guān)的數(shù)據(jù)
[D.]數(shù)值相差不大的數(shù)據(jù)
【答案】D
83
噪聲是指測量數(shù)據(jù)中的O?
(A.1隨機(jī)誤差
[B.]均值
[C.J方差
[D.]極差
第19頁共74頁
【答案】A
84
下列不屬于地圖的構(gòu)成要素的是()?
[A.]圖形要素
【B.】價(jià)格要素
[C.1數(shù)學(xué)要素
[D.]輔助要素
【答案】B
85
下列不屬于數(shù)據(jù)平滑方法的是O?
[A.]移動(dòng)平均法
[B.]最大最小值標(biāo)準(zhǔn)化
[C.1指數(shù)平滑法
[D.]分箱平滑法
【答案】B
86
下列不屬于移動(dòng)平均法的是O?
[A.]一次移動(dòng)平均法
[B.1二次移動(dòng)平均法
【C.】混合移動(dòng)平均法
[D.]多次移動(dòng)平均法
【答案】C
87
下列屬于一次移動(dòng)平均法的適用范圍的是()?
[A.]水平變動(dòng)的時(shí)間序列數(shù)據(jù)
[B.]長期變動(dòng)趨勢的時(shí)間序列數(shù)據(jù)
[C.1循環(huán)性變動(dòng)的時(shí)間序列數(shù)據(jù)
[DJ季節(jié)變動(dòng)趨勢的時(shí)間序列數(shù)據(jù)
【答案】A
88
第20頁共74頁
下列屬于二次移動(dòng)平均法的適用范圍的是()?
[A.]水平變動(dòng)的時(shí)間序列數(shù)據(jù)
[B.]長期變動(dòng)趨勢的時(shí)間序列數(shù)據(jù)
[C.1循環(huán)性變動(dòng)的時(shí)間序列數(shù)據(jù)
[D.]直線上升或下降趨勢的時(shí)間序列數(shù)據(jù)
【答案】D
89
下列不屬于指數(shù)平滑法的適用范圍的是()?
[A.]穩(wěn)定變化態(tài)勢的時(shí)間序列數(shù)據(jù)
[B.]不穩(wěn)定變化的時(shí)間序列數(shù)據(jù)
[C.1規(guī)則變化的時(shí)間序列數(shù)據(jù)
(D.)直線上升或下降趨勢的時(shí)間序列數(shù)據(jù)
【答案】B
90
下列不屬于指數(shù)平滑法的適用范圍的是O?
[A.]近期趨勢預(yù)測
[B.]短期趨勢預(yù)測
[C.1中期趨勢預(yù)測
[D.]長期趨勢預(yù)測
【答案】D
91
下列不屬于分箱平滑法參照的是()?
[A.]箱內(nèi)數(shù)值的均值
[B.]箱內(nèi)數(shù)值的中值
[C.1箱內(nèi)數(shù)值的邊界值
[D.]箱內(nèi)數(shù)值的方差
【答案】D
92
數(shù)據(jù)規(guī)范化是將原來的度量值轉(zhuǎn)換為O?
[A.]無量綱的值
[B.]原來度量值的均值
第21頁共74頁
[C.1原來度量值的方差
(D.J原來度量值的極差
【答案】A
93
下列不屬于數(shù)據(jù)規(guī)范化的作用的是O?
[AJ加快學(xué)習(xí)速度
[B.]規(guī)范事物概念
[C.1避免單位的影響
[D.]呈現(xiàn)數(shù)據(jù)的集中程度
【答案】D
94
假定某屬性x的最小值、最大值分別為12000和98000,將屬性x映射到[0,口中,根據(jù)
最小最大規(guī)范化方法,x的值73600(設(shè)定值)將轉(zhuǎn)換為()?
[A.]0.716
[B.]0.616
[C.]0.516
[D.]0.816
【答案】A
95
Z分?jǐn)?shù)規(guī)范化方法依據(jù)的是原始數(shù)據(jù)的()?
[A.]均值和中位數(shù)
[B.]中位數(shù)和極差
[C.1極差和方差
[D.]均值和標(biāo)準(zhǔn)差
【答案】D
96
如果x的平均值和標(biāo)準(zhǔn)差分別為54000和16000o使用z分?jǐn)?shù)規(guī)范化方法,x的值73600
被轉(zhuǎn)換為()?
[A.]1.125
[B.]1.025
[C.11.225
[D.]1.325
第22頁共74頁
【答案】C
97
Z分?jǐn)?shù)規(guī)范化方法中對于離群點(diǎn),均值絕對偏差相比標(biāo)準(zhǔn)差()?
[A.]更有效
[B.]更平穩(wěn)
[C.J更精確
[D.]更魯棒
【答案】D
98
小數(shù)定標(biāo)規(guī)范化方法中,其小數(shù)點(diǎn)移動(dòng)的位數(shù)依賴于S?
[A.]最大絕對值
[B.]最小絕對值
[C.1均值絕對值
(D.)中位數(shù)絕對值
【答案】A
99
數(shù)據(jù)平滑方法主要有指數(shù)平滑法、移動(dòng)平均法和O?
[A.]統(tǒng)計(jì)法
[B.1最短距離法
[C.1分箱平滑法
[D.]聚類方法
【答案】C
100
數(shù)據(jù)規(guī)范方法主要有最小最大規(guī)范法、z分?jǐn)?shù)規(guī)范法和?)?
[A.]極差規(guī)范法
[B.]小數(shù)定標(biāo)規(guī)范法
[C.1模糊規(guī)范法
[D.]聚類方法
【答案】B
101
第23頁共74頁
下列不屬于數(shù)據(jù)約簡策略的是()?
[A.]特征約簡
[B.]樣本約簡
[C.J數(shù)值約簡
【DJ文本約簡
【答案】D
102
下列不屬于特征約簡的步驟的是()?
【A.】搜索過程
[B.]填補(bǔ)過程
[C.J評估過程
[D.]分類過程
【答案】B
103
【答案】B
104
系統(tǒng)抽樣又稱之為()?
[A.]隨機(jī)抽樣
[B.]等距抽樣
(C.J分層抽樣
[D.]類型抽樣
【答案】B
105
下列不屬于影響突出對比的可視化展現(xiàn)是()?
[A.]比例選擇
[B.]顏色使用
[C.J圖形形狀
[D.J圖形內(nèi)容
【答案】D
第24頁共74頁
106
下列不屬于檢驗(yàn)假設(shè)方法的是O?
[A.]提出假設(shè)
[B.]選擇統(tǒng)計(jì)量
[C.J修正統(tǒng)計(jì)量
[DJ根據(jù)顯著性水平進(jìn)行判斷
【答案】C
107
分層抽樣又稱之為O?
[A.]隨機(jī)抽樣
[B.]等距抽樣
[C.J系統(tǒng)抽樣
[D.]類型抽樣
【答案】D
108
數(shù)據(jù)立方體是一類多維矩陣,讓用戶從多個(gè)角度探索和分析數(shù)據(jù)集,通常是一次同時(shí)考慮
幾個(gè)維度()?
[A.]一個(gè)
兩個(gè)
[C.1三個(gè)
[D.]四個(gè)
【答案】C
109
三維的數(shù)據(jù)立方體看作是一組類似的互相疊加起來的()?
[A.]一維表格
[B.J二維表格
(C.J三維表格
[D.]四維表格
【答案】B
110
第25頁共74頁
【答案】C
111
維數(shù)災(zāi)難通常是指在涉及()計(jì)算的問題中,隨著維數(shù)的增加,計(jì)算量呈指數(shù)倍增長的一
種現(xiàn)象。
[A.]數(shù)字
[B.J文木
[C.J向量
[D.]矩陣
【答案】C
112
下列不屬于維數(shù)災(zāi)難問題的特點(diǎn)O?
[A.]計(jì)算量巨大
[B.]成本降低
[C.]結(jié)果不理想
[D.]無法反映數(shù)據(jù)的本質(zhì)特征
【答案】B
113
下列不屬于數(shù)據(jù)約簡的特點(diǎn)O?
[A.]計(jì)算量巨大
[B.]成本降低
[C.1較少存儲量
[D.]方便分類
【答案】A
114
下列不屬于數(shù)據(jù)約簡的分類基準(zhǔn)的是O?
[A.]約簡維數(shù)的大小
[B.1成本的大小
[C.J數(shù)據(jù)時(shí)序
[D.]有無監(jiān)督信息
【答案】B
第26頁共74頁
115
卜.列不屬于數(shù)據(jù)約簡中有無監(jiān)督信息分類的是O?
【AJ監(jiān)督式維數(shù)約簡
[B.]半監(jiān)督式維數(shù)約簡
[C1非監(jiān)督式維數(shù)約簡
【DJ混合式維數(shù)約簡
【答案】D
116
下列不屬于無參數(shù)值約簡技術(shù)的是()?
[A.]直方圖
(B.1聚類
[C.1選擇
[D.]線性回歸模型
【答案】D
117
下列不屬于信息孤島帶來的問題的是()?
[A.]數(shù)據(jù)不能共享
[B.]冗余數(shù)據(jù)
[C.1數(shù)據(jù)優(yōu)化
[D.1垃圾數(shù)據(jù)
【答案】C
118
數(shù)據(jù)集成最復(fù)雜和困難的任務(wù)是O?
[A.]數(shù)據(jù)插補(bǔ)
[B.]數(shù)據(jù)格式轉(zhuǎn)換
[C.1數(shù)據(jù)修改
[D.]冗余數(shù)據(jù)處理
【答案】B
119
下列不屬于數(shù)據(jù)集成的核心問題是O?
[A.]有效性
第27頁共74頁
[B.]異構(gòu)性
[C.l分布性
[D.]自治性
【答案】A
120
下列不屬于數(shù)據(jù)集成的構(gòu)成方式的是()?
[A.]聯(lián)邦數(shù)據(jù)庫集成模式
[B.1中間件集成模式
[C.1數(shù)據(jù)倉庫集成模式
[D.]地區(qū)數(shù)據(jù)庫集成模式
【答案】D
121
大數(shù)據(jù)需要分析的是O?
[A.]發(fā)展趨勢
[B.]發(fā)展現(xiàn)狀
(C.J發(fā)展模式
[D.]發(fā)展制度
【答案】A
122
大數(shù)據(jù)分析的核心是()?
[A.]數(shù)據(jù)收集
[B.]數(shù)據(jù)管理
[C.1數(shù)據(jù)挖掘
[D.]數(shù)據(jù)交易
【答案】C
123
下列不屬于數(shù)據(jù)挖掘的特點(diǎn)的是O?
[A.]數(shù)據(jù)量大
(B.]目標(biāo)清晰
[C.1處理不同類型的數(shù)據(jù)
[D.]結(jié)果不易解釋
【答案】B
第28頁共74頁
124
F列屬于數(shù)據(jù)分析的特點(diǎn)的是()?
[A.]數(shù)據(jù)量大
[B.]目標(biāo)不清晰
[CJ處理不同類型的數(shù)據(jù)
[D.]結(jié)果不防解釋
【答案】A
125
從分析的結(jié)果上看,大數(shù)據(jù)分析主要分為O?
[A.]探索性數(shù)據(jù)分析、證實(shí)性數(shù)據(jù)分析、定性數(shù)據(jù)分析
[B.]證實(shí)性數(shù)據(jù)分析、定性數(shù)據(jù)分析、離線數(shù)據(jù)分析
[C.1探索性數(shù)據(jù)分析、定性數(shù)據(jù)分析、離線數(shù)據(jù)分折
[D.]探索性數(shù)據(jù)分析、證實(shí)性數(shù)據(jù)分析、離線數(shù)據(jù)分析
【答案】A
126
從分析方式上看,大數(shù)據(jù)分析主要分為()?
[A.]在線數(shù)據(jù)分析、離線數(shù)據(jù)分析、交互式數(shù)據(jù)分析
[B.]交互式數(shù)據(jù)分析、在線數(shù)據(jù)分析、定性數(shù)據(jù)分析
[C.1定性數(shù)據(jù)分析、離線數(shù)據(jù)分析、交互式數(shù)據(jù)分析
[D.]離線數(shù)據(jù)分析、在線數(shù)據(jù)分析、定性數(shù)據(jù)分析
【答案】A
127
探索性數(shù)據(jù)分析是基于什么角度來說明數(shù)據(jù)分析方法的O?
[A.]數(shù)據(jù)本身
[B.]數(shù)據(jù)范圍
[C.1模型假設(shè)
[D.]統(tǒng)計(jì)推斷
【答案】A
128
第29頁共74頁
下列不屬于探索性數(shù)據(jù)分析的特點(diǎn)的是()?
[A.]分離出數(shù)據(jù)的模式
[B.]分離出數(shù)據(jù)的特點(diǎn)
[C.1揭示數(shù)據(jù)對模型的偏離
[D.]計(jì)算模型對數(shù)據(jù)的擬合度
【答案】D
129
下列不屬于探索性數(shù)據(jù)分析的內(nèi)容的是()?
[A.]檢查數(shù)據(jù)錯(cuò)誤
[B.]填補(bǔ)數(shù)據(jù)缺失
[C.1獲取數(shù)據(jù)分布特征
[D.]觀察數(shù)據(jù)規(guī)律
【答案】B
130
下列不屬于數(shù)據(jù)位置特征的是O?
[A.]均值
[B.]中位數(shù)
[C.3方差
[D.]四分位數(shù)
【答案】C
131
下列不屬于數(shù)據(jù)分散性特征的是O?
[A.]均值
[B.]極差
[CJ方差
[D.]變異系數(shù)
【答案】A
132
統(tǒng)計(jì)學(xué)是收集、分析、表述和O的科學(xué)?
[A.]整理數(shù)據(jù)
(B.1計(jì)算數(shù)據(jù)
【C.】填補(bǔ)數(shù)據(jù)
第30頁共74頁
[D.]解釋數(shù)據(jù)
【答案】D
133
統(tǒng)計(jì)的基礎(chǔ)是O?
[A.]統(tǒng)計(jì)工作
[B.]計(jì)算數(shù)據(jù)
[C.1統(tǒng)計(jì)數(shù)據(jù)
[D.]統(tǒng)計(jì)科學(xué)
【答案】A
134
下列不屬于模型的組成的是O?
[A.]目標(biāo)
[B.]數(shù)據(jù)
[C.1變量
[D.]關(guān)系
【答案】B
135
下列不屬于相關(guān)系數(shù)的是()?
[A.]簡單相關(guān)系數(shù)
[B.]復(fù)相關(guān)系數(shù)
[C.1典型相關(guān)系數(shù)
[D.]常態(tài)相關(guān)系數(shù)
【答案】D
136
下列不屬于相關(guān)分析的是O?
(A.1線性相關(guān)分析
[B.1復(fù)相關(guān)分析
[C.1偏相關(guān)分析
[D.]距離分析
【答案】B
第31頁共74頁
137
卜.列不屬于回歸分析的步驟的是O?
[A.]確定自變量與因變量
[B.]對變量進(jìn)行分類
[CJ根據(jù)變量進(jìn)行回歸建模
【》】模型檢驗(yàn)
【答案】B
138
下列不屬于回歸分析的類別的是()?
[A.]一元回歸分析
(B.1二元回歸分析
[C.1多元回歸分析
[D.]線性回歸分析
【答案】B
139
下列不屬于判別分析的類別的是O?
[A.]兩組判別法
[B.]多組判別法
[C.1逐步判別法
【D.】面積判別法
【答案】D
140
下列不屬于判別方法的是()?
[A.]最大似然法
[B.]最小二乘法
[C.1距離判別法
[D.]貝葉斯判別法
【答案】B
141
Z分?jǐn)?shù)規(guī)范化方法中,下列可以替換標(biāo)準(zhǔn)差的是()?
[A.]均值
第32頁共74頁
[B.]方差
[Cl極差
[D.]平均值絕對偏差
【答案】D
142
下列不屬于確定樣本子集大小的因素的是O?
[A.]計(jì)算成本
[B.]存儲要求
[C.1估計(jì)量的范圍
[D.]估計(jì)量的精度
【答案】C
二、判斷題
計(jì)算機(jī)科學(xué)是算法與算法變換的科學(xué)。()
[A.]V
[B.]x
【答案】A
計(jì)算機(jī)科學(xué)是算法與算法變換的科學(xué)。
2
數(shù)據(jù)科學(xué)是通過科學(xué)方法探索數(shù)據(jù),以獲得有價(jià)值的發(fā)現(xiàn)。()
[A.]V
[B.]x
【答案】A
數(shù)據(jù)科學(xué)是通過科學(xué)方法探索數(shù)據(jù),以獲得有價(jià)值的發(fā)現(xiàn)。
3
數(shù)據(jù)科學(xué)的發(fā)展不僅可以推動(dòng)學(xué)科的發(fā)展,而且能夠助推相關(guān)產(chǎn)業(yè)的發(fā)展與進(jìn)步。()
[A.]V
[B.lx
【答案】A
數(shù)據(jù)科學(xué)的發(fā)展不僅可以推動(dòng)數(shù)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、統(tǒng)計(jì)學(xué)、天體信息學(xué)、生物
信息學(xué)、計(jì)算社會(huì)學(xué)等學(xué)科的發(fā)展,而且能夠大力助推用關(guān)產(chǎn)業(yè)的發(fā)展與進(jìn)步。
4
第33頁共74頁
數(shù)據(jù)科學(xué)家不需要具備計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)的知識和應(yīng)用領(lǐng)域的行業(yè)經(jīng)驗(yàn)。()
[A.]V
[B.]x
【答案】B
數(shù)據(jù)科學(xué)家需要具備計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)的知識和應(yīng)用領(lǐng)域的行業(yè)經(jīng)驗(yàn)。
Cyber空間是指以計(jì)算機(jī)技術(shù)、現(xiàn)代通信網(wǎng)絡(luò)技術(shù)、虛擬現(xiàn)實(shí)技術(shù)等信息技術(shù)的綜合運(yùn)用
為基礎(chǔ),以知識和信息為內(nèi)容的新型空間。()
[A.]V
[B.]x
【答案】A
Cyber空間是指以計(jì)算機(jī)技術(shù)、現(xiàn)代通信網(wǎng)絡(luò)技術(shù)、虛擬現(xiàn)實(shí)技術(shù)等信息技術(shù)的綜合運(yùn)用
為基礎(chǔ),以知識和信息為內(nèi)容的新型空間。
數(shù)據(jù)能夠記錄人類的行為,包括工作、生活和社會(huì)的發(fā)展。()
[A.]V
[B.]x
【答案】A
數(shù)據(jù)能夠記錄人類的行為,包括工作、生活和社會(huì)的發(fā)展。
研究數(shù)據(jù)僅僅包括數(shù)據(jù)采集和數(shù)據(jù)分析。O
[A.]V
[B.]x
【答案】B
研究數(shù)據(jù)主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲和數(shù)據(jù)分析。
數(shù)據(jù)加工與傳統(tǒng)數(shù)據(jù)處理的不同之處在于,其更加強(qiáng)調(diào)數(shù)據(jù)處理中的增值過程。()
[A.]V
[B.]x
【答案】A
數(shù)據(jù)加工與傳統(tǒng)數(shù)據(jù)處理的不同之處在于,其更加強(qiáng)調(diào)數(shù)據(jù)處理中的增值過程。
大數(shù)據(jù)只來自互聯(lián)網(wǎng)世界,O
第34頁共74頁
[A.]V
[B.]X
【答案】B
大數(shù)據(jù)主要來自互聯(lián)網(wǎng)世界與物理世界。
10
數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。O
[AJJ
[B.]X
【答案】A
數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
11
網(wǎng)頁數(shù)據(jù)是一種半結(jié)構(gòu)化數(shù)據(jù)。O
[A.]V
[B.]X
【答案】A
網(wǎng)頁數(shù)據(jù)就是一種典型的半結(jié)構(gòu)化數(shù)據(jù)。
12
批量計(jì)算是一種在線計(jì)算,支持海量作業(yè)并發(fā)規(guī)模,系統(tǒng)自動(dòng)完成資源管理、作業(yè)調(diào)度和
數(shù)據(jù)加載,并按實(shí)際使用量計(jì)費(fèi)。O
[A.]V
[B.]X
【答案】B
批量計(jì)算是一種離線計(jì)算,
13
靜態(tài)數(shù)據(jù)是流式數(shù)據(jù)。O
[A.]V
[B.]X
【答案】B
靜態(tài)數(shù)據(jù)不是流式數(shù)據(jù)。
14
流式計(jì)算適用于無須先存儲,可以直接進(jìn)行數(shù)據(jù)計(jì)算,實(shí)時(shí)性要求很嚴(yán)格,但對數(shù)據(jù)的精
確度要求較寬松的應(yīng)用場景。O
[A.]V
[B.]X
第35頁共74頁
【答案】A
流式計(jì)算適用于無須先存儲,可以直接進(jìn)行數(shù)據(jù)計(jì)算,實(shí)時(shí)性要求很嚴(yán)格,但對數(shù)據(jù)的精
確度要求較寬松的應(yīng)用場景。
15
實(shí)時(shí)計(jì)算系統(tǒng)的設(shè)計(jì)需要考慮高延遲、高性能、分布式、可擴(kuò)展、高容錯(cuò)。O
[A.]V
[B1X
【答案】B
實(shí)時(shí)計(jì)算系統(tǒng)的設(shè)計(jì)需要考慮低延遲、高性能、分布式、可擴(kuò)展、高容錯(cuò)。
16
流式查詢主要有兩種方式,一種是指定查詢,另一種是即席查詢。()
[A.]V
[B.]X
【答案】A
流式查詢主要有兩種方式,一種是指定查詢,另一種是即席查詢。
17
流式數(shù)據(jù)的處理是批量處理。O
[A.]V
[B.]X
【答案】B
流式數(shù)據(jù)的處理也是連續(xù)處理,而不是批量處理。
18
流式計(jì)算不宜用持久穩(wěn)定關(guān)系建模,而適用瞬態(tài)數(shù)據(jù)流建模。()
[A.]V
[B.]X
【答案】A
流式計(jì)算不宜用持久稽定關(guān)系建模,而適用瞬態(tài)數(shù)據(jù)流建模。
19
為了更有效地處理數(shù)據(jù),應(yīng)該盡可能地限制靜態(tài)數(shù)據(jù)。O
[A.]V
[B.]X
【答案】A
為了有效地處理數(shù)據(jù),人們應(yīng)該盡可能地限制靜態(tài)數(shù)據(jù).
第36頁共74頁
20
大數(shù)據(jù)的無序性是指各數(shù)據(jù)流之間無序,而同一-數(shù)據(jù)流內(nèi)部各數(shù)據(jù)元素之間是有序的。O
[A.]V
[B.]X
【答案】B
大數(shù)據(jù)的無序性是指各數(shù)據(jù)流之間無序,而同一數(shù)據(jù)流內(nèi)部各數(shù)據(jù)元素之間也無序。
21
MapReduce由Map和Reduce兩個(gè)階段組成,用戶只需要編寫Map和Reduce兩個(gè)函數(shù)就可
以完成簡單的分布式程序的設(shè)計(jì)。()
[A.]V
[B.JX
【答案】A
MapReduce由Map和Reduce兩個(gè)階段組成,用戶只需要編寫Map和Reduce兩個(gè)函數(shù)就可
以完成簡單的分布式程序的設(shè)計(jì)。
22
Map相對獨(dú)立且并行運(yùn)行,對存儲系統(tǒng)中的文件按列處理,并產(chǎn)生鍵值對。()
[A.]V
[B.JX
【答案】B
Map相對獨(dú)立且并行運(yùn)行,對存儲系統(tǒng)中的文件按行處理,并產(chǎn)生鍵值對。
23
在Hadoop中,將每一次計(jì)算請求稱為一個(gè)作業(yè)。()
[A.]V
[B.]X
【答案】A
在Hadoop中,將每,次計(jì)算請求稱為?個(gè)作業(yè)。
24
與分布式文件系統(tǒng)相比,MapReduce框架可定制性強(qiáng)。1)
[A.]V
[B.]X
【答案】A
與分布式文件系統(tǒng)相比,MapReduce框架還有一個(gè)特點(diǎn)就是可定制性強(qiáng)。
25
第37頁共74頁
通常一個(gè)作業(yè)的輸入都是基于分布式文件系統(tǒng)的文件,而對于一個(gè)Map任務(wù)而言,它的輸
入是輸入文件的一個(gè)數(shù)據(jù)塊,或者是數(shù)據(jù)塊的一部分,也可跨越數(shù)據(jù)塊。O
[A.]V
[B.]X
【答案】B
通常一個(gè)作業(yè)的輸入都是基于分布式文件系統(tǒng)的文件,而對于一個(gè)Map任務(wù)而言,它的輸
入是輸入文件的一個(gè)數(shù)據(jù)塊,或者是數(shù)據(jù)塊的一部分,但通常不跨越數(shù)據(jù)塊。
26
Reduce任務(wù)與Map任務(wù)的最大不同是Map任務(wù)的文件都存儲于木地,而Reduce任務(wù)需要
到多處采集。()
[A.]V
[B.JX
【答案】A
Reduce任務(wù)與Map任務(wù)的最大不同是Map任務(wù)的文件都存儲于本地,而Reduce任務(wù)需要
到多處采集。
27
MapReduce模型適用場景的特點(diǎn)是任務(wù)可被分解成相互我系的子問題。()
[A.]V
[B.JX
【答案】B
MapReduce模型適用場景的特點(diǎn)是任務(wù)可被分解成相互獨(dú)立的子問題。
28
可視分析是一種獨(dú)立式的圖形用戶界面模型。()
[A.]V
[B.]X
【答案】B
可視分析是?種交互式的圖形用戶界面模型。
29
在單詞計(jì)數(shù)的Map過程中需要將文件進(jìn)行按列分割。。
[A.]V
[B.lX
【答案】B
在單詞計(jì)數(shù)的Map過程中需要將文件進(jìn)行按行分割。
30
第38頁共74頁
在單詞計(jì)數(shù)中,Reduce方法的輸入?yún)?shù)key為單個(gè)單詞,而value是由各Mapper類上對■應(yīng)
單詞的計(jì)數(shù)值所組成的列表,所以只要遍歷value并求和,即可得到某個(gè)單詞出現(xiàn)的總次
數(shù)。()
[A.]V
[B.]X
【答案】A
在單詞計(jì)數(shù)中,Reduce方法的輸入?yún)?shù)key為單個(gè)單詞,而value是由各Mapper類上對應(yīng)
單詞的計(jì)數(shù)值所組成的列表,所以只要遍歷value并求和,即可得到某個(gè)單詞出現(xiàn)的總次
數(shù).
31
WordCount完成的功能是統(tǒng)計(jì)輸入文件中的每個(gè)單詞出現(xiàn)的頻率()
[A.]V
[B.]X
【答案】B
WordCount完成的功能是統(tǒng)計(jì)輸入文件中的每個(gè)單詞出現(xiàn)的次數(shù)。
32
在MapReduce程序執(zhí)行過程中,用戶程序中的MapReduce類庫首先將輸入文檔進(jìn)行分割,
用戶也可以通過設(shè)置參數(shù)對其大小進(jìn)行控制()
[A.]V
[B.]X
【答案】A
在MapReduce程序執(zhí)行過程中,用戶程序中的M叩Reduce類庫首先將輸入文檔進(jìn)行分割,
用戶也可以通過設(shè)置參數(shù)對其大小進(jìn)行控制。
33
在MapReduce程序執(zhí)行過程中,由Master負(fù)責(zé)分配任務(wù),分配的原則是Master選擇空閑
的Worker并為其分配一個(gè)Map任務(wù)或一個(gè)Reduce任務(wù)()
[A.]V
[B.]X
【答案】A
在M叩Reduce程序執(zhí)行過程中,由Master負(fù)責(zé)分配任務(wù),分配的原則是Master選擇空閑
的Worker并為其分配一個(gè)M叩任務(wù)或一個(gè)Reduce任務(wù)。
34
網(wǎng)站外部數(shù)據(jù)主要包括互我網(wǎng)環(huán)境數(shù)據(jù)、競爭對手?jǐn)?shù)據(jù)、合作伙伴數(shù)據(jù)和用戶數(shù)據(jù)等。()
[A.]V
[B.]X
【答案】A
第39頁共74頁
網(wǎng)站外部數(shù)據(jù)主要包括互狹網(wǎng)環(huán)境數(shù)據(jù)、競爭對手?jǐn)?shù)據(jù)、合作伙伴數(shù)據(jù)和用戶數(shù)據(jù)等。
35
在MapReduce程序執(zhí)行過程中,Map和Reduce函數(shù)接攻的都是鍵值對。()
[A.]V
[B.]X
【答案】A
在MapReduce程序執(zhí)行過程中,Map和Reduce函數(shù)接收的都是鍵值對。
36
MapReduce模型通過將數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)將已完成的
工作和狀態(tài)更新,周期性地報(bào)告給Worker。()
[A.]V
[B.]X
【答案】B
MapReduce模型通過將數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的各節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)將已完成的
工作和狀態(tài)更新,周期性地報(bào)告給Master。
37
M叩Reduce的基本原理就是將大數(shù)據(jù)分成小塊逐個(gè)分析,最后將提取出來的數(shù)據(jù)匯總分析,
進(jìn)而獲得需要的結(jié)果。O
[A.]V
[B.]X
【答案】A
MapReduce的基本原理就是將大數(shù)據(jù)分成小塊逐個(gè)分析,最后將提取出來的數(shù)據(jù)匯總分析,
進(jìn)而獲得需要的結(jié)果。
38
MapReduce模型中,Map針對每一個(gè)輸入元素都要生成一個(gè)輸出元素,Reduce針對每■個(gè)
輸入列表都要生成一個(gè)輸出元素。()
[A.]V
[B.]X
【答案】A
MapReduce模型中,Map針對每一個(gè)輸入元素都要生成一個(gè)輸出元素,Reduce針對每一個(gè)
輸入列表都要生成一個(gè)輸出元素。
39
通常情況下如果集群的規(guī)模在百個(gè)節(jié)點(diǎn)以上,MapReduce的速度可以和節(jié)點(diǎn)的數(shù)目成正比。
()
第40頁共74頁
[A.]V
[B.]X
【答案】A
通常情況下如果集群的規(guī)模在百個(gè)節(jié)點(diǎn)以上,MapReduce的速度可以和節(jié)點(diǎn)的數(shù)kl成正比。
40
由于集群模式和單節(jié)點(diǎn)模式運(yùn)行Hadoop系統(tǒng)都需要使用SSH登錄,因此在安裝Hadoop系
統(tǒng)之前,首先需要安裝配置SSH協(xié)議。
[A.]V
[B.lX
【答案】A
由于集群模式和單節(jié)點(diǎn)模式運(yùn)行Hadoop系統(tǒng)都需要使用SSH登錄,因此在安裝Hadoop系
統(tǒng)之前,首先需要安裝配置SSH協(xié)議。
41
獲取的數(shù)據(jù)是指已被轉(zhuǎn)換為電信號的各種物理量,如溫度、水位、風(fēng)速、壓力等。O
[A.]V
[B.]X
【答案】A
獲取的數(shù)據(jù)是指已被轉(zhuǎn)換為電信號的各種物理量,如溫度、水位、風(fēng)速、壓力等。
42
大數(shù)據(jù)的獲取要避免重復(fù)數(shù)據(jù)。O
[A.]V
[B.]X
【答案】A
大數(shù)據(jù)的獲取要避免重復(fù)數(shù)據(jù)。
43
在互聯(lián)網(wǎng)營銷中,用戶反饋承擔(dān)的核心任務(wù)是為產(chǎn)品收集用戶輿情信息。()
[A.]V
[B.lX
【答案】A
在互聯(lián)網(wǎng)營銷中,用戶反饋承擔(dān)的核心任務(wù)是為產(chǎn)品收集用戶輿情信息。
44
圖像數(shù)字化是進(jìn)行數(shù)字圖像處理的前提。O
[A.]V
[B.]X
第41頁共74頁
【答案】A
圖像數(shù)字化是進(jìn)行數(shù)字圖像處理的前提。
45
圖像數(shù)字化是將連續(xù)色調(diào)的模擬圖像經(jīng)采樣量化后轉(zhuǎn)換成數(shù)字影像的過程。()
[A.]V
[B.]X
【答案】A
圖像數(shù)字化是將連續(xù)色調(diào)的模擬圖像經(jīng)采樣量化后轉(zhuǎn)換成數(shù)字影像的過程。
46
圖像信息獲取的方法只有掃描技術(shù)。O
[A.]V
[B.]X
【答案】B
圖像信息獲取的主要方法是掃描技術(shù),另一種方法是直接運(yùn)用數(shù)字?jǐn)z影技術(shù)。
47
圖形數(shù)字化是將圖形的連續(xù)模擬展轉(zhuǎn)換成離散的數(shù)字最的過程。()
[A.]V
[B.]X
【答案】A
圖形數(shù)字化是將圖形的連續(xù)模擬量轉(zhuǎn)換成離散的數(shù)字量的過程。
48
空間數(shù)據(jù)是一種用點(diǎn)、線、面以及實(shí)體等基本空間數(shù)據(jù)結(jié)構(gòu)來表示自然世界的數(shù)據(jù)。O
[A.]V
[B.]X
【答案】A
空間數(shù)據(jù)是一種用點(diǎn)、線、面以及實(shí)體等基本空間數(shù)據(jù)結(jié)構(gòu)來表示自然世界的數(shù)據(jù)。
49
空間數(shù)據(jù)的獲取不包括對多媒體數(shù)據(jù)進(jìn)行獲取。()
[A.]V
[B.]X
【答案】B
空間數(shù)據(jù)獲取的任務(wù)包括對地圖數(shù)據(jù)、野外實(shí)測數(shù)據(jù)、空間定位數(shù)據(jù)、攝影測量與遙感圖
像、多媒體數(shù)據(jù)等進(jìn)行獲取。
第42頁共74頁
50
網(wǎng)站內(nèi)部數(shù)據(jù)是網(wǎng)站最容易獲取的數(shù)據(jù),其通常存放在網(wǎng)站的文件系統(tǒng)或數(shù)據(jù)庫中,也是
與網(wǎng)站自身最為密切相關(guān)的數(shù)據(jù),是網(wǎng)站分析最常用的數(shù)據(jù)來源。()
[A.]V
[B.]X
【答案】A
網(wǎng)站內(nèi)部數(shù)據(jù)是網(wǎng)站最容易獲取的數(shù)據(jù),其通常存放在網(wǎng)站的文件系統(tǒng)或數(shù)據(jù)庫中,也是
與網(wǎng)站自身最為密切相關(guān)的數(shù)據(jù)?,是網(wǎng)站分析最常用的數(shù)據(jù)來源。
51
網(wǎng)站數(shù)據(jù)采集只是將網(wǎng)站上的結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中提取出來,并將其存儲到統(tǒng)一的本地?cái)?shù)
據(jù)文件中。O
[A.]V
[B.]X
【答案】B
網(wǎng)站數(shù)據(jù)采集是將網(wǎng)站上的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁中提取出來,
并將其存儲到統(tǒng)一的本地?cái)?shù)據(jù)文件中。
52
網(wǎng)絡(luò)爬蟲的過程主要分為獲取網(wǎng)頁、解析網(wǎng)頁和存儲數(shù)據(jù)三部分,其是按照一定的獲取網(wǎng)
頁規(guī)則,自動(dòng)地抓取互聯(lián)網(wǎng)數(shù)據(jù)的軟件。O
[A.]V
[B.]X
【答案】A
網(wǎng)絡(luò)爬蟲的過程主要分為獲取網(wǎng)頁、解析網(wǎng)頁和存儲數(shù)據(jù)三部分,其是按照一定的獲取網(wǎng)
頁規(guī)則,自動(dòng)地抓取互聯(lián)網(wǎng)數(shù)據(jù)的軟件。
53
網(wǎng)絡(luò)爬蟲可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等。O
[A.]V
[B.]X
【答案】A
網(wǎng)絡(luò)爬蟲可以分為通用網(wǎng)絡(luò)爬蟲、聚焦網(wǎng)絡(luò)爬蟲、增量式網(wǎng)絡(luò)爬蟲、深層網(wǎng)絡(luò)爬蟲等。
54
網(wǎng)絡(luò)爬蟲從一個(gè)或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程
中,不斷從當(dāng)前頁面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的停止條件為止。()
[A.]V
[B.]X
第43頁共74頁
【答案】A
網(wǎng)絡(luò)爬蟲從一個(gè)或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)貝的過程
中,不斷從當(dāng)前頁面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的停止條件為止。
55
通用網(wǎng)絡(luò)爬蟲又稱為全網(wǎng)爬蟲,其可將爬行對象從一些種子URL擴(kuò)充到整個(gè)Web,主要為
門戶站點(diǎn)搜索引擎和大型Web服務(wù)采集數(shù)據(jù)。()
[A.]J
[B.]X
【答案】A
通用網(wǎng)絡(luò)爬蟲又稱為全網(wǎng)爬蟲,其可將爬行對象從一些種子URL擴(kuò)充到整個(gè)Web,主要為
門戶站點(diǎn)搜索引擎和大型Web服務(wù)采集數(shù)據(jù)。
56
網(wǎng)頁的爬行策略可以分為深度優(yōu)先搜索策略、廣度優(yōu)先搜索策略、最佳優(yōu)先搜索策略和反
向鏈接數(shù)搜索策略,其中深度優(yōu)先搜索策略是最常使用的方法。<)
[A.]V
[B.]X
【答案】B
網(wǎng)頁的爬行策略可以分為深度優(yōu)先搜索策略、廣度優(yōu)先搜索策略、最佳優(yōu)先搜索策略和反
向鏈接數(shù)搜索策略,其中廣度優(yōu)先搜索策略和最佳優(yōu)先搜索策略是經(jīng)常使用的方法。
57
聚焦網(wǎng)絡(luò)爬蟲又稱為主題爬蟲,是面向特定主題的一種網(wǎng)絡(luò)爬蟲程序。O
[A.]V
[B.JX
【答案】A
聚焦網(wǎng)絡(luò)爬蟲又稱為主題爬蟲,是面向特定主題的一種網(wǎng)絡(luò)爬蟲程序。
58
聚焦網(wǎng)絡(luò)爬蟲與通用網(wǎng)絡(luò)爬蟲的區(qū)別之處在于聚焦網(wǎng)絡(luò)爬蟲在實(shí)施網(wǎng)頁抓取時(shí)要進(jìn)行主題
篩選,盡量保證只抓取與主題相關(guān)的網(wǎng)頁信息。O
[A.]V
[B.lX
【答案】A
聚焦網(wǎng)絡(luò)爬蟲與通用網(wǎng)絡(luò)爬蟲的區(qū)別之處在于聚焦網(wǎng)絡(luò)爬蟲在實(shí)施網(wǎng)頁抓取時(shí)要進(jìn)行主題
篩選,盡量保證只抓取與主題相關(guān)的網(wǎng)頁信息
59
第44頁共74頁
網(wǎng)頁分析算法可以歸納為基于網(wǎng)絡(luò)拓?fù)?、基于網(wǎng)頁內(nèi)容和基于用戶訪問行為三種類型。()
[A.]V
[B.]X
【答案】A
網(wǎng)頁分析算法可以歸納為基于網(wǎng)絡(luò)拓?fù)洹⒒诰W(wǎng)頁內(nèi)容和基于用戶訪問行為三種類型。
60
網(wǎng)絡(luò)拓補(bǔ)分析算法是基于網(wǎng)頁之間的鏈接,通過已知的網(wǎng)頁或數(shù)據(jù)對與其有直接或間接鏈
接關(guān)系的對象作出評價(jià)的算法,其又分為網(wǎng)頁粒度、網(wǎng)站粒度兩種算法。()
[A.]V
[B.]X
【答案】B
網(wǎng)絡(luò)拓補(bǔ)分析算法是基于網(wǎng)頁之間的鏈接,通過已知的網(wǎng)頁或數(shù)據(jù)對與其有直接或間接鏈
接關(guān)系的對象作出評價(jià)的算法,其又分為網(wǎng)頁粒度、網(wǎng)站粒度以及網(wǎng)頁塊粒度三種算法。
G1
從應(yīng)用的構(gòu)建架構(gòu)角度出發(fā),我們可以將數(shù)據(jù)庫歸納為OldSQL數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫和
NewSQL數(shù)據(jù)庫。()
[A.]V
[B.JX
【答案】A
從應(yīng)用的構(gòu)建架構(gòu)角度出發(fā),我們可以將數(shù)據(jù)庫歸納為OldSQL數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫和
NewSQL數(shù)據(jù)庫。
62
OldSQL數(shù)據(jù)庫是指傳統(tǒng)的關(guān)系數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫是指非結(jié)構(gòu)化數(shù)據(jù)庫,而NewSQL數(shù)
據(jù)庫是介于OldSQL數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫兩者之間的數(shù)據(jù)庫。()
[A.]V
[B.]X
【答案】A
OldSQL數(shù)據(jù)庫是指傳統(tǒng)的關(guān)系數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫是指非結(jié)構(gòu)化數(shù)據(jù)庫,而NewSQL數(shù)
據(jù)庫是介于OldSQL數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫兩者之間的數(shù)據(jù)庫。
63
OldSQL數(shù)據(jù)庫適用于數(shù)據(jù)分析應(yīng)用,NewSQL數(shù)據(jù)庫適用于事務(wù)處理應(yīng)用,NoSQL數(shù)據(jù)庫
適用于互聯(lián)網(wǎng)應(yīng)用。()
[A.]V
[B.]X
【答案】B
第45頁共74頁
OldSQL數(shù)據(jù)庫適用于事務(wù)處理應(yīng)用,NewSQL數(shù)據(jù)庫適用于數(shù)據(jù)分析應(yīng)用,NoSQL數(shù)據(jù)庫
適用于互聯(lián)網(wǎng)應(yīng)用。
64
大數(shù)據(jù)可視分析通過交互可視界面來進(jìn)行分析、推理和決策,可視分析與各個(gè)領(lǐng)域的數(shù)據(jù)
形態(tài)、大小及其應(yīng)用密切相關(guān)。O
[A.]V
[B1X
【答案】A
大數(shù)據(jù)可視分析通過交互可視界面來進(jìn)行分析、推理和決策,可視分析與各個(gè)領(lǐng)域的數(shù)據(jù)
形態(tài)、大小及其應(yīng)用密切相關(guān)。
65
NoSQL主要指非關(guān)系型、分布式、不提供ACID特性的數(shù)據(jù)庫設(shè)計(jì)模式。()
[A.]V
[B.]X
【答案】A
NoSQL主要指非關(guān)系型、分布式、不提供ACID特性的數(shù)據(jù)庫設(shè)計(jì)模式。
66
NoSQL數(shù)據(jù)庫代表了一系列的、不同類型的相互關(guān)聯(lián)的數(shù)據(jù)存儲與處理的技術(shù)的集合。()
[A.]V
[B.]X
【答案】A
NoSQL數(shù)據(jù)庫代表了一系列的、不同類型的相互關(guān)聯(lián)的數(shù)據(jù)存儲與處理的技術(shù)的集合。
67
NoSQL數(shù)據(jù)庫與SQL數(shù)據(jù)庫顯著的區(qū)別是NoSQL數(shù)據(jù)庫不使用SQL作為查詢語言,其數(shù)據(jù)
存儲不使用固定的表格模式,具有橫向可擴(kuò)展性的特征。()
[A.]V
[B.]X
【答案】A
NoSQL數(shù)據(jù)庫與SQL數(shù)據(jù)庫顯著的區(qū)別是NoSQL數(shù)據(jù)庫不使用SQL作為查詢語言,其數(shù)據(jù)
存儲不使用固定的表格模式,具有橫向可擴(kuò)展性的特征.
68
NewSQL數(shù)據(jù)庫是指各種新型的可擴(kuò)展/高性能數(shù)據(jù)庫,這類數(shù)據(jù)庫不僅具有NoSQL數(shù)據(jù)
庫對海量數(shù)據(jù)的存儲管理能力,還保持了傳統(tǒng)數(shù)據(jù)庫的AQD和SQL等特性。()
[A.]V
第46頁共74頁
[B.]X
【答案】A
NewSQL數(shù)據(jù)庫是指各種新型的可擴(kuò)展/高性能數(shù)據(jù)庫,這類數(shù)據(jù)庫不僅具有NoSQL數(shù)據(jù)
庫對海量數(shù)據(jù)的存儲管理能力,還保持了傳統(tǒng)數(shù)據(jù)庫的ACID和SQL等特性。
69
在大數(shù)據(jù)抽取之前,無需清楚數(shù)據(jù)源的類型和數(shù)據(jù)的類型,可直接抽取。()
[A.]J
[B.]X
【答案】B
在大數(shù)據(jù)抽取之前,需要清楚數(shù)據(jù)源的類型和數(shù)據(jù)的類型。
70
增量數(shù)據(jù)抽取機(jī)制能夠?qū)I(yè)務(wù)系統(tǒng)中的變化數(shù)據(jù)按一定的頻率準(zhǔn)確地捕獲到,同時(shí)不能對
業(yè)務(wù)系統(tǒng)造成太大的壓力,也不能影響現(xiàn)有業(yè)務(wù)。相對全量數(shù)據(jù)抽取,增量數(shù)據(jù)抽取的設(shè)
計(jì)更簡單。()
[A.]V
[B.]X
【答案】B
增錄數(shù)據(jù)抽取機(jī)制能夠?qū)I(yè)務(wù)系統(tǒng)中的變化數(shù)據(jù)按一定的頻率準(zhǔn)確地捕獲到,同時(shí)不能對
業(yè)務(wù)系統(tǒng)造成太大的壓力,也不能影響現(xiàn)有業(yè)務(wù)。相對全量數(shù)據(jù)抽取,增量數(shù)據(jù)抽取的設(shè)
計(jì)更復(fù):雜。
71
時(shí)間戳是能表示一份數(shù)據(jù)在某個(gè)特定時(shí)間之前已經(jīng)存在的、完整的、可驗(yàn)證的一個(gè)數(shù)據(jù),
其通常是一個(gè)字符序列,唯一標(biāo)識某一刻的時(shí)間。()
[A.]V
[B.]X
【答案】A
時(shí)間戳是能表示?份數(shù)據(jù)在某個(gè)特定時(shí)間之前已經(jīng)存在的、完整的、可驗(yàn)證的?個(gè)數(shù)據(jù),
其通常是一個(gè)字符序列,唯一標(biāo)識某一刻的時(shí)間。
72
使用基于時(shí)間戳的增最數(shù)據(jù)抽取方式進(jìn)行數(shù)據(jù)抽取時(shí),系統(tǒng)通過比較上次抽取時(shí)間與時(shí)間
戳字段的值來決定抽取的數(shù)據(jù)。O
[A.]V
[B.]X
【答案】A
使用基于時(shí)間戳的增量數(shù)據(jù)抽取方式進(jìn)行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年山東省青島市嶗山區(qū)中考二模地理試題及答案
- 2025年中國方形鏈條市場調(diào)查研究報(bào)告
- 2025年中國數(shù)控螺紋鋼軋輥月牙槽銑床市場調(diào)查研究報(bào)告
- 新疆哈密石油高中2025屆高三第二次調(diào)查研究考試化學(xué)試題含解析
- 小兒維斯科特-奧爾德里奇綜合征預(yù)防和措施課件
- 肇慶市實(shí)驗(yàn)中學(xué)高中歷史一:第課世界多極化趨勢教案
- 新疆能源職業(yè)技術(shù)學(xué)院《高級細(xì)胞生物學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025-2030年中國PVAC乳液境外融資報(bào)告
- 新疆職業(yè)大學(xué)《Hadoop綜合實(shí)訓(xùn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 邢臺市臨西縣2025屆三下數(shù)學(xué)期末達(dá)標(biāo)檢測模擬試題含解析
- 空調(diào)冷卻冷凍水管道系統(tǒng)詳細(xì)的施工方案設(shè)計(jì)
- 兒童超聲心動(dòng)圖操作指南與標(biāo)準(zhǔn)課件
- 安全運(yùn)輸醫(yī)療垃圾的要點(diǎn)
- 關(guān)于員工心理健康的重要性
- 刑事案件模擬法庭劇本完整版五篇
- 2022年高考全國I卷數(shù)學(xué)高考真題(原卷版)
- 《商務(wù)英語閱讀》教學(xué)大綱
- 會(huì)計(jì)學(xué)畢業(yè)論文8000字-會(huì)計(jì)學(xué)論文范文8000字
- 小學(xué)教育畢業(yè)論文6000字范文
- 《愛心樹》-經(jīng)典繪本省名師優(yōu)質(zhì)課賽課獲獎(jiǎng)?wù)n件市賽課一等獎(jiǎng)?wù)n件
- 初級家政服務(wù)員培訓(xùn)烹飪篇課件
評論
0/150
提交評論