大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

上傳人：文*** IP屬地：河北上傳時(shí)間：2024-10-27 格式：PDF 頁數(shù)：100 大小：12.56MB 積分：12 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第2頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第3頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第4頁

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）_第5頁

已閱讀5頁，還剩95頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)

一、單選題

1.以下哪些分類方法可以較好地避免樣本的不平衡問題？

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案：A

2.0算法是最廣泛使用的聚類算法,算法簡(jiǎn)單,易于理解和操作。

Axgglomerative

B、C.URE

C、K-means

D、k-中心點(diǎn)算法

答案：C

3.貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。

A、極大似然概率

B、先驗(yàn)概率

C、邊際概率

D、后驗(yàn)概率

答案：D

4.回歸分析的第一步是()

A、確定解釋量和被解釋變量

B、確定回歸模型

C、建立回歸方程

D、進(jìn)行檢驗(yàn)

答案：A

5.當(dāng)所有觀測(cè)值都落在回歸直線上，則這兩個(gè)變量之間的相關(guān)系數(shù)為0

A、1

B、-1

C、+1或7

D、0

答案：C

6.()是進(jìn)行項(xiàng)目投資效益評(píng)價(jià)的最終依據(jù)。

A、現(xiàn)金流量

B、盈虧平衡點(diǎn)

C、凈現(xiàn)金流量

D、現(xiàn)金流入量

答案：C

7.被廣泛用于購物籃分析的是()。

A、關(guān)聯(lián)分析；

B、分類和預(yù)測(cè)

C、聚類分析

D、演變分析

答案：A

8.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法？()

A、變量代換

B、離散化

C、聚集

D、估計(jì)遺漏值

答案：D

9.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()

A、支持度

B、置信度

C、滿意度

D、提升度

答案：C

10.NoSQL含義是指0

A、NO!SQL;

B、NomberSQL;

C、NotOnIySQL

D、NOLLSQL

答案：C

11.個(gè)人信息的收集、處理和利用應(yīng)當(dāng)遵循()的原則，不得違反法律、法規(guī)的規(guī)定

和雙方的約定收集、處理和利用個(gè)人信息。()

A、正規(guī)、合法、必要

B、合法、正當(dāng)、必要

C、合法、合規(guī)、正當(dāng)

D、合法、合理、合規(guī)

答案：B

12.Tableau能夠?qū)?shù)據(jù)進(jìn)行處理包括()。

A、將多個(gè)數(shù)據(jù)源數(shù)據(jù)拼接為一個(gè)寬表；

B、修改、刪除、新增數(shù)據(jù)行；

C、對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換、重命名、格式修改；

D、對(duì)數(shù)據(jù)進(jìn)行計(jì)算、合并生成新的數(shù)據(jù)列

答案：A

13.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉庫的部分特征和OLTP系

統(tǒng)的部分特征。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案：C

14.RFM方法中的F說明客戶的0

A、興趣度

B、粘性

C、當(dāng)前價(jià)值

D、未來價(jià)值

答案：A

15.關(guān)于主成分?jǐn)?shù)目的選取,正確的是()

A、保留多少個(gè)主成分取決于累計(jì)方差在方差總和中所占百分比

B、一般選擇50%以上

C、選擇前兩個(gè)就可以

D、選擇的數(shù)目和變量的個(gè)數(shù)一致

答案:A

16.下列關(guān)于數(shù)據(jù)重組的說法中，錯(cuò)誤的是0

A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集

B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒

C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成

D、數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新

答案：A

17.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()

A、CREATESCHEMA

B、CREATETABLE

C、CREATEVIEW

D、CREATEDATABASE

答案：D

18.當(dāng)時(shí)間序列數(shù)據(jù)點(diǎn)的一階差分近似為一常數(shù),可配合以下哪種預(yù)測(cè)模型()

A、直線

B、二次拋物線

C、三次拋物線

D、指數(shù)曲線

答案：A

19.對(duì)于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()

A、數(shù)據(jù)收集

B、數(shù)據(jù)存儲(chǔ)

C、數(shù)據(jù)分析

D、數(shù)據(jù)再利用

答案：D

20.線性回歸算法尋找()與預(yù)測(cè)目標(biāo)之間的線性關(guān)系。

A、屬性

B、根因

C、表象

答案：A

21.下面不屬于明細(xì)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)的是()。

A、接入率；

B、自動(dòng)采集率

C、及時(shí)率

D、完整率

答案：B

22.資金的時(shí)間價(jià)值是()

A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額

B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額

C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額

D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額

答案：B

23.以下哪種方法不屬于于監(jiān)督學(xué)習(xí)模型()

A、決策樹

B、線性回歸

C、關(guān)聯(lián)分析

D、判別分析

答案：C

24.在多元回歸模型的檢驗(yàn)中，目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性

水平上是否存在線性相關(guān)關(guān)系的檢驗(yàn)是()

A\r檢驗(yàn)

B、t檢驗(yàn)

C\f檢驗(yàn)

D、DW檢驗(yàn)

答案：B

25.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說法正確的是()

A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn)，或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí)，混

合模型也能很好地處理。

B、混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布。

C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。

D、混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問題。

答案：B

26.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()

A、建立數(shù)據(jù)科學(xué)

B、完成數(shù)據(jù)應(yīng)用

C、配備數(shù)據(jù)硬件

D、吸納數(shù)據(jù)人才

答案：B

27.下面關(guān)于因子分析的說法正確的是()

A、因子分析就是主成分分析

B、因子之間可相關(guān)也可不相關(guān)

C、因子受量綱的影響

D、可以對(duì)因子進(jìn)行旋轉(zhuǎn)，使其意義更明顯

答案：D

28.快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開發(fā)專門的MapReduce應(yīng)用，十分適合

數(shù)據(jù)倉庫的統(tǒng)計(jì)分析的是0。

AxMap;

B、Reduce

C、H.ive

D、SQL語句

答案：D

29.企業(yè)要建立預(yù)測(cè)模型,需準(zhǔn)備建模數(shù)據(jù)集，以下四條描述建模數(shù)據(jù)集正確的是

A、數(shù)據(jù)越多越好

B、盡可能多的適合的數(shù)據(jù)

C、數(shù)據(jù)越少越好

D、以上三條都不正確

答案：B

30.以下哪個(gè)類型的變量在作預(yù)測(cè)客戶流失的模型中最有解釋力度？

A、人口基本數(shù)據(jù)，比如年齡和性別

B、基本社會(huì)狀態(tài)數(shù)據(jù)，比如收入和職業(yè)

C、業(yè)務(wù)數(shù)據(jù),比如消費(fèi)頻次

D、業(yè)務(wù)數(shù)據(jù)的衍生變量，比如最近3個(gè)月消費(fèi)頻次的變化情況

答案：D

31.將復(fù)雜的地址簡(jiǎn)化成北、中、南、東四區(qū)，是在進(jìn)行？

A、數(shù)據(jù)正規(guī)化

B、數(shù)據(jù)一般化

C、數(shù)據(jù)離散化

D、數(shù)據(jù)整合

答案：B

32.Hadoop是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺(tái)，是Appach的一個(gè)用（）

語言實(shí)現(xiàn)開源軟件框架。

A、java

B\C.++

C、R語言

答案：A

33.大數(shù)據(jù)特征錯(cuò)誤的是()。

A、容量大；

B、類型多

C、價(jià)值高

D、系統(tǒng)多

答案：D

34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻

繁項(xiàng)集的算法,利用()搜索的方法挖掘頻繁項(xiàng)集。

A、逐層

B\逐級(jí)

C、自底向上

D、自上而下

答案：A

35.分類算法以()定理為基礎(chǔ),采用概率方法對(duì)數(shù)據(jù)進(jìn)行建模

A、決策樹

B、K-最鄰近

C、SVM

D、貝葉斯

答案：D

36.自然界中某種事物發(fā)生時(shí)其他事物也會(huì)發(fā)生,則這種聯(lián)系稱之為()o

A、連接

B、聯(lián)絡(luò)

C、關(guān)聯(lián)

D、聯(lián)系

答案：C

37.源業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心的方式主要有:JDBCESB和()。

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案：C

38.下列哪個(gè)不屬于個(gè)人信息影響評(píng)估原則()

A、個(gè)人信息的處理目的、處理方式等是否合法、正當(dāng)、必要

B、對(duì)個(gè)人的影響及風(fēng)險(xiǎn)程度

C、誰主管誰負(fù)責(zé)

D、所采取的安全保護(hù)措施是否合法、有效并與風(fēng)險(xiǎn)程度相適應(yīng)。

答案：C

39.以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的0

A、冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響

B、子樹可能在決策樹中重復(fù)多次

C、決策樹算法對(duì)于噪聲的干擾非常敏感

D、尋找最佳決策樹是NP完全問題

答案：C

40.Hadoop框架中兩大核心是：（）和MapReducE

A、H.CFS;

B、H.DFS

C、H.EFS

D、H.FFS

答案：B

41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律,的數(shù)據(jù)探索方法是

A、匯總統(tǒng)計(jì)法

B、概率統(tǒng)計(jì)法

C、可視化法

答案：C

42.矩估計(jì)的基本原理是0

A、用樣本矩估計(jì)總體矩

B、使得似然函數(shù)達(dá)到最大

C、使得似然函數(shù)達(dá)到最小

D、小概率事件在一次試驗(yàn)中是不可能發(fā)生的

答案：A

43.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識(shí)別方法包括業(yè)務(wù)判別法、（）、箱線圖判別

法、統(tǒng)計(jì)判別法

A、聚類判別法；

B、回歸判別法

C、抽樣判別法

答案：A

44.算法的核心思想是()逐層構(gòu)造一個(gè)樹。

A、自上而下

B、自下而上

C、自左向右

D、自右向左

答案：A

45.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

答案：D

46.什么是KDD?()

A、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)

B、領(lǐng)域知識(shí)發(fā)現(xiàn)

C、文檔知識(shí)發(fā)現(xiàn)

D、動(dòng)態(tài)知識(shí)發(fā)現(xiàn)

答案：A

47.某家長為了使孩子在第3-6年上大學(xué)的4年中，每年

年初得到10000元助學(xué)基金,他應(yīng)在2年前在銀行存入多少錢？（年利率按5%計(jì)算）

A、33771

B、30291

C、32163

D、45256

答案：A

48.關(guān)于K均值和DBSCAN的比較，以下說法不正確的是0。

A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類

所有對(duì)象

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會(huì)

合并有重疊的簇

答案：A

49.SQL查詢語句中HAVING子句的作用是0

A、指出分組查詢的范圍

B、指出分組查詢的值

C、指出分組查詢的條件

D、指出分組查詢的內(nèi)容

答案：C

50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案：C

51.JS0N中的中括號(hào)一般來表示()。

A、數(shù)組；

B、標(biāo)點(diǎn)符號(hào)

C、對(duì)象

D、注釋

答案：C

52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。

A、線上

B、線下

C、實(shí)時(shí)

D、歷史

答案：D

53.Tableau在處理離線地圖時(shí),需要將標(biāo)記設(shè)置為()。

A、路徑；

B、區(qū)域

C、邊形

D、已填充地圖

答案：A

54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯(cuò)誤的有()

A、神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒

B、可以處理冗余特征

C、訓(xùn)練ANN是一個(gè)很耗時(shí)的過程

D、至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)

答案：A

55.美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明

了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

答案：B

56.當(dāng)時(shí)間序列的環(huán)比增長速度大體相同時(shí),適宜擬合()

A、指數(shù)曲線

B、拋物線

C、直線

D、對(duì)數(shù)曲線

答案：A

57.將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)指標(biāo)的一種統(tǒng)計(jì)分析方法是()o

A、數(shù)據(jù)預(yù)處理；

B、數(shù)據(jù)降維

C、主成分分析

D、假設(shè)檢驗(yàn)

答案：C

58.設(shè)X={1,213)是頻繁項(xiàng)集,則可由X可產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。

A、3

B、4

C、5

D、6

答案：D

59.當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理()

A、直接使用該變量

B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量

C、使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)

D、直接刪除該變量

答案：B

60.大數(shù)據(jù)分析挖掘流程正確的是()。

A、業(yè)務(wù)理解一數(shù)據(jù)理解T數(shù)據(jù)準(zhǔn)備T建立模型一模型評(píng)估；

B、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T建立模型T模型評(píng)估；

C、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T模型評(píng)估T建立模型；

D、業(yè)務(wù)理解-?數(shù)據(jù)準(zhǔn)備-?模型評(píng)估T數(shù)據(jù)理解T建立模型

答案：A

61.()是統(tǒng)計(jì)學(xué)的基礎(chǔ),是統(tǒng)計(jì)學(xué)里面最重要的概率分布

A、正態(tài)分布；

B、靜態(tài)分布

C、動(dòng)態(tài)分布

D、穩(wěn)態(tài)分布

答案：A

62.因子分析的主要作用有()

A、對(duì)變量進(jìn)行降維

B、對(duì)變量進(jìn)行判別

C、對(duì)變量進(jìn)行聚類

D、以上都不對(duì)

答案：A

63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案：D

64.給定歷史時(shí)間數(shù)據(jù),通過擬合時(shí)序模型,分析研究時(shí)序數(shù)據(jù)的發(fā)展變化規(guī)律,

得出觀測(cè)數(shù)據(jù)的歷史統(tǒng)計(jì)特征再據(jù)此進(jìn)行外推預(yù)測(cè)目標(biāo)的分析方法是()。

A、聚類;

B、回歸

C、時(shí)間序列

D、匯總統(tǒng)計(jì)

答案：C

65.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。

A、統(tǒng)計(jì)報(bào)表

B、網(wǎng)絡(luò)爬蟲

C、API接口

D、傳感器

答案：D

66.假設(shè)檢驗(yàn)中顯著性水平是：)

A、推斷時(shí)犯取偽錯(cuò)誤的概率

B、推斷時(shí)取偽棄真的概率

C、正確推斷的概率

D、是推斷的可信度

答案：B

67.以下哪些算法是分類算法。

A、DBSCAN

B、C4.5

C、K-Mean

D、EM

答案：B

68.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯(cuò)誤的是0。

A、大數(shù)據(jù)起源互聯(lián)網(wǎng)，目前處于成熟期；

B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù)；

C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地；

D、互聯(lián)網(wǎng)上形成了多種相對(duì)成熟的應(yīng)用模式。

答案：A

69.下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說法中,錯(cuò)誤的是()

A、1I<B<1MB<1GB

B、基本單位是字節(jié)(Byte)

C、一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間

D、一個(gè)字節(jié)能夠容納一個(gè)英文字符

答案：C

70.當(dāng)置信水平一定時(shí),置信區(qū)間的寬度()

A、隨著樣本量的增大而減小

B、隨著樣本量的增大而增大

C、與樣本量的大小無關(guān)

D、先隨著樣本量的增大而減小，到一定程度后會(huì)隨著樣本

量的增大而增大。

答案：A

71.倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓(xùn)練順序?yàn)楹危?A:調(diào)整權(quán)重;B:計(jì)算誤差值;

C:利用隨機(jī)的權(quán)重產(chǎn)生輸出的結(jié)果)

AvBCA

B、CAB

C、BAC

D、CBA

答案：D

72.個(gè)人信息保護(hù)影響評(píng)估報(bào)告和處理情況記錄應(yīng)當(dāng)至少保存()年。

A、—

B、+

C、五

D、三

答案：D

73.資金的時(shí)間價(jià)值是()

A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額

B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額

C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額

D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額

答案：B

74.有一條關(guān)聯(lián)規(guī)則為AT

B,此規(guī)則的信心水平(confidence)為60%,則代表()

A、買B商品的顧客中，有60%的顧客會(huì)同時(shí)購買A

B、同時(shí)購買

A,B兩商品的顧客，占所有顧客的60%

C、買A商品的顧客中，有60%的顧客會(huì)同時(shí)購買B

D、兩商品

A.B在交易數(shù)據(jù)庫中同時(shí)被購買的機(jī)率為60%

答案：C

75.有一組數(shù)據(jù)其均值是20,對(duì)其中的每一個(gè)數(shù)據(jù)都加上

10.那么得到的這組新數(shù)據(jù)的均值是0。

A、20

B、10

C、15

D、30

答案：D

76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是0。

A、藍(lán)牙；

B、云計(jì)算

C、Wi-Fi

D、博弈論

答案：B

77.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展強(qiáng)、數(shù)據(jù)挖掘能力

強(qiáng)等特點(diǎn)的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案：D

78.用于分類與回歸應(yīng)用的主要算法有：（）

AxApriori算法、HotSpot算法

B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

C、K均值法、S0M神經(jīng)網(wǎng)絡(luò)

D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

答案：D

79.（）提供的支撐技術(shù)，有效解決了大數(shù)據(jù)分析、研發(fā)的問題，比如虛擬化技術(shù)、

并行計(jì)算、海量存儲(chǔ)和海量管理等。

A、點(diǎn)計(jì)算

B、線計(jì)算

C、云計(jì)算

D、面計(jì)算

答案：C

80.描述一組對(duì)稱（或正態(tài)）分布數(shù)據(jù)的離散程度時(shí),最適宜選擇的指標(biāo)是0

A、極差

B、標(biāo)準(zhǔn)差

C、均值

D、變異系數(shù)

答案：B

81.考慮下面的頻繁3-項(xiàng)集的集合:（1.213},{1,2,

4},[1,3,4},{1,3,5},{2,3.4},[2,3,5},

{3.4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),若采用合并策略,則由候選產(chǎn)生過程得到4-項(xiàng)

集不包含()

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,45

答案：C

82.相關(guān)分析與回歸分析的一個(gè)重要區(qū)別是()

A、前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動(dòng)關(guān)系,并用方程式

表示

B、前者研究變量之間的變動(dòng)關(guān)系,后者研究變量間關(guān)系的密切程度

C、兩者都研究變量間的變動(dòng)關(guān)系

D、兩者都不研究變量間的變動(dòng)關(guān)系

答案：A

83.SQL語句中刪除表的命令是()

A、DROPTABLE

B、DELETETABLE

C、ERASETABLE

D、DELETEDBF

答案：A

84.已知事件A的概率P(A)=0.6,U為必然事件，則P(A+U)=1,P(AU)二

A、0.4

B、0.6

C、0

D、1

答案：B

85.邁克爾?波特的“五力模型”中，五種競(jìng)爭(zhēng)力量中不包括0

A、新進(jìn)入者

B、供應(yīng)商議價(jià)能力

C、其他利益相關(guān)者力量

D、行業(yè)中現(xiàn)有競(jìng)爭(zhēng)者

答案：C

86.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下：5,10,11,13.

15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)

方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子？()

A、第1個(gè)

B、第2個(gè)

C、第3個(gè)

D、第4個(gè)

答案：A

87.()是研究一種或者多種因素的變化對(duì)試驗(yàn)結(jié)果的觀測(cè)值是否有顯著影響的統(tǒng)

計(jì)方法。

A、因子分析；

B、數(shù)據(jù)降維

C、方差分析

D、假設(shè)檢驗(yàn)

答案：C

88.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購買尿布,這種屬

于數(shù)據(jù)挖掘的哪類問題？()

A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B、聚類

C、分類

D、自然語言處理

答案：A

89.以下哪個(gè)指標(biāo)不能用于線性回歸中的模型比較()

A、R方

B、調(diào)整R方

C、AIC

D、BIG

答案：A

90.下面關(guān)于聚類分析說法錯(cuò)誤的是0

A、一定存在一個(gè)最優(yōu)的分類

B、聚類分析是無監(jiān)督學(xué)習(xí)

C、聚類分析可以用于判斷異常值

D、聚類分析即:物以類聚，人以群分

答案：A

91.分類變量使用以下哪個(gè)統(tǒng)計(jì)量進(jìn)行缺失值填補(bǔ)較合適

A、均值

B、最大值

C、眾數(shù)

D、中位數(shù)

答案：C

92.若數(shù)據(jù)量較大,下面哪種方式比較適合()

A、系統(tǒng)聚類

B、快速聚類(k-means)

C、A和B都可以

D\A和B都不可以

答案：B

93.在對(duì)歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么

A、違反了建模的假設(shè)條件

B、加大了處理的難度

C、無法針對(duì)分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗

D、無法對(duì)不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法

答案：D

94.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下面的描述不正確的是()

A、數(shù)據(jù)倉庫隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B、捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照

C、數(shù)據(jù)倉庫隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行

重新綜合

答案：C

95.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是()

A、DELETE

B、DROP

GCLEAR

D、REMORE

答案：A

96.依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定，()負(fù)責(zé)統(tǒng)

籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。

A、工業(yè)和信息化部

B、國家安全部門

C、國家網(wǎng)信部門

D、通信主管部門

答案：C

97.假設(shè)屬性ine的最大最小值分別是12000

元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到。至1的范圍內(nèi)。

對(duì)屬性ine的73600元將被轉(zhuǎn)化為()

A、0.751

B、0.163

C、0.457

D、0.716

答案：D

98.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測(cè)其他某個(gè)變量值屬于

數(shù)據(jù)挖掘的哪一類任務(wù)？()

A、根據(jù)內(nèi)容檢索

B、建模描述

C、預(yù)測(cè)建模

D、尋找模式和規(guī)則

答案：C

99.自動(dòng)化高級(jí)分析實(shí)驗(yàn)室,實(shí)現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián),實(shí)現(xiàn)數(shù)據(jù)的自助組表、

自助分析功能，滿足不同層級(jí),不同水平的用戶需求的是0

A、初級(jí)分析；

B、綜合分析

C、典型分析

D、高級(jí)分析

答案：D

100.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是0

A、所得稅

B、建設(shè)投資

C、經(jīng)營成本

D、營業(yè)收入

答案：D

101.一組N個(gè)觀測(cè)值按數(shù)值大小排列,分成100份,處于X%位置的值稱第X個(gè)百

分位數(shù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案：A

102.開始將N個(gè)樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,

然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其他類的距離,重復(fù)進(jìn)行兩

個(gè)最近類的合并,每次減少一類,直至所有的樣品合并為一類，此種聚類方法是()

A、K-means

B、SOM聚類

C、系統(tǒng)聚類

D、有序聚類

答案：C

103.指數(shù)平滑法可以用以下哪種指標(biāo)來反映對(duì)時(shí)間序列資料的修正程度()

A、平滑常數(shù)

B、指數(shù)平滑數(shù)初始值

C、跨越期

D、季節(jié)指數(shù)

答案：A

104.變量的量綱比如以厘米或者米為單位對(duì)下面哪種方法會(huì)有影響0

A、方差分析

B、回歸分析

C、聚類分析

D、主成分分析

答案：C

105.關(guān)于Tableau的特點(diǎn)，以下說法錯(cuò)誤的是()

A、學(xué)習(xí)成本低，簡(jiǎn)單易用；

B、圖表精美；

C、開發(fā)快速，分享便捷；

D、需要IT大量人員參與

答案：D

106.在ID3算法中信息增益是指()

A、信息的溢出程度

B、信息的增加效益

C、烯增加的程度最大

D、炳減少的程度最大

答案：D

107.一組數(shù)據(jù)中最大值與最小值的差值稱為0,也稱全距。

A、極差

B、極距

C、距離

D、方差

答案：A

108.()是一種開源軟件編程語言,主要用于統(tǒng)計(jì)分析,繪圖和數(shù)據(jù)挖掘,內(nèi)置多種

統(tǒng)計(jì)及分析功能。

A、H.IVE;

B、H.ADOOP

C、R;

D、H.FDS

答案：C

109.決策樹中的InformationGain的計(jì)算是用來?

A、剪枝

B、使樹成長

C、處理缺失值和異常值

D、砍樹

答案：B

110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。

A、線性

B、非線性

C、預(yù)測(cè)

D、估算

答案：B

111.數(shù)據(jù)庫系統(tǒng)是由0組成的

A、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和用戶

B、數(shù)據(jù)文件、命令文件和報(bào)表

C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)

D、常量、變量和函數(shù)

答案：A

112.下列四項(xiàng)中，不屬于數(shù)據(jù)庫特點(diǎn)的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨(dú)立性高

答案：C

113.某小區(qū)60%居民訂晚報(bào),45%訂青年報(bào),30%兩報(bào)均訂,隨機(jī)抽一戶。則至少訂

一種報(bào)的概率為()

A、0.82

B、0.85

C、0.80

D、0.75

答案：D

114.關(guān)于統(tǒng)計(jì)學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說法錯(cuò)誤的是0。

A、面臨大數(shù)據(jù)，統(tǒng)計(jì)學(xué)的研究對(duì)象有所改變；

B、在大數(shù)據(jù)環(huán)境中,需要首先將未知的問題轉(zhuǎn)化為可用的統(tǒng)計(jì)方法；

C、在大數(shù)據(jù)分析過程中，傳統(tǒng)的統(tǒng)計(jì)分析過程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸?/p>

量一定性”；

D、在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計(jì)研究的對(duì)象范圍擴(kuò)展到一切數(shù)據(jù)。

答案：A

115.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展差、數(shù)據(jù)挖掘能力

強(qiáng)等特點(diǎn)的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案:B

116.下列說明錯(cuò)誤的是()

A、性別二“男”二)職業(yè)二“司機(jī)”，是布爾型關(guān)聯(lián)規(guī)則

B、性別二“女"二》avg(收入)二2300,是一個(gè)數(shù)值型

關(guān)聯(lián)規(guī)則

C、肝炎券ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個(gè)單層關(guān)聯(lián)規(guī)則

D、性別二“女”二〉職業(yè)二“秘書”，是多維關(guān)聯(lián)規(guī)則

答案：C

117.Hive是基于Hadoop的一個(gè)數(shù)據(jù)()工具

A、分析；

B、倉庫

C、制圖

D、可視化

答案：B

118.數(shù)據(jù)記錄內(nèi)容完整比例,包括指標(biāo)單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,

指標(biāo)字段值完整稱為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率；

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率；

D、指標(biāo)數(shù)據(jù)完整率

答案：D

119.EXCEL中，求標(biāo)準(zhǔn)差的函數(shù)是0

A、AVERAGE

B、MEDIAN

C、MODE

D、STDEV

答案：D

120.對(duì)于下列實(shí)驗(yàn)數(shù)據(jù):1,108,11,8,5,6,8,

8,7,11,描述其集中趨勢(shì)用()最為適宜,其值是()。

A、平均數(shù)，14.4

B、中位數(shù),8.5

C、眾數(shù),8

D、以上都可以

答案：C

121.《個(gè)人信息保護(hù)法》發(fā)布執(zhí)行時(shí)間()。

A、2021年9月1日;

B、2021年10月1日；

C、2021年11月1日

D、2021年12月1日

答案：C

122.檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于

()的離群點(diǎn)檢測(cè)

A、統(tǒng)計(jì)方法

B、鄰近度

C、密度

D、聚類技術(shù)

答案：A

123.下列關(guān)于聚類挖掘技術(shù)的說法中，錯(cuò)誤的是()

A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目，完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能

C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能

D、與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理

答案：B

124.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分分為0

A、結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)

B、強(qiáng)結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)

C、截面數(shù)據(jù)、面板數(shù)據(jù)

D、一級(jí)數(shù)據(jù)、二級(jí)數(shù)據(jù)、三級(jí)數(shù)據(jù)

答案：A

125.當(dāng)前國內(nèi)社會(huì)中，最為突出的大數(shù)據(jù)環(huán)境是()

A、互聯(lián)網(wǎng)

B、物聯(lián)網(wǎng)

C、綜合國力

D、自然資源

答案：A

126.()是一種松散耦合的服務(wù)和應(yīng)用之間標(biāo)準(zhǔn)的集成方式。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案：A

127.在建立線性回歸(LinearRegression)之前我們可以利用何種方法挑選重要

屬性,以降低模型的復(fù)雜度？

A、皮爾森相關(guān)系數(shù)

B、卡方檢定

C、T-檢定

D、Z-Score

答案：A

128.給定一個(gè)置信概率和置信區(qū)域,若誤差超過置信區(qū)域，則認(rèn)為誤差不是隨機(jī)

誤差引起,視為異常值的判別方法Oo

A、聚類判別法；

B、回歸判別法

C、抽樣判別法

D、統(tǒng)計(jì)判別法

答案：D

129.ROC曲線凸向哪個(gè)角，代表模型越理想？

A、左上角

B、右上角

C、左下角

D、右下角

答案：A

130..給出下列結(jié)論:

1)在回歸分析中,可用指數(shù)系數(shù)R方的值判斷模型的擬合效果,R方越大,模型的

擬合效果越好；

2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的

擬合效果越好；

⑶在回歸分析中,可用相關(guān)系數(shù)r的值判斷模型的擬合效果,r越小,模型的擬合

效果越好；

(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平

的帶狀區(qū)域中,說明這樣的模型比較

合適.帶狀區(qū)域的寬度越寬,說明模型的擬合精度越高.以上結(jié)論中,正確的有()

個(gè).

A、1

B、2

C、3

D、4

答案：A

131.回歸是一種預(yù)測(cè)建模技術(shù)研究()和()的依存關(guān)系。

A、預(yù)測(cè)值、實(shí)際值

B、自變量、因變量

C、絕對(duì)誤差、平方誤差

D、測(cè)試樣本、集合

答案：B

132.ODS是指()

A、企業(yè)數(shù)據(jù)中心；

B、數(shù)據(jù)倉庫

C、操作型存儲(chǔ)

D、總線

答案：B

133.用簡(jiǎn)單隨機(jī)重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,

則樣本容量需要擴(kuò)大到原來的()

A、2倍

B、3倍

C、4倍

D、5倍

答案：C

133假設(shè)｛BCE)為一頻繁項(xiàng)目集(FrequentItemset)，則根據(jù)AprioriPrinciple

以下何者不是子頻繁項(xiàng)目？

A、BC

B、CE

C、C

D、CD

答案：D

135.假如學(xué)生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄，為了說

明全班同學(xué)考試成績的水平高低,其集中趨勢(shì)的測(cè)度0

A、可以采用算術(shù)平均數(shù)

B、可以采用眾數(shù)或中位數(shù)

C、只能采用眾數(shù)

D、只能采用四分位數(shù)

答案：C

136.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?

A、數(shù)據(jù)獲取

B、分類和預(yù)測(cè)

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)可視化

答案：C

137.在有指導(dǎo)的數(shù)據(jù)挖掘中，有關(guān)測(cè)試集的說法錯(cuò)誤的是0

A、測(cè)試集和訓(xùn)練集是相互聯(lián)系的

B、測(cè)試集是用以測(cè)試模型的數(shù)據(jù)集

C、通常測(cè)試集大約占總樣本的三分之一

D、K-次交叉驗(yàn)證中,測(cè)試集只有1個(gè),訓(xùn)練集有K-1個(gè)

答案：A

138.以下那一項(xiàng)不是大數(shù)據(jù)提供的用戶交互方式是0。

A、企業(yè)報(bào)表;

B、查詢

C、大數(shù)據(jù)分析挖掘

D、可視化

答案：A

139.表示職稱為副教授、性別為男的表達(dá)式為0

A、職稱二‘副教授'0R性別=‘男’

B、職稱二'副教授'AND性別='男'

C、BETWEEN'副教授'AND'男，

D、IN(‘副教授‘，‘男‘)

答案：B

140.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測(cè)模型,常用于()分類變量

預(yù)測(cè)和概率預(yù)測(cè)。

A、四值

B、三值

C、二值

D、一值

答案：C

141.檢查異常值常用的統(tǒng)計(jì)圖形是()

A、柱狀圖

B、箱線圖

C、帕累托圖

D、氣泡圖

答案：B

142.以下哪條屬于個(gè)人信息影響的評(píng)估場(chǎng)景：()

A、處理敏感個(gè)人信息，利用個(gè)人信息進(jìn)行自動(dòng)化決策

B、委托處理個(gè)人信息、向第三方提供個(gè)人信息、公開個(gè)人信息

C、向境外提供個(gè)人信息

D、以上皆是

答案：D

143.《個(gè)人信息保護(hù)法》對(duì)于企業(yè)的影響不包括()

A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任

B、明確了可以量化的中國版執(zhí)行罰則

C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專門機(jī)構(gòu)和指定代表

D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則

答案：D

144.實(shí)際由源業(yè)務(wù)系統(tǒng)自動(dòng)接入的指標(biāo)數(shù)據(jù)占指標(biāo)體系中應(yīng)接指標(biāo)總數(shù)的比例

稱為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率；

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率；

D、指標(biāo)數(shù)據(jù)完整率

答案：A

145.假設(shè)檢驗(yàn)中，拒絕域的邊界稱為()

A、臨界值

B、臨界點(diǎn)

C、置信水平

D、邊際值

答案：A

146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是0

A、大數(shù)據(jù)是指無法再容許的時(shí)間內(nèi)用常規(guī)的軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理

和處理的數(shù)據(jù)集合,大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的，當(dāng)前泛指單一的數(shù)據(jù)集的

大小在幾十TB和PB之間；

B、大數(shù)據(jù)是一項(xiàng)技術(shù)，能夠?qū)?fù)雜海量數(shù)據(jù)進(jìn)行實(shí)時(shí)獲取、

傳輸、存儲(chǔ)、加工和利用的高薪技術(shù)；

C、大數(shù)據(jù)是一種挑戰(zhàn)，現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理和分析技術(shù)已無法適

用于現(xiàn)有的需要;

D、大數(shù)據(jù)是一個(gè)時(shí)代,擁有大數(shù)據(jù)是時(shí)代的特征、解讀大數(shù)據(jù)是時(shí)代的任務(wù)、應(yīng)

用大數(shù)據(jù)是時(shí)代的機(jī)遇。

答案：A

147,數(shù)據(jù)收集的標(biāo)準(zhǔn)為()而非動(dòng)用企業(yè)全部數(shù)據(jù)。

A、一致性、可靠性、時(shí)效性

B、相同性、可靠性、時(shí)效性

C、C相關(guān)性、可靠性、時(shí)效性

D、一致性、可靠性、實(shí)際性

答案：C

148.MySQL是()

A、操作系統(tǒng)；

B、數(shù)據(jù)庫

C、聊天軟件

D、瀏覽器

答案：B

149.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其

他標(biāo)簽的數(shù)據(jù)相分離？()

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、主成分分析

答案：B

150.某超市研究銷售記錄發(fā)現(xiàn)購買奶的很概率會(huì)購買包,這種屬于數(shù)據(jù)挖掘的

哪類問題？()

A、聚類分析

B、關(guān)聯(lián)規(guī)則

C、分類分析

D、自然語言處理

答案：B

151.蘋果公司對(duì)IPHONE的降價(jià)行為屬于0

A、地域性差別定價(jià)

B、時(shí)間性差別定價(jià)

C、非線性定價(jià)或數(shù)量折扣定價(jià)

D、其他形式的定價(jià)

答案：B

152.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其

他標(biāo)簽的數(shù)據(jù)相分離？

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、隱馬爾可夫鏈

答案：B

153.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法？

A、聚類

B、分類

C、時(shí)間序列

D、關(guān)聯(lián)規(guī)則

答案：B

154.《中華人民共和國數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對(duì)()

的記錄。

Av數(shù)據(jù)

B、信息

C、文件

D、知識(shí)

答案：B

155.下列不屬于原始數(shù)據(jù)來源的是()

A、行政記錄

B、統(tǒng)計(jì)調(diào)查

C、統(tǒng)計(jì)年鑒

D、實(shí)驗(yàn)

答案：C

156.數(shù)據(jù)挖掘技術(shù)包括三個(gè)主要的部分()

A、數(shù)據(jù)、模型、技術(shù)

B、算法、技術(shù)、領(lǐng)域知識(shí)

C、數(shù)據(jù)、建模能力、算法與技術(shù)

D、建模能力、算法與技術(shù)、領(lǐng)域知識(shí)

答案：C

157.(),用于顯示樹狀結(jié)構(gòu)數(shù)據(jù)。

A、矩形式樹狀結(jié)構(gòu)圖；

B、平行結(jié)構(gòu)樹

C、垂直結(jié)構(gòu)樹

答案：A

158.在Excel工作表中，在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是0

A、123

B、=123

C、+123

D、*123

答案：D

159.分析顧客消費(fèi)行業(yè),以便有針對(duì)性的向其推薦感興趣的服務(wù),屬于()問題。

A、關(guān)聯(lián)規(guī)則挖掘

B、分類與回歸

C、聚類分析

D、時(shí)序預(yù)測(cè)

答案：A

160.在有關(guān)數(shù)據(jù)倉庫測(cè)試,下列說法不正確的是()

A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對(duì)數(shù)據(jù)倉庫進(jìn)行各種測(cè)試.測(cè)試工作中要

包括單元測(cè)試和系統(tǒng)測(cè)試

B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試

C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉庫的所有組件進(jìn)行大量的

功能測(cè)試和回歸測(cè)試

D、在測(cè)試之前沒必要制定詳細(xì)的測(cè)試計(jì)劃

答案：D

161.Byte代表一個(gè)字節(jié),及()的數(shù)值范圍。

A、0~100

B、0~155

C、0~200

D、0~255

答案：D

162.目前常用的識(shí)別異常數(shù)據(jù)的方法有物理判別法和0。

A、化學(xué)判別法

B、統(tǒng)計(jì)判別法

C、靜態(tài)判別法

D、動(dòng)態(tài)判別法

答案：B

163,下列有關(guān)Apriori算法的說法中不正確的是()

A、Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。

B、應(yīng)用Apriori算法時(shí)，需要先設(shè)定模型的最小支持度、最小置信度等閾值。

C、應(yīng)用Apriori算法時(shí)，輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。

DxApriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項(xiàng)集中項(xiàng)的數(shù)量。

答案：C

164.VBA語言中，聲明變量的關(guān)鍵字是()。

A、SET;

B、C.ONST

C、PRIVATE

D、IM

答案：D

165.下列四項(xiàng)中，不屬于數(shù)據(jù)庫特點(diǎn)的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨(dú)立性高

答案：C

166.維度規(guī)約是在以下哪個(gè)步驟的任務(wù)？()

A、頻繁模式挖掘

B、降維

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)流挖掘

答案：C

167.屬于財(cái)務(wù)專業(yè)明細(xì)數(shù)據(jù)表的是()

A、客戶收費(fèi)流水表；

B、應(yīng)收票據(jù)信息表；

C、公司分壓線損統(tǒng)計(jì)表;

D、供應(yīng)計(jì)劃表

答案：B

168.以下哪個(gè)變量可以反映客戶的忠誠度？()

A、購買頻次

B、購買金額

C、最后一次購買時(shí)間

D、購買金額波動(dòng)率

答案:A

169.某項(xiàng)目預(yù)計(jì)運(yùn)行5年后的凈現(xiàn)值為4500萬元,如折現(xiàn)率為16%,其終值應(yīng)為()

萬元(說明:結(jié)果保留兩位小數(shù))

A、8045.86

B、6996.21

C、9451.54

D、7000.02

答案：C

170.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為0

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率；

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率；

D、指標(biāo)數(shù)據(jù)完整率

答案：C

171.數(shù)據(jù)正規(guī)化(DataNormaIization)是在知識(shí)發(fā)掘處理

(KnowIedgeDiscoveryProcess)中的哪一個(gè)階段進(jìn)行？

A、數(shù)據(jù)清洗

B、數(shù)據(jù)選擇

C、數(shù)據(jù)編碼

D、數(shù)據(jù)擴(kuò)充

答案：C

172.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:”主人呢？“豬說:“出去買蘑菇了。

“雞聽了撒丫子就跑。豬說:“你跑什么？"雞叫道：“有本事主人買粉條的時(shí)候你小

子別跑！”

以上對(duì)話體現(xiàn)了數(shù)據(jù)分析方法中的()

A、關(guān)聯(lián)

B、聚類

C、分類

D、自然語言處理

答案：A

173.以下敘述正確的是0

A、極差較少受異常值的影響

B、四分位差較少受異常值的影響

C、方差較少受異常值的影響

D、標(biāo)準(zhǔn)差較少受異常值的影響

答案：B

174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類。

A、季度需求

B、月度需求

C、周需求

D、即時(shí)需求

答案：D

175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系,典型例子是購物籃分析,常見算法有

Apriori關(guān)聯(lián)算法和()算法。

A、貝葉斯算法

B、線性回歸

C、F.P-growth關(guān)聯(lián)算法

D、聚類算法

答案：C

176.無監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法

A、聚類算法；

B、降維算法；

C、關(guān)聯(lián)規(guī)則算法；

D、文本挖掘

答案：A

177.以下哪些分類方法可以較好地避免樣本的不平衡問題？

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案：A

178.數(shù)據(jù)倉庫的最終目的是0

A、收集業(yè)務(wù)需求

B、建立數(shù)據(jù)倉庫邏輯模型

C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析

D、為用戶和業(yè)務(wù)部門提供決策支持

答案：D

179.下列不屬于分類算法的是()

A、C4.5算法

B、邏輯回歸

C、KNN算法

D、TF-TDF算法

答案：D

180.如下哪個(gè)不是最近鄰分類器的特點(diǎn)0

A、它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型

B、分類一個(gè)測(cè)試樣例開銷很大

C、最近鄰分類器基于全局信息進(jìn)行預(yù)測(cè)

D、可以生產(chǎn)任意形狀的決策邊界

答案：C

181.通過()，計(jì)算頻數(shù)、眾數(shù)、中位數(shù)等一個(gè)或多個(gè)數(shù)據(jù)指標(biāo)，探索數(shù)據(jù)的分布結(jié)

構(gòu)。

A、概率統(tǒng)計(jì)法

B、匯總統(tǒng)計(jì)法

C、可視化法

D、分類統(tǒng)計(jì)法

答案：B

182.MapReduce是一種()計(jì)算模型

A、集中式；

B、分布式

C、離散式

D、放射式

答案：B

183.一種商品價(jià)格變動(dòng)與由此引起另外一種商品需求量相對(duì)變動(dòng)的比率稱為()

A、需求價(jià)格彈性

B、供給價(jià)格彈性

C、需求交叉彈性

D、供給交叉彈性

答案：C

184.請(qǐng)問以下何者屬于時(shí)間序列的問題？

A、信用卡發(fā)卡銀行偵測(cè)潛在的卡奴

B、基金經(jīng)理人針對(duì)個(gè)股做出未來價(jià)格預(yù)測(cè)

C、電信公司將人戶區(qū)分為數(shù)個(gè)群體

D、以上均不是

答案：B

185.非參數(shù)檢驗(yàn)是針對(duì)()分布情況做的假設(shè)。

A、總體

B、局部

C、個(gè)體

答案:A

186.分類器效果檢驗(yàn)中的準(zhǔn)確率是指()

A、預(yù)測(cè)正確的數(shù)據(jù)在總數(shù)據(jù)中的比例

B、預(yù)測(cè)為正的數(shù)據(jù)在總數(shù)據(jù)中的比例

C、預(yù)測(cè)為正的數(shù)據(jù)中實(shí)際為正的數(shù)據(jù)所占比例

D、實(shí)際為正的數(shù)據(jù)中被預(yù)測(cè)為正的數(shù)據(jù)所占比例

答案：C

187.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時(shí)間0。

A、2021年9月1日；

B、2021年10月1日；

C、2021年11月1日

D、2021年12月1日

答案：A

188.實(shí)際接入的指標(biāo)數(shù)占應(yīng)接指標(biāo)總數(shù)的比例,統(tǒng)計(jì)時(shí)又分線上和線下接入率稱

為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率；

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率；

D、指標(biāo)數(shù)據(jù)完整率

答案：B

189.關(guān)于回歸分析,下列說法中錯(cuò)誤的是0

A、作回歸分析的變量之間要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象隨意進(jìn)行回

歸分析,要結(jié)合專業(yè)知識(shí)對(duì)兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。

B、在進(jìn)行線性回歸分析進(jìn)行的數(shù)據(jù)準(zhǔn)備的時(shí)候,要求因變量y和自變量x都是符

合總體正態(tài)的隨機(jī)變量。

C、回歸直線不要隨意外延

D、所有非線性回歸都可以轉(zhuǎn)化為線性回歸

答案：D

190.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標(biāo)之間的數(shù)量關(guān)系()NPV>0

Av當(dāng)PK1,IRR>iNPV>0

B、當(dāng)Pl>1,IRR>iNPV<0

C、當(dāng)Pl<1時(shí)，IRR>i,NPV<0、當(dāng)DPI>1IRR>i,時(shí)，

答案：B

191.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是

A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象。

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇。

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會(huì)

合并有重疊的簇。

答案：A

192..人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣,這屬于空調(diào)產(chǎn)品整

體概念中的()

A、有形產(chǎn)品

B、直接產(chǎn)品

C、核心產(chǎn)品

D、主要產(chǎn)品

答案：C

193.某牙膏廠原來生產(chǎn)兩面針?biāo)幬镅栏?現(xiàn)在又增加牙刷生產(chǎn),這屬于()

A、同心多元化

B、水平多元化

C、集團(tuán)多元化

D、相關(guān)多元化

答案：B

194.在發(fā)生或者可能發(fā)生個(gè)人信息泄露、毀損、丟失的情況時(shí)，應(yīng)當(dāng)立即采取()

措施,按照規(guī)定及時(shí)告知用戶并向有關(guān)主管部門報(bào)告。()

A\彌補(bǔ)

B、補(bǔ)救

C、救援

D、相關(guān)

答案：B

多選題

1.以下算法中對(duì)缺失值敏感的有()

A、Logistic回歸

B、SVM算法

C、CART決策樹

D、樸素貝葉斯

答案：AB

2.以下關(guān)于皮爾森相關(guān)分析敘述正確的是()

A、兩變量獨(dú)立，兩者的皮爾森相關(guān)系數(shù)必然等于0

B、兩變量皮爾森相關(guān)系數(shù)不等于0,兩者必然不獨(dú)立

C、皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨(dú)立

D、兩變量不獨(dú)立，兩者的皮爾森相關(guān)系數(shù)必然不等于0

答案：AB

3.配合一元線性回歸方程須具備下列前提條件0

A、現(xiàn)象間確實(shí)存在數(shù)量上的相互依存關(guān)系

B、現(xiàn)象間的關(guān)系是直線關(guān)系，這種直線關(guān)系可用散點(diǎn)圖來表示

C、具備一組自變量與因變量的對(duì)應(yīng)資料,且能明確哪個(gè)是自變量,哪個(gè)是因變量

D、兩個(gè)變量之間不是對(duì)等關(guān)系

答案：ABCD

4.下面關(guān)于季度模型的敘述,不正確的是0

A、季度模型以季度數(shù)據(jù)為樣本

B、季度模型主要用于季度預(yù)測(cè)

C、季度模型注重長期行為的描述

D、季度模型一般規(guī)模較大

答案：AB

5.如果自變量有連續(xù)型變量,則適用的分類預(yù)測(cè)方法有0

A、邏輯回歸

B、神經(jīng)網(wǎng)絡(luò)

GSVM算法

D、C4.5算法

答案：ABC

6.在比較不同預(yù)測(cè)方法的精確度時(shí),通常采用()等誤差指標(biāo)來衡量預(yù)測(cè)誤差的大

小。

A、絕對(duì)誤差

B、相對(duì)誤差

C、平均誤差

D、隨機(jī)誤差

答案：ABC

7.以下說法正確的有()

A、評(píng)價(jià)預(yù)測(cè)精度是通過測(cè)量與分析預(yù)測(cè)誤差進(jìn)行的

B、絕對(duì)誤差是實(shí)際觀測(cè)值與預(yù)測(cè)值的離差

C、相對(duì)誤差反映實(shí)際觀測(cè)值與預(yù)測(cè)值之間差異的相對(duì)程度

D、平均誤差反映實(shí)際觀測(cè)值與預(yù)測(cè)值之間的平均差異

答案：ABCD

8.產(chǎn)品成本費(fèi)用按其與產(chǎn)量變化的關(guān)系分為()

A、可變成本

B、固定成本

C、付現(xiàn)成本

D、沉沒成本

答案：AB

9.下面給出的t檢驗(yàn)的結(jié)果，0表明接受原假設(shè),顯著性水平為0.05o

A、0.000

B、0.039

C、0.092

D、0.124

答案：CD

10.回歸變差(或回歸平方和)是指()

A、被解釋變量的實(shí)際值與平均值的離差平方和

B、被解釋變量的回歸值與平均值的離差平方和

C、被解釋變量的總變差與剩余變差之差

D、解釋變量變動(dòng)所引起的被解釋變量的變差

答案：BCD

11.在ExceI中,要選定A到E列單元格,操作正確的是

A、用鼠標(biāo)左鍵單擊列號(hào)

A,然后向右拖動(dòng)鼠標(biāo)至列號(hào)

E,再釋放鼠標(biāo)左鍵

B、左鍵單擊列號(hào)

A,再按下shift鍵不放并用鼠標(biāo)左鍵單擊列號(hào)

E,最后釋放shift鍵

C、單擊列號(hào)

A,然后先按下Ctrl鍵不放,再用鼠標(biāo)單擊B.C,D,E列號(hào),最后釋放CtrI鍵

D、按shift鍵不放，用鼠標(biāo)左鍵單擊

A,B,C,D,E的每個(gè)列號(hào)

答案：ABC

12.^ijApriori算法計(jì)算頻繁項(xiàng)集可以有效降低計(jì)算頻繁集的時(shí)間復(fù)雜度。在以

下的購物籃中產(chǎn)生支持度不小于3的候選3-項(xiàng)集，在候選2-項(xiàng)集中需要剪枝的是

0ID項(xiàng)集。

1面包.牛奶

2面包.尿布.啤酒.雞蛋

3牛奶.尿布.啤酒.可樂

4面包.牛奶.尿布.啤酒

5面包.牛奶.尿布.可樂

A、啤酒.尿布

B、啤酒.面包

C、面包.尿布

D、啤酒.牛奶

答案：BD

13.大數(shù)據(jù)技術(shù)的兩大核心：

A、分布式存儲(chǔ)GFS'HDFS

B、分布式傳輸Transmission

C、分布式采集Collection

Dx分布式處理MapReduce

答案：AD

14.概率分析中，應(yīng)計(jì)算出()表明該風(fēng)險(xiǎn)因素的風(fēng)險(xiǎn)程度。

A、變異系數(shù)

B、期望值

C、方差

D、標(biāo)準(zhǔn)差

答案：ABCD

15.數(shù)據(jù)科學(xué)家的3c精神

A、創(chuàng)造性地工作

B、批判性地思考

C、系統(tǒng)性地處理

D、好奇性地提問

答案：ABD

16.相關(guān)分析的任務(wù)有()

A、判定現(xiàn)象之間有無關(guān)系

B、判定現(xiàn)象之間關(guān)系的方向

C、判定相關(guān)關(guān)系的緊密程度

D、說明現(xiàn)象之間聯(lián)系的具體形式

答案：ABCD

17.元組在某些屬性上缺少值是常有的。在實(shí)際數(shù)據(jù)中,描述處理該問題的各種方

法有()

A、直接刪除

B、.使用屬性的平均值填充空缺值

C、使用一個(gè)全局常量填充空缺

D、使用與給定元組屬同一類的所有樣本的平均值

答案：ABC

18.如下表student中，如何篩選type為包含數(shù)學(xué)或語文的記錄？

IDtypescore

A01數(shù)學(xué)78

A02語文76

A03英語90

A04數(shù)學(xué)68

A05英語84

A、seIect*fromstudentwheretype=,>數(shù)學(xué)"andtype=M語文”

B、seIect*fromstudentwheretype二“數(shù)學(xué)"ortype=,J語文”

C\seIect*fromstudentwheretypein（M數(shù)學(xué)"，“語文"）

D、seIect*fromstudentwheretypein(M數(shù)學(xué)"？“語文")

答案：BC

19.以下哪些變量使用RFM方法構(gòu)造出來的？()

A、最近3期境外消費(fèi)金額

B、最近6期網(wǎng)銀消費(fèi)交易筆數(shù)

C、信用額度

D、距最近一次逾期的月數(shù)

答案：ABD

20.以下關(guān)于邏輯回歸的說法正確的是()

A、應(yīng)用邏輯回歸時(shí),異常值會(huì)對(duì)模型造成很大的干擾。

B、邏輯回歸的自變量必須是分類變量,因此要對(duì)連續(xù)型變量進(jìn)行離散化處理。

C、邏輯回歸對(duì)模型中自變量的多重共線性較為敏感。

D、邏輯回歸屬于分類算法。

答案：ACD

21.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的致原則包括()

A、特征根值大于1

B、特征根值大于3

C、累積特征根值加總占總特征根值的80%以上

D、累積特征根值加總占總特征根值的90%以上

答案：AC

22.大數(shù)據(jù)應(yīng)用建設(shè)及運(yùn)營過程中如發(fā)生數(shù)據(jù)安全問題,應(yīng)立即暫停大數(shù)據(jù)應(yīng)用

建設(shè)或運(yùn)營工作，向0部門匯援。

A、互聯(lián)網(wǎng)部

B、安監(jiān)部

C、法規(guī)部

D、相關(guān)專業(yè)管理部門

答案：ABCD

23.下列關(guān)于統(tǒng)計(jì)量的表述中,正確的有()

A、估計(jì)同一個(gè)總體參數(shù)可以用多個(gè)不同的統(tǒng)計(jì)量

B、統(tǒng)計(jì)量是樣本的函數(shù)

C、.統(tǒng)計(jì)量不含有總體的參數(shù)

D、統(tǒng)計(jì)量是隨機(jī)變量

答案：ABD

24.下列對(duì)ID3算法的描述,正確的是0

A、每個(gè)節(jié)點(diǎn)的分支度都不相同

B、使用InformationGain作為節(jié)點(diǎn)分割的依據(jù)

C、可以處理數(shù)值型態(tài)的字段

D、方法處理空值的字段

答案：ABD

25.數(shù)據(jù)科學(xué)中的主流語音工具0

A、R

B、C++

C\Java

D、Python

答案：AD

26.定基發(fā)展速度與環(huán)比發(fā)展速度的關(guān)系有()。

A、各環(huán)比發(fā)展速度之和等于相應(yīng)的定基發(fā)展速度

B、各環(huán)比發(fā)展速度之積等于相應(yīng)的定基發(fā)展速度

C、兩個(gè)環(huán)比發(fā)展速度之商等于相應(yīng)的定基發(fā)展速度

D、兩個(gè)定基發(fā)展速度之商等于相應(yīng)的環(huán)比發(fā)展速度

答案：BD

27.處理噪聲數(shù)據(jù)的常用方法。

A、分箱

B、聚類

C、回歸

D、對(duì)比

答案：ABC

28.行業(yè)分析數(shù)據(jù)采集方法有I)o

A、一手資料

B、實(shí)地考察法

C、專家訪談法

D、收集媒體信息

答案：ABCD

29.貨幣時(shí)間價(jià)值用相對(duì)值來表示時(shí),在數(shù)量上應(yīng)當(dāng)理解為扣除0后的社會(huì)平均

利潤率。

A、時(shí)間因素

B、通貨膨脹因素

C、純粹利率

D、風(fēng)險(xiǎn)因素

答案：BD

30.商業(yè)模式描述正確的是：

A、B2B--商家對(duì)商家

B、B2C一商家對(duì)人

C、020一線上對(duì)線下

D、C2C一人對(duì)人

答案：ABCD

31.以下屬于聚類算法的是0

A、K均值

B、DBSCAN

C\Apriori

D、knn

答案：AB

32.KANO模型定義的顧客需求層次有()

A、興奮型需求

B、喜愛型需求

C、基本型需求

D、期望型需求

答案：ACD

33.根據(jù)分析內(nèi)容和側(cè)重面不同,風(fēng)險(xiǎn)分析的方法有()

A、敏感性分析

B、概率分析

C、經(jīng)濟(jì)效益分析

D、盈虧平衡分析

答案：ABD

34.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是0

A、系統(tǒng)誤差

B、登記性誤差

C、責(zé)任心誤差

D、技術(shù)性誤差

答案：BCD

35.敏感個(gè)人信息劃定依據(jù)()

A、與人格尊嚴(yán)相關(guān)

B、與人身.財(cái)產(chǎn)安全相關(guān)

C、不滿十四周歲未成年人的個(gè)人信息

D、與公司管理要求相關(guān)

答案：ABC

36.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。

A、潛在客戶

B、響應(yīng)客戶

C、即得客戶

D、流失客戶

答案：ABCD

37.以下屬于數(shù)據(jù)預(yù)處理的是：）

A、缺失值填充

B、噪聲數(shù)據(jù)剔除

C、異常值識(shí)別

D、數(shù)據(jù)可視化

答案：ABC

38.我們可以用哪種方式來避免決策樹過度擬合的問題？0

A、利用修剪法來限制樹的深度

B、利用盆栽法規(guī)定每個(gè)節(jié)點(diǎn)下的最小的記錄數(shù)

C、利用逐步回歸法來刪除部分?jǐn)?shù)據(jù)

D、目前并無適合的方法來處理這問題

答案：AB

39.在有關(guān)數(shù)據(jù)倉庫測(cè)試,下列說法中正確的是0

A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對(duì)數(shù)據(jù)倉庫進(jìn)行各種測(cè)試.測(cè)試工作中要

包括單元測(cè)試和系統(tǒng)測(cè)試

B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試

C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試

D、在測(cè)試之前可以不制定詳細(xì)的測(cè)試計(jì)劃，測(cè)試過程中實(shí)時(shí)調(diào)整。

答案：ABC

40.關(guān)于基準(zhǔn)收益率的表述,正確的是()

A、基準(zhǔn)收益率越高越好

B、基準(zhǔn)收益率越低越好，但不能低于銀行貸款利率

C、可以采用項(xiàng)目加權(quán)平均資金成本為基礎(chǔ)確定基準(zhǔn)收益率

D、可以采用國家有關(guān)部門或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準(zhǔn)收益

率

答案：CD

41.分箱方法有哪些？()

A、等深分箱

B、等寬分箱

C、數(shù)據(jù)標(biāo)準(zhǔn)化

D、自定義區(qū)間法

答案：ABD

42.數(shù)據(jù)類型：

A、離散Q型

B、連續(xù)性

C、符號(hào)型

D、文本型

答案：ABCD

43.營銷觀念是營銷過程中如何處理0利益關(guān)系。

Av企業(yè)

Bx員工

C、顧客

D、社會(huì)

答案：ACD

44.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲(chǔ)基礎(chǔ),其特點(diǎn)為()

A、支持超大文件

B、基于商用硬件

C、流式數(shù)據(jù)訪問

D、高吞吐量

答案：ABCD

45.隨機(jī)抽樣方法有0

A、等距隨機(jī)抽樣

B、綜合隨機(jī)抽樣

C、簡(jiǎn)單隨機(jī)抽樣

D、分群隨機(jī)抽樣

答案：ACD

46.能消除時(shí)間序列中的不規(guī)則變動(dòng)和季節(jié)變動(dòng)的方法是

A、移動(dòng)平均法

B、指數(shù)平滑法

C、時(shí)間序列乘法模型

D、季節(jié)指數(shù)

答案：AD

47.關(guān)于數(shù)據(jù)范式描述準(zhǔn)確的是：

A、經(jīng)驗(yàn)科學(xué)是第一范式，主要研究模型是科學(xué)實(shí)驗(yàn)；

B、理論科學(xué)是第二范式，主要研究模型是數(shù)學(xué)模型；

C、計(jì)算科學(xué)是第三范式,主要研究模型是計(jì)算機(jī)仿真和模擬，第三范式是“人腦+

電腦”，人腦是主角；

D、數(shù)據(jù)密集型科學(xué)是第四范式,的主要研究模型是數(shù)據(jù)挖掘卻機(jī)器學(xué)習(xí)，特別是

機(jī)器學(xué)習(xí)，第四范式是“電腦+人腦”，電腦是主角。

答案：ABCD

48.如下表student中，如何篩選type為包含數(shù)學(xué)或語文的記錄？0

AvseIect*fromstudentwheretype="數(shù)學(xué)”andtype="語文”

B、seIect*fromstudentwheretype="數(shù)學(xué)"ortype="語文”

Cvselect*fromstudentwheretypein（"數(shù)學(xué)”,“語文”）

D、seiect*fromstudentwheretypein（"數(shù)學(xué)"?”語文"）

答案：BC

49.下列項(xiàng)目中，其變動(dòng)可以改變盈虧平衡點(diǎn)位置的因素有

A、單價(jià)

B、單位變動(dòng)成本

C、銷量

D、固定成本

答案：ABCD

50.某種產(chǎn)品的生產(chǎn)總費(fèi)用2003年為50萬元，比2002

年多2萬元,而單位產(chǎn)品成本2003年比2002年降低5%,則()

A、生產(chǎn)費(fèi)用總指數(shù)為104.17%

B、生產(chǎn)費(fèi)用指數(shù)為108.56%

C、單位成本指數(shù)為95%

D、產(chǎn)量指數(shù)為109.65%

E、由于成本降低而節(jié)約的生產(chǎn)費(fèi)用為2.63萬元

答案：ACDE

51.按照性質(zhì),預(yù)測(cè)方法大致可分為()。

A、定性預(yù)測(cè)

B、情景預(yù)測(cè)

C、時(shí)間序列預(yù)測(cè)

D、回歸預(yù)測(cè)

答案：ACD

52.以下屬于分類器評(píng)價(jià)或比較尺度的有0

A、預(yù)測(cè)準(zhǔn)確度

B、召回率

C、模型描述的簡(jiǎn)潔度

D、F1-Score

答案：ABD

53.如下哪些不是基于規(guī)則的分類器的特點(diǎn)()

A、規(guī)則集的表達(dá)能力遠(yuǎn)不如決策樹好

B、基于規(guī)則的分類器都對(duì)屬性空間進(jìn)行直線劃分,并將類指派到每個(gè)劃分

C、無法被用來產(chǎn)生更易于解釋的描述性模型

D、非常適合處理類分布不平衡的數(shù)據(jù)集

答案：AC

54.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要，將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù)的過程。

數(shù)據(jù)離散化的方法有()

A、隨機(jī)取值

B、等距離散法

C、數(shù)值規(guī)約

D、等頻離散法

答案：BD

55.缺失值的處理方法有哪些？()

A、用平均值填充

B、忽略缺失記錄

C、以任意數(shù)據(jù)填充

D、用默認(rèn)值填充

答案:ABD

56.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的。

A、高維性

B、規(guī)模

C、稀疏性

D、噪聲和離群點(diǎn)

答案：ABCD

57.以下屬于數(shù)據(jù)規(guī)約方法的是0

A、數(shù)據(jù)離散化

B、數(shù)據(jù)標(biāo)準(zhǔn)化

C、噪聲數(shù)據(jù)識(shí)別

D、數(shù)據(jù)壓縮

答案：AD

58.在假設(shè)檢驗(yàn)中，當(dāng)我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時(shí),表示()

A、有充足的理由否定原假設(shè)

B、原假設(shè)必定是錯(cuò)誤的

C、犯錯(cuò)誤的概率不大于a

D、犯錯(cuò)誤的概率不大于b

E、在H。成立的情況下發(fā)生了小概率事件

答案：ACE

59.電子元器件：

A、電子管

B、晶體管

C、小規(guī)模中規(guī)模集成電路

D、大規(guī)?；虺笠?guī)模集成電路

答案：ABCD

60.若檢驗(yàn)統(tǒng)計(jì)量F近似等于1.說明()

A、組間方差中不包含系統(tǒng)因素的影響

B、組內(nèi)方差中不包含系統(tǒng)因素的影響

C、組間方差中包含系統(tǒng)因素的影響

D、方差分析中不應(yīng)拒絕原假設(shè)

答案：AD

61.統(tǒng)計(jì)決策的基本原則是()

Av可行性

B、發(fā)展性

C、合理性

D、經(jīng)濟(jì)性

答案：ACD

62.促銷預(yù)算的方法主要有()。

A、量入為出法

B、競(jìng)爭(zhēng)對(duì)等法

C、銷售比例法

D、目標(biāo)任務(wù)法

答案：ABCD

63.以下哪個(gè)分布是右偏分布？0

A、均勻分布

B、卡方分布

C、F分布

D、對(duì)數(shù)正態(tài)分布

答案：BCD

64.大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些？()

A、各種傳感器無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

B、各種監(jiān)控設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

C、各種智能設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

D、互聯(lián)網(wǎng)的收集和積累

答案:ABCD

65.數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)主要包括哪幾大類問題？0

A、分類

B、回歸

C、模式發(fā)現(xiàn)

D、模式匹配

答案：AB

66.從復(fù)雜度及價(jià)值高低兩個(gè)維度,可以將數(shù)據(jù)分析分為()

Av描述性分析(DescriptiveAnalytics)

B、診斷性分析(DiagnosticAnalytics)

C\預(yù)測(cè)性分析(PredictiveAnaIytics)

D、規(guī)范性分析(PrescriptiveAnalytics)

答案：ABCD

67.下面有關(guān)HAVING子句的說法中正確的是()

A、HAVING子句必須與GROUPBY子句同時(shí)使用，不能單獨(dú)使用

B、使用HAVING子句的同時(shí)不能使用WHERE子句

C、使用HAVING子句的同時(shí)可以使用WHERE子句

D、使用HAVING子句的作用是限定分組的條件

答案：ACD

68.在作邏輯回歸時(shí),如果區(qū)域這個(gè)變量,當(dāng)Region二A時(shí)Y取值均為1,無法確定

是否出現(xiàn)的是哪個(gè)問題？

A、共線性

B、異常值

C、擬完全分離(Quasi-pleteseparation)

D、缺失值

答案：ABD

69.以下哪個(gè)聚類分析的方法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量()

A、層次聚類法

B、快速聚類法(K-Means)

C、基于密度的聚類法

D、基于網(wǎng)格的聚類法

答案：AB

70.方差分析的基本假設(shè)前提包括()

A、各處理?xiàng)l件下的樣本均來自正態(tài)總體

B、各處理?xiàng)l件下的樣本相互獨(dú)立

C、各處理?xiàng)l件下樣本的方差都相等

D、各處理?xiàng)l件下樣本均值相等，方差可以不等

答案：ABC

71.季節(jié)變動(dòng)主要是由()引起的。

A、自然災(zāi)害

B、政治事件

C、制度.法津習(xí)俗

D、自然界的季節(jié)變化

答案：CD

72.以下說法正確的有哪些？()

A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大

B、大數(shù)據(jù)對(duì)傳統(tǒng)行業(yè)有幫助

C、大數(shù)據(jù)會(huì)帶來機(jī)器智能

D、大數(shù)據(jù)是一種思維方式

答案：BCD

73.下列公式正確的是()

A、流動(dòng)資金二流動(dòng)資產(chǎn)-流動(dòng)負(fù)債

B、流動(dòng)資產(chǎn)二應(yīng)收賬款+存貨

C、流動(dòng)負(fù)債=應(yīng)付賬款+預(yù)收賬款

D、流動(dòng)資金本年增加額二本年流動(dòng)資金-上年流動(dòng)資金

答案：ACD

74.決策樹法分析問題的主要步驟包括()。

A、結(jié)構(gòu)化問題

B、設(shè)計(jì)可能結(jié)果發(fā)生的概率

C、設(shè)計(jì)結(jié)果的得益

D、分析問題

答案：ABCD

75.下列說法中不正確的是()

A、任何兩個(gè)變量都具有相關(guān)關(guān)系

B、人的知識(shí)與其年齡具有相關(guān)關(guān)系

C、散點(diǎn)圖中的各點(diǎn)是分散的沒有規(guī)律

D、根據(jù)散點(diǎn)圖求得的回歸直線方程都是有意義的

答案：ACD

76.投資項(xiàng)目的現(xiàn)金流量中經(jīng)營成本與會(huì)計(jì)中的“總成本費(fèi)用”概念有根本的不

同,不包括

A、利息支出

B、攤銷費(fèi)

C、折舊費(fèi)

D、維修費(fèi)

答案：ABC

77.符合下列情形之一的,個(gè)人信息處理者方可處理個(gè)人信

息

A、取得個(gè)人的同意；

B、為訂立.履行個(gè)人作為一方當(dāng)事人的合同所必需，或者

按照依法制定的勞動(dòng)規(guī)章制度和依法簽訂的集體合同實(shí)施人力

資源管理所必需；

C、為履行法定職責(zé)或者法定義務(wù)所必需;

D、為應(yīng)對(duì)突發(fā)公共衛(wèi)生事件,或者緊急情況下為保護(hù)自然人的生命健康和財(cái)產(chǎn)安

全所必需；

E、為公共利益實(shí)施新聞報(bào)道.輿論監(jiān)督等行為,在合理的范圍內(nèi)處理個(gè)人信息；

F、依照本法規(guī)定在合理的范圍內(nèi)處理個(gè)人自行公開或者其他已經(jīng)合法公開的個(gè)

人信息；

G、法律.行政法規(guī)規(guī)定的其他情形。

答案：ABCDEFG

78.大數(shù)據(jù)四大特征：

A、速度快

B、數(shù)據(jù)量大

C、價(jià)值密度低

D、類型多

答案：ABCD

79.確定一個(gè)投資方案可行的必要條件是0。

A、凈現(xiàn)值大于零

B、現(xiàn)值指數(shù)大于1

C、投資回收期小于1年

D、內(nèi)部報(bào)酬率較高

答案：AB

80.以下屬于聚類算法的是()

A、K均值

B、DBSCAN

C\Apriori

Dxk-medoids

答案：ABD

81.下列何種算法可以幫助我們做數(shù)值的預(yù)測(cè)(Prediction)?

A、Apriori

B、DecisionTree

CvNaiveBayes

D、LinearRegression

答案：BD

82.層次聚類的聚類方式有0

A、凝聚方式聚類

B、分解方式聚類

C、Q型聚類

D、R型聚類

答案：AB

83.有下列情形之一的,個(gè)人信息處理者應(yīng)當(dāng)事前進(jìn)行個(gè)人信息保護(hù)影響評(píng)估,并

對(duì)處理情況進(jìn)行記錄：

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫（含答案）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔