大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)_第1頁
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)_第2頁
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)_第3頁
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)_第4頁
大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)挖掘分析專業(yè)考試復(fù)習(xí)題庫(含答案)

一、單選題

1.以下哪些分類方法可以較好地避免樣本的不平衡問題?

0

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案:A

2.0算法是最廣泛使用的聚類算法,算法簡(jiǎn)單,易于理解和操作。

Axgglomerative

B、C.URE

C、K-means

D、k-中心點(diǎn)算法

答案:C

3.貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。

A、極大似然概率

B、先驗(yàn)概率

C、邊際概率

D、后驗(yàn)概率

答案:D

4.回歸分析的第一步是()

A、確定解釋量和被解釋變量

B、確定回歸模型

C、建立回歸方程

D、進(jìn)行檢驗(yàn)

答案:A

5.當(dāng)所有觀測(cè)值都落在回歸直線上,則這兩個(gè)變量之間的相關(guān)系數(shù)為0

A、1

B、-1

C、+1或7

D、0

答案:C

6.()是進(jìn)行項(xiàng)目投資效益評(píng)價(jià)的最終依據(jù)。

A、現(xiàn)金流量

B、盈虧平衡點(diǎn)

C、凈現(xiàn)金流量

D、現(xiàn)金流入量

答案:C

7.被廣泛用于購物籃分析的是()。

A、關(guān)聯(lián)分析;

B、分類和預(yù)測(cè)

C、聚類分析

D、演變分析

答案:A

8.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()

A、變量代換

B、離散化

C、聚集

D、估計(jì)遺漏值

答案:D

9.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()

A、支持度

B、置信度

C、滿意度

D、提升度

答案:C

10.NoSQL含義是指0

A、NO!SQL;

B、NomberSQL;

C、NotOnIySQL

D、NOLLSQL

答案:C

11.個(gè)人信息的收集、處理和利用應(yīng)當(dāng)遵循()的原則,不得違反法律、法規(guī)的規(guī)定

和雙方的約定收集、處理和利用個(gè)人信息。()

A、正規(guī)、合法、必要

B、合法、正當(dāng)、必要

C、合法、合規(guī)、正當(dāng)

D、合法、合理、合規(guī)

答案:B

12.Tableau能夠?qū)?shù)據(jù)進(jìn)行處理包括()。

A、將多個(gè)數(shù)據(jù)源數(shù)據(jù)拼接為一個(gè)寬表;

B、修改、刪除、新增數(shù)據(jù)行;

C、對(duì)數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換、重命名、格式修改;

D、對(duì)數(shù)據(jù)進(jìn)行計(jì)算、合并生成新的數(shù)據(jù)列

答案:A

13.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分,具備數(shù)據(jù)倉庫的部分特征和OLTP系

統(tǒng)的部分特征。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案:C

14.RFM方法中的F說明客戶的0

A、興趣度

B、粘性

C、當(dāng)前價(jià)值

D、未來價(jià)值

答案:A

15.關(guān)于主成分?jǐn)?shù)目的選取,正確的是()

A、保留多少個(gè)主成分取決于累計(jì)方差在方差總和中所占百分比

B、一般選擇50%以上

C、選擇前兩個(gè)就可以

D、選擇的數(shù)目和變量的個(gè)數(shù)一致

答案:A

16.下列關(guān)于數(shù)據(jù)重組的說法中,錯(cuò)誤的是0

A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集

B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒

C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成

D、數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新

答案:A

17.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()

A、CREATESCHEMA

B、CREATETABLE

C、CREATEVIEW

D、CREATEDATABASE

答案:D

18.當(dāng)時(shí)間序列數(shù)據(jù)點(diǎn)的一階差分近似為一常數(shù),可配合以下哪種預(yù)測(cè)模型()

A、直線

B、二次拋物線

C、三次拋物線

D、指數(shù)曲線

答案:A

19.對(duì)于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()

A、數(shù)據(jù)收集

B、數(shù)據(jù)存儲(chǔ)

C、數(shù)據(jù)分析

D、數(shù)據(jù)再利用

答案:D

20.線性回歸算法尋找()與預(yù)測(cè)目標(biāo)之間的線性關(guān)系。

A、屬性

B、根因

C、表象

答案:A

21.下面不屬于明細(xì)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)的是()。

A、接入率;

B、自動(dòng)采集率

C、及時(shí)率

D、完整率

答案:B

22.資金的時(shí)間價(jià)值是()

A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額

B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額

C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額

D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額

答案:B

23.以下哪種方法不屬于于監(jiān)督學(xué)習(xí)模型()

A、決策樹

B、線性回歸

C、關(guān)聯(lián)分析

D、判別分析

答案:C

24.在多元回歸模型的檢驗(yàn)中,目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性

水平上是否存在線性相關(guān)關(guān)系的檢驗(yàn)是()

A\r檢驗(yàn)

B、t檢驗(yàn)

C\f檢驗(yàn)

D、DW檢驗(yàn)

答案:B

25.關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說法正確的是()

A、當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混

合模型也能很好地處理。

B、混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布。

C、混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。

D、混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問題。

答案:B

26.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()

A、建立數(shù)據(jù)科學(xué)

B、完成數(shù)據(jù)應(yīng)用

C、配備數(shù)據(jù)硬件

D、吸納數(shù)據(jù)人才

答案:B

27.下面關(guān)于因子分析的說法正確的是()

A、因子分析就是主成分分析

B、因子之間可相關(guān)也可不相關(guān)

C、因子受量綱的影響

D、可以對(duì)因子進(jìn)行旋轉(zhuǎn),使其意義更明顯

答案:D

28.快速實(shí)現(xiàn)簡(jiǎn)單的MapReduce統(tǒng)計(jì),不必開發(fā)專門的MapReduce應(yīng)用,十分適合

數(shù)據(jù)倉庫的統(tǒng)計(jì)分析的是0。

AxMap;

B、Reduce

C、H.ive

D、SQL語句

答案:D

29.企業(yè)要建立預(yù)測(cè)模型,需準(zhǔn)備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是

0

A、數(shù)據(jù)越多越好

B、盡可能多的適合的數(shù)據(jù)

C、數(shù)據(jù)越少越好

D、以上三條都不正確

答案:B

30.以下哪個(gè)類型的變量在作預(yù)測(cè)客戶流失的模型中最有解釋力度?

A、人口基本數(shù)據(jù),比如年齡和性別

B、基本社會(huì)狀態(tài)數(shù)據(jù),比如收入和職業(yè)

C、業(yè)務(wù)數(shù)據(jù),比如消費(fèi)頻次

D、業(yè)務(wù)數(shù)據(jù)的衍生變量,比如最近3個(gè)月消費(fèi)頻次的變化情況

答案:D

31.將復(fù)雜的地址簡(jiǎn)化成北、中、南、東四區(qū),是在進(jìn)行?

A、數(shù)據(jù)正規(guī)化

B、數(shù)據(jù)一般化

C、數(shù)據(jù)離散化

D、數(shù)據(jù)整合

答案:B

32.Hadoop是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺(tái),是Appach的一個(gè)用()

語言實(shí)現(xiàn)開源軟件框架。

A、java

B\C.++

C、R語言

答案:A

33.大數(shù)據(jù)特征錯(cuò)誤的是()。

A、容量大;

B、類型多

C、價(jià)值高

D、系統(tǒng)多

答案:D

34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻

繁項(xiàng)集的算法,利用()搜索的方法挖掘頻繁項(xiàng)集。

A、逐層

B\逐級(jí)

C、自底向上

D、自上而下

答案:A

35.分類算法以()定理為基礎(chǔ),采用概率方法對(duì)數(shù)據(jù)進(jìn)行建模

A、決策樹

B、K-最鄰近

C、SVM

D、貝葉斯

答案:D

36.自然界中某種事物發(fā)生時(shí)其他事物也會(huì)發(fā)生,則這種聯(lián)系稱之為()o

A、連接

B、聯(lián)絡(luò)

C、關(guān)聯(lián)

D、聯(lián)系

答案:C

37.源業(yè)務(wù)系統(tǒng)接入數(shù)據(jù)中心的方式主要有:JDBCESB和()。

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案:C

38.下列哪個(gè)不屬于個(gè)人信息影響評(píng)估原則()

A、個(gè)人信息的處理目的、處理方式等是否合法、正當(dāng)、必要

B、對(duì)個(gè)人的影響及風(fēng)險(xiǎn)程度

C、誰主管誰負(fù)責(zé)

D、所采取的安全保護(hù)措施是否合法、有效并與風(fēng)險(xiǎn)程度相適應(yīng)。

答案:C

39.以下哪項(xiàng)關(guān)于決策樹的說法是錯(cuò)誤的0

A、冗余屬性不會(huì)對(duì)決策樹的準(zhǔn)確率造成不利的影響

B、子樹可能在決策樹中重復(fù)多次

C、決策樹算法對(duì)于噪聲的干擾非常敏感

D、尋找最佳決策樹是NP完全問題

答案:C

40.Hadoop框架中兩大核心是:()和MapReducE

A、H.CFS;

B、H.DFS

C、H.EFS

D、H.FFS

答案:B

41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式,便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律,的數(shù)據(jù)探索方法是

Oo

A、匯總統(tǒng)計(jì)法

B、概率統(tǒng)計(jì)法

C、可視化法

答案:C

42.矩估計(jì)的基本原理是0

A、用樣本矩估計(jì)總體矩

B、使得似然函數(shù)達(dá)到最大

C、使得似然函數(shù)達(dá)到最小

D、小概率事件在一次試驗(yàn)中是不可能發(fā)生的

答案:A

43.數(shù)據(jù)預(yù)處理目前常用的異常數(shù)據(jù)識(shí)別方法包括業(yè)務(wù)判別法、()、箱線圖判別

法、統(tǒng)計(jì)判別法

A、聚類判別法;

B、回歸判別法

C、抽樣判別法

答案:A

44.算法的核心思想是()逐層構(gòu)造一個(gè)樹。

A、自上而下

B、自下而上

C、自左向右

D、自右向左

答案:A

45.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

答案:D

46.什么是KDD?()

A、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)

B、領(lǐng)域知識(shí)發(fā)現(xiàn)

C、文檔知識(shí)發(fā)現(xiàn)

D、動(dòng)態(tài)知識(shí)發(fā)現(xiàn)

答案:A

47.某家長為了使孩子在第3-6年上大學(xué)的4年中,每年

年初得到10000元助學(xué)基金,他應(yīng)在2年前在銀行存入多少錢?(年利率按5%計(jì)算)

0

A、33771

B、30291

C、32163

D、45256

答案:A

48.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是0。

A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類

所有對(duì)象

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)

合并有重疊的簇

答案:A

49.SQL查詢語句中HAVING子句的作用是0

A、指出分組查詢的范圍

B、指出分組查詢的值

C、指出分組查詢的條件

D、指出分組查詢的內(nèi)容

答案:C

50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案:C

51.JS0N中的中括號(hào)一般來表示()。

A、數(shù)組;

B、標(biāo)點(diǎn)符號(hào)

C、對(duì)象

D、注釋

答案:C

52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。

A、線上

B、線下

C、實(shí)時(shí)

D、歷史

答案:D

53.Tableau在處理離線地圖時(shí),需要將標(biāo)記設(shè)置為()。

A、路徑;

B、區(qū)域

C、邊形

D、已填充地圖

答案:A

54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯(cuò)誤的有()

A、神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒

B、可以處理冗余特征

C、訓(xùn)練ANN是一個(gè)很耗時(shí)的過程

D、至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)

答案:A

55.美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明

了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

答案:B

56.當(dāng)時(shí)間序列的環(huán)比增長速度大體相同時(shí),適宜擬合()

A、指數(shù)曲線

B、拋物線

C、直線

D、對(duì)數(shù)曲線

答案:A

57.將多個(gè)指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)指標(biāo)的一種統(tǒng)計(jì)分析方法是()o

A、數(shù)據(jù)預(yù)處理;

B、數(shù)據(jù)降維

C、主成分分析

D、假設(shè)檢驗(yàn)

答案:C

58.設(shè)X={1,213)是頻繁項(xiàng)集,則可由X可產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。

A、3

B、4

C、5

D、6

答案:D

59.當(dāng)一個(gè)連續(xù)變量的缺失值占比在85%左右時(shí),以下哪種方式最合理()

A、直接使用該變量

B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量

C、使用多重插補(bǔ)的方法進(jìn)行缺失值填補(bǔ)

D、直接刪除該變量

答案:B

60.大數(shù)據(jù)分析挖掘流程正確的是()。

A、業(yè)務(wù)理解一數(shù)據(jù)理解T數(shù)據(jù)準(zhǔn)備T建立模型一模型評(píng)估;

B、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T建立模型T模型評(píng)估;

C、業(yè)務(wù)理解T數(shù)據(jù)準(zhǔn)備T數(shù)據(jù)理解T模型評(píng)估T建立模型;

D、業(yè)務(wù)理解-?數(shù)據(jù)準(zhǔn)備-?模型評(píng)估T數(shù)據(jù)理解T建立模型

答案:A

61.()是統(tǒng)計(jì)學(xué)的基礎(chǔ),是統(tǒng)計(jì)學(xué)里面最重要的概率分布

A、正態(tài)分布;

B、靜態(tài)分布

C、動(dòng)態(tài)分布

D、穩(wěn)態(tài)分布

答案:A

62.因子分析的主要作用有()

A、對(duì)變量進(jìn)行降維

B、對(duì)變量進(jìn)行判別

C、對(duì)變量進(jìn)行聚類

D、以上都不對(duì)

答案:A

63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()

A、D.XP;

B、E.SP

C、OGG

D、E.TL

答案:D

64.給定歷史時(shí)間數(shù)據(jù),通過擬合時(shí)序模型,分析研究時(shí)序數(shù)據(jù)的發(fā)展變化規(guī)律,

得出觀測(cè)數(shù)據(jù)的歷史統(tǒng)計(jì)特征再據(jù)此進(jìn)行外推預(yù)測(cè)目標(biāo)的分析方法是()。

A、聚類;

B、回歸

C、時(shí)間序列

D、匯總統(tǒng)計(jì)

答案:C

65.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。

A、統(tǒng)計(jì)報(bào)表

B、網(wǎng)絡(luò)爬蟲

C、API接口

D、傳感器

答案:D

66.假設(shè)檢驗(yàn)中顯著性水平是:)

A、推斷時(shí)犯取偽錯(cuò)誤的概率

B、推斷時(shí)取偽棄真的概率

C、正確推斷的概率

D、是推斷的可信度

答案:B

67.以下哪些算法是分類算法。

A、DBSCAN

B、C4.5

C、K-Mean

D、EM

答案:B

68.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯(cuò)誤的是0。

A、大數(shù)據(jù)起源互聯(lián)網(wǎng),目前處于成熟期;

B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)用大數(shù)據(jù);

C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地;

D、互聯(lián)網(wǎng)上形成了多種相對(duì)成熟的應(yīng)用模式。

答案:A

69.下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說法中,錯(cuò)誤的是()

A、1I<B<1MB<1GB

B、基本單位是字節(jié)(Byte)

C、一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間

D、一個(gè)字節(jié)能夠容納一個(gè)英文字符

答案:C

70.當(dāng)置信水平一定時(shí),置信區(qū)間的寬度()

A、隨著樣本量的增大而減小

B、隨著樣本量的增大而增大

C、與樣本量的大小無關(guān)

D、先隨著樣本量的增大而減小,到一定程度后會(huì)隨著樣本

量的增大而增大。

答案:A

71.倒傳遞神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))的訓(xùn)練順序?yàn)楹危?A:調(diào)整權(quán)重;B:計(jì)算誤差值;

C:利用隨機(jī)的權(quán)重產(chǎn)生輸出的結(jié)果)

AvBCA

B、CAB

C、BAC

D、CBA

答案:D

72.個(gè)人信息保護(hù)影響評(píng)估報(bào)告和處理情況記錄應(yīng)當(dāng)至少保存()年。

A、—

B、+

C、五

D、三

答案:D

73.資金的時(shí)間價(jià)值是()

A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額

B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額

C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額

D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額

答案:B

74.有一條關(guān)聯(lián)規(guī)則為AT

B,此規(guī)則的信心水平(confidence)為60%,則代表()

A、買B商品的顧客中,有60%的顧客會(huì)同時(shí)購買A

B、同時(shí)購買

A,B兩商品的顧客,占所有顧客的60%

C、買A商品的顧客中,有60%的顧客會(huì)同時(shí)購買B

D、兩商品

A.B在交易數(shù)據(jù)庫中同時(shí)被購買的機(jī)率為60%

答案:C

75.有一組數(shù)據(jù)其均值是20,對(duì)其中的每一個(gè)數(shù)據(jù)都加上

10.那么得到的這組新數(shù)據(jù)的均值是0。

A、20

B、10

C、15

D、30

答案:D

76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是0。

A、藍(lán)牙;

B、云計(jì)算

C、Wi-Fi

D、博弈論

答案:B

77.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展強(qiáng)、數(shù)據(jù)挖掘能力

強(qiáng)等特點(diǎn)的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案:D

78.用于分類與回歸應(yīng)用的主要算法有:()

AxApriori算法、HotSpot算法

B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹

C、K均值法、S0M神經(jīng)網(wǎng)絡(luò)

D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯

答案:D

79.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、

并行計(jì)算、海量存儲(chǔ)和海量管理等。

A、點(diǎn)計(jì)算

B、線計(jì)算

C、云計(jì)算

D、面計(jì)算

答案:C

80.描述一組對(duì)稱(或正態(tài))分布數(shù)據(jù)的離散程度時(shí),最適宜選擇的指標(biāo)是0

A、極差

B、標(biāo)準(zhǔn)差

C、均值

D、變異系數(shù)

答案:B

81.考慮下面的頻繁3-項(xiàng)集的集合:(1.213},{1,2,

4},[1,3,4},{1,3,5},{2,3.4},[2,3,5},

{3.4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),若采用合并策略,則由候選產(chǎn)生過程得到4-項(xiàng)

集不包含()

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,45

答案:C

82.相關(guān)分析與回歸分析的一個(gè)重要區(qū)別是()

A、前者研究變量之間關(guān)系的密切程度,后者研究變量間的變動(dòng)關(guān)系,并用方程式

表示

B、前者研究變量之間的變動(dòng)關(guān)系,后者研究變量間關(guān)系的密切程度

C、兩者都研究變量間的變動(dòng)關(guān)系

D、兩者都不研究變量間的變動(dòng)關(guān)系

答案:A

83.SQL語句中刪除表的命令是()

A、DROPTABLE

B、DELETETABLE

C、ERASETABLE

D、DELETEDBF

答案:A

84.已知事件A的概率P(A)=0.6,U為必然事件,則P(A+U)=1,P(AU)二

A、0.4

B、0.6

C、0

D、1

答案:B

85.邁克爾?波特的“五力模型”中,五種競(jìng)爭(zhēng)力量中不包括0

A、新進(jìn)入者

B、供應(yīng)商議價(jià)能力

C、其他利益相關(guān)者力量

D、行業(yè)中現(xiàn)有競(jìng)爭(zhēng)者

答案:C

86.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13.

15,35,50,55,72,92,204,215使用等寬劃分(寬度為50)

方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子?()

A、第1個(gè)

B、第2個(gè)

C、第3個(gè)

D、第4個(gè)

答案:A

87.()是研究一種或者多種因素的變化對(duì)試驗(yàn)結(jié)果的觀測(cè)值是否有顯著影響的統(tǒng)

計(jì)方法。

A、因子分析;

B、數(shù)據(jù)降維

C、方差分析

D、假設(shè)檢驗(yàn)

答案:C

88.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購買尿布,這種屬

于數(shù)據(jù)挖掘的哪類問題?()

A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B、聚類

C、分類

D、自然語言處理

答案:A

89.以下哪個(gè)指標(biāo)不能用于線性回歸中的模型比較()

A、R方

B、調(diào)整R方

C、AIC

D、BIG

答案:A

90.下面關(guān)于聚類分析說法錯(cuò)誤的是0

A、一定存在一個(gè)最優(yōu)的分類

B、聚類分析是無監(jiān)督學(xué)習(xí)

C、聚類分析可以用于判斷異常值

D、聚類分析即:物以類聚,人以群分

答案:A

91.分類變量使用以下哪個(gè)統(tǒng)計(jì)量進(jìn)行缺失值填補(bǔ)較合適

A、均值

B、最大值

C、眾數(shù)

D、中位數(shù)

答案:C

92.若數(shù)據(jù)量較大,下面哪種方式比較適合()

A、系統(tǒng)聚類

B、快速聚類(k-means)

C、A和B都可以

D\A和B都不可以

答案:B

93.在對(duì)歷史數(shù)據(jù)集進(jìn)行分區(qū)之前進(jìn)行數(shù)據(jù)清洗(缺失值填補(bǔ)等)的缺點(diǎn)是什么

A、違反了建模的假設(shè)條件

B、加大了處理的難度

C、無法針對(duì)分區(qū)后各個(gè)數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗

D、無法對(duì)不同數(shù)據(jù)清理的方法進(jìn)行比較,以選擇最優(yōu)方法

答案:D

94.數(shù)據(jù)倉庫是隨著時(shí)間變化的,下面的描述不正確的是()

A、數(shù)據(jù)倉庫隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容

B、捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照

C、數(shù)據(jù)倉庫隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行

重新綜合

答案:C

95.SQL語言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()

A、DELETE

B、DROP

GCLEAR

D、REMORE

答案:A

96.依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法律、行政法規(guī)的規(guī)定,()負(fù)責(zé)統(tǒng)

籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。

A、工業(yè)和信息化部

B、國家安全部門

C、國家網(wǎng)信部門

D、通信主管部門

答案:C

97.假設(shè)屬性ine的最大最小值分別是12000

元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到。至1的范圍內(nèi)。

對(duì)屬性ine的73600元將被轉(zhuǎn)化為()

A、0.751

B、0.163

C、0.457

D、0.716

答案:D

98.建立一個(gè)模型,通過這個(gè)模型根據(jù)已知的變量值來預(yù)測(cè)其他某個(gè)變量值屬于

數(shù)據(jù)挖掘的哪一類任務(wù)?()

A、根據(jù)內(nèi)容檢索

B、建模描述

C、預(yù)測(cè)建模

D、尋找模式和規(guī)則

答案:C

99.自動(dòng)化高級(jí)分析實(shí)驗(yàn)室,實(shí)現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián),實(shí)現(xiàn)數(shù)據(jù)的自助組表、

自助分析功能,滿足不同層級(jí),不同水平的用戶需求的是0

A、初級(jí)分析;

B、綜合分析

C、典型分析

D、高級(jí)分析

答案:D

100.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是0

A、所得稅

B、建設(shè)投資

C、經(jīng)營成本

D、營業(yè)收入

答案:D

101.一組N個(gè)觀測(cè)值按數(shù)值大小排列,分成100份,處于X%位置的值稱第X個(gè)百

分位數(shù)稱為()。

A、分位數(shù)

B、中位數(shù)

C、眾數(shù)

答案:A

102.開始將N個(gè)樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,

然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其他類的距離,重復(fù)進(jìn)行兩

個(gè)最近類的合并,每次減少一類,直至所有的樣品合并為一類,此種聚類方法是()

A、K-means

B、SOM聚類

C、系統(tǒng)聚類

D、有序聚類

答案:C

103.指數(shù)平滑法可以用以下哪種指標(biāo)來反映對(duì)時(shí)間序列資料的修正程度()

A、平滑常數(shù)

B、指數(shù)平滑數(shù)初始值

C、跨越期

D、季節(jié)指數(shù)

答案:A

104.變量的量綱比如以厘米或者米為單位對(duì)下面哪種方法會(huì)有影響0

A、方差分析

B、回歸分析

C、聚類分析

D、主成分分析

答案:C

105.關(guān)于Tableau的特點(diǎn),以下說法錯(cuò)誤的是()

A、學(xué)習(xí)成本低,簡(jiǎn)單易用;

B、圖表精美;

C、開發(fā)快速,分享便捷;

D、需要IT大量人員參與

答案:D

106.在ID3算法中信息增益是指()

A、信息的溢出程度

B、信息的增加效益

C、烯增加的程度最大

D、炳減少的程度最大

答案:D

107.一組數(shù)據(jù)中最大值與最小值的差值稱為0,也稱全距。

A、極差

B、極距

C、距離

D、方差

答案:A

108.()是一種開源軟件編程語言,主要用于統(tǒng)計(jì)分析,繪圖和數(shù)據(jù)挖掘,內(nèi)置多種

統(tǒng)計(jì)及分析功能。

A、H.IVE;

B、H.ADOOP

C、R;

D、H.FDS

答案:C

109.決策樹中的InformationGain的計(jì)算是用來?

A、剪枝

B、使樹成長

C、處理缺失值和異常值

D、砍樹

答案:B

110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。

A、線性

B、非線性

C、預(yù)測(cè)

D、估算

答案:B

111.數(shù)據(jù)庫系統(tǒng)是由0組成的

A、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和用戶

B、數(shù)據(jù)文件、命令文件和報(bào)表

C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)

D、常量、變量和函數(shù)

答案:A

112.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨(dú)立性高

答案:C

113.某小區(qū)60%居民訂晚報(bào),45%訂青年報(bào),30%兩報(bào)均訂,隨機(jī)抽一戶。則至少訂

一種報(bào)的概率為()

A、0.82

B、0.85

C、0.80

D、0.75

答案:D

114.關(guān)于統(tǒng)計(jì)學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說法錯(cuò)誤的是0。

A、面臨大數(shù)據(jù),統(tǒng)計(jì)學(xué)的研究對(duì)象有所改變;

B、在大數(shù)據(jù)環(huán)境中,需要首先將未知的問題轉(zhuǎn)化為可用的統(tǒng)計(jì)方法;

C、在大數(shù)據(jù)分析過程中,傳統(tǒng)的統(tǒng)計(jì)分析過程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸?/p>

量一定性”;

D、在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計(jì)研究的對(duì)象范圍擴(kuò)展到一切數(shù)據(jù)。

答案:A

115.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展差、數(shù)據(jù)挖掘能力

強(qiáng)等特點(diǎn)的分析工具是()。

A、Weka

B、SPSS

C、SAS

D、R

答案:B

116.下列說明錯(cuò)誤的是()

A、性別二“男”二)職業(yè)二“司機(jī)”,是布爾型關(guān)聯(lián)規(guī)則

B、性別二“女"二》avg(收入)二2300,是一個(gè)數(shù)值型

關(guān)聯(lián)規(guī)則

C、肝炎券ALT(丙氨酸轉(zhuǎn)氨酶)升高,是一個(gè)單層關(guān)聯(lián)規(guī)則

D、性別二“女”二〉職業(yè)二“秘書”,是多維關(guān)聯(lián)規(guī)則

答案:C

117.Hive是基于Hadoop的一個(gè)數(shù)據(jù)()工具

A、分析;

B、倉庫

C、制圖

D、可視化

答案:B

118.數(shù)據(jù)記錄內(nèi)容完整比例,包括指標(biāo)單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整,

指標(biāo)字段值完整稱為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率;

D、指標(biāo)數(shù)據(jù)完整率

答案:D

119.EXCEL中,求標(biāo)準(zhǔn)差的函數(shù)是0

A、AVERAGE

B、MEDIAN

C、MODE

D、STDEV

答案:D

120.對(duì)于下列實(shí)驗(yàn)數(shù)據(jù):1,108,11,8,5,6,8,

8,7,11,描述其集中趨勢(shì)用()最為適宜,其值是()。

A、平均數(shù),14.4

B、中位數(shù),8.5

C、眾數(shù),8

D、以上都可以

答案:C

121.《個(gè)人信息保護(hù)法》發(fā)布執(zhí)行時(shí)間()。

A、2021年9月1日;

B、2021年10月1日;

C、2021年11月1日

D、2021年12月1日

答案:C

122.檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于

()的離群點(diǎn)檢測(cè)

A、統(tǒng)計(jì)方法

B、鄰近度

C、密度

D、聚類技術(shù)

答案:A

123.下列關(guān)于聚類挖掘技術(shù)的說法中,錯(cuò)誤的是()

A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能

C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能

D、與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理

答案:B

124.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分分為0

A、結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)

B、強(qiáng)結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)

C、截面數(shù)據(jù)、面板數(shù)據(jù)

D、一級(jí)數(shù)據(jù)、二級(jí)數(shù)據(jù)、三級(jí)數(shù)據(jù)

答案:A

125.當(dāng)前國內(nèi)社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()

A、互聯(lián)網(wǎng)

B、物聯(lián)網(wǎng)

C、綜合國力

D、自然資源

答案:A

126.()是一種松散耦合的服務(wù)和應(yīng)用之間標(biāo)準(zhǔn)的集成方式。

A、E.SB;

B、D.M

C、ODS

D、E.TL

答案:A

127.在建立線性回歸(LinearRegression)之前我們可以利用何種方法挑選重要

屬性,以降低模型的復(fù)雜度?

A、皮爾森相關(guān)系數(shù)

B、卡方檢定

C、T-檢定

D、Z-Score

答案:A

128.給定一個(gè)置信概率和置信區(qū)域,若誤差超過置信區(qū)域,則認(rèn)為誤差不是隨機(jī)

誤差引起,視為異常值的判別方法Oo

A、聚類判別法;

B、回歸判別法

C、抽樣判別法

D、統(tǒng)計(jì)判別法

答案:D

129.ROC曲線凸向哪個(gè)角,代表模型越理想?

A、左上角

B、右上角

C、左下角

D、右下角

答案:A

130..給出下列結(jié)論:

1)在回歸分析中,可用指數(shù)系數(shù)R方的值判斷模型的擬合效果,R方越大,模型的

擬合效果越好;

2)在回歸分析中,可用殘差平方和判斷模型的擬合效果,殘差平方和越大,模型的

擬合效果越好;

⑶在回歸分析中,可用相關(guān)系數(shù)r的值判斷模型的擬合效果,r越小,模型的擬合

效果越好;

(4)在回歸分析中,可用殘差圖判斷模型的擬合效果,殘差點(diǎn)比較均勻地落在水平

的帶狀區(qū)域中,說明這樣的模型比較

合適.帶狀區(qū)域的寬度越寬,說明模型的擬合精度越高.以上結(jié)論中,正確的有()

個(gè).

A、1

B、2

C、3

D、4

答案:A

131.回歸是一種預(yù)測(cè)建模技術(shù)研究()和()的依存關(guān)系。

A、預(yù)測(cè)值、實(shí)際值

B、自變量、因變量

C、絕對(duì)誤差、平方誤差

D、測(cè)試樣本、集合

答案:B

132.ODS是指()

A、企業(yè)數(shù)據(jù)中心;

B、數(shù)據(jù)倉庫

C、操作型存儲(chǔ)

D、總線

答案:B

133.用簡(jiǎn)單隨機(jī)重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,

則樣本容量需要擴(kuò)大到原來的()

A、2倍

B、3倍

C、4倍

D、5倍

答案:C

133假設(shè){BCE)為一頻繁項(xiàng)目集(FrequentItemset),則根據(jù)AprioriPrinciple

以下何者不是子頻繁項(xiàng)目?

A、BC

B、CE

C、C

D、CD

答案:D

135.假如學(xué)生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄,為了說

明全班同學(xué)考試成績的水平高低,其集中趨勢(shì)的測(cè)度0

A、可以采用算術(shù)平均數(shù)

B、可以采用眾數(shù)或中位數(shù)

C、只能采用眾數(shù)

D、只能采用四分位數(shù)

答案:C

136.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?

0

A、數(shù)據(jù)獲取

B、分類和預(yù)測(cè)

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)可視化

答案:C

137.在有指導(dǎo)的數(shù)據(jù)挖掘中,有關(guān)測(cè)試集的說法錯(cuò)誤的是0

A、測(cè)試集和訓(xùn)練集是相互聯(lián)系的

B、測(cè)試集是用以測(cè)試模型的數(shù)據(jù)集

C、通常測(cè)試集大約占總樣本的三分之一

D、K-次交叉驗(yàn)證中,測(cè)試集只有1個(gè),訓(xùn)練集有K-1個(gè)

答案:A

138.以下那一項(xiàng)不是大數(shù)據(jù)提供的用戶交互方式是0。

A、企業(yè)報(bào)表;

B、查詢

C、大數(shù)據(jù)分析挖掘

D、可視化

答案:A

139.表示職稱為副教授、性別為男的表達(dá)式為0

A、職稱二‘副教授'0R性別=‘男’

B、職稱二'副教授'AND性別='男'

C、BETWEEN'副教授'AND'男,

D、IN(‘副教授‘,‘男‘)

答案:B

140.Logistic回歸是在商業(yè)領(lǐng)域上使用最廣泛的預(yù)測(cè)模型,常用于()分類變量

預(yù)測(cè)和概率預(yù)測(cè)。

A、四值

B、三值

C、二值

D、一值

答案:C

141.檢查異常值常用的統(tǒng)計(jì)圖形是()

A、柱狀圖

B、箱線圖

C、帕累托圖

D、氣泡圖

答案:B

142.以下哪條屬于個(gè)人信息影響的評(píng)估場(chǎng)景:()

A、處理敏感個(gè)人信息,利用個(gè)人信息進(jìn)行自動(dòng)化決策

B、委托處理個(gè)人信息、向第三方提供個(gè)人信息、公開個(gè)人信息

C、向境外提供個(gè)人信息

D、以上皆是

答案:D

143.《個(gè)人信息保護(hù)法》對(duì)于企業(yè)的影響不包括()

A、需要強(qiáng)化個(gè)人信息處理這主體責(zé)任

B、明確了可以量化的中國版執(zhí)行罰則

C、需要設(shè)立負(fù)責(zé)處理個(gè)人信息保護(hù)相關(guān)事務(wù)的專門機(jī)構(gòu)和指定代表

D、收集和處理數(shù)據(jù)時(shí)可以不遵循“最小化”原則

答案:D

144.實(shí)際由源業(yè)務(wù)系統(tǒng)自動(dòng)接入的指標(biāo)數(shù)據(jù)占指標(biāo)體系中應(yīng)接指標(biāo)總數(shù)的比例

稱為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率;

D、指標(biāo)數(shù)據(jù)完整率

答案:A

145.假設(shè)檢驗(yàn)中,拒絕域的邊界稱為()

A、臨界值

B、臨界點(diǎn)

C、置信水平

D、邊際值

答案:A

146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是0

A、大數(shù)據(jù)是指無法再容許的時(shí)間內(nèi)用常規(guī)的軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理

和處理的數(shù)據(jù)集合,大數(shù)據(jù)規(guī)模的標(biāo)準(zhǔn)是持續(xù)變化的,當(dāng)前泛指單一的數(shù)據(jù)集的

大小在幾十TB和PB之間;

B、大數(shù)據(jù)是一項(xiàng)技術(shù),能夠?qū)?fù)雜海量數(shù)據(jù)進(jìn)行實(shí)時(shí)獲取、

傳輸、存儲(chǔ)、加工和利用的高薪技術(shù);

C、大數(shù)據(jù)是一種挑戰(zhàn),現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理和分析技術(shù)已無法適

用于現(xiàn)有的需要;

D、大數(shù)據(jù)是一個(gè)時(shí)代,擁有大數(shù)據(jù)是時(shí)代的特征、解讀大數(shù)據(jù)是時(shí)代的任務(wù)、應(yīng)

用大數(shù)據(jù)是時(shí)代的機(jī)遇。

答案:A

147,數(shù)據(jù)收集的標(biāo)準(zhǔn)為()而非動(dòng)用企業(yè)全部數(shù)據(jù)。

A、一致性、可靠性、時(shí)效性

B、相同性、可靠性、時(shí)效性

C、C相關(guān)性、可靠性、時(shí)效性

D、一致性、可靠性、實(shí)際性

答案:C

148.MySQL是()

A、操作系統(tǒng);

B、數(shù)據(jù)庫

C、聊天軟件

D、瀏覽器

答案:B

149.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其

他標(biāo)簽的數(shù)據(jù)相分離?()

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、主成分分析

答案:B

150.某超市研究銷售記錄發(fā)現(xiàn)購買奶的很概率會(huì)購買包,這種屬于數(shù)據(jù)挖掘的

哪類問題?()

A、聚類分析

B、關(guān)聯(lián)規(guī)則

C、分類分析

D、自然語言處理

答案:B

151.蘋果公司對(duì)IPHONE的降價(jià)行為屬于0

A、地域性差別定價(jià)

B、時(shí)間性差別定價(jià)

C、非線性定價(jià)或數(shù)量折扣定價(jià)

D、其他形式的定價(jià)

答案:B

152.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其

他標(biāo)簽的數(shù)據(jù)相分離?

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、隱馬爾可夫鏈

答案:B

153.NaiveBayes是屬于數(shù)據(jù)挖掘中的什么方法?

A、聚類

B、分類

C、時(shí)間序列

D、關(guān)聯(lián)規(guī)則

答案:B

154.《中華人民共和國數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對(duì)()

的記錄。

Av數(shù)據(jù)

B、信息

C、文件

D、知識(shí)

答案:B

155.下列不屬于原始數(shù)據(jù)來源的是()

A、行政記錄

B、統(tǒng)計(jì)調(diào)查

C、統(tǒng)計(jì)年鑒

D、實(shí)驗(yàn)

答案:C

156.數(shù)據(jù)挖掘技術(shù)包括三個(gè)主要的部分()

A、數(shù)據(jù)、模型、技術(shù)

B、算法、技術(shù)、領(lǐng)域知識(shí)

C、數(shù)據(jù)、建模能力、算法與技術(shù)

D、建模能力、算法與技術(shù)、領(lǐng)域知識(shí)

答案:C

157.(),用于顯示樹狀結(jié)構(gòu)數(shù)據(jù)。

A、矩形式樹狀結(jié)構(gòu)圖;

B、平行結(jié)構(gòu)樹

C、垂直結(jié)構(gòu)樹

答案:A

158.在Excel工作表中,在某單元格內(nèi)輸入數(shù)值123,不正確的輸入形式是0

A、123

B、=123

C、+123

D、*123

答案:D

159.分析顧客消費(fèi)行業(yè),以便有針對(duì)性的向其推薦感興趣的服務(wù),屬于()問題。

A、關(guān)聯(lián)規(guī)則挖掘

B、分類與回歸

C、聚類分析

D、時(shí)序預(yù)測(cè)

答案:A

160.在有關(guān)數(shù)據(jù)倉庫測(cè)試,下列說法不正確的是()

A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對(duì)數(shù)據(jù)倉庫進(jìn)行各種測(cè)試.測(cè)試工作中要

包括單元測(cè)試和系統(tǒng)測(cè)試

B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試

C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉庫的所有組件進(jìn)行大量的

功能測(cè)試和回歸測(cè)試

D、在測(cè)試之前沒必要制定詳細(xì)的測(cè)試計(jì)劃

答案:D

161.Byte代表一個(gè)字節(jié),及()的數(shù)值范圍。

A、0~100

B、0~155

C、0~200

D、0~255

答案:D

162.目前常用的識(shí)別異常數(shù)據(jù)的方法有物理判別法和0。

A、化學(xué)判別法

B、統(tǒng)計(jì)判別法

C、靜態(tài)判別法

D、動(dòng)態(tài)判別法

答案:B

163,下列有關(guān)Apriori算法的說法中不正確的是()

A、Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。

B、應(yīng)用Apriori算法時(shí),需要先設(shè)定模型的最小支持度、最小置信度等閾值。

C、應(yīng)用Apriori算法時(shí),輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是離散型數(shù)據(jù)。

DxApriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項(xiàng)集中項(xiàng)的數(shù)量。

答案:C

164.VBA語言中,聲明變量的關(guān)鍵字是()。

A、SET;

B、C.ONST

C、PRIVATE

D、IM

答案:D

165.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨(dú)立性高

答案:C

166.維度規(guī)約是在以下哪個(gè)步驟的任務(wù)?()

A、頻繁模式挖掘

B、降維

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)流挖掘

答案:C

167.屬于財(cái)務(wù)專業(yè)明細(xì)數(shù)據(jù)表的是()

A、客戶收費(fèi)流水表;

B、應(yīng)收票據(jù)信息表;

C、公司分壓線損統(tǒng)計(jì)表;

D、供應(yīng)計(jì)劃表

答案:B

168.以下哪個(gè)變量可以反映客戶的忠誠度?()

A、購買頻次

B、購買金額

C、最后一次購買時(shí)間

D、購買金額波動(dòng)率

答案:A

169.某項(xiàng)目預(yù)計(jì)運(yùn)行5年后的凈現(xiàn)值為4500萬元,如折現(xiàn)率為16%,其終值應(yīng)為()

萬元(說明:結(jié)果保留兩位小數(shù))

A、8045.86

B、6996.21

C、9451.54

D、7000.02

答案:C

170.數(shù)據(jù)在規(guī)定的時(shí)間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為0

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率;

D、指標(biāo)數(shù)據(jù)完整率

答案:C

171.數(shù)據(jù)正規(guī)化(DataNormaIization)是在知識(shí)發(fā)掘處理

(KnowIedgeDiscoveryProcess)中的哪一個(gè)階段進(jìn)行?

A、數(shù)據(jù)清洗

B、數(shù)據(jù)選擇

C、數(shù)據(jù)編碼

D、數(shù)據(jù)擴(kuò)充

答案:C

172.東北人養(yǎng)了一只雞和一頭豬。一天雞問豬:”主人呢?“豬說:“出去買蘑菇了。

“雞聽了撒丫子就跑。豬說:“你跑什么?"雞叫道:“有本事主人買粉條的時(shí)候你小

子別跑!”

以上對(duì)話體現(xiàn)了數(shù)據(jù)分析方法中的()

A、關(guān)聯(lián)

B、聚類

C、分類

D、自然語言處理

答案:A

173.以下敘述正確的是0

A、極差較少受異常值的影響

B、四分位差較少受異常值的影響

C、方差較少受異常值的影響

D、標(biāo)準(zhǔn)差較少受異常值的影響

答案:B

174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類。

A、季度需求

B、月度需求

C、周需求

D、即時(shí)需求

答案:D

175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系,典型例子是購物籃分析,常見算法有

Apriori關(guān)聯(lián)算法和()算法。

A、貝葉斯算法

B、線性回歸

C、F.P-growth關(guān)聯(lián)算法

D、聚類算法

答案:C

176.無監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法

A、聚類算法;

B、降維算法;

C、關(guān)聯(lián)規(guī)則算法;

D、文本挖掘

答案:A

177.以下哪些分類方法可以較好地避免樣本的不平衡問題?

0

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

答案:A

178.數(shù)據(jù)倉庫的最終目的是0

A、收集業(yè)務(wù)需求

B、建立數(shù)據(jù)倉庫邏輯模型

C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析

D、為用戶和業(yè)務(wù)部門提供決策支持

答案:D

179.下列不屬于分類算法的是()

A、C4.5算法

B、邏輯回歸

C、KNN算法

D、TF-TDF算法

答案:D

180.如下哪個(gè)不是最近鄰分類器的特點(diǎn)0

A、它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型

B、分類一個(gè)測(cè)試樣例開銷很大

C、最近鄰分類器基于全局信息進(jìn)行預(yù)測(cè)

D、可以生產(chǎn)任意形狀的決策邊界

答案:C

181.通過(),計(jì)算頻數(shù)、眾數(shù)、中位數(shù)等一個(gè)或多個(gè)數(shù)據(jù)指標(biāo),探索數(shù)據(jù)的分布結(jié)

構(gòu)。

A、概率統(tǒng)計(jì)法

B、匯總統(tǒng)計(jì)法

C、可視化法

D、分類統(tǒng)計(jì)法

答案:B

182.MapReduce是一種()計(jì)算模型

A、集中式;

B、分布式

C、離散式

D、放射式

答案:B

183.一種商品價(jià)格變動(dòng)與由此引起另外一種商品需求量相對(duì)變動(dòng)的比率稱為()

A、需求價(jià)格彈性

B、供給價(jià)格彈性

C、需求交叉彈性

D、供給交叉彈性

答案:C

184.請(qǐng)問以下何者屬于時(shí)間序列的問題?

A、信用卡發(fā)卡銀行偵測(cè)潛在的卡奴

B、基金經(jīng)理人針對(duì)個(gè)股做出未來價(jià)格預(yù)測(cè)

C、電信公司將人戶區(qū)分為數(shù)個(gè)群體

D、以上均不是

答案:B

185.非參數(shù)檢驗(yàn)是針對(duì)()分布情況做的假設(shè)。

A、總體

B、局部

C、個(gè)體

答案:A

186.分類器效果檢驗(yàn)中的準(zhǔn)確率是指()

A、預(yù)測(cè)正確的數(shù)據(jù)在總數(shù)據(jù)中的比例

B、預(yù)測(cè)為正的數(shù)據(jù)在總數(shù)據(jù)中的比例

C、預(yù)測(cè)為正的數(shù)據(jù)中實(shí)際為正的數(shù)據(jù)所占比例

D、實(shí)際為正的數(shù)據(jù)中被預(yù)測(cè)為正的數(shù)據(jù)所占比例

答案:C

187.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時(shí)間0。

A、2021年9月1日;

B、2021年10月1日;

C、2021年11月1日

D、2021年12月1日

答案:A

188.實(shí)際接入的指標(biāo)數(shù)占應(yīng)接指標(biāo)總數(shù)的比例,統(tǒng)計(jì)時(shí)又分線上和線下接入率稱

為()

A、指標(biāo)數(shù)據(jù)自動(dòng)采集率;

B、指標(biāo)數(shù)據(jù)接入率

C、指標(biāo)數(shù)據(jù)接入及時(shí)率;

D、指標(biāo)數(shù)據(jù)完整率

答案:B

189.關(guān)于回歸分析,下列說法中錯(cuò)誤的是0

A、作回歸分析的變量之間要有實(shí)際意義,不能把毫無關(guān)聯(lián)的兩種現(xiàn)象隨意進(jìn)行回

歸分析,要結(jié)合專業(yè)知識(shí)對(duì)兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。

B、在進(jìn)行線性回歸分析進(jìn)行的數(shù)據(jù)準(zhǔn)備的時(shí)候,要求因變量y和自變量x都是符

合總體正態(tài)的隨機(jī)變量。

C、回歸直線不要隨意外延

D、所有非線性回歸都可以轉(zhuǎn)化為線性回歸

答案:D

190.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標(biāo)之間的數(shù)量關(guān)系()NPV>0

Av當(dāng)PK1,IRR>iNPV>0

B、當(dāng)Pl>1,IRR>iNPV<0

C、當(dāng)Pl<1時(shí),IRR>i,NPV<0、當(dāng)DPI>1IRR>i,時(shí),

答案:B

191.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是

0

A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象。

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同

形狀的簇。

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)

合并有重疊的簇。

答案:A

192..人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣,這屬于空調(diào)產(chǎn)品整

體概念中的()

A、有形產(chǎn)品

B、直接產(chǎn)品

C、核心產(chǎn)品

D、主要產(chǎn)品

答案:C

193.某牙膏廠原來生產(chǎn)兩面針?biāo)幬镅栏?現(xiàn)在又增加牙刷生產(chǎn),這屬于()

A、同心多元化

B、水平多元化

C、集團(tuán)多元化

D、相關(guān)多元化

答案:B

194.在發(fā)生或者可能發(fā)生個(gè)人信息泄露、毀損、丟失的情況時(shí),應(yīng)當(dāng)立即采取()

措施,按照規(guī)定及時(shí)告知用戶并向有關(guān)主管部門報(bào)告。()

A\彌補(bǔ)

B、補(bǔ)救

C、救援

D、相關(guān)

答案:B

多選題

1.以下算法中對(duì)缺失值敏感的有()

A、Logistic回歸

B、SVM算法

C、CART決策樹

D、樸素貝葉斯

答案:AB

2.以下關(guān)于皮爾森相關(guān)分析敘述正確的是()

A、兩變量獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然等于0

B、兩變量皮爾森相關(guān)系數(shù)不等于0,兩者必然不獨(dú)立

C、皮爾森相關(guān)系數(shù)是否等于零,不能指明兩變量是否獨(dú)立

D、兩變量不獨(dú)立,兩者的皮爾森相關(guān)系數(shù)必然不等于0

答案:AB

3.配合一元線性回歸方程須具備下列前提條件0

A、現(xiàn)象間確實(shí)存在數(shù)量上的相互依存關(guān)系

B、現(xiàn)象間的關(guān)系是直線關(guān)系,這種直線關(guān)系可用散點(diǎn)圖來表示

C、具備一組自變量與因變量的對(duì)應(yīng)資料,且能明確哪個(gè)是自變量,哪個(gè)是因變量

D、兩個(gè)變量之間不是對(duì)等關(guān)系

答案:ABCD

4.下面關(guān)于季度模型的敘述,不正確的是0

A、季度模型以季度數(shù)據(jù)為樣本

B、季度模型主要用于季度預(yù)測(cè)

C、季度模型注重長期行為的描述

D、季度模型一般規(guī)模較大

答案:AB

5.如果自變量有連續(xù)型變量,則適用的分類預(yù)測(cè)方法有0

A、邏輯回歸

B、神經(jīng)網(wǎng)絡(luò)

GSVM算法

D、C4.5算法

答案:ABC

6.在比較不同預(yù)測(cè)方法的精確度時(shí),通常采用()等誤差指標(biāo)來衡量預(yù)測(cè)誤差的大

小。

A、絕對(duì)誤差

B、相對(duì)誤差

C、平均誤差

D、隨機(jī)誤差

答案:ABC

7.以下說法正確的有()

A、評(píng)價(jià)預(yù)測(cè)精度是通過測(cè)量與分析預(yù)測(cè)誤差進(jìn)行的

B、絕對(duì)誤差是實(shí)際觀測(cè)值與預(yù)測(cè)值的離差

C、相對(duì)誤差反映實(shí)際觀測(cè)值與預(yù)測(cè)值之間差異的相對(duì)程度

D、平均誤差反映實(shí)際觀測(cè)值與預(yù)測(cè)值之間的平均差異

答案:ABCD

8.產(chǎn)品成本費(fèi)用按其與產(chǎn)量變化的關(guān)系分為()

A、可變成本

B、固定成本

C、付現(xiàn)成本

D、沉沒成本

答案:AB

9.下面給出的t檢驗(yàn)的結(jié)果,0表明接受原假設(shè),顯著性水平為0.05o

A、0.000

B、0.039

C、0.092

D、0.124

答案:CD

10.回歸變差(或回歸平方和)是指()

A、被解釋變量的實(shí)際值與平均值的離差平方和

B、被解釋變量的回歸值與平均值的離差平方和

C、被解釋變量的總變差與剩余變差之差

D、解釋變量變動(dòng)所引起的被解釋變量的變差

答案:BCD

11.在ExceI中,要選定A到E列單元格,操作正確的是

0

A、用鼠標(biāo)左鍵單擊列號(hào)

A,然后向右拖動(dòng)鼠標(biāo)至列號(hào)

E,再釋放鼠標(biāo)左鍵

B、左鍵單擊列號(hào)

A,再按下shift鍵不放并用鼠標(biāo)左鍵單擊列號(hào)

E,最后釋放shift鍵

C、單擊列號(hào)

A,然后先按下Ctrl鍵不放,再用鼠標(biāo)單擊B.C,D,E列號(hào),最后釋放CtrI鍵

D、按shift鍵不放,用鼠標(biāo)左鍵單擊

A,B,C,D,E的每個(gè)列號(hào)

答案:ABC

12.^ijApriori算法計(jì)算頻繁項(xiàng)集可以有效降低計(jì)算頻繁集的時(shí)間復(fù)雜度。在以

下的購物籃中產(chǎn)生支持度不小于3的候選3-項(xiàng)集,在候選2-項(xiàng)集中需要剪枝的是

0ID項(xiàng)集。

1面包.牛奶

2面包.尿布.啤酒.雞蛋

3牛奶.尿布.啤酒.可樂

4面包.牛奶.尿布.啤酒

5面包.牛奶.尿布.可樂

A、啤酒.尿布

B、啤酒.面包

C、面包.尿布

D、啤酒.牛奶

答案:BD

13.大數(shù)據(jù)技術(shù)的兩大核心:

A、分布式存儲(chǔ)GFS'HDFS

B、分布式傳輸Transmission

C、分布式采集Collection

Dx分布式處理MapReduce

答案:AD

14.概率分析中,應(yīng)計(jì)算出()表明該風(fēng)險(xiǎn)因素的風(fēng)險(xiǎn)程度。

A、變異系數(shù)

B、期望值

C、方差

D、標(biāo)準(zhǔn)差

答案:ABCD

15.數(shù)據(jù)科學(xué)家的3c精神

A、創(chuàng)造性地工作

B、批判性地思考

C、系統(tǒng)性地處理

D、好奇性地提問

答案:ABD

16.相關(guān)分析的任務(wù)有()

A、判定現(xiàn)象之間有無關(guān)系

B、判定現(xiàn)象之間關(guān)系的方向

C、判定相關(guān)關(guān)系的緊密程度

D、說明現(xiàn)象之間聯(lián)系的具體形式

答案:ABCD

17.元組在某些屬性上缺少值是常有的。在實(shí)際數(shù)據(jù)中,描述處理該問題的各種方

法有()

A、直接刪除

B、.使用屬性的平均值填充空缺值

C、使用一個(gè)全局常量填充空缺

D、使用與給定元組屬同一類的所有樣本的平均值

答案:ABC

18.如下表student中,如何篩選type為包含數(shù)學(xué)或語文的記錄?

IDtypescore

A01數(shù)學(xué)78

A02語文76

A03英語90

A04數(shù)學(xué)68

A05英語84

A、seIect*fromstudentwheretype=,>數(shù)學(xué)"andtype=M語文”

B、seIect*fromstudentwheretype二“數(shù)學(xué)"ortype=,J語文”

C\seIect*fromstudentwheretypein(M數(shù)學(xué)",“語文")

D、seIect*fromstudentwheretypein(M數(shù)學(xué)"?“語文")

答案:BC

19.以下哪些變量使用RFM方法構(gòu)造出來的?()

A、最近3期境外消費(fèi)金額

B、最近6期網(wǎng)銀消費(fèi)交易筆數(shù)

C、信用額度

D、距最近一次逾期的月數(shù)

答案:ABD

20.以下關(guān)于邏輯回歸的說法正確的是()

A、應(yīng)用邏輯回歸時(shí),異常值會(huì)對(duì)模型造成很大的干擾。

B、邏輯回歸的自變量必須是分類變量,因此要對(duì)連續(xù)型變量進(jìn)行離散化處理。

C、邏輯回歸對(duì)模型中自變量的多重共線性較為敏感。

D、邏輯回歸屬于分類算法。

答案:ACD

21.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的致原則包括()

A、特征根值大于1

B、特征根值大于3

C、累積特征根值加總占總特征根值的80%以上

D、累積特征根值加總占總特征根值的90%以上

答案:AC

22.大數(shù)據(jù)應(yīng)用建設(shè)及運(yùn)營過程中如發(fā)生數(shù)據(jù)安全問題,應(yīng)立即暫停大數(shù)據(jù)應(yīng)用

建設(shè)或運(yùn)營工作,向0部門匯援。

A、互聯(lián)網(wǎng)部

B、安監(jiān)部

C、法規(guī)部

D、相關(guān)專業(yè)管理部門

答案:ABCD

23.下列關(guān)于統(tǒng)計(jì)量的表述中,正確的有()

A、估計(jì)同一個(gè)總體參數(shù)可以用多個(gè)不同的統(tǒng)計(jì)量

B、統(tǒng)計(jì)量是樣本的函數(shù)

C、.統(tǒng)計(jì)量不含有總體的參數(shù)

D、統(tǒng)計(jì)量是隨機(jī)變量

答案:ABD

24.下列對(duì)ID3算法的描述,正確的是0

A、每個(gè)節(jié)點(diǎn)的分支度都不相同

B、使用InformationGain作為節(jié)點(diǎn)分割的依據(jù)

C、可以處理數(shù)值型態(tài)的字段

D、方法處理空值的字段

答案:ABD

25.數(shù)據(jù)科學(xué)中的主流語音工具0

A、R

B、C++

C\Java

D、Python

答案:AD

26.定基發(fā)展速度與環(huán)比發(fā)展速度的關(guān)系有()。

A、各環(huán)比發(fā)展速度之和等于相應(yīng)的定基發(fā)展速度

B、各環(huán)比發(fā)展速度之積等于相應(yīng)的定基發(fā)展速度

C、兩個(gè)環(huán)比發(fā)展速度之商等于相應(yīng)的定基發(fā)展速度

D、兩個(gè)定基發(fā)展速度之商等于相應(yīng)的環(huán)比發(fā)展速度

答案:BD

27.處理噪聲數(shù)據(jù)的常用方法。

A、分箱

B、聚類

C、回歸

D、對(duì)比

答案:ABC

28.行業(yè)分析數(shù)據(jù)采集方法有I)o

A、一手資料

B、實(shí)地考察法

C、專家訪談法

D、收集媒體信息

答案:ABCD

29.貨幣時(shí)間價(jià)值用相對(duì)值來表示時(shí),在數(shù)量上應(yīng)當(dāng)理解為扣除0后的社會(huì)平均

利潤率。

A、時(shí)間因素

B、通貨膨脹因素

C、純粹利率

D、風(fēng)險(xiǎn)因素

答案:BD

30.商業(yè)模式描述正確的是:

A、B2B--商家對(duì)商家

B、B2C一商家對(duì)人

C、020一線上對(duì)線下

D、C2C一人對(duì)人

答案:ABCD

31.以下屬于聚類算法的是0

A、K均值

B、DBSCAN

C\Apriori

D、knn

答案:AB

32.KANO模型定義的顧客需求層次有()

A、興奮型需求

B、喜愛型需求

C、基本型需求

D、期望型需求

答案:ACD

33.根據(jù)分析內(nèi)容和側(cè)重面不同,風(fēng)險(xiǎn)分析的方法有()

A、敏感性分析

B、概率分析

C、經(jīng)濟(jì)效益分析

D、盈虧平衡分析

答案:ABD

34.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是0

A、系統(tǒng)誤差

B、登記性誤差

C、責(zé)任心誤差

D、技術(shù)性誤差

答案:BCD

35.敏感個(gè)人信息劃定依據(jù)()

A、與人格尊嚴(yán)相關(guān)

B、與人身.財(cái)產(chǎn)安全相關(guān)

C、不滿十四周歲未成年人的個(gè)人信息

D、與公司管理要求相關(guān)

答案:ABC

36.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。

A、潛在客戶

B、響應(yīng)客戶

C、即得客戶

D、流失客戶

答案:ABCD

37.以下屬于數(shù)據(jù)預(yù)處理的是:)

A、缺失值填充

B、噪聲數(shù)據(jù)剔除

C、異常值識(shí)別

D、數(shù)據(jù)可視化

答案:ABC

38.我們可以用哪種方式來避免決策樹過度擬合的問題?0

A、利用修剪法來限制樹的深度

B、利用盆栽法規(guī)定每個(gè)節(jié)點(diǎn)下的最小的記錄數(shù)

C、利用逐步回歸法來刪除部分?jǐn)?shù)據(jù)

D、目前并無適合的方法來處理這問題

答案:AB

39.在有關(guān)數(shù)據(jù)倉庫測(cè)試,下列說法中正確的是0

A、在完成數(shù)據(jù)倉庫的實(shí)施過程中,需要對(duì)數(shù)據(jù)倉庫進(jìn)行各種測(cè)試.測(cè)試工作中要

包括單元測(cè)試和系統(tǒng)測(cè)試

B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試

C、系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試

D、在測(cè)試之前可以不制定詳細(xì)的測(cè)試計(jì)劃,測(cè)試過程中實(shí)時(shí)調(diào)整。

答案:ABC

40.關(guān)于基準(zhǔn)收益率的表述,正確的是()

A、基準(zhǔn)收益率越高越好

B、基準(zhǔn)收益率越低越好,但不能低于銀行貸款利率

C、可以采用項(xiàng)目加權(quán)平均資金成本為基礎(chǔ)確定基準(zhǔn)收益率

D、可以采用國家有關(guān)部門或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準(zhǔn)收益

答案:CD

41.分箱方法有哪些?()

A、等深分箱

B、等寬分箱

C、數(shù)據(jù)標(biāo)準(zhǔn)化

D、自定義區(qū)間法

答案:ABD

42.數(shù)據(jù)類型:

A、離散Q型

B、連續(xù)性

C、符號(hào)型

D、文本型

答案:ABCD

43.營銷觀念是營銷過程中如何處理0利益關(guān)系。

Av企業(yè)

Bx員工

C、顧客

D、社會(huì)

答案:ACD

44.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲(chǔ)基礎(chǔ),其特點(diǎn)為()

A、支持超大文件

B、基于商用硬件

C、流式數(shù)據(jù)訪問

D、高吞吐量

答案:ABCD

45.隨機(jī)抽樣方法有0

A、等距隨機(jī)抽樣

B、綜合隨機(jī)抽樣

C、簡(jiǎn)單隨機(jī)抽樣

D、分群隨機(jī)抽樣

答案:ACD

46.能消除時(shí)間序列中的不規(guī)則變動(dòng)和季節(jié)變動(dòng)的方法是

0

A、移動(dòng)平均法

B、指數(shù)平滑法

C、時(shí)間序列乘法模型

D、季節(jié)指數(shù)

答案:AD

47.關(guān)于數(shù)據(jù)范式描述準(zhǔn)確的是:

A、經(jīng)驗(yàn)科學(xué)是第一范式,主要研究模型是科學(xué)實(shí)驗(yàn);

B、理論科學(xué)是第二范式,主要研究模型是數(shù)學(xué)模型;

C、計(jì)算科學(xué)是第三范式,主要研究模型是計(jì)算機(jī)仿真和模擬,第三范式是“人腦+

電腦”,人腦是主角;

D、數(shù)據(jù)密集型科學(xué)是第四范式,的主要研究模型是數(shù)據(jù)挖掘卻機(jī)器學(xué)習(xí),特別是

機(jī)器學(xué)習(xí),第四范式是“電腦+人腦”,電腦是主角。

答案:ABCD

48.如下表student中,如何篩選type為包含數(shù)學(xué)或語文的記錄?0

AvseIect*fromstudentwheretype="數(shù)學(xué)”andtype="語文”

B、seIect*fromstudentwheretype="數(shù)學(xué)"ortype="語文”

Cvselect*fromstudentwheretypein("數(shù)學(xué)”,“語文”)

D、seiect*fromstudentwheretypein("數(shù)學(xué)"?”語文")

答案:BC

49.下列項(xiàng)目中,其變動(dòng)可以改變盈虧平衡點(diǎn)位置的因素有

0

A、單價(jià)

B、單位變動(dòng)成本

C、銷量

D、固定成本

答案:ABCD

50.某種產(chǎn)品的生產(chǎn)總費(fèi)用2003年為50萬元,比2002

年多2萬元,而單位產(chǎn)品成本2003年比2002年降低5%,則()

A、生產(chǎn)費(fèi)用總指數(shù)為104.17%

B、生產(chǎn)費(fèi)用指數(shù)為108.56%

C、單位成本指數(shù)為95%

D、產(chǎn)量指數(shù)為109.65%

E、由于成本降低而節(jié)約的生產(chǎn)費(fèi)用為2.63萬元

答案:ACDE

51.按照性質(zhì),預(yù)測(cè)方法大致可分為()。

A、定性預(yù)測(cè)

B、情景預(yù)測(cè)

C、時(shí)間序列預(yù)測(cè)

D、回歸預(yù)測(cè)

答案:ACD

52.以下屬于分類器評(píng)價(jià)或比較尺度的有0

A、預(yù)測(cè)準(zhǔn)確度

B、召回率

C、模型描述的簡(jiǎn)潔度

D、F1-Score

答案:ABD

53.如下哪些不是基于規(guī)則的分類器的特點(diǎn)()

A、規(guī)則集的表達(dá)能力遠(yuǎn)不如決策樹好

B、基于規(guī)則的分類器都對(duì)屬性空間進(jìn)行直線劃分,并將類指派到每個(gè)劃分

C、無法被用來產(chǎn)生更易于解釋的描述性模型

D、非常適合處理類分布不平衡的數(shù)據(jù)集

答案:AC

54.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要,將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù)的過程。

數(shù)據(jù)離散化的方法有()

A、隨機(jī)取值

B、等距離散法

C、數(shù)值規(guī)約

D、等頻離散法

答案:BD

55.缺失值的處理方法有哪些?()

A、用平均值填充

B、忽略缺失記錄

C、以任意數(shù)據(jù)填充

D、用默認(rèn)值填充

答案:ABD

56.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的。

A、高維性

B、規(guī)模

C、稀疏性

D、噪聲和離群點(diǎn)

答案:ABCD

57.以下屬于數(shù)據(jù)規(guī)約方法的是0

A、數(shù)據(jù)離散化

B、數(shù)據(jù)標(biāo)準(zhǔn)化

C、噪聲數(shù)據(jù)識(shí)別

D、數(shù)據(jù)壓縮

答案:AD

58.在假設(shè)檢驗(yàn)中,當(dāng)我們做出拒絕原假設(shè)而接受備擇假設(shè)的結(jié)論時(shí),表示()

A、有充足的理由否定原假設(shè)

B、原假設(shè)必定是錯(cuò)誤的

C、犯錯(cuò)誤的概率不大于a

D、犯錯(cuò)誤的概率不大于b

E、在H。成立的情況下發(fā)生了小概率事件

答案:ACE

59.電子元器件:

A、電子管

B、晶體管

C、小規(guī)模中規(guī)模集成電路

D、大規(guī)?;虺笠?guī)模集成電路

答案:ABCD

60.若檢驗(yàn)統(tǒng)計(jì)量F近似等于1.說明()

A、組間方差中不包含系統(tǒng)因素的影響

B、組內(nèi)方差中不包含系統(tǒng)因素的影響

C、組間方差中包含系統(tǒng)因素的影響

D、方差分析中不應(yīng)拒絕原假設(shè)

答案:AD

61.統(tǒng)計(jì)決策的基本原則是()

Av可行性

B、發(fā)展性

C、合理性

D、經(jīng)濟(jì)性

答案:ACD

62.促銷預(yù)算的方法主要有()。

A、量入為出法

B、競(jìng)爭(zhēng)對(duì)等法

C、銷售比例法

D、目標(biāo)任務(wù)法

答案:ABCD

63.以下哪個(gè)分布是右偏分布?0

A、均勻分布

B、卡方分布

C、F分布

D、對(duì)數(shù)正態(tài)分布

答案:BCD

64.大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些?()

A、各種傳感器無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

B、各種監(jiān)控設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

C、各種智能設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

D、互聯(lián)網(wǎng)的收集和積累

答案:ABCD

65.數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)主要包括哪幾大類問題?0

A、分類

B、回歸

C、模式發(fā)現(xiàn)

D、模式匹配

答案:AB

66.從復(fù)雜度及價(jià)值高低兩個(gè)維度,可以將數(shù)據(jù)分析分為()

Av描述性分析(DescriptiveAnalytics)

B、診斷性分析(DiagnosticAnalytics)

C\預(yù)測(cè)性分析(PredictiveAnaIytics)

D、規(guī)范性分析(PrescriptiveAnalytics)

答案:ABCD

67.下面有關(guān)HAVING子句的說法中正確的是()

A、HAVING子句必須與GROUPBY子句同時(shí)使用,不能單獨(dú)使用

B、使用HAVING子句的同時(shí)不能使用WHERE子句

C、使用HAVING子句的同時(shí)可以使用WHERE子句

D、使用HAVING子句的作用是限定分組的條件

答案:ACD

68.在作邏輯回歸時(shí),如果區(qū)域這個(gè)變量,當(dāng)Region二A時(shí)Y取值均為1,無法確定

是否出現(xiàn)的是哪個(gè)問題?

A、共線性

B、異常值

C、擬完全分離(Quasi-pleteseparation)

D、缺失值

答案:ABD

69.以下哪個(gè)聚類分析的方法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量()

A、層次聚類法

B、快速聚類法(K-Means)

C、基于密度的聚類法

D、基于網(wǎng)格的聚類法

答案:AB

70.方差分析的基本假設(shè)前提包括()

A、各處理?xiàng)l件下的樣本均來自正態(tài)總體

B、各處理?xiàng)l件下的樣本相互獨(dú)立

C、各處理?xiàng)l件下樣本的方差都相等

D、各處理?xiàng)l件下樣本均值相等,方差可以不等

答案:ABC

71.季節(jié)變動(dòng)主要是由()引起的。

A、自然災(zāi)害

B、政治事件

C、制度.法津習(xí)俗

D、自然界的季節(jié)變化

答案:CD

72.以下說法正確的有哪些?()

A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大

B、大數(shù)據(jù)對(duì)傳統(tǒng)行業(yè)有幫助

C、大數(shù)據(jù)會(huì)帶來機(jī)器智能

D、大數(shù)據(jù)是一種思維方式

答案:BCD

73.下列公式正確的是()

A、流動(dòng)資金二流動(dòng)資產(chǎn)-流動(dòng)負(fù)債

B、流動(dòng)資產(chǎn)二應(yīng)收賬款+存貨

C、流動(dòng)負(fù)債=應(yīng)付賬款+預(yù)收賬款

D、流動(dòng)資金本年增加額二本年流動(dòng)資金-上年流動(dòng)資金

答案:ACD

74.決策樹法分析問題的主要步驟包括()。

A、結(jié)構(gòu)化問題

B、設(shè)計(jì)可能結(jié)果發(fā)生的概率

C、設(shè)計(jì)結(jié)果的得益

D、分析問題

答案:ABCD

75.下列說法中不正確的是()

A、任何兩個(gè)變量都具有相關(guān)關(guān)系

B、人的知識(shí)與其年齡具有相關(guān)關(guān)系

C、散點(diǎn)圖中的各點(diǎn)是分散的沒有規(guī)律

D、根據(jù)散點(diǎn)圖求得的回歸直線方程都是有意義的

答案:ACD

76.投資項(xiàng)目的現(xiàn)金流量中經(jīng)營成本與會(huì)計(jì)中的“總成本費(fèi)用”概念有根本的不

同,不包括

A、利息支出

B、攤銷費(fèi)

C、折舊費(fèi)

D、維修費(fèi)

答案:ABC

77.符合下列情形之一的,個(gè)人信息處理者方可處理個(gè)人信

A、取得個(gè)人的同意;

B、為訂立.履行個(gè)人作為一方當(dāng)事人的合同所必需,或者

按照依法制定的勞動(dòng)規(guī)章制度和依法簽訂的集體合同實(shí)施人力

資源管理所必需;

C、為履行法定職責(zé)或者法定義務(wù)所必需;

D、為應(yīng)對(duì)突發(fā)公共衛(wèi)生事件,或者緊急情況下為保護(hù)自然人的生命健康和財(cái)產(chǎn)安

全所必需;

E、為公共利益實(shí)施新聞報(bào)道.輿論監(jiān)督等行為,在合理的范圍內(nèi)處理個(gè)人信息;

F、依照本法規(guī)定在合理的范圍內(nèi)處理個(gè)人自行公開或者其他已經(jīng)合法公開的個(gè)

人信息;

G、法律.行政法規(guī)規(guī)定的其他情形。

答案:ABCDEFG

78.大數(shù)據(jù)四大特征:

A、速度快

B、數(shù)據(jù)量大

C、價(jià)值密度低

D、類型多

答案:ABCD

79.確定一個(gè)投資方案可行的必要條件是0。

A、凈現(xiàn)值大于零

B、現(xiàn)值指數(shù)大于1

C、投資回收期小于1年

D、內(nèi)部報(bào)酬率較高

答案:AB

80.以下屬于聚類算法的是()

A、K均值

B、DBSCAN

C\Apriori

Dxk-medoids

答案:ABD

81.下列何種算法可以幫助我們做數(shù)值的預(yù)測(cè)(Prediction)?

A、Apriori

B、DecisionTree

CvNaiveBayes

D、LinearRegression

答案:BD

82.層次聚類的聚類方式有0

A、凝聚方式聚類

B、分解方式聚類

C、Q型聚類

D、R型聚類

答案:AB

83.有下列情形之一的,個(gè)人信息處理者應(yīng)當(dāng)事前進(jìn)行個(gè)人信息保護(hù)影響評(píng)估,并

對(duì)處理情況進(jìn)行記錄:

A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論