大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14-2023-練習(xí)版_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14-2023-練習(xí)版_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14-2023-練習(xí)版_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14-2023-練習(xí)版_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14-2023-練習(xí)版_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試題說(shuō)明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14(500題)

大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14

L[單選題]下列哪個(gè)不是RDD的緩存方法()

A)persist()

B)cache()

C)memory()

2.[單選題]Spark中Job的劃分依據(jù)是()。

A)依賴

B)Action算子

C)Transformation算子

3.[單選題]下列方法中,不可以用于特征降維的方法包括

A)主成分分析PCA

B)線性判別分析LDA

C)深度學(xué)習(xí)SparseAutoEncoder

D)矩陣奇異值分解SVD

4.[單選題]MaxCompute服務(wù)是以RESTfulAPI的形式對(duì)外提供。下列()方法可以更新資源。

A)UPDATE

B)P0ST

C)GET

D)PUT

5.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,全景風(fēng)險(xiǎn)視圖模塊,為了用戶能便捷查看客戶

的關(guān)聯(lián)風(fēng)險(xiǎn),實(shí)現(xiàn)客群風(fēng)險(xiǎn)監(jiān)測(cè)和關(guān)聯(lián)客戶風(fēng)險(xiǎn)聯(lián)防聯(lián)控,系統(tǒng)在全景風(fēng)險(xiǎn)視圖的客戶名稱下放置

了()按鈕,方便用戶查看關(guān)鍵信息。

A)【權(quán)限申請(qǐng)】、【集團(tuán)圖譜】、【最終受益人】

B)B.【數(shù)據(jù)補(bǔ)錄】、【集團(tuán)圖譜】、【最終受益人】

C)C.【影像操作】、【企業(yè)信用智能分析報(bào)告】、【集團(tuán)圖譜】、【最終受益人】

D)D.【擔(dān)保圈鏈】、【關(guān)聯(lián)關(guān)系圖譜】、【企業(yè)信用智能分析報(bào)告】、【集團(tuán)圖譜】、【最終受益

人】

6.[單選題]假設(shè)你正在訓(xùn)練一個(gè)LSTM網(wǎng)絡(luò),你有一個(gè)10000詞的詞匯表,并且使用一個(gè)激活值維度

為100的LSTM塊,在每一個(gè)時(shí)間步中,幾的維度是()

A)1

B)100

C)300

D)10000

7.[單選題]Hive不適用于以下哪個(gè)場(chǎng)景

A)非實(shí)時(shí)分析,例如日志分析,統(tǒng)計(jì)分析

B)數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示

C)數(shù)據(jù)匯總,例如每天,每用戶點(diǎn)擊數(shù),點(diǎn)擊排行

D)實(shí)時(shí)在線數(shù)據(jù)分析

8.[單選題]Kafka集群在運(yùn)行期間,直接依賴于下面那些組件?

A)Spark

B)Zookeeper

OHBase

D)HDFS

9.[單選題]內(nèi)部用戶有作業(yè)層、管理層、()

A)執(zhí)行層

B)決策層

C)建議層

D)推送層

10.[單選題]數(shù)據(jù)的故事化描述是指為了提升數(shù)據(jù)的(),將數(shù)據(jù)還原成關(guān)聯(lián)至特定的情景的過(guò)程

O

A)可理解性、可記憶性、可體驗(yàn)性

B)可接受性、可記憶性、可體驗(yàn)性

C)可接受性、可記憶性、可呈現(xiàn)性

D)可理解性、可記憶性、可呈線性

11.[單選題]迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()

A)我為人人,人人為我

B)全樣而非抽樣

C)效率而非精確

D)相關(guān)而非因果

12.[單選題]以下不屬于大數(shù)據(jù)系統(tǒng)端風(fēng)險(xiǎn)的是()

A)數(shù)據(jù)系統(tǒng)的申請(qǐng)、查看流程

B)數(shù)據(jù)查看權(quán)限

C)系統(tǒng)平臺(tái)的穩(wěn)定性

D)數(shù)據(jù)庫(kù)管理、存儲(chǔ)

13.[單選題]下列語(yǔ)句執(zhí)行的結(jié)果是()>>>a=l>>>b=2*a/4>>>a="one">〉>print(a,b)

A)one0

B)10

C)one0.5

D)one,0.5

14.[單選題]以下關(guān)于關(guān)系數(shù)據(jù)模型的論述正確的是()

A)只能表示實(shí)體間的1:1聯(lián)系

B)只能表示實(shí)體間的Ln聯(lián)系

C)只能表示實(shí)體間的m:n聯(lián)系

D)可以表示實(shí)體間上述三種聯(lián)系

15.[單選題]在Hive中,以下那一個(gè)查詢語(yǔ)句可以將2個(gè)或多個(gè)表集合進(jìn)行合并()

A)unionfull

B)unionall

C)unionfor

D)unionon

16.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于

分歧的方法(disagreement-basedme也ods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分岐(disagreement)對(duì)未

標(biāo)記數(shù)據(jù)的利用至關(guān)重要()是此類方法的重要代表

A)協(xié)同訓(xùn)練

B)組合訓(xùn)練

C)配合訓(xùn)練

D)陪同訓(xùn)練

17.[單選題]大數(shù)據(jù)的4V特性不包括

A)Volume(大量)

B)Velocity(高速)

C)Visual(可視)

D)Variety(多樣)

18.[單選題]下面關(guān)于Hadoop的描述錯(cuò)誤的是:()

A)Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架

B)作為并行分布式計(jì)算平臺(tái),Hadoop采用分布式存儲(chǔ)和分布式處理兩大核心技術(shù),能夠高效地處理

PB級(jí)數(shù)據(jù)

C)Hadoop只支持Java編程語(yǔ)言

D)Hadoop可以高效穩(wěn)定地運(yùn)行在廉價(jià)的計(jì)算機(jī)集群上,可以擴(kuò)展到數(shù)以千計(jì)的計(jì)算機(jī)節(jié)點(diǎn)上

19.[單選題]type(complex(2,4))的結(jié)果為(____)0

A)class'int'

B)class'float'

C)class'complex

D)class'bool'

20.[單選題]以下四種描述中,正確的是()

A)、大數(shù)據(jù)和海量數(shù)據(jù)是同一個(gè)事物的不同描述

B)、數(shù)據(jù)和數(shù)值是同一個(gè)事物的不同描述

C)、數(shù)據(jù)和數(shù)字是同一個(gè)事物的不同描述

D)、以上說(shuō)法均不正確

21.[單選題](_)是M-P神經(jīng)元,也稱為“閾值邏輯單元”。

A)輸入層

B)輸出層

C)第一層

D)第二層

22.[單選題]Python使用()符號(hào)標(biāo)示注釋。

A)&

B)*

0#

D)//

23.[單選題]大數(shù)據(jù)時(shí)代,數(shù)據(jù)使用的關(guān)鍵是().

A)數(shù)據(jù)收集

B)數(shù)據(jù)存儲(chǔ)

C)數(shù)據(jù)分析

D)低容錯(cuò)性

24.[單選題]下面哪項(xiàng)操作能實(shí)現(xiàn)跟神經(jīng)網(wǎng)絡(luò)中Dropout的類似效果?

A)Boosting

B)bagging

C)Stacking

D)Mapping

25.[單選題]網(wǎng)站在運(yùn)營(yíng)過(guò)程中,會(huì)有用戶訪問(wèn)并產(chǎn)生行為數(shù)據(jù),要想對(duì)這些數(shù)據(jù)進(jìn)行處理挖掘,如

果是離線批處理下的方案配置,描述不正確的是

A)數(shù)據(jù)導(dǎo)入導(dǎo)出,Loader

B)數(shù)據(jù)采集傳輸:Flume

C)數(shù)據(jù)計(jì)算,Storm

D)數(shù)據(jù)存儲(chǔ).HDFS或MySql

26.[單選題]機(jī)器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是?()

A)使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值

B)使用L1可以得到平滑的權(quán)值,使用L2可以得到平滑的權(quán)值

C)使用L1可以得到平滑的權(quán)值,使用L2可以得到稀疏的權(quán)值

D)使用L1可以得到稀疏的權(quán)值,使用L2可以得到稀疏的權(quán)值

27.[單選題]我國(guó)首家大數(shù)據(jù)交易所是:()

A)貴陽(yáng)大數(shù)據(jù)交易所

B)上海數(shù)據(jù)交易中心

C)華東江蘇大數(shù)據(jù)交易中心

D)浙江大數(shù)據(jù)交易中心

28.[單選題]下列哪個(gè)標(biāo)識(shí)符是合法的()

A)print

B)_100

C)12name

D)name

29.[單選題](_)是從海量文本中查詢到觀點(diǎn)信息,根據(jù)主題相關(guān)度和觀點(diǎn)傾向性對(duì)結(jié)果排序。

A)情感分類

B)情感檢索

C)情感抽取

D)情感分析

30.[單選題]下面不屬于大數(shù)據(jù)4V特性有(一)。

A)容量大

B)類型多

C)速度快

D)應(yīng)用價(jià)值高

31.[單選題]設(shè)2={1,1,1,1,1,2,3,4,5,5,5,5},貝?。輕rint(len(a))的顯示結(jié)果為(.)。

A)5

B)12

03

D)Error

32.[單選題]支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()

A)數(shù)據(jù)科學(xué)

B)數(shù)據(jù)應(yīng)用

C)數(shù)據(jù)硬件

D)數(shù)據(jù)人才

33.[單選題]以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫流程說(shuō)法正確的是?

A)僅寫入內(nèi)存

B)同時(shí)寫入磁盤和內(nèi)存

C)先寫入內(nèi)存再寫入磁盤

D)先寫磁盤再寫內(nèi)存

34.[單選題]numpy中向量轉(zhuǎn)成矩陣使用什么函數(shù)?

A)np.reshape()

B)np.reval()

C)np.arange()

D)np.random()

35.[單選題]對(duì)線下零售而言,做好大數(shù)據(jù)分析應(yīng)用的前提是。

A)增加統(tǒng)計(jì)種類

B)擴(kuò)大營(yíng)業(yè)面積

C)增加數(shù)據(jù)來(lái)源

D)開(kāi)展優(yōu)惠促銷

36.[單選題]以下名稱中不屬于“屬性張成的空間”的是(—)。

A)屬性空間

B)樣本空間

C)輸入空間

D)對(duì)偶空間

37.[單選題]關(guān)于賦值語(yǔ)句,以下選項(xiàng)中描述錯(cuò)誤的是

A)在Python語(yǔ)言中,有一種賦值語(yǔ)句,可以同時(shí)給多個(gè)變量賦值

B)設(shè)x="alice";y="kate",執(zhí)行x,y=y,x可以實(shí)現(xiàn)變量x和y值的互換

C)設(shè)a=10;b=20,執(zhí)行a,b=a,a+bprint(a,b)和a=bb=a+bprint(a,b)之后,得到

同樣的輸出結(jié)果:1030

D)在Python語(yǔ)言中,“=”表示賦值,即將“=”右側(cè)的計(jì)算結(jié)果賦值給左側(cè)變量,包含“=”的語(yǔ)

句稱為賦值語(yǔ)句

38.[單選題]關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:

A)基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息

B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息

C)基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息

D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息

39.[單選題]以下不屬于關(guān)系型數(shù)據(jù)庫(kù)的是()

A)DB2

B)HBase

C)MySQL

D)Oracle

40.[單選題]下列數(shù)據(jù)類型中不可以作為索引對(duì)Numpy數(shù)組進(jìn)行選取的是()。

A)boolean

B)tuple

C)diet

D)int

41.[單選題]scipy.stats模塊中對(duì)隨機(jī)變量進(jìn)行隨機(jī)取值的函數(shù)是()。

A)rvs

B)pdf

Ocdf

D)sf

42.[單選題]以下哪項(xiàng)用來(lái)排序()

A)ORDEREDBY

B)ORDERBY

C)GROUPBY

D)GROUPEDBY

43.[單選題]Relief的擴(kuò)展變體Relief-F能夠處理(_)問(wèn)題。

A)二分類

B)多分類

C)回歸

D)降維

44.[單選題]信息安全事件的處理不遵循的原則是()

A)統(tǒng)一領(lǐng)導(dǎo)

B)綜合協(xié)調(diào)

C)快速處理

D)集體責(zé)任

45.[單選題]下列哪一項(xiàng)不屬于儀表板的布局模式()

A)標(biāo)準(zhǔn)模式

B)自由模式

C)標(biāo)準(zhǔn)模式(分頁(yè))

D)自由模式(分頁(yè))

46.[單選題]若設(shè)1.啟動(dòng),2.診斷,3.建立,4.行動(dòng),5.學(xué)習(xí),貝UDMM模型中的順序?yàn)椋╛)。

A)12345

B)12354

013254

D)13245

47.[單選題]以下關(guān)于函數(shù)參數(shù)和返回值的描述,正確的是:

A)采用名稱傳參的時(shí)候,實(shí)參的順序需要和形參的順序一致

B)可選參數(shù)傳遞指的是沒(méi)有傳入對(duì)應(yīng)參數(shù)值的時(shí)候,就不使用該參數(shù)

C)函數(shù)能同時(shí)返回多個(gè)參數(shù)值,需要形成一個(gè)列表來(lái)返回

D)Python支持按照位置傳參也支持名稱傳參,但不支持地址傳參

48.[單選題]高斯核也稱為(_)。

A)多項(xiàng)式核

B)拉普拉斯核

C)RBF核

D)Sigmoid核

49.[單選題]數(shù)據(jù)產(chǎn)品開(kāi)發(fā)的關(guān)鍵環(huán)節(jié)是()

A)數(shù)據(jù)收集

B)數(shù)據(jù)預(yù)處理

C)數(shù)據(jù)學(xué)習(xí)

D)數(shù)據(jù)加工

50.[單選題]Flume的高級(jí)組件不包含以下哪個(gè)?

A)SinkProcessor

B)ChannelInterceptor

C)ChannelSelector

D)SourceInterceptor

51.[單選題]以下()組件負(fù)責(zé)存儲(chǔ)業(yè)務(wù)數(shù)據(jù)、執(zhí)行數(shù)據(jù)查詢?nèi)蝿?wù)以及向CN返回執(zhí)行結(jié)果。

A)GTM

B)WLM

C)CN

D)DN

52.[單選題]下列語(yǔ)句中不能創(chuàng)建一個(gè)字典的是()。

A)dictl={}

B)dict2={3:5}

C)dict3={[1,2,3]I"uestc")

D)dict4={(1,2,3):"uestc")

53.[單選題]下列有關(guān)Hive中分桶表理解不正確的是()

A)Hive不能針對(duì)分區(qū)進(jìn)行桶的組織

B)Hive可以針對(duì)某一列進(jìn)行桶的組織

C)把表組織成桶可以獲得更高的查詢處理效率

D)把表組織成桶可以使取樣更高效

54.[單選題]國(guó)網(wǎng)公司泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案要求,推進(jìn)營(yíng)配貫通優(yōu)化提升,貫通率提升

()O

A)5%

B)7%

010%

D)15%

55.[單選題]某公司在進(jìn)行大數(shù)據(jù)離線批處理平臺(tái)的前期技術(shù)選型,以下哪個(gè)大數(shù)據(jù)組件不屬于離線

批處理業(yè)務(wù)所涉及到的組件?

A)HDFS

B)Spark

C)Storm

D)Hive

56.[單選題]下面python循環(huán)體執(zhí)行的次數(shù)與其他不同的是。。

A)i=0while(i

B)i=10while(i>0):print(i)i=i-l

C)forIinrange(10):Print(i)

D)forIinrange(10,0,-l):print(i)

57.[單選題]以下關(guān)于ElasticSearch介紹錯(cuò)誤的是?(

A)Document文檔,被素引的基本單位

B)EsMaster主節(jié)點(diǎn)

C)Index親弓I,與關(guān)系型數(shù)據(jù)庫(kù)中的索引概念一樣

D)EsNode:Elasticsearch節(jié)點(diǎn),一個(gè)節(jié)點(diǎn)就是一個(gè)Elasticsearch實(shí)例

58.[單選題]以下不是NoSQL常用數(shù)據(jù)模型的是()

A)Key-Value

B)Key-Colum

C)圖存儲(chǔ)

D)關(guān)系數(shù)據(jù)模型

59.[單選題](一)返回模塊名稱空間的字典,(—)返回當(dāng)前名稱空間的字典。

A)locals()locals()

B)global()locals()

C)locals()global()

D)globals()globals()

60.[單選題]以P(w)表示詞條w的概率,假設(shè)已知P(南京)=0.8,P(市長(zhǎng))=0.6,P(江大橋

)=0.4;P(南京市)=0.3,P(長(zhǎng)江大橋)=0.5。如果假設(shè)前后兩個(gè)詞的出現(xiàn)是獨(dú)立的,那么分詞

結(jié)果就是()。

A)南京市*長(zhǎng)江*大橋

B)南京*市長(zhǎng)*江大橋

C)南京市長(zhǎng)*江大橋

D)南京市*長(zhǎng)江大橋

61.[單選題]Hive在處理數(shù)據(jù)時(shí),默認(rèn)的分隔復(fù)合類型中元素的分隔符是()

ALA

B)"B

C)-C

D)\n

62.[單選題]常用的數(shù)據(jù)歸約方法可以分為()。

A)維歸約、數(shù)據(jù)壓縮

B)維歸約、參數(shù)歸約

C)維歸約、值歸約

D)數(shù)據(jù)壓縮、值歸約

63.[單選題]ApacheHadoop可以在(_)平臺(tái)上運(yùn)行。

A)Ubuntu

B)Debian

C)Windows

D)跨平臺(tái)

64.[單選題]某電商公司數(shù)據(jù)庫(kù)高級(jí)工程師進(jìn)行大數(shù)據(jù)分析,現(xiàn)在界面提示:"0:

jdbe:hive2:〃192.168.0.186:2181/>"信息,那么他最有可能在進(jìn)行什么場(chǎng)錄的數(shù)據(jù)分析工作?

A)實(shí)時(shí)檢素場(chǎng)景

B)離線批處理場(chǎng)景

C)圖搜索場(chǎng)景

D)實(shí)時(shí)流開(kāi)發(fā)場(chǎng)景

65.[單選題]HDFS的優(yōu)點(diǎn)不包含哪個(gè)?

A)處理超大文件

B)運(yùn)行于廉價(jià)機(jī)器上

C)高效存儲(chǔ)大量小文件

D)流式的訪問(wèn)數(shù)據(jù)

66.[單選題]MapReduce流程有()各階段。

A)三

B)二

C)四

D)五

67.[單選題]Hive常被用來(lái)處理()場(chǎng)景。

A)事務(wù)性處理

B)批量計(jì)算

C)實(shí)時(shí)性計(jì)算

D)流計(jì)算

68.[單選題]下列關(guān)于Numpy的數(shù)組Ndarray對(duì)象屬性的描述錯(cuò)誤的是()。

A)Ndarray.ndim秩,即軸的數(shù)量或維度的數(shù)量

B)Ndarray.shape數(shù)組的維度,對(duì)于矩陣來(lái)說(shuō)是n行m列

C)Ndarray.size數(shù)組元素的總個(gè)數(shù),也是shape屬性中nXm的值

D)Ndarray.itemsizeNdarray對(duì)象的元素類型

69.[單選題]下列算法中屬于圖像平滑處理的是()o

A)梯度銳化

B)直方圖均衡化

0中值濾波

D)Laplacian增強(qiáng)

70.[單選題]在MaxCompute中,可以通過(guò)Tunnel命令行來(lái)完成數(shù)據(jù)的上傳下載。如果要下載

test_project項(xiàng)目空間下的一個(gè)帶分區(qū)的表test_table_p的內(nèi)容到log.txt文件中,使用命令

tunneldownloadtest_project.test_table_plog.txt;結(jié)果報(bào)錯(cuò),其中出錯(cuò)的部分為:()。

A)tunnel

B)download

C)test_project.test_table_p

D)logtxt

71.[單選題]假設(shè)我們要解決一個(gè)二類分類問(wèn)題,我們已經(jīng)建立好了模型,輸出是0或1,初始時(shí)設(shè)閾

值為0.5,超過(guò)0.5概率估計(jì),就判別為1,否則就判別為0;如果我們現(xiàn)在用另一個(gè)大于0.5的閾值,

那么現(xiàn)在關(guān)于模型說(shuō)法,正確的是:

A)模型分類的召回率會(huì)降低或不變

B)模型分類的召回率會(huì)升高

C)模型分類準(zhǔn)確率會(huì)升高或不變

D)模型分類準(zhǔn)確率會(huì)降低

72.[單選題](_)通過(guò)構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù)。

A)支持向量機(jī)

B)貝葉斯分類器

C)神經(jīng)網(wǎng)絡(luò)

D)集成學(xué)習(xí)

73.[單選題]如想定義字符串,應(yīng)使用。

A)list

B)set

C)str

D)dict

74.[單選題]關(guān)于基于Hadoop的MapReduce編程的環(huán)境配置,下面哪一步是不必要的()

A)配置java環(huán)境變量

B)配置Hadoop環(huán)境變量

C)配置Eclipse

D)配置ssh

75.[單選題]以下哪項(xiàng)不是“大數(shù)據(jù)”和傳統(tǒng)的“小數(shù)據(jù)”的區(qū)別?

A)數(shù)據(jù)規(guī)模的采樣聚合與全量

B)數(shù)據(jù)結(jié)構(gòu)的結(jié)構(gòu)化與非結(jié)構(gòu)化

C)數(shù)據(jù)來(lái)源的集中于分散

D)數(shù)據(jù)質(zhì)量的高低參差不齊

76.[單選題]在邏輯回歸輸出與日標(biāo)對(duì)比的情況下,以下評(píng)估指標(biāo)中()不適用

A)AUC-R0C

B)準(zhǔn)確度

C)Logloss

D)均方誤差

77.[單選題]能實(shí)現(xiàn)將一維數(shù)據(jù)寫入CSV文件中的是

A)fo=open("price2016bj.csv","w")Is=['AAA','BBB','CCC','DDD']

fo.write(",join(Is)+"\n")fo.close()

B)fr=open("price2016.csv","w")Is=[]forlineinfo:line=

line,replace("\n","")Is.append(line,split(","))print(Is)fo.close()

C)fo=open("price2016bj.csv","r")Is=['AAA','BBB','CCC",

'DDD']fo.write(",",join(Is)+"\n")fo.close()

D)fname=input("請(qǐng)輸入要寫入的文件:")fo=open(fname,"w+")ls=["AAA","BBB",

"CCC"]fo.writelines(Is)forlineinfo:print(line)fo.close()

78.[單選題]在線性回歸問(wèn)題中,我們用R方來(lái)衡量擬合的好壞。在線性回歸模型中增加特征值并再訓(xùn)

練同一模型。下列說(shuō)法正確的是()。

A)如果R方上升,則該變量是顯著的

B)如果R方下降,則該變量不顯著

C)單單R方不能反映變量重要性,不能就此得出正確結(jié)論

D)以上答案都不正確

79.[單選題]當(dāng)數(shù)據(jù)集非常大的時(shí)候,對(duì)全體數(shù)據(jù)進(jìn)行處理存在困難時(shí),通過(guò)什么方式可以估計(jì)和推

斷出整體的特性()

A)抽樣查詢

B)模糊查詢

C)條件查詢

D)連接查詢

80.[單選題]下列選項(xiàng)中,Python不支持的數(shù)據(jù)類型有()。

A)int

B)char

C)float

D)dictionary

81.[單選題]np.square(2)的結(jié)果是多少?

A)1

B)4

03

D)2

82.[單選題]下列哪項(xiàng)通常是集群的最主要的性能瓶頸?()

A)CPU

B)網(wǎng)絡(luò)

C)磁盤

D)內(nèi)存

83.[單選題]下列關(guān)于BigTable的描述,哪個(gè)是錯(cuò)誤的?()

A)爬蟲(chóng)持續(xù)不斷地抓取新頁(yè)面,這些頁(yè)面每隔一段時(shí)間地存儲(chǔ)到BigTable里

B)BigTable是一布式存儲(chǔ)系統(tǒng)

OBigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問(wèn)題

D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable到網(wǎng)頁(yè)

84.[單選題]選擇哪一個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見(jiàn)的做法是引人()。

A)線性回歸

B)線性判別分析

C)正則化項(xiàng)

D)偏置項(xiàng)

85.[單選題]變量的不確定性越大,相對(duì)應(yīng)信息'腦的變化是()

A)蜻變小

B)蜻變大

C)不變

D)以上答案都不正確

86.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。

A)機(jī)器學(xué)習(xí)、對(duì)數(shù)回歸、關(guān)聯(lián)模式

B)K均值法、SOM機(jī)器學(xué)習(xí)

C)Apriori算法、FP-Tree算法

D)RBF機(jī)器學(xué)習(xí)、K均值法、機(jī)器學(xué)習(xí)

87.[單選題]以下關(guān)于DataNode的描述不正確的是?

A)DataNode執(zhí)行數(shù)據(jù)塊的讀/寫操作

B)DataNode是用來(lái)存儲(chǔ)數(shù)據(jù)塊

C)DataNode管理數(shù)據(jù)塊元數(shù)據(jù)

D)DataNode的數(shù)量受數(shù)據(jù)規(guī)模影響

88.[單選題]()是基于規(guī)則的分類器

A)C4,S

B)KNN

C)NaiveBayes

D)C.ANN

89.[單選題]關(guān)于數(shù)據(jù)備份的做法不對(duì)的是:()

A)確認(rèn)備份操作步驟準(zhǔn)確無(wú)誤后進(jìn)行備份操作。

B)各業(yè)務(wù)部門應(yīng)將計(jì)算機(jī)信息數(shù)據(jù)備份媒體視同重要空白憑證,指定專人負(fù)責(zé)備份數(shù)據(jù)媒體的簽收

和入庫(kù)管理。

C)備份數(shù)據(jù)媒體應(yīng)按要求寫明標(biāo)識(shí),交辦公室檔案管理員異地存放,要確保存放地的安全,并定期

進(jìn)行檢查,確保數(shù)據(jù)的完整性、可用性。

D)涉密信息媒體的備份媒體(磁帶、磁盤、光盤、紙媒體等)應(yīng)有密級(jí)及保密期限標(biāo)志,統(tǒng)一編號(hào)

,各單位保密機(jī)構(gòu)負(fù)責(zé)涉密信息媒體的界定和銷毀。

90.[單選題]智能健康手環(huán)的應(yīng)用,體現(xiàn)了()數(shù)據(jù)采集技術(shù)的應(yīng)用。

A)統(tǒng)計(jì)報(bào)表

B)網(wǎng)絡(luò)爬蟲(chóng)

C)傳感器

D)API接口

91.[單選題]以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的敘述中,正確的是()

A)數(shù)據(jù)倉(cāng)庫(kù)主要用于支持決策管理

B)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源相對(duì)比較單一

C)存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般是實(shí)時(shí)更新的

D)數(shù)據(jù)倉(cāng)庫(kù)為企業(yè)的特定應(yīng)用服務(wù)、強(qiáng)調(diào)處理的響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性等

92.[單選題]若2=叩.abs(-5),則print(a)輸出為(—)。

A)-6

B)-4

0-5

D)5

93.[單選題]下列語(yǔ)句會(huì)無(wú)限循環(huán)下去的是()。

A)forainrange(10):timesleep(10)

B)whilei<10:

Timesleep(10)

C)whileTrue:

Break

D)a=[3,-1,']

Foriina[:]:ifnota:

Break

94.[單選題]()是指過(guò)濾器在圖像上滑動(dòng)的距離。

A)卷積核大小

B)卷積步長(zhǎng)

C)過(guò)濾器大小

D)圖像大小

95.[單選題]任何一個(gè)核函數(shù)都隱式地定義了一個(gè)(_)空間。

A)希爾伯特空間

B)再生希爾伯特空間

C)再生核希爾伯特空間

D)歐式空間

96.[單選題]我想使用JavaAPI刪除HDFS中的非空文件夾/123,以下選項(xiàng)正確的是。

A)fs.delete(newPath("/123"));

B)fs.delete(newPath("/123"),false);

C)fs.delete(newPath("/123"),true);

D)delete()方法只能刪除文件或非空文件夾,不能直接刪除非空文件夾

97.[單選題]例如數(shù)據(jù)庫(kù)中有A表,包括學(xué)生,學(xué)科,成績(jī)?nèi)齻€(gè)字段,數(shù)據(jù)庫(kù)結(jié)構(gòu)為學(xué)生學(xué)科成

績(jī)張三語(yǔ)文60張三數(shù)學(xué)100李四語(yǔ)文70李四數(shù)學(xué)80李四英語(yǔ)80如何統(tǒng)計(jì)最高分>80的

學(xué)科()

A)SELECTMAX(成績(jī))FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))〉80;

B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績(jī)>80;

C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;

D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績(jī))>80;

98.[單選題]下列關(guān)于支持向量機(jī)優(yōu)化性問(wèn)題的形式說(shuō)法正確的是(_)。

A)它是一個(gè)凸二次規(guī)劃問(wèn)題

B)它是一個(gè)凸一次規(guī)劃問(wèn)題

C)它是一個(gè)凹二次規(guī)劃問(wèn)題

D)它是一個(gè)凹一次規(guī)劃問(wèn)題

99.[單選題]HFile數(shù)據(jù)格式中的Data字段用于()。

A)存儲(chǔ)實(shí)際的KeyValue數(shù)據(jù)

B)存儲(chǔ)數(shù)據(jù)的起點(diǎn)

C)指定字段的長(zhǎng)度

D)存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)

100.[單選題]多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()。

A)一對(duì)一

B)一對(duì)其余

C)一對(duì)多

D)多對(duì)多

101.[單選題]下面關(guān)于機(jī)械思維的核心思想,描述錯(cuò)誤的是:()

A)世界變化的規(guī)律是確定的

B)lit界變化的規(guī)律是無(wú)法確定的

C)規(guī)律不僅是可以被認(rèn)識(shí)的,而且可以用簡(jiǎn)單的公式或者語(yǔ)言描述清楚

D)這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的.可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐

102.[單選題]在Matplotlib中,在當(dāng)前圖形上添加一個(gè)子圖需要用到的函數(shù)是()。

A)pit.stackplot()

B)pit.suptitle()

C)pit.subplot()

D)plt.imshow()

103.[單選題]電影評(píng)分是以下哪些的應(yīng)用實(shí)例(—)。

A)分類

B)聚類

C)強(qiáng)化學(xué)習(xí)

D)回歸

104.[單選題]在HBase的專用過(guò)濾器中,單列排除過(guò)濾器是()

A)SingleValueExcludeFilter

B)SingleColumnExcludeFilter

C)SingleColumnValueExcludeFilter

D)ColumnValueExcludeFilter

105.[單選題]通過(guò)(),持續(xù)降低自動(dòng)采集成本和操作難度,不斷提高公司數(shù)據(jù)的自動(dòng)采集水平。

A)組織開(kāi)展數(shù)據(jù)轉(zhuǎn)換技術(shù)及應(yīng)用研究

B)組織開(kāi)展數(shù)據(jù)分類技術(shù)及應(yīng)用研究

C)組織開(kāi)展數(shù)據(jù)錄入技術(shù)及應(yīng)用研究

D)組織開(kāi)展數(shù)據(jù)自動(dòng)采集技術(shù)及應(yīng)用研究

106.[單選題]回歸方程判定系數(shù)的計(jì)算公式R2=SSR/SST=1-SSE/SST,對(duì)判定系數(shù)描述錯(cuò)誤的是。

A)式中的SSE指殘差平方和

B)式中的SSR指總離差平方和

C)判定系數(shù)用來(lái)衡量回歸方程的抗合優(yōu)皮

D)判定系教K等于相關(guān)系數(shù)的平方

107.[單選題]下列哪個(gè)程序通常與NameNode在一個(gè)節(jié)點(diǎn)啟動(dòng)?

A)SecondaryNameNode

B)DataNode

C)TaskTracker

D)Jobtracker

108.[單選題]a和b為兩個(gè)整數(shù),以下關(guān)系表達(dá)式語(yǔ)法錯(cuò)誤的是?

A)a==b

B)ab

C)a>=b

D)a!=b

109.[單選題]Oracle數(shù)據(jù)庫(kù)最近使用過(guò)的SQL語(yǔ)句存儲(chǔ)在

A)共享池

B)數(shù)據(jù)高速緩沖區(qū)

C)私有全局區(qū)

D)用戶全局區(qū)

110.[單選題]K-搖臂賭博機(jī)屬于(—)算法。

A)機(jī)器學(xué)習(xí)

B)深度學(xué)習(xí)

C)強(qiáng)化學(xué)習(xí)

D)有監(jiān)督學(xué)習(xí)

111.[單選題]二項(xiàng)分布的數(shù)學(xué)期望為()

A)n(1-n)p

B)np(1-p)

C)np

D)n(1-p)

112.[單選題]MapReduce框架對(duì)()按照鍵值排序。。

A)中間結(jié)果

B)最終結(jié)果

C)輸入數(shù)據(jù)

D)輸出數(shù)據(jù)

113.[單選題]對(duì)于ADS的主鍵,()說(shuō)法是正確的。

A)對(duì)于updateType=realtime的表來(lái)講,主鍵是必須的,且主鍵中不能包含作為一級(jí)hash分區(qū)的分區(qū)

B)對(duì)于ADS的普通表,無(wú)論updateType如何取值,主鍵是必要的

C)對(duì)于updateType=batch的表來(lái)講,主鍵是必須的,主要是約束導(dǎo)入數(shù)據(jù)時(shí)的重復(fù)記錄

D)有主鍵的表的性能和用法上和沒(méi)有主鍵的表之間沒(méi)有任何區(qū)別

114.[單選題]進(jìn)入要操作的數(shù)據(jù)庫(kù)TEST用以下哪一項(xiàng)()

A)INTEST

B)SHOWTEST

C)USERTEST

D)USETEST

115.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()

A)頻繁子集挖掘

B)頻繁于圈挖掘

C)頻繁數(shù)據(jù)項(xiàng)挖掘

D)頻繁模式挖掘

116.[單選題]以下哪一項(xiàng)不是Spark框架可用的資源調(diào)度系統(tǒng)?

A)Mesos

B)Yarn

C)deremel

D)aws

117.[單選題](_)是一類用圖來(lái)表達(dá)變量相關(guān)關(guān)系的概率模型。

A)神經(jīng)元模型

B)感知機(jī)模型

C)概率圖模型

D)SVM

118.[單選題]以下描述中錯(cuò)誤的是()。

A)數(shù)據(jù)化與數(shù)字化是兩個(gè)不同概念

B)數(shù)據(jù)與數(shù)值是一個(gè)概念

C)大數(shù)據(jù)與海量數(shù)據(jù)是兩個(gè)不同的概念

D)數(shù)據(jù)和信息是兩個(gè)不同的概念

119.[單選題]()對(duì)監(jiān)管數(shù)據(jù)質(zhì)量承擔(dān)最終責(zé)任

A)董事長(zhǎng)

B)風(fēng)險(xiǎn)管理部

C)行長(zhǎng)

D)數(shù)據(jù)運(yùn)管部

120.[單選題]阿里巴巴旗下的數(shù)據(jù)管理平臺(tái),被稱為:

A)達(dá)摩盤

B)支付寶

C)螞蟻花唄

D)招財(cái)寶

121.[單選題]感知層是物聯(lián)網(wǎng)體系架構(gòu)的()層。

A)第一層

B)第二層

C)第三層

D)第四層

122.[單選題]執(zhí)行后可以查看Python的版本的是

A)importsysprint(sys.Version)

B)importsystemprint(system,version)

C)importsystemprint(system.Version)

D)importsysprint(sys.version)

123.[單選題]一般地,”人“與”馬“分別與”人馬“相似,但”人“與”馬”很不相似;要達(dá)到

這個(gè)目的,可以令”人“”馬“與”人馬”之間的距離都比較小,但”人“與”馬”之間的距離很

大,此時(shí)該距離不滿足(_)O

A)非負(fù)性

B)同一性

C)對(duì)稱性

D)直遞性

124.[單選題]MapReduce中的歸約過(guò)程是

A)Map

B)Guiyue

C)Summary

D)Reduce

125.[單選題]HDFS采用塊復(fù)制的概念,讓數(shù)據(jù)在集群的節(jié)點(diǎn)間進(jìn)行復(fù)制,從而實(shí)現(xiàn)了一個(gè)(__)的

系統(tǒng)。

A)云計(jì)算

B)分布式文件

C)流處理

D)高度容錯(cuò)性

126.[單選題]實(shí)現(xiàn)One-Hot編碼可以用Pandas中()函數(shù)。

A)groupby()

B)merge()

C)getdummies()

D)llna()

127.[單選題]kafka-clustermirroring工具可以實(shí)現(xiàn)()功能。

A)kafka集群數(shù)據(jù)同步方案

B)kafka單集群內(nèi)數(shù)據(jù)備份

Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)

D)以全部不對(duì)

128.[單選題]線性回歸的基本假設(shè)不包括()。

A)隨機(jī)誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量

B)對(duì)于解釋變量的所有觀測(cè)值,隨機(jī)誤差項(xiàng)有相同的方差

C)隨機(jī)誤差項(xiàng)彼此相關(guān)

D)解釋變量是確定性變量不是隨機(jī)變量,與隨機(jī)誤差項(xiàng)之間相互獨(dú)立

129.[單選題]執(zhí)行以下代碼段時(shí)a=set('apple')b=set('orange')print(a&b)時(shí),輸出為

(一)o

A){'r,'e','a'.'p'}

Bn)\tf?r',tai,,g,,tef,in?,for)\

1,p,g,O,e,n,a,r)

D){Q,'a')

130.[單選題]BP算法基于(_)策略,以目標(biāo)的(_)梯度方向?yàn)閰?shù)進(jìn)行調(diào)整。

A)前向傳播,正

B)梯度下降,負(fù)

C)前向傳播,負(fù)

D)梯度下降,正

131.[單選題]下列有關(guān)Hive和Impala的對(duì)比錯(cuò)誤的是()。

A)Hive與Impala中對(duì)SQL的解釋處理比較相似,都是通過(guò)詞法分析生成執(zhí)行計(jì)劃

B)Hive與Impala使用相同的元數(shù)據(jù)

C)Hive適合于長(zhǎng)時(shí)間的批處理查詢分析,而Impala適合于實(shí)時(shí)交互式SQL查詢

D)Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而Impala也是如此

132.[單選題]選擇哪一個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見(jiàn)的做法是引人()

A)線性回歸

B)線性判別分析

C)正則化項(xiàng)

D)偏置項(xiàng)

133.[單選題]下面哪個(gè)功能不是大數(shù)據(jù)平臺(tái)安全管理組件提供的功能0。

A)接口代理

B)接口認(rèn)證

C)接口授權(quán)

D)路由代理

134.[單選題]在完整的異常語(yǔ)句中,語(yǔ)句出現(xiàn)的順序正確的是()o

A)tryfexceptfelseffinally

B)try-*else-*except-?finally

C)tryfexceptffinallyfelse

D)try-*else-*else-*except

135.[單選題]Gremlin中查詢單個(gè)點(diǎn)的信息該用什么命令

A)g.VO.hasLabel("test")

B)g.VOhasLabel("test"),values("age")

C)9.VO.hasLabel("test).valueMap("String,list","age")

D)gV(13464736).valueMapO自

136.[單選題]大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity,Variety,Veracity,其中Volume的含義是()

A)價(jià)值密度低

B)處理速度快

C)數(shù)據(jù)類型繁多

D)數(shù)據(jù)體量巨大

137.[單選題]下列操作是只能刪除空目錄的是(—)。

A)rmtree

B)mkdir

C)chdir

D)rmdir

138.[單選題]向量空間模型的缺陷不包括()

A)維度災(zāi)難

B)模型稀疏性

C)語(yǔ)義信息缺失

D)無(wú)法計(jì)算文本相似度

139.[單選題]()和假設(shè)檢驗(yàn)又可歸結(jié)為統(tǒng)計(jì)推斷的范疇,即對(duì)總體的數(shù)量特征做出具有一定可靠程度

的估計(jì)和判斷。

A)參數(shù)估計(jì)

B)邏輯分析

C)方差分析

D)回歸分析

140.[單選題]摩爾定律指出,當(dāng)價(jià)格不變時(shí),集成電路上可容納的晶體管數(shù)目,約每隔()便會(huì)增

加一倍,性能也將提升一倍。

A)6個(gè)月

B)18個(gè)月

012個(gè)月

D)24個(gè)月

141.[單選題]下列操作屬于預(yù)剪枝的是()。

A)信息增益

B)計(jì)算最好的特征切分點(diǎn)

C)限制樹(shù)模型的深度

D)可視化樹(shù)模型

142.[單選題]公司()負(fù)責(zé)研究審議網(wǎng)絡(luò)與數(shù)據(jù)安全總體方針、重大政策和重大事項(xiàng)。

A)國(guó)網(wǎng)安質(zhì)部

B)國(guó)網(wǎng)信通部

C)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組

D)國(guó)網(wǎng)辦公廳

143.[單選題]下列關(guān)于HDFS為存儲(chǔ)MapReduce并行切分和處理的數(shù)據(jù)做的設(shè)計(jì),錯(cuò)誤的是()

A)FSDatalnputStream擴(kuò)展了DatalnputStream以支持隨機(jī)讀

B)為實(shí)現(xiàn)細(xì)粒度并行,輸入分片(InputSplit)應(yīng)該越小越好

C)一臺(tái)機(jī)器可能被指派從輸入文件的任意位置開(kāi)始處理一個(gè)分片

D)輸入分片是一種記錄的邏輯劃分,而HDFS數(shù)據(jù)塊是對(duì)輸入數(shù)據(jù)的物理分割

144.[單選題](一)是一個(gè)在HDFS上開(kāi)發(fā)的面向列的分布式數(shù)據(jù)庫(kù)。

A)Hive

B)Pig

C)Mahout

D)Hbase

145.[單選題]以下()在關(guān)系模型中表示屬性的取值范圍。--

A)元組

B)鍵

C)屬性

D)域

146.[單選題]啟動(dòng)hadoop所有進(jìn)程的命令是()。

A)start-dfs.sh

B)start-all.sh

C)start-hadoop.sh

D)start-hdfs.sh

147.[單選題]以下圖像分割方法中,不屬于基于圖像灰度分布的閾值方法的是

A)類間最大距離法

B)最大類間、內(nèi)方差比法

0p-參數(shù)法

D)區(qū)域生長(zhǎng)法

148.[單選題]數(shù)據(jù)管理成熟度模型中成熟度等級(jí)最高的是()。

A)已優(yōu)化級(jí)

B)已測(cè)量級(jí)

C)已定義級(jí)

D)已管理級(jí)

149.[單選題]int('Oxa',16)的結(jié)果為()0

A)10

B)12

016

D)a

150.[單選題]大數(shù)據(jù)的起源是().

A)金融

B)電信

C)互聯(lián)網(wǎng)

D)公共管理

151.[單選題]業(yè)務(wù)中臺(tái)方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺(tái),后期逐步視情況

拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)

A)電網(wǎng)服務(wù)業(yè)務(wù)中臺(tái)

B)電網(wǎng)資源業(yè)務(wù)中臺(tái)

C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺(tái)

D)電網(wǎng)環(huán)境業(yè)務(wù)中臺(tái)

152.[單選題]ElasticSearch中構(gòu)建一個(gè)query需要用到下列哪個(gè)代碼?

A)QueryBuilders.putQuery()

B)QueryBuilders.matchQuery()

C)QueryBuiIdersgetQuery()

D)QueryBuiIderscreateQuery()

153.[單選題]關(guān)系云的一個(gè)重要功能是提供()。

A)數(shù)據(jù)庫(kù)即服務(wù)

B)虛擬服務(wù)

C)彈性計(jì)算

D)按需服務(wù)

154.[單選題]下列不屬于Transformation操作的是()。

A)map

B)filter

C)sample

D)count

155.[單選題]使用池化層相比于相同步長(zhǎng)的卷積層的優(yōu)勢(shì)在于?

A)參數(shù)更少

B)可以獲得更大下采樣

C)速度更快

D)有助于提升精度

156.[單選題]下列關(guān)于線性回歸分析中的殘差說(shuō)法正確的是()。

A)殘差均值總是為零

B)殘差均值總是約等于零

C)殘差均值總是大于本

D)以上答案都不正確

157.[單選題]執(zhí)行以下代碼段x=32deffl():globalxx=14deff2():globalxx=

29print(x)時(shí),輸出為(____)。

A)32

B)14

029

D)以上都不是

158.[單選題]以下插入記錄正確的()

A)insertintoemp(ename,hiredate,sal)values(valuel,value2,value3);

B)insertintoemp(ename,sal)values(valuel,value2,value3);

C)insertintoemp(ename)values(valuel,value2,value3);

D)insertintoemp(ename,hiredate,sal)values(valuel,value2);

159.[單選題]給定訓(xùn)練樣例集,設(shè)法將樣例投影到一條直線上,使得同類樣例的投影點(diǎn)盡可能接近、

異類樣例的投影點(diǎn)盡可能遠(yuǎn)離,這說(shuō)的是()算法。

A)PCA

B)SVM

C)K-means

D)LDA

160.[單選題]FusioninsightHD系統(tǒng)中,下面哪個(gè)方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果

A)通過(guò)LoaderUI界面查看

B)通過(guò)YARN任務(wù)管理查看

C)通過(guò)NodeManager查看

D)通過(guò)Manager的告警查看

161.[單選題]關(guān)于“from-import”形式,以下錯(cuò)誤的選項(xiàng)是(—兀

A)從模塊名導(dǎo)入標(biāo)識(shí)符

B)這種導(dǎo)入形式可以防止名稱沖突

C)被導(dǎo)入模塊的命名空間是模塊導(dǎo)入的一部分

D)模塊中的標(biāo)識(shí)符可直接訪問(wèn)為標(biāo)識(shí)符

162.[單選題]下列模型中與文本分類相關(guān)的是()。

A)決策樹(shù)

B)神經(jīng)網(wǎng)絡(luò)

OKNN算法

D)以上都對(duì)

163.[單選題]()屬于Spark框架中的可擴(kuò)展機(jī)器學(xué)習(xí)庫(kù)。

A)MLib

B)GraphX

C)Streaming

D)SparkSQL

164.[單選題]關(guān)于RDD,下列說(shuō)法錯(cuò)誤的是?

A)RDD具有血統(tǒng)機(jī)制答案:Lineage

B)RDD默認(rèn)存儲(chǔ)在磁盤

ORDD是一個(gè)只讀的,可分區(qū)的分布式數(shù)據(jù)集

D)RDD是Spark對(duì)基礎(chǔ)數(shù)據(jù)的抽象

165.[單選題]Spark的集群管理模式不包含()。

A)Standalone模式

B)Message模式

OYARN模式

D)Mesos模式

166.[單選題]在Kafka集群中,Kafka服務(wù)端的角色是下列哪-項(xiàng)?

A)Producer

B)ZooKeeper

C)Consumer

D)Broker

167.[單選題](一)是norm,rvs(5)的結(jié)果。

A)7.1316243700758

B)array([-0.35687759,1.34347647,-0.11710531,-1.00725181,-0.51275702])

C)array([1,2,3,4,5])

D)array([5,4,3,2,1])

168.[單選題](_)不屬于基本分析方法。

A)回歸分析

B)分類分析

C)聚類分析

D)元分析

169.[單選題]Hadoop使用了一套獨(dú)有的配置文件管理系統(tǒng),并提供自己的API,即使用()處理配

置信息。

A)org.apache,hadoop.conf.Configuration

B)org.apache,hadoop.conf.Config

C)org.apache,hadoop.fs.FileSystem

D)org.apache,hadoop.fs.Path

170.[單選題]大數(shù)據(jù)的起源()

A)電信

B)互聯(lián)網(wǎng)

C)金融

D)公共管理

171.[單選題]在Hadoop生態(tài)系統(tǒng)的組件中(__)是可擴(kuò)展可伸縮的工作流協(xié)調(diào)管理器。

A)Oozie

B)Flume

C)Sqoop

D)Hue

172.[單選題]執(zhí)行以下代碼段cars=['bmw','audi','toyota',

1subaru']cars,sort()print(cars)時(shí),輸出為()。

A)['audi',1bmw',1subaru*,1toyotaf]

B)['toyota',1subaru1,'bmw',faudi1]

C)[rbmw1,1audi1,1toyota',1subaru1]

D)['bmw',1toyota1,'audi',1subaru11

173.[單選題]Flume中一個(gè)ChannelSelector的作用是什么?

A)設(shè)置多個(gè)channel發(fā)往多個(gè)sink的策略

B)設(shè)置一個(gè)source發(fā)往多個(gè)channel的策略

C)設(shè)置多個(gè)source發(fā)往多個(gè)channel的策略

D)設(shè)置一個(gè)channel發(fā)往多個(gè)sink的策略角

174.[單選題]Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()

A)64M

B)128M

C)256M

D)512M

175.[單選題]下列有關(guān)KNN算法的流程順序,描述正確的是()①確定K的大小,和距離的計(jì)算方法

②根據(jù)K個(gè)樣本的所屬類別,投票決定測(cè)試樣本的類別歸屬③計(jì)算訓(xùn)練集樣本與測(cè)試樣本的舉例,選

出K個(gè)與測(cè)試樣本最相似的樣本

A)①②③

B)③②①

C)①③②

D)②①③

176.[單選題]HAVING子句的位置放在GROUPBY子句之()

A)前后都可以

B)前

C)后

D)以上都不對(duì)

177.[單選題]以下哪項(xiàng)屬于Flume的基本數(shù)據(jù)單位?

A)Subject

B)Topic

C)Object

D)Event

178.[單選題]消費(fèi)信息是否屬于用戶信息?()

A)屬于

B)不屬于

C)未定義

D)以上都不對(duì)

179.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于

分歧的方法(disagreement-basedmethods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分歧(disagreement)對(duì)未

標(biāo)記數(shù)據(jù)的利用至關(guān)重要。()是此類方法的重要代表。

A)協(xié)同訓(xùn)練

B)組合訓(xùn)練

C)配合訓(xùn)練

D)陪同訓(xùn)練

180.[單選題]下列關(guān)于Python模塊的理解錯(cuò)誤的是()。

A)模塊是包含函數(shù)和變量的Python文件

B)不可以使用"操作符訪問(wèn)模塊中的函數(shù)和變量

C)可以導(dǎo)入模塊中的所有類

D)可以在一個(gè)模塊中導(dǎo)入另一個(gè)模塊

181.[單選題]k-means算法中K指的是:()

A)K個(gè)樣本

B)K個(gè)質(zhì)心

C)K次迭代

D)K次方

182.[單選題]某電商網(wǎng)站想要實(shí)現(xiàn)熱銷商品的實(shí)時(shí)TopN排名,可以使用哪種技術(shù)實(shí)現(xiàn)?

A)Elasticsearch的快速檢索

B)HBase的rowkey索引

C)Hive的關(guān)聯(lián)查詢分析

D)Redis的排序計(jì)算

183.[單選題]()是表管理類,提供了一個(gè)接口來(lái)管理HBase數(shù)據(jù)庫(kù)的表信息。它提供的方法包括

:創(chuàng)建表、刪除表、列出表項(xiàng)、使表有效或無(wú)效,以及添加或刪除表列簇成員等。

A)Admin

B)Table

C)HTableDescriptor

D)HColumnDescriptor

184.[單選題]以下不屬于維度建模過(guò)程的是()

A)選擇業(yè)務(wù)過(guò)程

B)定義粒度

C)建立模型

D)確定事實(shí)

185.[單選題]下列哪個(gè)不屬于可視化工具?()

A)Google

B)D3

C)Visual.ly

D)Spark

186.[單選題]與以下代碼段var=lOOifvar==200:print("1-Gotatrueexpression

value")print(var)elifvar==150:print("2-Gotatrueexpressionvalue")

print(var)elifvar==100:print("3-Gotatrueexpressionvalue")print(var)else:

print("4-Gotafalseexpressionvalue")print(var)等效的列表描述()。

A)1-GotatrueexpressionvaluelOO

B)2-GotatrueexpressionvaluelOO

C)3-GotatrueexpressionvaluelOO

D)4-GotatrueexpressionvaluelOO

187.[單選題]數(shù)學(xué)關(guān)系式2

A)2

B)2

02

D)x>2orx

188.[單選題]在Numpy中,數(shù)組拼接的函數(shù)不包括()。

A)append()

B)insert()

C)vstack()

D)where()

189.[單選題]HBase依賴____提供強(qiáng)大的計(jì)算能力。

A)Zookeeper

B)Chubby

ORPC

D)MapReduce

190.[單選題]在k近鄰學(xué)習(xí)算法中,隨著k的增加,上界將逐漸降低,當(dāng)k區(qū)域無(wú)窮大時(shí),上界和下界

碰到一起,k近鄰法就達(dá)到了(_)。

A)貝葉斯錯(cuò)誤率

B)漸進(jìn)錯(cuò)誤率

C)最優(yōu)值

D)上界

191.[單選題]()屬于淺層學(xué)習(xí)模型

A)DBN

B)CNN

OSVM

D)RNN

192.[單選題]下面這段代碼的作用是什么?(VX:HWRZKSTK)

A)判斷索引分片是否存在

B)判斷索引是否可用

C)判斷索引是否存在

D)判斷索引類型

193.[單選題]當(dāng)在卷積神經(jīng)網(wǎng)絡(luò)中加人池化層(pool恒.glay,町)時(shí),變換的不變性會(huì)被保留該說(shuō)十

法()正確

A)不知道

B)看情況

C)是

D)否

194.[單選題]在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的MapReduce中可以使用資源

(Resource,包括jar包、壓縮文件、表等)。在使用jar命令執(zhí)行MR程序時(shí),需要在參數(shù)

resources中指定資源,以下說(shuō)法正確的是:()。

A)包括已上傳到大數(shù)據(jù)計(jì)算服務(wù)的MR程序本身所在的jar包,以及MR程序用到的大數(shù)據(jù)計(jì)算服務(wù)上的

資源

B)僅包含MR程序中用到的大數(shù)據(jù)計(jì)算服務(wù)上的資源

0僅包含保存在本地的MR程序本身所在的jar包

D)僅包含已上傳到大數(shù)據(jù)計(jì)算服務(wù)的MR程序本身所在的jar包

195.[單選題]以下說(shuō)法不正確的是()

A)卷積神經(jīng)網(wǎng)絡(luò)主要用于目標(biāo)識(shí)別、國(guó)像分割等方面

B)循環(huán)神經(jīng)網(wǎng)絡(luò)主要用于處理序列數(shù)據(jù)

C)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)主要用于處理序列數(shù)據(jù)

D)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是和循環(huán)神經(jīng)網(wǎng)絡(luò)完全不同的一種新型神經(jīng)網(wǎng)絡(luò)

196.[單選題]如果線性回歸模型中的隨機(jī)誤差存在異方差性,那么參數(shù)的OLS估計(jì)量是

A)無(wú)偏的,有效的

B)無(wú)偏的,非有效的

C)有偏的,有效的

D)有偏的,非有效的

197.[單選題]當(dāng)閔可夫斯基距離公式中的系數(shù)p趨近于無(wú)窮大時(shí),可得到(_)的公式。

A)歐氏距離

B)曼哈頓距離

C)街區(qū)距離

D)切比雪夫距離

198.[單選題]從節(jié)點(diǎn)程序()o

A)NameNode

B)DataNode

C)SecondaryNameNode

D)Jobtracker

199.[單選題]當(dāng)機(jī)器學(xué)習(xí)把訓(xùn)練樣本自身特點(diǎn)當(dāng)作所有潛在樣本特點(diǎn),導(dǎo)致泛化性能下降,這種現(xiàn)

象在機(jī)器學(xué)習(xí)中稱為(—)。

A)偏差

B)過(guò)擬合

C)欠擬合

D)誤差

200.[單選題]下列關(guān)于拋出異常的說(shuō)法錯(cuò)誤的是()。

A)當(dāng)raise指定異常的類名時(shí),會(huì)隱式地創(chuàng)建異常類的實(shí)例

B)顯式地創(chuàng)建異常類實(shí)例,可以使用raise直接引發(fā)

C)不帶參數(shù)的raise語(yǔ)句,只能引發(fā)剛剛發(fā)生過(guò)的異常

D)使用raise拋出異常時(shí),無(wú)法指定描述信息

201.[單選題]2012年,()政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,標(biāo)志著大數(shù)據(jù)已經(jīng)成為重要的

時(shí)代特征

A)中國(guó)

B)美國(guó)

C)日本

D)英國(guó)

202.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列()學(xué)派。

A)符號(hào)主義

B)連接主義

C)行為主義

D)都不是

203.[單選題]邏輯回歸的實(shí)現(xiàn)采用的方法是()。

A)LinearRegression()

B)LogisticRegression()

C)HuberRegression()

D)TheilSenRegression()

204.[單選題]numpy矩陣之間的內(nèi)積使用什么函數(shù)?

A)np.dot()

B)np.cross()

C)np.outer()

D)np.svd()

205.[單選題]()是指幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),但當(dāng)這些數(shù)據(jù)組組合在一起后,這種

趨勢(shì)將消失或反轉(zhuǎn)。

A)辛普森悖論

B)大數(shù)據(jù)悖論

C)大數(shù)據(jù)偏見(jiàn)

D)幸存者偏差

206.[單選題]下列關(guān)于推薦系統(tǒng)的描述,哪一項(xiàng)是錯(cuò)誤的?()

A)推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用

B)推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具

C)推薦系統(tǒng)可以創(chuàng)造全新的商業(yè)和經(jīng)濟(jì)模式,幫助實(shí)現(xiàn)長(zhǎng)尾商品的銷售

D)推薦系統(tǒng)分為基于物品的協(xié)同過(guò)濾和基于商家的協(xié)同過(guò)濾

207.[單選題]下面屬于數(shù)據(jù)權(quán)限的特權(quán)是()。-

A)DR0P

B)ALTER

C)DELETE

D)以上答案全部正確

208.[單選題]使用Maxcomputetunnel命令上傳log.txt文件到表t_log中去,t_log為分區(qū)表(pl

string,p2string)。下列命令中正確的是:()。

A)tunneluploadlog.txtt_log/pl="bl”/p2="b2”

B)tunneluploadlog.txtt_log(pl="bl”,p2=“b2”)

C)tunneluploadlog.txtt_log/pl="bl”,p2=“b2”

D)tunneluploadlog.txtt_log/(pl="bl”,p2="b2”)

209.[單選題]()肯定是寬依賴操作。

A)map

B)flatMap

C)reduceByKey

D)sample

210.[單選題]上傳當(dāng)前目錄下的本地文件word,txt到分布式文件系統(tǒng)HDFS的"/dirPath”目錄下的

Shell命令是()o

A)hdfsdfs-put/dirPathword,txt

B)hadoopdfs-put/dirPathword,txt

C)hdfsfs-putword,txt/dirPath

D)hdfsdfs-putword,txt/dirPath

211.[單選題]以下內(nèi)容符合物體識(shí)別任務(wù)的是()o

A)不能對(duì)圖像進(jìn)行壓縮或剪裁

B)遵守誤差最小準(zhǔn)則和最佳近似準(zhǔn)則

C)可以不指定分類的類別數(shù)量

D)事先給定樣本的分布特征

212.[單選題]整形變量x中存放了一個(gè)兩位數(shù),要將這個(gè)兩位數(shù)的個(gè)位數(shù)字和十位數(shù)字變換位子,例

如,13變成31,正確的python表達(dá)式為。()

A)(x%10)*10+x//10

B)(x%10)//10+x//10

C)(x/10)%10+x//10

D)(x%10)*10+x%10

213.[單選題]在支持向量機(jī)中,軟間隔支持向量機(jī)的目標(biāo)函數(shù)比硬間隔支持向量機(jī)多了一個(gè)()

A)偏置項(xiàng)b

B)系教

C)松弛變量

D)兩種情況的目標(biāo)函數(shù)相同

214.[單選題]假設(shè)你有5個(gè)大小為7x7、邊界值為0的卷積核,同時(shí)卷積神經(jīng)網(wǎng)絡(luò)第一層的深度為1此

時(shí)如果你向這一層傳人一個(gè)維度為224x224x3的數(shù)據(jù),那么神經(jīng)網(wǎng)絡(luò)下一層所接收到的數(shù)據(jù)維度是(

A)218x218x5

B)217x217x8

0217x217x3

D)220x220x5

215.[單選題]下面對(duì)SecondaryNameNode第二名稱節(jié)點(diǎn)的描述,哪個(gè)是錯(cuò)誤的?

A)SecondaryNameNode一般是并行運(yùn)行在多臺(tái)機(jī)器上

B)它是用來(lái)保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間

C)SecondaryNameNode通過(guò)HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地

的相應(yīng)目錄下

D)SecondaryNameNode是HDFS架構(gòu)中的一個(gè)組成部分

216.[單選題]FusioninsightHD系統(tǒng)中,以下選項(xiàng)哪一個(gè)不是HBase寫數(shù)據(jù)設(shè)計(jì)的角色或服務(wù)?

A)Zookeeper

B)HDFS

OHMaster

D)RegionServer

217.[單選題]以下屬于FROM子查詢的是()。一

A)標(biāo)量子查詢

B)列子查詢

C)行子查詢

D)表子查詢

218.[單選題]下列選項(xiàng)中,哪一項(xiàng)是研究大數(shù)據(jù)最重要的意義()

A)分析

B)統(tǒng)計(jì)

C)測(cè)試

D)預(yù)測(cè)

219.[單選題]把基于使用DMSquid作為模型的Predict輸出進(jìn)行反向轉(zhuǎn)換得到原始的標(biāo)簽值,會(huì)采用

哪個(gè)數(shù)值轉(zhuǎn)換器?

A)JobId

B)InverseQuantify

C)DMSquid

D)InverseNormalizer

220.[單選題]數(shù)據(jù)可視化的本質(zhì)是()o

A)將數(shù)據(jù)轉(zhuǎn)換為知識(shí)

B)將知識(shí)轉(zhuǎn)換為數(shù)據(jù)

C)將數(shù)據(jù)轉(zhuǎn)換為信息

D)將信息轉(zhuǎn)換為智慧

221.[單選題]在一個(gè)線性回歸問(wèn)題中,我們使用R平方(R-Squared)來(lái)判斷擬合度。此時(shí)、如果增加一

個(gè)特征,模型不變,則下面說(shuō)法正確的是()。

A)如果R-Squared增加,則這個(gè)特征有意義

B)如果R-Squared減小,則這個(gè)特征沒(méi)有意義

C)僅看R-Squared單一變量,無(wú)法確定這個(gè)特征是否有意義

D)以上說(shuō)法都不對(duì)

222.[單選題]建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘

的哪一類任務(wù)?

A)根據(jù)內(nèi)容檢索

B)建模描述

C)預(yù)測(cè)建模

D)尋找模式和規(guī)則

223.[單選題]pipshowSomePackage指令的意義是(__)0

A)卸載指定包

B)安裝指定包

C)搜索指定包

D)查看指定包的詳細(xì)信息

224.[單選題]以()為指導(dǎo),結(jié)合業(yè)務(wù)數(shù)據(jù)資產(chǎn)需求和數(shù)據(jù)資產(chǎn)管理現(xiàn)狀,編制專業(yè)數(shù)據(jù)資產(chǎn)發(fā)展

規(guī)劃,統(tǒng)籌編制公司數(shù)據(jù)資產(chǎn)發(fā)展規(guī)劃。

A)公司戰(zhàn)略

B)公司數(shù)據(jù)安全戰(zhàn)略

C)公司管理制度

D)公司數(shù)據(jù)資產(chǎn)發(fā)展戰(zhàn)略

225.[單選題]MaxCompute提供了多種針對(duì)日期的計(jì)算函數(shù),以下函數(shù)中,能實(shí)現(xiàn)計(jì)算兩個(gè)時(shí)間的差

的是:()。

A)datediff

B)timestampdiff

C)interval

D)直接相減

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論