版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試題說(shuō)明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14(500題)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)練習(xí)題及答案14
L[單選題]下列哪個(gè)不是RDD的緩存方法()
A)persist()
B)cache()
C)memory()
2.[單選題]Spark中Job的劃分依據(jù)是()。
A)依賴
B)Action算子
C)Transformation算子
3.[單選題]下列方法中,不可以用于特征降維的方法包括
A)主成分分析PCA
B)線性判別分析LDA
C)深度學(xué)習(xí)SparseAutoEncoder
D)矩陣奇異值分解SVD
4.[單選題]MaxCompute服務(wù)是以RESTfulAPI的形式對(duì)外提供。下列()方法可以更新資源。
A)UPDATE
B)P0ST
C)GET
D)PUT
5.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,全景風(fēng)險(xiǎn)視圖模塊,為了用戶能便捷查看客戶
的關(guān)聯(lián)風(fēng)險(xiǎn),實(shí)現(xiàn)客群風(fēng)險(xiǎn)監(jiān)測(cè)和關(guān)聯(lián)客戶風(fēng)險(xiǎn)聯(lián)防聯(lián)控,系統(tǒng)在全景風(fēng)險(xiǎn)視圖的客戶名稱下放置
了()按鈕,方便用戶查看關(guān)鍵信息。
A)【權(quán)限申請(qǐng)】、【集團(tuán)圖譜】、【最終受益人】
B)B.【數(shù)據(jù)補(bǔ)錄】、【集團(tuán)圖譜】、【最終受益人】
C)C.【影像操作】、【企業(yè)信用智能分析報(bào)告】、【集團(tuán)圖譜】、【最終受益人】
D)D.【擔(dān)保圈鏈】、【關(guān)聯(lián)關(guān)系圖譜】、【企業(yè)信用智能分析報(bào)告】、【集團(tuán)圖譜】、【最終受益
人】
6.[單選題]假設(shè)你正在訓(xùn)練一個(gè)LSTM網(wǎng)絡(luò),你有一個(gè)10000詞的詞匯表,并且使用一個(gè)激活值維度
為100的LSTM塊,在每一個(gè)時(shí)間步中,幾的維度是()
A)1
B)100
C)300
D)10000
7.[單選題]Hive不適用于以下哪個(gè)場(chǎng)景
A)非實(shí)時(shí)分析,例如日志分析,統(tǒng)計(jì)分析
B)數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示
C)數(shù)據(jù)匯總,例如每天,每用戶點(diǎn)擊數(shù),點(diǎn)擊排行
D)實(shí)時(shí)在線數(shù)據(jù)分析
8.[單選題]Kafka集群在運(yùn)行期間,直接依賴于下面那些組件?
A)Spark
B)Zookeeper
OHBase
D)HDFS
9.[單選題]內(nèi)部用戶有作業(yè)層、管理層、()
A)執(zhí)行層
B)決策層
C)建議層
D)推送層
10.[單選題]數(shù)據(jù)的故事化描述是指為了提升數(shù)據(jù)的(),將數(shù)據(jù)還原成關(guān)聯(lián)至特定的情景的過(guò)程
O
A)可理解性、可記憶性、可體驗(yàn)性
B)可接受性、可記憶性、可體驗(yàn)性
C)可接受性、可記憶性、可呈現(xiàn)性
D)可理解性、可記憶性、可呈線性
11.[單選題]迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()
A)我為人人,人人為我
B)全樣而非抽樣
C)效率而非精確
D)相關(guān)而非因果
12.[單選題]以下不屬于大數(shù)據(jù)系統(tǒng)端風(fēng)險(xiǎn)的是()
A)數(shù)據(jù)系統(tǒng)的申請(qǐng)、查看流程
B)數(shù)據(jù)查看權(quán)限
C)系統(tǒng)平臺(tái)的穩(wěn)定性
D)數(shù)據(jù)庫(kù)管理、存儲(chǔ)
13.[單選題]下列語(yǔ)句執(zhí)行的結(jié)果是()>>>a=l>>>b=2*a/4>>>a="one">〉>print(a,b)
A)one0
B)10
C)one0.5
D)one,0.5
14.[單選題]以下關(guān)于關(guān)系數(shù)據(jù)模型的論述正確的是()
A)只能表示實(shí)體間的1:1聯(lián)系
B)只能表示實(shí)體間的Ln聯(lián)系
C)只能表示實(shí)體間的m:n聯(lián)系
D)可以表示實(shí)體間上述三種聯(lián)系
15.[單選題]在Hive中,以下那一個(gè)查詢語(yǔ)句可以將2個(gè)或多個(gè)表集合進(jìn)行合并()
A)unionfull
B)unionall
C)unionfor
D)unionon
16.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于
分歧的方法(disagreement-basedme也ods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分岐(disagreement)對(duì)未
標(biāo)記數(shù)據(jù)的利用至關(guān)重要()是此類方法的重要代表
A)協(xié)同訓(xùn)練
B)組合訓(xùn)練
C)配合訓(xùn)練
D)陪同訓(xùn)練
17.[單選題]大數(shù)據(jù)的4V特性不包括
A)Volume(大量)
B)Velocity(高速)
C)Visual(可視)
D)Variety(多樣)
18.[單選題]下面關(guān)于Hadoop的描述錯(cuò)誤的是:()
A)Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架
B)作為并行分布式計(jì)算平臺(tái),Hadoop采用分布式存儲(chǔ)和分布式處理兩大核心技術(shù),能夠高效地處理
PB級(jí)數(shù)據(jù)
C)Hadoop只支持Java編程語(yǔ)言
D)Hadoop可以高效穩(wěn)定地運(yùn)行在廉價(jià)的計(jì)算機(jī)集群上,可以擴(kuò)展到數(shù)以千計(jì)的計(jì)算機(jī)節(jié)點(diǎn)上
19.[單選題]type(complex(2,4))的結(jié)果為(____)0
A)class'int'
B)class'float'
C)class'complex
D)class'bool'
20.[單選題]以下四種描述中,正確的是()
A)、大數(shù)據(jù)和海量數(shù)據(jù)是同一個(gè)事物的不同描述
B)、數(shù)據(jù)和數(shù)值是同一個(gè)事物的不同描述
C)、數(shù)據(jù)和數(shù)字是同一個(gè)事物的不同描述
D)、以上說(shuō)法均不正確
21.[單選題](_)是M-P神經(jīng)元,也稱為“閾值邏輯單元”。
A)輸入層
B)輸出層
C)第一層
D)第二層
22.[單選題]Python使用()符號(hào)標(biāo)示注釋。
A)&
B)*
0#
D)//
23.[單選題]大數(shù)據(jù)時(shí)代,數(shù)據(jù)使用的關(guān)鍵是().
A)數(shù)據(jù)收集
B)數(shù)據(jù)存儲(chǔ)
C)數(shù)據(jù)分析
D)低容錯(cuò)性
24.[單選題]下面哪項(xiàng)操作能實(shí)現(xiàn)跟神經(jīng)網(wǎng)絡(luò)中Dropout的類似效果?
A)Boosting
B)bagging
C)Stacking
D)Mapping
25.[單選題]網(wǎng)站在運(yùn)營(yíng)過(guò)程中,會(huì)有用戶訪問(wèn)并產(chǎn)生行為數(shù)據(jù),要想對(duì)這些數(shù)據(jù)進(jìn)行處理挖掘,如
果是離線批處理下的方案配置,描述不正確的是
A)數(shù)據(jù)導(dǎo)入導(dǎo)出,Loader
B)數(shù)據(jù)采集傳輸:Flume
C)數(shù)據(jù)計(jì)算,Storm
D)數(shù)據(jù)存儲(chǔ).HDFS或MySql
26.[單選題]機(jī)器學(xué)習(xí)中L1正則化和L2正則化的區(qū)別是?()
A)使用L1可以得到稀疏的權(quán)值,使用L2可以得到平滑的權(quán)值
B)使用L1可以得到平滑的權(quán)值,使用L2可以得到平滑的權(quán)值
C)使用L1可以得到平滑的權(quán)值,使用L2可以得到稀疏的權(quán)值
D)使用L1可以得到稀疏的權(quán)值,使用L2可以得到稀疏的權(quán)值
27.[單選題]我國(guó)首家大數(shù)據(jù)交易所是:()
A)貴陽(yáng)大數(shù)據(jù)交易所
B)上海數(shù)據(jù)交易中心
C)華東江蘇大數(shù)據(jù)交易中心
D)浙江大數(shù)據(jù)交易中心
28.[單選題]下列哪個(gè)標(biāo)識(shí)符是合法的()
A)print
B)_100
C)12name
D)name
29.[單選題](_)是從海量文本中查詢到觀點(diǎn)信息,根據(jù)主題相關(guān)度和觀點(diǎn)傾向性對(duì)結(jié)果排序。
A)情感分類
B)情感檢索
C)情感抽取
D)情感分析
30.[單選題]下面不屬于大數(shù)據(jù)4V特性有(一)。
A)容量大
B)類型多
C)速度快
D)應(yīng)用價(jià)值高
31.[單選題]設(shè)2={1,1,1,1,1,2,3,4,5,5,5,5},貝?。輕rint(len(a))的顯示結(jié)果為(.)。
A)5
B)12
03
D)Error
32.[單選題]支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是()
A)數(shù)據(jù)科學(xué)
B)數(shù)據(jù)應(yīng)用
C)數(shù)據(jù)硬件
D)數(shù)據(jù)人才
33.[單選題]以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫流程說(shuō)法正確的是?
A)僅寫入內(nèi)存
B)同時(shí)寫入磁盤和內(nèi)存
C)先寫入內(nèi)存再寫入磁盤
D)先寫磁盤再寫內(nèi)存
34.[單選題]numpy中向量轉(zhuǎn)成矩陣使用什么函數(shù)?
A)np.reshape()
B)np.reval()
C)np.arange()
D)np.random()
35.[單選題]對(duì)線下零售而言,做好大數(shù)據(jù)分析應(yīng)用的前提是。
A)增加統(tǒng)計(jì)種類
B)擴(kuò)大營(yíng)業(yè)面積
C)增加數(shù)據(jù)來(lái)源
D)開(kāi)展優(yōu)惠促銷
36.[單選題]以下名稱中不屬于“屬性張成的空間”的是(—)。
A)屬性空間
B)樣本空間
C)輸入空間
D)對(duì)偶空間
37.[單選題]關(guān)于賦值語(yǔ)句,以下選項(xiàng)中描述錯(cuò)誤的是
A)在Python語(yǔ)言中,有一種賦值語(yǔ)句,可以同時(shí)給多個(gè)變量賦值
B)設(shè)x="alice";y="kate",執(zhí)行x,y=y,x可以實(shí)現(xiàn)變量x和y值的互換
C)設(shè)a=10;b=20,執(zhí)行a,b=a,a+bprint(a,b)和a=bb=a+bprint(a,b)之后,得到
同樣的輸出結(jié)果:1030
D)在Python語(yǔ)言中,“=”表示賦值,即將“=”右側(cè)的計(jì)算結(jié)果賦值給左側(cè)變量,包含“=”的語(yǔ)
句稱為賦值語(yǔ)句
38.[單選題]關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:
A)基本元數(shù)據(jù)與數(shù)據(jù)源,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息
B)基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息
C)基本元數(shù)據(jù)包括日志文件和簡(jiǎn)歷執(zhí)行處理的時(shí)序調(diào)度信息
D)基本元數(shù)據(jù)包括關(guān)于裝載和更新處理,分析處理以及管理方面的信息
39.[單選題]以下不屬于關(guān)系型數(shù)據(jù)庫(kù)的是()
A)DB2
B)HBase
C)MySQL
D)Oracle
40.[單選題]下列數(shù)據(jù)類型中不可以作為索引對(duì)Numpy數(shù)組進(jìn)行選取的是()。
A)boolean
B)tuple
C)diet
D)int
41.[單選題]scipy.stats模塊中對(duì)隨機(jī)變量進(jìn)行隨機(jī)取值的函數(shù)是()。
A)rvs
B)pdf
Ocdf
D)sf
42.[單選題]以下哪項(xiàng)用來(lái)排序()
A)ORDEREDBY
B)ORDERBY
C)GROUPBY
D)GROUPEDBY
43.[單選題]Relief的擴(kuò)展變體Relief-F能夠處理(_)問(wèn)題。
A)二分類
B)多分類
C)回歸
D)降維
44.[單選題]信息安全事件的處理不遵循的原則是()
A)統(tǒng)一領(lǐng)導(dǎo)
B)綜合協(xié)調(diào)
C)快速處理
D)集體責(zé)任
45.[單選題]下列哪一項(xiàng)不屬于儀表板的布局模式()
A)標(biāo)準(zhǔn)模式
B)自由模式
C)標(biāo)準(zhǔn)模式(分頁(yè))
D)自由模式(分頁(yè))
46.[單選題]若設(shè)1.啟動(dòng),2.診斷,3.建立,4.行動(dòng),5.學(xué)習(xí),貝UDMM模型中的順序?yàn)椋╛)。
A)12345
B)12354
013254
D)13245
47.[單選題]以下關(guān)于函數(shù)參數(shù)和返回值的描述,正確的是:
A)采用名稱傳參的時(shí)候,實(shí)參的順序需要和形參的順序一致
B)可選參數(shù)傳遞指的是沒(méi)有傳入對(duì)應(yīng)參數(shù)值的時(shí)候,就不使用該參數(shù)
C)函數(shù)能同時(shí)返回多個(gè)參數(shù)值,需要形成一個(gè)列表來(lái)返回
D)Python支持按照位置傳參也支持名稱傳參,但不支持地址傳參
48.[單選題]高斯核也稱為(_)。
A)多項(xiàng)式核
B)拉普拉斯核
C)RBF核
D)Sigmoid核
49.[單選題]數(shù)據(jù)產(chǎn)品開(kāi)發(fā)的關(guān)鍵環(huán)節(jié)是()
A)數(shù)據(jù)收集
B)數(shù)據(jù)預(yù)處理
C)數(shù)據(jù)學(xué)習(xí)
D)數(shù)據(jù)加工
50.[單選題]Flume的高級(jí)組件不包含以下哪個(gè)?
A)SinkProcessor
B)ChannelInterceptor
C)ChannelSelector
D)SourceInterceptor
51.[單選題]以下()組件負(fù)責(zé)存儲(chǔ)業(yè)務(wù)數(shù)據(jù)、執(zhí)行數(shù)據(jù)查詢?nèi)蝿?wù)以及向CN返回執(zhí)行結(jié)果。
A)GTM
B)WLM
C)CN
D)DN
52.[單選題]下列語(yǔ)句中不能創(chuàng)建一個(gè)字典的是()。
A)dictl={}
B)dict2={3:5}
C)dict3={[1,2,3]I"uestc")
D)dict4={(1,2,3):"uestc")
53.[單選題]下列有關(guān)Hive中分桶表理解不正確的是()
A)Hive不能針對(duì)分區(qū)進(jìn)行桶的組織
B)Hive可以針對(duì)某一列進(jìn)行桶的組織
C)把表組織成桶可以獲得更高的查詢處理效率
D)把表組織成桶可以使取樣更高效
54.[單選題]國(guó)網(wǎng)公司泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案要求,推進(jìn)營(yíng)配貫通優(yōu)化提升,貫通率提升
()O
A)5%
B)7%
010%
D)15%
55.[單選題]某公司在進(jìn)行大數(shù)據(jù)離線批處理平臺(tái)的前期技術(shù)選型,以下哪個(gè)大數(shù)據(jù)組件不屬于離線
批處理業(yè)務(wù)所涉及到的組件?
A)HDFS
B)Spark
C)Storm
D)Hive
56.[單選題]下面python循環(huán)體執(zhí)行的次數(shù)與其他不同的是。。
A)i=0while(i
B)i=10while(i>0):print(i)i=i-l
C)forIinrange(10):Print(i)
D)forIinrange(10,0,-l):print(i)
57.[單選題]以下關(guān)于ElasticSearch介紹錯(cuò)誤的是?(
A)Document文檔,被素引的基本單位
B)EsMaster主節(jié)點(diǎn)
C)Index親弓I,與關(guān)系型數(shù)據(jù)庫(kù)中的索引概念一樣
D)EsNode:Elasticsearch節(jié)點(diǎn),一個(gè)節(jié)點(diǎn)就是一個(gè)Elasticsearch實(shí)例
58.[單選題]以下不是NoSQL常用數(shù)據(jù)模型的是()
A)Key-Value
B)Key-Colum
C)圖存儲(chǔ)
D)關(guān)系數(shù)據(jù)模型
59.[單選題](一)返回模塊名稱空間的字典,(—)返回當(dāng)前名稱空間的字典。
A)locals()locals()
B)global()locals()
C)locals()global()
D)globals()globals()
60.[單選題]以P(w)表示詞條w的概率,假設(shè)已知P(南京)=0.8,P(市長(zhǎng))=0.6,P(江大橋
)=0.4;P(南京市)=0.3,P(長(zhǎng)江大橋)=0.5。如果假設(shè)前后兩個(gè)詞的出現(xiàn)是獨(dú)立的,那么分詞
結(jié)果就是()。
A)南京市*長(zhǎng)江*大橋
B)南京*市長(zhǎng)*江大橋
C)南京市長(zhǎng)*江大橋
D)南京市*長(zhǎng)江大橋
61.[單選題]Hive在處理數(shù)據(jù)時(shí),默認(rèn)的分隔復(fù)合類型中元素的分隔符是()
ALA
B)"B
C)-C
D)\n
62.[單選題]常用的數(shù)據(jù)歸約方法可以分為()。
A)維歸約、數(shù)據(jù)壓縮
B)維歸約、參數(shù)歸約
C)維歸約、值歸約
D)數(shù)據(jù)壓縮、值歸約
63.[單選題]ApacheHadoop可以在(_)平臺(tái)上運(yùn)行。
A)Ubuntu
B)Debian
C)Windows
D)跨平臺(tái)
64.[單選題]某電商公司數(shù)據(jù)庫(kù)高級(jí)工程師進(jìn)行大數(shù)據(jù)分析,現(xiàn)在界面提示:"0:
jdbe:hive2:〃192.168.0.186:2181/>"信息,那么他最有可能在進(jìn)行什么場(chǎng)錄的數(shù)據(jù)分析工作?
A)實(shí)時(shí)檢素場(chǎng)景
B)離線批處理場(chǎng)景
C)圖搜索場(chǎng)景
D)實(shí)時(shí)流開(kāi)發(fā)場(chǎng)景
65.[單選題]HDFS的優(yōu)點(diǎn)不包含哪個(gè)?
A)處理超大文件
B)運(yùn)行于廉價(jià)機(jī)器上
C)高效存儲(chǔ)大量小文件
D)流式的訪問(wèn)數(shù)據(jù)
66.[單選題]MapReduce流程有()各階段。
A)三
B)二
C)四
D)五
67.[單選題]Hive常被用來(lái)處理()場(chǎng)景。
A)事務(wù)性處理
B)批量計(jì)算
C)實(shí)時(shí)性計(jì)算
D)流計(jì)算
68.[單選題]下列關(guān)于Numpy的數(shù)組Ndarray對(duì)象屬性的描述錯(cuò)誤的是()。
A)Ndarray.ndim秩,即軸的數(shù)量或維度的數(shù)量
B)Ndarray.shape數(shù)組的維度,對(duì)于矩陣來(lái)說(shuō)是n行m列
C)Ndarray.size數(shù)組元素的總個(gè)數(shù),也是shape屬性中nXm的值
D)Ndarray.itemsizeNdarray對(duì)象的元素類型
69.[單選題]下列算法中屬于圖像平滑處理的是()o
A)梯度銳化
B)直方圖均衡化
0中值濾波
D)Laplacian增強(qiáng)
70.[單選題]在MaxCompute中,可以通過(guò)Tunnel命令行來(lái)完成數(shù)據(jù)的上傳下載。如果要下載
test_project項(xiàng)目空間下的一個(gè)帶分區(qū)的表test_table_p的內(nèi)容到log.txt文件中,使用命令
tunneldownloadtest_project.test_table_plog.txt;結(jié)果報(bào)錯(cuò),其中出錯(cuò)的部分為:()。
A)tunnel
B)download
C)test_project.test_table_p
D)logtxt
71.[單選題]假設(shè)我們要解決一個(gè)二類分類問(wèn)題,我們已經(jīng)建立好了模型,輸出是0或1,初始時(shí)設(shè)閾
值為0.5,超過(guò)0.5概率估計(jì),就判別為1,否則就判別為0;如果我們現(xiàn)在用另一個(gè)大于0.5的閾值,
那么現(xiàn)在關(guān)于模型說(shuō)法,正確的是:
A)模型分類的召回率會(huì)降低或不變
B)模型分類的召回率會(huì)升高
C)模型分類準(zhǔn)確率會(huì)升高或不變
D)模型分類準(zhǔn)確率會(huì)降低
72.[單選題](_)通過(guò)構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù)。
A)支持向量機(jī)
B)貝葉斯分類器
C)神經(jīng)網(wǎng)絡(luò)
D)集成學(xué)習(xí)
73.[單選題]如想定義字符串,應(yīng)使用。
A)list
B)set
C)str
D)dict
74.[單選題]關(guān)于基于Hadoop的MapReduce編程的環(huán)境配置,下面哪一步是不必要的()
A)配置java環(huán)境變量
B)配置Hadoop環(huán)境變量
C)配置Eclipse
D)配置ssh
75.[單選題]以下哪項(xiàng)不是“大數(shù)據(jù)”和傳統(tǒng)的“小數(shù)據(jù)”的區(qū)別?
A)數(shù)據(jù)規(guī)模的采樣聚合與全量
B)數(shù)據(jù)結(jié)構(gòu)的結(jié)構(gòu)化與非結(jié)構(gòu)化
C)數(shù)據(jù)來(lái)源的集中于分散
D)數(shù)據(jù)質(zhì)量的高低參差不齊
76.[單選題]在邏輯回歸輸出與日標(biāo)對(duì)比的情況下,以下評(píng)估指標(biāo)中()不適用
A)AUC-R0C
B)準(zhǔn)確度
C)Logloss
D)均方誤差
77.[單選題]能實(shí)現(xiàn)將一維數(shù)據(jù)寫入CSV文件中的是
A)fo=open("price2016bj.csv","w")Is=['AAA','BBB','CCC','DDD']
fo.write(",join(Is)+"\n")fo.close()
B)fr=open("price2016.csv","w")Is=[]forlineinfo:line=
line,replace("\n","")Is.append(line,split(","))print(Is)fo.close()
C)fo=open("price2016bj.csv","r")Is=['AAA','BBB','CCC",
'DDD']fo.write(",",join(Is)+"\n")fo.close()
D)fname=input("請(qǐng)輸入要寫入的文件:")fo=open(fname,"w+")ls=["AAA","BBB",
"CCC"]fo.writelines(Is)forlineinfo:print(line)fo.close()
78.[單選題]在線性回歸問(wèn)題中,我們用R方來(lái)衡量擬合的好壞。在線性回歸模型中增加特征值并再訓(xùn)
練同一模型。下列說(shuō)法正確的是()。
A)如果R方上升,則該變量是顯著的
B)如果R方下降,則該變量不顯著
C)單單R方不能反映變量重要性,不能就此得出正確結(jié)論
D)以上答案都不正確
79.[單選題]當(dāng)數(shù)據(jù)集非常大的時(shí)候,對(duì)全體數(shù)據(jù)進(jìn)行處理存在困難時(shí),通過(guò)什么方式可以估計(jì)和推
斷出整體的特性()
A)抽樣查詢
B)模糊查詢
C)條件查詢
D)連接查詢
80.[單選題]下列選項(xiàng)中,Python不支持的數(shù)據(jù)類型有()。
A)int
B)char
C)float
D)dictionary
81.[單選題]np.square(2)的結(jié)果是多少?
A)1
B)4
03
D)2
82.[單選題]下列哪項(xiàng)通常是集群的最主要的性能瓶頸?()
A)CPU
B)網(wǎng)絡(luò)
C)磁盤
D)內(nèi)存
83.[單選題]下列關(guān)于BigTable的描述,哪個(gè)是錯(cuò)誤的?()
A)爬蟲(chóng)持續(xù)不斷地抓取新頁(yè)面,這些頁(yè)面每隔一段時(shí)間地存儲(chǔ)到BigTable里
B)BigTable是一布式存儲(chǔ)系統(tǒng)
OBigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問(wèn)題
D)網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable到網(wǎng)頁(yè)
84.[單選題]選擇哪一個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見(jiàn)的做法是引人()。
A)線性回歸
B)線性判別分析
C)正則化項(xiàng)
D)偏置項(xiàng)
85.[單選題]變量的不確定性越大,相對(duì)應(yīng)信息'腦的變化是()
A)蜻變小
B)蜻變大
C)不變
D)以上答案都不正確
86.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。
A)機(jī)器學(xué)習(xí)、對(duì)數(shù)回歸、關(guān)聯(lián)模式
B)K均值法、SOM機(jī)器學(xué)習(xí)
C)Apriori算法、FP-Tree算法
D)RBF機(jī)器學(xué)習(xí)、K均值法、機(jī)器學(xué)習(xí)
87.[單選題]以下關(guān)于DataNode的描述不正確的是?
A)DataNode執(zhí)行數(shù)據(jù)塊的讀/寫操作
B)DataNode是用來(lái)存儲(chǔ)數(shù)據(jù)塊
C)DataNode管理數(shù)據(jù)塊元數(shù)據(jù)
D)DataNode的數(shù)量受數(shù)據(jù)規(guī)模影響
88.[單選題]()是基于規(guī)則的分類器
A)C4,S
B)KNN
C)NaiveBayes
D)C.ANN
89.[單選題]關(guān)于數(shù)據(jù)備份的做法不對(duì)的是:()
A)確認(rèn)備份操作步驟準(zhǔn)確無(wú)誤后進(jìn)行備份操作。
B)各業(yè)務(wù)部門應(yīng)將計(jì)算機(jī)信息數(shù)據(jù)備份媒體視同重要空白憑證,指定專人負(fù)責(zé)備份數(shù)據(jù)媒體的簽收
和入庫(kù)管理。
C)備份數(shù)據(jù)媒體應(yīng)按要求寫明標(biāo)識(shí),交辦公室檔案管理員異地存放,要確保存放地的安全,并定期
進(jìn)行檢查,確保數(shù)據(jù)的完整性、可用性。
D)涉密信息媒體的備份媒體(磁帶、磁盤、光盤、紙媒體等)應(yīng)有密級(jí)及保密期限標(biāo)志,統(tǒng)一編號(hào)
,各單位保密機(jī)構(gòu)負(fù)責(zé)涉密信息媒體的界定和銷毀。
90.[單選題]智能健康手環(huán)的應(yīng)用,體現(xiàn)了()數(shù)據(jù)采集技術(shù)的應(yīng)用。
A)統(tǒng)計(jì)報(bào)表
B)網(wǎng)絡(luò)爬蟲(chóng)
C)傳感器
D)API接口
91.[單選題]以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的敘述中,正確的是()
A)數(shù)據(jù)倉(cāng)庫(kù)主要用于支持決策管理
B)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源相對(duì)比較單一
C)存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般是實(shí)時(shí)更新的
D)數(shù)據(jù)倉(cāng)庫(kù)為企業(yè)的特定應(yīng)用服務(wù)、強(qiáng)調(diào)處理的響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性等
92.[單選題]若2=叩.abs(-5),則print(a)輸出為(—)。
A)-6
B)-4
0-5
D)5
93.[單選題]下列語(yǔ)句會(huì)無(wú)限循環(huán)下去的是()。
A)forainrange(10):timesleep(10)
B)whilei<10:
Timesleep(10)
C)whileTrue:
Break
D)a=[3,-1,']
Foriina[:]:ifnota:
Break
94.[單選題]()是指過(guò)濾器在圖像上滑動(dòng)的距離。
A)卷積核大小
B)卷積步長(zhǎng)
C)過(guò)濾器大小
D)圖像大小
95.[單選題]任何一個(gè)核函數(shù)都隱式地定義了一個(gè)(_)空間。
A)希爾伯特空間
B)再生希爾伯特空間
C)再生核希爾伯特空間
D)歐式空間
96.[單選題]我想使用JavaAPI刪除HDFS中的非空文件夾/123,以下選項(xiàng)正確的是。
A)fs.delete(newPath("/123"));
B)fs.delete(newPath("/123"),false);
C)fs.delete(newPath("/123"),true);
D)delete()方法只能刪除文件或非空文件夾,不能直接刪除非空文件夾
97.[單選題]例如數(shù)據(jù)庫(kù)中有A表,包括學(xué)生,學(xué)科,成績(jī)?nèi)齻€(gè)字段,數(shù)據(jù)庫(kù)結(jié)構(gòu)為學(xué)生學(xué)科成
績(jī)張三語(yǔ)文60張三數(shù)學(xué)100李四語(yǔ)文70李四數(shù)學(xué)80李四英語(yǔ)80如何統(tǒng)計(jì)最高分>80的
學(xué)科()
A)SELECTMAX(成績(jī))FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))〉80;
B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績(jī)>80;
C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;
D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績(jī))>80;
98.[單選題]下列關(guān)于支持向量機(jī)優(yōu)化性問(wèn)題的形式說(shuō)法正確的是(_)。
A)它是一個(gè)凸二次規(guī)劃問(wèn)題
B)它是一個(gè)凸一次規(guī)劃問(wèn)題
C)它是一個(gè)凹二次規(guī)劃問(wèn)題
D)它是一個(gè)凹一次規(guī)劃問(wèn)題
99.[單選題]HFile數(shù)據(jù)格式中的Data字段用于()。
A)存儲(chǔ)實(shí)際的KeyValue數(shù)據(jù)
B)存儲(chǔ)數(shù)據(jù)的起點(diǎn)
C)指定字段的長(zhǎng)度
D)存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)
100.[單選題]多分類學(xué)習(xí)中,最經(jīng)典的三種拆分策略不包括()。
A)一對(duì)一
B)一對(duì)其余
C)一對(duì)多
D)多對(duì)多
101.[單選題]下面關(guān)于機(jī)械思維的核心思想,描述錯(cuò)誤的是:()
A)世界變化的規(guī)律是確定的
B)lit界變化的規(guī)律是無(wú)法確定的
C)規(guī)律不僅是可以被認(rèn)識(shí)的,而且可以用簡(jiǎn)單的公式或者語(yǔ)言描述清楚
D)這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的.可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐
102.[單選題]在Matplotlib中,在當(dāng)前圖形上添加一個(gè)子圖需要用到的函數(shù)是()。
A)pit.stackplot()
B)pit.suptitle()
C)pit.subplot()
D)plt.imshow()
103.[單選題]電影評(píng)分是以下哪些的應(yīng)用實(shí)例(—)。
A)分類
B)聚類
C)強(qiáng)化學(xué)習(xí)
D)回歸
104.[單選題]在HBase的專用過(guò)濾器中,單列排除過(guò)濾器是()
A)SingleValueExcludeFilter
B)SingleColumnExcludeFilter
C)SingleColumnValueExcludeFilter
D)ColumnValueExcludeFilter
105.[單選題]通過(guò)(),持續(xù)降低自動(dòng)采集成本和操作難度,不斷提高公司數(shù)據(jù)的自動(dòng)采集水平。
A)組織開(kāi)展數(shù)據(jù)轉(zhuǎn)換技術(shù)及應(yīng)用研究
B)組織開(kāi)展數(shù)據(jù)分類技術(shù)及應(yīng)用研究
C)組織開(kāi)展數(shù)據(jù)錄入技術(shù)及應(yīng)用研究
D)組織開(kāi)展數(shù)據(jù)自動(dòng)采集技術(shù)及應(yīng)用研究
106.[單選題]回歸方程判定系數(shù)的計(jì)算公式R2=SSR/SST=1-SSE/SST,對(duì)判定系數(shù)描述錯(cuò)誤的是。
A)式中的SSE指殘差平方和
B)式中的SSR指總離差平方和
C)判定系數(shù)用來(lái)衡量回歸方程的抗合優(yōu)皮
D)判定系教K等于相關(guān)系數(shù)的平方
107.[單選題]下列哪個(gè)程序通常與NameNode在一個(gè)節(jié)點(diǎn)啟動(dòng)?
A)SecondaryNameNode
B)DataNode
C)TaskTracker
D)Jobtracker
108.[單選題]a和b為兩個(gè)整數(shù),以下關(guān)系表達(dá)式語(yǔ)法錯(cuò)誤的是?
A)a==b
B)ab
C)a>=b
D)a!=b
109.[單選題]Oracle數(shù)據(jù)庫(kù)最近使用過(guò)的SQL語(yǔ)句存儲(chǔ)在
A)共享池
B)數(shù)據(jù)高速緩沖區(qū)
C)私有全局區(qū)
D)用戶全局區(qū)
110.[單選題]K-搖臂賭博機(jī)屬于(—)算法。
A)機(jī)器學(xué)習(xí)
B)深度學(xué)習(xí)
C)強(qiáng)化學(xué)習(xí)
D)有監(jiān)督學(xué)習(xí)
111.[單選題]二項(xiàng)分布的數(shù)學(xué)期望為()
A)n(1-n)p
B)np(1-p)
C)np
D)n(1-p)
112.[單選題]MapReduce框架對(duì)()按照鍵值排序。。
A)中間結(jié)果
B)最終結(jié)果
C)輸入數(shù)據(jù)
D)輸出數(shù)據(jù)
113.[單選題]對(duì)于ADS的主鍵,()說(shuō)法是正確的。
A)對(duì)于updateType=realtime的表來(lái)講,主鍵是必須的,且主鍵中不能包含作為一級(jí)hash分區(qū)的分區(qū)
列
B)對(duì)于ADS的普通表,無(wú)論updateType如何取值,主鍵是必要的
C)對(duì)于updateType=batch的表來(lái)講,主鍵是必須的,主要是約束導(dǎo)入數(shù)據(jù)時(shí)的重復(fù)記錄
D)有主鍵的表的性能和用法上和沒(méi)有主鍵的表之間沒(méi)有任何區(qū)別
114.[單選題]進(jìn)入要操作的數(shù)據(jù)庫(kù)TEST用以下哪一項(xiàng)()
A)INTEST
B)SHOWTEST
C)USERTEST
D)USETEST
115.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為()
A)頻繁子集挖掘
B)頻繁于圈挖掘
C)頻繁數(shù)據(jù)項(xiàng)挖掘
D)頻繁模式挖掘
116.[單選題]以下哪一項(xiàng)不是Spark框架可用的資源調(diào)度系統(tǒng)?
A)Mesos
B)Yarn
C)deremel
D)aws
117.[單選題](_)是一類用圖來(lái)表達(dá)變量相關(guān)關(guān)系的概率模型。
A)神經(jīng)元模型
B)感知機(jī)模型
C)概率圖模型
D)SVM
118.[單選題]以下描述中錯(cuò)誤的是()。
A)數(shù)據(jù)化與數(shù)字化是兩個(gè)不同概念
B)數(shù)據(jù)與數(shù)值是一個(gè)概念
C)大數(shù)據(jù)與海量數(shù)據(jù)是兩個(gè)不同的概念
D)數(shù)據(jù)和信息是兩個(gè)不同的概念
119.[單選題]()對(duì)監(jiān)管數(shù)據(jù)質(zhì)量承擔(dān)最終責(zé)任
A)董事長(zhǎng)
B)風(fēng)險(xiǎn)管理部
C)行長(zhǎng)
D)數(shù)據(jù)運(yùn)管部
120.[單選題]阿里巴巴旗下的數(shù)據(jù)管理平臺(tái),被稱為:
A)達(dá)摩盤
B)支付寶
C)螞蟻花唄
D)招財(cái)寶
121.[單選題]感知層是物聯(lián)網(wǎng)體系架構(gòu)的()層。
A)第一層
B)第二層
C)第三層
D)第四層
122.[單選題]執(zhí)行后可以查看Python的版本的是
A)importsysprint(sys.Version)
B)importsystemprint(system,version)
C)importsystemprint(system.Version)
D)importsysprint(sys.version)
123.[單選題]一般地,”人“與”馬“分別與”人馬“相似,但”人“與”馬”很不相似;要達(dá)到
這個(gè)目的,可以令”人“”馬“與”人馬”之間的距離都比較小,但”人“與”馬”之間的距離很
大,此時(shí)該距離不滿足(_)O
A)非負(fù)性
B)同一性
C)對(duì)稱性
D)直遞性
124.[單選題]MapReduce中的歸約過(guò)程是
A)Map
B)Guiyue
C)Summary
D)Reduce
125.[單選題]HDFS采用塊復(fù)制的概念,讓數(shù)據(jù)在集群的節(jié)點(diǎn)間進(jìn)行復(fù)制,從而實(shí)現(xiàn)了一個(gè)(__)的
系統(tǒng)。
A)云計(jì)算
B)分布式文件
C)流處理
D)高度容錯(cuò)性
126.[單選題]實(shí)現(xiàn)One-Hot編碼可以用Pandas中()函數(shù)。
A)groupby()
B)merge()
C)getdummies()
D)llna()
127.[單選題]kafka-clustermirroring工具可以實(shí)現(xiàn)()功能。
A)kafka集群數(shù)據(jù)同步方案
B)kafka單集群內(nèi)數(shù)據(jù)備份
Okafka單集群內(nèi)數(shù)據(jù)恢復(fù)
D)以全部不對(duì)
128.[單選題]線性回歸的基本假設(shè)不包括()。
A)隨機(jī)誤差項(xiàng)是一個(gè)期望值為0的隨機(jī)變量
B)對(duì)于解釋變量的所有觀測(cè)值,隨機(jī)誤差項(xiàng)有相同的方差
C)隨機(jī)誤差項(xiàng)彼此相關(guān)
D)解釋變量是確定性變量不是隨機(jī)變量,與隨機(jī)誤差項(xiàng)之間相互獨(dú)立
129.[單選題]執(zhí)行以下代碼段時(shí)a=set('apple')b=set('orange')print(a&b)時(shí),輸出為
(一)o
A){'r,'e','a'.'p'}
Bn)\tf?r',tai,,g,,tef,in?,for)\
1,p,g,O,e,n,a,r)
D){Q,'a')
130.[單選題]BP算法基于(_)策略,以目標(biāo)的(_)梯度方向?yàn)閰?shù)進(jìn)行調(diào)整。
A)前向傳播,正
B)梯度下降,負(fù)
C)前向傳播,負(fù)
D)梯度下降,正
131.[單選題]下列有關(guān)Hive和Impala的對(duì)比錯(cuò)誤的是()。
A)Hive與Impala中對(duì)SQL的解釋處理比較相似,都是通過(guò)詞法分析生成執(zhí)行計(jì)劃
B)Hive與Impala使用相同的元數(shù)據(jù)
C)Hive適合于長(zhǎng)時(shí)間的批處理查詢分析,而Impala適合于實(shí)時(shí)交互式SQL查詢
D)Hive在內(nèi)存不足以存儲(chǔ)所有數(shù)據(jù)時(shí),會(huì)使用外存,而Impala也是如此
132.[單選題]選擇哪一個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定,常見(jiàn)的做法是引人()
A)線性回歸
B)線性判別分析
C)正則化項(xiàng)
D)偏置項(xiàng)
133.[單選題]下面哪個(gè)功能不是大數(shù)據(jù)平臺(tái)安全管理組件提供的功能0。
A)接口代理
B)接口認(rèn)證
C)接口授權(quán)
D)路由代理
134.[單選題]在完整的異常語(yǔ)句中,語(yǔ)句出現(xiàn)的順序正確的是()o
A)tryfexceptfelseffinally
B)try-*else-*except-?finally
C)tryfexceptffinallyfelse
D)try-*else-*else-*except
135.[單選題]Gremlin中查詢單個(gè)點(diǎn)的信息該用什么命令
A)g.VO.hasLabel("test")
B)g.VOhasLabel("test"),values("age")
C)9.VO.hasLabel("test).valueMap("String,list","age")
D)gV(13464736).valueMapO自
136.[單選題]大數(shù)據(jù)的4V特點(diǎn):Volume、Velocity,Variety,Veracity,其中Volume的含義是()
A)價(jià)值密度低
B)處理速度快
C)數(shù)據(jù)類型繁多
D)數(shù)據(jù)體量巨大
137.[單選題]下列操作是只能刪除空目錄的是(—)。
A)rmtree
B)mkdir
C)chdir
D)rmdir
138.[單選題]向量空間模型的缺陷不包括()
A)維度災(zāi)難
B)模型稀疏性
C)語(yǔ)義信息缺失
D)無(wú)法計(jì)算文本相似度
139.[單選題]()和假設(shè)檢驗(yàn)又可歸結(jié)為統(tǒng)計(jì)推斷的范疇,即對(duì)總體的數(shù)量特征做出具有一定可靠程度
的估計(jì)和判斷。
A)參數(shù)估計(jì)
B)邏輯分析
C)方差分析
D)回歸分析
140.[單選題]摩爾定律指出,當(dāng)價(jià)格不變時(shí),集成電路上可容納的晶體管數(shù)目,約每隔()便會(huì)增
加一倍,性能也將提升一倍。
A)6個(gè)月
B)18個(gè)月
012個(gè)月
D)24個(gè)月
141.[單選題]下列操作屬于預(yù)剪枝的是()。
A)信息增益
B)計(jì)算最好的特征切分點(diǎn)
C)限制樹(shù)模型的深度
D)可視化樹(shù)模型
142.[單選題]公司()負(fù)責(zé)研究審議網(wǎng)絡(luò)與數(shù)據(jù)安全總體方針、重大政策和重大事項(xiàng)。
A)國(guó)網(wǎng)安質(zhì)部
B)國(guó)網(wǎng)信通部
C)網(wǎng)絡(luò)安全和信息化領(lǐng)導(dǎo)小組
D)國(guó)網(wǎng)辦公廳
143.[單選題]下列關(guān)于HDFS為存儲(chǔ)MapReduce并行切分和處理的數(shù)據(jù)做的設(shè)計(jì),錯(cuò)誤的是()
A)FSDatalnputStream擴(kuò)展了DatalnputStream以支持隨機(jī)讀
B)為實(shí)現(xiàn)細(xì)粒度并行,輸入分片(InputSplit)應(yīng)該越小越好
C)一臺(tái)機(jī)器可能被指派從輸入文件的任意位置開(kāi)始處理一個(gè)分片
D)輸入分片是一種記錄的邏輯劃分,而HDFS數(shù)據(jù)塊是對(duì)輸入數(shù)據(jù)的物理分割
144.[單選題](一)是一個(gè)在HDFS上開(kāi)發(fā)的面向列的分布式數(shù)據(jù)庫(kù)。
A)Hive
B)Pig
C)Mahout
D)Hbase
145.[單選題]以下()在關(guān)系模型中表示屬性的取值范圍。--
A)元組
B)鍵
C)屬性
D)域
146.[單選題]啟動(dòng)hadoop所有進(jìn)程的命令是()。
A)start-dfs.sh
B)start-all.sh
C)start-hadoop.sh
D)start-hdfs.sh
147.[單選題]以下圖像分割方法中,不屬于基于圖像灰度分布的閾值方法的是
A)類間最大距離法
B)最大類間、內(nèi)方差比法
0p-參數(shù)法
D)區(qū)域生長(zhǎng)法
148.[單選題]數(shù)據(jù)管理成熟度模型中成熟度等級(jí)最高的是()。
A)已優(yōu)化級(jí)
B)已測(cè)量級(jí)
C)已定義級(jí)
D)已管理級(jí)
149.[單選題]int('Oxa',16)的結(jié)果為()0
A)10
B)12
016
D)a
150.[單選題]大數(shù)據(jù)的起源是().
A)金融
B)電信
C)互聯(lián)網(wǎng)
D)公共管理
151.[單選題]業(yè)務(wù)中臺(tái)方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺(tái),后期逐步視情況
拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)
A)電網(wǎng)服務(wù)業(yè)務(wù)中臺(tái)
B)電網(wǎng)資源業(yè)務(wù)中臺(tái)
C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺(tái)
D)電網(wǎng)環(huán)境業(yè)務(wù)中臺(tái)
152.[單選題]ElasticSearch中構(gòu)建一個(gè)query需要用到下列哪個(gè)代碼?
A)QueryBuilders.putQuery()
B)QueryBuilders.matchQuery()
C)QueryBuiIdersgetQuery()
D)QueryBuiIderscreateQuery()
153.[單選題]關(guān)系云的一個(gè)重要功能是提供()。
A)數(shù)據(jù)庫(kù)即服務(wù)
B)虛擬服務(wù)
C)彈性計(jì)算
D)按需服務(wù)
154.[單選題]下列不屬于Transformation操作的是()。
A)map
B)filter
C)sample
D)count
155.[單選題]使用池化層相比于相同步長(zhǎng)的卷積層的優(yōu)勢(shì)在于?
A)參數(shù)更少
B)可以獲得更大下采樣
C)速度更快
D)有助于提升精度
156.[單選題]下列關(guān)于線性回歸分析中的殘差說(shuō)法正確的是()。
A)殘差均值總是為零
B)殘差均值總是約等于零
C)殘差均值總是大于本
D)以上答案都不正確
157.[單選題]執(zhí)行以下代碼段x=32deffl():globalxx=14deff2():globalxx=
29print(x)時(shí),輸出為(____)。
A)32
B)14
029
D)以上都不是
158.[單選題]以下插入記錄正確的()
A)insertintoemp(ename,hiredate,sal)values(valuel,value2,value3);
B)insertintoemp(ename,sal)values(valuel,value2,value3);
C)insertintoemp(ename)values(valuel,value2,value3);
D)insertintoemp(ename,hiredate,sal)values(valuel,value2);
159.[單選題]給定訓(xùn)練樣例集,設(shè)法將樣例投影到一條直線上,使得同類樣例的投影點(diǎn)盡可能接近、
異類樣例的投影點(diǎn)盡可能遠(yuǎn)離,這說(shuō)的是()算法。
A)PCA
B)SVM
C)K-means
D)LDA
160.[單選題]FusioninsightHD系統(tǒng)中,下面哪個(gè)方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果
A)通過(guò)LoaderUI界面查看
B)通過(guò)YARN任務(wù)管理查看
C)通過(guò)NodeManager查看
D)通過(guò)Manager的告警查看
161.[單選題]關(guān)于“from-import”形式,以下錯(cuò)誤的選項(xiàng)是(—兀
A)從模塊名導(dǎo)入標(biāo)識(shí)符
B)這種導(dǎo)入形式可以防止名稱沖突
C)被導(dǎo)入模塊的命名空間是模塊導(dǎo)入的一部分
D)模塊中的標(biāo)識(shí)符可直接訪問(wèn)為標(biāo)識(shí)符
162.[單選題]下列模型中與文本分類相關(guān)的是()。
A)決策樹(shù)
B)神經(jīng)網(wǎng)絡(luò)
OKNN算法
D)以上都對(duì)
163.[單選題]()屬于Spark框架中的可擴(kuò)展機(jī)器學(xué)習(xí)庫(kù)。
A)MLib
B)GraphX
C)Streaming
D)SparkSQL
164.[單選題]關(guān)于RDD,下列說(shuō)法錯(cuò)誤的是?
A)RDD具有血統(tǒng)機(jī)制答案:Lineage
B)RDD默認(rèn)存儲(chǔ)在磁盤
ORDD是一個(gè)只讀的,可分區(qū)的分布式數(shù)據(jù)集
D)RDD是Spark對(duì)基礎(chǔ)數(shù)據(jù)的抽象
165.[單選題]Spark的集群管理模式不包含()。
A)Standalone模式
B)Message模式
OYARN模式
D)Mesos模式
166.[單選題]在Kafka集群中,Kafka服務(wù)端的角色是下列哪-項(xiàng)?
A)Producer
B)ZooKeeper
C)Consumer
D)Broker
167.[單選題](一)是norm,rvs(5)的結(jié)果。
A)7.1316243700758
B)array([-0.35687759,1.34347647,-0.11710531,-1.00725181,-0.51275702])
C)array([1,2,3,4,5])
D)array([5,4,3,2,1])
168.[單選題](_)不屬于基本分析方法。
A)回歸分析
B)分類分析
C)聚類分析
D)元分析
169.[單選題]Hadoop使用了一套獨(dú)有的配置文件管理系統(tǒng),并提供自己的API,即使用()處理配
置信息。
A)org.apache,hadoop.conf.Configuration
B)org.apache,hadoop.conf.Config
C)org.apache,hadoop.fs.FileSystem
D)org.apache,hadoop.fs.Path
170.[單選題]大數(shù)據(jù)的起源()
A)電信
B)互聯(lián)網(wǎng)
C)金融
D)公共管理
171.[單選題]在Hadoop生態(tài)系統(tǒng)的組件中(__)是可擴(kuò)展可伸縮的工作流協(xié)調(diào)管理器。
A)Oozie
B)Flume
C)Sqoop
D)Hue
172.[單選題]執(zhí)行以下代碼段cars=['bmw','audi','toyota',
1subaru']cars,sort()print(cars)時(shí),輸出為()。
A)['audi',1bmw',1subaru*,1toyotaf]
B)['toyota',1subaru1,'bmw',faudi1]
C)[rbmw1,1audi1,1toyota',1subaru1]
D)['bmw',1toyota1,'audi',1subaru11
173.[單選題]Flume中一個(gè)ChannelSelector的作用是什么?
A)設(shè)置多個(gè)channel發(fā)往多個(gè)sink的策略
B)設(shè)置一個(gè)source發(fā)往多個(gè)channel的策略
C)設(shè)置多個(gè)source發(fā)往多個(gè)channel的策略
D)設(shè)置一個(gè)channel發(fā)往多個(gè)sink的策略角
174.[單選題]Hadoop2.x版本中的數(shù)據(jù)塊大小默認(rèn)是多少?()
A)64M
B)128M
C)256M
D)512M
175.[單選題]下列有關(guān)KNN算法的流程順序,描述正確的是()①確定K的大小,和距離的計(jì)算方法
②根據(jù)K個(gè)樣本的所屬類別,投票決定測(cè)試樣本的類別歸屬③計(jì)算訓(xùn)練集樣本與測(cè)試樣本的舉例,選
出K個(gè)與測(cè)試樣本最相似的樣本
A)①②③
B)③②①
C)①③②
D)②①③
176.[單選題]HAVING子句的位置放在GROUPBY子句之()
A)前后都可以
B)前
C)后
D)以上都不對(duì)
177.[單選題]以下哪項(xiàng)屬于Flume的基本數(shù)據(jù)單位?
A)Subject
B)Topic
C)Object
D)Event
178.[單選題]消費(fèi)信息是否屬于用戶信息?()
A)屬于
B)不屬于
C)未定義
D)以上都不對(duì)
179.[單選題]與生成方法、半監(jiān)督SVM、圖半監(jiān)督學(xué)習(xí)等基于單學(xué)習(xí)機(jī)器利用未標(biāo)記數(shù)據(jù)不同,基于
分歧的方法(disagreement-basedmethods)使用多學(xué)習(xí)器,而學(xué)習(xí)器之間的分歧(disagreement)對(duì)未
標(biāo)記數(shù)據(jù)的利用至關(guān)重要。()是此類方法的重要代表。
A)協(xié)同訓(xùn)練
B)組合訓(xùn)練
C)配合訓(xùn)練
D)陪同訓(xùn)練
180.[單選題]下列關(guān)于Python模塊的理解錯(cuò)誤的是()。
A)模塊是包含函數(shù)和變量的Python文件
B)不可以使用"操作符訪問(wèn)模塊中的函數(shù)和變量
C)可以導(dǎo)入模塊中的所有類
D)可以在一個(gè)模塊中導(dǎo)入另一個(gè)模塊
181.[單選題]k-means算法中K指的是:()
A)K個(gè)樣本
B)K個(gè)質(zhì)心
C)K次迭代
D)K次方
182.[單選題]某電商網(wǎng)站想要實(shí)現(xiàn)熱銷商品的實(shí)時(shí)TopN排名,可以使用哪種技術(shù)實(shí)現(xiàn)?
A)Elasticsearch的快速檢索
B)HBase的rowkey索引
C)Hive的關(guān)聯(lián)查詢分析
D)Redis的排序計(jì)算
183.[單選題]()是表管理類,提供了一個(gè)接口來(lái)管理HBase數(shù)據(jù)庫(kù)的表信息。它提供的方法包括
:創(chuàng)建表、刪除表、列出表項(xiàng)、使表有效或無(wú)效,以及添加或刪除表列簇成員等。
A)Admin
B)Table
C)HTableDescriptor
D)HColumnDescriptor
184.[單選題]以下不屬于維度建模過(guò)程的是()
A)選擇業(yè)務(wù)過(guò)程
B)定義粒度
C)建立模型
D)確定事實(shí)
185.[單選題]下列哪個(gè)不屬于可視化工具?()
A)Google
B)D3
C)Visual.ly
D)Spark
186.[單選題]與以下代碼段var=lOOifvar==200:print("1-Gotatrueexpression
value")print(var)elifvar==150:print("2-Gotatrueexpressionvalue")
print(var)elifvar==100:print("3-Gotatrueexpressionvalue")print(var)else:
print("4-Gotafalseexpressionvalue")print(var)等效的列表描述()。
A)1-GotatrueexpressionvaluelOO
B)2-GotatrueexpressionvaluelOO
C)3-GotatrueexpressionvaluelOO
D)4-GotatrueexpressionvaluelOO
187.[單選題]數(shù)學(xué)關(guān)系式2
A)2
B)2
02
D)x>2orx
188.[單選題]在Numpy中,數(shù)組拼接的函數(shù)不包括()。
A)append()
B)insert()
C)vstack()
D)where()
189.[單選題]HBase依賴____提供強(qiáng)大的計(jì)算能力。
A)Zookeeper
B)Chubby
ORPC
D)MapReduce
190.[單選題]在k近鄰學(xué)習(xí)算法中,隨著k的增加,上界將逐漸降低,當(dāng)k區(qū)域無(wú)窮大時(shí),上界和下界
碰到一起,k近鄰法就達(dá)到了(_)。
A)貝葉斯錯(cuò)誤率
B)漸進(jìn)錯(cuò)誤率
C)最優(yōu)值
D)上界
191.[單選題]()屬于淺層學(xué)習(xí)模型
A)DBN
B)CNN
OSVM
D)RNN
192.[單選題]下面這段代碼的作用是什么?(VX:HWRZKSTK)
A)判斷索引分片是否存在
B)判斷索引是否可用
C)判斷索引是否存在
D)判斷索引類型
193.[單選題]當(dāng)在卷積神經(jīng)網(wǎng)絡(luò)中加人池化層(pool恒.glay,町)時(shí),變換的不變性會(huì)被保留該說(shuō)十
法()正確
A)不知道
B)看情況
C)是
D)否
194.[單選題]在大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的MapReduce中可以使用資源
(Resource,包括jar包、壓縮文件、表等)。在使用jar命令執(zhí)行MR程序時(shí),需要在參數(shù)
resources中指定資源,以下說(shuō)法正確的是:()。
A)包括已上傳到大數(shù)據(jù)計(jì)算服務(wù)的MR程序本身所在的jar包,以及MR程序用到的大數(shù)據(jù)計(jì)算服務(wù)上的
資源
B)僅包含MR程序中用到的大數(shù)據(jù)計(jì)算服務(wù)上的資源
0僅包含保存在本地的MR程序本身所在的jar包
D)僅包含已上傳到大數(shù)據(jù)計(jì)算服務(wù)的MR程序本身所在的jar包
195.[單選題]以下說(shuō)法不正確的是()
A)卷積神經(jīng)網(wǎng)絡(luò)主要用于目標(biāo)識(shí)別、國(guó)像分割等方面
B)循環(huán)神經(jīng)網(wǎng)絡(luò)主要用于處理序列數(shù)據(jù)
C)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)主要用于處理序列數(shù)據(jù)
D)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是和循環(huán)神經(jīng)網(wǎng)絡(luò)完全不同的一種新型神經(jīng)網(wǎng)絡(luò)
196.[單選題]如果線性回歸模型中的隨機(jī)誤差存在異方差性,那么參數(shù)的OLS估計(jì)量是
A)無(wú)偏的,有效的
B)無(wú)偏的,非有效的
C)有偏的,有效的
D)有偏的,非有效的
197.[單選題]當(dāng)閔可夫斯基距離公式中的系數(shù)p趨近于無(wú)窮大時(shí),可得到(_)的公式。
A)歐氏距離
B)曼哈頓距離
C)街區(qū)距離
D)切比雪夫距離
198.[單選題]從節(jié)點(diǎn)程序()o
A)NameNode
B)DataNode
C)SecondaryNameNode
D)Jobtracker
199.[單選題]當(dāng)機(jī)器學(xué)習(xí)把訓(xùn)練樣本自身特點(diǎn)當(dāng)作所有潛在樣本特點(diǎn),導(dǎo)致泛化性能下降,這種現(xiàn)
象在機(jī)器學(xué)習(xí)中稱為(—)。
A)偏差
B)過(guò)擬合
C)欠擬合
D)誤差
200.[單選題]下列關(guān)于拋出異常的說(shuō)法錯(cuò)誤的是()。
A)當(dāng)raise指定異常的類名時(shí),會(huì)隱式地創(chuàng)建異常類的實(shí)例
B)顯式地創(chuàng)建異常類實(shí)例,可以使用raise直接引發(fā)
C)不帶參數(shù)的raise語(yǔ)句,只能引發(fā)剛剛發(fā)生過(guò)的異常
D)使用raise拋出異常時(shí),無(wú)法指定描述信息
201.[單選題]2012年,()政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,標(biāo)志著大數(shù)據(jù)已經(jīng)成為重要的
時(shí)代特征
A)中國(guó)
B)美國(guó)
C)日本
D)英國(guó)
202.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列()學(xué)派。
A)符號(hào)主義
B)連接主義
C)行為主義
D)都不是
203.[單選題]邏輯回歸的實(shí)現(xiàn)采用的方法是()。
A)LinearRegression()
B)LogisticRegression()
C)HuberRegression()
D)TheilSenRegression()
204.[單選題]numpy矩陣之間的內(nèi)積使用什么函數(shù)?
A)np.dot()
B)np.cross()
C)np.outer()
D)np.svd()
205.[單選題]()是指幾組不同的數(shù)據(jù)中均存在一種趨勢(shì),但當(dāng)這些數(shù)據(jù)組組合在一起后,這種
趨勢(shì)將消失或反轉(zhuǎn)。
A)辛普森悖論
B)大數(shù)據(jù)悖論
C)大數(shù)據(jù)偏見(jiàn)
D)幸存者偏差
206.[單選題]下列關(guān)于推薦系統(tǒng)的描述,哪一項(xiàng)是錯(cuò)誤的?()
A)推薦系統(tǒng)是大數(shù)據(jù)在互聯(lián)網(wǎng)領(lǐng)域的典型應(yīng)用
B)推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具
C)推薦系統(tǒng)可以創(chuàng)造全新的商業(yè)和經(jīng)濟(jì)模式,幫助實(shí)現(xiàn)長(zhǎng)尾商品的銷售
D)推薦系統(tǒng)分為基于物品的協(xié)同過(guò)濾和基于商家的協(xié)同過(guò)濾
207.[單選題]下面屬于數(shù)據(jù)權(quán)限的特權(quán)是()。-
A)DR0P
B)ALTER
C)DELETE
D)以上答案全部正確
208.[單選題]使用Maxcomputetunnel命令上傳log.txt文件到表t_log中去,t_log為分區(qū)表(pl
string,p2string)。下列命令中正確的是:()。
A)tunneluploadlog.txtt_log/pl="bl”/p2="b2”
B)tunneluploadlog.txtt_log(pl="bl”,p2=“b2”)
C)tunneluploadlog.txtt_log/pl="bl”,p2=“b2”
D)tunneluploadlog.txtt_log/(pl="bl”,p2="b2”)
209.[單選題]()肯定是寬依賴操作。
A)map
B)flatMap
C)reduceByKey
D)sample
210.[單選題]上傳當(dāng)前目錄下的本地文件word,txt到分布式文件系統(tǒng)HDFS的"/dirPath”目錄下的
Shell命令是()o
A)hdfsdfs-put/dirPathword,txt
B)hadoopdfs-put/dirPathword,txt
C)hdfsfs-putword,txt/dirPath
D)hdfsdfs-putword,txt/dirPath
211.[單選題]以下內(nèi)容符合物體識(shí)別任務(wù)的是()o
A)不能對(duì)圖像進(jìn)行壓縮或剪裁
B)遵守誤差最小準(zhǔn)則和最佳近似準(zhǔn)則
C)可以不指定分類的類別數(shù)量
D)事先給定樣本的分布特征
212.[單選題]整形變量x中存放了一個(gè)兩位數(shù),要將這個(gè)兩位數(shù)的個(gè)位數(shù)字和十位數(shù)字變換位子,例
如,13變成31,正確的python表達(dá)式為。()
A)(x%10)*10+x//10
B)(x%10)//10+x//10
C)(x/10)%10+x//10
D)(x%10)*10+x%10
213.[單選題]在支持向量機(jī)中,軟間隔支持向量機(jī)的目標(biāo)函數(shù)比硬間隔支持向量機(jī)多了一個(gè)()
A)偏置項(xiàng)b
B)系教
C)松弛變量
D)兩種情況的目標(biāo)函數(shù)相同
214.[單選題]假設(shè)你有5個(gè)大小為7x7、邊界值為0的卷積核,同時(shí)卷積神經(jīng)網(wǎng)絡(luò)第一層的深度為1此
時(shí)如果你向這一層傳人一個(gè)維度為224x224x3的數(shù)據(jù),那么神經(jīng)網(wǎng)絡(luò)下一層所接收到的數(shù)據(jù)維度是(
)
A)218x218x5
B)217x217x8
0217x217x3
D)220x220x5
215.[單選題]下面對(duì)SecondaryNameNode第二名稱節(jié)點(diǎn)的描述,哪個(gè)是錯(cuò)誤的?
A)SecondaryNameNode一般是并行運(yùn)行在多臺(tái)機(jī)器上
B)它是用來(lái)保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間
C)SecondaryNameNode通過(guò)HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地
的相應(yīng)目錄下
D)SecondaryNameNode是HDFS架構(gòu)中的一個(gè)組成部分
216.[單選題]FusioninsightHD系統(tǒng)中,以下選項(xiàng)哪一個(gè)不是HBase寫數(shù)據(jù)設(shè)計(jì)的角色或服務(wù)?
A)Zookeeper
B)HDFS
OHMaster
D)RegionServer
217.[單選題]以下屬于FROM子查詢的是()。一
A)標(biāo)量子查詢
B)列子查詢
C)行子查詢
D)表子查詢
218.[單選題]下列選項(xiàng)中,哪一項(xiàng)是研究大數(shù)據(jù)最重要的意義()
A)分析
B)統(tǒng)計(jì)
C)測(cè)試
D)預(yù)測(cè)
219.[單選題]把基于使用DMSquid作為模型的Predict輸出進(jìn)行反向轉(zhuǎn)換得到原始的標(biāo)簽值,會(huì)采用
哪個(gè)數(shù)值轉(zhuǎn)換器?
A)JobId
B)InverseQuantify
C)DMSquid
D)InverseNormalizer
220.[單選題]數(shù)據(jù)可視化的本質(zhì)是()o
A)將數(shù)據(jù)轉(zhuǎn)換為知識(shí)
B)將知識(shí)轉(zhuǎn)換為數(shù)據(jù)
C)將數(shù)據(jù)轉(zhuǎn)換為信息
D)將信息轉(zhuǎn)換為智慧
221.[單選題]在一個(gè)線性回歸問(wèn)題中,我們使用R平方(R-Squared)來(lái)判斷擬合度。此時(shí)、如果增加一
個(gè)特征,模型不變,則下面說(shuō)法正確的是()。
A)如果R-Squared增加,則這個(gè)特征有意義
B)如果R-Squared減小,則這個(gè)特征沒(méi)有意義
C)僅看R-Squared單一變量,無(wú)法確定這個(gè)特征是否有意義
D)以上說(shuō)法都不對(duì)
222.[單選題]建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘
的哪一類任務(wù)?
A)根據(jù)內(nèi)容檢索
B)建模描述
C)預(yù)測(cè)建模
D)尋找模式和規(guī)則
223.[單選題]pipshowSomePackage指令的意義是(__)0
A)卸載指定包
B)安裝指定包
C)搜索指定包
D)查看指定包的詳細(xì)信息
224.[單選題]以()為指導(dǎo),結(jié)合業(yè)務(wù)數(shù)據(jù)資產(chǎn)需求和數(shù)據(jù)資產(chǎn)管理現(xiàn)狀,編制專業(yè)數(shù)據(jù)資產(chǎn)發(fā)展
規(guī)劃,統(tǒng)籌編制公司數(shù)據(jù)資產(chǎn)發(fā)展規(guī)劃。
A)公司戰(zhàn)略
B)公司數(shù)據(jù)安全戰(zhàn)略
C)公司管理制度
D)公司數(shù)據(jù)資產(chǎn)發(fā)展戰(zhàn)略
225.[單選題]MaxCompute提供了多種針對(duì)日期的計(jì)算函數(shù),以下函數(shù)中,能實(shí)現(xiàn)計(jì)算兩個(gè)時(shí)間的差
的是:()。
A)datediff
B)timestampdiff
C)interval
D)直接相減
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版設(shè)備采購(gòu)合同(生產(chǎn)線升級(jí))
- 二零二五年度醫(yī)院醫(yī)學(xué)教育與培訓(xùn)合同2篇
- 2024年資金借入及清償合同書
- 二零二五年度債權(quán)轉(zhuǎn)讓合同:債權(quán)金額、轉(zhuǎn)讓價(jià)格及轉(zhuǎn)讓程序2篇
- 二零二五年度個(gè)人承包礦山開(kāi)采合同2篇
- 2025版高新技術(shù)企業(yè)研發(fā)人員短期勞動(dòng)合同樣本
- 2025廣東省設(shè)備采購(gòu)合同的范本
- 2025電子雜志設(shè)計(jì)合同書
- 2025版酒店內(nèi)部培訓(xùn)場(chǎng)地租賃及講師服務(wù)合同3篇
- 2024年風(fēng)險(xiǎn)評(píng)估與咨詢服務(wù)合同3篇
- 長(zhǎng)期照護(hù)服務(wù)流程
- 精心打造東北大學(xué)近四年C語(yǔ)言理論考試試題及答案
- 醫(yī)院規(guī)劃發(fā)展部社會(huì)工作科職責(zé)
- 《Power Bi應(yīng)用》課程標(biāo)準(zhǔn)
- 《瘋狂動(dòng)物城》全本臺(tái)詞中英文對(duì)照
- 幼兒園的品格與道德教育主題班會(huì)課件
- 2024抗菌藥物分級(jí)管理及臨床合理應(yīng)用考核試題及答案
- 儲(chǔ)能系統(tǒng)的應(yīng)急預(yù)案措施
- 論海瀾之家存貨管理的問(wèn)題、成因及其對(duì)策
- 醫(yī)院長(zhǎng)期醫(yī)囑單(模板)
- 班主任育人故事(通用17篇)
評(píng)論
0/150
提交評(píng)論