版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試題說明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3(500題)
大數(shù)據(jù)開發(fā)基礎(chǔ)練習(xí)題及答案3
L[單選題]下列關(guān)于機(jī)器學(xué)習(xí)模型的說法正確的是()。
A)一個(gè)機(jī)器學(xué)習(xí)模型如果有較高準(zhǔn)確率,總是說明這個(gè)分類器是好的
B)如果增加模型復(fù)雜度,那么模型的測(cè)試錯(cuò)誤率不一定會(huì)降低
C)如果增加模型復(fù)雜度,那么模型的訓(xùn)練錯(cuò)誤率總是會(huì)降低
2.[單選題]大數(shù)據(jù)環(huán)境下,為了從大量電子數(shù)據(jù)中挖掘有用的信息,一些數(shù)據(jù)分析工具被開發(fā)出來
,主要有三類工具:批處理工具、流處理工具、交互式分析工具
A)交互式分析工具
B)嵌入式分析工具
C)模擬仿真工具
3.[單選題]MapReduce任務(wù)最終是在下列()中被執(zhí)行的。
A)NodeManager
B)container
C)ResourceManager
D)AppMaster
4.[單選題]什么是詞向量?
A)句子分詞得到的向量
B)多個(gè)詞組成的向量
C)對(duì)每個(gè)詞進(jìn)行編碼得到的向量
D)文檔的向量表示
5.[單選題]下列關(guān)于誤差的說法,正確的是O
A)訓(xùn)練樣本容量增加,泛化誤差也會(huì)增加
B)過擬合指數(shù)據(jù)在訓(xùn)練集上的誤差過大
C)過擬合可以通過減少模型參數(shù)數(shù)量解決
D)交叉驗(yàn)證不重復(fù)使用數(shù)據(jù)
6.[單選題]在其它條件不變的前提下,以下哪種做法容易引起機(jī)器學(xué)習(xí)中的過擬合問題
A)增加訓(xùn)練集數(shù)量
B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)
C)刪除稀疏的特征
D)SVM算法中使用高斯核/RBF核代替
7.[單選題]()是用來解決海量大數(shù)據(jù)文件存儲(chǔ)問題的,是目前應(yīng)用最廣泛的分布式文件系統(tǒng)。
A)HDFS
B)HBase
OHIve
D)Kafka
8.[單選題]以下關(guān)于turtle庫的描述,正確的是:
A)在importturtle之后就可以用CirCle()語句,來畫一個(gè)圓圈
B)要用fromturtleimportturtle來導(dǎo)入所有的庫函數(shù)
OhomeO函數(shù)設(shè)置當(dāng)前畫筆位置到原點(diǎn),朝向東
D)seth(x)是Setheading(X)函數(shù)的別名,讓畫筆向前移動(dòng)X
9.[單選題]IDC的定義除了揭示大數(shù)據(jù)傳統(tǒng)3V基本特征,即VOlUme、Variety和VeIOCity,還增添了
一個(gè)新特征是
A)量大
B)速度快
C)應(yīng)用廣
D)價(jià)值
10.[單選題]下列關(guān)于可視化工具中高級(jí)分析工具的說法,錯(cuò)誤的是?()
A)R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件
B)Weka主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非常酷炫的可視化圖形
C)GePhi主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非常酷炫的可視化圖形
D)R通常用于大數(shù)據(jù)集的統(tǒng)計(jì)與分析
11.[單選題]執(zhí)行以下代碼段Print(bool('FaISe'))Print(bool())時(shí),輸出為(.)。
A)TrueTrue
B)TrueFalse
C)FalseTrue
D)FalseFalse
12.[單選題]關(guān)系云的一個(gè)重要功能是提供()。
A)數(shù)據(jù)庫即服務(wù)
B)虛擬服務(wù)
C)彈性計(jì)算
D)按需服務(wù)
13.[單選題]python語句Print(type({}))的結(jié)果是。()
A)class'dict'
B)class'tuple'
C)class'set'
D)class'list'
14.[單選題]第3次信息化浪潮的標(biāo)志是:O
A)個(gè)人計(jì)算機(jī)的普及
B)互聯(lián)網(wǎng)的普及
C)云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及
D)人工智能化
15.[單選題]針對(duì)MaXCOnIPUteSQL做邏輯分析的時(shí)候,會(huì)進(jìn)行一些優(yōu)化,不包括:()優(yōu)化。
A)常量表達(dá)式(ConStantExpression)
B)列映射(ColumnProjection)
C)謂語動(dòng)詞下沉(PredictPushDown)
D)掃描方式(ScanMethod)
16.[單選題]在早期版本低的HadooP中使用的是()方法來調(diào)度用戶的作業(yè)。
A)短作業(yè)優(yōu)先
B)高響應(yīng)比優(yōu)選
C)基于時(shí)間片輪轉(zhuǎn)
D)先進(jìn)先出
17.[單選題]以下風(fēng)險(xiǎn)管理工作,哪些可運(yùn)用大數(shù)據(jù)實(shí)現(xiàn)?
A)貸款催收
B)憑證審閱
C)風(fēng)險(xiǎn)模型預(yù)警
D)以上都是
18.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用以安全可控為前提,按照()的原則,落實(shí)安全與保密責(zé)任。
A)誰經(jīng)手,誰使用,誰負(fù)責(zé)
B)誰主管,誰負(fù)責(zé)
C)誰使用,誰主管,誰負(fù)責(zé)
D)誰錄入,誰使用,誰負(fù)責(zé)
19.[單選題]哪個(gè)軟件架構(gòu)是GOogIe提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的
A)GFS
B)MapReduce
C)Chubby
D)Bigtable
20.[單選題]關(guān)于數(shù)據(jù)相關(guān)性,以下說法錯(cuò)誤的是(一)。
A)相關(guān)性體現(xiàn)了大數(shù)據(jù)的靈魂
B)相關(guān)性思維實(shí)現(xiàn)了從“為什么”到“是什么”的思維轉(zhuǎn)變
C)相關(guān)性關(guān)注事物的因果關(guān)系
D)相關(guān)性關(guān)注事物的相關(guān)關(guān)系
21.[單選題]HDFS中當(dāng)前block大小為128M,如果當(dāng)前要上傳到HDFS中的文件大小為300M,那么在存
儲(chǔ)時(shí)會(huì)分配()個(gè)block進(jìn)行存儲(chǔ)。
A)l
B)2
03
D)4
22.[單選題]第一數(shù)字定律中使用概率最大的數(shù)字是()。
A)0
B)l
02
D)3
23.[單選題]下列關(guān)于HiVe中連接查詢描述正確的是()
A)HiVe中連接查詢只支持相等連接而不支持不等連接
B)HiVe中連接查詢支持相等連接和不等連接
C)HiVe中連接查詢只支持不等連接而不支持相等連接
D)以上都不對(duì)
24.[單選題]在TF-IDF算法中,在計(jì)算完詞頻與逆文檔頻率后,將兩者()后得到最終的結(jié)果。
A)相加
B)相減
C)相乘
D)相除
25.[單選題]下列選項(xiàng)中,關(guān)于HBaSe特性描述不正確的一項(xiàng)是()。
A)高可靠性
B)高性能
C)面向行
D)可伸縮
26.[單選題]對(duì)于二分類問題,線性分類器用一個(gè)超平面將兩類樣本分開,對(duì)于二維平面,這個(gè)超平面
是一條()
A)折線
B)曲線
C)直線
D)以上說法都不對(duì)
27.[單選題]由于不同類別的關(guān)鍵詞對(duì)排序的貢獻(xiàn)不同,檢索算法一般把查詢關(guān)鍵詞分為幾類,
以下哪一類不屬于此關(guān)鍵詞類型的是()。
A)、引用詞
B)、普通關(guān)鍵詞
C)、高頻詞匯
D)、擴(kuò)展關(guān)鍵詞
28.[單選題]根據(jù)《大數(shù)據(jù)風(fēng)控平臺(tái)項(xiàng)目操作手冊(cè)》,系統(tǒng)在【客戶信息管理】一級(jí)菜單下增加【征
信報(bào)告查詢管理】二級(jí)菜單,用戶可在此菜單下的O節(jié)點(diǎn)查看否決意見。
A)待處理的征信報(bào)告
B)B.審批中的征信報(bào)告
C)C.審批批準(zhǔn)
D)D.審批否決
29.[單選題]如果問題存在最優(yōu)解,則下面幾種搜索算法中,()必然可以得到該最優(yōu)解。
A)廣度優(yōu)先搜索
B)深度優(yōu)先搜索
C)有界深度優(yōu)先搜索
D)啟發(fā)式搜索
30.[單選題]組合多條SQL查詢語句形成組合查詢的操作符是()
A)SELECT
B)ALL
C)LINK
D)UNION
31.[單選題]下列不屬于TranSfOrmation操作的是0
A)map
B)fIter
C)sample
D)count
32.[單選題]某單位運(yùn)用隨機(jī)森林算法思想建立搶修熱點(diǎn)模型。該模型主要預(yù)測(cè)下期臺(tái)區(qū)工單數(shù)量
,構(gòu)建搶修熱點(diǎn)。模型構(gòu)建步驟如下:①將歷史數(shù)據(jù)進(jìn)行隨機(jī)自助法重抽樣,生成N個(gè)訓(xùn)練樣本集;②將
N個(gè)訓(xùn)練樣本集分別做決策樹,生成N棵決策樹;③將N棵決策樹隨機(jī)構(gòu)成隨機(jī)森林;④未來根據(jù)預(yù)測(cè)樣
本氣候環(huán)境、設(shè)備屬性、設(shè)備工況進(jìn)行隨機(jī)森林決策投票,得出針對(duì)該預(yù)測(cè)樣本最優(yōu)的決策樹進(jìn)行運(yùn)
算,并計(jì)算出最終結(jié)果。模型算法構(gòu)建步驟合理的順序是()。
A)①②③④
B)①③②④
C)④①②③
D)④②①③
33.[單選題]執(zhí)行以下代碼段ClaSSA:def_init_(self,x=1):self,x=xclassder(A):def
—init一(self,y=2):super().—init—()self,y=ydefmain():obj=der()print(obj.x,
Obj.y)main()時(shí),輸出為(一)0
A)l1
B)l2
C)22
D)21
34.[單選題]在Matplotlib中設(shè)置X軸、y軸的刻度位置可用函數(shù)()。
A)xlabel()、ylabel()
B)xlimO、ylimO
C)Xscale()、yscale()
D)xticks()、yticks()
35.[單選題]以下哪個(gè)選項(xiàng)對(duì)Redis數(shù)據(jù)讀寫流程描述是正確的?(
A)ServerA節(jié)點(diǎn)返回集群拓?fù)?客戶端選擇集群任意一個(gè)serverA節(jié)點(diǎn)連接客戶端計(jì)算Key歸屬的槽
位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接-Servere節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果
B)客戶端選擇集群任意一個(gè)SerVerA節(jié)點(diǎn)連接-Servera節(jié)點(diǎn)返回集群拓?fù)淇蛻舳擞?jì)算Key歸屬的槽
位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接一ServerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果
C)ServerA節(jié)點(diǎn)返回集群拓?fù)?喜戶端計(jì)算Key歸屬的槽位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連接戶端選擇集
群任意一個(gè)SerVerA節(jié)點(diǎn)連接-eerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果
D)客戶端選擇集群任意一個(gè)SerVera節(jié)點(diǎn)連接客戶端計(jì)算Key歸屬的槽位以及對(duì)應(yīng)SerVerB節(jié)點(diǎn)并連
接-ServerA節(jié)點(diǎn)返回集群拓?fù)?ServerB節(jié)點(diǎn)返回業(yè)務(wù)操作結(jié)果
36.[單選題]以下描述中不屬于"規(guī)整數(shù)據(jù)(TidyData)"三個(gè)基本原則的是()。
A)每一類觀察單元構(gòu)成一個(gè)關(guān)系(表)
B)每個(gè)觀察占且僅占一行
C)每個(gè)變量占且僅占一列
D)每個(gè)觀察占且僅占一個(gè)關(guān)系(表)
37.[單選題]關(guān)于MaXCOmPUte用戶和權(quán)限,說法正確的是:()。
A)每一個(gè)項(xiàng)目空間在創(chuàng)建后,需要手工創(chuàng)建一個(gè)admin的角色,并且為該角色授予了確定的權(quán)限
B)admin角色可以將admin權(quán)限指派給用戶
C)Admin可以設(shè)定項(xiàng)目空間的安全配置,但是不能修改項(xiàng)目空間的鑒權(quán)模型
D)MaXComPUte目前不支持在項(xiàng)目空間中徹底移除一個(gè)用戶及其所有權(quán)限數(shù)據(jù)。
38.[單選題]考察一個(gè)由三個(gè)卷積層組成的CNN:kernel=3×3,stride=2,padding=SAME0最低層
輸出100個(gè)特征映射(featuremap),中間層200個(gè)特征映射,最高層400個(gè)特征映射。輸入是
200X300的RGB圖片,則總參數(shù)的數(shù)量是()。
A)903400
B)2800
C)180200
D)720400
39.[單選題]F1參數(shù)(一),說明模型越穩(wěn)定。
A)越小
B)越大
C)越趨近于某一特定值
D)Fl參數(shù)和模型穩(wěn)定性沒有關(guān)系
40.[單選題]數(shù)據(jù)使用環(huán)節(jié)的安全技術(shù)措施除防火墻、()、防病毒、防DDOS、漏洞檢測(cè)等網(wǎng)絡(luò)安全
防護(hù)技術(shù)措施外,還需實(shí)現(xiàn)以下安全技術(shù)能力:賬號(hào)權(quán)限管理、數(shù)據(jù)安全域、數(shù)據(jù)脫敏、日志管理和
審計(jì)、異常行為實(shí)時(shí)監(jiān)控和終端數(shù)據(jù)防泄漏。
A)入侵檢測(cè)
B)病毒檢測(cè)
C)程序檢測(cè)
D)進(jìn)程檢測(cè)
41.[單選題]下列哪個(gè)程序通常與NameNode在同一個(gè)節(jié)點(diǎn)啟動(dòng)
A)TaskTracker
B)DataNode
C)SecondaryNameNode
D)Jobtracker
42.[單選題]大數(shù)據(jù)計(jì)算服務(wù)項(xiàng)目空間Prjl中存在表tl,其中包含一列名字為id,OWner打開
LabelSeCUrity設(shè)置后,執(zhí)行如下命令:SETLABEL1TOTABLEtl;SETLABEL2TOTABLE
tl(id);SETLABEL3TOTABLEtl;此時(shí),tl表中的id列的敏感等級(jí)標(biāo)簽()。
A)I級(jí)
B)3級(jí)
C)2級(jí)
D)O級(jí)
43.[單選題](一)是一種建立在HadooP之上的數(shù)據(jù)倉庫架構(gòu)。
A)HDFS
B)Flume
C)Sqoop
D)Hive
44.[單選題]長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)被設(shè)計(jì)用來解決什么問題?()
A)、傳統(tǒng)RNN存在的梯度消失/爆炸問題
B)、傳統(tǒng)RNN計(jì)算量大的問題
C)、傳統(tǒng)RNN速度較慢的問題
D)、傳統(tǒng)RNN容易過過擬合的問題
45.[單選題]下面哪一個(gè)不屬于大數(shù)據(jù)倫理問題:()
A)隱私泄露問題
B)數(shù)據(jù)安全問題
C)數(shù)字鴻溝問題
D)數(shù)據(jù)冗余問題
46.[單選題]執(zhí)行以下代碼段CiaSSFather():def_init_(self,a,b):self,b=bifa<b:
self,a=aelse:self,a=bdefaction(self):self,a+=4classSon(Father):def
init_(self,a,b):self,a=8self,b=4defaction(self):self,a+=7self,b*=
2classGrandSon(Son):def—init—(self,a,b):Father.—init—(self,a,b)grandson=
GrandSon(9,6)grandson,action()print(grandson,a)?,輸出為()0
A)10
B)13
C)15
D)16
47.[單選題]以等可能性為基礎(chǔ)的概率是O。
A)古典概率
B)經(jīng)驗(yàn)概率
C)試驗(yàn)概率
D)主觀概率
48.[單選題]在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,感知機(jī)輸出層中的M-P神經(jīng)元通常被稱為()。
A)閾值邏輯單元
B)激活函數(shù)
C)擠壓函數(shù)
D)連接函數(shù)
49.[單選題]以下對(duì)于離線批處理的概念理解錯(cuò)誤的是哪-項(xiàng)?
A)離線批處理對(duì)數(shù)據(jù)處理的時(shí)延要求不高。
B)離線批處理占用的內(nèi)存資源較多。
C)離線批處理通常通過眠作業(yè)、SPark作業(yè)或者HQL作業(yè)實(shí)現(xiàn)。
D)離線批處理針對(duì)的數(shù)據(jù)量較大。
50.[單選題]MapReduce默認(rèn)的分區(qū)函數(shù)是()。
A)hash
B)disk
C)reduce
D)map
51.[單選題]查找表結(jié)構(gòu)用以下哪一項(xiàng)()
A)FIND
B)SELETE
C)ALTER
D)DESC
52.[單選題]Flink的數(shù)據(jù)轉(zhuǎn)換操作在:()環(huán)節(jié)中完成。
A)channel
B)Transformation
C)sink
D)source
53.[單選題]下列哪項(xiàng)通常是集群的最主要瓶頸_
A)CPU
B)網(wǎng)絡(luò)
C)磁盤IO
D)內(nèi)存
54.[單選題]在比較模型的擬合效果時(shí),甲、乙、丙蘭個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.71、
0.85.0.90,則擬合效果較好的模型是()。
A)甲
B)乙
C)丙
D)效果一樣
55.[單選題]下列代碼中最適合接受系統(tǒng)輸入是一個(gè)整數(shù)的是()。
A)num=input()
B)num=input("6")
C)num=int(input)
D)num=oat(input)
56.[單選題]使用Pig語句查詢一張名為tmp_table的表的前50行,下列語句正確的是()。
A)SELECT*FROMtmp_tableLIMIT50;
B)tmp_table_limit=LIMITtmp_table50;DUMPtmp_table_limit;
ODUMPtmp_tableLIMIT50
D)DUMPtmp_tableLIMIT=50;
57.[單選題]推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過程,滿足客戶的個(gè)性化需求,推
薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測(cè)客戶將來可能的購買行為。
A)客戶的朋友
B)客戶的個(gè)人信息
C)客戶的興趣愛好
D)客戶過去的購買行為和購買記錄
58.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:
A)粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別
B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高
C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高
D)粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量
59.[單選題]留出法直接將數(shù)據(jù)集劃分為()個(gè)互斥的集合
A)一
B)二
C)三
D)四
60.[單選題]決策樹的基本流程遵循()的策略。
A)貪心
B)最優(yōu)化
C)分而治之
D)順序
61.[單選題]關(guān)于數(shù)據(jù)整合和分組的說法,不E確的是
A)數(shù)據(jù)連接可以用concat或merge函數(shù)
B)axis=l表示軸向連接
C)數(shù)據(jù)分組可以使用mean函數(shù)
D)使用agg可以自定義多個(gè)聚合函數(shù)
62.[單選題]遺忘門的作用是()。
A)保留重要信息
B)去除不重要信息
C)信息增加
D)輸出
63.[單選題]創(chuàng)建數(shù)據(jù)庫使用以下哪項(xiàng)()
A)createmytest
B)createtablemytest
C)databasemytest
D)createdatabasemytest
64.[單選題]下列關(guān)于MaPRedUCe計(jì)算原理敘述不正確的一項(xiàng)是()0
A)將大數(shù)據(jù)集劃分為小數(shù)據(jù)集,小數(shù)據(jù)集劃分為更小數(shù)據(jù)集
B)將最終劃分的小數(shù)據(jù)分發(fā)布到集群節(jié)點(diǎn)上
C)以串行的方式完成計(jì)算處理
D)將計(jì)算結(jié)果遞歸融匯,得到最后的結(jié)果
65.[單選題]在SeleCt語句中,實(shí)現(xiàn)選擇操作的子句是()
A)select
B)groupby
C)where
D)from
66.[單選題]Python源程序文件的擴(kuò)展名為()
A)pdb
B)db
Opy
D)exe
67.[單選題]決策樹中,同一路徑上的所有屬性之間是()關(guān)系
A)因果
B)相關(guān)
C)邏輯或
D)邏輯與
68.[單選題]()是SPark中用于結(jié)構(gòu)化數(shù)據(jù)處理的軟件包。
A)SPARKCORE
B)SparkSQL
C)SparkStreaming
D)Mllib
69.[單選題]下面關(guān)于MaPRedUCe模型中MaP函數(shù)與RedUCe函數(shù)的描述正確的是()
A)一個(gè)MaP函數(shù)就是對(duì)一部分原始數(shù)據(jù)進(jìn)行指定的操作。
B)一個(gè)MaP操作就是對(duì)每個(gè)RedUCe所產(chǎn)生的一部分中間結(jié)果進(jìn)行合并操作。
C)MaP與MaP之間不是相互獨(dú)立的。
D)RedUCee與RedUCe之間不是相互獨(dú)立的。
70.[單選題]數(shù)據(jù)資產(chǎn)應(yīng)用O以為前提,按照“誰經(jīng)手,誰使用,誰負(fù)責(zé)”的原則,落實(shí)安全與保
密責(zé)任。
A)來源明確
B)冗余率低
C)分類清晰
D)安全可控
71.[單選題]下面不屬于NoSQL的有(_)。
A)ORACLE
B)Redislabs
C)couchbase
D)paradigm4
72.[單選題]數(shù)據(jù)抽取是從數(shù)據(jù)源中抽取數(shù)據(jù)的過程,數(shù)據(jù)抽取的方式有全量抽取和()。
A)重點(diǎn)抽取
B)個(gè)別抽取
C)抽樣抽取
D)增量抽取
73.[單選題]一般情況下,若要提高EIaStiCSearCh檢索效率,可以采取什么操作?
A)調(diào)整索引分片數(shù)
B)使用HiVe做底層存儲(chǔ)
C)壓縮素引
D)正價(jià)ESMaSter節(jié)點(diǎn)
74.[單選題]下面屬于批處理技術(shù)的是:()
A)MapReduce
B)Storm
C)Spark
D)GraphX
75.[單選題]下列關(guān)于數(shù)據(jù)交易市場(chǎng)的說法中,錯(cuò)誤的是()。
A)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物
B)商業(yè)化的數(shù)據(jù)交易活動(dòng)催生了多方參與的第三方數(shù)據(jù)交易市場(chǎng)
C)數(shù)據(jù)交易市場(chǎng)通過生產(chǎn)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助
D)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)資源化的必然產(chǎn)物
76.[單選題]下面幾種梯度下降方法中,哪種是速度最慢的:()
A)SGD
B)Adagrad
ORMSProp
D)Adam
77.[單選題]在我們神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,每次dropout想去掉20%的參數(shù),下面有關(guān)激活函數(shù)說法錯(cuò)
誤的是:()
A)SigmOid容易飽和,出現(xiàn)梯度消失。
B)LeakyRelU是ReiU的一個(gè)變種,他在X
C)Tanh存在梯度消失問題,但是是0均值,而且收斂速度比Sigmoid慢。
D)ReIU收斂速度比Sigmoid和tanh快很多,可以緩解梯度消失現(xiàn)象。
78.[單選題]()反映數(shù)據(jù)的精細(xì)化程度,越細(xì)化的數(shù)據(jù),價(jià)值越高。
A)規(guī)模
B)活性
0關(guān)聯(lián)度
D)顆粒度
79.[單選題]HBase使用get方法讀取數(shù)據(jù)時(shí),下列哪個(gè)選項(xiàng)是需要的?
A)Deletedelete=newDelete(rowkey)
B)scan.SetCaching(1000)
C)bytellrowkey=Bytes.toBytesC"012005000201")
D)List<Put>]putS=newArraylist<Put>0
80.[單選題]與以下代碼段foriinranged,101):ifint(i*0.5)==i*0.5:Print(i)等效
的列表描述(一)o
A)[iforiinrange(1,100)ifint(i*0.5)==(i*0.5)]
B)[iforiinrange(1,101)ifint(i*0.5)==(i*0.5)]
C)[iforiinrange(1,101)ifint(i*0.5)=(i*0.5)]
D)[iforiinrange(1,100)ifint(i*0.5)=(i*0.5)]
81.[單選題]在支持向量機(jī)中,軟間隔支持向量機(jī)的目標(biāo)函數(shù)比硬間隔支持向量機(jī)多了一個(gè)(_)。
A)偏置項(xiàng)b
B)系數(shù)
C)松弛變量
D)兩種情況的目標(biāo)函數(shù)相同
82.[單選題]Hive創(chuàng)建。時(shí),會(huì)將數(shù)據(jù)移動(dòng)到數(shù)據(jù)倉庫指向的路徑;創(chuàng)建O,僅記錄數(shù)據(jù)所在的
路徑,不對(duì)數(shù)據(jù)的位置做任何改變
A)內(nèi)部表.外部表
B)內(nèi)部表.元數(shù)據(jù)
C)原元數(shù)據(jù).外部表
D)外部表.托管表
83.[單選題]若不針對(duì)MapReduce編程模型中的key和VaIUe值進(jìn)行特別設(shè)置,下列哪一項(xiàng)是
MapReduce不適宜的運(yùn)算。()
A)Max
B)Min
C)Count
D)Average
84.[單選題]()可用來展示持續(xù)性數(shù)據(jù),可很好地表示趨勢(shì)、累積、減少以及變化。
A)柱形圖
B)地圖
C)面積圖
D)雷達(dá)圖
85.[單選題]Spark的核心概念不包括?
A)RDD
B)Hoq
C)寬套依賴
D)Shuffle
86.[單選題]以下哪個(gè)不是大數(shù)據(jù)的“4V”特性:()
A)數(shù)據(jù)量大
B)數(shù)據(jù)類型繁多
C)處理速度快
D)價(jià)值密度高
87.[單選題]關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是
A)Load可將作業(yè)提交到Y(jié)arn執(zhí)行后,如果此時(shí)Loader服務(wù)出現(xiàn)異常,則此作業(yè)執(zhí)行失敗。
B)LOader將作業(yè)提交至Yarn執(zhí)行后,如果某個(gè)MaPPer任務(wù)執(zhí)行失敗,能夠自動(dòng)進(jìn)行重試。
C)Loader作業(yè)執(zhí)行共敗后將會(huì)產(chǎn)生垃圾數(shù)據(jù),需要用戶手動(dòng)清除
D)LOader將一個(gè)作業(yè)提交至Yarn執(zhí)行后,該作讓執(zhí)行完成前,不能再提交其他作業(yè)
88.[單選題]落實(shí)國(guó)家大數(shù)據(jù)安全保護(hù)要求時(shí),需進(jìn)一步明確大數(shù)據(jù)采集、傳輸、存儲(chǔ)、使用、開放
等各環(huán)節(jié)的O和具體措施。
A)責(zé)任主體
B)生產(chǎn)成本
C)關(guān)鍵技術(shù)
D)標(biāo)準(zhǔn)規(guī)范
89.[單選題]評(píng)估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbi踴),應(yīng)采取的解決方法是0
A)減少模型的特征數(shù)量
B)增加模型的特征數(shù)量
C)增加樣本數(shù)量
D)以上答案都正確
90.[單選題]相對(duì)于HadoopMapReducel.0,Spark的特點(diǎn)不包括()。
A)速度快
B)并發(fā)多
C)通用性
D)易用性
91.[單選題]Flink的窗口,按窗口行為劃分不包含以下哪種?
A)容量窗口
B)滑動(dòng)窗
C)滾動(dòng)窗口
D)會(huì)話窗口
92.[單選題]一張表的主鍵個(gè)數(shù)為()
A)至多3個(gè)
B)沒有限制
C)至多1個(gè)
D)至多2個(gè)
93.[單選題]下面的循環(huán)會(huì)打印多少次"ILovePythonw?foriinrange(0,10,2):print('ILove
Python')
A)2
B)5
C)6
D)10
94.[單選題]下列關(guān)于類屬性和實(shí)例屬性的說法中,描述正確的是。。
A)類屬性既可以顯式定義,又能在方法中定義
B)公有類屬性可以通過類和類的實(shí)例訪問
C)通過類可以獲取實(shí)例屬性的值
D)類的實(shí)例只能獲取實(shí)例屬性的值
95.[單選題]Maxcompute拓展MR的主要特點(diǎn)是:()。
A)支持計(jì)算在內(nèi)存中進(jìn)行,中間結(jié)果不落地
B)支持MaP后連續(xù)任意多個(gè)RedUCe操作
C)可以在上一次的reduce結(jié)束之后,直接增加一次map
D)從MaP直接到RedUCe,省去ShUffle階段
96.[單選題]有關(guān)HiVe支持的基本數(shù)據(jù)類型,TimeStamP表示()
A)時(shí)間戳
B)字符序列,可以指定字符集
C)字節(jié)數(shù)組
D)集合數(shù)據(jù)類型
97.[單選題]Flume中最小的獨(dú)立運(yùn)行單位是()。
A)Source
B)Agent
C)Channel
D)Sink
98.[單選題IStructuredStreaming中通過什么機(jī)制解決數(shù)據(jù)的無序和滯后問題?
A)事件時(shí)間
B)流連接
C)Watermark機(jī)制
D)持續(xù)查詢
99.[單選題]輸入圖像為32x32,經(jīng)過步長(zhǎng)為1,不進(jìn)行Padding,卷積核為5x5的卷積層后,得到的特
征圖尺寸是多少?O
A)28x28
B)27x27
C)29x29
D)32x32
100.[單選題]下列關(guān)于SkIearn說法錯(cuò)誤的是Oo
A)sklearn全稱為SCikitTearn
B)sklearn在官網(wǎng)被分為7個(gè)大塊
C)sklearn的聚類算法幾乎都已經(jīng)放在CIUSter模塊中了
D)sklearn需要NUmPy和SCiPy庫的支持
IOL[單選題]執(zhí)行"abedef''[::-l]語句時(shí)輸出是(Jo
A)fedcba
B)f
C)abcdef
D)abcde
102.[單選題]業(yè)務(wù)中臺(tái)方面,以業(yè)務(wù)為導(dǎo)向,優(yōu)先建設(shè)()和客戶服務(wù)業(yè)務(wù)中臺(tái),后期逐步視
情況拓展賬務(wù)結(jié)算等業(yè)務(wù)共享服務(wù)
A)電網(wǎng)服務(wù)業(yè)務(wù)中臺(tái)
B)電網(wǎng)資源業(yè)務(wù)中臺(tái)
C)電網(wǎng)優(yōu)化業(yè)務(wù)中臺(tái)
D)電網(wǎng)環(huán)境業(yè)務(wù)中臺(tái)
103.[單選題]()屬于SVM應(yīng)用。
A)文本和超文本分類
B)圖像分類
C)新文章聚類
D)以上均是
104.[單選題]Relief的時(shí)間開銷隨采樣次數(shù)以及原始特征數(shù)(_)。
A)線性增長(zhǎng)
B)指數(shù)型增長(zhǎng)
C)快速增長(zhǎng)
D)負(fù)增長(zhǎng)
105.[單選題]Reduce階段不包括以下哪一步?。
A)排序
B)分區(qū)
C分組
D)規(guī)約
106.[單選題]YARN分層結(jié)構(gòu)的本質(zhì)是(一),負(fù)責(zé)整個(gè)系統(tǒng)的資源管理和分配。
A)ResourceManger
B)NodeManger
C)ApplicationMaster
D)Container
107.[單選題]下列哪個(gè)命令是刪除文件的?
A)dfs-clear
B)dfs-Is
C)dfs-rm
D)dfs-del
108.[單選題]下面程序段執(zhí)行后的輸出結(jié)果是()。
N=Is=l
Whilen<5:
S=s*nn=n+lprint(s)
A)24
B)10
C)120
D)15
109.[單選題]Hadoopl.0默認(rèn)的調(diào)度器策略是哪個(gè)。()
A)先進(jìn)先出調(diào)度器
B)計(jì)算能力調(diào)度器
C)公平調(diào)度器
D)優(yōu)先級(jí)調(diào)度器
110.[單選題]一幅大小為512X512的8比特圖像,則該圖像大小為(一)。
A)32KB
B)128KB
C)16KB
D)256KB
Ill.[單選題]一切皆可連,任何數(shù)據(jù)之間邏輯上都有可能存在聯(lián)系,這體現(xiàn)了大數(shù)據(jù)思維維度中的
()O
A)定量思維
B)相關(guān)思維
C)因果思維
D)檢驗(yàn)思維
112.[單選題]O以上地方人民政府有關(guān)部門的網(wǎng)絡(luò)安全保護(hù)和監(jiān)督管理職責(zé),按照國(guó)家有關(guān)規(guī)定
確定
A)鄉(xiāng)級(jí)
B)縣級(jí)
C)市級(jí)
D)省級(jí)
113.[單選題]數(shù)據(jù)管理成熟度模型將機(jī)構(gòu)數(shù)據(jù)管理能力定義為(_)個(gè)不同成熟度等級(jí),并給出了
(_)類關(guān)鍵過程域,共(_)個(gè)關(guān)鍵活動(dòng)。
A)3,7,21
B)4,6,24
05,6,25
D)6,7,28
114.[單選題IMapReduce編程模型,鍵值對(duì)<key,value>的key必須實(shí)現(xiàn)哪個(gè)接口?()
A)WritableComparab1e
B)ComparabIe
OWritable
D)LongWritable
115.[單選題]CNN神經(jīng)網(wǎng)絡(luò)對(duì)圖像特征提取帶來了變革性的變化,使之前的人工特征提取升級(jí)到數(shù)據(jù)
驅(qū)動(dòng)的自動(dòng)特征提取,在αN中,起到特征提取作用的網(wǎng)絡(luò)層是()
A)ConVoIUtion層
B)fullConneet層
C)maxpooling層
D)norm層
116.[單選題]Maxcompute中,當(dāng)一個(gè)用戶被移除后,與該用戶有關(guān)的()授權(quán)會(huì)保留。
?)PaCkage授權(quán)
B)POIiCy授權(quán)
C)ACL授權(quán)
D)項(xiàng)目空間授權(quán)
117.[單選題]關(guān)于缺失值填補(bǔ),不正確的說法是()。
A)填補(bǔ)數(shù)據(jù)可以用中位數(shù)或者眾數(shù)等
B)Pandas,dropna可以用來填補(bǔ)缺失值
C)用平均值填補(bǔ)會(huì)引入相關(guān)性
D)啞變量填補(bǔ)是將缺失值當(dāng)做一類新特征處理
118.[單選題]Hadoop環(huán)境下HDFS系統(tǒng)中的NameNOde實(shí)現(xiàn)的功能是()。
A)管理文件系統(tǒng)的命名空間
B)管理存儲(chǔ)空間
C)分配算力
D)調(diào)控算法
119.[單選題]下列關(guān)于GaUSSDB200的TOAST機(jī)制說法正確的是O?
A)存儲(chǔ)超過2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制.
B)支持變長(zhǎng)(Varlena)表現(xiàn)形式的數(shù)據(jù)類型.
C)存儲(chǔ)超過1/2KB的字段時(shí),會(huì)觸發(fā)TOAST機(jī)制。
D)存儲(chǔ)超過IKB的字段時(shí),會(huì)觸發(fā)ToAST機(jī)制。
120.[單選題]執(zhí)行以下代碼段IiStl=[1,5,9]Print(SUnI(IiStI))時(shí),輸出為(_)。
A)l
B)5
09
D)15
121.[單選題]假如使用LaSSO回歸來擬合數(shù)據(jù)集,該數(shù)據(jù)集輸入特征有100個(gè)(XI,X2,…,
XlOO)O現(xiàn)在,把其中一個(gè)特征的值擴(kuò)大10倍(如特征XD,然后用相同的正則化參數(shù)對(duì)LaSSO
回歸進(jìn)行修正。那么下列說法正確的是()。
A)特征Xl很可能被排除在模型之外
B)特征Xl很可能還包含在模型之中
C)無法確定特征Xl是否被舍
D)以上答案都不正確
122.[單選題]防火墻、漏洞掃描、病毒防范和系統(tǒng)加固等服務(wù)屬于O
A)安全增值服務(wù)
B)代理代維服務(wù)
C)優(yōu)化類服務(wù)
D)容災(zāi)服務(wù)
123.[單選題]K折交叉驗(yàn)證器是()函數(shù)。
A)model_selection.GroupKFold()
B)model_SeleCtion.GroupShufeSplit()
C)model_selection.KFold()
D)model_seIection.RepeatedKFold()
124.[單選題]閱讀以下代碼,回答問題,當(dāng)n是11的時(shí)候,S為多少1deftotal(n):2s=03i=14
while(i
A)55
B)66
C)44
D)50
125.[單選題]已知初始問題的描述,通過一系列變換把此問題最終變?yōu)橐粋€(gè)子問題集合;這些子問題
的解可以直接得到,從而解決了初始問題。這是知識(shí)表示法叫OO
A)狀態(tài)空間法
B)問題歸約法
C)謂詞邏輯法
D)語義網(wǎng)絡(luò)法
126.[單選題]下面哪個(gè)是分布式數(shù)據(jù)庫O
?)HDFS
B)HBase
C)Oracle
D)Mysql
127.[單選題]HBase的物理存儲(chǔ)單元是什么?
A)Region
B)ColumnFamily
C)Column
D)ROW
128.[單選題]numPy中實(shí)現(xiàn)豎直軸分割數(shù)組的函數(shù)是什么?
A)np.vsplit
B)np.hsplit
C)np.dsplit
D)np.split
129.[單選題]假設(shè)現(xiàn)在要做一個(gè)可以根據(jù)線索指導(dǎo)運(yùn)維人員進(jìn)行排障的功能,你建議選擇下列哪個(gè)
工具實(shí)現(xiàn)該功能?
A)Lucene
B)HBase
C)ElasticSearch
D)GraphBase
130.[單選題]關(guān)于HiVe在FUSiOnlnSightHD中的架構(gòu)描述錯(cuò)誤的是?
A)只要有一個(gè)HiVeSerVer不可用,整個(gè)HiVe集群便不可用
B)MOtaStOre用于提供元數(shù)據(jù)服務(wù),依賴于DBSerViCe
C)在同一時(shí)間點(diǎn),HiVeSerVer只要一個(gè)處于ACtiVe狀態(tài),另一個(gè)則處于Standby狀態(tài)
D)HiVeSerVer負(fù)責(zé)接收客戶端請(qǐng)求.解析.執(zhí)行HQL命令并返回查詢結(jié)果
131.[單選題]哪一項(xiàng)不屬于FUSiOnInSightHD中HiVe的流控特性的描述?
A)支持對(duì)已經(jīng)建立的總連接數(shù)做閥值控制
B)支持對(duì)每個(gè)用戶已經(jīng)建立的連接數(shù)做閥值控制
C)支持對(duì)某個(gè)特定用戶已經(jīng)建立的連接數(shù)做閥值控制
D)支持對(duì)單位時(shí)間所建立的連接數(shù)做閥值控制
132.[單選題]()是GOOgle提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運(yùn)算的
軟件架構(gòu)。
Λ)GFS
B)MapReduce
C)Chubby
D)BitTable
133.[單選題]下列關(guān)于數(shù)據(jù)交易市場(chǎng)的說法中,錯(cuò)誤的是()。
A)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物
B)咱商業(yè)化的數(shù)據(jù)交易活動(dòng)催生了多方參與的第三方數(shù)據(jù)交易市場(chǎng)
C)數(shù)據(jù)交易市場(chǎng)通過生產(chǎn)、研友和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助
D)數(shù)據(jù)交易市場(chǎng)是大數(shù)據(jù)資源化的必然產(chǎn)物
134.[單選題]下列對(duì)于ADS中表和表組的描述正確的是()。
A)維度表在創(chuàng)建時(shí)不需要指定表組,但是需要配置分區(qū)信息
B)維度表可以和除維度表組外的任意表組中的表關(guān)聯(lián)
C)批量插入的表如果只有一級(jí)分區(qū),每次導(dǎo)入數(shù)據(jù)是會(huì)覆蓋掉已有數(shù)據(jù)
D)維度表組有且只有一個(gè),用戶可以修改表組屬性,但是不能刪除
135.[單選題]np.arraySPIit()函數(shù)的作用是(_)o
A)沿著它的水平軸分割
B)沿著縱向的軸分割
C)允許指定沿哪個(gè)軸分割
D)按深度方向分割
136.[單選題]sciPy中模塊Signal.的作用是什么?
A)信號(hào)處理
B)程序輸入輸出
C)程序輸入輸出
D)計(jì)算積分
137.[單選題]大數(shù)據(jù)產(chǎn)業(yè)指什么?
A)一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合
B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)
C)提供數(shù)據(jù)分享平臺(tái)、數(shù)據(jù)分析平臺(tái)、數(shù)據(jù)租售平臺(tái)等服務(wù)的企業(yè)
D)提供分布式計(jì)算、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析等服務(wù)的各類企業(yè)
138.[單選題]為保證流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在:()。
A)本地文件系統(tǒng)中
B)JObManager的內(nèi)存中
C)HDFS中
D)可靠性高的單擊數(shù)據(jù)庫中
139.[單選題]下列選項(xiàng)中,用于標(biāo)識(shí)為靜態(tài)方法的是OO
A)@classmethod
B)PythOn標(biāo)示注釋使用符號(hào)是以下哪個(gè)?
C)?staticmethod
D)'?privatemethod
140.[單選題]HBase為什么適用于海量數(shù)據(jù)存儲(chǔ)?
A)集群規(guī)模小
B)支持列存表
C)多列簇特性
D)HDFS做底層存儲(chǔ)
141.[單選題]下列關(guān)于RDD說法,描述有誤的是?
A)一個(gè)RDD就是一個(gè)分布式對(duì)象集合,本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合
B)每個(gè)RDD可分成多個(gè)分區(qū),每個(gè)分區(qū)就是一個(gè)數(shù)據(jù)集片段
C)RDD是可以直接修改的
D)RDD提供了一種高度受限的共享內(nèi)存模型
142.[單選題]以下不屬于生成式模型的是:
A)樸素貝葉斯
B)K近鄰
C)高斯混合模型
D)馬爾科夫隨機(jī)場(chǎng)
143.[單選題]在其他條件不變的前提下,()容易引起機(jī)器學(xué)習(xí)中的過擬合問題
A)增加訓(xùn)練集量
B)減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)數(shù)
C)刪除稀疏的特征
D)SVM算法中使用高斯拉底BF桂代替線性
144.[單選題]信息安全管理最關(guān)注的是?()
A)外部惡意攻擊
B)病毒對(duì)PC的影響
C)內(nèi)部惡意攻擊
D)病毒對(duì)網(wǎng)絡(luò)的影響
145.[單選題]數(shù)據(jù)、信息與知識(shí)三者之間的變化趨勢(shì)是O
A)宏課程
B)大課程
C)小課程
D)微課程
146.[單選題]在留出法、交叉驗(yàn)證法和自助法三種評(píng)估方法中,()更適用于數(shù)據(jù)集較小、難以劃分訓(xùn)
練集和測(cè)試集的情況。
A)留出法
B)交叉驗(yàn)證法
C)自助法
D)留一法
147.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫的描述,哪一項(xiàng)是錯(cuò)誤的:()
A)擴(kuò)展性好,靈活性好
B)大量寫操作時(shí)性能高
C)無法存儲(chǔ)結(jié)構(gòu)化信息
D)條件查詢效率高
148.[單選題]下列操作是創(chuàng)建目錄的是(__)。
A)mkdir
B)chdir
C)rmdir
D)move
149.[單選題IFusionInsightHD集群組網(wǎng)設(shè)計(jì)中,有一種機(jī)架可以按照業(yè)務(wù)需求線性擴(kuò)展,這種機(jī)
架被稱為()
A)基本框
B)擴(kuò)展框
C)管理框
D)數(shù)據(jù)框
150.[單選題]下面說法錯(cuò)誤的是()。
A)可以利用統(tǒng)計(jì)量對(duì)缺失值進(jìn)行填補(bǔ)
B)可以利用K近鄰值對(duì)缺失值進(jìn)行填補(bǔ)
C)只要有缺失值就必須把對(duì)應(yīng)記錄刪除
D)對(duì)于缺失值較多的屬性可以考慮刪除
151.[單選題]下列選項(xiàng)中,不屬于PythOn特點(diǎn)的是。()
A)面向?qū)ο?/p>
B)運(yùn)行效率高
C)可移植性
D)免費(fèi)和開源
152.[單選題]MySQL數(shù)據(jù)庫驅(qū)動(dòng)文件放置于hive哪個(gè)目錄下O
A)jar
B)lib
Obin
D)sbin
153.[單選題]在HadoOP的分區(qū)階段,默認(rèn)的PartitiOner是()。
A)RangePartitioner
B)Partitioner
C)HashPartitioner
D)用戶自定義的Partitioner
154.[單選題]大數(shù)據(jù)計(jì)算服務(wù)(MaxCompute,原ODPS)的運(yùn)維人員想要知道一張日志表IOg已經(jīng)占
用了多少存儲(chǔ)空間,可以在命令行工具OdPSemd中使用()命令查看。
A)Islog;
B)desclog;
C)select*fromlog;
D)sizelog;
155.[單選題]下列選項(xiàng)中,哪個(gè)配置文件可以配置HDFS地址、端口號(hào)以及臨時(shí)文件目錄()
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)yarn-site,xml
156.[單選題]有N個(gè)樣本,一般用于訓(xùn)練,一般用于測(cè)試若N增大,則訓(xùn)練誤差和測(cè)試誤差之間的差
距會(huì)()
A)增大
B)減小
C)無法確定
D)無明顯變化
157.[單選題]下面哪個(gè)RDD操作肯定是寬依賴()
A)map
B)fIatMap
OreduceByKey
D)sample
158.[單選題]下面哪個(gè)不屬于matplotlib基本圖表包含的元素
A)坐標(biāo)軸
B)刻度
C)刻度標(biāo)簽
D)參考區(qū)域
159.[單選題]表A為ADS中的普通表,列a為其中一個(gè)普通列,類型為int,以下SQL()是正確的。
A)SELECTa+COUNT(*)FROMA
B)SELECTUDF_SYS_COUNT_COLUMN(a)FROMA
C)SELECTSUM(COUNT(*))FROMA
D)以上都正確
160.[單選題]下列關(guān)于Python文件處理的描述錯(cuò)誤的是()。
A)Python能處理jpg圖像文件
B)Python不可以處理PDF文件
OPython能處理CSV文件
D)Python能處理Excel文件
161.[單選題]在空間維度上刻畫數(shù)據(jù)連續(xù)性是數(shù)據(jù)的()特點(diǎn)。
A)可關(guān)聯(lián)性
B)可溯源性
C)可理解性
D)可復(fù)制性
162.[單選題]()是指為最小化總體風(fēng)險(xiǎn),只需在每個(gè)樣本上選擇能使特定條件風(fēng)險(xiǎn)最小的類別標(biāo)記。
A)支持向量機(jī)
B)間隔最大化
C)線性分類器
D)貝葉斯判定準(zhǔn)則
163.[單選題]Flume中基于WAL(預(yù)寫式日志W(wǎng)rite-AheadLog)實(shí)現(xiàn)ChanneI持久化的是?
A)JDBCChannel
B)KafkaChannel
C)MemoryChannel
D)FiIeChannel
164.[單選題]情感信息抽取不包括以下哪些方法?()
A)、基于命名實(shí)體識(shí)別的抽取方法
B)、基于重復(fù)段落的識(shí)別方法
0、基于語義角色標(biāo)注的抽取方法
D)、基于監(jiān)督學(xué)習(xí)抽取的學(xué)習(xí)方法
165.[單選題]下列的處理過程與RedUCe處理過程相似的是(一)0
A)Shuffle
B)Combiner
C)Partition
D)Map
166.[單選題]假設(shè)每個(gè)用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,
QueueA.minimum-userTimit-PerCent=24。則以下說法錯(cuò)誤的是?
A)第3個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得33.33%的資源
B)第2個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得50%的資源
C)C第4個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得25%的資源
D)D第5個(gè)用戶提交任務(wù)時(shí),每個(gè)用戶最多獲得20%的資源
167.[單選題]CSV是一種通用的、相對(duì)簡(jiǎn)單的文件格式,被用戶、商業(yè)和科學(xué)廣泛應(yīng)用。現(xiàn)在需要在
DEEP平臺(tái)中將多個(gè)字符串拼接成CSV格式的字符串。請(qǐng)選擇適用的數(shù)值轉(zhuǎn)換器:
A)Ceiling
B)CsvAssemble
C)CsnToString
D)TermExtract
168.[單選題]下面插入數(shù)據(jù)操作錯(cuò)誤的是()。-
A)INSERT數(shù)據(jù)表名VALUE(值列表)
B)INSERTINTO數(shù)據(jù)表名VALUES(值列表)
C)INSERT數(shù)據(jù)表名VALUES(值列表)
D)INSERT數(shù)據(jù)表名(值列表)
169.[單選題]執(zhí)行以下代碼段deffl(a,b=[]):b.append(a)returnbprint(fl(1,[2,3]))時(shí)
,輸出為()o
A)[1,2,3]
B)[1,3,2]
C)[3,2,1]
D)[2,3,1]
170.[單選題]在hadoop配置中yarn-site,xml作用是()
A)用于定義系統(tǒng)級(jí)別的參數(shù)
B)用于名稱節(jié)點(diǎn)和數(shù)據(jù)節(jié)點(diǎn)的存放位置
C)用于配置
D)配置
171.[單選題]當(dāng)(_)過高,會(huì)出現(xiàn)欠擬合現(xiàn)象
A)偏差
B)方差
C)噪聲
D)泛化誤差
172.[單選題]YARN調(diào)度器分配資源的順序是:()o
A)任意機(jī)器一本地資源一同機(jī)架
B)任意機(jī)器一同機(jī)架一本地資源
C)本地資源一同機(jī)架一任意機(jī)器
D)同機(jī)架一任意機(jī)器一本地資源
173.[單選題]假設(shè)PreCiSiOn=TP/(TP+FP),recall=TP/(TP+FN),則在二分類問題中,當(dāng)測(cè)試集的正例
和負(fù)例數(shù)量不均衡時(shí),以下評(píng)價(jià)方案中()是相對(duì)不合理的。
A)Accuracy:(TP+TN)/all
B)F-value:2recallprecision/(recal!+precision)
C)G-mean:sqrt(precision*recall)
D)AUC:曲線下面積
174.[單選題]國(guó)網(wǎng)數(shù)據(jù)中臺(tái),是在下面()數(shù)據(jù)中心階段的基礎(chǔ)上發(fā)展過來的。
A)營(yíng)銷服務(wù)中心
B)全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心
C)海量歷史/實(shí)時(shí)數(shù)據(jù)中心
D)電網(wǎng)GlS數(shù)據(jù)中心
175.[單選題]執(zhí)行下列語句后的顯示結(jié)果是什么?>>>World="world"?>print"hello"+
world
A)helloworld
B)“hello"world
C)helloworld
D)語法錯(cuò)誤
176.[單選題]在MaPRedUCe中,以下描述錯(cuò)誤的有()。
A)WOrker缸故障和MaSter故障的處理方法不相同
B)Map和Reduce的處理結(jié)果都存儲(chǔ)在本地文件件統(tǒng)
C)一個(gè)WOrker發(fā)生故障時(shí),該節(jié)點(diǎn)上執(zhí)行完成的Map任務(wù)需要再次執(zhí)行
D)MapReduce具有很強(qiáng)的容錯(cuò)機(jī)制
177.[單選題]離線批處理方案的應(yīng)用場(chǎng)景不包括?
A)占用計(jì)算存儲(chǔ)資源多
B)快速高效,實(shí)時(shí)的數(shù)據(jù)處理
C)數(shù)據(jù)處理格式多樣
D)處理大規(guī)模數(shù)據(jù)
178.[單選題]Hive中distributeby和Sortby的功能結(jié)合的是()
A)orderby
B)sortby
C)distributeby
D)clusterby
179.[單選題]大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用不包括以下哪項(xiàng)?O
A)大數(shù)據(jù)驅(qū)動(dòng)的團(tuán)購模式
B)利用大數(shù)據(jù)為用戶推薦消費(fèi)內(nèi)容
C)利用大數(shù)據(jù)調(diào)整線下門店布局
D)利用大數(shù)據(jù)控制消費(fèi)人群的口味喜好
180.[單選題]如果x=5.5,則表達(dá)式x>0andx==int(x)的運(yùn)算結(jié)果為;表達(dá)式x>0or
x==int(x)的運(yùn)算結(jié)果為?
A)TrUe、False
B)False,True
C)TrUe、True
D)False,False
181.[單選題]以下語句錯(cuò)誤的是()
A)selectsal+1fromemp;
B)selectsal*10,sal*deptnofromemp;
C)不能使用運(yùn)算符號(hào)
D)selectsal*10,deptno*10fromemp;
182.[單選題]在一個(gè)簡(jiǎn)單的線性回歸模型中(只有一個(gè)變量),如果將輸入變量改變一個(gè)單位
(增加或減少),那么輸出將改變()。
A)一個(gè)單位
B)不變
C)截距
D)回歸模型的尺度因子
183.[單選題]MaxCompute中負(fù)責(zé)對(duì)等待提交的task進(jìn)行排序的模塊是:()。
A)Worker
B)Executor
C)Scheduler
D)controller
184.[單選題]把圖像分割問題與圖的最小割(mincut)問題相關(guān)聯(lián)的方法是()。
A)基于圖論的分割方法
B)分水嶺算法
OSLIC算法
D)基于閾值的方法
185.[單選題]對(duì)于缺失值的處理中,不屬于數(shù)據(jù)補(bǔ)齊的是()
A)熱卡填充
B)期望值最大化方法
C)人工填寫
D)隨機(jī)補(bǔ)充
186.[單選題]從數(shù)據(jù)庫架構(gòu)設(shè)計(jì)來看,主要有以下哪些設(shè)計(jì)思路?
A)Shared-Disk
B)Shared-Everying
C)Shared-Nothing
D)以上全都正確
187.[單選題]下列選項(xiàng)中,若是哪個(gè)節(jié)點(diǎn)關(guān)閉了,就無法訪問HadooP集群()。
A)namenode
B)datanode
C)secondarynamenode
D)yarn
188.[單選題]現(xiàn)階段的大數(shù)據(jù)技術(shù)體系主要類型不包括()。
A)數(shù)據(jù)源與App
B)基礎(chǔ)設(shè)施
OHadoop
D)D.數(shù)據(jù)資源
189.[單選題]下面()表示日期和時(shí)間的數(shù)據(jù)類型。--
A)DECIMAL(6,2)
B)DATE
OYEAR
D)TIMESTAMP
190.[單選題]在DlKW金字塔中屬于未來的是(一)。
A)信息
B)數(shù)據(jù)
C)知識(shí)
D)智慧
191.[單選題]下列選項(xiàng)中適合MapReduce的場(chǎng)景有?
A)實(shí)時(shí)交互計(jì)算
B)迭代計(jì)算
C)流式計(jì)算
D)離線計(jì)算
192.[單選題]綜合類大數(shù)據(jù)應(yīng)用管理主要包括應(yīng)用需求、分析應(yīng)用和O,由互聯(lián)網(wǎng)部統(tǒng)一組織開
展。
A)數(shù)據(jù)安全
B)成果管理
C)商務(wù)拓展
D)推廣應(yīng)用
193.[單選題]大數(shù)據(jù)的起源是()。
A)金融
B)電信
C)互聯(lián)網(wǎng)
D)公共管理
194.[單選題]()表達(dá)了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問
題本身的難度。
A)偏差
B)方差
C)噪聲
D)泛化誤差
195.[單選題]在多元線性回歸模型中,若某個(gè)解釋變量對(duì)其余解釋變量的判定系數(shù)接近于1,則表明
模型中存在()
A)異方差
B)嘈序列相關(guān)
C)多重共線性
D)高擬合優(yōu)皮
196.[單選題]下列哪一種不屬于Bl工具數(shù)據(jù)集的數(shù)據(jù)字段類型?()
A)文本
B)數(shù)值
C)日期
D)整型
197.[單選題]數(shù)據(jù)科學(xué)是一門以“數(shù)據(jù)”,尤其是“大數(shù)據(jù)”為研究對(duì)象,并以數(shù)據(jù)統(tǒng)計(jì)、機(jī)器學(xué)
習(xí)、數(shù)據(jù)可視化等為理論基礎(chǔ),主要研究數(shù)據(jù)加工、數(shù)據(jù)管理、數(shù)據(jù)計(jì)算等活動(dòng)的(一)o
A)新興科學(xué)
B)交叉性學(xué)科
C)獨(dú)立學(xué)科
D)一整套知識(shí)體系
198.[單選題]在計(jì)算擬合曲線時(shí),如果擬合曲線始終沒有收斂,應(yīng)調(diào)整哪個(gè)參數(shù)?
A)增加迭代步數(shù)
B)減少迭代步數(shù)
C)增大收斂系數(shù)
D)減小收斂系數(shù)
199.[單選題]SQL語言的數(shù)據(jù)操縱語句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也
是使用最頻繁的語句是()。
A)UPDATE
B)SELECT
C)DELETE
D)INSERT
200.[單選題]下列算法中,()更適合做時(shí)間序列建模。
A)CNN
B)決策樹
C)LSTM
D)貝葉斯算法
201.[單選題]s=On=int(input())foriinrange(1,n+1):al=0forjinrange(1,i+
1):al+=ja=1.0/als+=aprint("s=%.If"%S)當(dāng)輸入的n為4時(shí),輸出S=()。
A)l.5
B)1.4
01.6
D)l.7
202.[單選題]以下可以在字符串中表示單引號(hào)的是()。-
A)?"
B)??'
C)?'
D)'
203.[單選題]Spark的技術(shù)架構(gòu)中,SPark核心層的作用是什么?
A)資源管理
B)提供內(nèi)存計(jì)算框架
C)提供面向特定類型的計(jì)算服務(wù)
D)分布式數(shù)據(jù)存取
204.[單選題]神經(jīng)網(wǎng)絡(luò)研究屬于下列O學(xué)派
A)符號(hào)主義
B)連接主義
C)行為主義
D)都不是
205.[單選題]使用似然函數(shù)的目的是()。
A)求解目標(biāo)函數(shù)
B)得到最優(yōu)數(shù)據(jù)樣本
C)找到最適合數(shù)據(jù)的參數(shù)
D)改變目標(biāo)函數(shù)分布
206.[單選題]如果要將讀寫位置移動(dòng)到文件開頭,需要使用的命令是()。
A)close
B)seek(0)
C)truncate
D)write(1stuff')
207.[單選題]FusionInsightHD中LOader從SFTP服務(wù)器導(dǎo)入文件,如果不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)
換且速度最快,選擇下面哪個(gè)文件類型?
A)test_file
B)sequence_file
C)binary_file
D)graph_file
208.[單選題](_)在劃分屬性時(shí)是在當(dāng)前結(jié)點(diǎn)的屬性集合中選擇一個(gè)最優(yōu)屬性。
A)AdaBoost
B)RF
C)Bagging
D)傳統(tǒng)決策樹
209.[單選題]以下哪些情景可以使用機(jī)器學(xué)習(xí)技術(shù)?O
A)記錄過去一段時(shí)間內(nèi)某移動(dòng)運(yùn)營(yíng)商客戶轉(zhuǎn)移到競(jìng)爭(zhēng)對(duì)手的案例
B)統(tǒng)計(jì)電商網(wǎng)站某類別商品在一定時(shí)間內(nèi)的銷量均值
C)統(tǒng)計(jì)某零售超市一個(gè)月內(nèi)哪類牛奶的銷量最大
D)為攜程在線旅游公司的客戶推薦度假產(chǎn)品
210.[單選題]下列不是數(shù)據(jù)科學(xué)項(xiàng)目的主要角色()。
A)項(xiàng)目發(fā)起人
B)項(xiàng)目經(jīng)理
C)操作員
D)驗(yàn)收人員
211.[單選題]Python運(yùn)算符中用來計(jì)算集合并集的是()。
A)l
B)&
Oll
D)+
212.[單選題]以下選項(xiàng)哪個(gè)是MapReduce正確的運(yùn)行模型()
?)Reduce-Map-Shuffie
B)Shuffle-Map-Reduce
C)Map-Shuff1e-Reduce
D)Map-Reduce-Shuffie
213.[單選題]下列哪一種命令格式是不正確的()
?)get表行健列族
B)scan表時(shí)間戳起始行健結(jié)束行健
C)alter表列族
D)put表行鍵列族:列值
214.[單選題]關(guān)于計(jì)算機(jī)技術(shù)的描述以下正確的是,:
A)計(jì)算機(jī)是革命性技術(shù)
B)計(jì)算機(jī)早于工業(yè)革命時(shí)代誕生
C)計(jì)算機(jī)運(yùn)行算法的時(shí)候跟CPU速度沒關(guān)系
D)計(jì)算機(jī)不能用來收集數(shù)據(jù)
215.[單選題]下列不屬于無監(jiān)督學(xué)習(xí)方法的是O
A)K-means
B)線性降維
C)DBSCAN
D)支持向量機(jī)
216.[單選題]以下()屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過程域"數(shù)據(jù)戰(zhàn)略"。
A)數(shù)據(jù)戰(zhàn)略制定
B)嘈業(yè)務(wù)術(shù)語表
C)數(shù)據(jù)質(zhì)量評(píng)估
D)過程質(zhì)量保障
217.[單選題]優(yōu)化管理體系,實(shí)現(xiàn)管理模式從(_)向(_)轉(zhuǎn)變,向各級(jí)組織和業(yè)務(wù)賦能。
A)數(shù)據(jù)化,業(yè)務(wù)化
B)平臺(tái)化,集約化
C)條塊化,共享化
D)縱向貫通,橫向貫通
218.[單選題]namenode默認(rèn)的WebUl訪問端口號(hào)是()
A)50070
B)50060
C)50050
D)50040
219.[單選題]()選擇成為支持向量機(jī)的最大變數(shù)
A)核函數(shù)
B)樣本空間
C)模型
D)算法
220.[單選題]下列描述說法錯(cuò)誤的是?O
A)SeCUreCRT是一款支持SSH的終端仿真程序,它能夠在WindoWS操作系統(tǒng)上遠(yuǎn)程連接LinUX服務(wù)器執(zhí)
行操作。
B)HadOoP是一個(gè)用于處理大數(shù)據(jù)的分布式集群架構(gòu),支持在GNU/Linux系統(tǒng)以及WindOWS系統(tǒng)上進(jìn)行
安裝使用。
C)VMware
D)SSH是一個(gè)軟件,專為遠(yuǎn)程登錄會(huì)話和其他網(wǎng)絡(luò)服務(wù)提供安全性功能的軟件。
221.[單選題]以下哪項(xiàng)用來分組()
A)ORDERBY
B)ORDEREDBY
C)GROUPBY
D)GROUPEDBY
222.[單選題]假設(shè)我們使用原始的非線性可分版本的SOft-SVM優(yōu)化目標(biāo)函數(shù)。我們可通過0來保證
得到的模型是線性可分離的。
A)C=O
B)C=1
C)C正無窮大
D)C負(fù)無窮大
223.[單選題]創(chuàng)建分支語句如下,CREATEORREPLACEPROCEDUREproccase,branch(pi_result
ininteger,pi_returnoutinteger)ASBEGINCASEpi_resultWHEN!THENpi_return;=
1:WHEN2THENpi_return:=3:WHEN3THENpireturn:5:WHEN6THENPi_return:-7:WHEN
7THENpi_return
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版九年級(jí)化學(xué)上冊(cè)自制第六單元課題4實(shí)驗(yàn)活動(dòng)2-二氧化碳實(shí)驗(yàn)室制取與性質(zhì)(34張)
- 2019-2020學(xué)年高中數(shù)學(xué)第2章解析幾何初步2-3空間直角坐標(biāo)系課件北師大版必修2
- 接待禮儀-素材-培訓(xùn)講學(xué)
- 教育學(xué)原理04-近現(xiàn)代高等教育發(fā)展、教師
- 2024年泰州職業(yè)技術(shù)學(xué)院高職單招數(shù)學(xué)歷年參考題庫含答案解析
- 2024年陽江市衛(wèi)校附屬醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 二零二五年離婚房產(chǎn)分割與贍養(yǎng)義務(wù)協(xié)議3篇
- 二零二五版“汽車零部件銷售協(xié)議”英文翻譯
- 2024年江西醫(yī)學(xué)高等??茖W(xué)校高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 2024年江蘇安全技術(shù)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(頻考版)含答案解析
- 牛津譯林版八年級(jí)上冊(cè)英語8A期末復(fù)習(xí)-閱讀理解(含答案)
- 鄉(xiāng)鎮(zhèn)污水處理調(diào)研報(bào)告
- 普通高等新郎接親試卷(2022全國(guó)卷)
- 第三章天氣與氣候練習(xí)題 人教版七年級(jí)上冊(cè)地理
- 小動(dòng)物疾病-第一章 小動(dòng)物疾病概述
- 科研倫理與學(xué)術(shù)規(guī)范-課后作業(yè)答案
- 紀(jì)檢涉案財(cái)物管理規(guī)定
- 低溫雨雪冰凍災(zāi)害應(yīng)急救援準(zhǔn)備
- 幼兒園背景研究分析報(bào)告
- 圍墻維修 施工方案
- 電動(dòng)車轉(zhuǎn)讓協(xié)議書電子版
評(píng)論
0/150
提交評(píng)論