大數(shù)據(jù)開發(fā)基礎練習題及答案10-2023練習版_第1頁
大數(shù)據(jù)開發(fā)基礎練習題及答案10-2023練習版_第2頁
大數(shù)據(jù)開發(fā)基礎練習題及答案10-2023練習版_第3頁
大數(shù)據(jù)開發(fā)基礎練習題及答案10-2023練習版_第4頁
大數(shù)據(jù)開發(fā)基礎練習題及答案10-2023練習版_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

試題說明

本套試題共包括1套試卷

答案和解析在每套試卷后

大數(shù)據(jù)開發(fā)基礎練習題及答案10(500題)

大數(shù)據(jù)開發(fā)基礎練習題及答案10

L[單選題]Hadoop作者

A)MartinFowler

B)KentBeck

C)Dougcutting

2.[單選題]假設有n組數(shù)據(jù)集,每組數(shù)據(jù)集中,x的平均值都是9,x的方差都是11,y的平均值都是

7.50,X與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500xo那么這n組數(shù)據(jù)集()o

A)一樣

B)不一樣

C)無法確定是否一樣

3.[單選題]關(guān)于MaXComPUte類型之間的類型轉(zhuǎn)化,說法不正確的是:()。

A)隱式類型轉(zhuǎn)換是MaXCOmPUte依據(jù)上下文使用環(huán)境自動進行的類型轉(zhuǎn)換

B)部分類型之間不可以通過顯式的類型轉(zhuǎn)換,但可以通過SQL的隱式轉(zhuǎn)換完成

C)不支持的隱式類型轉(zhuǎn)換會導致異常

D)MaXCOmPUte支持的隱式類型轉(zhuǎn)換規(guī)則與顯式轉(zhuǎn)換相同

4.[單選題]下列關(guān)于分布式數(shù)據(jù)庫的說法中,錯誤的是

A)分布式數(shù)據(jù)庫系統(tǒng)通常使用較小的計算機系統(tǒng)

B)分布式數(shù)據(jù)庫是物理上分散的數(shù)據(jù)庫

C)分布式數(shù)據(jù)庫是邏輯上統(tǒng)一的數(shù)據(jù)庫

D)每臺計算機中都一定有DBMS的一份完整拷貝副本

5.[單選題]通常會單獨購買獨立設備組為其服務的行業(yè)是?O

A)電商行業(yè)

B)金融行業(yè)

C)視頻行業(yè)

D)新聞網(wǎng)站

6.[單選題]運行下面代碼的輸出結(jié)果為()。

Importnumpyasnp

A=np.array([[3,7,5],[8,4,3],[2,4,9]])print(np.ptp(a))

A)[E3,7,5],[8,4,3],[2,4,9]]

B)7

C)[4,5,7]

D)[6,3,6]

7.[單選題]分類模型評估指標不包括O

A)Fl-score

B)平均絕對誤差

C)準確率

D)ΛUC

8.[單選題]下列語句的輸出結(jié)果為()a=5b=4c=a+bprint("a+b=",c)

A)a=5

B)b=4

C)5+4=9

D)a+b=9

9.[單選題]當上傳本地文件到QUiCkBl中做展現(xiàn)時,數(shù)據(jù)被保存到了()。

A)QuickB自帶的探索空間

B)QuickBI自帶的MaXComPUte

OAnalyticDB

D)客戶端本地緩存

10.[單選題]HDFS配置數(shù)據(jù)文件存儲路徑(dfs.datanode.data,dir)的文件是哪一個?

A)hadoop-env.sh

B)core-site,xml

C)hdfs-site.xml

D)yarn-site,xml

IL[單選題]下列關(guān)于數(shù)據(jù)標準化的說法中,不正確的是()

A)Z-SCore標準化適用于特征最大值和最小值未知,數(shù)據(jù)較分散的情況

B)聚類算法要求數(shù)據(jù)集無量綱化

C)LogiStiC標準化函數(shù)。(x)滿足。(0)=1

D)Min-Max標準化易受離群值影響

12.[單選題]推動多元化新興產(chǎn)業(yè)發(fā)展,重點發(fā)揮公司()企業(yè)優(yōu)勢,聚集產(chǎn)業(yè)各方,構(gòu)建多方參與、

共商共建共贏的多元產(chǎn)業(yè)生態(tài)。

A)聚集型

B)共享型

C)樞紐型

D)計劃型

13.[單選題]下列函數(shù)中,用于沿著軸方向堆疊PandaS對象的是()。

A)concat()

B)join()

C)merge()

D)combinefirst()

14.[單選題]平均值很容易受()影響

A)平均值

B)定變值

C)極值

D)以上說法都不對

15.[單選題]在Python中,變量的取名要遵循一定的規(guī)則,下列規(guī)則不正確的是()。

A)變量名要以字母、數(shù)字、下劃線命名,且不能以數(shù)字開頭;

B)變量名不區(qū)分大小寫

C)變量名不能有空格;

D)變量名能與Python中的內(nèi)置命令重復,如if、while、for等不可以作為變量名;

16.[單選題]數(shù)據(jù)轉(zhuǎn)換器中日期類型的使用用途正確的是()

A)DateDiff對應用途是將時間類型轉(zhuǎn)換為字符類型

B)DateFOmat對應用途是把一個日期值格式化為DateShire系統(tǒng)內(nèi)部統(tǒng)一格式

OStringToDateTime對應用途是將字符串轉(zhuǎn)換為日期時間

D)FormatDate對應用途為計算兩個日期之間的差

17.[單選題]以下關(guān)于知識圖譜,描述錯誤的是:。

A)又稱為科學知識圖譜

B)在圖書情報界稱為知識域可視化或知識領域映射地圖

C)知識圖譜屬于密碼學研究范疇

D)知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域

18.[單選題]大數(shù)據(jù)計算服務的開發(fā)人員創(chuàng)建了日志表,并且導入了歷史數(shù)據(jù)后發(fā)現(xiàn)表的一個字段命

名拼寫有錯誤,可以采用()更正此問題成本最低。

A)將原表重命名,然后建張正確的表,再導入歷史數(shù)據(jù)

B)在表的末尾新添加一個字段

C)刪除表后重建,然后重新導入歷史數(shù)據(jù)

D)通過alter命令重新命令該字段

19.[單選題]在MaPRedUCe的應用程序開發(fā)中,下列()JAVA類負責管理和運行一個計算任務。

A)lob

B)Context

OFileSystem

D)Configuration

20.[單選題]下列關(guān)于聚類挖掘技術(shù)的說法中,錯誤的是()。

A)不預先設定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B)要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小

C)要求不同類數(shù)據(jù)的內(nèi)容相儀度盡可能小

D)與分類挖據(jù)技術(shù)相似的是,都是要對數(shù)據(jù)進行分類處理

21.[單選題]下列關(guān)于Logistic回歸和SVM的描述不正確的是()。

A)Logistic回歸本質(zhì)上是一種根據(jù)樣本對權(quán)值進行極大似然估計的方法,用先驗概率的乘積代替后

驗概率

B)Logistic回歸的輸出就是樣本屬于正類別的概率

OSVM的目標是找到使得訓練數(shù)據(jù)盡可能分開且分類間隔最大的超平面,屬于結(jié)構(gòu)風險最小化

D)SVM可以通過正則化系數(shù)控制模型的復雜度,避免過擬合

22.[單選題]以下哪項是SParkQ2x程序統(tǒng)一入口?0

A)StreamingContext

B)SaContext

C)HiveContext

D)SparkSession

23.[單選題]下面哪種不屬于池化操作()。

A)、連接池化

B)、一般池化

C)、重疊池化

D)、金字塔池化

24.[單選題]下列關(guān)于不確定性知識描述錯誤的是()。

A)不確定性知識是不可以精確表示的

B)專家知識通常屬于不確定性知識

C)不確定性知識是經(jīng)過處理過的知識

D)不確定性知識的事實與結(jié)論的關(guān)系不是簡單的“是”或“不是”。

25.[單選題]數(shù)據(jù)科學基本原則中,"基于數(shù)據(jù)的智能"的主要特點是()。

A)數(shù)據(jù)簡單、但算法簡單

B)數(shù)據(jù)復雜、但算法簡單

C)數(shù)據(jù)簡單、但算法復雜

D)數(shù)據(jù)復奈、但算法復雜

26.[單選題]下列說法錯誤的是()。

A)大數(shù)據(jù)是一種思維

B)大數(shù)據(jù)不僅僅是數(shù)的體量大

C)大數(shù)據(jù)的英文Iargedata

D)大數(shù)據(jù)會帶來機器智能

27.[單選題]作為技術(shù)人員,小王被MaXConIPUte強大的數(shù)據(jù)處理能力吸引,想去體驗一下。他快速注

冊了一個阿里云帳號,進入官網(wǎng)后試圖創(chuàng)建一個名字為test_project的MaXConIPUteProjeCt,結(jié)果

沒有成功。分析,小王出錯的最有可能的原因是:()。

A)帳號未充值,余額不足導致出錯

B)帳號未開通MaXCOnlPUte的使用權(quán)限

C)未創(chuàng)建合適的accesSlD和accesSKey

D)項目名字和現(xiàn)有的其他帳戶的名字重復

28.[單選題]在MaPRedUCe中,哪個組件是用戶不指定也不會有默認的()。

A)Combiner

B)OutputFormat

C)Partitioner

D)InputFormat

29.[單選題]關(guān)系數(shù)據(jù)庫所謂的關(guān)系是指()

A)各記錄中的數(shù)據(jù)彼此有一定關(guān)聯(lián)

B)數(shù)據(jù)模型符合滿足一定條件的二維表格式

C)某兩個數(shù)據(jù)庫之間有一定的關(guān)系

D)表中兩個字段有一定的關(guān)系

30.[單選題]下面()子句專用于GroUPBy操作中的條件過濾功能。

A)WHERE子句

B)HAVING子句

C)LlMlT子句

D)ORDERBY子句

31.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,系統(tǒng)在【客戶信息管理】一級菜單下增加【征

信報告查詢管理】二級菜單,用戶可在此菜單下的【審批中的征信報告】節(jié)點中點擊O按鈕,完

成查看/下載征信查詢授權(quán)書動作。

A)新增查詢

B)B.查看/下載授權(quán)書

C)C.取消申請

D)D.提交

32.[單選題]下列符號中,表示Python中單行注釋的是()。

A)#

B)//

C)D)”

33.[單選題]己知一組數(shù)據(jù)的協(xié)方差矩陣P,下面關(guān)于主分量說法錯誤的是()

A)主分量分析的最佳準則是對一組數(shù)據(jù)進行接一紐正交基分解,在只取相同數(shù)量分量的條件下,以

均方誤差計算截尾誤差最小

B)在經(jīng)主分量分解后,協(xié)方差矩陣成為對角矩陣

C)主分量分析就是K-L變換

D)主分量是通過求協(xié)方差矩陣的特征值得到

34.[單選題]哪個不是StrUetUredStreaming中OUtPUt可以定義的存儲方式?

A)UpdateMode

B)JDBCMode

C)CompleteMode

D)AppendMode

35.[單選題]GaussDB200在創(chuàng)建表時,需要注意以下哪些事項O?

A)創(chuàng)建列存表之后,后續(xù)可以修改為行存表。

B)創(chuàng)建列存表時壓縮級別默認為HlGH.

C)如果指定表空間為普通表空間,創(chuàng)建表時默認是行式存儲。

D)創(chuàng)建行存表之后,后續(xù)可以修改為列存表。

36.[單選題]在HiVe的查詢語句中,表示A和B按位取或的是()

A)A∣B

B)A&B

OA-B

D)A~B

37.[單選題](一)是SPark中用來進行圖計算的庫函數(shù)。

A)GraphX

B)SparkSQL

C)SparkStreaming

D)MlIib

38.[單選題]若用如下的SQL語句創(chuàng)建了一個表SC:()CREATETABLESC(S#CHAR(6)NOT

NULL,CttCHAR(3)NOTNULL,SCOREINTEGER,NOTECHAR(20));向SC表插入如下行時,(

)行可以被插入。

A)(NULL,,103',80,'選修')

B)('200823,,'101',NULL,NULL)

C)('201132,,NULL,86,'')

D)(,201009,,'111,,60,必修)

39.[單選題]依據(jù)國網(wǎng)公司數(shù)據(jù)管理辦法,()是用來描述公司核心業(yè)務實體的數(shù)據(jù),是各業(yè)務應用

和各系統(tǒng)之間進行信息交互的基礎。

A)基礎數(shù)據(jù)

B)數(shù)據(jù)標準

C)參考數(shù)據(jù)

D)主數(shù)據(jù)

40.[單選題]大數(shù)據(jù)最顯著的特征是:

A)數(shù)據(jù)規(guī)模大

B)數(shù)據(jù)類型多

C)數(shù)據(jù)分布廣

D)數(shù)據(jù)處理快

41.[單選題]有一個關(guān)系,課程目錄(課程號,授課教師,所述專業(yè)),規(guī)定授課教師不能取空值,這一規(guī)

則屬于()

A)實體完整性約束

B)參照完整性約束

C)用戶自定義完整性約束

D)關(guān)鍵字完整性約束

42.[單選題]解決多重共線性的方法包括O

A)嶺回歸

B)主成分回歸

C)偏最小二乘回歸

D)以上都是

43.[單選題]下列哪項方法不屬于圖像分割方法Oo

A)邊緣檢測法

B)閾值分割法

C)區(qū)域分割法

D)特征提取法

44.[單選題]圖像的形態(tài)學處理方法包括()。

A)圖像增強

B)圖像銳化

C)圖像分割

D)腐蝕

45.[單選題]HDFS數(shù)據(jù)寫入流程描述錯誤的是?

A)業(yè)務應用調(diào)用HDFSClient提供的API,請求寫入文件。

B)業(yè)務調(diào)用ClOSe,flush后HDFSClient聯(lián)系NameNode,確認數(shù)據(jù)寫完成,DataNode持久化元數(shù)據(jù)。

OHDFSCIient收到業(yè)務數(shù)據(jù)后,從NameNode獲取到數(shù)據(jù)塊編號.位置信息后,聯(lián)系DataNode,并將需

要寫入數(shù)據(jù)的DataNode建立起流水線。完成后,客戶端再通過自有協(xié)議寫入數(shù)據(jù)到DataNodeL再由

DataNode1復制到DataNodeQ2DataNOde3。

D)HDFSCIient聯(lián)系NameNOde,NameNode在元數(shù)據(jù)中創(chuàng)建文件節(jié)點。

46.[單選題]條件uIN(20,30,40),,表示()

A)年齡在20到40之間

B)年齡在20到30之間

C)年齡是20或30或40

D)年齡在30到40之間

47.[單選題]下列關(guān)于SCaIa特性的描述,錯誤的是哪一項?

A)SCala語法復雜,但是能提供優(yōu)雅的APl計算

B)SCaIa具備強大的并發(fā)性,支持函數(shù)式編程,可以更好地支持分布式系統(tǒng)

C)SCaIa兼容Java,運行速度快,且能融合到HadooP生態(tài)圈中

D)SCala是SPark的主要編程語言

48.[單選題]hadoop能可靠地存儲和處理()字節(jié)數(shù)據(jù)。

A)TB

B)PB

OYB

D)ZB

49.[單選題]數(shù)據(jù)產(chǎn)品開發(fā)的關(guān)鍵環(huán)節(jié)是()

A)數(shù)據(jù)收集

B)數(shù)據(jù)預處理

C)數(shù)據(jù)學習

D)數(shù)據(jù)加工

50.[單選題]以下關(guān)于降維的表述,錯誤的是()

A)降維過程中可以保留原始數(shù)據(jù)的所有信息

B)多維縮放的目標是要保證降維后樣本之間的距離不變

C)線性降維方法目標是要保證降維到的起平面能更好地表示原始數(shù)據(jù)

D)核線性降維方法目標是通過按函數(shù)和核方法來避免采樣空間投影到高維空間再降維之后的低維結(jié)

構(gòu)丟失

51.[單選題]關(guān)于bagging下列說法錯誤的是()

A)各基分類器之間有較強依賴,不可以進行并行訓練

B)嘈最著名的算法之一是基于決策樹基分類器的隨機森林

C)當訓練樣本數(shù)量較少時,子集之間可能有重疊

D)為了讓基分類器之間互相獨立,需要將訓練集分為若干子集

52.[單選題]下列PythOn文件模式中,(—)表示創(chuàng)建一個新文件。如果文件已經(jīng)存在,則操作失

敗。

A)“r”

B)“W”

C)“x”

D)“+”

53.[單選題]語句np.random,randn(5,4)的運算結(jié)果是()。

A)生成一個5行4列的隨機矩陣

B)將矩陣的第5行第4列改成一個隨機值

C)將矩陣的第4行第3列改成一個隨機值

D)將矩陣的第5列和第4列都用隨機值代替

54.[單選題]如果LA、SSO模型中的懲罰項變大,下列說法正確的是0

A)、部分回歸系數(shù)會變?yōu)?

B)、部分回歸系數(shù)會趨近于0,但不會取值為0

C)、A和B的表述都正確

D)、以上說法都不正確

55.[單選題]()不是最近鄰分類器的特點。

A)它使用具體的訓練實例進行預測,不必維護源自數(shù)據(jù)的模型

B)分類一個測試樣例開銷很大

C)最近鄰分類器基于全局信息進行預測

D)可以生產(chǎn)任意形狀的決策邊界

56.[單選題]下列關(guān)于線性回歸分析中的殘差說法正確的是()。

A)殘差均值總是為零

B)殘差均值總是約等于零

C)殘差均值總是大于零

D)以上答案都不正確

57.[單選題]x=Idefchange(a):x+=1printXChange(X)代碼執(zhí)行結(jié)果是(_)。

A)l

B)2

03

D)報錯

58.[單選題]下面關(guān)于TimetOaSt的描述,哪個是錯誤的?()

A)TimetoaSt是在線創(chuàng)作基于時間軸事件記載服務的網(wǎng)站

B)提供個性化的時間線服務

C)TimetOaSt基于flash平臺,并基于flash時間軸上任意加入事件

D)TimetOaSt是一個提供復雜統(tǒng)計圖表的工具

59.[單選題]下列方法中,能夠讓所有單詞的首字母變成大寫的方法是()。

A)capitalize

B)title

C)upper

D)Ijust

60.[單選題]核矩陣是()的。

A)沒有規(guī)律

B)半正定

C)正定

D)樣本矩陣

61.[單選題]下列不屬于scikit-learn中用于標準化的函數(shù)是()。

A)StandardScaler

B)MinMaxScaler

C)MeanScaler

D)以上都對

62.[單選題]MaxComputeSQL中,使用關(guān)系運算符對兩個操作數(shù)進行比較,如果進行比較的兩個類型

間不能進行隱式類型轉(zhuǎn)換,貝1I:()O

A)則該關(guān)系運算不能完成,但并不會報錯

B)則該關(guān)系運算可以完成,健艮錯退出

C)則該關(guān)系運算不能完成,報錯退出

D)提示用戶需要使用CaSt進行顯示的類型轉(zhuǎn)換

63.[單選題]表達式Print("{:.2f}".format(20-2**3+10∕3**2*5))的結(jié)果是:

A)55

B)56

022

D)56

64.[單選題]數(shù)據(jù)科學是一門以()為主要研究任務的獨立學科。

A)數(shù)據(jù)驅(qū)動、數(shù)據(jù)業(yè)務化、數(shù)據(jù)洞見、數(shù)據(jù)產(chǎn)品研發(fā)和(或)數(shù)據(jù)生態(tài)系統(tǒng)的建設

B)數(shù)據(jù)研發(fā)

C)數(shù)據(jù)處理

D)數(shù)據(jù)洞見

65.[單選題]Insert事務使用的鎖模式是:()。

A)AccessShareLock

B)ROWEXCIUSiveLock

C)ShareupdateExclusiveLock

D)ExclusiveLock

66.[單選題]假設一個線性回歸模型完美適合訓練數(shù)據(jù)(訓練誤差為時,下面那個說法是正確的()

A)測試集誤差一直為0

B)測試集誤差可能為0

C)測試集誤差不會為。

D)以上都不對

67.[單選題]Flume數(shù)據(jù)采集過程中,下列選項中能對數(shù)據(jù)進行過濾和修飾的是:()。

A)Sink

B)Channel

C)ChannelSelector

D)Interceptor

68.[單選題]下面哪個不是SPark的組件()

A)SparkStreaming

B)SparkMlib

OSparkSQL

D)SparkR

69.[單選題]建立在相關(guān)關(guān)系分析法基礎上的預測是大數(shù)據(jù)的()。

A)基礎

B)前提

C)核心

D)條件

70」單選題]()不是HDFS的守護進程。

A)SecondaryNameNode

B)DataNode

C)MRAppMaster/YarnChi1d

D)NameNode

71.[單選題]DataFrame和RDD最大的區(qū)別()

A)科學統(tǒng)計支持

B)多了schema

C)存儲方式不一樣

D)外部數(shù)據(jù)源支持

72.[單選題]Spark生態(tài)系統(tǒng)組件SParkStreaming的應用場景是?

A)基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘

B)圖結(jié)構(gòu)數(shù)據(jù)的處理

C)基于歷史數(shù)據(jù)的交互式查詢

D)基于實時數(shù)據(jù)流的數(shù)據(jù)處理

73.[單選題]長短時記憶神經(jīng)網(wǎng)絡被設計用來解決的問題是()。

A)傳統(tǒng)RNN存在的梯度消失/爆炸問題

B)傳統(tǒng)RNN計算量大的問題

C)傳統(tǒng)RNN速度較慢的問題

D)傳統(tǒng)RNN容易過過擬合的問題

74.[單選題]以下說法錯的是哪項

A)大數(shù)據(jù)是一種思維方式

B)大數(shù)據(jù)不僅僅是講數(shù)據(jù)的體量大

C)大數(shù)據(jù)會帶來機器智能

D)大數(shù)據(jù)的英文名稱是Iargedata

75.[單選題]啟用日志聚集功能,需要配置哪個參數(shù)?

A)Ayarn,nodemanager,local-dirs

B)Byarn,nodemanager,log-dirs

C)Cyarn.acl.enable

D)Dyarn,log-aggregation-enable

76.[單選題]HadoopStreaming支持腳本語言編寫簡單MaPRedUCe程序,以下是一個例子:

bin/hadoopjarcontrib/streaming/hadoop-O.20-streaming.jar

-inputinput/fiIename

-outputoutput

-mapperMosth.py5,

-filedosth.py

-Dmapred.reduce,tasks=l

以下說法不正確的是:

A)HadoopStreaming使用UniX中的流與程序交互

B)HadoopStreaming允許我們使用任何可執(zhí)行腳本語言處理數(shù)據(jù)流

C)采用腳本語言時必須遵從UNlX的標準輸入STDlN,并輸出到STDoUT

D)RedUCe沒有設定,上述命令運行會出現(xiàn)問題

77.[單選題]在數(shù)據(jù)生命周期管理實踐中,()是執(zhí)行方法。

A)數(shù)據(jù)存儲和備份規(guī)范

B)數(shù)據(jù)管理和維護

C)數(shù)據(jù)價值發(fā)覺和利用

D)數(shù)據(jù)應用開發(fā)和管理

78.[單選題]更新列表時可以使用以下哪幾種方法來添加列表項(__)o

A)append(),next(),pop()

B)index(),clear(),extend()

C)append(),extend(),insert()

D)remove(),super0,pop()

79.[單選題]以下可表示變長度字符串的數(shù)據(jù)類型是()

A)TEXT

B)CHAR

C)VΛRCHΛR

D)EMUM

80.[單選題]下列哪些操作可以設置一個監(jiān)聽器WatCher()

A)getData

B)getChiIdren

C)exists

D)setData

81.[單選題]以下SQL語句編寫正確的是()?!?/p>

A)SELECT*FROMsh_goodsWHERE0;

B)SELECT*FROMsh_goodsGROUPBYCategOry_iD、WHEREprice>5;

C)SELECT*FROMsh_goodsLIMIT3ORDERBYprice;

D)以上選項都不正確

82.[單選題]以下可以創(chuàng)建外鍵約束的表是()。-

A)MylSAM表

B)InnoDB表

C)MEMORY表

D)以上答案全部正確

83.[單選題]Storage模塊負責了SPark計算過程中所有的(_)。

A)運算

B)存儲

C)編程

D)編譯

84.[單選題]以下選項中,不是PythOn對文件的打開模式的是

A)w'

B)+'

Oc'

D)r'

85.[單選題]函數(shù)使用哪個關(guān)鍵字()o

A)fun

B)define

Odef

D)function

86.[單選題]下列哪一個不屬于云數(shù)據(jù)庫產(chǎn)品?()

A)本地安裝MySQL

B)阿里云RDS

C)Oracle

D)百度云數(shù)據(jù)庫

87.[單選題]以下C類繼承A類和B類的格式中,正確的是OO

A)classCA,B:

B)classC(A:B):

C)classC(A,B):

D)classCAandB:

88.[單選題]在HDFS中,默認一個塊多大?

A)64MB

B)32KB

C)128KB

D)16KB

89.[單選題]當前社會中,最為突出的大數(shù)據(jù)環(huán)境是

A)互聯(lián)網(wǎng)

B)物聯(lián)網(wǎng)

C)綜合國力

D)自然資源

90.[單選題]在進行回歸模型運行操作前,需要進行哪一步轉(zhuǎn)換操作?()

A)數(shù)值組裝

B)數(shù)值預測

C)模型訓練

D)求絕對值

91.[單選題]np.SWaPaXeS()函數(shù),需要傳入的參數(shù)是(_)。

A)數(shù)組維度

B)數(shù)組大小

C)一對軸編號

D)一個軸編號

92.[單選題]將從源數(shù)據(jù)源獲取的數(shù)據(jù)按照業(yè)務需求,轉(zhuǎn)換成目的數(shù)據(jù)源要求的形式,并對錯誤、不

一致的數(shù)據(jù)進行清洗和加工這一過程稱為(一)O

A)數(shù)據(jù)抽取

B)數(shù)據(jù)轉(zhuǎn)換

C)數(shù)據(jù)加載

D)數(shù)據(jù)存儲

93.[單選題]HBase依靠()存儲底層數(shù)據(jù)。

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

94.[單選題]閱讀下面PythOn代碼,選擇正確輸出結(jié)果:()deffun(x,y,z=10):

print("{}:{}:{}".format(x,y,z))fun(y=20,x=30)

A)20:30:10

B)O.43090277777778

C)30:20:10

D)報錯,缺少參數(shù)

95.[單選題]聚類算法的性能度量可稱為()。

A)密度估計

B)異常檢測

C)有效性指標

D)分布結(jié)構(gòu)

96.[單選題]面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務器等硬件.數(shù)據(jù)分析應用軟

件及技術(shù)運維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是()

A)大數(shù)據(jù)解決方案模式

B)大數(shù)據(jù)信息分類模式

C)大數(shù)據(jù)處理服務模式

D)大數(shù)據(jù)資源提供模式

97.[單選題]下面關(guān)于深度學習相關(guān)描述不正確的有(_)。

A)深度學習是一種特征學習方法

B)深度學習通過足夠多的簡單轉(zhuǎn)換函數(shù)及其組合方式來學習一個復雜的目標函數(shù)

C)深度學習的關(guān)鍵在于計算觀測書記的分層特征及其表示

D)ANN不是深度學習

98.[單選題]使用numpy.arange(0,11,2)表示的結(jié)果為?

A)[0,2,4,6,8]

B)[2,4,6,8,10]

O[0,2,4,6,8,10]

D)[0,2,4,6,8,10,12]

99.[單選題]執(zhí)行以下代碼段X=5x-=2x+=3**XPrint(X)時,輸出為()。

A)12

B)20

C)30

D)86

IOO.[單選題]在一些算法中,為了進行屬性之間的比較或運算,需要把不同屬性的不同變量取值范圍

變換成同一范圍,以免使得結(jié)果發(fā)生扭曲,偏向取值范圍大的變量。這一過程稱為()。

A)合并

B)數(shù)據(jù)聚合

C)歸一化

D)數(shù)據(jù)處理

101.[單選題]客戶端首次查詢HBaSe數(shù)據(jù)庫時,首先需要從哪個表開始查找()

A)METΛ

B)R00T

C)用戶表

D)信息表

102.[單選題]敏感信息核驗中不包含以下哪類信息的核驗:()

A)用戶實名制驗證

B)聯(lián)系人驗證

C)用戶上網(wǎng)行為驗證

D)通話交叉驗證

103.[單選題](一)是將HadoOP生態(tài)系統(tǒng)云化的一個組件。

A)Avro

B)HttPFSB

C)Mahout

D)Whirr

104.[單選題]專家系統(tǒng)的正向推理是以O作為出發(fā)點,按照一定的策略,應用知識庫中的知識

,推斷出結(jié)論的過程。

A)需要解決的問題

B)已知事實

C)證明結(jié)論

D)表示目標的謂詞或命題

105.[單選題]下面組件哪個是負布式資源調(diào)度與管理的:O

A)YARN

B)FIume

C)Zookeeper

D)Kafka

106.[單選題]下列哪個不屬于常用的文本分類的特征選擇算法?

A)卡方檢驗值

B)互信息

C)信息增益

D)主成分分析

107.[單選題]在多元線性回歸模型中,若某個解釋變量對其余解釋變量的判定系數(shù)接近于1,則表

明模型中存在()。

A)異方差

B)序列相關(guān)

C)多重共線性

D)高擬合優(yōu)度

108.[單選題]以下哪個不屬于數(shù)據(jù)治理內(nèi)容的是()。

A)理解自己的數(shù)據(jù)

B)行為規(guī)范的制定

C)崗位職責的定義

D)獲得更多的數(shù)據(jù)

109.[單選題]數(shù)據(jù)變換的策略包括()。

A)乎滑處理、特征構(gòu)造、聚集、標準化、離散化中

B)平滑處理、特征構(gòu)造、聚集、審計、離散化

C)乎滑處理、聚集、標準化、審計、離散化

D)特征構(gòu)造、聚集、標準化、審計、離散化

110.[單選題]以下哪個不是HDFS的進程()

A)SecondaryNode

B)NameNode

C)ResourceManager

D)DataNode

IlL[單選題]關(guān)于SeCOndaryNameNode哪項是正確?()

A)它是

B)它對內(nèi)存沒有要求

C)它的目的是幫助

D)SecondaryNameNode

112.[單選題]基于Bagging的集成學習代表算法有()。

A)Adaboost

B)GBDT

C)XGB00ST

D)隨機森林

113.[單選題]下面哪項是HadOOP的作者?O

A)Martin

B)Doug

C)Mark

D)Kent

114.[單選題]數(shù)據(jù)銷毀環(huán)節(jié)的安全技術(shù)措施有通過軟件或物理方式保障磁盤中存儲數(shù)據(jù)的(},不可

恢復,如數(shù)據(jù)銷毀軟件、硬盤消磁機、硬盤粉碎機等。

A)暫時隔離

B)暫時刪除

C)永久刪除

D)不做處理

115.[單選題]表示數(shù)據(jù)分布是否為對稱性的統(tǒng)計量是()。

A)方差

B)中位數(shù)

C)偏態(tài)

D)峰態(tài)

116.[單選題]執(zhí)行以下代碼段X=12deffl(a,b=x):print(a,b)x=15fl(4)時,輸出為

(一)o

A)154

B)415

0412

D)124

117.[單選題]大數(shù)據(jù)時代的一大特征是萬物互聯(lián)與融合,下列說法錯誤的是O0

A)人均入網(wǎng)設備增加

B)融入各個領域行業(yè)

C)個人信息安全問題凸顯

D)信息安全領域影響不大

118.[單選題]以下關(guān)于人機交互,描述錯誤的是:()

A)人機交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學科

B)人機交互界面通常是指用戶不可見的部分

C)系統(tǒng)可以是各種各樣的機器,也可以是計算機化的系統(tǒng)和軟件

D)用戶通過人機交互界面與系統(tǒng)交流,并進行操作

119.[單選題]下列關(guān)于智能物流的描述錯誤的是Oo

A)是利用智能化技術(shù),使物流技術(shù)能模仿人的智能,具有思維、感知、學習、推理判斷和自行解決

物流中某些問題的能力

B)實現(xiàn)物流資源優(yōu)化配置和有效調(diào)度,并且提示物流系統(tǒng)效率

C)智能物流概念源于2010年IBM發(fā)布的研究報告《智慧的未來供應鏈》

D)提高了物流活動的一體化,增加了物流的復雜性

120.[單選題]在訓練集上每學到一條規(guī)則,就將該規(guī)則覆蓋的訓練樣例去除,然后以剩下的訓練樣

例組成訓練集重復上述步驟。這個過程稱為(_)。

A)規(guī)則學習

B)直推學習

C)強化學習

D)序貫覆蓋

121.[單選題]()不是專門用于可視化時間空間數(shù)據(jù)的技術(shù)

A)等高線圖

B)餅圈

C)曲面圖

D)矢量場圈

122.[單選題]下列不是hadoop核心組件的是OO

A)JobTracker

B)TaskTracker

C)HDFS

D)Hbase

123.[單選題]如果使用RediS統(tǒng)計topN元素,可以使用哪些數(shù)據(jù)類型?

A)Set

B)List

C)Storedset

D)Hash

124.[單選題]HDFS中的block默認保存幾個備份。()

A)3份

B)2份

C)I份

D)不確定

125.[單選題]以下關(guān)于同步賦值語句描述錯誤的選項是:

A)同步賦值能夠使得賦值過程變得更簡潔

B)判斷多個單一賦值語句是否相關(guān)的方法是看其功能上是否相關(guān)或相同

C)設X,y表示一個點的坐標,則x=a;y=b兩條語句可以用x,y=a,b一條語句來賦值

D)多個無關(guān)的單一賦值語句組合成同步賦值語句,會提高程序可讀性

126.[單選題]下列關(guān)于HadoOPAPl的說法錯誤的是O

A)HadoOP的文件APl不是通用的,只用于HDFS文件系統(tǒng)

B)Configuration類的默認實例化方法是以HDFS系統(tǒng)的資源配置為基礎的

C)FiIeStatUS對象存儲文件和目錄的元數(shù)據(jù)

D)FSDatalnPUtStreanI是java.io.DatalnPUtStream的子類

127.[單選題]2015年,美國2150萬個社保賬號被黑客盜取。該事件反映出的問題是O0

A)大數(shù)據(jù)時代個人信息安全成為關(guān)注熱點

B)美國政府的信息安全技術(shù)水平低

C)黑客只對個人社保賬號感興趣

D)美國公民的信息安全意識普遍不高

128.[單選題]下面關(guān)于自定義視圖列的說法錯誤的是()。-

A)自定義列名稱的順序與AS后SELECT字段列表的順序一致

B)自定義列名稱的數(shù)量必須與SELECT字段列表的數(shù)量一致

C)自定義列名稱的視圖在操作數(shù)據(jù)時只能使用自定義的列名稱

D)以上說法都不正確

129.[單選題]BASE原則的含義不包括()

A)基本可用

B)柔性狀態(tài)

C)最終一致

D)基礎條件

130.[單選題]在深度學習中,我們經(jīng)常會遇到收斂到localminimum,下列不屬于解決

localminimum

問題的方法是()。

A)隨機梯度下降

B)設置Momentum

C)設置不同初始值

D)增大batchsize

131.[單選題]有N個樣本,一半用于訓練,一半用于測試。若增大N值,則訓練誤差和測試誤差之間

的差距會()

A)增大

B)減小

C)不確定

D)無變化

132.[單選題]下列哪個不是情感分析的應用場景?

A)數(shù)據(jù)挖掘

B)信息檢索

C)文本分詞

D)市場營銷

133.[單選題]下列關(guān)于鍵值數(shù)據(jù)庫的描述,哪一項是錯誤的:(D)

A)擴展性好,靈活性好

B)大量寫操作時性能高

C)無法存儲結(jié)構(gòu)化信息

D)條件查詢效率高

134.[單選題]下列能體現(xiàn)大數(shù)據(jù)思維的是()

A)大數(shù)據(jù)思維是要追求數(shù)據(jù)的精確性

B)大數(shù)據(jù)思維是要抓住樣本數(shù)據(jù)

C)大數(shù)據(jù)思維是要通過少量數(shù)據(jù)觀察數(shù)據(jù)間關(guān)系

D)大數(shù)據(jù)思維是要從自然思維轉(zhuǎn)變?yōu)橹悄芩季S

135.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,貸后預警處置,是基于O維度對目標客戶

的同一批次貸后預警信號一并處置,并非是基于信號維度,逐一對信號進行處置。

A)客戶

B)B.信號

Oc.支行

D)D.分行

136.[單選題]執(zhí)行以下代碼段defgreetuser(username):print("Hello,+username,title()

+"!")greet_user(jesse')時,輸出為(.)□

A)Hello!

B)jesse!

C)Hello,jesse!

D)Hello,Jesse!

137.[單選題]下列選項中優(yōu)先級級別最高的是()。-

A)~(按位取反)

B)^

C)&&

D)&

138.[單選題]下列選項中無法通過大數(shù)據(jù)技術(shù)實現(xiàn)的是?

A)商業(yè)模式發(fā)現(xiàn)

B)信用評估

C)商品推薦

D)運營分析

139.[單選題]以下關(guān)于HiVeSQL基本操作描述正確的是?

A)創(chuàng)建外部表必須要指定IOCatiOn信息

B)創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字

C)加載數(shù)據(jù)到HiVe時源數(shù)據(jù)必須是HDFS的一個路徑

D)創(chuàng)建表時可以指定列分割符

140.[單選題]留出法直接將數(shù)據(jù)集劃分為()個互斥的集合。

A)-

B)二

OS

D)四

141.[單選題]()是表示數(shù)據(jù)分布是否為對稱性的統(tǒng)計量。

A)方差

B)中位數(shù)

C)偏態(tài)

D)峰態(tài)

142.[單選題]數(shù)據(jù)可視化的方法論基礎是()。

A)統(tǒng)計圖表

B)視覺編碼

C)圖論

D)圖形符號學

143.[單選題]RDD中的數(shù)據(jù)被()在集群中,使得任務可以并行執(zhí)行。

A)順序存儲

B)連續(xù)存儲

C)分塊存儲

D)分區(qū)存儲

144.[單選題]硬件故障被認為是常態(tài),為了解決這個問題,HDFS設計了副本機制,默認情況下,一

份文件,HDFS會存放()份。

A)3

B)5

02

D)l

145.[單選題]泛在電力物聯(lián)網(wǎng)系統(tǒng)建設必須嚴格遵循公司統(tǒng)一的O數(shù)據(jù)模型和數(shù)據(jù)、采集、定義

、編碼、應用等標準,確保數(shù)據(jù)共享。

A)E-R模型

B)SG-ClM模型

C)IMS模型

D)DBTG模型

146.[單選題]下面描述錯誤的是:()

A)“探針盒子”就是一款自動收集用戶隱私的產(chǎn)品

B)許多顧客在使用WiFi之后會收到大量的廣告信息,甚至自己的手機號碼也會被當做信息進行多次

買賣

C)在免費上網(wǎng)的背后,其實也存在著不小的信息安全風險,或許一不小心,就落入了電腦黑客們設

計的WiFi陷阱之中

D)免費WlFl都是安全的,可以放心使用

147.[單選題]配置HadooP時,JAVAJ40ME包含在()配置文件中

A)hadoop-default.xml

B)hadoop-env.sh

C)hadoop-site.xml

D)configuration,xs

148.[單選題]下述O不是人工智能中常用的知識格式化表示方法。

A)框架表示法

B)狀態(tài)空間表示法

C)語義網(wǎng)絡表示法

D)形象描寫表示法

149.[單選題]當用戶選擇的列是集合數(shù)據(jù)類型時,HiVe會使用()格式應用于輸出

A)string

B)map

C)json

D)list

150.[單選題]部署HiVe時元數(shù)據(jù)信息通常存在哪個數(shù)據(jù)庫中

A)SqlServer

B)HBase

OMySql

D)OracleRAC

151.[單選題]()是從總體N個單位中隨機地抽取n個單位作為樣本的抽樣方法。每個單位被抽中的概

率是相等的,屬于“等概率抽樣”。

A)方便抽樣

B)分層抽樣

C)整群抽樣

D)簡單隨機抽樣

152.[單選題]下列哪些不是HBase的特點()

A)高可靠性

B)高性能

C)面向列

D)緊密性

153.[單選題]以下哪個選項不能做為Kafka的ConSUmer?

A)Hadoop

B)Real-timeMonitoring

C)FrontEnd

D)DataWarehouse

154.[單選題]下面回歸模型中的哪個步驟/假設最能影響過擬合和欠擬合之間的平衡因素()

A)多項式的階數(shù)

B)是否通過矩陣求逆或梯度下降學習權(quán)重

C)使用常數(shù)項

D)使用正則化

155.[單選題]根據(jù)《承德銀行大數(shù)據(jù)貸后風險預警信號管理辦法(試行)》,承德轄區(qū)支行的紅色

級信號,支行管戶客戶經(jīng)理應在接收到系統(tǒng)所推送信號當日立即聯(lián)系客戶開展預警信號風險核實工

作,限期O個工作日內(nèi)制定出針對性的處置措施

A)l

B)B.3

C)C.5

D)D.10

156.[單選題]下面不屬于數(shù)據(jù)科學家的主要職責有(_)。

A)制定“數(shù)據(jù)戰(zhàn)略”

B)研發(fā)“數(shù)據(jù)產(chǎn)品”

C)模擬“數(shù)據(jù)學習”

D)構(gòu)建“數(shù)據(jù)生態(tài)系統(tǒng)”

157.[單選題]一切以數(shù)據(jù)作為驅(qū)動或者核心的產(chǎn)品叫做O

A)創(chuàng)新性產(chǎn)品

B)數(shù)據(jù)產(chǎn)品

C)風控產(chǎn)品

D)核心產(chǎn)品

158.[單選題]查找條件為:姓名為NULL的記錄()

A)WHERENAMENULL

B)?WHERENAMEISNULL

OWHERENAME=NULL

D)?WHERENAME==NULL

159.[單選題]大數(shù)據(jù)的O體現(xiàn)在大數(shù)據(jù)是基于互聯(lián)網(wǎng)的實時動態(tài)數(shù)據(jù),而不是歷史的或嚴格控制

環(huán)境下產(chǎn)生的內(nèi)容

A)社會性

B)廣泛性

C)公開性

D)動態(tài)性

160.[單選題]感知機只有(_)神經(jīng)元進行激活函數(shù)處理,即只擁有一層功能神經(jīng)元。

A)輸入層

B)輸出層

C)第一層

D)第二層

161.[單選題]大數(shù)據(jù)元年是指Oo

A)2012年

B)2011年

C)2013年

D)2010年

162.[單選題]關(guān)于批量數(shù)據(jù)處理組件的描述不正確的是?

A)HiVe:傳統(tǒng)SQL批處理引擎,用于處理SQL類批處理作業(yè),使用廣泛海量數(shù)據(jù)下表現(xiàn)穩(wěn)定,但是處理

速度較慢。

B)SParkSQL:新型SSQL批處理引擎,用于處理SQL類批處理作業(yè),適合海量數(shù)據(jù),處理速度高效。

OSpark:新型批處理引擎,可以用于處理非SQL類,尤其是數(shù)據(jù)挖掘和機器學習類批處理作業(yè),適

合海量數(shù)據(jù),處理速度高效。

D)MaPRedUCer傳統(tǒng)批處理引整用于處理非SoL類,尤其是數(shù)據(jù)挖掘和機器學習類批處理作業(yè),使用廣

泛,海量數(shù)據(jù)下表現(xiàn)不穩(wěn)定,但是處理速度較快。

163.[單選題]以下對于離線批處理的概念理解錯誤的是哪一項?

A)離線批處理針對的數(shù)據(jù)量較大

B)離線批處理占用的內(nèi)存資源較多。

C)齋線批收處理對數(shù)據(jù)處理的時延要求不高。

D)離線批處理通常MR作業(yè),SPark作業(yè)或者HQL作業(yè)實現(xiàn)。

164.[單選題]多分類圖像識別任務一般采用什么編碼方式作為輸出。O

A)二進制編碼

B)One-hot編碼

C)霍夫曼編碼

D)曼切斯特編碼

165.[單選題]Flume傳輸數(shù)據(jù)過程中,為了防止數(shù)據(jù)不丟失,使用的ChanneI類型是?

A)MemoryChannel

B)FileChanne

C)JDBCChanne

D)HDESChannel

166.[單選題]以下描述中不正確的是(—)。

A)若欲預測的是離散值,則此學習任務稱為分類

B)若預測的是連續(xù)值,則此類學習任務稱為回歸

C)學得的模型適用于新樣本的能力,稱訓練能力

D)從數(shù)據(jù)中學得模型的過程稱為學習

167.[單選題]對于ElaStiCSearch描述不正確的是?

A)對LUCene進行了擴展

B)不支持結(jié)構(gòu)化數(shù)據(jù)存儲

C)能夠水平擴展

D)基于LUCene的全文檢素服務

168.[單選題]下面不屬于詞袋模型的缺點的是?

A)詞匯表的詞匯需要經(jīng)過精心設計

B)表示具有稀疏性

C)丟失詞序忽略了上下文

D)模型復雜,不利于實施

169.[單選題]大數(shù)據(jù)計算服務(MaxCompute,原ODPS)圖計算框架再計算過程中通過對圖進行編輯

、演化最終求解出結(jié)果,在計算過程中用戶可以對圖進行()編輯操作。

A)增加邊

B)刪除點

C)修改邊的權(quán)值

D)增加點

170.[單選題]sciPy中模塊StatS的作用是什么?

A)統(tǒng)計

B)差值計算

C)程序輸入輸出

D)稀疏矩陣

171.[單選題]數(shù)據(jù)倉庫的最終目的是()

A)收集業(yè)務需求

B)建立數(shù)據(jù)倉庫邏輯模型

C)開發(fā)數(shù)據(jù)的應用分析

D)為用戶和業(yè)務部門提供決策支持

172.[單選題]運營人員為了搞促銷,需要找出目標客戶名單,這批客戶的信息存儲在大數(shù)據(jù)計算服

務(MaxCompute,原ODPS)的USer表中,并且用戶名字段USername中包含"vip"字樣,通過執(zhí)行

SQL語句()可以找出這批客戶。

A)select*fromuserwhereusernamecontains('vip')

B)select*fromuserwhereusername=,vip,

C)select*fromuserwhereusernamelike'*vip*'

D)select*fromuserwhereusernamelike,%vip%,

173.[單選題]Apriori算法的核心思想是()

A)通過頻繁項集生成和情節(jié)的向下封閉檢測兩個階段來挖掘候選集

B)通過候選集生成和情節(jié)的向下封閉檢測兩個階段來挖掘頻繁項集

C)數(shù)據(jù)集中包含該項集的數(shù)據(jù)所占數(shù)據(jù)集的比例,度量一個集合在原始數(shù)據(jù)中出現(xiàn)的頻率

D)若某條規(guī)則不滿足最小置信度要求,則該規(guī)則的所有子集也不滿足最小置信皮要求

174.[單選題]下列選項中,用于刪除缺失值的方法是()

A)isnull()

B)delete()

C)dropna()

D)fiIlnaO

175.[單選題]以下Python代碼運行結(jié)果為()。$;$defSUm(a,b=3,c=5):$;$returnsum(La,

b,c])$;Sprint(Sum(a=8,c=2))$;$print(Sum(8))$;$print(Sum(8,2))

A)13,16,15

B)10,8,10

C)13,8,10

D)10,16,10

176.[單選題]F1參數(shù)的大小反映了模型的(_)。

A)準確度

B)誤差

C)穩(wěn)定性

D)偏差

177.[單選題]下列說法錯誤的是()

A)大數(shù)據(jù),不僅是以此技術(shù)革命,同時也是以此思想革命。

B)舍恩伯格指出大數(shù)據(jù)時代最大的轉(zhuǎn)變就是思維方式的轉(zhuǎn)變。

C)并非所有的規(guī)律都可以用簡單的原理來描述。

D)世界的一切都是可知的,都可以用簡單的原理、公式描述出來。

178.[單選題]將基礎設施作為服務的云計算服務類型是()

A)IaaS

B)SaaS

OPaaS

D)三個選項都是

179.[單選題]()是二維隨機變量的分布。

A)正態(tài)分布

B)二項分布

C)邊緣分布

D)指數(shù)分布

180.[單選題]大數(shù)據(jù)的基本特征不包括()。

A)數(shù)據(jù)量大

B)據(jù)類型繁多

C)處理速度快

D)價值密度高

181.[單選題]以下不屬于大數(shù)據(jù)重要意義的是()。

A)大數(shù)據(jù)成為推動經(jīng)濟轉(zhuǎn)型發(fā)展的新動力

B)大數(shù)據(jù)成為重塑國家競爭優(yōu)勢的新機遇

C)大數(shù)據(jù)成為提升政府治理能力的新途徑

D)大數(shù)據(jù)會增加經(jīng)濟發(fā)展的成本

182.[單選題]根據(jù)泛在電力物聯(lián)網(wǎng)建設戰(zhàn)略安排,第一個階段是到O年,初步建成泛在電力物聯(lián)

網(wǎng)。

A)2020

B)2021

02024

D)2025

183.[單選題]長短時記憶神經(jīng)網(wǎng)絡通過什么來緩解梯度消失問題?

A)增加網(wǎng)絡深度

B)減少網(wǎng)絡神經(jīng)元

C)使用雙向的網(wǎng)絡結(jié)構(gòu)

D)增加一個用來保存長期狀態(tài)的單元

184.[單選題]下列關(guān)于常見的動作(ACtion)和轉(zhuǎn)換(TranSformation)操作的APl解釋錯誤的是(

A)filter(func):篩選出滿足函數(shù)func的元素,并返回一個新的數(shù)據(jù)集

B)map(func):將每個元素傳遞到函數(shù)func中,并將結(jié)果返回為一個新的數(shù)據(jù)集

OcountO:返回數(shù)據(jù)集中的元素個數(shù)

D)take(n):返回數(shù)據(jù)集中的第n個元素

185.[單選題]假設在龐大的數(shù)據(jù)集上使用LogiStiC回歸模型,可能遇到一個問題,Logistic回歸需

要很長時間才能訓練,如果對相同的數(shù)據(jù)進行邏輯回歸,則花費更少的時間,并給出比較相似的精度的

方法是()。

A)降低學習率,減少選代次數(shù)

B)降低學習率,增加迭代次數(shù)

C)提高學習率,增加迭代次數(shù)

D)增加學習率,減少迭代次數(shù)

186.[單選題]Spark的默認存儲級別()

A)MEMORYj)NLY

B)MEMORYJ)NLYSER

C)MEMoRY_AND_DlSK

D)MEMORY_AND_DISK_SER

187.[單選題]下列選項中那些是HadooP2.x版本獨有的進程()

A)JobTracker

B)TaskTracker

C)NodeManager

D)NameNode

188.[單選題.]HadoopL0中,HadOOP內(nèi)核的主要組成是()

A)HDFS和MaPRedUCe

B)HDFS和Yarn

C)Yarn

D)MaPRedUCe和Yarn

189.[單選題]下列關(guān)于文本分類的說法不正確的是()o

A)文本分類是指按照預先定義的主題類別,由計算機自動地為文檔集合中的每個文檔確定一個類別

B)文本分類系統(tǒng)大致可分為基于知識工程的分類系統(tǒng)和基于機器學習的分類革統(tǒng)

C)文本的向量形式一般基于祠袋模型構(gòu)建,該模型考慮了文本詞語的行文順序

D)構(gòu)建立本的向量形式可以歸結(jié)為文本的特征選擇與特征權(quán)重計算兩個步驟

190.[單選題]下列關(guān)于網(wǎng)絡用戶行為的說法中,錯誤的是()

A)網(wǎng)絡公司能夠捕捉到用戶在其網(wǎng)站上的所有行為

B)用戶離散的交互痕跡能夠為企業(yè)提升服務質(zhì)量提供參考

C)數(shù)字軌跡用完即自動刪除

D)用戶的隱私安全很難得以規(guī)范保護

191.[單選題]Hadoop生態(tài)系統(tǒng)中,(—_)主要解決的是日志類數(shù)據(jù)的收集和處理問題。

A)Mahout

B)Flume

C)Sqoop

D)HBase

192.[單選題]專家系統(tǒng)的推理機的最基本的方式是O0

A)直接推理與間接推理

B)正向推理與反向推理

C)邏輯推理與非邏輯推理

D)準確推理與模糊推理

193.[單選題]O是大數(shù)據(jù)審計技術(shù)發(fā)展的最強大動力

A)人才培養(yǎng)

B)科技發(fā)展

C)制度建設

D)審計方式轉(zhuǎn)變

194.[單選題]數(shù)據(jù)管理成熟度模型--DMM將一個機構(gòu)的數(shù)據(jù)管理工作抽象成6個關(guān)鍵過程域,即

數(shù)據(jù)戰(zhàn)略、()、數(shù)據(jù)質(zhì)量、平臺與架構(gòu)、數(shù)據(jù)操作以及輔助性過程。

A)數(shù)據(jù)管理

B)數(shù)據(jù)治理

C)數(shù)據(jù)策略

D)數(shù)據(jù)安全

195.[單選題]()先對數(shù)據(jù)集進行特征選擇,然后再訓練學習器

A)過濾式選擇

B)包裹式選擇

C)稀疏表示

D)嵌入式選擇

196.[單選題]美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風

與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A)在數(shù)據(jù)基礎上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B)在分析方法上更注重相關(guān)分析而不是因果分析

C)在分析效果上更追究效率而不是絕對精確

D)在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)

197.[單選題]創(chuàng)建Loader作業(yè)中,可以在以下哪個步驟中設置過濾器類型?

A)輸入設置

B)轉(zhuǎn)換

C)基本信息

D)輸出

198.[單選題]HDFS默認的一個塊大小是()。

A)64MB

B)8KB

C)32KB

D)16KB

199.[單選題]下列關(guān)于MaPRedUCe工作流程,哪個描述是正確的?

A)所有的數(shù)據(jù)交換都是通過MaPRedUCe框架自身去實現(xiàn)的

B)不同的MaP任務之間會進行通信

C)不同的RedUCe任務之間可以發(fā)生信息交換

D)用戶可以顯式地從一臺機器向另一臺機器發(fā)送消息

200.[單選題]()是指通過訓練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使

圖像識別技術(shù)能夠得到高識別率。

A)預處理

B)特征抽取和選擇

C)分類器設計

D)分類決策

201.[單選題]以下哪個組件可以指定對key進行RedUCe分發(fā)的策略?

A)RecordReader

B)Combiner

C)Partitioner

D)FiIeInputFormat

202.[單選題]人工智能的目的是讓機器能夠O,以實現(xiàn)某些腦力勞動的機械化。

A)具有智能

B)與人一樣工作

C)完全代替人的大腦

D)模擬、延伸與擴展人的智能

203.[單選題]下面關(guān)于機器學習和數(shù)據(jù)挖掘的描述錯誤的是:()

A)機器學習是一門多領域交叉學科,涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多

門學科

B)數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。

C)數(shù)據(jù)挖掘可以視為機器學習與數(shù)據(jù)庫的交叉

D)數(shù)據(jù)挖掘是機器學習的底層技術(shù)

204.[單選題]在用戶驗證權(quán)限時,應當在“服務列表”中選擇數(shù)據(jù)復制服務,進入DRS主界面,單擊

右上角(),嘗試購創(chuàng)建遷移任務。

A)修改遷移任務

B)創(chuàng)建遷移任務

C)查閱權(quán)限

D)刪除遷移任務

205.[單選題]商業(yè)秘密數(shù)據(jù)脫離本單位(含網(wǎng)絡、信息系統(tǒng)及各種介質(zhì))環(huán)境須經(jīng)O業(yè)務主管部

門和保密部門審批。

A)公司部門級及以上單位

B)市級及以上單位

C)省級及以上單位

D)國家級單位

206.[單選題]智慧城市的構(gòu)建,不包含()。

A)數(shù)字城市

B)物聯(lián)網(wǎng)

C)聯(lián)網(wǎng)監(jiān)控

D)云計算

207.[單選題]現(xiàn)有如下兩個HiVe表,使用如下哪條語句可以得到以下結(jié)果:O

?)selectfromstudentjoinscoreonstudent,id=score,id;

B)selectfromstudentleftjoinscoreonstudent,id=score,id;

C)selectfromstudentrightjoinscoreonstudent,id=score,id;

D)selectfromstudentfulljoinscoreonstudent,id=score,id;

208.[單選題]已知初始問題的描述,通過一系列變換把此問題最終變?yōu)橐粋€子問題集合;這些子問題

的解可以直接得到,從而解決了初始問題。這是知識表示法叫O

A)狀態(tài)空間法

B)問題歸約法

C)謂詞邏輯法

D)語義網(wǎng)絡法

209.[單選題]下面不屬于數(shù)據(jù)科學主要研究內(nèi)容的有(_)。

A)基礎理論

B)數(shù)據(jù)管理

C)數(shù)據(jù)分析

D)數(shù)據(jù)商務

210.[單選題]關(guān)于數(shù)據(jù)分析,下列說法正確的是()。

A)描述性分析和預測性分析是診斷性分析的基礎

B)診斷性分析是對規(guī)范性分析的進一步理解

C)預測性分析是規(guī)范性分析的基礎

D)規(guī)范性分析是數(shù)據(jù)分析的最高階段,可以直接產(chǎn)生產(chǎn)業(yè)價值

211.[單選題]SciPy通常與()同時使用。

A)Pandas

B)Scikit-learn

C)Numpy

D)Jieba

212.[單選題]Hadoop框架是用下面()語言寫的。

A)Pytyon

B)Java

OC++

D)Scala

213.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,系統(tǒng)在【大數(shù)據(jù)貸后預警處置】菜單下設置

【待處置】、【處置中】等4個節(jié)點。其中,用戶在()節(jié)點可查看已提交審批且流程尚未走完的客

戶預警信號詳情、關(guān)注其貸后預警審批狀態(tài)等。

A)待處置

B)B.處置中

C)C.退回

D)D.處置完成

214.[單選題]HBase依靠。存儲底層數(shù)據(jù)

A)HDFS

B)Hadoop

C)Memory

D)MapReduce

215.[單選題](_)度量了同樣大小的訓練集的變動所導致的學習性能的變化。

A)偏差

B)方差

C)均方差

D)泛化誤差

216.[單選題]DataX是阿里集團發(fā)起的開源項目,是一種離線數(shù)據(jù)同步的工具,支持多種異構(gòu)數(shù)據(jù)源

之間的高效數(shù)據(jù)同步。DataX任務配置文件使用()文件格式。

A)java

B)bson

C)xml

D)json

217.[單選題]下列可以作為文本分類準則的是()。

A)預測準確率

B)魯棒性

C)可擴展性

D)以上都對

218.[單選題]在頁面中看不見的表單元素是()。

A)<inputtype="password"><∕input>

B)<inputtype="radio"></input>

C)<inputtype="hidden"><∕input>

D)<inputtype="reset"></input>

219.[單選題]如果需要從MaXCOmPUte同步一張表到ADS,則該表的訪問權(quán)限需要授予MaXComPUte中的

()用戶。

A)aliyun$guradabuild@aliyun.com

B)aliyun$gurada_data@aliyun.com

OaliyunSguradaads@aliyun.com

D)aliyun$ads_data@aliyun.com

220.[單選題]關(guān)于數(shù)據(jù)服務中,app說法正確的是:()。

A)一個用戶只能創(chuàng)建一個APP

B)一個APP只能申請一個API的權(quán)限

C)一個用戶可以創(chuàng)建多個APP,一個APP可以申請多個APl的權(quán)限

D)一個APl只能被一個APP使用

221.[單選題]下列選項哪一個不屬于HlVE的工作內(nèi)容?

A)表結(jié)構(gòu)元數(shù)據(jù)管理

B)HQL語句命令解析

C)分布式文件底層數(shù)據(jù)管理

D)數(shù)據(jù)結(jié)構(gòu)以及函數(shù)的定義

222.[單選題]更新數(shù)據(jù)表中的記錄用以下哪一項()

A)DELETE

B)ALTRE

C)UPDATE

D)SELECT

223.[單選題]以下不屬于推斷統(tǒng)計的是(一)。

A)參數(shù)估計

B)關(guān)聯(lián)預測

C)假設檢驗

D)采樣分布

224.[單選題]Numpy是(_)的簡寫。

A)NumericalPython

B)Numericpython

ONumericalforPython

D)Numericofpython

225.[單選題]Sigmoid函數(shù)作為神經(jīng)元激活函數(shù)的特點是()

A)連續(xù)但不光滑

B)不連續(xù)但尤滑

C)連續(xù)且光滑

D)不連續(xù)且不光滑

226.[單選題]根據(jù)《大數(shù)據(jù)風控平臺項目操作手冊》,財務智能分析中的財務指標趨勢分析模塊

,O部分描述頁面右側(cè)表格中有所異動、大幅異動的重點財務指標數(shù)值、增額、增幅情況,描述

的文字內(nèi)容隨表格內(nèi)容變動而變動。

A)表格

B)B.圖表

OC.文字

D)D.以上都不對

227.[單選題]谷歌采用搜索引擎大數(shù)據(jù)進行流感趨勢預測,體現(xiàn)了哪種大數(shù)據(jù)思維方式()

A)我為人人,人人為我

B)全樣而非抽樣

C)效率而非精確

D)相關(guān)而非因果

228.[單選題]LSM含義是?

A)日志結(jié)構(gòu)合并樹

B)二叉樹

C)平衡二叉樹

D)基于日志結(jié)構(gòu)的合并樹

229.[單選題IFusionInsightHD系統(tǒng)中執(zhí)行HBaSe些數(shù)據(jù)是,數(shù)據(jù)被寫入內(nèi)存MemStore,日志HLOg和

HDP中,請問那一步寫入成功后才會最終返回客戶端寫數(shù)據(jù)成功?

A)Memstore

B)HLog

OHDFS

D)Memory

230.[單選題]k近鄰學習是一種(_)方法。

A)監(jiān)督學習方法

B)半監(jiān)督學習方法

C)無監(jiān)督學習方法

D)測試方法

231.[單選題]下面哪個程序負責HDFS數(shù)據(jù)存儲O

A)NameNode

B)Jobtracker

C)Datanode

D)SecondaryNameNode

232.[單選題]()不屬于特征選擇的標準方法。

A)散入

B)過濾

C)包裹

D)抽樣

233.[單選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論