大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)_第1頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)_第2頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)_第3頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)_第4頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷71)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共54題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.HBase的物理存儲(chǔ)單元是什么?A)RegionB)ColumnfamilC)ColumnD)Row答案:B解析:[單選題]2.在MapReduce中,reduce()函數(shù)可以將()值相同的輸入進(jìn)行合并處理。A)inputB)keyC)va1ueD)number答案:B解析:[單選題]3.大數(shù)據(jù)安全核心技術(shù)研發(fā)是我國(guó)大數(shù)據(jù)產(chǎn)業(yè)自主發(fā)展的關(guān)鍵驅(qū)動(dòng),其中不包括()。A)數(shù)據(jù)加密B)數(shù)據(jù)完整性驗(yàn)證C)網(wǎng)絡(luò)安全保護(hù)D)大數(shù)據(jù)管理制度答案:D解析:[單選題]4.公共云計(jì)算上分析型數(shù)據(jù)庫(kù)的用戶創(chuàng)建數(shù)據(jù)庫(kù)的方式為:()。A)直接通過CREATEDATABASE的DDL語(yǔ)句創(chuàng)建數(shù)據(jù)庫(kù)B)直接通過CREATEDATABASE的DML語(yǔ)句創(chuàng)建數(shù)據(jù)庫(kù)C)直接通過CREATETABLE的DDL語(yǔ)句創(chuàng)建數(shù)據(jù)庫(kù)D)只能通過DMS控制臺(tái)界面來創(chuàng)建需要的業(yè)務(wù)數(shù)據(jù)庫(kù)答案:D解析:[單選題]5.下列描述中不屬于規(guī)整數(shù)據(jù)(TidyData)三個(gè)基本原則的是()。A)每一類觀察單元構(gòu)成一個(gè)關(guān)系(表)B)每個(gè)觀察占且僅占一行C)每個(gè)變量占且僅占一列D)每個(gè)觀察占且僅占一個(gè)關(guān)系(表)答案:D解析:tidyData原則為每列代表一個(gè)單獨(dú)變量、每行代表單個(gè)觀察值、每種觀察形成一個(gè)表格。[單選題]6.基礎(chǔ)IT資源的管理部分屬于()A)IAASB)PAASC)SAASD)以上都不是答案:A解析:[單選題]7.對(duì)于GaussDB200的數(shù)據(jù)并行導(dǎo)入策略Normal,下列說法錯(cuò)誤的是()?A)通過GDS服務(wù)的方式實(shí)現(xiàn)數(shù)據(jù)并行導(dǎo)入。B)導(dǎo)入的效率和GDS服務(wù)器有關(guān),GDS服務(wù)器越多,導(dǎo)入效率越快。C)數(shù)據(jù)導(dǎo)入時(shí),支持單行數(shù)據(jù)大小小于1GB.D)能夠?qū)?shù)據(jù)庫(kù)的數(shù)據(jù).表結(jié)構(gòu)都導(dǎo)入。答案:C解析:[單選題]8.HBase只有一個(gè)針對(duì)行健的索引,如果要訪問HBase表中的行,下面哪種方式是不可行的?A)通過單個(gè)行健訪問B)通過時(shí)間戳訪問C)通過一個(gè)行健的區(qū)間來訪問D)全表掃描答案:B解析:[單選題]9.在深度學(xué)習(xí)中,我們經(jīng)常會(huì)遇到收斂到localminimum,下列不屬于解決localminimum問題的方法是()。A)隨機(jī)梯度下降B)設(shè)置MomentumC)設(shè)置不同初始值D)增大batchsize答案:D解析:增大batchsize無法解決localminimum問題。[單選題]10.圖靈獎(jiǎng)獲得者JimGray提出的"科學(xué)研究第四范式"的全稱為()。A)數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)B)以數(shù)據(jù)為中心的科學(xué)發(fā)現(xiàn),C)數(shù)據(jù)驅(qū)動(dòng)型的科學(xué)發(fā)現(xiàn)D)大數(shù)據(jù)科學(xué)研究答案:A解析:2007年,圖靈獎(jiǎng)獲得者JimGray提出了科學(xué)研究的第四范式--數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(Data-intensiveScientificDiscovery)。在他看來,人類科學(xué)研究活動(dòng)已經(jīng)歷過三種不同范式的演變過程(原始社會(huì)的"實(shí)驗(yàn)科學(xué)范式"、以模型和歸納為特征的"理論科學(xué)范式"和以模擬仿真為特征的"計(jì)算科學(xué)范式"),目前正在從"計(jì)算科學(xué)范式"轉(zhuǎn)向"數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式"。[單選題]11.企業(yè)中臺(tái)是一種實(shí)現(xiàn)公司核心資源共享化、服務(wù)化的理念和模式,從管理視角上強(qiáng)調(diào)(),從技術(shù)視角上強(qiáng)調(diào)()。A)服務(wù)化、企業(yè)級(jí)B)企業(yè)級(jí)、服務(wù)化C)共享化、服務(wù)化D)服務(wù)化、共享化答案:B解析:[單選題]12.大數(shù)據(jù)涌現(xiàn)現(xiàn)象的形式有多種,不屬于大數(shù)據(jù)涌現(xiàn)形式的是()。A)價(jià)值涌現(xiàn)B)隱私涌現(xiàn)C)物質(zhì)涌現(xiàn)D)質(zhì)量涌現(xiàn)答案:C解析:[單選題]13.傳統(tǒng)RNN有什么特別大的弊端?A)無法進(jìn)行長(zhǎng)久記憶B)精度太低C)速度太慢D)效果太差答案:A解析:[單選題]14.在Hadoop的分區(qū)階段,默認(rèn)的Partitioner是()。A)RangePartitionerB)PartitionerC)HashPartitionerD)用戶自定義的Partitioner答案:C解析:Hadoop中默認(rèn)的Partitioner是HashPartitioner。[單選題]15.在用戶驗(yàn)證權(quán)限時(shí),應(yīng)當(dāng)在?服務(wù)列表?中選擇數(shù)據(jù)復(fù)制服務(wù),進(jìn)入DRS主界面,單擊右上角(),嘗試購(gòu)創(chuàng)建遷移任務(wù)。A)修改遷移任務(wù)B)創(chuàng)建遷移任務(wù)C)查閱權(quán)限D(zhuǎn))刪除遷移任務(wù)答案:B解析:[單選題]16.關(guān)于?三型兩網(wǎng)?,以下()說法不正確:A)中國(guó)堅(jiān)強(qiáng)智能電網(wǎng)建設(shè)已經(jīng)走在世界前列,泛在電力物聯(lián)網(wǎng)的建設(shè)也走在前列。B)泛在電力物聯(lián)網(wǎng)從概念上講,就是圍繞電力系統(tǒng)各環(huán)節(jié),充分應(yīng)用移動(dòng)互聯(lián)、人工智能等現(xiàn)代信息技術(shù)、先進(jìn)通信技術(shù),實(shí)現(xiàn)電力系統(tǒng)各個(gè)環(huán)節(jié)萬(wàn)物互聯(lián)、人機(jī)交互,具有狀態(tài)全面感知、信息高效處理、應(yīng)用便捷靈活特征的智慧服務(wù)系統(tǒng)。C)泛在電力物聯(lián)網(wǎng)包含感知層、網(wǎng)絡(luò)層、平臺(tái)層、應(yīng)用層四層結(jié)構(gòu)。D)堅(jiān)強(qiáng)智能電網(wǎng)和泛在電力物聯(lián)網(wǎng),二者相輔相成、融合發(fā)展,形成強(qiáng)大的價(jià)值創(chuàng)造平臺(tái),共同構(gòu)成能源流、業(yè)務(wù)流、數(shù)據(jù)流?三流合一?的能源互聯(lián)網(wǎng)。答案:A解析:[單選題]17.采用多副本冗余存儲(chǔ)的優(yōu)勢(shì)不包含()。A)保證數(shù)據(jù)可靠性B)容易檢查數(shù)據(jù)錯(cuò)誤C)加快數(shù)據(jù)傳輸速度D)節(jié)約存儲(chǔ)空間答案:D解析:[單選題]18.下列選項(xiàng)中,關(guān)于HBase特性描述不正確的一項(xiàng)是()。A)高可靠性B)高性能C)面向行D)可伸縮答案:C解析:[單選題]19.以下哪項(xiàng)不屬于大數(shù)據(jù)在城市管理中的應(yīng)用:()A)智能交通B)環(huán)保監(jiān)測(cè)C)城市規(guī)劃D)比賽預(yù)測(cè)答案:D解析:[單選題]20.()負(fù)責(zé)MapReduce任務(wù)調(diào)度。A)NameNodeB)JobtrackerC)TaskTrackerD)SecondaryNameNode答案:B解析:[單選題]21.()是指理解挖掘項(xiàng)目的目標(biāo)業(yè)務(wù)需求。A)業(yè)務(wù)理解B)數(shù)據(jù)理解C)數(shù)據(jù)準(zhǔn)備D)數(shù)據(jù)建模答案:A解析:根據(jù)跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程(cross-industrystandardprocessfordatamining,CRISP-DM)模型,業(yè)務(wù)理解是指從業(yè)務(wù)的角度了解項(xiàng)目的要求和最終目的,并將這些目的與數(shù)據(jù)挖掘的定義以及結(jié)果結(jié)合起來。[單選題]22.下面這段代碼的作用是什么?A)創(chuàng)建索引B)刪除索引C)維護(hù)親引D)更新索引答案:A解析:[單選題]23.當(dāng)我們需要在一張圖表中加上文字標(biāo)注達(dá)到提醒讀者的目的時(shí),需要用到()函數(shù)。A)plt.axvspan()B)plt.axhspan()C)plt.annotate()D)plt.text()答案:D解析:文字標(biāo)注是text()函數(shù)。[單選題]24.什么是KDD?A)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)B)領(lǐng)域知識(shí)發(fā)現(xiàn)C)文檔知識(shí)發(fā)現(xiàn)D)動(dòng)態(tài)知識(shí)發(fā)現(xiàn)答案:A解析:[單選題]25.以下哪些選項(xiàng)屬于實(shí)時(shí)檢索的特點(diǎn)?A)處理時(shí)間要求不高B)全文檢素功能C)高并發(fā)D)查詢響應(yīng)要求較高答案:D解析:[單選題]26.卷積神經(jīng)網(wǎng)絡(luò)(CNN)中Dropout層的作用是A)加快收斂速度B)防止過擬合C)豐富訓(xùn)練樣本D)增強(qiáng)正樣本答案:B解析:[單選題]27.對(duì)于信息增益,決策樹分裂節(jié)點(diǎn),下面說法正確的是()1純度高的節(jié)點(diǎn)需要更多的信息去區(qū)分2信息增益可以用?1比特-熵?獲得3如果選擇一個(gè)屬性具有許多歸類值,那么這個(gè)信息增益是有偏差的A)1B)2C)2和3D)所有以上答案:C解析:[單選題]28.()算法假設(shè)聚類結(jié)構(gòu)能通過樣本分布的緊密程度確定。A)原型聚類B)密度聚類C)層次聚類D)模型聚類答案:B解析:[單選題]29.以下關(guān)布式文件系統(tǒng),描述錯(cuò)誤的是:()A)是一種通過網(wǎng)絡(luò)實(shí)現(xiàn)文件在多臺(tái)主機(jī)上進(jìn)布式存儲(chǔ)的文件系統(tǒng)B)所有布式文件系統(tǒng)的設(shè)計(jì)都是采用?客戶機(jī)/服務(wù)器?(Client/server)模式C)谷歌開發(fā)布式文件系統(tǒng)GFSD)Hadoop布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)是針對(duì)GFS的開源實(shí)現(xiàn)答案:B解析:[單選題]30.下列關(guān)于數(shù)據(jù)的說法,不正確的是()A)數(shù)據(jù)的類別有多種多樣B)數(shù)據(jù)庫(kù)中的一列代表一個(gè)特征C)一組數(shù)據(jù)平均值不會(huì)受異常值影響D)數(shù)據(jù)點(diǎn)之間的距離滿足d_ij+d_jk≥d_ik答案:C解析:[單選題]31.求以下程序結(jié)果正確的是()L=('Google','Python','Taobao')print(L[-2])print(L[1:])A)Python',('Python','Taobao')B)Google',('Python','Taobao')C)Google''Python?D)?Taobao''Python?答案:A解析:[單選題]32.()算法可以用于特征選擇。A)樸素貝葉斯B)感知器C)支持向量機(jī)D)決策樹答案:D解析:使用決策樹也可以計(jì)算每個(gè)特征的相對(duì)重要性。這些重要性能夠輔助進(jìn)行特征選擇。[單選題]33.以下哪個(gè)是技術(shù)性最強(qiáng)的計(jì)算機(jī)系統(tǒng)攻擊手法?()A)口令猜測(cè)B)數(shù)據(jù)包偵聽C)口令破解D)數(shù)據(jù)包欺騙答案:D解析:[單選題]34.Hadoop框架是用下面()語(yǔ)言寫的。A)PytyonB)JavaC)C++D)Scala答案:B解析:[單選題]35.()用于說明在父RDD上執(zhí)行何種計(jì)算。A)分區(qū)B)算子C)日志D)數(shù)據(jù)塊答案:B解析:算子是Spark中定義的函數(shù),用于對(duì)RDD中的數(shù)據(jù)進(jìn)行操作、轉(zhuǎn)換和計(jì)算。[單選題]36.關(guān)于MapReduce1.0的體系結(jié)構(gòu)的描述,下列說法錯(cuò)誤的是?A)Task分為MapTask和ReduceTask兩種,分別由JobTracker和TaskTracker啟動(dòng)B)slot分為Mapslot和Reduceslot兩種,分別供MapTask和ReduceTask使用C)TaskTracker使用?slot?等量劃分本節(jié)點(diǎn)上的資源量(CPU、內(nèi)存等)D)TaskTracker會(huì)周期性接收J(rèn)obTracker發(fā)送過來的命令并執(zhí)行相應(yīng)的操作(如啟動(dòng)新任務(wù)、殺死任務(wù)等)答案:A解析:[單選題]37.下列標(biāo)識(shí)符中,合法的是()。A)helloWorldB)2ndObjC)hello#worldD)-helloworld答案:A解析:[單選題]38.邏輯回歸將輸出概率范圍限定為[0,1]。()函數(shù)能起到這樣的作用A)Sigmoid函數(shù)B)tanh函數(shù)C)ReLU函數(shù)D)LeakyReLU函數(shù)答案:A解析:Sigmoid函數(shù)輸出值限定為[0,1]。[單選題]39.HDFS采用塊復(fù)制的概念,讓數(shù)據(jù)在集群的節(jié)點(diǎn)間進(jìn)行復(fù)制,從而實(shí)現(xiàn)了一個(gè)()的系統(tǒng)。A)云計(jì)算B)分布式文件C)流處理D)高度容錯(cuò)性答案:D解析:[單選題]40.有關(guān)kmeans算法,正確的說法是?()A)kmeans算法對(duì)異常樣本非常敏感,因此在聚類前要把異常樣本直接刪除。B)kmeans只能處理凸型分布的非數(shù)值型樣本。C)kmeans聚類的過程與初始的k個(gè)假設(shè)的聚類中心的選擇沒關(guān)。D)kmeans算法需要在聚類前確定類數(shù)k,這個(gè)k值需要有助于解釋各類的業(yè)務(wù)含義。答案:D解析:[單選題]41.下列關(guān)于Numpy敘述錯(cuò)誤的是?A)是一個(gè)開源的Python科學(xué)計(jì)算庫(kù)B)底層基于C++封裝,運(yùn)行速度快C)常用來處理數(shù)組D)支持矩陣,處理數(shù)學(xué)問題更加形象答案:B解析:[單選題]42.對(duì)于運(yùn)行在MapReduce平臺(tái)上的應(yīng)用程序,此應(yīng)用程序所依賴的jar包會(huì)被放到()。A)HIVEB)HBASEC)HDFSD)DB答案:C解析:[單選題]43.下列不屬于導(dǎo)致各類數(shù)據(jù)泄露的風(fēng)險(xiǎn)大幅提升,公司數(shù)據(jù)安全防護(hù)面臨嚴(yán)峻挑戰(zhàn)因素的是()。A)數(shù)據(jù)量大、分布面廣B)數(shù)據(jù)利用價(jià)值高C)數(shù)據(jù)采集點(diǎn)多,發(fā)布渠道多樣化D)數(shù)據(jù)成本高答案:D解析:[單選題]44.下面不屬于云計(jì)算技術(shù)的有(__)。A)HadoopB)SparkC)YARND)集中式計(jì)算答案:D解析:[單選題]45.用來插入數(shù)據(jù)的命令是(),用于更新的命令是()A)INSERT,UPDATEB)CREATE,INSERTINTOC)DELETE,UPDATED)UPDATE,INSERT答案:A解析:[單選題]46.Oracle數(shù)據(jù)庫(kù)中,段的集合稱為A)區(qū)B)段C)表空間D)數(shù)據(jù)庫(kù)答案:C解析:[單選題]47.一個(gè)簡(jiǎn)單的Series是由()的數(shù)據(jù)組成的A)兩個(gè)數(shù)組B)三個(gè)數(shù)組C)一個(gè)數(shù)組D)四個(gè)數(shù)組答案:C解析:[單選題]48.()算法是決策樹學(xué)習(xí)的基本算法,其他多數(shù)決策樹學(xué)習(xí)方法都是它的變體A)Find-SB)KNNC)概念D)ID3答案:D解析:[單選題]49.大數(shù)據(jù)計(jì)算服務(wù)MaxCompute是阿里巴巴自主研發(fā)的海量數(shù)據(jù)處理平臺(tái),主要服務(wù)于批量結(jié)構(gòu)化數(shù)據(jù)的存化和計(jì)。以下()場(chǎng)景不適合使用大數(shù)據(jù)計(jì)算服務(wù)實(shí)現(xiàn)。A)訂單辦理B)數(shù)據(jù)倉(cāng)庫(kù)C)杜交網(wǎng)絡(luò)分析D)用戶畫像答案:A解析:[單選題]50.假設(shè)你正在訓(xùn)練一個(gè)LSτM網(wǎng)絡(luò),你有一個(gè)10000詞的詞匯表,并且使用一個(gè)激活值維度為100的LSTM塊,在每一個(gè)時(shí)間步中,幾的維度是()A)lB)100C)300D)10000答案:B解析:[單選題]51.Hadoop中partition()函數(shù)代表的是()。A)分區(qū)函數(shù)B)特征函數(shù)C)算法函數(shù)D)排序函數(shù)答案:A解析:[單選題]52.一個(gè)RDD有多個(gè)()組成。A)數(shù)據(jù)塊B)單元C)分區(qū)D)表答案:C解析:[單選題]53.()是基于規(guī)則的分類器。A)C4.5B)KNNC)NaiveBayesD)ANN答案:A解析:基于規(guī)則的分類器有決策樹、隨機(jī)森林、Aprior,C4.5屬于決策樹算法。[單選題]54.已知一個(gè)數(shù)據(jù)集,n為特征數(shù),m為訓(xùn)練樣本數(shù),如果n較小,而且m大小中等(例如n為1~1000,而m為10~10000),則一般選擇()。A)邏輯回歸模型B)不帶核的支持向量機(jī)C)高斯核的支持向量機(jī)D)多項(xiàng)式核的支持向量機(jī)答案:C解析:高斯核函數(shù)需要選擇合適的sigma2參數(shù),適用于少量特征,大量樣本的情況,可以擬合出非常復(fù)雜的非線性決策邊界。第2部分:多項(xiàng)選擇題,共26題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.大數(shù)據(jù)技術(shù)在我們身邊應(yīng)用的越來越廣,以下場(chǎng)景中有哪些場(chǎng)景可以應(yīng)用大數(shù)據(jù)技術(shù)?A)游戲畫面實(shí)時(shí)刷新B)廣告精準(zhǔn)營(yíng)銷C)道路智能規(guī)劃D)人物國(guó)像答案:ABCD解析:[多選題]56.下列說法正確的是()A)一張數(shù)據(jù)表一旦建立完成,是不能修改的。B)在MySQL中,用戶在單機(jī)上操作的數(shù)據(jù)就存放在單機(jī)中。C)在MySQL中,可以建立多個(gè)數(shù)據(jù)庫(kù),但也可以通過限定,使用戶只能建立一個(gè)數(shù)據(jù)庫(kù)。D)要建立一張數(shù)據(jù)表,必須先建數(shù)據(jù)表的結(jié)構(gòu)。答案:BCD解析:[多選題]57.如果回歸模型中存在多重共線性(multicollinearity),應(yīng)該如何解決這一問題而不丟失太多信息A)剔除所有的共線性變量B)剔除共線性變量中的一個(gè)C)通過計(jì)算方差膨脹因子(VarianceInflationFactor,VIF)來檢查共線性程度,并采取相應(yīng)措施D)刪除相關(guān)變量可能會(huì)有信息損失,我們可以不刪除相關(guān)變量,而使用一些正則化方法來解決多重共線性問題,例如Ridge或Lasso回歸。答案:BCD解析:[多選題]58.關(guān)于?三型兩網(wǎng)?,除了泛在電力物聯(lián)網(wǎng),還包括():A)建設(shè)樞紐型企業(yè)B)建設(shè)平臺(tái)型企業(yè)C)建設(shè)共享型企業(yè)D)堅(jiān)強(qiáng)智能電網(wǎng)答案:ABCD解析:[多選題]59.深度學(xué)習(xí)最常用的算法包含()A)CNNB)RNNC)ANND)MPP答案:AB解析:[多選題]60.以下選項(xiàng)屬于數(shù)據(jù)控制語(yǔ)言的是()。--A)ALTERB)GRANTC)COMMITD)ROLLBACK答案:BCD解析:[多選題]61.根據(jù)《國(guó)網(wǎng)數(shù)據(jù)管理辦法》(2019征求意見稿),公司數(shù)據(jù)質(zhì)量管理主要包括():A)數(shù)據(jù)質(zhì)量規(guī)則管理B)數(shù)據(jù)質(zhì)量評(píng)估C)數(shù)據(jù)問題整改D)數(shù)據(jù)質(zhì)量核查答案:ABCD解析:[多選題]62.物聯(lián)網(wǎng)主要由下列哪些部分組成的?A)應(yīng)用層B)處理層C)感知層D)網(wǎng)絡(luò)層答案:ABCD解析:[多選題]63.usionlnsightManager會(huì)定時(shí)備份哪些數(shù)據(jù)A)NameNodeB)LDAPC)OMSD)DBService答案:ABCD解析:[多選題]64.在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括哪幾種類型:()A)復(fù)雜的批量數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)十分鐘到數(shù)小時(shí)之間B)基于歷史數(shù)據(jù)的交互式查詢:時(shí)間跨度通常在數(shù)十秒到數(shù)分鐘之間C)基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)百毫秒到數(shù)秒之間D)基于歷史數(shù)據(jù)的流查詢:時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間答案:ABC解析:[多選題]65.(__)是?黑客精神和技能?。A)大膽創(chuàng)新B)喜歡挑戰(zhàn)C)追求完美D)不斷改進(jìn)答案:ABCD解析:[多選題]66.關(guān)于hbase存儲(chǔ)模型的描述正確的是?A)即使是key值相同,qualifier也相同的多個(gè)keyvalue.也可能有多個(gè),此時(shí)使用時(shí)間戳來區(qū)分B)同一個(gè)key值可以關(guān)聯(lián)多個(gè)valueC)keyvalue中期有時(shí)間戳,類型等關(guān)鍵信息D)每一個(gè)keyvalue都有一個(gè)qualifier標(biāo)識(shí)答案:ABCD解析:[多選題]67.利用Apriori算法計(jì)算頻繁項(xiàng)集可以有效降低計(jì)算頻繁集的時(shí)間復(fù)雜度。在以下的購(gòu)物籃中產(chǎn)生支持度不小于3的候選3-項(xiàng)集,在候選2-項(xiàng)集中需要剪枝的是()ID項(xiàng)集1面包、牛奶2面包、尿布、啤酒、雞蛋3牛奶、尿布、啤酒、可樂4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可樂A)啤酒、尿布B)啤酒、面包C)面包、尿布D)啤酒、牛奶答案:BD解析:[多選題]68.調(diào)用函數(shù)時(shí)可使用的正式參數(shù)類型()。A)必備參數(shù)B)關(guān)鍵字參數(shù)C)默認(rèn)參數(shù)D)不定長(zhǎng)參數(shù)答案:ABCD解析:[多選題]69.下面屬于探索性分析主要關(guān)注的四大主題的有(__)。A)耐抗性B)方差C)重新表達(dá)D)啟示答案:ACD解析:[多選題]70.數(shù)據(jù)挖掘的主要功能包括概念描述、趨勢(shì)分析、孤立點(diǎn)分析及()等方面。A)關(guān)聯(lián)分析B)分類和預(yù)測(cè)C)聚類分析D)偏差分析答案:ABCD解析:[多選題]71.大數(shù)據(jù)平臺(tái)建設(shè)原則為()A)統(tǒng)一數(shù)據(jù)入湖:全網(wǎng)數(shù)據(jù)統(tǒng)一采集到大數(shù)據(jù)湖,利用大數(shù)據(jù)分布式計(jì)算、存儲(chǔ)能力實(shí)現(xiàn)跨域數(shù)據(jù)處理B)統(tǒng)一技術(shù)架構(gòu):采用全網(wǎng)統(tǒng)一的PaaS架構(gòu)構(gòu)建大數(shù)據(jù)平臺(tái),統(tǒng)一組件標(biāo)準(zhǔn),通過全網(wǎng)統(tǒng)一調(diào)度管控兩級(jí)資源C)統(tǒng)一數(shù)據(jù)服務(wù):對(duì)外提供統(tǒng)一數(shù)據(jù)服務(wù),通過API、標(biāo)簽、模型、指標(biāo)、卡片等方式全網(wǎng)開放使用D)統(tǒng)一開發(fā)平臺(tái):提供基于專區(qū)、AI、跨域數(shù)據(jù)的統(tǒng)一開發(fā)平臺(tái),打造全網(wǎng)生態(tài)化大數(shù)據(jù)應(yīng)用敏捷開發(fā)生態(tài)答案:ABCD解析:[多選題]72.Web內(nèi)容挖掘?qū)崿F(xiàn)技術(shù)包括()。A)文本總結(jié)B)文本分類C)文本機(jī)器學(xué)習(xí)D)關(guān)聯(lián)規(guī)則答案:ABCD解析:[多選題]73.以下()屬于數(shù)據(jù)統(tǒng)計(jì)分析工具。A)WekaB)SASC)SPSSD)Matlab答案:ABCD解析:[多選題]74.關(guān)于表掃描算子的說法正確的是(?A)對(duì)于點(diǎn)查或者范圍掃描等過濾本量數(shù)據(jù)的查詢,如果使用SeqScan全表掃描會(huì)比較快。B)表的數(shù)目比較少的時(shí)候,使用Seqscan效率更高。C)SOL的執(zhí)行計(jì)劃第一步就是從表掃描算子開始的。D)SeqScan是指順序掃描表的所有信息。答案:ABC解析:[多選題]75.Python類的特點(diǎn)有(___)。A)根據(jù)職責(zé)將屬性和方法封裝到一個(gè)抽象的類中B)實(shí)現(xiàn)代碼的重用,不需要重復(fù)編寫代碼C)子類擁有父類所有的屬性和方法。也可以重新父類方法D)不同的對(duì)象調(diào)用相同的代碼,產(chǎn)生不同的效果,提高代碼的靈活性答案:ABCD解析:[多選題]76.下列屬于原型聚類算法的是(__)。A)k均值算法B)學(xué)習(xí)向量量化C)高斯混合聚類密度聚類D)密度聚類答案:ABC解析:[多選題]77.數(shù)據(jù)資產(chǎn)應(yīng)用管理主要任務(wù)包括()A)歸集數(shù)據(jù)資產(chǎn)應(yīng)用成果B)評(píng)估數(shù)據(jù)資產(chǎn)應(yīng)用成效C)促進(jìn)共享和應(yīng)用D)促進(jìn)共享和應(yīng)用答案:ABCD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.JSON是一種輕量級(jí)的數(shù)據(jù)交換格式,本質(zhì)上是一個(gè)字符串。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.Series是一個(gè)類似于一維數(shù)組的對(duì)象。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.通過執(zhí)行指令?serviceiptablesstatus?可以關(guān)閉Linux系統(tǒng)的防火墻。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.建立數(shù)據(jù)質(zhì)量現(xiàn)場(chǎng)檢查制度,定期組織實(shí)施,每年不低于一次,對(duì)重大問題及時(shí)上報(bào)董事長(zhǎng),并按流程實(shí)施整改。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]82.與傳統(tǒng)產(chǎn)業(yè)相比,互聯(lián)網(wǎng)產(chǎn)業(yè)創(chuàng)業(yè)成本較低A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.零售商之所以要關(guān)注Rny即消費(fèi)者最近一次消費(fèi)時(shí)間,是因?yàn)闀r(shí)間越短,對(duì)產(chǎn)品和零售商的記憶就越鮮活。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.Spark基于內(nèi)存計(jì)算,本身可以直接讀寫Hadoop上任何格式數(shù)據(jù),其應(yīng)用程序在集群上以獨(dú)立的進(jìn)程集合的形式運(yùn)行。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.在循環(huán)中continue語(yǔ)句的作用是跳出當(dāng)前循環(huán),進(jìn)行下一次循環(huán)。。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]86.Flume在多路傳輸數(shù)據(jù)過程中,如果下一跳的Flume節(jié)點(diǎn)故障或者數(shù)據(jù)接受異常時(shí),可以自動(dòng)切換到另外-路上繼續(xù)傳輸。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.深度學(xué)習(xí)是端到端學(xué)習(xí),系統(tǒng)自動(dòng)提取不同層次的特征。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]88.語(yǔ)句pass僅起到占位符的作用,并不會(huì)做任何操作。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]89.已知x=list(range(20)),那么語(yǔ)句delx[::2]可以正常執(zhí)行。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]90.每個(gè)查詢會(huì)被Hive轉(zhuǎn)化為多個(gè)階段,當(dāng)有些階段關(guān)聯(lián)性較大時(shí),可以并行化執(zhí)行,誠(chéng)少整個(gè)任務(wù)的執(zhí)行時(shí)間。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]91.Flume架構(gòu)中,一個(gè)source可以連接多個(gè)Channel。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]92.聯(lián)接函數(shù)LEFTJOIN結(jié)果集包括LEFTJOIN子句中指定的左表的所有行,而不僅是聯(lián)接列所匹配的行。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]93.集合可以作為字典的鍵。A)正確B)錯(cuò)誤答案:錯(cuò)解析:第4部分:?jiǎn)柎痤},共4題,請(qǐng)?jiān)诳瞻滋幪顚懻_答案。[問答題]94.大數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其中()為數(shù)據(jù)的主要部分。答案:非結(jié)構(gòu)化數(shù)據(jù)解析:[問答題]95.Zookeeper監(jiān)聽服務(wù)器流程()客戶端連接Zooke

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論