大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)_第1頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)_第2頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)_第3頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)_第4頁(yè)
大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)(習(xí)題卷11)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開(kāi)發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共145題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.大數(shù)據(jù)應(yīng)用開(kāi)發(fā)流程不包含以下哪項(xiàng)?A)需求分析B)可行性分析C)應(yīng)用推廣D、技術(shù)選型[單選題]2.以下哪個(gè)不屬于hadoop的核心構(gòu)成A)HDFSB)MapReduceC)SparkD)YARN[單選題]3.()不是長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)蘭個(gè)門(mén)中的一個(gè)門(mén)A)輸入門(mén)B)輸出門(mén)C)遺忘門(mén)D)進(jìn)化門(mén)[單選題]4.搜索引擎?點(diǎn)擊模型?體現(xiàn)的大數(shù)據(jù)思維方式是()A)全樣而非抽樣B)效率而非精確C)相關(guān)而非因果D)以數(shù)據(jù)為中心[單選題]5.獲取指定字符串長(zhǎng)度的函數(shù)是()A)LefttrimB)LengthC)LowerD)NumberToString[單選題]6.假定你現(xiàn)在訓(xùn)練了一個(gè)線性SVM并推斷出這個(gè)模型出現(xiàn)了欠擬合現(xiàn)象,在下一次訓(xùn)練時(shí),應(yīng)該采取的措施是()。A)增加數(shù)據(jù)點(diǎn)B)減少數(shù)據(jù)點(diǎn)C)增加特征D)減少特征[單選題]7.Spark的四大組件下面哪個(gè)不是()A)SparkStreamingB)MlibC)GraphxD)SparkR[單選題]8.下列哪個(gè)不屬于Hadoop的特性?A)成本高B)高可靠性C)高容錯(cuò)性D)運(yùn)行在Linux平臺(tái)上[單選題]9.將用戶的上班距離{0-1Miles,1-2Miles,2-5Miles,5-10Miles,10-20Miles},通過(guò)數(shù)據(jù)加工轉(zhuǎn)換為{0.0,0.25,0.5,0.75,1.0},這屬于對(duì)數(shù)據(jù)進(jìn)行()。A)篩選B)離散化C)標(biāo)準(zhǔn)化D)量化[單選題]10.DAYU批量數(shù)據(jù)遷移(CloudDataMigration)提供()數(shù)據(jù)源之間批量數(shù)據(jù)遷移服務(wù),幫助您實(shí)現(xiàn)數(shù)據(jù)自由流動(dòng)。A)同構(gòu)B)異構(gòu)C)同構(gòu)/異構(gòu)D)架構(gòu)[單選題]11.下列關(guān)于隊(duì)列的描述正確的是()。A)在隊(duì)列中只能刪除數(shù)據(jù)B)隊(duì)列是先進(jìn)后出的線性表C)在隊(duì)列中只能插入數(shù)據(jù)D)隊(duì)列是先進(jìn)先出的線性表[單選題]12.從數(shù)據(jù)到智慧的轉(zhuǎn)換依次遞進(jìn)過(guò)程是()。A)數(shù)據(jù)、知識(shí)、信息、理解、智慧B)數(shù)據(jù)、信息、理解、知識(shí)、智慧C)數(shù)據(jù)、信息、知識(shí)、理解、智慧D)數(shù)據(jù)、理解、信息、知識(shí)、智慧[單選題]13.關(guān)于SecondaryNameNode的說(shuō)法錯(cuò)誤的是()A)main方法是SecondaryNameNode的入口,它啟動(dòng)線程執(zhí)行runB)啟動(dòng)前的構(gòu)造過(guò)程主要是創(chuàng)建和NameNode通信的接口和啟動(dòng)HTTP服務(wù)器C)run方法每隔一段時(shí)間執(zhí)行doCheckpoint()D)main方法從NameNode上取下FSImage和日志,和本地合并再傳回NameNode[單選題]14.關(guān)于__name__的說(shuō)法,下列描述錯(cuò)誤的是()。A)它是Python提供的一個(gè)方法B)每個(gè)模塊內(nèi)部都有一個(gè)__name__屬性C)當(dāng)它的值為'__main__'時(shí),表示模塊自身在運(yùn)行D)當(dāng)它的值不為'__main__'時(shí),表示模塊被引用[單選題]15.定義類(lèi)如下:classhello():defshowInfo(sef):print(self.x)下面描述正確的是A)該類(lèi)不可以實(shí)例化B)該類(lèi)可以實(shí)例化C)在pycharm工具中會(huì)出現(xiàn)語(yǔ)法錯(cuò)誤,說(shuō)self沒(méi)有定義D)該類(lèi)可以實(shí)例化,并且能正常通過(guò)對(duì)象調(diào)用showInfo()[單選題]16.本行()負(fù)責(zé)牽頭開(kāi)展數(shù)據(jù)治理風(fēng)險(xiǎn)管理工作,規(guī)范數(shù)據(jù)風(fēng)險(xiǎn)管理A)風(fēng)險(xiǎn)管理部B)內(nèi)審監(jiān)督部C)科技部D)數(shù)據(jù)運(yùn)管部[單選題]17.()是Google提出的用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運(yùn)算的軟件架構(gòu)。A)GFSB)MapReduceC)ChubbyD)BitTable[單選題]18.根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(國(guó)發(fā)〔2015〕50號(hào)),大數(shù)據(jù)對(duì)推動(dòng)經(jīng)濟(jì)的重要意義不包括()。A)大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展的新動(dòng)力B)大數(shù)據(jù)成為重塑?chē)?guó)家競(jìng)爭(zhēng)優(yōu)勢(shì)的新機(jī)遇C)大數(shù)據(jù)成為企業(yè)轉(zhuǎn)型升級(jí)的新常態(tài)D)大數(shù)據(jù)成為提升政府治理能力的新途徑[單選題]19.某些在線廣告APP采用了阿里云的技術(shù),通過(guò)對(duì)網(wǎng)上搜集的海量數(shù)據(jù)的分析,給企業(yè)主提供精準(zhǔn)的廣告投放人群。該APP的產(chǎn)品經(jīng)理介紹該系統(tǒng)能實(shí)現(xiàn)以下計(jì)數(shù)指標(biāo):1-能存儲(chǔ)海量數(shù)據(jù),單標(biāo)大小超過(guò)100TB;2-支持多張上億的表進(jìn)行Join;3-支持多種篩選條件,包括連續(xù)范圍篩選、取值篩選、and/or/not條件組合等;4-支持快速(3秒以內(nèi))對(duì)十個(gè)維度分別進(jìn)行技術(shù)透視分析根據(jù)以上信息,請(qǐng)判斷該APP使用的是阿里云的()產(chǎn)品。A)DRDSB)OTSC)ADSD)Maxcompute[單選題]20.HBase的主HMaster是如何選舉的?A)由RegionServer進(jìn)行裁決B)HMaster為雙主模式,不需要進(jìn)行裁決C)通過(guò)ZooKeeper進(jìn)行裁決D)隨機(jī)選舉[單選題]21.在HDFS根目錄下創(chuàng)建一個(gè)文件夾/test,且/test文件夾內(nèi)還包含一個(gè)文件夾dir,正確的shell命令是()。A)hadoopfs-mkdir-p/test/dirB)hdfsfs-mkdir-p/test/dirC)hadoopdfs-mkdir/test/dirD)hdfsdfs*mkdir-p/test/dir[單選題]22.以下關(guān)于n剛說(shuō)法不正確的是()A)層數(shù)多B)抽象能力強(qiáng)C)模擬更復(fù)雜模型D)廣義上包含CNN、DBN、SVM等[單選題]23.在情感分析任務(wù)中,其目的是將無(wú)結(jié)構(gòu)化的情感文本轉(zhuǎn)化成計(jì)算機(jī)容易識(shí)別和處理的結(jié)構(gòu)化文本,進(jìn)而供情感分析上層的研究和應(yīng)用服務(wù)的是()。A)情感信息檢索B)情感信息抽取C)情感信息分類(lèi)D)情感信息歸納[單選題]24.線性模型試圖學(xué)得一個(gè)屬性的(__)來(lái)進(jìn)行預(yù)測(cè)的函數(shù)。A)線性組合B)非線性組合C)取值D)維度[單選題]25.下列關(guān)于可視化方法體系說(shuō)法不正確的是()。A)通常采用視覺(jué)圖形元素和視覺(jué)通道兩個(gè)維度進(jìn)行視覺(jué)編碼B)常用的共性方法有統(tǒng)計(jì)圖表、圖論方法、視覺(jué)隱喻和圖形符號(hào)學(xué)等C)領(lǐng)域方法在所屬領(lǐng)域內(nèi)其可視化的信度和效果往往低干基礎(chǔ)方法的直接應(yīng)用D)視覺(jué)編碼為其他數(shù)據(jù)可視化方法提供了方法學(xué)基礎(chǔ)[單選題]26.關(guān)于圖像放大處理,下列說(shuō)法不正確的是A)從物理意義上講,圖像的放大是圖像縮小的逆操作B)當(dāng)放大的倍數(shù)比較大時(shí),使用基于像素放大原理的圖像放大方法會(huì)導(dǎo)致馬賽克現(xiàn)象。C)對(duì)于因放大后的圖像子塊與子塊之間的過(guò)渡因不平緩而導(dǎo)致畫(huà)面效果不自然的問(wèn)題,可以采用雙線性插值方法可以用來(lái)解決。D)圖像的放大不會(huì)引起圖像的畸變。[單選題]27.若要對(duì)圖片進(jìn)行檢索,一般選擇什么工具較好?A)ElasticSearchB)HiveC)HDFSD)MySQL[單選題]28.關(guān)于計(jì)算機(jī)技術(shù)的描述以下正確的是,:A)計(jì)算機(jī)是革命性技術(shù)B)計(jì)算機(jī)早于工業(yè)革命時(shí)代誕生C)計(jì)算機(jī)運(yùn)行算法的時(shí)候跟CPU速度沒(méi)關(guān)系D)計(jì)算機(jī)不能用來(lái)收集數(shù)據(jù)[單選題]29.下面不屬于農(nóng)業(yè)的有(__)。A)farmersB)farmlogsC)prosperaD)uber[單選題]30.()是大數(shù)據(jù)審計(jì)技術(shù)發(fā)展的最強(qiáng)大動(dòng)力A)人才培養(yǎng)B)科技發(fā)展C)制度建設(shè)D)審計(jì)方式轉(zhuǎn)變[單選題]31.下列方法中,不可以使用類(lèi)名訪問(wèn)的是()。A)實(shí)例方法B)類(lèi)方法C)靜態(tài)方法D)以上3項(xiàng)都不符合[單選題]32.下列關(guān)于大數(shù)據(jù)中計(jì)算機(jī)存儲(chǔ)容量單位的說(shuō)法中,錯(cuò)誤的是A)基本存儲(chǔ)容量單位是字節(jié)(Byte)B)漢字字符存儲(chǔ)空間要大于英文字符存儲(chǔ)空間C)一個(gè)英文字符需要2個(gè)字節(jié)的存儲(chǔ)空間D)一個(gè)漢字字符需要2個(gè)字節(jié)的存儲(chǔ)空間[單選題]33.下面組件哪個(gè)是負(fù)責(zé)分布式資源調(diào)度與管理的:()A)YARNB)FlumeC)ZookeeperD)Kafka[單選題]34.下列哪個(gè)方法會(huì)把讀取到的數(shù)據(jù)返回的是一個(gè)列表()。A)read(12)B)read()C)readlines()D)readline()[單選題]35.對(duì)ElasticSearch描述正確的是()。A)客戶端必須把索引請(qǐng)求發(fā)給shardB)客戶端必須把索引請(qǐng)求發(fā)給EsNodeC)客戶端必須把素引請(qǐng)求發(fā)給EsMasteD)客戶端必須把索引請(qǐng)求發(fā)給指定的EsNode[單選題]36.下列不屬于大數(shù)據(jù)在社會(huì)活動(dòng)中的典型應(yīng)用的是()。A)美團(tuán)實(shí)現(xiàn)了快速精準(zhǔn)的送餐服務(wù)B)共享單車(chē)、滴滴打車(chē)方便了人們的日常出行C)快遞實(shí)現(xiàn)了訂單的實(shí)時(shí)跟蹤D)供電公司提供電費(fèi)賬單查詢[單選題]37.常用的數(shù)據(jù)歸約方法可以分為()。A)維歸約、數(shù)據(jù)壓縮B)維歸約、參數(shù)歸約C)維歸約、值歸約D)數(shù)據(jù)壓縮、值歸約[單選題]38.(__)是在不影響數(shù)據(jù)分析結(jié)果準(zhǔn)確性的前提下,對(duì)原始數(shù)據(jù)進(jìn)行一定的變換操作,對(duì)其中的個(gè)人(組織)敏感數(shù)據(jù)進(jìn)行替換或刪除操作。A)數(shù)據(jù)加工B)數(shù)據(jù)保護(hù)C)數(shù)據(jù)脫敏D)數(shù)據(jù)清洗[單選題]39.以下關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的敘述中,不正確的是()A)數(shù)據(jù)倉(cāng)庫(kù)是相對(duì)穩(wěn)定的B)數(shù)據(jù)倉(cāng)庫(kù)是反映歷史變化的數(shù)據(jù)集合C)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)源可能是異構(gòu)的D)數(shù)據(jù)倉(cāng)庫(kù)是動(dòng)態(tài)的、實(shí)時(shí)的數(shù)據(jù)集合[單選題]40.(__)不屬于離中趨勢(shì)分析。A)極差B)平均差C)誤差D)標(biāo)準(zhǔn)差[單選題]41.以下哪個(gè)選項(xiàng)屬于大數(shù)據(jù)消息系統(tǒng)?A)ZookeeperB)HBaseC)KafkaD)Spark[單選題]42.根據(jù)《承德銀行大數(shù)據(jù)貸后風(fēng)險(xiǎn)預(yù)警信號(hào)管理辦法(試行)》,大數(shù)據(jù)貸后預(yù)警處置全流程共包含客戶經(jīng)理崗、支行預(yù)警審批崗、分行預(yù)警分發(fā)崗、分行預(yù)警審批崗、總行公司預(yù)警分發(fā)崗、總行公司預(yù)警審批崗等()類(lèi)崗位。A)3B)5C)9D)15[單選題]43.下列函數(shù)中,用于沿著軸方向堆疊Pandas對(duì)象的是()。A)concat()B)join()C)merge()D)combine_first()[單選題]44.以下哪一選項(xiàng)不屬于MRS日常運(yùn)維不影響業(yè)務(wù)這一特性?A)滾動(dòng)升級(jí)/補(bǔ)丁B)修改配置滾動(dòng)重啟C)單集群跨AZ高可用D)擴(kuò)縮容業(yè)務(wù)無(wú)感知[單選題]45.度量特征的分散程度,可以使用哪個(gè)量()A)分位數(shù)B)中位數(shù)C)平均數(shù)D)相似性[單選題]46.執(zhí)行以下程序,輸入la,輸出結(jié)果是:la='python'try:s=eval(input('請(qǐng)輸入整數(shù):'))ls=s*2print(ls)except:print('請(qǐng)輸入整數(shù)')A)pythonpythonB)laC)請(qǐng)輸入整數(shù)D)python[單選題]47.以下哪項(xiàng)屬于F1ume的基本數(shù)據(jù)單位?A)SubjectB)TopicC)ObjectD)Event[單選題]48.對(duì)于ADS的數(shù)據(jù)一致性問(wèn)題,以下說(shuō)法是錯(cuò)誤的是:()。A)當(dāng)updateType=realtime時(shí),對(duì)于不同主鍵數(shù)據(jù)的多次變更,ADS不保證先執(zhí)行的變更會(huì)比后執(zhí)行的變更更優(yōu)秀的查詢到B)當(dāng)updateType=realtime時(shí),不支持事務(wù),并且僅遵循會(huì)話一致性的設(shè)計(jì),所以ADS并不能作為OLTP系統(tǒng)使用解釋?zhuān)鹤罱K一致性C)當(dāng)updateType=realtime時(shí),當(dāng)業(yè)務(wù)端暫停數(shù)據(jù)寫(xiě)入的若干時(shí)間后,ADS會(huì)保證數(shù)據(jù)的一致性D)當(dāng)updateType=realtime時(shí),對(duì)于同一主鍵數(shù)據(jù)的多次變更,ADS會(huì)遵循ADS返回語(yǔ)句執(zhí)行成功的順序進(jìn)行[單選題]49.下列哪個(gè)不是TF-IDF的缺點(diǎn)?A)沒(méi)有考慮特征詞的位置因素對(duì)文本的區(qū)分度B)將一些生僻字誤當(dāng)作文檔關(guān)鍵詞C)只考慮特征詞和文本之間的關(guān)系,忽略了一個(gè)特征項(xiàng)在不同類(lèi)別間的分布情況D)字詞的重要性隨它在文件中出現(xiàn)的次數(shù)成反比[單選題]50.以下哪個(gè)組件是Spark中的機(jī)器學(xué)習(xí)算法庫(kù):()A)MLlibB)SparkC)MachineD)Spark[單選題]51.從網(wǎng)絡(luò)的原理上來(lái)看,結(jié)構(gòu)最復(fù)雜的神經(jīng)網(wǎng)絡(luò)是()。A)卷積神經(jīng)網(wǎng)絡(luò)B)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)C)GRUD)BP神經(jīng)網(wǎng)絡(luò)[單選題]52.python不支持的數(shù)據(jù)類(lèi)型有()A)charB)intC)floatD)list[單選題]53.迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A)我為人人,人人為我B)全樣而非抽樣C)效率而非精確D)相關(guān)而非因果[單選題]54.列表是Python語(yǔ)言中基本數(shù)據(jù)類(lèi)型之一。我們可以通過(guò)list[i]獲取列表中第i個(gè)元素的值,那么list[i∶j]的作用是()。A)將列表中第i個(gè)元素的值設(shè)置為jB)返回一個(gè)列表切片--由原列表第i個(gè)到第j-1個(gè)元素組成的新列表C)返回一個(gè)擁有第i和j個(gè)元素的新列表D)返回一個(gè)擁有第j和i個(gè)元素的新列表[單選題]55.下列關(guān)于地圖的說(shuō)法中,錯(cuò)誤的是()A)地圖是指使用地理地圖作為背景,通過(guò)圖形的位置來(lái)表現(xiàn)數(shù)據(jù)的地理位置,將數(shù)據(jù)在不同地理位置上的分布通過(guò)顏色或者氣泡等映射在地圖上的一種圖表B)地圖適合帶有地理位置信息的數(shù)據(jù)的展現(xiàn),可以非常直觀地展示出不同地理位置的數(shù)據(jù)信息,給人以空間感C)氣泡地圖中,即使相鄰氣泡所示數(shù)值很大,氣泡間也不容易疊加D)地圖可以分為氣泡地圖、顏色地圖等[單選題]56.計(jì)算機(jī)初始狀態(tài)能識(shí)別(__)上的基本信息。A)像素點(diǎn)B)每個(gè)物體C)背景D)前景[單選題]57.下列是數(shù)學(xué)模塊的是()A)mathB)randomC)reD)sax[單選題]58.圖像的形態(tài)學(xué)處理方法包括()。A)圖像增強(qiáng)B)圖像銳化C)圖像分割D)腐蝕[單選題]59.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是以下哪個(gè)步驟的任務(wù)()。A)頻繁模式挖掘B)分類(lèi)和預(yù)測(cè)C)數(shù)據(jù)預(yù)處理D)數(shù)據(jù)流挖掘[單選題]60.離線批處工具不包合以下哪項(xiàng)?A)MapReduceB)SparkC)StormD)SQL[單選題]61.Matplotlib中調(diào)用堆積折線圖的函數(shù)是()。A)step()B)stackplot()C)plusplot()D)hist()[單選題]62.信息熵的值越小,則該樣本集合的純度(__)。A)越低B)越高C)沒(méi)有影響D)自由變化[單選題]63.傅里葉變換得到的頻譜中,低頻系數(shù)對(duì)應(yīng)于()。A)物體邊緣B)噪聲C)變化平緩部分D)變化劇烈部分[單選題]64.()的主要目標(biāo)是提供可擴(kuò)展的機(jī)器學(xué)習(xí)算法及其實(shí)現(xiàn),旨在幫助開(kāi)發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序。A)MahoutB)FlumeC)SqoopD)HBase[單選題]65.Python程序文件的擴(kuò)展名是()。A)pythonB)pytC)ptD)py[單選題]66.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是:()。A)barrier周期性的插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動(dòng)B)barrier是Flink快照的核心C)一個(gè)barrier將本周期快照的數(shù)據(jù)與下一周期快照的數(shù)據(jù)分隔開(kāi)來(lái)D)在插入barrier的時(shí)候,會(huì)暫時(shí)阻斷數(shù)據(jù)[單選題]67.在能源互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)架構(gòu)中,()將不僅作為能源傳輸、轉(zhuǎn)換的樞紐,更是承載各種服務(wù),連接各方利益,實(shí)現(xiàn)信息交互、共享,支撐各種交易的平臺(tái)。A)電能B)電網(wǎng)C)電廠D)電力設(shè)備制造企業(yè)[單選題]68.根據(jù)建議,/srv/BigDate分區(qū)應(yīng)該部署在什么磁盤(pán)上?A)OS盤(pán)B)元數(shù)據(jù)盤(pán)C)數(shù)據(jù)盤(pán)D)管理盤(pán)[單選題]69.Hive適合()環(huán)境A)HiveB)提供實(shí)時(shí)查詢功能C)適合應(yīng)用在大量不可變數(shù)據(jù)的批處理作業(yè)D)Hive[單選題]70.刪除數(shù)據(jù)表用以下哪一項(xiàng)()A)DROPB)UPDATEC)DELETED)DELETED[單選題]71.關(guān)于引入模塊的方式,錯(cuò)誤的是()A)importmathB)fromfibimportfibonacciC)frommathimport*D)fromimportfib[單選題]72.在Spark中一個(gè)RDD有()個(gè)分區(qū)A)2B)3C)4D)5[單選題]73.(__)可以理解為對(duì)數(shù)據(jù)管理的管理。A)數(shù)據(jù)治理B)數(shù)據(jù)統(tǒng)治C)數(shù)據(jù)宰相D)數(shù)據(jù)戰(zhàn)略[單選題]74.關(guān)于欠擬合(under-fitting),正確的是()。A)訓(xùn)練誤差較大,測(cè)試誤差較小B)訓(xùn)練誤差較小,測(cè)試誤差較大C)訓(xùn)練誤差較大,測(cè)試誤差較大D)訓(xùn)練誤差較小,測(cè)試誤差較小[單選題]75.Reduce階段不包括以下哪一步?()A)排序B)分區(qū)C)分組D)規(guī)約[單選題]76.基于大數(shù)據(jù)的藥品研發(fā)的案例體現(xiàn)的大數(shù)據(jù)的思維方式是()A)全樣而非抽樣B)效率而非精確C)相關(guān)而非因果D)我為人人,人人為我[單選題]77.概率圖模型中最常用的采樣技術(shù)是馬爾科夫鏈蒙特卡洛(MCMC)方法,以下關(guān)于其方法流程有如下內(nèi)容,1.設(shè)法構(gòu)造一條馬爾科夫鏈,使其收斂至平穩(wěn)分布恰為待估計(jì)參數(shù)的后驗(yàn)分布;2.通過(guò)馬爾科夫鏈產(chǎn)生符合后驗(yàn)分布的樣本;3.利用估計(jì)結(jié)果構(gòu)造馬爾科夫鏈;4.對(duì)樣本進(jìn)行估計(jì);請(qǐng)選擇正確的排序:A)1,2,3,4B)4,3,1,2C)3,1,2,4D)1,2,4[單選題]78.第一個(gè)提出大數(shù)據(jù)概念的公司是()。A)微軟公司B)谷歌公司C)臉譜公司D)麥肯錫公司[單選題]79.下列算法中,()更適合做時(shí)間序列建模A)CNNB)決策樹(shù)C)LSTMD)貝葉斯算法[單選題]80.在plt中通常的lw參數(shù)代表的作用是(__)。A)線條的風(fēng)格B)文字的顏色C)線條的寬度D)線條的透明度[單選題]81.更新數(shù)據(jù)表中的記錄用以下哪一項(xiàng)()A)DELETEB)ALTREC)UPDATED)SELECT[單選題]82.信息熵是度量()最常用的一種指標(biāo)。A)樣本的個(gè)數(shù)B)樣本的維度C)樣本的純度D)樣本的冗余度[單選題]83.下面哪個(gè)指標(biāo)不是聚類(lèi)算法的質(zhì)量特征?()A)對(duì)噪聲數(shù)據(jù)的敏感性。B)處理多種類(lèi)型的數(shù)據(jù)。C)聚類(lèi)的類(lèi)別多少D)可伸縮性[單選題]84.下列不屬于HBase基本元素的一項(xiàng)是()。A)表B)記錄C)行鍵D)單元格[單選題]85.以下關(guān)于數(shù)據(jù)維度的描述,錯(cuò)誤的是:A)采用列表表示一維數(shù)據(jù),不同數(shù)據(jù)類(lèi)型的元素是可以的B)JSON格式可以表示比二維數(shù)據(jù)還復(fù)雜的高維數(shù)據(jù)C)二維數(shù)據(jù)可以看成是一維數(shù)據(jù)的組合形式D)字典不可以表示二維以上的高維數(shù)據(jù)[單選題]86.下列屬于卷積網(wǎng)絡(luò)類(lèi)型分類(lèi)的是()A)普通卷積B)擴(kuò)張卷積中C)轉(zhuǎn)置卷積D)以上答案都正確[單選題]87.內(nèi)外部合作單位和供應(yīng)商的數(shù)據(jù)安全管理過(guò)程中,應(yīng)確保內(nèi)部合作單位開(kāi)發(fā)測(cè)試環(huán)境與互聯(lián)網(wǎng)(),嚴(yán)禁外部合作單位、技術(shù)支持單位和供應(yīng)商在對(duì)互聯(lián)網(wǎng)提供服務(wù)的網(wǎng)絡(luò)和信息系統(tǒng)中存儲(chǔ)或運(yùn)行公司商業(yè)秘密數(shù)據(jù)和重要數(shù)據(jù)。A)物理隔離B)邏輯隔離C)相互連接D)間接連接[單選題]88.sklearn.decomposition.PCA()的作用是()。A)因子分析B)數(shù)據(jù)降維C)稀疏編碼D)唯一編碼[單選題]89.關(guān)于Hive與Hadoop其他組件的關(guān)系,以下描述錯(cuò)誤的是:()。A)Hive最終將數(shù)據(jù)存儲(chǔ)在HDFS中B)Hive是Hadoop平臺(tái)的數(shù)據(jù)倉(cāng)庫(kù)工具C)HQL可以通過(guò)MapReduce執(zhí)行任務(wù)D)Hive對(duì)HBase有強(qiáng)依賴[單選題]90.OTS的一些表中存在冷數(shù)據(jù)和熱數(shù)據(jù)的區(qū)分,所謂冷數(shù)據(jù)是指根據(jù)時(shí)效性判斷被查詢的可能性不大的數(shù)據(jù),反之為熱數(shù)據(jù)。下面關(guān)于冷熱數(shù)據(jù)的說(shuō)法,錯(cuò)誤的是:()。A)可以用不同的表來(lái)區(qū)分冷熱數(shù)據(jù),并設(shè)置不同的預(yù)留讀寫(xiě)吞吐量B)表中存在大量冷數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)訪問(wèn)壓力不均勻,從而導(dǎo)致表上配置的預(yù)留讀寫(xiě)吞吐量無(wú)法被充分利用C)按照冷熱數(shù)據(jù)拆分成不同的表后,可對(duì)冷數(shù)據(jù)對(duì)應(yīng)的表設(shè)置較小的預(yù)留讀寫(xiě)吞吐量D)在同一張表可以對(duì)不同的分片設(shè)置不同的預(yù)留讀寫(xiě)吞吐量,對(duì)于冷數(shù)據(jù)所在的片,設(shè)置較低的預(yù)留讀寫(xiě)吞吐量[單選題]91.()代表了Oracle數(shù)據(jù)庫(kù)中最小粒度的邏輯數(shù)據(jù)存儲(chǔ)層次。A)表空間B)盤(pán)區(qū)C)數(shù)據(jù)文件D)數(shù)據(jù)塊[單選題]92.()不是Hive支持的數(shù)據(jù)類(lèi)型。A)StructB)IntC)MapD)Long[單選題]93.零售商Target的機(jī)遇大數(shù)據(jù)的商品營(yíng)銷(xiāo)案例體現(xiàn)的大數(shù)據(jù)思維方式是()A)全樣而非抽樣B)效率而非精確C)相關(guān)而非因果D)以數(shù)據(jù)為中心[單選題]94.大數(shù)據(jù)的4V特征中的Velocity是指()。A)價(jià)值密度低B)處理速度快C)數(shù)據(jù)類(lèi)型繁多D)數(shù)據(jù)體量巨大[單選題]95.以下()是Maxcompute內(nèi)網(wǎng)的endpoint。A)/apiB)/apiC)/apiD)/api[單選題]96.以下選項(xiàng)對(duì)GES概念描述正確的是()。A)Edge:邊,用于表示關(guān)系度B)EdgeLabel:邊的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的關(guān)系類(lèi)型C)VertexLabel:節(jié)點(diǎn)的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的實(shí)體類(lèi)型D)vertex:節(jié)點(diǎn)/頂點(diǎn),用于表示現(xiàn)實(shí)世界中的實(shí)體對(duì)象[單選題]97.Spark集群的默認(rèn)web管理頁(yè)面端口(__)。A)8090B)1020C)8010D)8080[單選題]98.面向?qū)ο蟪绦蛟O(shè)計(jì)的缺點(diǎn)是()。A)可擴(kuò)展性B)編程復(fù)雜度C)共享性D)易維護(hù)性[單選題]99.執(zhí)行如下代碼:importturtleastdefDrawCctCircle(n):t.penup()t.goto(0,-n)t.pendown()t.circle(n)foriinrange(20,80,20):DrawCctCircle(i)t.done()在PythonTurtleGraphics中,繪制的圖形是A)同切圓B)同心圓C)笛卡爾心形D)太極[單選題]100.清洗數(shù)據(jù)應(yīng)使用()A)ES落地B)流轉(zhuǎn)換C)抽樣D)轉(zhuǎn)換[單選題]101.查找條件為:姓名為NULL的記錄()A)WHERENAMENULLB)\WHERENAMEISNULLC)WHERENAME=NULLD)\WHERENAME==NULL[單選題]102.對(duì)長(zhǎng)度為n的線性表作快速排序,在最壞情況下,比較次數(shù)為_(kāi)__________。A)n(n-1)/2B)n(n-1)C)n-1D)n[單選題]103.下列關(guān)于情感分析的說(shuō)法不正確的是?A)簡(jiǎn)單而言,是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過(guò)程B)情感分析的發(fā)展得益于社交媒體的興起C)按照處理文本的粒度不同,情感分析大致可分為句子級(jí)、篇章級(jí)兩個(gè)D)情感分析可以應(yīng)用于文本挖掘[單選題]104.關(guān)于HBase的三層結(jié)構(gòu)中各層次的名稱(chēng)和作用的說(shuō)法,哪個(gè)是錯(cuò)誤的?A)Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息B)-ROOT-表記錄了.META.表的Region位置信息C)META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息D)Zookeeper文件記錄了-ROOT-表的位置信息[單選題]105.關(guān)于貝葉斯網(wǎng)絡(luò),說(shuō)法錯(cuò)誤的是()A)、是由有向有環(huán)圖構(gòu)成B)、每個(gè)節(jié)點(diǎn)代表一個(gè)?事件?或者?隨機(jī)變量?C)、貝葉斯網(wǎng)絡(luò)是基于概率推理的模型D)、表示起因的假設(shè)和表示結(jié)果的數(shù)據(jù)均用結(jié)點(diǎn)表示[單選題]106.以下屬于PythonWeb開(kāi)發(fā)框架第三方庫(kù)的是:A)DjangoB)WheelC)PygameD)WeRoBot[單選題]107.在HDFS中客戶端(client)和元數(shù)據(jù)節(jié)點(diǎn)(NameNode)可以向()請(qǐng)求寫(xiě)入或讀出數(shù)據(jù)塊。A)NameNodeB)DataNodeC)SecondaryNameNodeD)Master[單選題]108.我們常提到的"Window裝個(gè)VMware裝個(gè)Linux虛擬機(jī)"屬于()A)內(nèi)存虛擬化B)存儲(chǔ)虛擬化C)系統(tǒng)虛擬化D)網(wǎng)絡(luò)虛擬化[單選題]109.下列關(guān)于數(shù)據(jù)模型中行的敘述不正確的一項(xiàng)為()。A)表按照行鍵?逐字節(jié)排序?順序?qū)π羞M(jìn)行有序化的處理B)表內(nèi)數(shù)據(jù)非常?緊密?C)不用行的列的數(shù)目完全可以大不相同D)可以只對(duì)一行上?鎖?[單選題]110.以下關(guān)于機(jī)器學(xué)習(xí)的發(fā)展歷程描述錯(cuò)誤的是(___)。A)要使機(jī)器具有智能,就必須設(shè)法使機(jī)器擁有知識(shí)B)從二十世紀(jì)七十年代中期開(kāi)始,人工智能研究進(jìn)入了?知識(shí)期?C)二十世紀(jì)五十年代中后期,基于神經(jīng)網(wǎng)絡(luò)的?符號(hào)主義?學(xué)習(xí)開(kāi)始出現(xiàn)D)二十世紀(jì)八十年代是機(jī)器學(xué)習(xí)稱(chēng)為一個(gè)獨(dú)立的學(xué)科領(lǐng)域、各種機(jī)器學(xué)習(xí)技術(shù)百花初綻的時(shí)期[單選題]111.Hadoop的作者是下面哪一位(___)。A)MartinFowlerB)KentBeckC)GraceHopperD)Dougcutting[單選題]112.下列關(guān)于組織機(jī)構(gòu)的數(shù)據(jù)管理成熟度等級(jí)劃分中的已執(zhí)行級(jí)的描述錯(cuò)誤的是()。A)在具體項(xiàng)目中,DMM關(guān)鍵過(guò)程域(KPA)中給出的關(guān)鍵過(guò)程已被執(zhí)行,但隨意性和臨時(shí)性較大B)DMM關(guān)鍵過(guò)程的執(zhí)行不僅僅局限于特定業(yè)務(wù)范疇,存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過(guò)程C)缺少針對(duì)DMM關(guān)鍵過(guò)程的反饋與優(yōu)化D)雖然有可能在特定業(yè)務(wù)過(guò)程中進(jìn)行了基礎(chǔ)性改進(jìn),但沒(méi)有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu)[單選題]113.對(duì)于OTS表的主鍵描述正確的是()。A)由四個(gè)屬性組成B)建表的時(shí)候可以暫時(shí)不指定,之后用altertable修改C)組成主鍵的屬性只能是string或者integerD)主鍵本身就是表的分片鍵[單選題]114.假設(shè)擁有一個(gè)已完成訓(xùn)練的、用來(lái)解決車(chē)輛檢測(cè)問(wèn)題的深度神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練所用的數(shù)據(jù)集由汽車(chē)和卡車(chē)的照片構(gòu)成,而訓(xùn)練目標(biāo)是檢測(cè)出每種車(chē)輛的名稱(chēng)(車(chē)輛共有10種類(lèi)型)。現(xiàn)在想要使用這個(gè)模型來(lái)解決另外一個(gè)問(wèn)題,問(wèn)題數(shù)據(jù)集中僅包含一種車(chē)(福特野馬)而目標(biāo)變?yōu)槎ㄎ卉?chē)輛在照片中的位置,則應(yīng)采取的方法是()。A)除去神經(jīng)網(wǎng)絡(luò)中的最后一層,凍結(jié)所有層然后重新訓(xùn)練B)對(duì)神經(jīng)網(wǎng)絡(luò)中的最后幾層進(jìn)行微調(diào),同時(shí)將最后一層(分類(lèi)層)更改為回歸層C)使用新的數(shù)據(jù)集重新訓(xùn)練模型D)所有答案均不對(duì)[單選題]115.在分類(lèi)問(wèn)題中,我們經(jīng)常會(huì)遇到正負(fù)樣本數(shù)據(jù)量不等的情況,比如正樣本為10w條數(shù)據(jù),負(fù)樣本只有1w條數(shù)據(jù),以下最合適的處理方法是()?A)將負(fù)樣本重復(fù)10次,生成10w樣本量,打亂順序參與分類(lèi)B)直接進(jìn)行分類(lèi),可以最大限度利用數(shù)據(jù)C)從10w正樣本中隨機(jī)抽取1w參與分類(lèi)D)將負(fù)樣本每個(gè)權(quán)重設(shè)置為10,正樣本權(quán)重為1,參與訓(xùn)練過(guò)程[單選題]116.下列關(guān)于Pandas中g(shù)roupby方法的說(shuō)法正確的是()。A)groupby能夠?qū)崿F(xiàn)分組聚合B)groupby方法的結(jié)果能夠直接查看C)groupby是Pandas提供的一個(gè)用來(lái)分組的方法D)groupby方法是Pandas提供的一個(gè)用來(lái)聚合的方法[單選題]117.數(shù)據(jù)產(chǎn)品的定義是()。A)數(shù)據(jù)產(chǎn)品是指能夠供給市場(chǎng),被人們使用和消費(fèi),并能滿足人們某種需求的任何東西B)數(shù)據(jù)產(chǎn)品是可以發(fā)揮數(shù)據(jù)價(jià)值去輔助用戶更優(yōu)地做決策(甚至行動(dòng))的一種產(chǎn)品形式C)數(shù)據(jù)產(chǎn)品是指為了滿足自身的需要,通過(guò)科技發(fā)明或經(jīng)驗(yàn)總結(jié)而形成的技術(shù)D)數(shù)據(jù)產(chǎn)品是數(shù)據(jù)科學(xué)的結(jié)果,創(chuàng)造了新的實(shí)物形態(tài)和使用價(jià)值的產(chǎn)品。[單選題]118.下面哪個(gè)函數(shù)可以將形如YYYY-MM-DDhh:mm:ss日期時(shí)間轉(zhuǎn)化為字符串()A)DateToStringB)DateTimeToStringC)FormatDateD)StringToDateTime[單選題]119.關(guān)于Python的全局變量和局部變量,以下選項(xiàng)中描述錯(cuò)誤的是A)局部變量指在函數(shù)內(nèi)部使用的變量,當(dāng)函數(shù)退出時(shí),變量依然存在,下次函數(shù)調(diào)用可以繼續(xù)使用B)使用global保留字聲明簡(jiǎn)單數(shù)據(jù)類(lèi)型變量后,該變量作為全局變量使用C)簡(jiǎn)單數(shù)據(jù)類(lèi)型變量無(wú)論是否與全局變量重名,僅在函數(shù)內(nèi)部創(chuàng)建和使用,函數(shù)退出后變量被釋放D)全局變量指在函數(shù)之外定義的變量,一般沒(méi)有縮進(jìn),在程序執(zhí)行全過(guò)程有效[單選題]120.LSTM中特有的三個(gè)門(mén),下列哪一個(gè)不再其中?()A)輸入門(mén)B)輸出門(mén)C)循環(huán)門(mén)D)遺忘門(mén)[單選題]121.Hive創(chuàng)建表的語(yǔ)句是()A)createtableB)createdatabaseC)createdataD)createsheet[單選題]122.a=np.array([1,0,0,3,4,5,0,8]),b=np.nonzero(a),則b[0]的值為()。A)[0,3,4,5,7]B)[1,3,4,5,8]C)[03457]D)[13458][單選題]123.小米的智能音響屬于物聯(lián)網(wǎng)架構(gòu)中的哪一層?A)感知層B)網(wǎng)絡(luò)層C)處理層D)應(yīng)用層[單選題]124.循環(huán)神經(jīng)網(wǎng)絡(luò)簡(jiǎn)寫(xiě)是()A)CNNB)RNNC)LSTMD)SRN[單選題]125.HDFS基本系統(tǒng)架構(gòu)中,副本配置通常存儲(chǔ)()份?A)3B)4C)1D)2[單選題]126.HBase中的Region是由哪個(gè)服務(wù)進(jìn)程來(lái)管理的?A)HRegionServerB)ZookeeperC)HMasterD)DataNode[單選題]127.關(guān)于Spark中SparkSQL描述不準(zhǔn)確的是?A)SparkSQL使用場(chǎng)景包括毫秒級(jí)實(shí)時(shí)查詢B)SQL語(yǔ)句通過(guò)SparkSQL模塊解析為DAG,交給SparkCore執(zhí)行C)通過(guò)Sparksession提交SQL語(yǔ)句,任務(wù)像Spark應(yīng)用一樣,提交到集群中分布式運(yùn)行。D)SparksQL是Spark用來(lái)處理結(jié)構(gòu)化數(shù)據(jù)的一個(gè)模塊,可以在spark應(yīng)用中接使用SQL語(yǔ)句對(duì)數(shù)據(jù)進(jìn)行操作。[單選題]128.在輸入以0開(kāi)頭的文本型數(shù)據(jù)時(shí),需要在數(shù)據(jù)前面加()A)?B)?C):D)不加[單選題]129.()是一個(gè)數(shù)據(jù)序列化系統(tǒng),能保存持久化的數(shù)據(jù)到hdfs,能傳輸并且反序列化為高級(jí)數(shù)據(jù)結(jié)構(gòu)。A)AvroB)HttPFSBC)MahoutD)Snappy[單選題]130.下面屬于圖計(jì)算技術(shù)的是:()A)PregelB)DremelC)ImpalaD)DStream[單選題]131.在圖像識(shí)別中,(__)是重中之重。A)人臉識(shí)別B)物品識(shí)別C)色彩識(shí)別D)輪廓識(shí)別[單選題]132.()選擇成為支持向量機(jī)的最大變數(shù)A)核函數(shù)B)樣本空間C)模型D)算法[單選題]133.關(guān)于OTS中數(shù)據(jù)查詢的說(shuō)法正確的是:()。A)查詢時(shí)僅需要提供分片鍵即可B)可以創(chuàng)建索引,然后基于索引列進(jìn)行查詢C)查詢時(shí)可以僅提供主鍵的一部分,但是和組成主鍵的列的順序有關(guān)D)單行查詢必須提供主鍵[單選題]134.下列機(jī)器學(xué)習(xí)算法中,不需要?dú)w一化處理的是()。A)DecisionTreeB)SVMC)K-meansD)LogisticRegression[單選題]135.有N個(gè)樣本,一般用于訓(xùn)練,一般用于測(cè)試若N增大,則訓(xùn)練誤差和測(cè)試誤差之間的差距會(huì)()A)增大B)減小C)無(wú)法確定D)無(wú)明顯變化[單選題]136.以下說(shuō)法錯(cuò)誤的是()A)當(dāng)目標(biāo)函數(shù)是凸函數(shù)時(shí),梯度下降的解時(shí)全局最優(yōu)解B)進(jìn)行PCA降雄時(shí)需要計(jì)算協(xié)方差矩陣C)沿負(fù)梯度下降的方向一定是最優(yōu)的方向D)利用拉格朗日函數(shù)能解帶約束的優(yōu)化問(wèn)題[單選題]137.在留出法、交叉驗(yàn)證法和自助法三種評(píng)估方法中,()更適用于數(shù)據(jù)集較小、難以劃分訓(xùn)練集和測(cè)試集的情況。A)留出法B)交叉驗(yàn)證法C)自助法D)留一法[單選題]138.下面關(guān)于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的描述錯(cuò)誤的是:()A)機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科B)數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中信息的過(guò)程。C)數(shù)據(jù)挖掘可以視為機(jī)器學(xué)習(xí)與數(shù)據(jù)庫(kù)的交叉D)數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)的底層技術(shù)[單選題]139.Oracle返回字符串長(zhǎng)度的函數(shù)是()A)len()B)length()C)left()D)long()[單選題]140.()與HDFS類(lèi)似。A)NTFSB)FAT32C)GFSD)EXT3[單選題]141.下列能體現(xiàn)大數(shù)據(jù)思維的是()A)大數(shù)據(jù)思維是要追求數(shù)據(jù)的精確性B)大數(shù)據(jù)思維是要抓住樣本數(shù)據(jù)C)大數(shù)據(jù)思維是要通過(guò)少量數(shù)據(jù)觀察數(shù)據(jù)間關(guān)系D)大數(shù)據(jù)思維是要從自然思維轉(zhuǎn)變?yōu)橹悄芩季S[單選題]142.下面回歸模型中的哪個(gè)步驟/假設(shè)最能影響過(guò)擬合和欠擬合之間的平衡因素()。A)多項(xiàng)式的階數(shù)B)是否通過(guò)矩陣求逆或梯度下降學(xué)習(xí)權(quán)重C)使用常數(shù)項(xiàng)D)使用正則化[單選題]143.在HBase系統(tǒng)架構(gòu)中,每一個(gè)HRegionServer中的所有對(duì)象會(huì)共享一個(gè)()實(shí)例A)HLogB)MasterC)ClientD)ZooKeeper[單選題]144.HBase作為數(shù)據(jù)存儲(chǔ)組件封裝于大數(shù)據(jù)平臺(tái),用于()存儲(chǔ)。A)關(guān)系型數(shù)據(jù)庫(kù)B)分布式文件C)非關(guān)系型數(shù)據(jù)庫(kù)D)列式存儲(chǔ)第2部分:多項(xiàng)選擇題,共62題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]145.Spark中的Scheduler模塊可以分為以下哪幾個(gè)部分?A)DAGSchedulerB)ResourceSchedulerC)TaskSchedulerD)JobScheduler[多選題]146.大數(shù)據(jù)技術(shù)的基礎(chǔ)包括()A)分布式文件系統(tǒng)B)分布式并行計(jì)算C)關(guān)系型數(shù)據(jù)庫(kù)D)分布式數(shù)據(jù)庫(kù)[多選題]147.下面說(shuō)法正確的選項(xiàng)有()。A)正確的縮進(jìn)對(duì)Python程序是非常重要的B)在表達(dá)式中圓括號(hào)可以改變運(yùn)算順序C)在Python3x中可以使用中文做變量名D)Python程序中的空格和空行可有可無(wú),但是適當(dāng)?shù)脑黾涌崭窈涂招锌梢蕴岣叽a的可讀性[多選題]148.數(shù)據(jù)故事化描述應(yīng)遵循的基本原則是()。A)忠于原始數(shù)據(jù)原則B)設(shè)定共同場(chǎng)景原則C)有效性利用原則D)3C精神原則[多選題]149.造成數(shù)據(jù)缺失的原因是多方面的,主要可能有()A)有些信息暫時(shí)無(wú)法獲取B)有些信息是被遺漏的C)有些對(duì)象的某個(gè)或某些屬性是不可用的D)獲取這些信息的代價(jià)太大[多選題]150.對(duì)于主成分分析方法,確定降維后低維空間的維數(shù)d的方法有()。A)由用戶事先指定B)通過(guò)在d值不同的低維空間中對(duì)開(kāi)銷(xiāo)較小的學(xué)習(xí)器進(jìn)行交叉驗(yàn)證來(lái)選取C)可從重構(gòu)的角度設(shè)置一個(gè)重構(gòu)閾值,選取使得特定公式成立的最小值D)隨機(jī)設(shè)置[多選題]151.云計(jì)算能夠給我們帶來(lái)什么?A)彈性配給B)按需自主服務(wù)C)進(jìn)行資源匯集D)按需硬性服務(wù)[多選題]152.名字節(jié)點(diǎn)主要負(fù)責(zé)()A)接受用戶操作請(qǐng)求B)維護(hù)文件系統(tǒng)的目錄結(jié)構(gòu)C)管理文件與block之間的關(guān)系D)管理block與datanode之間的關(guān)系[多選題]153.下面關(guān)于單樣本t檢驗(yàn)的說(shuō)法,錯(cuò)誤的是()。A)當(dāng)單樣本t檢驗(yàn)的自由度越來(lái)越大時(shí),正態(tài)分布越來(lái)越趨向于t分布B)單樣本t檢驗(yàn)適用于樣本量比較多(n>30)的情況C)t分布的不確定性比正態(tài)分布小,其原因是樣本數(shù)量比較小D)單樣本t檢驗(yàn)通常也被叫作學(xué)生t檢驗(yàn)[多選題]154.使用極大似然估計(jì)的前提條件有()。A)數(shù)據(jù)服從某種已知的特定數(shù)據(jù)分布型B)已經(jīng)得到了一部分?jǐn)?shù)據(jù)集C)提前已知某先驗(yàn)概率D)數(shù)據(jù)集各個(gè)屬性相對(duì)獨(dú)立[多選題]155.云計(jì)算包括哪3種類(lèi)型:()A)公有云B)獨(dú)立云C)私有云D)混合云[多選題]156.以下選項(xiàng)中,屬于HDFS架構(gòu)關(guān)鍵特性的是?A)HA高可靠性B)健壯機(jī)制C)元數(shù)據(jù)持久化機(jī)制D)多方式訪問(wèn)機(jī)制[多選題]157.以下關(guān)于大數(shù)據(jù)描述正確的是()。A)?涌現(xiàn)?是大數(shù)據(jù)的本質(zhì)特征B)大數(shù)據(jù)是對(duì)數(shù)量巨大、來(lái)源分散、格式多樣的數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析C)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要是2016年由國(guó)務(wù)院發(fā)布的D)大數(shù)據(jù)是以容量大、類(lèi)型多、存取速度快、應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合[多選題]158.下列關(guān)于情感分析的說(shuō)法正確的是?A)簡(jiǎn)單而言,是對(duì)帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過(guò)程B)情感分析的發(fā)展得益于社交媒體的興起C)按照處理文本的粒度不同,情感分析大致可分為詞語(yǔ)級(jí),句子級(jí)、篇章級(jí)三個(gè)D)情感分析可以應(yīng)用于文本挖掘[多選題]159.如何培養(yǎng)適應(yīng)泛在電力物聯(lián)網(wǎng)建設(shè)和發(fā)展需要的人才隊(duì)伍A)優(yōu)化新興業(yè)務(wù)和產(chǎn)業(yè)公司管理模式B)優(yōu)化市場(chǎng)化用工策略C)加大人才引進(jìn)力度D)建立激勵(lì)措施[多選題]160.下列對(duì)字符串函數(shù)或方法說(shuō)法正確的有()A)istitle()如果字符串是標(biāo)題化的(見(jiàn)title())則返回True,否則返回FalseB)max(str)返回字符串str中最大的字母。C)replace(old,new,max)把將字符串中的str1替換成str2,如果max指定,則替換不超過(guò)max次D)upper()轉(zhuǎn)換字符串中所有大寫(xiě)字符為小寫(xiě).[多選題]161.人類(lèi)社會(huì)的數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了哪三個(gè)階段:()A)手工生產(chǎn)階段B)運(yùn)營(yíng)式系統(tǒng)階段C)用戶原創(chuàng)內(nèi)容階段D)感知式系統(tǒng)階段[多選題]162.Spark組成部件包括()A)ResourceManagerB)ExecutorC)DriverD)RDD[多選題]163.ADS的維度表租中存放的表的特點(diǎn)包括:()。A)數(shù)據(jù)量較小B)為星型或者雪花型C)記錄條數(shù)據(jù)不超過(guò)100萬(wàn)或者不大于1GD)需要和任何表關(guān)聯(lián)[多選題]164.完成智慧物聯(lián)體系試點(diǎn)建設(shè),試點(diǎn)建成企業(yè)級(jí)物聯(lián)管理中心,實(shí)現(xiàn)()100%標(biāo)準(zhǔn)化接入和統(tǒng)一物聯(lián)管理,初步具備能力開(kāi)放功能A)輸變電B)配用電C)客戶增量設(shè)備D)基礎(chǔ)增量設(shè)備[多選題]165.下列算法可以應(yīng)用于圖像分割的有()。A)邊緣檢測(cè)技術(shù)B)閾值分割技術(shù)C)基于區(qū)域的分割技術(shù)D)區(qū)域生長(zhǎng)方法[多選題]166.對(duì)于安全模式下列說(shuō)法正確的是()A)SafeMode是NameNode的一種特殊狀態(tài),在這種狀態(tài)下,文件系統(tǒng)只接受讀數(shù)據(jù)請(qǐng)求(ls、cat),而不接受上傳、刪除、修改等變更請(qǐng)求。B)HDFS處于安全模式下,block不能進(jìn)行任何的副本復(fù)制操作。C)在HDFS集群正常冷啟動(dòng)時(shí),NameNode會(huì)在SafeMode狀態(tài)下維持相當(dāng)長(zhǎng)的一段時(shí)間,此時(shí)你不需要去理會(huì),等待它自動(dòng)退出安全模式即可。D)在HDFS集群正常冷啟動(dòng)時(shí),NameNode會(huì)進(jìn)入SafeMode狀態(tài),這是因?yàn)閒simage鏡像文件中缺少文件的路徑信息和相關(guān)副本數(shù)[多選題]167.下面屬于詞袋模型的缺點(diǎn)的是?()A)詞匯表的詞匯需要經(jīng)過(guò)精心設(shè)計(jì)B)表示具有稀疏性C)丟失詞序忽略了上下文D)模型復(fù)雜,不利于實(shí)施[多選題]168.Spark比MapReduce計(jì)算快的原因有()。A)基于內(nèi)存的計(jì)算B)基于DAG的調(diào)度框架C)基于Lineage的容錯(cuò)機(jī)制D)基于分布式計(jì)算的框架[多選題]169.語(yǔ)句select*fromproductswhereprod_namelike'%se%'結(jié)果集包括()A)檢索products表中prod_name字段以'se'結(jié)尾的數(shù)據(jù)B)檢索products表中prod_name字段以'se'開(kāi)關(guān)的數(shù)據(jù)C)檢索products表中prod_name字段包含'se'的數(shù)據(jù)D)檢索products表中prod_name字段不包含'se'的數(shù)據(jù)[多選題]170.在ApacheHadoop中,關(guān)于HDFS的回收站機(jī)制,描述正確的是?()A)回收站里的文件可以快速恢復(fù)。B)可以設(shè)置一個(gè)時(shí)間閥值,當(dāng)回收姑里文件的存放時(shí)間超過(guò)這個(gè)閥值或是回收站被清空時(shí),文件才會(huì)被徹底刪除,并且釋放占用的數(shù)據(jù)塊。C)刪除文件時(shí),不會(huì)真正的冊(cè)除,其實(shí)是放入回收站。D)回收站默認(rèn)是關(guān)閉的。[多選題]171.下面屬于范數(shù)規(guī)則化的作用的是()。A)保證模型盡可能的簡(jiǎn)單,避免過(guò)擬合B)約束模型特征C)最小化問(wèn)題D)最大化問(wèn)題[多選題]172.流式計(jì)算的應(yīng)用場(chǎng)景包括:()。A)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)B)實(shí)時(shí)監(jiān)控C)實(shí)時(shí)報(bào)表D)流式數(shù)據(jù)分析[多選題]173.以下關(guān)于詞袋模型的敘述正確的是()。A)詞袋模型可以理解為將所有詞語(yǔ)裝進(jìn)一個(gè)袋子里B)詞袋模型需要考慮語(yǔ)序問(wèn)題C)詞袋模型需要考慮詞法問(wèn)題D)詞袋模型中的每個(gè)詞是獨(dú)立的[多選題]174.下面關(guān)于數(shù)字鴻溝問(wèn)題的描述,正確的是:()A)數(shù)字鴻溝被認(rèn)為是信息時(shí)代的?馬太效應(yīng)?,即先進(jìn)技術(shù)的成果不能為人公享,于是造成?富者越富、窮者越窮?的情況B)數(shù)字鴻溝因?yàn)榇髷?shù)據(jù)技術(shù)的誕生而趨向彌合C)數(shù)字鴻溝是一個(gè)涉及公平公正的問(wèn)題D)在我國(guó),東中西部地區(qū)、城鄉(xiāng)之間等都可以明顯感受到數(shù)字鴻溝的存在[多選題]175.HDFS聯(lián)邦環(huán)境下,NameSpace答案:命名空間包含以下哪些內(nèi)容?A)目錄B)文件C)塊D)以上全不正確[多選題]176.主成分分析(PCA)是一種重要的降維技術(shù),以下對(duì)于PCA的描述正確的是(___)。A)主成分分析是一種無(wú)監(jiān)督方法B)主成分?jǐn)?shù)量一定小于等于特征的數(shù)量C)各個(gè)主成分之間相互正交D)PCA擁有最近可分性和最大重構(gòu)性等性質(zhì)[多選題]177.下列運(yùn)算符中合法的是()。A)%=B)&=C)**=D)|=[多選題]178.HBase的系統(tǒng)架構(gòu)包括哪兒個(gè)組成:()A)客戶端B)Zookeeper服務(wù)器C)Master主服務(wù)器D)Region服務(wù)器[多選題]179.下面哪些關(guān)鍵詞是Kafka的特點(diǎn)?A)高吞吐B)分布式C)消息持久化D)支持消息隨機(jī)讀取[多選題]180.下列選項(xiàng)參數(shù)是Sqoop指令的是?()()A)importB)outputC)inputD)export[多選題]181.合并操作與連接相似,因?yàn)樗麄兌际菍蓚€(gè)表合并起來(lái)形成另一個(gè)表的方法。但它們的合并方法有本質(zhì)上的不同。以下選項(xiàng)中說(shuō)法正確的有()A)在合并中,兩個(gè)表源列的數(shù)量與數(shù)據(jù)類(lèi)型可以不相同B)在合并中,兩個(gè)表源列的數(shù)量與數(shù)據(jù)類(lèi)型必須相同C)在聯(lián)接中,行的最大數(shù)量是兩個(gè)表行的?和?D)在聯(lián)接中,行的最大數(shù)量是它們的?乘積?[多選題]182.下列關(guān)于RNN、LSTM、GRU說(shuō)法正確的是()A)RNNI入了循環(huán)的概念B)LSTM可以防止梯度消失或者爆炸C)GRU是LSTM的變體D)RNN、LSTM、GRU是同一神經(jīng)網(wǎng)絡(luò)的不同說(shuō)法沒(méi)有區(qū)別[多選題]183.下面關(guān)于flink窗口的描述錯(cuò)誤的是A)滾動(dòng)窗口在時(shí)間上是重疊的B)滾動(dòng)窗口在時(shí)間上是不重疊的C)滑動(dòng)動(dòng)窗口之間時(shí)間點(diǎn)不存在重疊D)滑動(dòng)窗口之間時(shí)間點(diǎn)存在重疊[多選題]184.關(guān)于HDFS的文件寫(xiě)人,正確的是()。A)不支持多用戶對(duì)同一文件的寫(xiě)操作B)用戶不可以在文件任意位置進(jìn)行修改C)默認(rèn)將文件復(fù)制成三份存放D)復(fù)制的文件塊默認(rèn)不存在同一機(jī)架上[多選題]185.某餐飲O2O公司,立足于分析簽約餐廳的用戶用餐數(shù)據(jù),提供用戶菜品推薦,以下說(shuō)法正確的有:()。A)可以利用Maxcompute的海量數(shù)據(jù)處理能力,對(duì)簽約餐廳的用戶用餐數(shù)據(jù)進(jìn)行離線分析B)可以使用ADS的多值列,可以在一條用餐記錄中包含多個(gè)菜品,減少join的次數(shù),提供處理效率C)可以使用ADS的實(shí)時(shí)插入特性的表,可以支持一些OLTP類(lèi)的場(chǎng)景D)可以利用OTS的高并發(fā)低延時(shí)的特性,支持一些在線分析,即將產(chǎn)生的業(yè)務(wù)數(shù)據(jù)存入OTS中,進(jìn)行一些簡(jiǎn)單的join和計(jì)算[多選題]186.從方法體系看,數(shù)據(jù)可視化方法可以分為三個(gè)不同的層次(__)。A)領(lǐng)域方法B)基礎(chǔ)方法C)方法論D)智能方法[多選題]187.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有哪些關(guān)鍵特性?A)容災(zāi)能力B)靈活性C)消息可靠性D)可伸縮性[多選題]188.關(guān)于泛在電力物聯(lián)網(wǎng)功能模塊間流轉(zhuǎn)方向正確的是()A)數(shù)據(jù)匯聚執(zhí)行反饋由邊緣智能-》物聯(lián)管理中心B)數(shù)據(jù)匯聚需求導(dǎo)入由對(duì)內(nèi)/外業(yè)務(wù)-》數(shù)據(jù)中臺(tái)C)合作伙伴將數(shù)據(jù)匯聚至物聯(lián)管理中心D)對(duì)內(nèi)、外業(yè)務(wù)和能源生態(tài)進(jìn)行交互[多選題]189.下列關(guān)于集合操作結(jié)果正確的有()A)name={?d?,?s?}name.add(?sd?)name值為:{?sd?,?d?,?s?}B)name={?sd?,d?,?s?}name.remove(?s?)name值為:{?sd?,?d?}C)name={?sd?,d?,?s?}name.clear()name值為:{}D)name={?sd?,d?,?s?}name.update(?df?)name值為:{?sd?,?d?,?f?,?s?,?j?}[多選題]190.下列說(shuō)法中正確的有()。A)云計(jì)算的主要特點(diǎn)是非常昂貴B)大數(shù)據(jù)是多源、異構(gòu)、動(dòng)態(tài)的復(fù)雜數(shù)據(jù),即具有4V特征的數(shù)據(jù)42C)大數(shù)據(jù)是數(shù)據(jù)科學(xué)的研究對(duì)象之一D)MapReduce是采用云計(jì)算這種新的計(jì)算模式研發(fā)出的具體工具軟件(或算法)[多選題]191.以下關(guān)于華為大數(shù)據(jù)解決方案說(shuō)法正確的是A)GaussDB是一款開(kāi)源數(shù)據(jù)庫(kù)產(chǎn)品B)Farmer是數(shù)據(jù)服務(wù)框架C)FusionInsightManager是一個(gè)分布式系統(tǒng)管理框架,管理員可以通過(guò)多接入點(diǎn)操控分布式集群D)FusionInsightHD是基于開(kāi)源大數(shù)據(jù)軟件Hadoop的增強(qiáng)版本[多選題]192.以下關(guān)于Flink與其它組件交互說(shuō)法正確的是?A)Flink任務(wù)的運(yùn)行依賴Yarn來(lái)進(jìn)行資源的調(diào)度管理B)Flink的checkpoint的實(shí)現(xiàn)依賴于ZookeeperC)Flink可以將接收的組件發(fā)送給KafkaD)Flink在HDFS文件系統(tǒng)中讀寫(xiě)數(shù)據(jù)[多選題]193.本行數(shù)據(jù)治理工作遵循?四性?原則是()A)全覆蓋原則B)匹配性原則C)持續(xù)性原則D)有效性原則[多選題]194.()是通過(guò)對(duì)無(wú)標(biāo)記訓(xùn)練樣本的學(xué)習(xí)來(lái)進(jìn)行分類(lèi)的。A)密度估計(jì)B)異常檢測(cè)C)線性回歸D)聚類(lèi)分析[多選題]195.FusionlnsightHD集群升級(jí),以下描述準(zhǔn)確的有A)升級(jí)過(guò)程中不可以手動(dòng)操作注射泵OMS倒換B)集群內(nèi)所有主機(jī)root賬號(hào)密碼要保持一致C)保持網(wǎng)絡(luò)暢通,避免因網(wǎng)絡(luò)問(wèn)題導(dǎo)致升級(jí)異常D)觀察期不能做擴(kuò)容[多選題]196.Hive中的查詢語(yǔ)句命令的別名使用描述正確的是()【選兩項(xiàng)】A)別名在單表查詢中作用不大,所以單表查詢命令不能使用別名B)涉及到多個(gè)不同的表查詢,使用別名能簡(jiǎn)化命令凸顯其優(yōu)勢(shì)C)對(duì)于多表的連接查詢使用別名能方便程序代碼的可讀性以及后期代碼的維護(hù)D)不管任何情況下使用別名進(jìn)行查詢會(huì)更好[多選題]197.關(guān)于分析學(xué)習(xí)和歸納學(xué)習(xí)的比較,說(shuō)法正確的是()。A)歸納學(xué)習(xí)擬合數(shù)據(jù)假設(shè),分析學(xué)習(xí)擬合領(lǐng)域理論的假設(shè)B)歸納學(xué)習(xí)論證方式為統(tǒng)計(jì)推理,分析學(xué)習(xí)為演繹推理C)歸納學(xué)習(xí)不需要先驗(yàn)知識(shí)D)訓(xùn)練數(shù)據(jù)不足時(shí)歸納學(xué)習(xí)可能會(huì)失敗[多選題]198.信息的碎片化導(dǎo)致了()的碎片化。A)時(shí)間B)空間C)資源D)結(jié)構(gòu)[多選題]199.下面關(guān)于中心極限定理的說(shuō)法,正確的是()。A)中心極限定理說(shuō)明,對(duì)于大量相互獨(dú)立的隨機(jī)變量,其均值的分布以正態(tài)分布為極限B)中心極限定理說(shuō)明,對(duì)于大量相互獨(dú)立的隨機(jī)變量,其均值的分布以t分布為極限C)中心極限定理為Z檢驗(yàn)提供了理論支持D)中心極限定理是數(shù)理統(tǒng)計(jì)學(xué)和誤差分析的基礎(chǔ)[多選題]200.Redis的AOF持久化中,寫(xiě)命令同步的時(shí)機(jī)有以下哪幾項(xiàng)?A)appendfsyncnoneB)appendfsynceverysecC)appendfsyncnoD)appendfsyncalways[多選題]201.下列網(wǎng)絡(luò)結(jié)構(gòu)中可以應(yīng)用于圖像識(shí)別任務(wù)的有()。A)LeNet-5B)AlexNetC)CNND)VGG-net[多選題]202.企業(yè)數(shù)據(jù)孤島產(chǎn)生的原因主要包括哪兩個(gè)方面:()A)以功能為標(biāo)準(zhǔn)的部門(mén)導(dǎo)致數(shù)據(jù)孤島B)不同類(lèi)型、不同版本的信息化管理系統(tǒng)導(dǎo)致數(shù)據(jù)孤島C)機(jī)構(gòu)設(shè)置不合理D)各個(gè)部門(mén)責(zé)權(quán)利不清晰[多選題]203.以下哪項(xiàng)是事務(wù)特性()A)獨(dú)立性B)持久性C)原子性D)一致性[多選題]204.根據(jù)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(國(guó)發(fā)〔2015〕50號(hào)),大數(shù)據(jù)發(fā)展和應(yīng)用在未來(lái)5-10年確定要逐步實(shí)現(xiàn)的目標(biāo)包括()。A)建立運(yùn)行平穩(wěn)、安全高效的經(jīng)濟(jì)運(yùn)行新機(jī)制B)構(gòu)建以人為本、惠及全民的民生服務(wù)新體系C)開(kāi)啟大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新的創(chuàng)新驅(qū)動(dòng)新格局D)培育高端智能、新興繁榮的產(chǎn)業(yè)發(fā)展新生態(tài)[多選題]205.在Hive架構(gòu)中支持對(duì)數(shù)據(jù)的操作有()。A)插入B)查詢C)刪除D)分析[多選題]206.下列關(guān)于基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式和傳統(tǒng)的營(yíng)銷(xiāo)模式的說(shuō)法中,錯(cuò)誤的是()。A)傳統(tǒng)營(yíng)銷(xiāo)模式比基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式投入更小B)傳統(tǒng)營(yíng)銷(xiāo)模式比基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式針對(duì)性更強(qiáng)C)傳統(tǒng)營(yíng)銷(xiāo)模式比基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式轉(zhuǎn)換率低D)基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式比傳統(tǒng)營(yíng)銷(xiāo)模式實(shí)時(shí)性更強(qiáng)E)基于大數(shù)據(jù)的營(yíng)銷(xiāo)模式比傳統(tǒng)營(yíng)銷(xiāo)模式標(biāo)準(zhǔn)性更強(qiáng)第3部分:判斷題,共42題,請(qǐng)判斷題目是否正確。[判斷題]207.實(shí)例方法可以由類(lèi)和對(duì)象調(diào)用。()A)正確B)錯(cuò)誤[判斷題]208.在MaCompute中,通常使用SQLDML中的UPDATE更新MaxCompute表或者分區(qū)中的數(shù)據(jù)。A)正確B)錯(cuò)誤[判斷題]209.已知a=npA)正確B)錯(cuò)誤[判斷題]210.AnalyticDB需要用戶提前根據(jù)應(yīng)用需求為相關(guān)的列創(chuàng)建索引,以提升查詢速度。A)正確B)錯(cuò)誤[判斷題]211.奧巴馬認(rèn)為,對(duì)大數(shù)據(jù)的占有與控制,反映的是一個(gè)國(guó)家的核心能力之大小。因此,他已經(jīng)將大數(shù)據(jù)上升到國(guó)家戰(zhàn)略高度。A)正確B)錯(cuò)誤[判斷題]212.在循環(huán)中break語(yǔ)句的作用是結(jié)束該語(yǔ)句所在的循環(huán)。A)正確B)錯(cuò)誤[判斷題]213.某公司大數(shù)據(jù)業(yè)務(wù)存在多種計(jì)算任務(wù),包括使用CPU,GPU等多種異構(gòu)計(jì)算芯片,為了保證資源的合理利用調(diào)度,可以依據(jù)華為云Stack架構(gòu),構(gòu)建--站式平合,資源統(tǒng)--管理、按需分配。A)正確B)錯(cuò)誤[判斷題]214.字符串屬于Python有序序列,和列表、元組一樣都支持雙向索引A)正確B)錯(cuò)誤[判斷題]215.BI工具不能實(shí)現(xiàn)行級(jí)數(shù)據(jù)權(quán)限()A)正確B)錯(cuò)誤[判斷題]216.Combiner運(yùn)行O次、1次或多次,Reducer都會(huì)產(chǎn)生相同的輸出結(jié)果。A)正確B)錯(cuò)誤[判斷題]217.僅空間管理員可審計(jì)用戶權(quán)限,包含查看用戶列表、回收用戶權(quán)限、對(duì)用戶進(jìn)行授權(quán)。A)正確B)錯(cuò)誤[判斷題]218.describe()方法可以一次性輸出多個(gè)統(tǒng)計(jì)指標(biāo)。()A)正確B)錯(cuò)誤[判斷題]219.機(jī)器學(xué)習(xí)對(duì)噪聲數(shù)據(jù)具有高承受能力,并能對(duì)未經(jīng)過(guò)訓(xùn)練的數(shù)據(jù)具有分類(lèi)能力,但其需要很長(zhǎng)的訓(xùn)練時(shí)間,因而對(duì)于有足夠長(zhǎng)訓(xùn)練時(shí)間的應(yīng)用更合適。()A)正確B)錯(cuò)誤[判斷題]220.在HDFS里,若打開(kāi)其回收站機(jī)制,則刪除文件時(shí),文件不會(huì)立即真正被刪除。A)正確B)錯(cuò)誤[判斷題]221.當(dāng)學(xué)習(xí)器把訓(xùn)練樣本學(xué)得太好時(shí),很可能把訓(xùn)練樣本自身的一些特點(diǎn)當(dāng)作了所有潛在樣本都會(huì)具有的一般性質(zhì),會(huì)導(dǎo)致泛化性能下降。()A)正確B)錯(cuò)誤[判斷題]222.表達(dá)式'aaasdf'A)正確B)錯(cuò)誤[判斷題]223.Pandas創(chuàng)建對(duì)象時(shí),可以通過(guò)傳遞一個(gè)list對(duì)象來(lái)創(chuàng)建一個(gè)Series,pandas會(huì)默認(rèn)創(chuàng)建整型索引。A)正確B)錯(cuò)誤[判斷題]224.HadoopHA是兩臺(tái)NameNode同時(shí)執(zhí)行NameNode角色的工作。A)正確B)錯(cuò)誤[判斷題]225.在HDFS中,namenode用于決定數(shù)據(jù)存儲(chǔ)到哪一個(gè)datanode節(jié)點(diǎn)上。A)正確B)錯(cuò)誤[判斷題]226.對(duì)于帶有else子句的for循環(huán)和while循環(huán),當(dāng)循環(huán)因循環(huán)條件不成立而自然結(jié)束時(shí)不會(huì)執(zhí)行else中的代碼。A)正確B)錯(cuò)誤[判斷題]227.大數(shù)據(jù)分析結(jié)果可直接用于項(xiàng)目決策,不需要行業(yè)專(zhuān)家參與。A)正確B)錯(cuò)誤[判斷題]228.函數(shù)的位置參數(shù)有嚴(yán)格的位置關(guān)系。()A)正確B)錯(cuò)誤[判斷題]229.如果NameNode意外終止,SecondaryNameNode會(huì)接替它使集群繼續(xù)工作。A)正確B)錯(cuò)誤[判斷題]230.數(shù)據(jù)管理是指通過(guò)管理"數(shù)據(jù)"實(shí)現(xiàn)組織機(jī)構(gòu)的某種業(yè)務(wù)目的。而數(shù)據(jù)治理則指的是如何確保"數(shù)據(jù)管理"的順利、科學(xué)、有效進(jìn)行。()A)正確B)錯(cuò)誤[判斷題]231.對(duì)于生成器對(duì)象x=(3foriinrange(5)),連續(xù)兩次執(zhí)行l(wèi)ist(x)的結(jié)果是一樣的。A)正確B)錯(cuò)誤[判斷題]232.建立數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程一般包括清洗、抽取數(shù)據(jù)操作,統(tǒng)一數(shù)據(jù)格式,設(shè)定自動(dòng)程序建立數(shù)據(jù)倉(cāng)庫(kù)的過(guò)程一般包括清洗、抽取數(shù)據(jù)操作,統(tǒng)一數(shù)據(jù)格式,設(shè)定自動(dòng)程序以定時(shí)抽取操作數(shù)據(jù)并自動(dòng)更新數(shù)據(jù)倉(cāng)庫(kù),預(yù)先執(zhí)行合計(jì)計(jì)算等步驟。A)正確B)錯(cuò)誤[判斷題]233.Spark根據(jù)RDD的依賴關(guān)系來(lái)劃分stage,調(diào)度器從DAG圖末端出發(fā),逆向遍歷整個(gè)依賴關(guān)系,遇到窄依賴就斷開(kāi),遇到寬依賴就將其加入當(dāng)前stage。A)正確B)錯(cuò)誤[判斷題]234.大數(shù)據(jù)僅僅是指數(shù)據(jù)的體量大。A)正確B)錯(cuò)誤[判斷題]235.任何數(shù)據(jù)流必須有數(shù)據(jù)庫(kù)()A)正確B)錯(cuò)誤[判斷題]236.Python中一切內(nèi)容都可以稱(chēng)為對(duì)象。A)正確B)錯(cuò)誤[判斷題]237.列表對(duì)象的排序方法sort()只能按元素從小到大排列,不支持別的排序方式。A)正確B)錯(cuò)誤[判斷題]238.范式的目的主要是為了提高查詢效率。--A)正確B)錯(cuò)誤[判斷題]239.Sqoop進(jìn)行數(shù)據(jù)導(dǎo)出時(shí),也會(huì)進(jìn)行數(shù)據(jù)文件切片,與MapReduce切片類(lèi)似,可以通過(guò)修改參數(shù)block塊大小進(jìn)行切片數(shù)量?jī)?yōu)化。A)正確B)錯(cuò)誤[判斷題]240.執(zhí)行引擎的主要功能是解析用戶輸入的SQL查詢,生成執(zhí)行計(jì)劃。A)正確B)錯(cuò)誤[判斷題]241.如果定義類(lèi)時(shí)沒(méi)有編寫(xiě)析構(gòu)函數(shù),Python將提供一個(gè)默認(rèn)的析構(gòu)函數(shù)進(jìn)行必要的資源清理工作。A)正確B)錯(cuò)誤[判斷題]242.大數(shù)據(jù)安全主要任務(wù)是保證數(shù)據(jù)內(nèi)容的安全可靠,系統(tǒng)安全并不重要A)正確B)錯(cuò)誤[判斷題]243.()建立索引的目的在于加快查詢速度以及約束輸入的數(shù)據(jù)。A)正確B)錯(cuò)誤[判斷題]244.GraphBase可以完全替代關(guān)系型數(shù)據(jù)庫(kù)。A)正確B)錯(cuò)誤[判斷題]245.省略CROSSJOIN中的CROSS同樣可實(shí)現(xiàn)交叉連接。--A)正確B)錯(cuò)誤[判斷題]246.互聯(lián)網(wǎng)時(shí)代最為典型的特征是扁平化、單一向度A)正確B)錯(cuò)誤[判斷題]247.表達(dá)式'helloworld,helloweveryone'A)正確B)錯(cuò)誤[判斷題]248.DBSCAN是相對(duì)抗噪聲的,并且能夠處理任意形狀和大小的簇。()A)正確B)錯(cuò)誤第4部分:?jiǎn)柎痤},共11題,請(qǐng)?jiān)诳瞻滋幪顚?xiě)正確答案。[問(wèn)答題]249.利用python語(yǔ)言編寫(xiě)程序,實(shí)現(xiàn)以下功能:檢查字符串"Lifeisshort.Iusepython"中是否包含字符串"python",若包含則替換為"Python"后輸出新字符串,否則輸出原字符串。[問(wèn)答題]250.MultiIndex類(lèi)提供了3種創(chuàng)建層次化索引的方法,它們分別是from_tuples()、from_arrays()和【】。[問(wèn)答題]251.大數(shù)據(jù)在金融行業(yè)中的具體表現(xiàn)為()()、決策支持、服務(wù)創(chuàng)新以及產(chǎn)品創(chuàng)新。[問(wèn)答題]252.如果兩個(gè)變量相關(guān),它們()線性關(guān)系A(chǔ))一定是B)不一定是$;[問(wèn)答題]253.DataNode之間需要建立()通道,用于傳輸數(shù)據(jù)包。[問(wèn)答題]254.Hadoop提供的和yarn-env.sh配置文件是用來(lái)指定Hadoop和Yarn所需的運(yùn)行環(huán)境。[問(wèn)答題]255.在Hadoop集群中,NameNode負(fù)責(zé)管理所有DataNode。正確[問(wèn)答題]256.VM是否可以稱(chēng)為Pseudo?[問(wèn)答題]257.()是集群的主服務(wù)器,主要是用于對(duì)HDFS中所有的文件及內(nèi)容數(shù)據(jù)進(jìn)行維護(hù),并不斷讀取記錄集群中()主機(jī)情況與工作狀態(tài),并通過(guò)讀取與寫(xiě)入鏡像日志文件的方式進(jìn)行存儲(chǔ)。二.[問(wèn)答題]258.Slaves由什么組成?[問(wèn)答題]259.Hive創(chuàng)建桶表關(guān)鍵字(),且Hive默認(rèn)分桶數(shù)量是1。[單選題]260.TF-IDF模型中IDF是指(__)。A)詞頻數(shù)B)逆文檔頻率C)詞頻率D)逆文檔頻數(shù)1.答案:C解析:2.答案:C解析:3.答案:D解析:4.答案:D解析:5.答案:B解析:6.答案:C解析:欠擬合是指模型擬合程度不高,數(shù)據(jù)距離擬合曲線較遠(yuǎn),或指模型沒(méi)有很好地捕捉到數(shù)據(jù)特征,不能夠很好地?cái)M合數(shù)據(jù)。可通過(guò)增加特征解決。7.答案:D解析:8.答案:A解析:9.答案:D解析:10.答案:C解析:11.答案:D解析:隊(duì)列既能插入也能刪除數(shù)據(jù),并且是先進(jìn)先出的線性表12.答案:C解析:13.答案:D解析:應(yīng)該是run方法完成,不是main方法完成14.答案:A解析:15.答案:B解析:16.答案:A解析:17.答案:B解析:18.答案:C解析:19.答案:C解析:20.答案:C解析:21.答案:D解析:22.答案:D解析:23.答案:B解析:情感分析上層的研究和應(yīng)用主要是為情感信息抽取。24.答案:A解析:25.答案:C解析:領(lǐng)域方法在所屬領(lǐng)域內(nèi)其可視化的信度和效果高于基礎(chǔ)方法的直接應(yīng)用。26.答案:D解析:27.答案:A解析:28.答案:A解析:29.答案:D解析:30.答案:A解析:31.答案:A解析:32.答案:C解析:33.答案:A解析:34.答案:C解析:35.答案:C解析:36.答案:D解析:電費(fèi)賬單查詢屬于簡(jiǎn)單報(bào)表查詢,用電情況分析、竊電行為分析、基于交易大數(shù)據(jù)分析用戶的購(gòu)買(mǎi)習(xí)慣、基于傳感器感知的海量數(shù)據(jù)分析自然災(zāi)害的危害程度、基于搜索引擎的搜索關(guān)鍵詞分析社會(huì)熱點(diǎn)等屬于大數(shù)據(jù)應(yīng)用。37.答案:C解析:常用的數(shù)據(jù)歸約方法有維歸約和值歸約兩種。38.答案:C解析:39.答案:D解析:40.答案:C解析:41.答案:C解析:42.答案:C解析:43.答案:A解析:44.答案:C解析:45.答案:A解析:46.答案:A解析:47.答案:D解析:48.答案:B解析:49.答案:D解析:50.答案:A解析:51.答案:B解析:52.答案:A解析:53.答案:A解析:54.答案:B解析:切片得到索引從i到末尾。55.答案:C解析:56.答案:A解析:57.答案:A解析:58.答案:D解析:59.答案:C解析:數(shù)據(jù)預(yù)處理是對(duì)原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約的過(guò)程。頻繁模式挖掘、分類(lèi)和預(yù)測(cè)和數(shù)據(jù)流挖掘均屬于數(shù)據(jù)挖掘范疇。60.答案:C解析:61.答案:B解析:stackplot()函數(shù)用于繪制堆積折線圖。62.答案:B解析:63.答案:C解析:64.答案:A解析:65.答案:D解析:66.答案:D解析:67.答案:B解析:68.答案:A解析:69.答案:C解析:70.答案:A解析:71.答案:D解析:72.答案:C解析:73.答案:A解析:74.答案:C解析:欠擬合是指對(duì)訓(xùn)練樣本的一般性質(zhì)尚未學(xué)好,因此訓(xùn)練誤差和測(cè)試誤差均較大75.答案:B解析:76.答案:C解析:77.答案:D解析:78.答案:D解析:79.答案:C解析:80.答案:C解析:81.答案:C解析:82.答案:C解析:83.答案:C解析:84.答案:B解析:85.答案:B解析:86.答案:D解析:87.答案:A解析:88.答案:B解析:PCA()是一種常用的降維方法,在數(shù)據(jù)維度較高時(shí)使用。89.答案:D解析:90.答案:D解析:91.答案:D解析:92.答案:D解析:Hive支持原生數(shù)據(jù)類(lèi)型(TinyInt、SmallInt、Int、BigInt、Boolean、Float、Double、String),也支持復(fù)雜數(shù)據(jù)類(lèi)型(Map、Array、Struct、Union),不支持Long。93.答案:C解析:94.答案:B解析:95.答案:B解析:96.答案:D解析:97.答案:D解析:98.答案:B解析:99.答案:B解析:100.答案:D解析:101.答案:B解析:102.答案:A解析:103.答案:C解析:104.答案:A解析:105.答案:A解析:106.答案:A解析:107.答案:B解析:108.答案:C解析:109.答案:B解析:110.答案:C解析:111.答案:D解析:112.答案:B解析:DMM的執(zhí)行級(jí)(PerformedLevel):組織機(jī)構(gòu)只在個(gè)別項(xiàng)目的范圍之內(nèi)執(zhí)行了DMM給出的關(guān)鍵過(guò)程,但缺乏機(jī)構(gòu)層次的統(tǒng)籌與管理。主要特點(diǎn)如下:①在具體項(xiàng)目中,DMM關(guān)鍵過(guò)程域(KPA)中給出的關(guān)鍵過(guò)程(KeyProcess)已被執(zhí)行,但隨意性和臨時(shí)性較大。②DMM關(guān)鍵過(guò)程(KeyProcess)的執(zhí)行往往僅限于特定業(yè)務(wù)范疇,很少存在跨越不同業(yè)務(wù)領(lǐng)域的關(guān)鍵過(guò)程。③缺少針對(duì)DMM關(guān)鍵過(guò)程(KeyProcess)的反饋與優(yōu)化。以DMM關(guān)鍵過(guò)程(KeyProcess)中的數(shù)據(jù)質(zhì)量為例,其數(shù)據(jù)管理工作可能過(guò)于集中在一個(gè)特定業(yè)務(wù),如數(shù)據(jù)修復(fù)活動(dòng),并沒(méi)有擴(kuò)散到整個(gè)的業(yè)務(wù)范圍或并沒(méi)有開(kāi)展對(duì)數(shù)據(jù)修復(fù)活動(dòng)本身的反饋與優(yōu)化工作;④雖然有可能在特定業(yè)務(wù)過(guò)程中已進(jìn)行了基礎(chǔ)性改進(jìn),但沒(méi)有進(jìn)行持續(xù)跟進(jìn),也未拓展到整個(gè)組織機(jī)構(gòu);⑤組織機(jī)構(gòu)沒(méi)有統(tǒng)籌其數(shù)據(jù)管理工作,而數(shù)據(jù)管理活動(dòng)局限在具體項(xiàng)目中,主要按照其具體項(xiàng)目的實(shí)施需求進(jìn)行,如果一個(gè)具體項(xiàng)目中需要進(jìn)行數(shù)據(jù)管理,可能會(huì)執(zhí)行DMM中給出的相關(guān)過(guò)程,反之亦然。113.答案:C解析:114.答案:B解析:由于神經(jīng)網(wǎng)絡(luò)淺層網(wǎng)絡(luò)主要提取圖像的低維特征,對(duì)于相近領(lǐng)域進(jìn)行遷移學(xué)習(xí)時(shí),這些低維特征相同,因此只需要對(duì)最后幾層進(jìn)行微調(diào),而檢測(cè)位置相當(dāng)于回歸任務(wù)。115.答案:D解析:116.答案:C解析:groupby是分組函數(shù),分組的結(jié)果是一個(gè)group對(duì)象,結(jié)果需要進(jìn)行聚合或迭代操作才能查看。117.答案:B解析:數(shù)據(jù)產(chǎn)品是可以發(fā)揮數(shù)據(jù)價(jià)值去輔助用戶更優(yōu)的做決策(甚至行動(dòng))的一種產(chǎn)品形式。118.答案:B解析:119.答案:A解析:120.答案:C解析:121.答案:A解析:122.答案:A解析:np.nonzero()函數(shù)是提取數(shù)組中不為0的下標(biāo),返回的結(jié)果為每一個(gè)位置的下標(biāo)數(shù)組組成的元組。123.答案:D解析:124.答案:B解析:125.答案:A解析:126.答案:A解析:127.答案:A解析:128.答案:B解析:129.答案:A解析:130.答案:A解析:131.答案:D解析:132.答案:A解析:133.答案:D解析:134.答案:A解析:DecisionTree屬于概率模型,不需要?dú)w一化處理;SVM、K-means和LogisticRegression之類(lèi)的最優(yōu)化問(wèn)題需要?dú)w一化處理。135.答案:B解析:136.答案:C解析:137.答案:C解析:138.答案:D解析:139.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論