大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)_第1頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)_第2頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)_第3頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)_第4頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷17)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.下列不屬于大數(shù)據(jù)4V特性的是().A)大量B)多樣C)高速D)快捷答案:D解析:[單選題]2.一個(gè)HDFS集群是由一個(gè)名字節(jié)點(diǎn)和多個(gè)()組成。A)索引節(jié)點(diǎn)B)根節(jié)點(diǎn)C)名字節(jié)點(diǎn)D)數(shù)據(jù)節(jié)點(diǎn)答案:D解析:[單選題]3.在高階數(shù)據(jù)處理中,往往無(wú)法把整個(gè)流程寫在單個(gè)MapReduce作業(yè)中,下列關(guān)于鏈接MapReduce作業(yè)的說(shuō)法,不正確的是A)Job和JobControl類可以管理非線性作業(yè)之間的依賴B)ChainMapper和ChainReducer類可以用來(lái)簡(jiǎn)化數(shù)據(jù)預(yù)處理和后處理的構(gòu)成C)使用ChainReducer時(shí),每個(gè)mapper和reducer對(duì)象都有一個(gè)本地JobConf對(duì)象D)ChainReducer.addMapper()方法中,一般對(duì)鍵/值對(duì)發(fā)送設(shè)置成值傳遞,性能好且安全性高答案:D解析:ChainReducer.addMapper()方法中,值傳遞安全性高,引用傳遞性能高[單選題]4.下列算法中,不屬于外推法的是()。A)移動(dòng)平均法B)回歸分析法C)指數(shù)平滑法D)季節(jié)指數(shù)法答案:B解析:外推法(Extrapolation)是根據(jù)過(guò)去和現(xiàn)在的發(fā)展趨勢(shì)推斷未來(lái)的一類方法的總稱,回歸分析法不屬于外推法。[單選題]5.存儲(chǔ)過(guò)程的調(diào)用有幾種方式(A)3B)1C)4D)2答案:B解析:[單選題]6.Relief是為()問(wèn)題設(shè)計(jì)的。A)二分類B)多分類C)回歸D)降維答案:A解析:[單選題]7.下列不屬于Action操作的是()。A)collectB)filterC)reduceD)count答案:B解析:Action常用的函數(shù)為reduce、collect、count、take、first、foreach等。[單選題]8.計(jì)算機(jī)初始狀態(tài)能識(shí)別(__)上的基本信息。A)像素點(diǎn)B)每個(gè)物體C)背景D)前景答案:A解析:[單選題]9.王先生近期收到了一封電子郵件,發(fā)件人顯示是某同事,但該郵件十分可疑,沒有任何與工作相關(guān)內(nèi)容,郵件中帶有一個(gè)陌生的網(wǎng)站鏈接,要求他訪問(wèn)并使用真實(shí)姓名注冊(cè),這可能屬于哪種攻擊手段?()A)DDOS攻擊B)釣魚攻擊C)水坑攻擊D)緩沖區(qū)溢出攻擊答案:B解析:[單選題]10.HDFS默認(rèn)備份數(shù)量?()A)0B)1C)2D)3答案:D解析:[單選題]11.啟動(dòng)HDFS上的垃圾回收機(jī)制只需要配置兩個(gè)參數(shù):一個(gè)是erval,另外一個(gè)是erval,若是erval的值設(shè)置為0,則表示()A)表示垃圾檢查點(diǎn)之間的分鐘數(shù)為0分鐘B)表示和erval的值相等C)表示自動(dòng)開啟垃圾回收功能D)表示禁用垃圾回收功能答案:D解析:[單選題]12.Sqoop是一種用于在Hadoop和()之間傳輸數(shù)據(jù)的工具。A)HiveB)OracleC)關(guān)系型數(shù)據(jù)庫(kù)D)MySQL答案:C解析:[單選題]13.下列關(guān)于熱力點(diǎn)圖的說(shuō)法中,錯(cuò)誤的是()A)熱力點(diǎn)圖是指根據(jù)數(shù)據(jù)的結(jié)果、以不同熱力色展示出數(shù)據(jù)大小的圖表B)在熱力點(diǎn)圖中,顏色越熱烈往往意味著數(shù)值越大C)我們可以設(shè)置熱力點(diǎn)圖中的點(diǎn)的大小,使其反應(yīng)出原始數(shù)據(jù)中其他指標(biāo)的狀況D)熱力點(diǎn)圖中無(wú)法設(shè)置標(biāo)簽屬性答案:D解析:[單選題]14.下面關(guān)于參數(shù)估計(jì)相關(guān)描述不正確的有(__)。A)參數(shù)估計(jì)是根據(jù)樣本的統(tǒng)計(jì)量來(lái)估計(jì)總體的參數(shù)B)相關(guān)分析是參數(shù)估計(jì)C)點(diǎn)估計(jì)是參數(shù)估計(jì)D)利用樣本均值估計(jì)總體均值是參數(shù)估計(jì)答案:B解析:[單選題]15.以下()不是NoSQL數(shù)據(jù)庫(kù)。A)MongoDBB)BigTableC)HBaseD)Access答案:D解析:NoSQL是指那些非關(guān)系型的、分布式的、不保證遵循ACID原則的數(shù)據(jù)存儲(chǔ)系統(tǒng)。典型的NoSOL產(chǎn)品有DangaInteractive的Memcached、10gen的MongoDB、Facebook的Cassandra、Google的BigTable及其開源系統(tǒng)HBase、Amazon的Dynamo、Apache的TokyoCabinet、CouchDB和Redis等。[單選題]16.Metastore是Hive的()的集中存放地,它保存了Hive的元數(shù)據(jù)信息A)元數(shù)據(jù)B)配置信息C)登錄信息D)權(quán)限設(shè)置答案:A解析:[單選題]17.()不是HDFS的設(shè)計(jì)目標(biāo)。A)流式數(shù)據(jù)訪問(wèn)B)大規(guī)模數(shù)據(jù)集C)移動(dòng)計(jì)算D)"多次寫入,多次讀取"的文件訪問(wèn)模型答案:D解析:HDFS的設(shè)計(jì)以"一次寫入,多次讀取"為主要應(yīng)用場(chǎng)景,因此D錯(cuò)。[單選題]18.下列選項(xiàng)中,哪個(gè)方法可以一次性輸出多個(gè)統(tǒng)計(jì)指標(biāo)()。A)describe()B)mean()C)median()D)sum()答案:A解析:[單選題]19.以下說(shuō)法正確的是:A)一個(gè)機(jī)器學(xué)習(xí)模型,如果有較高準(zhǔn)確率,總是說(shuō)明這個(gè)分類器是好的B)如果增加模型復(fù)雜度,那么模型的測(cè)試錯(cuò)誤率總是會(huì)降低C)不可以使用聚類?類別id?作為一個(gè)新的特征項(xiàng),用監(jiān)督學(xué)習(xí)進(jìn)行學(xué)習(xí)D)ABC全錯(cuò)答案:D解析:[單選題]20.聚類算法屬于(__)。A)半監(jiān)督學(xué)習(xí)B)有監(jiān)督學(xué)習(xí)C)無(wú)監(jiān)督學(xué)習(xí)D)一種分類方法答案:C解析:[單選題]21.下列關(guān)于函數(shù)的參數(shù)的描述錯(cuò)誤的是()。A)可選參數(shù)可以定義在非可選參數(shù)的前面B)一個(gè)元組可以傳遞給帶有星號(hào)的可變參數(shù)C)在定義函數(shù)時(shí),可以設(shè)計(jì)可變數(shù)量參數(shù),通過(guò)在參數(shù)前增加星號(hào)(*)實(shí)現(xiàn)D)在定義函數(shù)時(shí),如果有些參數(shù)存在默認(rèn)值,可以在定義函數(shù)時(shí)直接為這些參數(shù)指定默認(rèn)值答案:A解析:可選參數(shù)需放在最后。[單選題]22.HDFS每個(gè)文件被劃分成()大小的多個(gè)block,屬于同一個(gè)文件的blocks分散存儲(chǔ)在不同DataNode上。A)32MBB)64MBC)128MBD)無(wú)法確定答案:B解析:[單選題]23.在HDFS根目錄下創(chuàng)建一個(gè)文件夾/example,且/example文件夾內(nèi)還包含一個(gè)文件夾dir,正確的shell命令是()。A)hadoopfs-mkdir-p/example/dirB)hdfsfs-mkdir-p/example/dirC)hadoopdfs-mkdir/example/dirD)hdfsdfs*mkdir-p/example/dir答案:A解析:[單選題]24.若b=np.array([1,2,3,4]),則b.shape的輸出結(jié)果為(__)。A)4B)[4,]C)(4,1)D)(4,)答案:D解析:[單選題]25.假設(shè)有命令importnumpyasnpArray1=np.linspace(1,5,3,dtype=int)print(Array1)則,執(zhí)行結(jié)果是A)[135]B)[125]C)[1.3.5.]D)[1.2.5.]答案:A解析:[單選題]26.HBase依賴()提供強(qiáng)大的計(jì)算能力。A)ZookeeperB)ChubbyC)RPCD)MapReduce答案:D解析:[單選題]27.按照KB、MB、GB、TB、PB的有小到大順序,下列換算錯(cuò)誤的是A)1KB=1024ByteB)1MB=1024KBC)1TB=1024MBD)1PB=1024TB答案:C解析:[單選題]28.關(guān)于數(shù)據(jù)清洗,不正確的說(shuō)法是()A)單數(shù)據(jù)源,主鍵取值不能重復(fù)B)多數(shù)據(jù)源會(huì)存在數(shù)據(jù)重復(fù),單位不一致的問(wèn)題C)連續(xù)型數(shù)據(jù)不存在冗余問(wèn)題D)缺失值可以采用刪除和填補(bǔ)等方法處理答案:C解析:[單選題]29.在MapReduce程序中,map()函數(shù)接收的數(shù)據(jù)格式是()A)字符串B)整型C)LongD)鍵值對(duì)答案:D解析:[單選題]30.在Kafka集群中,Kafka服務(wù)端的角色是下列哪-項(xiàng)?A)ProducerB)ZooKeeperC)ConsumerD)Broker答案:D解析:[單選題]31.Sigmoid函數(shù)作為神經(jīng)元激活函數(shù)的特點(diǎn)是()A)連續(xù)但不光滑B)不連續(xù)但尤滑C)連續(xù)且光滑D)不連續(xù)且不光滑答案:C解析:[單選題]32.假設(shè)有n組數(shù)據(jù)集,每組數(shù)據(jù)集中x的平均值都是9,x的方差都是11,y的平均值都是7.50,x與y的相關(guān)系數(shù)都是0.816,擬合的線性回歸方程都是y=3.00+0.500x。那么這n組數(shù)據(jù)集()。A)一樣B)不一樣C)無(wú)法確定是否一樣D)以上都不對(duì)答案:C解析:只比較平均值、方差、相關(guān)系數(shù)和回歸方程,無(wú)法確定數(shù)據(jù)集是否相同,還需比較Anscombe'squartet。[單選題]33.UNIQUE惟一索引的作用是()A)保證各行在該索引上的值都不得重復(fù)B)保證各行在該索引上的值不得為NULLC)保證參加惟一索引的各列,不得再參加其他的索引D)保證惟一索引不能被刪除答案:A解析:[單選題]34.大數(shù)據(jù)產(chǎn)業(yè)指什么?A)一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合B)提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應(yīng)用的企業(yè)C)提供數(shù)據(jù)分享平臺(tái)、數(shù)據(jù)分析平臺(tái)、數(shù)據(jù)租售平臺(tái)等服務(wù)的企業(yè)D)提供分布式計(jì)算、數(shù)據(jù)挖掘、統(tǒng)計(jì)分析等服務(wù)的各類企業(yè)答案:A解析:[單選題]35.以下哪些選項(xiàng)不屬于大數(shù)據(jù)時(shí)代到來(lái)的必要條件?A)存儲(chǔ)設(shè)備容量提升B)CPU計(jì)算性能提升C)超級(jí)計(jì)算機(jī)的出現(xiàn)D)網(wǎng)絡(luò)帶寬提升答案:C解析:[單選題]36.python中while的中止的關(guān)鍵字是()。A)continueB)brokenC)breakD)plug答案:C解析:break是while的中止的關(guān)鍵字。[單選題]37.np.vsplit()函數(shù)的作用是(__)。A)沿著它的水平軸分割B)沿著縱向的軸分割C)允許指定沿哪個(gè)軸分割D)按深度方向分割答案:B解析:[單選題]38.字符串?Hi,Andy?中(該字符串中沒有空格),字符?A?對(duì)應(yīng)的索引為()。A)1B)2C)3D)4答案:C解析:[單選題]39.()是HBase提供的工具類,通過(guò)簡(jiǎn)單的設(shè)置幫我們將mapreduce程序提交到HBase任務(wù)中。工具類中封裝了許多mapreduce寫入到HBase的操作,無(wú)需我們?cè)偃ピO(shè)置。我們可以通過(guò)initTableMapperJob()和initTableReducerJob()來(lái)方法來(lái)執(zhí)行Mapper類和Reducer類。A)AdminMapReduceUtilB)MapReduceUtilC)HBaseMapReduceUtilD)TableMapReduceUtil答案:D解析:[單選題]40.DRDS實(shí)例名稱不能以()開頭。A)小寫字母B)中文C)大寫字母D)下劃線答案:B解析:[單選題]41.下面不屬于臟數(shù)據(jù)的是(__)。A)有缺失值B)冗余數(shù)據(jù)C)噪聲數(shù)據(jù)D)無(wú)序數(shù)據(jù)答案:D解析:[單選題]42.定義域?yàn)閧飛機(jī),火車,輪船}的離散屬性也可稱為稱為(__)。A)無(wú)序?qū)傩訠)有序?qū)傩訡)連續(xù)屬性D)離散屬性答案:A解析:[單選題]43.下列關(guān)于深度神經(jīng)網(wǎng)絡(luò)的說(shuō)法正確的是()。A)增加神經(jīng)網(wǎng)絡(luò)層數(shù),可能會(huì)增加測(cè)試數(shù)據(jù)集的分類錯(cuò)誤率B)減少神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小測(cè)試數(shù)據(jù)集的分類錯(cuò)誤率C)增加神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小訓(xùn)練數(shù)據(jù)集的分類錯(cuò)誤率D)A、B都對(duì)答案:A解析:深度神經(jīng)網(wǎng)絡(luò)的成功已經(jīng)證明,增加神經(jīng)網(wǎng)絡(luò)層數(shù),可以增加模型范化能力,即訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集都表現(xiàn)得更好,但更多的層數(shù)也不一定能保證有更好的表現(xiàn)。[單選題]44.在WebHCat架構(gòu)中,用戶能夠通過(guò)安全的HTTPS協(xié)議執(zhí)行以下哪些操作?A)執(zhí)行HiveDDL操作。B)運(yùn)行MapReduce任務(wù)C)運(yùn)行HiveHQL任務(wù)D)以上全都正確答案:D解析:[單選題]45.如果我們現(xiàn)有一個(gè)安裝2.6.5版本的Hadoop集群,在不修改默認(rèn)配置的情況下存儲(chǔ)200個(gè)200M的文本文件,請(qǐng)問(wèn)最終會(huì)在集群中產(chǎn)生()個(gè)數(shù)據(jù)塊(包括副本)。A)200B)40000C)400D)1200答案:D解析:在默認(rèn)情況下,HDFS集群默認(rèn)存儲(chǔ)文件3份,并且大文件會(huì)按照128M的數(shù)據(jù)塊大小(Hadoop2.×版本以前的默認(rèn)數(shù)據(jù)塊的大小是64M,到了Hadoop2.×版本以后,默認(rèn)的數(shù)據(jù)塊大小就變成了128M)進(jìn)行切割分散存儲(chǔ)。所以題目中的總數(shù)據(jù)塊有200×2=400個(gè),再加上會(huì)存儲(chǔ)三份,共有400×3=1200個(gè)。[單選題]46.NumericToString是文本函數(shù)的一種,它的功能是()。A)把一個(gè)字符串轉(zhuǎn)換為數(shù)值B)把二進(jìn)制轉(zhuǎn)換為字符串C)把一個(gè)CSN序列轉(zhuǎn)換成字符串D)把一個(gè)數(shù)值數(shù)據(jù)轉(zhuǎn)換為字符串答案:D解析:[單選題]47.統(tǒng)計(jì)每個(gè)部門中人數(shù)可以使用的SQL語(yǔ)句是()A)SELECTSUM(ID)FROMEMPGROUPBYDEPTNO;B)SELECTSUM(ID)FROMEMPORDERBYDEPTNO;C)SELECTCOUNT(ID)FROMEMPORDERBYDEPTNO;D)SELECTCOUNT(ID)FROMEMPGROUPBYDEPTNO;答案:D解析:[單選題]48.核主成分分析是一種(__)方法。A)非線性降維B)線性降維C)分類D)回歸答案:A解析:[單選題]49.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是以下哪個(gè)步驟的任務(wù)()。A)頻繁模式挖掘B)分類和預(yù)測(cè)C)數(shù)據(jù)預(yù)處理D)數(shù)據(jù)流挖掘答案:C解析:數(shù)據(jù)預(yù)處理是對(duì)原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約的過(guò)程。頻繁模式挖掘、分類和預(yù)測(cè)和數(shù)據(jù)流挖掘均屬于數(shù)據(jù)挖掘范疇。[單選題]50.下面哪個(gè)色彩空間最接近人的視覺系統(tǒng)的特點(diǎn)()。A)RGB空間B)CMY空間C)CMYK空間D)HSI空間答案:D解析:[單選題]51.數(shù)據(jù)被稱為信息時(shí)代的?石油?,正在成為企業(yè)的核心資產(chǎn)。下列說(shuō)法不正確的是()。A)企業(yè)應(yīng)更加重視大數(shù)據(jù)技術(shù)應(yīng)用推廣B)企業(yè)需要培養(yǎng)和引進(jìn)數(shù)據(jù)應(yīng)用人才C)可以未經(jīng)許可任意使用其它企業(yè)的數(shù)據(jù)D)核心數(shù)據(jù)必須通過(guò)加密備份等嚴(yán)密保護(hù)答案:C解析:[單選題]52.下列可分解為偏差、方差與噪聲之和的是()。A)訓(xùn)練誤差(trainingerror)B)經(jīng)驗(yàn)誤差(empiricalerror)C)均方誤差(meansquarederror)D)泛化誤差(generalizationerror)答案:D解析:泛化誤差可分解為偏差、方差與噪聲之和。[單選題]53.下面程序中最后X_train_minmax值為多少()>>>X_train=np.array([[1.,-1.,2.],...[2.,0.,0.],...[0.,1.,-1.]])...>>>min_max_scaler=preprocessing.MinMaxScaler()>>>X_train_minmax=min_max_scaler.fit_transform(X_train)A)array([[0.,0.,1.],[1.,0.5,0.33333333],[0.5,1.,0.]])B)array([[0.5,0.,0.],[1.,0.5,0.33333333],[0.,1.,1.]])C)array([[0.5,0.,1.],[1.,0.5,0.33333333],[0.,1.,0.]])D)array([[0.5,0.,1.],[1.,0.5,0.],[0.,1.,0.]])答案:C解析:[單選題]54.神經(jīng)網(wǎng)絡(luò)感知機(jī)只有()神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能神經(jīng)元A)輸出層B)輸入層C)感知層D)網(wǎng)絡(luò)層答案:A解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.StructuredStreaming包括哪兩種處理模型:()A)微批處理B)高階處理C)分層處理D)持續(xù)處理答案:AD解析:[多選題]56.下列對(duì)Shuffle過(guò)程的期望描述正確的是()。A)盡可能的將所有數(shù)據(jù)打亂B)將Map的輸出數(shù)據(jù)完整地傳輸?shù)絉educe端C)在傳輸數(shù)據(jù)時(shí),盡可能得減少不必要的帶寬消耗D)降低磁盤I/O的影響答案:BCD解析:[多選題]57.執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取那幾部分?jǐn)?shù)據(jù)?A)HFileB)HLogC)MemStoreD)HDFS答案:AC解析:[多選題]58.針對(duì)學(xué)習(xí)器的泛化誤差問(wèn)題,主要的評(píng)估方法有()。A)留出法B)交叉驗(yàn)證法C)自助法D)測(cè)試誤差法答案:ABC解析:[多選題]59.華為FusionInsightHD行業(yè)成功案例都有哪些?A)數(shù)字政府B)智慧園區(qū)C)智慧交通D)金融答案:ABCD解析:[多選題]60.以下哪些數(shù)據(jù)可以轉(zhuǎn)化為Dataset或DataFrame?A)JAVAStringB)JPGC)JSOND)MySqlTable答案:CD解析:[多選題]61.以下提法中正確的是()。A)數(shù)據(jù)學(xué)科中的?數(shù)據(jù)?并不僅僅是?數(shù)值?,也不等同于?數(shù)值?;B)數(shù)據(jù)科學(xué)中的?計(jì)算?并不僅僅是加、減、乘、除等?數(shù)學(xué)計(jì)算?,還包括數(shù)據(jù)的查詢、挖掘、洞見、分析、可視化等更多類型;C)數(shù)據(jù)科學(xué)關(guān)注的是?單一學(xué)科?的問(wèn)題;D)數(shù)據(jù)科學(xué)強(qiáng)調(diào)的是?理論研究?,一般不涉及?領(lǐng)域?qū)崉?wù)知識(shí)?;答案:AB解析:[多選題]62.根據(jù)泛在電力物聯(lián)網(wǎng)2019年建設(shè)方案,數(shù)據(jù)中臺(tái)分為()A)控制層B)分析層C)共享層D)貼源層答案:BCD解析:[多選題]63.下列關(guān)于Python語(yǔ)言的特點(diǎn)的描述不正確的有()。A)Python語(yǔ)言不支持面向?qū)ο驜)Python語(yǔ)言是解釋型語(yǔ)言C)Python語(yǔ)言是編譯型語(yǔ)言D)Python語(yǔ)言是非跨平臺(tái)語(yǔ)言答案:ACD解析:Python語(yǔ)言是面向?qū)ο蟮慕忉屝驼Z(yǔ)言,可跨平臺(tái)使用。[多選題]64.大數(shù)據(jù)計(jì)算服務(wù)圖計(jì)算框架在計(jì)算過(guò)程中通過(guò)對(duì)圖進(jìn)行編輯、演化最終求解出結(jié)果,在計(jì)算過(guò)程中用戶可以對(duì)圖進(jìn)行()編輯操作。A)增加點(diǎn)B)修改邊的權(quán)值C)增加邊D)刪除點(diǎn)答案:ABCD解析:[多選題]65.下列對(duì)RDBMS描述正確是()。A)RDBMS可以保持?jǐn)?shù)據(jù)的一致性B)RDBMS可以實(shí)現(xiàn)高并發(fā)的讀寫需求C)對(duì)于數(shù)據(jù)量巨大的網(wǎng)站,RDBMS可以實(shí)現(xiàn)高效的查詢需求D)RDBMS以標(biāo)準(zhǔn)化為前提,數(shù)據(jù)更新的開銷很小答案:AD解析:[多選題]66.開發(fā)Hive應(yīng)用時(shí),不可避免地需要設(shè)定Hive的參數(shù)。對(duì)于一般參數(shù),我們可以使用以下哪幾種方式來(lái)進(jìn)行設(shè)定?()A)配置文件hive-site.xml(全局有效)B)命令行參數(shù):使用hive命令啟動(dòng)Hive時(shí),可以在命令行添加-hiveconfA.property=value來(lái)設(shè)定參數(shù),這一設(shè)定僅對(duì)本次啟動(dòng)的session有效。C)參數(shù)聲明:使用hiveServer2/beeline啟動(dòng)Hive時(shí),可以在命令行添加--hiveconfproperty=value來(lái)設(shè)定參數(shù)。D)參數(shù)聲明:可以在Hive的客戶端中使用--hiveconf關(guān)鍵字設(shè)定參數(shù)。答案:AB解析:[多選題]67.下列選項(xiàng)中可以設(shè)置數(shù)據(jù)精度的是()。--A)INTB)FLOATC)DOUBLED)DECIMAL答案:BCD解析:[多選題]68.HBase的可視化Web界面可以查詢到()。A)表的信息B)Region信息C)Region起始RowKeyD)以上全不正確答案:ABC解析:[多選題]69.數(shù)據(jù)源和APPs提供的數(shù)據(jù)內(nèi)容包括(__)和物聯(lián)網(wǎng),金融,人/實(shí)體,位置智能等數(shù)據(jù)。A)健康B)經(jīng)濟(jì)C)空氣D)海洋答案:ABCD解析:[多選題]70.下面關(guān)于Flink的描述正確的是:()A)Flink和Spark一樣,都是基于磁盤的計(jì)算框架B)當(dāng)全部運(yùn)行在HadoopC)Flink的流計(jì)算性能和Storm差不多,可以支持毫秒級(jí)的響應(yīng)D)Spark的市場(chǎng)影響力和社區(qū)活躍度明顯超過(guò)Flink答案:BCD解析:[多選題]71.下面屬于數(shù)據(jù)分析基本類型的是(__)。A)描述性分析B)預(yù)測(cè)性分析C)總結(jié)性分析D)規(guī)范性分析答案:ABD解析:[多選題]72.關(guān)系型數(shù)據(jù)庫(kù)計(jì)費(fèi)項(xiàng)包括哪些()A)實(shí)例規(guī)格B)數(shù)據(jù)備份空間C)存儲(chǔ)空間D)公網(wǎng)帶寬答案:ABCD解析:[多選題]73.Maxcompute中,當(dāng)一個(gè)大表和多個(gè)小表做連接時(shí),可以考慮使用mapjoin,以下關(guān)于mapjoin的限制,說(shuō)法正確的是:()。A)leftouterjoin的左表必須是大表,innerjoin左表或者右表都可以為大表B)fullouterjoin不能使用mapjoinC)最多支持8張小表D)所有小表占用內(nèi)存綜合不能超過(guò)256M答案:AB解析:[多選題]74.以下關(guān)于MaxComputeMR的輸入和輸出,描述正確的是:()。A)MR的輸入輸出支持MaxCompute內(nèi)置類型以及用戶自定義類型B)可以支持多表輸入。且輸入表的Schema可以不同C)可以支持視圖(View)作為輸入D)Reduce支持多路輸出,可以輸出到不同的表或同一張表的不同分區(qū)答案:BD解析:[多選題]75.Spark支持的分布式部署方式中哪個(gè)是正確的()A)standaloneB)sparkonmesosC)sparkonYARND)sparkonlocal答案:ABC解析:[多選題]76.計(jì)算機(jī)系統(tǒng)中的數(shù)據(jù)組織形式主要有兩種別是:()A)文件B)視頻C)音頻D)數(shù)據(jù)庫(kù)答案:AD解析:[多選題]77.以下描述中正確的是()。A)統(tǒng)計(jì)學(xué)是數(shù)據(jù)科學(xué)的理論基礎(chǔ)之一B)Python語(yǔ)言是統(tǒng)計(jì)學(xué)家發(fā)明的語(yǔ)言C)機(jī)器學(xué)習(xí)是數(shù)據(jù)科學(xué)的理論基礎(chǔ)之一D)數(shù)據(jù)科學(xué)是統(tǒng)計(jì)學(xué)的一個(gè)分支領(lǐng)域(子學(xué)科)答案:AC解析:Python發(fā)明者是GuidoVanRossum,并非為統(tǒng)計(jì)學(xué)家;數(shù)據(jù)科學(xué)是一門獨(dú)立學(xué)科,已經(jīng)超出了統(tǒng)計(jì)學(xué)一個(gè)學(xué)科的研究范疇,并非為統(tǒng)計(jì)學(xué)的一個(gè)分支。第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.數(shù)據(jù)已成為公司的戰(zhàn)略核心資產(chǎn),各類數(shù)據(jù)在公司生產(chǎn)運(yùn)行、經(jīng)營(yíng)管理、客戶服務(wù)等領(lǐng)域發(fā)揮重要作用,同時(shí),網(wǎng)站門戶、在線業(yè)務(wù)應(yīng)用和通信群組的內(nèi)容安全已成為國(guó)家網(wǎng)絡(luò)意識(shí)J彭態(tài)安全的重要組成部分。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.當(dāng)通過(guò)布爾數(shù)組索引操作數(shù)組時(shí),返回的數(shù)據(jù)是布爾數(shù)組中False對(duì)應(yīng)位置的值。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.在MySQL5.7中分組后只有使用聚合函數(shù)才能獲取非分組字段信息。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.編寫函數(shù)時(shí),一般建議先對(duì)參數(shù)進(jìn)行合法性檢查,然后再編寫正常的功能代碼。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.訓(xùn)練CNN時(shí),可以對(duì)輸入進(jìn)行旋轉(zhuǎn)、平移、縮放(增強(qiáng)數(shù)據(jù))等預(yù)處理提高模型泛化能力。這么說(shuō)是對(duì),還是不對(duì)?A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.云計(jì)算這個(gè)概念繼承自大數(shù)據(jù)的概念。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]84.棧和隊(duì)列的都具有先入后出的特點(diǎn)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.可以給項(xiàng)目空間外的主體授權(quán)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]86.數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)的大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]87.K均值是一種產(chǎn)生劃分聚類的基于密度的聚類算法,簇的個(gè)數(shù)由算法自動(dòng)地確定。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]88.Map階段處理數(shù)據(jù)時(shí),是按照Key的哈希值與ReduceTask數(shù)量取模進(jìn)行分區(qū)的規(guī)則。()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]89.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論