大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第1頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第2頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第3頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第4頁(yè)
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:?jiǎn)雾?xiàng)選擇題,共57題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.在線遷移同步過(guò)程中可能因數(shù)據(jù)沖突、數(shù)據(jù)加工、異構(gòu)類型轉(zhuǎn)化、對(duì)象缺失等因素導(dǎo)致數(shù)據(jù)異常,用戶可以通過(guò)?異常數(shù)據(jù)?頁(yè)簽查看,以幫助異常寫入的排查。下列同步過(guò)程中,支持異常診斷的是:()。A)Postgres->GaussDBB)Oracle->RDSforMySQLC)Mysql->GaussDB(forMySQL)D)Postgres->GaussDB答案:B解析:[單選題]2.黨中央、國(guó)務(wù)院高度重視網(wǎng)絡(luò)安全工作,出臺(tái)了()等一系列法律、法規(guī)和專項(xiàng)文件。A)《中華人民共和國(guó)網(wǎng)絡(luò)安全法》B)《中華人民共和國(guó)數(shù)據(jù)安全法》C)《中華人民共和國(guó)通信安全法》D)《中華人民共和國(guó)網(wǎng)絡(luò)信息安全法》答案:A解析:[單選題]3.k近鄰學(xué)習(xí)是一種(__)方法。A)監(jiān)督學(xué)習(xí)方法B)半監(jiān)督學(xué)習(xí)方法C)無(wú)監(jiān)督學(xué)習(xí)方法D)測(cè)試方法答案:A解析:[單選題]4.如何禁用reduce階段()A)設(shè)置conf.setNumreduceTasks(0)B)設(shè)置job.setNumreduceTasks(0)C)設(shè)置job.setNumreduceTasks()=0D)修改配置文件中NumreduceTasks=0答案:B解析:[單選題]5.在K均值算法中,()可用于獲得全局最小A)嘗試為不同的質(zhì)心(centroid)初始化運(yùn)行算法B)調(diào)整迭代的次數(shù)C)找到集群的最佳數(shù)量D)以上答案都正確答案:D解析:[單選題]6.根據(jù)泛在電力物聯(lián)網(wǎng)建設(shè)和發(fā)展需要,借鑒()思維,動(dòng)態(tài)優(yōu)化各層級(jí)組織機(jī)構(gòu)、職責(zé)范圍和管理權(quán)限,打造柔性組織,推動(dòng)前端融合。A)能源網(wǎng)B)信息網(wǎng)C)智能網(wǎng)D)互聯(lián)網(wǎng)答案:D解析:[單選題]7.下列函數(shù)中,用于沿著軸方向堆疊Pandas對(duì)象的是()。A)concat()B)join()C)merge()D)combine_first()答案:A解析:[單選題]8.下列哪個(gè)不是Explain的關(guān)鍵字()?A)TablescanB)HashJoinC)FilterD)Seqscan答案:C解析:[單選題]9.關(guān)于高偏差說(shuō)法錯(cuò)誤的是()A)、隨著訓(xùn)練樣本數(shù)增多,訓(xùn)練準(zhǔn)確率和交叉驗(yàn)證準(zhǔn)確率趨于收斂,但與理想取值的偏差很大B)、高偏差意味著模型在訓(xùn)練集和交叉驗(yàn)證集上的準(zhǔn)確率都很低,很可能存在?欠擬合?現(xiàn)象。C)、造成欠擬合的主要原因有兩個(gè):一是所訓(xùn)練出的模型過(guò)于簡(jiǎn)單;二是所選擇的特征32屬性并不提供充分信息,與本模型的功能并不相關(guān)。D)、高偏差表示對(duì)應(yīng)模型很可能存在?過(guò)擬合?現(xiàn)象。答案:D解析:[單選題]10.下列算法中,不屬于外推法的是()A)移動(dòng)平均法B)回歸分析法C)指數(shù)平滑法D)季節(jié)指數(shù)法答案:B解析:[單選題]11.下列說(shuō)法錯(cuò)誤的是?A)RDD(ResillientDistributedDataset)是運(yùn)行在工作節(jié)點(diǎn)(WorkerNode)的一個(gè)進(jìn)程,負(fù)責(zé)運(yùn)行TaskB)Application是用戶編寫的Spark應(yīng)用程序C)一個(gè)Job包含多個(gè)RDD及作用于相應(yīng)RDD上的各種操作D)DirectedAcyclicGraph反映RDD之間的依賴關(guān)系答案:A解析:[單選題]12.關(guān)于HDFS的特征,下列說(shuō)法錯(cuò)誤的是()。A)支持超大文件B)基于商用硬件C)流式數(shù)據(jù)訪問(wèn)D)低吞吐量答案:D解析:HDFS設(shè)計(jì)中重視"數(shù)據(jù)的高吞吐量",因此其數(shù)據(jù)吞吐量高,但也造成了其數(shù)據(jù)延遲訪問(wèn)的特征。[單選題]13.創(chuàng)建DRDS庫(kù)的時(shí)候,每個(gè)掛載的RDS實(shí)例默認(rèn)創(chuàng)建的庫(kù)的個(gè)數(shù)為:()。A)16B)8C)4D)2答案:B解析:[單選題]14.以下程序的輸出結(jié)果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A)['z','j','s','y']B)['j','s','y','z']C)['j','z','z','s','z','y','j']D)['j','j','s','y','z','z','z']答案:B解析:[單選題]15.下列不屬于模型集成方法的是()。A)直接集成法B)增強(qiáng)法C)堆疊法D)遞歸法答案:D解析:模型集成方法包括直接集成法、自助法、隨機(jī)森林、增強(qiáng)法和堆疊法等。[單選題]16.數(shù)據(jù)庫(kù)(DB)、數(shù)據(jù)庫(kù)系統(tǒng)(DBS)和數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)三者之間的關(guān)系是A)DBS包括DB和DBMSB)DDMS包括DB和DBSC)DB包括DBS和DBMSD)DBS就是DB,也就是DBMS答案:A解析:[單選題]17.下列哪一項(xiàng)不是大數(shù)據(jù)架構(gòu)中需要考慮的要點(diǎn)?A)業(yè)務(wù)分解B)業(yè)務(wù)聯(lián)動(dòng)C)持續(xù)發(fā)展D)獨(dú)立開發(fā)答案:D解析:[單選題]18.D剛常用的激活函數(shù)有()A)sigmoidB)tanhC)ReLUD)以上答案都正確答案:D解析:[單選題]19.()網(wǎng)絡(luò)是一種競(jìng)爭(zhēng)學(xué)習(xí)型的無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò),它能將高維輸入數(shù)據(jù)映射到低維空間,同時(shí)保持輸入數(shù)據(jù)在高維空間的拓?fù)浣Y(jié)構(gòu),即將高維空間中相似的樣本點(diǎn)映射到網(wǎng)絡(luò)輸出層中的鄰近神經(jīng)元A)SOMB)RBFC)ARTD)ELman答案:A解析:[單選題]20.從行為目的與思維方式看,下列哪個(gè)屬于描述性統(tǒng)計(jì)分析()。A)線性回歸B)參數(shù)估計(jì)C)相關(guān)分析D)主成分分析答案:C解析:描述性統(tǒng)計(jì)是指運(yùn)用制表和分類、圖形以及計(jì)算概括性數(shù)據(jù)來(lái)描述數(shù)據(jù)特征的各項(xiàng)活動(dòng)。描述性統(tǒng)計(jì)分析要對(duì)調(diào)查總體所有變量的有關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述,主要包括數(shù)據(jù)的頻數(shù)分析、集中趨勢(shì)分析、離散程度分析、分布、相關(guān)分析以及一些基本的統(tǒng)計(jì)圖形。[單選題]21.empdet是一個(gè)外部表,它包含empno和ename列,哪個(gè)涉及empdet表的操作可以執(zhí)行成功A)UPDATEempdetSETename=?Amit?WHEREempno=1234;B)DELETEFROMempdetSETenameWHEREenameLIKE'J%'C)CREATEVIEWempvuASSELECT*FROMempdet;D)CREATEINDEXempdet_idxONempdet(empno)答案:C解析:[單選題]22.(__)是決策樹學(xué)習(xí)算法對(duì)付過(guò)擬合的主要手段。A)剪枝B)連續(xù)值處理C)信息增益D)數(shù)據(jù)預(yù)處理答案:A解析:[單選題]23.()模式的變化意味著數(shù)據(jù)科學(xué)中所關(guān)注的數(shù)據(jù)計(jì)算的常見(jiàn)瓶頸、關(guān)注焦點(diǎn)、主要矛盾和思維模式發(fā)生了根本性變化。A)數(shù)據(jù)計(jì)算B)、數(shù)據(jù)管理C)、數(shù)據(jù)分析D)、數(shù)據(jù)獲取答案:A解析:[單選題]24.在Spark中,()是指RDD的每個(gè)分區(qū)都只被子RDD的一個(gè)分區(qū)所依賴。A)子分區(qū)B)父分區(qū)C)寬依賴D)窄依賴答案:D解析:[單選題]25.Numpy是(__)的簡(jiǎn)寫。A)NumericalPythonB)NumericpythonC)NumericalforPythonD)Numericofpython答案:A解析:[單選題]26.ndarry對(duì)象的itemsize屬性表示(__)。A)指定元素的大小B)指定維度的大小C)數(shù)組元素占用的字節(jié)數(shù)D)數(shù)組的元素個(gè)數(shù)答案:C解析:[單選題]27.下列描述中屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過(guò)程域數(shù)據(jù)戰(zhàn)略的是()。A)數(shù)據(jù)戰(zhàn)略制定B)業(yè)務(wù)術(shù)語(yǔ)表C)數(shù)據(jù)質(zhì)量評(píng)估D)過(guò)程質(zhì)量保障答案:A解析:數(shù)據(jù)戰(zhàn)略制定屬于DMM(數(shù)據(jù)管理成熟度模型)中的關(guān)鍵過(guò)程域?數(shù)據(jù)戰(zhàn)略?。[單選題]28.當(dāng)客戶端需要讀取HDFS中存儲(chǔ)的文件時(shí),首先向()發(fā)起讀請(qǐng)求。A)DataNodeB)NameNodeC)YarnD)Zookeeper答案:B解析:[單選題]29.Hbase的一個(gè)典型應(yīng)用是webtable,它是一個(gè)以網(wǎng)頁(yè)()為主鍵的表。A)標(biāo)題B)URLC)內(nèi)容D)類別答案:B解析:[單選題]30.使用似然函數(shù)的目的是()。A)求解目標(biāo)函數(shù)B)得到最優(yōu)數(shù)據(jù)樣本C)找到最適合數(shù)據(jù)的參數(shù)D)改變目標(biāo)函數(shù)分布答案:C解析:似然估計(jì)是一種確定模型參數(shù)值的方法。確定參數(shù)值的過(guò)程,是找到能最大化模型產(chǎn)生真實(shí)觀察數(shù)據(jù)可能性的那一組參數(shù)。[單選題]31.shuffle和sort輸出的key實(shí)現(xiàn)了下面哪個(gè)接口()A)WritableB)WritableComparableC)ConfigurableD)ComparableWritable答案:B解析:[單選題]32.Hive的基本數(shù)據(jù)類型是可以進(jìn)行隱式轉(zhuǎn)換,類似于Java的類型轉(zhuǎn)換。例如:某表達(dá)式使用INT類型,TINYINT會(huì)自動(dòng)轉(zhuǎn)換為INT類型,若是某表達(dá)式使用TINYINT類型,INT不會(huì)自動(dòng)轉(zhuǎn)換為TINYINT類型,它會(huì)返回錯(cuò)誤,除非使用()操作進(jìn)行顯示類型的轉(zhuǎn)換。A)CASTB)CTASC)CATSD)CSAT答案:A解析:[單選題]33.在分類問(wèn)題中,我們經(jīng)常會(huì)遇到正負(fù)樣本數(shù)據(jù)量不等的情況,比如正樣本為10w條數(shù)據(jù),負(fù)樣本只有1w條數(shù)據(jù),以下最合適的處理方法是()?A)將負(fù)樣本重復(fù)10次,生成10w樣本量,打亂順序參與分類B)直接進(jìn)行分類,可以最大限度利用數(shù)據(jù)C)從10w正樣本中隨機(jī)抽取1w參與分類D)將負(fù)樣本每個(gè)權(quán)重設(shè)置為10,正樣本權(quán)重為1,參與訓(xùn)練過(guò)程答案:D解析:[單選題]34.下列選項(xiàng)中適合MapReduce的場(chǎng)景有:()。A)實(shí)時(shí)交互計(jì)算B)迭代計(jì)算C)流式計(jì)算D)離線計(jì)算答案:D解析:[單選題]35.()反映數(shù)據(jù)的精細(xì)化程度,越細(xì)化的數(shù)據(jù),價(jià)值越高。A)規(guī)模B)靈活性C)關(guān)聯(lián)度D)顆粒度答案:D解析:顆粒度反映的是數(shù)據(jù)的精細(xì)化程度。[單選題]36.當(dāng)子查詢返回的是多行數(shù)據(jù)時(shí),可以使用()方法來(lái)解決。A)聚合函數(shù)B)where語(yǔ)句C)in運(yùn)算符D)groupby語(yǔ)句答案:C解析:[單選題]37.Redis中適合存儲(chǔ)對(duì)象的數(shù)據(jù)類型是?()A)StringB)ListC)HashD)Set答案:C解析:[單選題]38.某企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)運(yùn)行在大數(shù)據(jù)計(jì)算服務(wù)上,開發(fā)人員在加工數(shù)據(jù)時(shí)發(fā)現(xiàn)用戶表user中的用戶標(biāo)識(shí)字段user_id有部分臟數(shù)據(jù),正確的格式應(yīng)該是8位的字符串??梢允褂肧QL語(yǔ)句()將臟數(shù)據(jù)過(guò)濾出來(lái)。A)select*fromuserwherelength(userid)<>8B)select*fromuserwherelength(userid)>8C)select*fromuserwherelength(userid)<8D)select*fromuserwherelength(userid)<>8oruseridisnull答案:D解析:[單選題]39.結(jié)構(gòu)化程序設(shè)計(jì)的三種基本語(yǔ)句是?A)函數(shù)結(jié)構(gòu)、分支結(jié)構(gòu)、判斷結(jié)構(gòu)B)函數(shù)結(jié)構(gòu)、嵌套結(jié)構(gòu)、平行結(jié)構(gòu)C)順序結(jié)構(gòu)、分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)D)分支結(jié)構(gòu)、循環(huán)結(jié)構(gòu)、嵌套結(jié)構(gòu)答案:C解析:[單選題]40.下列關(guān)于BP網(wǎng)絡(luò)的說(shuō)法,不正確的是()A)標(biāo)準(zhǔn)BP算法每次僅針對(duì)一個(gè)訓(xùn)練樣倒更新連接權(quán)和閩值B)BP神經(jīng)網(wǎng)絡(luò)經(jīng)常遭遇過(guò)擬合十C)平停策略可用來(lái)緩解BP網(wǎng)絡(luò)的過(guò)擬合問(wèn)題中D)晚停策略可用來(lái)緩解BP網(wǎng)絡(luò)的欠擬合問(wèn)題答案:D解析:[單選題]41.行業(yè)應(yīng)用解決的是行業(yè)()問(wèn)題,并為企業(yè)應(yīng)用提供基礎(chǔ)平臺(tái)。A)單一B)共性C)基礎(chǔ)D)根本答案:B解析:[單選題]42.以下關(guān)于Zookeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫流程說(shuō)法正確的是?A)僅寫入內(nèi)存B)同時(shí)寫入磁盤和內(nèi)存C)先寫入內(nèi)存再寫入磁盤D)先寫磁盤再寫內(nèi)存答案:D解析:[單選題]43.下列不屬于Transformation操作的是()A)mapB)flterC)sampleD)count答案:D解析:Transformation常用函數(shù)為map、filter、flatMap、sample、union、join等。[單選題]44.規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指的是()。A)富數(shù)據(jù)B)貧數(shù)據(jù)C)繁數(shù)據(jù)D)大數(shù)據(jù)答案:D解析:[單選題]45.關(guān)于云主機(jī)登錄方式描述對(duì)的是()A)Windows通過(guò)遠(yuǎn)程桌面(MSTSC)方式登錄B)Linux通過(guò)SSH方式登錄C)通過(guò)控制臺(tái)方式(VNC)登錄D)以上描述均對(duì)答案:D解析:[單選題]46.下列關(guān)于HBase的集群結(jié)構(gòu)描述有誤的是()A)HBase的服務(wù)器體系結(jié)構(gòu)遵從簡(jiǎn)單的主/從服務(wù)器架構(gòu),它由HRegionServer群和HBaseMasterServer構(gòu)成。B)當(dāng)表的大小超過(guò)設(shè)置的值時(shí),HBase會(huì)自動(dòng)地將表劃分為不同的區(qū)域,每個(gè)區(qū)域包含所有行的子集。C)HBase邏輯上的表可能會(huì)被劃分成多個(gè)HRegion,然后存儲(chǔ)到HRegionServer群中。D)ZooKeeper本身并不存儲(chǔ)HBase中的任何數(shù)據(jù),它存儲(chǔ)的是從數(shù)據(jù)到HRegionServer的映射,告訴每臺(tái)HRegionServer它要維護(hù)哪些HRegion。答案:D解析:[單選題]47.關(guān)于Hive自定義UDF描述錯(cuò)誤的是()。A)普通的UDF,用于操作單個(gè)數(shù)據(jù)行,且產(chǎn)生一個(gè)數(shù)據(jù)行作為輸出。B)永久函數(shù),可以在多個(gè)會(huì)話中使用,不需要每次創(chuàng)建。C)用戶定義表生成函數(shù)UDTF,用于接受多個(gè)輸入數(shù)據(jù)行,并產(chǎn)生一個(gè)輸出數(shù)據(jù)行。D)臨時(shí)函數(shù),只能在當(dāng)前會(huì)話使用,重啟會(huì)話后需要重新創(chuàng)建答案:C解析:[單選題]48.規(guī)模巨大且復(fù)雜,用現(xiàn)有的數(shù)據(jù)處理工具難以獲取、整理、管理以及處理的數(shù)據(jù),這指的是()。A)大數(shù)據(jù)B)貧數(shù)據(jù)C)富數(shù)據(jù)D)繁數(shù)據(jù)答案:A解析:[單選題]49.常用的圖像分割方法是把圖像(__)分成不同等級(jí)。A)顏色B)灰度C)大小D)亮度信息答案:B解析:[單選題]50.下列哪個(gè)不是情感分析的應(yīng)用場(chǎng)景?A)數(shù)據(jù)挖掘B)信息檢索C)文本分詞D)市場(chǎng)營(yíng)銷答案:C解析:[單選題]51.程序如下:i=0j=0while(iA)1B)0C)2D)4.5答案:B解析:[單選題]52.例如數(shù)據(jù)庫(kù)中有A表,包括學(xué)生,學(xué)科,成績(jī)?nèi)齻€(gè)字段,數(shù)據(jù)庫(kù)結(jié)構(gòu)為學(xué)生學(xué)科成績(jī)張三語(yǔ)文60張三數(shù)學(xué)100李四語(yǔ)文70李四數(shù)學(xué)80李四英語(yǔ)80如何統(tǒng)計(jì)最高分>80的學(xué)科()A)SELECTMAX(成績(jī))FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;B)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVING成績(jī)>80;C)SELECT學(xué)科FROMAGROUPBY學(xué)科HAVINGMAX(成績(jī))>80;D)SELECT學(xué)科FROMAGROUPBY學(xué)科WHEREMAX(成績(jī))>80;答案:C解析:[單選題]53.()的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過(guò)程。A)數(shù)據(jù)處理B)數(shù)據(jù)計(jì)算C)數(shù)據(jù)加工D)整齊數(shù)據(jù)答案:C解析:數(shù)據(jù)加工(DataWrangling或DataMunging)的本質(zhì)是將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過(guò)程。從加工程度看,數(shù)據(jù)可以分為零次、一次、二次、三次數(shù)據(jù)。[單選題]54.如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為()。A)無(wú)序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則答案:C解析:第2部分:多項(xiàng)選擇題,共23題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]55.JupyterNotebook支持以下哪些語(yǔ)言A)CB)RC)PythonD)Java答案:BC解析:[多選題]56.關(guān)于分析學(xué)習(xí)和歸納學(xué)習(xí)的比較,說(shuō)法正確的是()。A)歸納學(xué)習(xí)擬合數(shù)據(jù)假設(shè),分析學(xué)習(xí)擬合領(lǐng)域理論的假設(shè)B)歸納學(xué)習(xí)論證方式為統(tǒng)計(jì)推理,分析學(xué)習(xí)為演繹推理C)歸納學(xué)習(xí)不需要先驗(yàn)知識(shí)D)訓(xùn)練數(shù)據(jù)不足時(shí)歸納學(xué)習(xí)可能會(huì)失敗答案:ABCD解析:分析學(xué)習(xí)是相對(duì)于歸納學(xué)習(xí)的一種提法,其特點(diǎn)是使用先驗(yàn)知識(shí)來(lái)分析或解釋每個(gè)訓(xùn)練樣本,以推理出樣本的哪些特征與目標(biāo)函數(shù)相關(guān)或不相關(guān)。因此,這些解釋能使機(jī)器學(xué)習(xí)系統(tǒng)比單獨(dú)依靠數(shù)據(jù)進(jìn)行泛化有更高的精度。分析學(xué)習(xí)使用先驗(yàn)知識(shí)來(lái)減小待搜索假設(shè)空間的復(fù)雜度,減小了樣本復(fù)雜度并提高了機(jī)器學(xué)習(xí)系統(tǒng)的泛化精度??梢?jiàn),分析學(xué)習(xí)與歸納學(xué)習(xí)的優(yōu)缺點(diǎn)在一定程度上具有互補(bǔ)性,分析學(xué)習(xí)方法的優(yōu)點(diǎn)在于可用先驗(yàn)知識(shí)從較少的數(shù)據(jù)中更精確地泛化以引導(dǎo)學(xué)習(xí)。但是,當(dāng)先驗(yàn)知識(shí)不正確或不足時(shí),分析學(xué)習(xí)的缺點(diǎn)也會(huì)被突顯;歸納學(xué)習(xí)具有的優(yōu)點(diǎn)是不需要顯式的先驗(yàn)知識(shí),并且主要基于訓(xùn)練數(shù)據(jù)學(xué)習(xí)到規(guī)律。然而,若訓(xùn)練數(shù)據(jù)不足時(shí)它能會(huì)失敗,并且會(huì)被其中隱式的歸納偏置所誤導(dǎo),而歸納偏置是從觀察數(shù)據(jù)中泛化所必需的過(guò)程。因此,我們可以考慮如何將二者結(jié)合成一個(gè)單獨(dú)的算法,以獲得它們各自的優(yōu)點(diǎn)。[多選題]57.卷積神經(jīng)網(wǎng)絡(luò)可以用于()。A)圖像分類B)目標(biāo)提取C)圖像分割D)中文分詞答案:ABC解析:[多選題]58.下面哪幾項(xiàng)屬于ElasticSearch的RESTful請(qǐng)求方式?A)GetB)DeleteC)UpdateD)Post答案:ABD解析:[多選題]59.關(guān)于HBase二級(jí)索引的描述,哪些是正確的?A)核心是倒排表B)二級(jí)索引概念是對(duì)應(yīng)Rowkey這個(gè)?一級(jí)?索引C)二級(jí)索引使用平衡二叉樹D)二級(jí)索引使用LSM結(jié)構(gòu)答案:AB解析:C、D項(xiàng)沒(méi)百度到,所以沒(méi)使用。[多選題]60.Hadoop架構(gòu)中,核心的存儲(chǔ)、計(jì)算架構(gòu)包括A)HDFSB)CephC)SparkD)MapReduce答案:AD解析:[多選題]61.隨著社會(huì)數(shù)據(jù)收集手段的不斷豐富及完善,越來(lái)越多的行業(yè)數(shù)據(jù)被積累下來(lái),數(shù)據(jù)規(guī)模已經(jīng)增長(zhǎng)到了傳統(tǒng)軟件行業(yè)無(wú)法承載的海量數(shù)據(jù)級(jí)別。大數(shù)據(jù)計(jì)算服務(wù)可以很多的利用存儲(chǔ)和計(jì)算能力去處理、分析這些海量數(shù)據(jù),發(fā)現(xiàn)價(jià)值。以下說(shuō)法中正確的有:()。A)大數(shù)據(jù)計(jì)算服務(wù)提供了高并發(fā)低延遲(毫秒級(jí))的處理能力,對(duì)海量數(shù)據(jù)進(jìn)行靈活分析B)大數(shù)據(jù)計(jì)算服務(wù)提供了高并發(fā)吞吐量上傳下載工具,可以將外部數(shù)據(jù)源中的數(shù)據(jù)高效的同步到大數(shù)據(jù)計(jì)算服務(wù)中去C)大數(shù)據(jù)計(jì)算服務(wù)支持使用SQL或者M(jìn)apReduce編程對(duì)海量數(shù)據(jù)進(jìn)行處理D)大數(shù)據(jù)計(jì)算服務(wù)可以對(duì)海量數(shù)據(jù)進(jìn)行基于復(fù)雜算法的分析,如聚類、分類、回歸、主成分分析等。答案:BCD解析:[多選題]62.?showdatabaseslike?student%??命令可以顯示出以下數(shù)據(jù)庫(kù)()A)student_myB)studentyC)mystudentD)student答案:ABD解析:[多選題]63.以下選項(xiàng)對(duì)GraphBase概念描述正確的是?A)Vertex:節(jié)點(diǎn)/頂點(diǎn),用于表示現(xiàn)實(shí)世界中的實(shí)體對(duì)象。B)VertexLabel:節(jié)點(diǎn)的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的實(shí)體類型。C)EdgeLabel:邊的標(biāo)簽,用于表示現(xiàn)實(shí)世界中的關(guān)系類型D)Edge:邊,用于表示關(guān)系度答案:ABC解析:[多選題]64.Python中,字符串可以使用哪些格式A)單引號(hào)B)雙引號(hào)C)三雙引號(hào)D)三單引號(hào)答案:ABCD解析:[多選題]65.數(shù)據(jù)節(jié)點(diǎn)(DataNode)的主要功能包括哪些?A)負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和讀取B)根據(jù)客戶端或者是名稱節(jié)點(diǎn)的調(diào)度來(lái)進(jìn)行數(shù)據(jù)的存儲(chǔ)和檢索C)向名稱節(jié)點(diǎn)定期發(fā)送自己所存儲(chǔ)的塊的列表D)用來(lái)保存名稱節(jié)點(diǎn)中對(duì)HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點(diǎn)重啟的時(shí)間答案:ABC解析:[多選題]66.ADS的普通表分區(qū),支持()分區(qū)方式。A)ListB)IntervalC)HashD)Range答案:AC解析:[多選題]67.一次BSP計(jì)算過(guò)程包括一系列全局超步(超步就是指計(jì)算中的一次迭代),每個(gè)超步主要包括哪幾個(gè)組件:()A)局部計(jì)算B)中間計(jì)算C)通信D)柵欄同步答案:ACD解析:[多選題]68.下列關(guān)于包裹式選擇的描述正確的是(__)。A)包裹式特征選擇方法直接針對(duì)給定學(xué)習(xí)器進(jìn)行優(yōu)化B)從最終學(xué)習(xí)器性能來(lái)看,包裹式特征選擇比過(guò)濾式特征選擇更好C)包裹式特征選擇的計(jì)算開銷通常比過(guò)濾式特征選擇大得多D)包裹式特征選擇的典型算法:LVW算法,其特征子集搜索采用了隨機(jī)策略答案:ABCD解析:[多選題]69.公司各級(jí)業(yè)務(wù)部門負(fù)責(zé)()等環(huán)節(jié)的安全審核。A)相關(guān)業(yè)務(wù)系統(tǒng)開通B)數(shù)據(jù)采集C)數(shù)據(jù)使用D)數(shù)據(jù)發(fā)布答案:ABCD解析:[多選題]70.提升企業(yè)經(jīng)營(yíng)績(jī)效方面,2019年重點(diǎn)開展()、()、實(shí)物ID推廣應(yīng)用、基建全過(guò)程綜合數(shù)字化管理平臺(tái)建設(shè)和現(xiàn)代(智慧)供應(yīng)鏈體系構(gòu)建等5項(xiàng)工作。A)數(shù)字化審計(jì)B)多維精益管理體系變革C)泛在電力物聯(lián)網(wǎng)營(yíng)銷服務(wù)系統(tǒng)D)網(wǎng)上電網(wǎng)應(yīng)用構(gòu)建答案:BD解析:[多選題]71.Maxcompute通過(guò)eclipseplugin提供了MR的編程框架,開發(fā)時(shí)通常需要添加以下()類。A)reducerB)mapreducedriverC)combinerD)mapper答案:ACD解析:[多選題]72.以下()方法可以支持MaxCompute中受保護(hù)項(xiàng)目空間的數(shù)據(jù)流出。A)使用owner通過(guò)ACL授權(quán)B)使用owner通過(guò)policy授權(quán)C)設(shè)置例外(ExceptionPolicy)D)設(shè)置項(xiàng)目互信(TrustedProject)答案:CD解析:[多選題]73.下面屬于數(shù)據(jù)科學(xué)理論基礎(chǔ)的有(__)。A)統(tǒng)計(jì)學(xué)B)數(shù)據(jù)可視化C)機(jī)器學(xué)習(xí)D)領(lǐng)域知識(shí)答案:ABCD解析:[多選題]74.下列關(guān)于文檔數(shù)據(jù)庫(kù)的描述,哪些是正確的?()A)性能好(高并發(fā)),靈活性高B)具備統(tǒng)一的査詢語(yǔ)法C)文檔數(shù)據(jù)庫(kù)支持文檔間的事務(wù)D)復(fù)雜性低,數(shù)據(jù)結(jié)構(gòu)靈活答案:AD解析:[多選題]75.可作為決策樹選擇劃分屬性的參數(shù)是()A)信息增益B)增益率C)基尼指數(shù)D)密度函數(shù)答案:ABC解析:特征選擇的準(zhǔn)則主要有信息增益,信息增益率,基尼指數(shù)三種。[多選題]76.創(chuàng)建世界一流能源互聯(lián)網(wǎng)企業(yè)辦公室,下設(shè)()常設(shè)小組。A)技術(shù)組B)運(yùn)營(yíng)組C)商務(wù)組D)管理優(yōu)化組答案:ACD解析:[多選題]77.大數(shù)據(jù)的應(yīng)用能夠?qū)崿F(xiàn)一場(chǎng)新的革命,提高綜合管理水平的原因是()A)從被動(dòng)反應(yīng)走向主動(dòng)預(yù)見(jiàn)型管理B)從粗放化管理走向精細(xì)化管理C)從單兵作戰(zhàn)走向聯(lián)合共享型管理D)從柜臺(tái)式管理走向全天候管理答案:ABCD解析:第3部分:判斷題,共16題,請(qǐng)判斷題目是否正確。[判斷題]78.在Hive中,Driver負(fù)責(zé)管理HiveQL執(zhí)行的生命周期,并貫穿Hive任務(wù)整個(gè)執(zhí)行期間。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]79.正則表達(dá)式元字符?用來(lái)表示該符號(hào)前面的字符或子模式0次或多次出現(xiàn)。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]80.函數(shù)在定義完成后會(huì)立刻執(zhí)行。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]81.密碼過(guò)期的用戶可使用ALTERUSER...IDENTIFIED、BY設(shè)置密碼。--A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.Colocation同分布文件級(jí)的同分布實(shí)現(xiàn)文件的快速訪問(wèn),避免了因數(shù)據(jù)遷移盜來(lái)的大量網(wǎng)絡(luò)開銷。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.?大數(shù)據(jù)?一詞,最早出現(xiàn)于20世紀(jì)90年代,當(dāng)時(shí)的數(shù)據(jù)倉(cāng)庫(kù)之父比爾·恩門經(jīng)常提及。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.孤立點(diǎn)在數(shù)據(jù)挖掘時(shí)總是被視為異常、元用數(shù)據(jù)而丟棄。()A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]85.執(zhí)行語(yǔ)句fromm

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論