版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)分析師(高級)試題[復(fù)制](A卷)
姓名:______
分?jǐn)?shù):_______一、選擇題(每題1分,共80分)1、按下()鍵能終止當(dāng)前運行的命令[單選題]*A.Ctrl-C(正確答案)B.Ctrl-FC.Ctrl-BD.Ctrl-D2、ls命令有很多的參數(shù),顯示所有文件,包括隱藏文件的參數(shù)是()[單選題]*A.-a(正確答案)B.-lC.–rD.–help3、若要將鼠標(biāo)從VM中釋放出來,可按()鍵來實現(xiàn)[單選題]*A.Ctrl+Alt(正確答案)B.Ctrl+Alt+DelC.Ctrl+Alt+EnterD.Ctrl+Enter4、除非特別指定,cp假定要拷貝的文件在下面哪個目錄下()[單選題]*A.用戶目錄(正確答案)B.home目錄C.root目錄D.當(dāng)前目錄5、用"rm-i",系統(tǒng)會提示什么來讓你確認(rèn)()[單選題]*A.命令行的每個選項(正確答案)B.是否真的刪除C.是否有寫的權(quán)限D(zhuǎn).文件的位置6、幾位學(xué)生的某門課成績分別是67分、78分、88分、89分、96分,則“成績”是()[單選題]*A.品質(zhì)標(biāo)志(正確答案)B.數(shù)量標(biāo)志C.標(biāo)志值D.數(shù)量指標(biāo)7、抽樣調(diào)查與重點調(diào)查的主要區(qū)別是()[單選題]*A.作用不同(正確答案)B.組織方式不同C.靈活程度不同D.選取調(diào)查單位的方法不同8、先對總體中的個體按主要標(biāo)志加以分類,再以隨機原則從各類中抽取一定的單位進(jìn)行調(diào)查,這種抽樣調(diào)查形式屬于()[單選題]*A.簡單隨機抽樣(正確答案)B.等距抽樣C.整群抽樣D.類型抽樣9、統(tǒng)計指標(biāo)按所反映的數(shù)量特征不同可以分為數(shù)量指標(biāo)和質(zhì)量指標(biāo)兩種。其中數(shù)量指標(biāo)的表現(xiàn)形式是()[單選題]*A.絕對數(shù)(正確答案)B.相對數(shù)C.平均數(shù)D.小數(shù)10、HDfS中的block默認(rèn)保存幾份?()[單選題]*A.1份(正確答案)B.2份C.3份D.不確定11、對某市全部商業(yè)企業(yè)職工的生活狀況進(jìn)行調(diào)查,調(diào)查對象是()[單選題]*A.該市全部商業(yè)企業(yè)(正確答案)B.該市全部商業(yè)企業(yè)的職工C.該市每一個商業(yè)企業(yè)D.該市商業(yè)企業(yè)的每一名職工12、在抽樣推斷中,可計算和控制的誤差是()[單選題]*A.登記誤差(正確答案)B.系統(tǒng)性誤差(偏差)C.抽樣實際誤差D.抽樣平均誤差13、下面偏度系數(shù)的值表明數(shù)據(jù)分布形態(tài)是右偏的是()[單選題]*A.1.429(正確答案)B.0C.-3.412D.-114、()可以刻畫離中趨勢。[單選題]*A.均值(正確答案)B.全距C.眾數(shù)D.中位數(shù)15、正態(tài)分布有兩個參數(shù)δ與μ,(),分布越集中,正態(tài)曲線的形狀越“扁平”。[單選題]*A.μ越大(正確答案)B.μ越小C.δ越大D.δ越小16、HBase依賴()提供強大的計算能力[單選題]*A.Zookeeper(正確答案)B.ChubbyC.RPCD.MapReduce17、HFile數(shù)據(jù)格式中的Data字段用于()[單選題]*A.存儲實際的KeyValue數(shù)據(jù)(正確答案)B.存儲數(shù)據(jù)的起點C.指定字段的長度D.存儲數(shù)據(jù)塊的起點18、HFile數(shù)據(jù)格式中的Magic字段用于()[單選題]*A.存儲隨機數(shù),防止數(shù)據(jù)損壞(正確答案)B.存儲數(shù)據(jù)的起點C.存儲數(shù)據(jù)塊的起點D.指定字段的長度19、默認(rèn)情況下,YARN支持下面哪個調(diào)度器。()[單選題]*A.Fairscheduler(正確答案)B.CapacityschedulerC.FIFO調(diào)度器D.DRT調(diào)度器20、HBase虛擬分布式模式需要()個節(jié)點?[單選題]*A.1(正確答案)B.2C.3D.最少3個21、HBase分布式模式最好需要()個節(jié)點?[單選題]*A.1(正確答案)B.2C.3D.最少22、SQL語句中的條件用以下哪一項來表達(dá)()[單選題]*A.THEN(正確答案)B.WHILEC.WHERED.IF23、下面哪項工作場景不是MapReduce計算框架擅長處理的?()[單選題]*A.分析web日志記錄,分析用戶的行為(正確答案)B.實時分析微博熱詞C.分析氣象數(shù)據(jù),找出有歷史記錄以來每年的最高氣溫D.購物籃分析,分析用戶購買商品的關(guān)聯(lián)度24、在Hadoop客戶端提交數(shù)據(jù)到HDFS上時,數(shù)據(jù)文件會被分片(split),最佳的分片策略是()[單選題]*A.等于兩個HDFS的block塊大小(正確答案)B.等于一個HDFS的block塊大小C.等于操作系統(tǒng)的文件塊大小D.大小無所謂25、SELECT語句的完整語法較復(fù)雜,但至少包括的部分是()[單選題]*A.僅SELECT(正確答案)B.SELECT,F(xiàn)ROMC.SELECT,GROUPD.SELECT,INTO26、子表中一個列族下的所有數(shù)據(jù)統(tǒng)一存放在一個物理文件中,該物理文件對應(yīng)于HRegion中的一個()[單選題]*A.StoreFile(正確答案)B.HFileC.StoreD.MemStore27、向數(shù)據(jù)表中更新一條記錄用以下哪一項()[單選題]*A.CREATE(正確答案)B.INSERTC.SAVED.UPDATE28、關(guān)于Tableau,以下說法錯誤的是():[單選題]*A.Tableau支持多種格式數(shù)據(jù),包括平面文件(比如Execl,txt文本),或者是數(shù)據(jù)庫(jdbc,odbc均可)(正確答案)B.支持多表關(guān)聯(lián)C.使用Tableau分析數(shù)據(jù),比傳統(tǒng)的數(shù)據(jù)庫查詢快10到100倍D.Tableau不能查詢Hadoop29、HDFS的NameNode負(fù)責(zé)管理文件系統(tǒng)的命名空間,將所有的文件和文件夾的元數(shù)據(jù)保存在一個文件系統(tǒng)樹中,這些信息也會在硬盤上保存成以下文件:()[單選題]*A.日志(正確答案)B.命名空間鏡像C.兩者都是D.兩者都不是30、客戶端在HDFS上進(jìn)行文件寫入時,namenode根據(jù)文件大小和配置情況,返回部分datanode信息,然后()負(fù)責(zé)將文件劃分為多個Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€DataNode塊。[單選題]*A.Namenode(正確答案)B.DatanodeC.SecondarynamenodeD.客戶端31、HDFS的是基于流數(shù)據(jù)模式訪問和處理超大文件的需求而開發(fā)的,默認(rèn)的最基本的存儲單位是128M,具有高容錯、高可靠性、高可擴(kuò)展性、高吞吐率等特征,適合的讀寫任務(wù)是()[單選題]*A.一次寫入,少次讀取(正確答案)B.多次寫入,少次讀取C.一次寫入,多次讀取D.多次寫入,多次讀取32、組合多條SQL查詢語句形成組合查詢的操作符是()[單選題]*A.SELECT(正確答案)B.ALLC.LINKD.UNION33、HBase是面向()的數(shù)據(jù)庫。[單選題]*A.行(正確答案)B.列C.網(wǎng)絡(luò)D.內(nèi)存34、linux中,哪個目錄存放用戶密碼信息()[單選題]*A./boot(正確答案)B./etcC./varD./dev35、考慮如下場景:在M/R系統(tǒng)中,-HDFS塊的大小是128MB-輸入數(shù)據(jù)格式是FileInputFormat-我們有2個文件,大小分別為64Mb和200Mb問:Hadoop框架將啟動幾個mapper進(jìn)程進(jìn)行處理?()[單選題]*A.2個(正確答案)B.3個C.4個D.5個36、在大數(shù)據(jù)的單位中,PB稱為”拍字節(jié)”,其中1PB指的是:()[單選題]*A.1024KB(正確答案)B.1024MBC.1024GBD.1024TB37、hdfs-site.xml中哪個主要屬性決定數(shù)據(jù)存儲的路徑?()[單選題]*A..dir(正確答案)B.dfs.data.dirC.fs.checkpoint.dirD.dfs.url38、以下哪項用于左連接()[單選題]*A.JOIN(正確答案)B.RIGHTJOINC.LEFTJOIND.INNERJOIN39、SQL是一種()語言。[單選題]*A.函數(shù)型(正確答案)B.高級算法C.關(guān)系數(shù)據(jù)庫D.人工智能40、一張表的主鍵個數(shù)為()[單選題]*A.至多3個(正確答案)B.沒有限制C.至多1個D.至多2個41、在Hadoopv2YARN中,負(fù)責(zé)管理一個單獨節(jié)點內(nèi)資源的服務(wù)是()[單選題]*A.NodeManager(正確答案)B.ResourceManagerC.NameNodeD.DataNode42、向數(shù)據(jù)表中插入一條記錄用以下哪一項()[單選題]*A.CREATE(正確答案)B.INSERTC.SAVED.UPDATE43、Hadoopfs中的-get和-put命令操作對象是:()[單選題]*A.文件(正確答案)B.目錄C.兩者都是D.兩者都不是44、創(chuàng)建一個數(shù)據(jù)庫表用以下哪一項()[單選題]*A.UPDATE(正確答案)B.CREATEC.UPDATEDD.ALTER45、HDFS是一個分布式文件系統(tǒng),它允許用戶使用shell命令操作文件系統(tǒng)。其中讀取/user/hduser/file1.txt文件并打印到屏幕上的命令是:()[單選題]*A.hdfsdfs-ls/user/hduser/file1.txt(正確答案)B.hdfsdfs-mkdir/user/hduser/file1.txtC.hdfsdfs-cat/user/hduser/file1.txtD.hdfsdfs-put/user/hduser/file1.txt46、LSM更能保證哪種操作的性能?()[單選題]*A.讀(正確答案)B.寫C.隨機讀D.合并47、HDFS文件系統(tǒng)有一個/作為根目錄。運行如下哪個命令來列出在HDFS中新創(chuàng)建的目錄的內(nèi)容:()[單選題]*A.hdfsdfs-lstest(正確答案)B.hdfsdfs-mkdirtestC.hdfsdfs-cattestD.hdfsdfs-puttest48、運行如下的命令,將本地readme.txt文件拷貝到test目錄中:()[單選題]*A.hdfsdfs-cattest/readme.txt(正確答案)B.hdfsdfs-puttest/readme.txtC.hdfsdfs-rm-Rtest/readme.txtD.hdfsdfs-copyFromLocalreadme.txttest49、關(guān)于MapReduce計算框架,以下說法正確的是:()[單選題]*A.MapReduce是一個離線的批處理計算框架(正確答案)B.MapReduce是一個實時的流處理計算框架C.MapReduce是一個內(nèi)存計算框架D.以上說法都正確50、在MapReduce的Shuffle階段,每個Reducer使用HTTP協(xié)議來從Mapper節(jié)點獲取自己的partition。默認(rèn)每個Reducer使用幾個線程來獲取Maper節(jié)點數(shù)據(jù)?()[單選題]*A.3個(正確答案)B.4個C.5個D.6個51、HadoopMapReduce應(yīng)用程序可以運行在YARN上,使用一個()來協(xié)調(diào)每個job以及一系列資源容器(resourcecontainer)來運行Map和Reduce任務(wù)。[單選題]*A.NodeManager(正確答案)B.ResourceManagerC.JobTrackerD.ApplicationMaster52、以下哪個命令可以終止一個用戶的所有進(jìn)程()[單選題]*A.skillall(正確答案)B.skillC.killD.killall53、在基本K均值算法里,當(dāng)鄰近度函數(shù)采用()的時候,合適的質(zhì)心是簇中各點的中位數(shù)[單選題]*A.曼哈頓距離(正確答案)B.平方歐幾里德距離C.余弦距離D.Bregman散度54、關(guān)于SecondaryNameNode哪項是正確的?()[單選題]*A.它是NameNode的熱備(正確答案)B.它對內(nèi)存沒有要求C.它的目的是幫助NameNode合并編輯日志,減少NameNode啟動時間D.SecondaryNameNode應(yīng)與NameNode部署到一個節(jié)點55、以HDFS上master:9000/graphdata.txt中的數(shù)據(jù)創(chuàng)建圖graphhdfs,其中g(shù)raphdata.txt文本格式:121256132156?,F(xiàn)將graphhdfs中每個節(jié)點的屬性值變?yōu)樵档?倍,并查看其中的10個頂點,則以下選項正確的是()[單選題]*A.valtemp=graphhdfs.mapVertices((x1,x2)=>x2.toInt*3).vertices.take(10)(正確答案)B.valtemp=graphhdfs.mapEdges((x1,x2)=>x2.toInt*3).vertices.take(10)C.valtemp=graphhdfs.mapVertices(x=>x._2.toInt*3).vertices.take(10)D.valtemp=graphhdfs.map(x=>x._1.toInt*3).vertices.take(10)56、Mahout中實現(xiàn)的ALS-WR算法計算()后,就可以進(jìn)行推薦了[單選題]*A.評分矩陣(userXitem)A(正確答案)B.用戶特征矩陣UC.物品特征矩陣MD.U與M’的乘積A_k矩陣57、HBase依賴()提供消息通信機制[單選題]*A.Zookeeper(正確答案)B.ChubbyC.RPCD.Socket58、Client端上傳文件的時候下列哪項正確()[單選題]*A.數(shù)據(jù)經(jīng)過NameNode傳遞給DataNode(正確答案)B.Client端將文件切分為Block,依次上傳C.Client只上傳數(shù)據(jù)到一臺DataNode,然后由NameNode負(fù)責(zé)Block復(fù)制工作D.以上都不對59、下面與Zookeeper類似的框架是()[單選題]*A.Protobuf(正確答案)B.JavaC.KafkaD.Chubby60、下面與HDFS類似的框架是()[單選題]*A.NTFS(正確答案)B.FAT32C.GFSD.EXT361、在Hbase中刪除表t1的命令是()[單選題]*A.droptablet1(正確答案)B.truncatet1C.drop‘t1’D.truncatetablet162、使用Pig的優(yōu)勢在于()[單選題]*A.Pig可以使用一個類SQL的語言,降低了學(xué)習(xí)成本(正確答案)B.Pig的語言編輯器可以把類SQL語言轉(zhuǎn)換為一系列經(jīng)過優(yōu)化處理的MapReduce運算C.目前Pig主要由開源社區(qū)維護(hù)D.Pig是一種數(shù)據(jù)流語言63、Spark中的task分別是以()方式維護(hù)的[單選題]*A.進(jìn)程(正確答案)B.線程C.流水線D.以上都不是64、MapReduce中的task是以()方式維護(hù)的[單選題]*A.進(jìn)程(正確答案)B.線程C.流水線D.以上都不是65、配置Standalone模式下的Spark集群,Worker節(jié)點需要在conf文件夾下的哪個文件中指明()[單選題]*A.regionserver(正確答案)B.spark-env.shC.spark-defaults.confD.slaves66、valrdd=sc.parallelize(List(("Tom",2),("Lee",5),("Lee",6),(“Tom”,7)))rdd.reduceByKey((x,y)=>x+y).collect上述代碼的執(zhí)行結(jié)果為()[單選題]*A.Array((1,2),(3,10))(正確答案)B.Array((9,“Tom”),(11,“Lee”))C.Array((“Tom”,9),(“Lee”,11))D.Array((“Tom”,2,7),(“Lee”,5,6))67、valrdd=sc.parallelize(1to10).filter(_%2==0)rdd.collect上述代碼的執(zhí)行結(jié)果為()[單選題]*A.Array(1,2,3,4,5,6,7,8,9,10)(正確答案)B.Array(1,3,5,7,9)C.Array(2,4,6,8,10)D.Array(1,10)68、基于密集向量(1.0,0.0,3.0)創(chuàng)建一個LabledPoint,設(shè)其標(biāo)識值為1.0,以下正確的選項為()[單選題]*A.valpos=LabeledPoint(1.0,Vectors.dense(1.0,0.0,3.0))(正確答案)B.valpos=LabeledPoint(1.0,(1.0,0.0,3.0))C.valpos=LabeledPoint(Vectors.dense(1.0,0.0,3.0),1.0)D.valpos=LabeledPoint((1.0,0.0,3.0),1.0)69、MLlib中創(chuàng)建稀疏矩陣((0.0,2.0),(3.0,0.0),(0.0,6.0))的語句是()[單選題]*A.valdm:Matrix=Matrices.dense(3,2,Array(0.0,3.0,0.0,2.0,0.0,6.0))(正確答案)B.valdm:Matrix=Matrices.sparse(3,2,Array(0.0,2.0,3.0,0.0,0.0,6.0))C.valsm:Matrix=Matrices.sparse(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6))D.valsm:Matrix=Matrices.dense(3,2,Array(0,1,2),Array(1,0,1),Array(2,3,6))70、MLlib提供的分布式矩陣中,不包含行、列索引信息的矩陣類型是()[單選題]*A.RowMatrix(正確答案)B.IndexedRowMatrixC.MatrixD.CoordinateMatrix71、Spark支持的分布式部署方式中哪個是錯誤的()[單選題]*A.standalone(正確答案)B.sparkonmesosC.sparkonYARND.Sparkonlocal72、下列哪個操作能夠?qū)崿F(xiàn)“基于窗口將DStream[(K,V)]中的值V按鍵K使用聚合函數(shù)func聚合得到新的DStream”()[單選題]*A.count(正確答案)B.reduceByKeyAndWidowC.countByValueD.reduceByKey73、在SparkStreaming中批處理時間間隔是指()[單選題]*A.系統(tǒng)將獲取到的數(shù)據(jù)流封裝成一個RDD的時間間隔(正確答案)B.系統(tǒng)對數(shù)據(jù)流進(jìn)行統(tǒng)計分析的時間間隔C.系統(tǒng)對數(shù)據(jù)流
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二四年度新型鋁材特種定制購銷合同范本3篇
- 二零二五年度車輛抵押借款合同(含車輛保險理賠)4篇
- 二零二五版城市景觀照明工程設(shè)計施工合同范本4篇
- 專項服務(wù)協(xié)議知識產(chǎn)權(quán)維護(hù)說明一
- 二零二五年度家電租賃服務(wù)合同與2025年度維修維護(hù)保障合同4篇
- 2024年企業(yè)主要負(fù)責(zé)人安全培訓(xùn)考試題(培優(yōu)A卷)
- 二零二五年度環(huán)保型變壓器研發(fā)、生產(chǎn)及安裝合作合同3篇
- 23年-24年項目管理人員安全培訓(xùn)考試題【完整版】
- 2023年-2024年項目安全培訓(xùn)考試題附完整答案【歷年真題】
- 二零二五版房地產(chǎn)租賃合同擔(dān)保及售后服務(wù)保障范本4篇
- 初級中學(xué)語文教師資格考試學(xué)科知識與教學(xué)能力試題及解答參考(2024年)
- 《帶一本書去讀研:研究生關(guān)鍵學(xué)術(shù)技能快速入門》筆記
- 人教版八年級數(shù)學(xué)下冊舉一反三專題17.6勾股定理章末八大題型總結(jié)(培優(yōu)篇)(學(xué)生版+解析)
- 2024屆上海高考語文課內(nèi)古詩文背誦默寫篇目(精校版)
- DL-T5024-2020電力工程地基處理技術(shù)規(guī)程
- 2024年度-美團(tuán)新騎手入門培訓(xùn)
- 初中數(shù)學(xué)要背誦記憶知識點(概念+公式)
- 駕照體檢表完整版本
- 農(nóng)產(chǎn)品農(nóng)藥殘留檢測及風(fēng)險評估
- 農(nóng)村高中思想政治課時政教育研究的中期報告
- 20100927-宣化上人《愣嚴(yán)咒句偈疏解》(簡體全)
評論
0/150
提交評論