ACP大數(shù)據(jù)工程師復習試題含答案_第1頁
ACP大數(shù)據(jù)工程師復習試題含答案_第2頁
ACP大數(shù)據(jù)工程師復習試題含答案_第3頁
ACP大數(shù)據(jù)工程師復習試題含答案_第4頁
ACP大數(shù)據(jù)工程師復習試題含答案_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第頁ACP大數(shù)據(jù)工程師復習試題含答案1.tbl_p為一個ODPS的分區(qū)表,包含一個p1='1'的分區(qū),現(xiàn)在想把該分區(qū)上的數(shù)據(jù)刪除,達到使用select*fromtblwherepi='1'查詢時,返回結果為空的目的。以下哪個SQL可以實現(xiàn)該功能?A、truncatetabletbl;B、altertabletbldroppartition(p1='1');C、insertintotabletblselect*fromtblwhere1=2;D、deletefromtabletbl;【正確答案】:B解析:

MaxCompute不支持直接對表數(shù)據(jù)進行刪除(DELETE)操作。您可以通過如下方法進行刪除:通過刪除(DROP語句)表,達到刪除數(shù)據(jù)的目的。2.以下哪種對RDS的描述是正確的?A、一個實例可以創(chuàng)建多個數(shù)據(jù)庫B、在實例內(nèi)數(shù)據(jù)庫命名可重復C、數(shù)據(jù)庫不會共享該實例下的資源D、以上都不對【正確答案】:A解析:

RDS中數(shù)據(jù)庫名稱是唯一的,相同庫名是無法創(chuàng)建的;RDS下數(shù)據(jù)庫資源是可以共享的。3.Bob使用java開發(fā)了一個大數(shù)據(jù)計算服務的MapReduce,用來對海量交易數(shù)據(jù)做時序分析,結果該MR性能較差,某些map存在明顯的長尾效應,__________方法可以有效的消除長尾效應。A、只關心處理的列,忽略其余的多余列B、合理使用combiner,適當?shù)臏p少數(shù)據(jù)交互量C、通過set命令或者Jobconf修改MR參數(shù),增大map/reduce的內(nèi)存D、通過set命令或者Jobconf修改MR參數(shù),影響分片的大小和個數(shù)【正確答案】:B解析:

無4.大數(shù)據(jù)計算服務中的日志表log是一張分區(qū)表,分區(qū)鍵是dt,每天產(chǎn)生一個分區(qū)用于存儲當天新增的數(shù)據(jù),現(xiàn)在共有dt='20160101'至dt='20160131'共31個分區(qū)的數(shù)據(jù),為了刪除20160101當天新增的數(shù)據(jù),可以通過_____方式實現(xiàn)。A、deletefromlogwheredt='20160101'B、altertablelogdroppartition(dt=20160101')C、truncatetablewheredt='20160101'D、droppartitionlog(dt='20160101')【正確答案】:B解析:

刪除分區(qū)表分區(qū)數(shù)據(jù):使用drop關鍵字;刪除非分區(qū)表數(shù)據(jù):使用truncate關鍵字;不支持delete操作;5.作為技術人員,小王被ODPS的大數(shù)據(jù)處理能力吸引,想體驗一下,他快速注冊了阿里云賬號,進入官網(wǎng)后試圖創(chuàng)建一個名字為test.project的ODSPproject,結果沒有成功,試分析,小王出錯的最有可能的原因是()A、項目空間名稱已存在B、賬號未開通ODPS的使用權限C、賬號未充值,余額不足導致出錯D、未創(chuàng)建合適的accesslD和accessKey【正確答案】:A解析:

未開通服務是無法使用的;未充值也不影響創(chuàng)建項目;是否創(chuàng)建合適的accessid和創(chuàng)建項目空間沒有直接關系。如果項目空間名稱已存在,則不會創(chuàng)建成功。6.ADS的普通表的一級分區(qū)數(shù)量最多有多少個()A、無限制B、128個C、256個D、1000個【正確答案】:C解析:

正確答案C。一般來講,每個分區(qū)的數(shù)據(jù)不超過800萬條為宜,當然也不絕對,分區(qū)數(shù)不能超過256個7.在大數(shù)據(jù)計算服務的數(shù)據(jù)倉庫中的訂單表fact_order,建表語句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的數(shù)據(jù)是從ods_order加工而來,ods_order建表語句如下:createtableods_order(order_idstring,order_amtbigint,order_dtstring);ods_order中有一條記錄數(shù)據(jù)值是order_idorder_amtorder_dt000110020160301。運行SQL語句將數(shù)據(jù)從ods_order加載到fact_order中:insertoverwritetablefact_orderpartition(dt='20160301')select*fromods_order;對此語句的執(zhí)行結果描述正確的是___。A、提交SQL時會報語法錯誤B、語句可以執(zhí)行,order_amt的值會被自動的轉(zhuǎn)為double類型C、語句可以執(zhí)行,但是這條數(shù)據(jù)會被當作臟數(shù)據(jù)丟棄D、目標表與源表中的數(shù)據(jù)類型不一致,執(zhí)行出錯【正確答案】:B解析:

隱式轉(zhuǎn)換int會轉(zhuǎn)換成double,語法不會報錯,可以正常執(zhí)行。int類型的值是可以轉(zhuǎn)換double類型8.在ADS中,為了更高效的進行表關聯(lián),兩個事實表進行Join的必要條件不包括以下哪些項?A、這兩個表的joinkey至少有一列建立了主鍵B、這兩個表在一個表組C、這兩個表的joinkey是hash分區(qū)列D、兩個表的Hash分區(qū)數(shù)必須一致【正確答案】:A解析:

為了更高效的進行表關聯(lián),分析型數(shù)據(jù)庫對表關聯(lián)操作在分析型數(shù)據(jù)庫中,兩個事實表進行Join的充要條件是:(1)這兩個表在一個表組;(2)這兩個表的JoinKey是Hash分區(qū)列;(3)兩張表的Hash分區(qū)數(shù)必須一致,否則Join結果不準確;(4)兩張表的JoinKey至少有一列建立了HashMap索引,推薦建立在數(shù)據(jù)量較小的一側。9.大數(shù)據(jù)開發(fā)治理平臺DataWorks中,周期性調(diào)度任務是指按配置的時間周期進行自動調(diào)度的任務,以下場景中,()不適合配置成周期性調(diào)度任務。A、MaxCompute中基于商品庫存表每隔一小時生成一張庫存盤點的匯總表B、每隔5分鐘對MaxCompute中的訪問日志表進行一次數(shù)據(jù)清洗C、今天市場部經(jīng)理臨時要求分析師基于MaxCompute中的用戶交易表生成一份昨天有成交記錄的品牌列表D、把云數(shù)據(jù)庫RDS中的用戶登錄記錄表每天0點30分同步到MaxCompute表中【正確答案】:C解析:

根據(jù)題目臨時要求,臨時要求一般為一次性任務,很明顯不需要周期調(diào)度。10.以下哪些應用場合適合RDS只讀實例來完成()A、擴大RDS的存儲能力B、分擔RDS主實例的寫壓力C、緩解RDS主實例的寫壓力D、實現(xiàn)兩天前的數(shù)據(jù)回溯【正確答案】:B解析:

/yiqiu3812/article/details/10...11.2只讀實例能分擔RDS主實例的寫壓力11.有關DDoS攻擊的描述,最準確的是?A、主要是攻擊目標是數(shù)據(jù)庫B、黑客自己夠買了大量服務器,專門從事破壞活動C、攻擊的目的是讓服務超負載,然后竊取機密信息D、攻擊的主要目的是讓指定目標無法提供正常服務,甚至從互聯(lián)網(wǎng)上消失,是目前最強大、最難防御的攻擊之一【正確答案】:D解析:

無12.從ODPS導入數(shù)據(jù)到ADS的時候,導入路徑的格式為?A、odps://project_nameltable_name:partition_specB、odps://project_nameltable_name/partition_specC、odps://project_nameltable_name(partition_spec)D、odps://project_nameltable_namepartition_spec【正確答案】:B解析:

無13.DataIDE的數(shù)據(jù)管理模塊主要是對項目空間中的表的元數(shù)據(jù)、權限申請等進行管理操作,以下說法錯誤的是()A、可以通過數(shù)據(jù)管理模塊查看項目空間中的表的生命周期B、可以通過數(shù)據(jù)管理模塊查看項目空間中的表的結構C、可以通過數(shù)據(jù)管理模塊申請項目空間中的表的查詢權限D(zhuǎn)、可以通過數(shù)據(jù)管理模塊查看項目空間中的表的數(shù)據(jù).【正確答案】:D解析:

數(shù)據(jù)管理模塊:全局預覽,查找數(shù)據(jù)(此頁面功能為搜索數(shù)據(jù)表),數(shù)據(jù)表管理,權限管理。可以查看表的基本信息(表名,項目名稱,負責人,描述,權限),存儲信息(物理存儲量,生命周期,是否分區(qū)表,表的創(chuàng)建時間,ddl時間,數(shù)據(jù)最后變更時間),字段信息,分區(qū)信息,產(chǎn)出信息,變更歷史,血緣信息,申請授權D、支持在數(shù)據(jù)管理模塊預覽數(shù)據(jù),這道題有待考究14.Hadoop主要組成不包括以下哪個選項?A、MapReduceB、YARNC、HIVED、HDFS【正確答案】:C解析:

主要組成:MapReduce、YARN和HDFS15.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的開發(fā)人員在做數(shù)據(jù)探查時,想要從nginx日志表nginx_access_log中取10條記錄,可以____通過實現(xiàn)。A、selectfromnginx_access_logwhererownumc=10B、selecttop10*fromnginx_access_logC、select"fromnginx_access_loglimit10;D、select"fromnginx_access_logorderby_rownum_limit10;【正確答案】:C解析:

取10條數(shù)據(jù)的方式:1、selectlimit10;前10條;2、Readtable_name10;隨機10條;16.您希望通過管理控制臺進行阿里云的專有網(wǎng)絡VPC內(nèi)的云服務器ECS實例的私網(wǎng)IP地址的修改,但發(fā)現(xiàn)操作的菜單不可用,是________原因引起的。A、該云服務器ECS實例所在的VPC類型是默認專有網(wǎng)絡B、該云服務器ECS實例沒有綁定IPC、沒有針對該云服務器ECS實例進行停止操作,且該云服務器ECS實例不是停止狀態(tài)D、該云服務器ECS實例不是運行狀態(tài)【正確答案】:C解析:

修改私網(wǎng)IP需要保證ECS處于已停止的狀態(tài)。17.數(shù)據(jù)工場DataWorks中,task1和task2都是按天調(diào)度的周期性調(diào)度任務,task1生成分區(qū)表table1,task2生成分區(qū)表table2,每天task2取table1最新分區(qū)的數(shù)據(jù)進行統(tǒng)計,而task1有部分數(shù)據(jù)來源是table2前一天分區(qū)的數(shù)據(jù)。task1和task2的依賴關系需要如何配置?A、只需要task1依賴屬性的上游任務配置為task2B、task1和task2都不需要配置依賴屬性C、task1跨周期依賴選擇“等待自定義任務的上一周期結束,才能繼續(xù)運行”,自定義任務填寫task2,task2依賴屬性的上游任務配置為task1D、只需要task2依賴屬性的上游任務配置為task1【正確答案】:C解析:

調(diào)度周期配置按題意應該是task2依賴task1,task1依賴task2的前一天數(shù)據(jù),要保證依賴關系正常執(zhí)行,需要task1等待前一周期結束,然后task2才能正常執(zhí)行。A、如果只設置task1依賴屬性的上游任務配置為task2,那么task2無法取table1最新分區(qū)數(shù)據(jù)進行統(tǒng)計;B、不依賴是無法完成題目中復雜的邏輯運算的;D、只設置task2依賴屬性的上游任務配置為task1,那么無法實現(xiàn)task1部分數(shù)據(jù)取字table2的前一天分區(qū)。18.OTS中可以使用拼接的分片鍵,拼接就是把幾個屬性拼接成一個屬性。拼接是為了解決什么問題()A、解決數(shù)據(jù)生命周期的問題B、解決寫壓力過于集中的問題C、解決單個分片鍵下數(shù)據(jù)量過大的問題D、解決OTS預留讀寫量不足的問題【正確答案】:C解析:

正確答案CTableStore建議單個分片下的數(shù)據(jù)量大小不超過1GB,如果您的表中單個分片鍵的所有行的總數(shù)據(jù)量大小可能超過1GB,在設計表時可以將原來的多個主鍵列拼接成分片鍵。19.關于Maxcompute,說法不正確的是()A、在很多方面并不具備數(shù)據(jù)庫的特征B、適用于海量數(shù)據(jù),實時性要求不高的場合C、每個作業(yè)的準備,提交等階段要花費較長時間D、大部分標準SQL的功能都支持,但是不支持窗口函數(shù)、rownum等【正確答案】:D解析:

Maxcompute不支持事務,索引等數(shù)據(jù)庫特征,批量離線處理,對實時性不高;不能處理實時性特別高的事務,響應時間長,需要花費時間長。是支持窗口函數(shù)的。20.數(shù)據(jù)工場DataWorks(原DatalDE)中的調(diào)度任務可以通過配置依賴屬性來控制任務運行的先后順序,下列說法不正確的是()。A、同一個組織的不同數(shù)據(jù)工場DataWorks(原DatalDE)項目空間中的調(diào)度任務不能配置成上下游依賴的關系B、多個調(diào)度任務可以配置成依賴同一個上游任務C、同一個項目空間中的節(jié)點任務和工作流任務可以配置成上下游依賴的關系D、一個調(diào)度任務可以配置多個上游依賴任務【正確答案】:A解析:

官網(wǎng)文檔中:數(shù)據(jù)開發(fā)-調(diào)度配置-依賴關系中說明,DataWorks目前支持同區(qū)域下的跨項目依賴21.ODPS的命令行工具odpscmd可以使用以下哪個參數(shù)調(diào)用某個文件中的命令集?A、kB、eC、fD、C【正確答案】:C解析:

odpscmd-fxxx.sql22.在服務器上手動安裝云盾客戶端安騎士時需要什么權限?A、系統(tǒng)管理員權限B、FTP服務權限C、數(shù)據(jù)庫權限D(zhuǎn)、系統(tǒng)普通用戶權限【正確答案】:A解析:

登錄阿里云帳號,進入服務器安全(安騎士)控制臺-安裝Agent頁面,根據(jù)頁面提示獲取最新版本下載地址,以管理員權限在服務器上運行并安裝,點擊進入安裝頁面。23.在MaxCompute中,根據(jù)業(yè)務需要有時需要優(yōu)化SQL語句,下列關于SQL語句優(yōu)化方法的說法中,正確的是()。A、在多個去重逾矩的場景中,可能發(fā)生數(shù)據(jù)膨脹,建議多使用groupby而不是distinctB、將groupby語句拆成兩部分會降低SQL執(zhí)行效率C、在進行Mapper優(yōu)化時,當input的文件都很大,任務邏輯復雜,map執(zhí)行非常慢的時候,可以考慮減少Map數(shù)D、分區(qū)裁剪過濾分區(qū)列,可以避免SQL執(zhí)行時完整表掃描,通過logview檢查分區(qū)裁剪是否有效【正確答案】:A解析:

當input的文件都很大,任務邏輯復雜,map執(zhí)行非常慢的時候,可以考慮增加Map數(shù),來使得每個map處理的數(shù)據(jù)量減少,從而提高任務的執(zhí)行效率。groupby:數(shù)據(jù)量大時比distinct效率更高,且使用場景更大。24.ADS創(chuàng)建普通表時,關于updateType屬性那種說法是錯誤的?A、合法的取值為realtime或者batch,該值不顯式指定時,默認取batchB、該值為realtime時,對應的表必須指定合法的主鍵并且必須指定二級分區(qū)C、通過該屬性指定數(shù)據(jù)的更新方式D、該值為batch時,如果要支持增量導入,必須指定二級分區(qū)【正確答案】:B解析:

根據(jù)表的數(shù)據(jù)更新方式不同,分析型數(shù)據(jù)庫的表根據(jù)updateType分為批量更新表(僅能夠離線批量更新數(shù)據(jù))和實時更新表(能夠通過insert/delete實時更新數(shù)據(jù)),用updateType以區(qū)分,如果updateType選項不填則默認為批皇更新表。需要注意的是,updateType=realtime暨為實時更新表時,必須指定合法的主鍵并且不能有二級分區(qū)。25.以下不屬于基于Dataworks的數(shù)據(jù)倉庫建設的優(yōu)勢?A、全托管B、高性能C、免運維D、高成本【正確答案】:D解析:

高性能、低成本、免運維、全托管/document_detail/73016.html?spm=a2c4g.143996.0.i1026.關于ADS的ECU,說法正確的是?A、可以動態(tài)的擴容或者縮容,兩者都是瞬間的同步操作B、通過參數(shù)設置,可以使同一個ADS的庫同時使用兩種類型的ECUC、可以通過查詢表information_schema.resource_request獲得目前的ECU的狀態(tài)D、可以通過DDL語句alterdatabasesetecu_count=N來修改ECU的個數(shù)【正確答案】:D解析:

A、動態(tài)擴容或縮容不能瞬間完成;B、兩種類型ECU需要根據(jù)業(yè)務需求指定一種使用:(1)高性能:以字母C或者H開頭的ECU為高性能實例,數(shù)據(jù)全部存儲在SSD磁盤中。適用于對性能要求高、查詢并發(fā)高的業(yè)務場景。(2)大存儲:以字母S開頭的ECU為大存儲實例,采用SSD/HDD分層存儲架構,熱點數(shù)據(jù)存儲在SSD磁盤中,冷數(shù)據(jù)存儲在HDD磁盤中。適用于并發(fā)稍低、性能要求不高(可接受數(shù)據(jù)查詢響應時間受超過10秒以上)的業(yè)務場景。CD、如果當前ECU配置無法滿足需求,您可以變更ECU配置。注意:當遇到特殊情況需要手動擴縮容時,請登錄ads_ag容器,執(zhí)行以下命令即可,[$ECU_Type]為ECU的類型,[$ECU_Count]為ECU的數(shù)量。27.關于ADS的權限模型,下列哪些描述是正確的()A、每個權限級別能聚合其下面級別的所有權限B、導出數(shù)據(jù)時需要DUMPDATA、DESCRIBE和SELECT權限,同時需要數(shù)據(jù)導出目的地的數(shù)據(jù)寫入相關權限C、查詢表數(shù)據(jù)需要SELECT權限,最小級別是表D、ADS的授權模型和Mysql非常相似,比如ADS支持針對用戶在host上授權【正確答案】:A解析:

正確答案A。A、聚合:Database–>Table[Group)]-->Column,即每個權限級別能聚合其下面級別的所有權限。B、導出數(shù)據(jù)同時需要DUMPDATA和SELECT權限,同時需要數(shù)據(jù)導出目的地的數(shù)據(jù)寫入相關權限,并非所有查詢都需要該權限,例如SELECTnow()C、最小查詢級別是列級;D、任何分析型數(shù)據(jù)庫支持的賬號類型均可視為一個用戶。和Mysql略有不同的是,分析型數(shù)據(jù)庫目前不支持針對用戶在host上授權。28.在進行數(shù)據(jù)分析之前,需要對數(shù)據(jù)進行處理,以下屬于數(shù)據(jù)處理操作的是()A、構建數(shù)據(jù)分析模型,進行預測分析,評估模型B、確定數(shù)據(jù)范圍,獲取目標數(shù)據(jù),并整合相關數(shù)據(jù)C、整理組合信息,通過圖表展現(xiàn)信息D、處理缺失數(shù)據(jù),清洗不一致數(shù)據(jù)【正確答案】:D解析:

缺失值處理、異常值處理、重復值處理等數(shù)據(jù)清洗操作屬于數(shù)據(jù)處理,所以選擇D。29.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的MapReduce在正式執(zhí)行Map前,需要將輸入數(shù)據(jù)進行"片"(split)。關于分片的說法中錯誤的是A、分片會對輸入文件進行實際的物理切分,即分片數(shù)據(jù)會被存成多個大小相同的物理文件B、一個輸入分片就是能夠被單個map操作處理的輸入塊C、每一個map操作只處理一個輸入分片D、可以通過參數(shù)控制分片的大小【正確答案】:A解析:

map的分片是邏輯上的分片,只是一種標記,不會是物理上的分片MapReduce是處理數(shù)據(jù)的一種編程模型,通常用于大規(guī)模數(shù)據(jù)集的并行運算。您可以使用MapReduce提供的接口(JavaAPI)編寫MapReduce程序,來處理MaxCompute中的數(shù)據(jù)。編程思想是將數(shù)據(jù)的處理方式分為Map(映射)和Reduce(規(guī)約)。在正式執(zhí)行Map前,需要將輸入的數(shù)據(jù)進行分片。所謂分片,就是將輸入數(shù)據(jù)切分為大小相等的數(shù)據(jù)塊,每一塊作為單個MapWorker的輸入被處理,以便于多個MapWorker同時工作。每個MapWorker在讀入各自的數(shù)據(jù)后,進行計算處理,最終通過Reduce函數(shù)整合中間結果,從而得到最終計算結果。30.DRDS的產(chǎn)品定位不包括以下哪項?A、基于RDS的分布式數(shù)據(jù)存儲和檢索產(chǎn)品B、海量數(shù)據(jù)的多維分析C、降低用戶使用分布式數(shù)據(jù)庫的難度D、解決用戶單RDS無法支撐業(yè)務的困難【正確答案】:B解析:

海量數(shù)據(jù)多維分析適合使用大數(shù)據(jù)計算服務完成。31.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)tunnel命令提供了豐富的參數(shù),可以通過參數(shù)設置,對上傳或者下載操作進行控制,現(xiàn)在有一個大文件要上傳至odps某表中,想先檢查一下該文件內(nèi)容是否和表的定義匹配,并不實際上傳,以免文件中有錯誤記錄會導致上傳出錯??梢允褂媚膫€參數(shù)實現(xiàn)這個功能?A、錯誤記錄丟棄:-dbrB、字段分隔符:-fdC、掃瞄選項:-SD、空字符串顯示:-ni【正確答案】:C解析:

無32.阿里云QuickBI報表工具支持多種數(shù)據(jù)源,方便用戶基于自己來自不同數(shù)據(jù)源的數(shù)據(jù)進行分析和展現(xiàn)。目前還不支持作為數(shù)據(jù)源。A、OSSB、MaxComputeC、AnalytieDBD、RDSMySQL【正確答案】:A解析:

支持如下數(shù)據(jù)源:目前自助取數(shù)功能可以支持的數(shù)據(jù)庫類型有限,只支持MySQL、MaxCompute、Oracle、AnalyticDBforMySQL3.0、Clickhouse、Impala等六種類型的數(shù)據(jù)庫。如果您有導出近百萬條數(shù)據(jù)的需求,只能將數(shù)據(jù)存儲于這幾類數(shù)據(jù)庫中,然后通過這幾種數(shù)據(jù)庫建數(shù)據(jù)集,再制作交叉表,供導出場景使用。33.某在線廣告APP采用了阿里云的技術,通過對網(wǎng)上搜集的海量數(shù)據(jù)的分析,給企業(yè)主提供精準的廣告投放人群。該app的產(chǎn)品經(jīng)理介紹該系統(tǒng)能實現(xiàn)以下技術指標:1-能存儲海量數(shù)據(jù),單表大小超過10TB2-支持多張上億的表進行Join3-支持多種篩選條件,包括連續(xù)范圍篩選、取值篩選、and/or/not條件組合等4-支持快速(3秒以內(nèi))對數(shù)十個維度分別進行透視分析根據(jù)以上信息,請判斷該app最有可能使用的是阿里云的哪一款產(chǎn)品?A、分布式關系型數(shù)據(jù)庫(DRDS)B、表格存儲(TableStore,原OTS)C、分析型數(shù)據(jù)庫(AnalyticDB,原ADS)D、大數(shù)據(jù)計算服務(MaxCompute,原ODPS)【正確答案】:C解析:

分析型數(shù)據(jù)庫支持sql規(guī)范規(guī)則并響應速度快。所以最合適。需要區(qū)別不同數(shù)據(jù)庫的性能差異;分布式關系型數(shù)據(jù)庫,主要基于RDS的分布式數(shù)據(jù)存儲和檢索產(chǎn)品,快速響應不及分析性數(shù)據(jù)庫;表格存儲NoSQL,海量結構化數(shù)據(jù)存儲和實時訪問,彈性資源預留,實時監(jiān)控顯示。

大數(shù)據(jù)計算服務主要是海量數(shù)據(jù)存儲計算。34.在數(shù)據(jù)工場DataWorks中使用數(shù)據(jù)同步任務進行數(shù)據(jù)同步時,數(shù)據(jù)同步任務讀源頭表需要權限,寫目標表也需要權限,如數(shù)據(jù)同步任務日志提示:ODPS-0420095:AccessDenied-AuthorizationFailed[4019],YouhaveNOprivilege'odps:Describe'on{acs:odps:*:projects/xxx_prj/tables/xxx_table}.ContextD:2ac7aac3-0928-45d2-98c0-4085fbc6ba88.]通過該提示日志,可以得到信息。A、從該日志可以看出該任務是寫表xxx_prj/tables.xxx_tableB、從該日志可以看出具體哪個云賬號沒有權限C、從該日志可以看出該任務是讀表xxx_prj/tables.xxx_tableD、從該日志提示可以看出是對MaxCompute(原ODPS)表xxx_prj/tables.xxx_table沒有describe權限【正確答案】:A解析:

無35.某Bl系統(tǒng)構建在大數(shù)據(jù)計算服務MaxCompute上,某數(shù)據(jù)分析員在分析訂單的地域分布時,需要把訂單表order(占用存儲空間約10G)與地域維表region(占用存儲空間100M)關聯(lián)起來,兩張表的結構如下:createtableorder(order_idstring,region_idstring,orderamtbigint);createtableregion(region_idstring,region_namestring)在運行時發(fā)現(xiàn)由于訂單大量集中在上海地區(qū),數(shù)據(jù)的傾斜導致整體運行時間較長,運行的SQL語句如下:selectregion_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;此時可以考慮通過優(yōu)化SQL的運行效率。A、使用mapjoinhint:select/*+mapjoin(t2)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;B、使用mapjoinhint:select/*+mapjoin(t1)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;C、調(diào)整兩張表的位置:selectregion_name,sum(order_amt)amtfromregiont1joint2ont1.region_id=t2.region_id;D、減小SQL的splitsize,增加計算資源【正確答案】:A解析:

使用Mapjoin小表放內(nèi)存里可以提高運行速率Mapjoin應該把小表放內(nèi)存,把大表放內(nèi)存不符合調(diào)換位置不影響計算速度數(shù)據(jù)傾斜問題時減少splitsize不能解決的36.使用大數(shù)據(jù)計算服務tunnel命令上傳log.txt文件到表t_log中去,t_log為分區(qū)表,分區(qū)列為(p1string,p2string)。下列命令中正確的是?A、tunneluploadlog.txtt_log/p1="b1"/p2="b2"B、tunneluploadlog.txtt_log/(p1="b1",p2="b2")C、tunneluploadlog.txtt_log/p1="b1",p2="b2"D、tunneluploadlog.txtt_log(p1="b1",p2="b2")【正確答案】:C解析:

upload:上傳數(shù)據(jù)到MaxCompute的表中。支持文件或目錄(指一級目錄)的上傳,每一次上傳只支持數(shù)據(jù)上傳到一張表或表的一個分區(qū)。分區(qū)表一定要指定上傳的分區(qū),多級分區(qū)一定要指定到末級分區(qū)。37.數(shù)據(jù)工場DataWorks(原DataIDE)中,按天調(diào)度的周期性任務task1的定時調(diào)度時間設置為2點0分;按天調(diào)度的周期性任務task2的定時調(diào)度時間設置為0點0分,task1依賴屬性的**任務設置為task2,關于task1以下說法正確的是?A、每天0點0分開始執(zhí)行B、每天2點0分一定開始執(zhí)行C、每天只要task2當前周期執(zhí)行狀態(tài)為成功,則task1馬上開始執(zhí)行D、每天2點0分后task2當前周期執(zhí)行狀態(tài)為成功,則task1可以開始執(zhí)行【正確答案】:D解析:

無38.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的MapReduce編程框架中,Reduce是把Map的輸出結果進行“規(guī)約”(有時稱作“化簡”),得到最終結果的過程,關于Reduce過程,以下說法正確的是_________。A、Map后必須有至少一次的Reduce,對于擴展MR,Map后可以支持連續(xù)多次的ReduceB、對于MapReduce來講,可以沒有Map過程,但是Reduce是必須的C、Reduce的個數(shù)和Map的個數(shù)一定相同,由分片的個數(shù)決定D、在某些特殊情況下,可以沒有Reduce過程【正確答案】:D解析:

Reduce是接收Map的輸出結果進行后續(xù)的“化簡”,所以Reduce可以沒有,特殊情況下只需要Map輸出就可以實現(xiàn)需求,排除選項A和B,且reduce個數(shù)可以進行人工設置,排除C。39.大數(shù)據(jù)計算服務中的fact_order表的生命周期屬性設置成了30天,開發(fā)人員通過以下命令創(chuàng)建了一張新的fact_lottery_order表:createtablefact_lottery_orderlikefact_order;對于新表的描述正確的是____A、fact_lottery_order的生命周期屬性是無窮大B、fact_lottery_order的生命周期屬性不會被設置C、fact_lottery_order的生命周期屬性是30D、fact_lottery_order的生命周期屬性是0【正確答案】:A解析:

like復制表fact_order結構,但是并不會復制生命周期,所以fact_lottery_order表的生命周期為默認,而默認周期是永久的。40.資源((Resource)是大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的特有概念。用戶如果想使用MaxCompute的MapReduce或自定義函數(shù)(UDF)功能,需要依賴資源來完成。DataIDE中,可以通過數(shù)據(jù)開發(fā)面板的資源管理上傳資源,目前支持的資源類型有()。A、jar、file、archiveB、jar、file、pythonC、jar、archive、pythonD、file、archive、python【正確答案】:A解析:

無41.以下哪個不屬于Maxcompute的訪問策略的訪問控制元素()A、效果B、操作C、權限D(zhuǎn)、主體【正確答案】:C解析:

每次權限管理操作均是對效果(授權、撤銷)、對象(如表、資源等)、主體(用戶或是角色)、操作(讀、寫、刪除等)的組合描述

/document_detail/104028.html?spm=a2c4g.27935.0.i042.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的開發(fā)人員在建模時需要使用內(nèi)置函數(shù)floor對某表的value字段進行取整,在數(shù)據(jù)表中有兩條記錄,value字段的值是1.2和-3.3,則結果數(shù)據(jù)是A、1和-3B、2和-3C、1和-4D、2和-4【正確答案】:C解析:

正確答案C。內(nèi)置函數(shù)考察floor是表示取下,1.2的下值為1,-3.3的下值為-443.下列對于ADS中表和表組的描述正確的是()A、維度表在創(chuàng)建時不需要指定表組,但是需要配置分區(qū)信息B、維度表可以和除維度表組外的任意表組中的表關聯(lián)C、批量插入的表如果只有一級分區(qū),每次導入數(shù)據(jù)是會覆蓋掉已有數(shù)據(jù)D、維度表組有且只有一個,用戶可以修改表組屬性,但是不能刪除【正確答案】:C解析:

維度表可以和任意表組的任意表進行關聯(lián),并且創(chuàng)建時不需要配置分區(qū)信息,但是對單表數(shù)據(jù)量大小有所限制,并且需要消耗更多的存儲資源。

維度表組有且僅有一個,并且在分析型數(shù)據(jù)庫數(shù)據(jù)庫建立時會自動創(chuàng)建,用戶不可修改和刪除44.您希望通過華北2(北京)地域的阿里云專有網(wǎng)絡VPC中的云服務器ECS實例通過內(nèi)網(wǎng)訪問OSS,但是連接(華北2(北京)地域的通用內(nèi)網(wǎng)地址)失敗,可以通過________解決。A、只能通過外網(wǎng)地址進行訪問B、其他方式都不能解決C、換其他地域的內(nèi)網(wǎng)地址進行訪問,如華北1(青島)地域的通用內(nèi)網(wǎng)地址()D、通過VPC專用的OSS內(nèi)網(wǎng)地址進行訪問,【正確答案】:D解析:

在VPC的環(huán)境中ECS連接這個地址不通。這個是因為OSS針對VPC是有一套自己的內(nèi)網(wǎng)地址,所以需要用北京:45.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的開發(fā)人員需要創(chuàng)建一個自定義函數(shù)用以評估客戶的經(jīng)營情況,輸入?yún)?shù)的兩個字段類型是double,則在開發(fā)JavaUDF函數(shù)時,這兩個字段對應的輸入?yún)?shù)類型應該是A、基礎類型doubleBigDecimal類型C、String類型Double類型【正確答案】:D解析:

正確答案D。ODPS和Java的數(shù)據(jù)類型基本相似,在ODPS中的類型都是封裝類型。ODPS中DOUBLE數(shù)據(jù)類型是對應java.lang.Double46.數(shù)據(jù)工場DataWorks(原DatalDE)中工作流任務支持一次性調(diào)度和周期調(diào)度兩種類型,對于周期性調(diào)度可以設置不同時間粒度的調(diào)度周期,最小的調(diào)度周期為()A、5分鐘B、1分鐘C、10分鐘D、30分鐘【正確答案】:A解析:

正確答案A目前分鐘僅支持最小5分鐘的粒度,時間表達式根據(jù)上面選擇的時間生成,不能手動修改。47.AlphaGO.自動駕駛等場景實現(xiàn)都使用了比較復雜的機器學習算法,這些算法的特點是:一個系統(tǒng)和外界環(huán)境不斷地交互,獲得外界反饋,然后決定自身的行為,達到長期目標的最優(yōu)化。對這類算法的歸類中,最恰當?shù)囊粋€是.A、增強學習(reinforcementlearning)B、無監(jiān)督學習(umsypervisedlearning)C、集成學習(ensemblelearning)D、經(jīng)典學習(cassiolearning)【正確答案】:A解析:

是一種自反饋,自激勵性學習,屬于強化學習48.以下acl授權里,哪種是對ODPS的表賦予select權限?A、grantselectontabletable_nametouserB、grantdesconprojectproject_nametouserC、grantreadonprojectproject_nametouserD、grantreadontabletable_nametouser【正確答案】:A解析:

無49.如果在非阿里云的服務器安裝了安騎士,如何在管理控制臺查看報告?A、在安裝安騎士的過程中需要輸入“安裝驗證key",通過此key關聯(lián)用戶的管理控制臺B、通過阿里云官網(wǎng)賬號關聯(lián)C、報告無法體驗在阿里云的管理控制臺D、非阿里云服務器不支持安騎士【正確答案】:A解析:

對于非阿里云服務器,在安裝過程中會提示輸入驗證Key,這個驗證Key用于關聯(lián)阿里云賬號,通過阿里云賬號在安騎士控制臺使用相關功能,驗證key會顯示在安裝頁面中。50.阿里云數(shù)據(jù)湖構建(DataLakeFormation,簡稱DLF)是一款全托管的快速幫助用戶構建云上數(shù)據(jù)湖及Lakehouse的服務,可無縫對接多種計算引擎,其元數(shù)據(jù)管理是核心功能之一,下列描述,哪些不屬于元數(shù)據(jù)管理的功能?A、元數(shù)據(jù)抽取B、元數(shù)據(jù)產(chǎn)生C、元數(shù)據(jù)備份D、元數(shù)據(jù)管理【正確答案】:C解析:

/document_detail/183492.html?spm=a2c4g.1962a943bbfVaNV5S元數(shù)據(jù)備份不屬于元數(shù)據(jù)管理的功能。51.某企業(yè)的數(shù)據(jù)倉庫運行在大數(shù)據(jù)計算服務上,開發(fā)人員在加工數(shù)據(jù)時發(fā)現(xiàn)用戶表user中的用戶標識字段user_id有部分臟數(shù)據(jù),正確的格式應該是8位的字符串??梢允褂肧QL語句_________將臟數(shù)據(jù)過濾出來。A、select*fromuserwherelength(userid)8B、select*fromuserwherelength(userid)>8C、select*fromuserwherelength(userid)D、select*fromuserwherelength(userid)8oruseridisnull【正確答案】:D解析:

表示不等于,只有d中可以把長度不等于8的,值為null的過濾出來A、只過濾了不等于8的,沒過濾掉null的B、只過濾了大于8的,邏輯不正確C、之過濾了小于8的,邏輯不正確52.ODPS中,哪個命令可查看角色role_test的權限()A、listrolerole_testB、showgrantsforrolerole_testC、descrolerole_testD、showaclforrolerole_test【正確答案】:C解析:

查看角色中的權限:describerole;A、listroles查詢role角色B、Showgrantsforuserusername;不適合roleD、語法不對53.Hologress是阿里巴巴自主研發(fā)的一站式實時數(shù)倉引擎(Real-TimeDataWarehouse),關于Hologress,錯誤的描述是()?A、支持海量數(shù)據(jù)實時寫入、實時更新、實時分析,支持標準SQL,兼容Postgre大部分函數(shù),兼容MySQL全部函數(shù)B、支持高并發(fā)低延遲的在線數(shù)據(jù)服務(Serving)C、支持PB級數(shù)據(jù)多維分析(OLAP)與即席分析(AdHoc)D、與MaxCompute、Flink、DataWorks深度融合,提供企業(yè)級離在線一體化全棧數(shù)倉解決方案?!菊_答案】:A解析:

Hologres是阿里巴巴自主研發(fā)的一站式實時數(shù)倉引擎(Real-TimeDataWarehouse),支持海量數(shù)據(jù)實時寫入、實時更新、實時加工、實時分析,支持標準SQL(兼容PostgreSQL協(xié)議和語法,支持大部分PostgreSQL函數(shù)),支持PB級數(shù)據(jù)多維分析(OLAP)與即席分析(AdHoc),支持高并發(fā)低延遲的在線數(shù)據(jù)服務(Serving),支持多種負載的細粒度隔離與企業(yè)級安全能力,與MaxCompute、Flink、DataWorks深度融合,提供企業(yè)級離在線一體化全棧數(shù)倉解決方案。/document_detail/113648.html?spm=a2c4g.183492.0.i654.在DataIDE中配置數(shù)據(jù)同步任務時,將云數(shù)據(jù)庫RDS(Mysql)中的數(shù)據(jù)同步至大數(shù)據(jù)計算服務(MaxCompute,原ODPS)分區(qū)表對應的日期分區(qū)中,采用數(shù)據(jù)同步任務周期性的調(diào)度向不同分區(qū)中寫入數(shù)據(jù),把yyyymmdd的數(shù)據(jù)寫入對應的yyyy-mm-dd分區(qū)中,如20160308的數(shù)據(jù)需要寫入MaxCompute表的"2016-03-08分區(qū)中,MaxCompute的分區(qū)可以通過()實現(xiàn)。A、在MaxCompute側中使用系統(tǒng)內(nèi)置參數(shù)$bizdateB、在MaxCompute側中使用變量${datetime},并在節(jié)點參數(shù)出賦值datetime=${YYYY/MM/DD}C、在MaxCompute側的分區(qū)中寫入常量值2016-03-18即可D、在MaxCompute側中使用變量${datatime},并在節(jié)點參數(shù)出賦值datetime=${YYYY-MM-DD}【正確答案】:D解析:

datetime=${YYYY-MM-DD}符合要求格式55.下面關于冷熱數(shù)據(jù)的說法,錯誤的是()A、在同一張表可以對不同的分片設置不同的預留讀寫吞吐量,對于冷數(shù)據(jù)所在的片,設置較低的預留讀寫吞吐量B、可以用不同的表來區(qū)分冷熱數(shù)據(jù),并設置不同的預留讀寫吞吐量C、表中存在大量冷數(shù)據(jù)會導致數(shù)據(jù)訪問壓力不均勻,從而導致表上配置的預留讀寫吞吐量無法被充分利用D、對冷數(shù)據(jù)對應的表,可以設置較小的預留讀寫吞吐量【正確答案】:A解析:

無56.某視頻直播公司采用阿里云彈性伸縮(AutoScaling)來實現(xiàn)動態(tài)添加或者減少云服務器ECS實例,以應對業(yè)務量的變化。由于該公司的系統(tǒng)剛上線不久,沒有歷史數(shù)據(jù)做參考,同時也不能預估業(yè)務量的變化,他們希望通過ECS實例資源的使用情況(比如CPU利用率、系統(tǒng)負載Load等)來彈性伸縮計算資源。他們應該選擇以下哪種伸縮模式?A、動態(tài)模式B、定時模式C、固定數(shù)量模式D、lazy模式【正確答案】:A解析:

用戶沒有歷史數(shù)據(jù)作為參考,故使用動態(tài)模式配置彈性伸縮服務更為靈活。57.DataIDE的數(shù)據(jù)同步任務Task1,將數(shù)據(jù)從大數(shù)據(jù)計算服務(MaxCompute,原ODPS)同步到云數(shù)據(jù)庫RDS(MySQL)中,數(shù)據(jù)表中存在數(shù)據(jù)質(zhì)量問題,加載的時候會有部分出錯記錄,Task1中已經(jīng)配置了容錯記錄條數(shù),為了保證正確記錄能夠保留,在數(shù)據(jù)加載與控制中,還需要對Task1配置A、數(shù)據(jù)過濾條件B、視為臟數(shù)據(jù),保留原有數(shù)據(jù)(insertinto)C、作業(yè)速率上限D(zhuǎn)、源表切分主鍵.【正確答案】:B解析:

A、數(shù)據(jù)過濾是完成數(shù)據(jù)篩選以及增量上傳;C、作業(yè)速率上限只同步速率,不涉及容錯;D、切分鍵是為了增加同步線程,增加同步速率。58.某企業(yè)需要一個能夠從身份證號中分析得出所屬省份的自定義函數(shù),哪種自定義函數(shù)適用于這種場景?A、UserDefinedSplittedFunction(用戶自定義分組函數(shù))B、UserDefinedScalarFunction(用戶自定義標量函數(shù))C、UserDefinedTableValuedFunction(用戶自定義表值函數(shù))D、UserDefinedAggregationFunction(用戶自定義聚組函數(shù))【正確答案】:B解析:

無59.同步任務有一二級調(diào)度的概念,真正抽取數(shù)據(jù)的機器是哪級調(diào)度的機器?如何查看某個同步任務的真正抽取數(shù)據(jù)的機器是哪臺?A、同步任務有一二級調(diào)度的概念,真正抽取數(shù)據(jù)的機器是哪級調(diào)度的機器?如何查看某個同步任務的真正抽取數(shù)據(jù)的機器是哪臺?B、一級;任務日志中搜索onnode關鍵字得到的第二條結果C、二級;任務日志中搜索onnode關鍵字得到的第二條結果D、一級;任務日志中搜索onnode關鍵字得到的第一條結果【正確答案】:C解析:

針對數(shù)據(jù)同步任務,DataWorks的調(diào)度資源分為一級調(diào)度資源和二級運行資源。一級調(diào)度資源:可以進入運維中心>周期任務運維>周期實例頁面,右鍵單擊相應節(jié)點,選擇查看更多詳情,即可查看該節(jié)點的屬性。二級運行資源:可以進入數(shù)據(jù)集成>同步資源管理>資源組頁面,新增和查看二級任務運行資源。同步任務的真正抽取數(shù)據(jù)的機器是哪臺是通過二級運行資源onnode關鍵字得到的第二條結果。60.數(shù)據(jù)質(zhì)量模塊中配置監(jiān)控規(guī)則時,需要先進行分區(qū)表達式配置,對于非分區(qū)表的分區(qū)規(guī)則應選擇()?A、NULLB、NOTC、NOTAPARTITIONTABLED、$yyyymmdd【正確答案】:C解析:

數(shù)據(jù)質(zhì)量通過分區(qū)表達式來確定需要配置的規(guī)則:如果您的檢查對象為非分區(qū)表,可以配置分區(qū)表達式為NOTAPARTITIONTABLE。如果您的檢查對象為分區(qū)表,可以配置為業(yè)務日期的表達式(例如$[yyyymmdd])。/document_detail/73690.html?spm=a2c4g.468043.0.i1461.用戶A是公司的系統(tǒng)管理員,經(jīng)常去上海出差,每當他在上海遠程登錄服務器時系統(tǒng)就會發(fā)出報警信息,提示“有人異地登錄,請注意服務器安全”,有什么方法可以快速、自動解決這個問題?A、登錄阿里云管理控制臺,在安騎士配置項里添加“常用登錄地點”B、向我的朋友電話求助,他是業(yè)界有名的黑客高手C、向公司領導請求幫助D、立即提交工單,咨詢阿里云工程師【正確答案】:A解析:

無62.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)中的訂單表fact_order是一張分區(qū)表,有order_id及order_amt兩個字段,分區(qū)鍵是dt,每天新增的訂單存儲在當天的分區(qū)中,對應的源表是ods_order,源表中可能包括多天的訂單,需要按照訂單生成的日期(order_dt)將數(shù)據(jù)保存到fact_order表中,執(zhí)行以下SQL語句:insertoverwritetablefact_orderspartition(dt)selectorder_id,order_amt,order_dtasdtfromods_order;在語句執(zhí)行之前fact_order表中有dt='20160301'及dt='20160302'兩個分區(qū),在這個語句執(zhí)行時ods_order表是空的,沒有任何記錄。對這個語句的執(zhí)行結果,以下說法正確的是A、執(zhí)行完以后fact_order表會被清空,所有的分區(qū)都會被刪除B、執(zhí)行完以后fact_order表中有三個分區(qū),包括dt='20160301',dt="20160302'及dt="C、執(zhí)行完以后fact_order中仍然有dt=*20160301"及dt='20160302'兩個分區(qū),但是數(shù)據(jù)會被清空D、執(zhí)行完以后fact_order中的數(shù)據(jù)未受影響,仍然是dt='20160301'及dt='20160302'兩個分區(qū)【正確答案】:D解析:

A、該語句是使用動態(tài)分區(qū)的方式插入數(shù)據(jù),即會根據(jù)查詢的最后一個字段確認分區(qū)值,因ods_order表是空的,而分區(qū)表操作相當于針對對應文件目錄操作,所以并不會影響其他分區(qū)數(shù)據(jù),其他分區(qū)無變化;

B、同A,同時dt="是語法不支持的,不支持空作為分區(qū)

C、同A,數(shù)據(jù)不受影響

D、正確63.大數(shù)據(jù)計算服務提供了大數(shù)據(jù)的存儲和計算服務,非常適合應用于大數(shù)據(jù)分析的領域。以下說法中錯誤的是哪一項?A、可以實現(xiàn)大型互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)倉庫和BI分析B、提供了便捷的分析處理海量數(shù)據(jù)的手段,用戶可以不必關心分布式計算細節(jié),從而達到分析大數(shù)據(jù)的目的C、可以支持實時OLAP分析D、可以基于歷史數(shù)據(jù),進行用戶特征和興趣挖掘【正確答案】:C解析:

大數(shù)據(jù)計算服務屬于批量、離線處理。OLAP對實時性要求較高,一般不適合使用。64.云盾DDoS基礎防護功能如何開啟?A、提交工單,24小時之內(nèi)開通B、自動開通C、聯(lián)系客戶經(jīng)理線下開通D、需要從管理控制臺申請開通【正確答案】:B解析:

無65.大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的開發(fā)人員需要創(chuàng)建一張用戶消費習慣表,其中一個字段想要命名為like,則以下說法正確的是A、可以將字段命名為like,無需特殊處理B、可以將字段名命名為like,在創(chuàng)建表及引用該字段時,需要用括起來,即表示為'like'C、在創(chuàng)建表時無需特殊處理,但是在引用該字段時需要表示為'like’(注:沒有測試成功)D、無法將字段命名為like,因為這是關鍵字【正確答案】:D解析:

無66.DataIDE的數(shù)據(jù)同步任務Task1,將數(shù)據(jù)從大數(shù)據(jù)計算服務(MaxCompute,原ODPS)同步到云數(shù)據(jù)庫RDS(MySQL)中,源數(shù)據(jù)表中存在數(shù)據(jù)質(zhì)量問題,加載的時候會有部分出錯記錄,Task1中已經(jīng)配置了容錯記錄條數(shù),為了保證正確記錄能夠保留,在數(shù)據(jù)加載與控制中,還需要對Task1配置()A、數(shù)據(jù)過濾條件B、視為臟數(shù)據(jù),保留原有數(shù)據(jù)(insertinto)C、作業(yè)速率上限D(zhuǎn)、源表切分主鍵【正確答案】:B解析:

無67.對于OTS表的主鍵描述正確的是哪一個()A、由四個屬性組成B、建表的時候可以暫時不指定,之后用altertable修改C、組成主鍵的屬性只能是string或者integerD、主鍵本身就是表的分片鍵【正確答案】:D解析:

表格存儲(TableStore)是構建在阿里云飛天分布式系統(tǒng)之上的NoSQL數(shù)據(jù)存儲服務。TableStore支持1~4個主鍵,主鍵類型為STRING、INTEGER和BINARY,其中第一個主鍵為分區(qū)鍵。主鍵屬性一般有2個,分別是名稱和類型;建表必須指定名稱;主鍵類型有三種:STRING、INTEGER和BINARY;數(shù)據(jù)分區(qū)的劃分粒度為主鍵的第一列,該列即為數(shù)據(jù)分區(qū)鍵?!爸麈I本身就是分區(qū)鍵”沒問題68.在實際應用中,哪種性能指標表示RDS實例磁盤空間的使用量?A、磁盤空間B、CPU利用率C、IOPSD、連接數(shù)【正確答案】:A解析:

無69.阿里云機器學習的標準化組件可以對數(shù)值型的字段進行標準化處理,以字段x為例,其標準化的計算為______。A、x字段整列的最大值減掉該列的最小值得到一個差,然后每一行的x值除以這個差:x/[max(x)-min(x)]B、每一行的x值除以該列最大的x值:x/max(x)C、每一行的x值減掉x字段整列的平均值,然后除以x字段整列的平均值:[xmean(x)]/mean(x)D、每一行的x值減掉x字段整列的平均值,然后除以x字段整列的標準差:[xmean(x)]/std(x)【正確答案】:D解析:

標準化所使用的公式:(X-Mean)/(standarddeviation)。70.在ODPS表T中添加一個新的列col,類型為bigint,最簡單易行的辦法是?A、將表T刪掉重建B、altertabletaddcolumns(cbigint)C、新建一張表,將原有數(shù)據(jù)插入Daltertableaddcbigint【正確答案】:B解析:

增加字段最簡單的方式是適用alter修改,D選項語法不對71.RDS采用的主備M-M的高可用架構,其主備之間的數(shù)據(jù)同步依靠日志的方式實現(xiàn),MySQL數(shù)據(jù)庫和SQLServer分別使用的日志是什么?A、均為事務日志B、MySQL數(shù)據(jù)庫為事務日志,SQLServer為BINLOG日志C、MySQL數(shù)據(jù)庫為BINLOG日志,SQLServer為事務日志D、均為BINLOG日志【正確答案】:C解析:

此題為常識題,Mysql數(shù)據(jù)庫為BINLOG日志,SQLServer為事務日志。72.某圖書管理系統(tǒng)使用ODPS進行離線數(shù)據(jù)分析,現(xiàn)在他們要將同一類目的書籍的名稱拼成一個字符串,即將屬于同一分組的字符串合并在一列展示,以下哪個內(nèi)置函數(shù)可以實現(xiàn)這一功能?A、wm_concatB、split_partC、concatD、regexp_instr【正確答案】:A解析:

wm_concat聚合函數(shù),用途:用指定的separator做分隔符,鏈接str中的值。其輸入與輸出是多對一的關系,即將多條輸入記錄聚合成一條輸出值??梢耘cSQL中的groupby語句聯(lián)用。split_part:split_part()切割函數(shù)對按分隔符去取某個特定位置上的值concat用途:返回值是將參數(shù)中的所有字符串連接在一起的結果。regexp_instr:返回字符串source從start_position開始,和pattern第n次(nth_occurrence)匹配的子串的起始/結束位置。任一輸入?yún)?shù)為NULL時返回NULL。73.DRDS的服務可用性不低于百分之多少?A、95B、99.95C、99.99D、99【正確答案】:B解析:

無74.OTS中某秒內(nèi)發(fā)生了10次讀操作,其中5次每次操作讀出當行數(shù)據(jù)大小為2.78KB,另外5次操作讀出當行數(shù)據(jù)大小為5.36KB,則共消耗多少()A、11CUB、20CUC、10CUD、15CU【正確答案】:D解析:

一、計算過程:

5次讀操作:2.78k<4k,即使用5CU

5次寫操作:5.36k>4K,即1<5.36/4<2,向上取整2*5=10CU

總共消耗:5+10=15CU

二、讀/寫吞吐量的單位為讀服務能力單元和寫服務能力單元,簡稱CU(CapacityUnit),是數(shù)據(jù)讀寫操作的最小計費單位。

CU消耗說明

1、PutRow操作消耗的讀CU和寫CU說明如下:

消耗的寫CU為修改的行主鍵數(shù)據(jù)大小與屬性列數(shù)據(jù)大小之和除以4KB向上取整。

如果指定條件檢查不為IGNORE,則消耗行主鍵數(shù)據(jù)大小除以4KB向上取整的讀CU。

如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU和1單位讀CU。

2、UpdateRow操作消耗的讀CU和寫CU說明如下:

消耗的寫CU為修改的行主鍵數(shù)據(jù)大小與屬性列數(shù)據(jù)大小之和除以4KB向上取整。操作中包含的需要刪除的屬性列,只有屬性列的列名計入屬性列數(shù)據(jù)大小。

如果指定條件檢查不為IGNORE,則消耗行主鍵數(shù)據(jù)大小除以4KB向上取整的讀CU。

如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU和1單位讀CU。

3、DeleteRow操作消耗的讀CU和寫CU說明如下:

消耗的寫CU為刪除的行主鍵數(shù)據(jù)大小除以4KB向上取整。

如果指定條件檢查不為IGNORE,則消耗行主鍵數(shù)據(jù)大小除以4KB向上取整的讀CU。

如果操作不滿足指定的行存在性檢查條件,則操作失敗并消耗1單位寫CU。

/document_detail/27284.html

/document_detail/54519.html75.大數(shù)據(jù)計算服務MaxCompute中,用戶登錄表user_login的建表語句如下createtableuser_login(user_idstring,logindatedatetime,loginipstring);表中包含了近3個月的用戶登錄信息,為了統(tǒng)計每天的用戶登錄次數(shù),可以用()實現(xiàn)。A、Selectdatetrunc(login_date,’dd’),count(*)fromuser_logingroupbydatetrunc(login_date,’dd’)B、selectdatetrunc(login_date,hh"),count(*)fromuser_logingroupbydatetrunclogin_date,’hh’);C、Selectdatetrunc(login_date,’mm’),count(*)fromuser_logingroupbydatetrunc(login_date,’mm’);D、Selectdatetrunc(login_date,’yyyy’),count(*)fromuser_logingroupbydatetrunc(login_date,’yyyy’)【正確答案】:A解析:

內(nèi)置函數(shù)考察76.MaxCompute體系架構中,負責計算的是(),由邏輯層的Executor負責向該master提交SQL/MR任務。A、SchedulerB、SparkC、FlinkD、Fuxi【正確答案】:A解析:

Scheduler負責instance的調(diào)度:包括將instance分解為task、對等待提交的task進行排序、以及向計算集群的Fuximaster詢問資源占用情況以進行流控(Fuxislot滿的時候,停止響應Executor的task申請)。/apsara/enterprise/v_3_13_0_20201215/odps/enterprise-product-introduction/product-architecture.html77.大數(shù)據(jù)計算服務中,通常情況下,prj1項目空間的成員若要訪問prj2項目空間的數(shù)據(jù),則需要prj2項目空間管理員執(zhí)行繁瑣的授權操作:首先需要將prj1項目空間中的用戶添加到prj2項目空間中,再分別對這些新加入的用戶進行普通授權。實際上prj2項目空間管理員并不期望對prj1項目空間中的每個用戶都進行授權管理,而期望有另一種更高效的機制能使得prj1項目空間管理員能對許可的對象進行自主授權控制。以下哪種授權方式可以幫助prj2項目空間管理員實現(xiàn)他的預期目標?A、LabelSecurityB、RoleC、PackageD、ProjectProtection【正確答案】:C解析:

通過打包的方式把授權給另外一個項目,然后有另外一個項目的管理員再分配權限,這樣更高效,更利于團隊的合作。A、LabelSecurity支持列級別的權限授權;B、Role是角色,使用戶的集合;D、項目空間數(shù)據(jù)安全,開啟后禁止數(shù)據(jù)流出。78.從優(yōu)化角度來看,大數(shù)據(jù)計算服務的MapReduce對于哪個節(jié)點處理哪個分片這個問題,采用了_______策略。A、本地性原理,即數(shù)據(jù)在哪臺機器上,就在哪臺機器上啟動mapB、能者多勞原理,將數(shù)據(jù)移動到計算能力最強的節(jié)點上,啟動map.C、基于歷史處理信息的優(yōu)化原理,即將數(shù)據(jù)移到從歷史執(zhí)行信息看處理效果最好的機器上D、負載均衡原理,即將數(shù)據(jù)放在當前負載最小的節(jié)點上啟動map【正確答案】:A解析:

map拉取數(shù)據(jù)遵從數(shù)據(jù)本地化原則79.數(shù)據(jù)工場DataWorks(原DataIDE)中,大數(shù)據(jù)計算服務(MaxCompute,原ODPS)的表可以通過數(shù)據(jù)管理模塊的可視化建表功能創(chuàng)建,也可以通過開發(fā)面板或者調(diào)度執(zhí)行建表語句創(chuàng)建。兩種建表方式中,數(shù)據(jù)管理模塊的可視化建表特有的功能點是________。A、可以設置表生命周期B、可以設置表類目C、可以設置表字段描述D、可以設置表描述【正確答案】:B解析:

除了設置表類目,其他都可以通過執(zhí)行語句創(chuàng)建80.OTS中以什么方式來存儲數(shù)據(jù)?A、二維表B、鍵值對C、對象D、聚簇列【正確答案】:B解析:

表格存儲支持將主鍵列設置為自增列,每張表只能設置一個主鍵列為自增列,且分區(qū)鍵不能設置為自增列。主鍵列設置為自增列后,在寫入一行數(shù)據(jù)時,該主鍵列無需填值,表格存儲會自動生成該主鍵列的值。自動生成的主鍵列的值在分區(qū)鍵內(nèi)嚴格遞增且唯一。綜上所述,OTS是類似于HBase存儲方式以鍵值對的方式存儲數(shù)據(jù)。81.ABC電商公司非常關心用戶從瀏覽到下單到支付的轉(zhuǎn)化率,他們想分析不同性別的人在該流程中的轉(zhuǎn)化率的差異,可以通過很好的實現(xiàn)該需求。A、漏斗圖B、餅圖C、對比漏斗D、樹圖【正確答案】:C解析:

正確答案C。A、漏斗圖適用于分析具有規(guī)范性、周期長、和環(huán)節(jié)多的業(yè)務流程。通過漏斗各環(huán)節(jié)業(yè)務數(shù)據(jù)的比較,能夠直觀地發(fā)現(xiàn)和說明問題所在。漏斗圖還可以用來展示各步驟的轉(zhuǎn)化率,適用于業(yè)務流程多的流程分析,例如通過漏斗圖可以清楚地展示用戶從進入網(wǎng)站到實現(xiàn)購買的最終轉(zhuǎn)化率。漏斗圖是由漏斗層標簽和漏斗層寬決定的,漏斗層標簽由數(shù)據(jù)的維度決定,如區(qū)域;漏斗層寬度由數(shù)據(jù)的度量決定,如訂單金額。B、餅圖顯?的是?個數(shù)據(jù)系列,每個數(shù)據(jù)系列具有?個顏?或圖案(當餅圖的扇區(qū)數(shù)量超過12個時,會出現(xiàn)顏?重復)。餅圖可?來展?數(shù)據(jù)中各項的?小與各項總和的?例,例如展?五險??在個人收入中的比例等。C、旋風漏斗圖可被看做是旋風圖和漏斗圖的結合體,本題更適合使用旋風漏斗圖;D、樹圖是通過樹形結構來展現(xiàn)層級數(shù)據(jù)的組織關系,以??層次結構來組織對象,是枚舉法的?種表達?式,例如查看某個省份下各地級市的收?狀況,那么省份與地級市之間的關系就可以看做是??層次結構。樹圖適?于與組織結構有關的分析,如公司的?員組織結構,或者醫(yī)院的科室組織結構。82.哪個字符集是目前RDSforMySQL不支持的()A、gbkB、big5C、latin1D、utf8【正確答案】:B解析:

支持utf8、gbk、latin1或utf8mb483.下列關于ADS用戶的說法,哪些是正確的?A、對用戶的授權支持ACL和policy兩種B、在授權給一個用戶之前,需要使用adduseron.*將用戶添加到ADS庫dbname中來C、數(shù)據(jù)庫擁有者可以刪除用戶,意味著被刪除用戶無法再使用ADS的任何服務D、用戶是被授權的數(shù)據(jù)庫用戶,由數(shù)據(jù)庫擁有者授權時添加,無須開通ADS服務【正確答案】:D解析:

支持ACL,不支持policy授權進行授權SQL語法GRANTprivilege_type[(column_list)][,privilege_type[(column_list)]...ON[object_type]privilege_levelTOuser[,user]...不可以刪除用戶,可以回收用戶84.某業(yè)務部門計劃使用ApacheFlink來實現(xiàn)QPS比較少且非核心業(yè)務的流式計算能力,下面哪種部署方式可以保證業(yè)務的高可用性?A、部署1個JobManager節(jié)點和1個TaskManger節(jié)點B、部署1個JobManager節(jié)點和若干TaskManger節(jié)點C、部署若干JobManager節(jié)點和1個TaskManger節(jié)點D、部署若干JobManager節(jié)點和若干TaskManger節(jié)點【正確答案】:D解析:

部署若干JobManager節(jié)點和若干TaskManager節(jié)點可以保證業(yè)務的高可用性。因為在這種部署方式下,如果某個節(jié)點出現(xiàn)故障,其他節(jié)點可以接管其任務,保證業(yè)務的持續(xù)運行。而其他部署方式可能會因為單點故障而導致業(yè)務中斷。85.查詢數(shù)據(jù)需要select權限。目前ADS中對select權限的管理的最小級別是?A、表組B、表C、列D、數(shù)據(jù)庫【正確答案】:C解析:

查詢數(shù)據(jù)的權限:查詢表數(shù)據(jù)需要SELECT權限,最小級別是列并非所有查詢都需要該權限,例如SELECTnow()導出數(shù)據(jù)的權限:導出數(shù)據(jù)同時需要DUMPDATA和SELECT權限同時需要數(shù)據(jù)導出目的地的數(shù)據(jù)寫入相關權限86.OTS是構建在阿里飛天系統(tǒng)之上的產(chǎn)品,它提供的是什么服務?A、在線高并發(fā)事務服務B、海量數(shù)據(jù)的非結構化讀寫服務C、在線NoSQL數(shù)據(jù)庫服務D、在線關系型數(shù)據(jù)庫服務【正確答案】:C解析:

無87.ODPS中提供了別名命令ALIAS,可以為哪些對象設置別名()A、資源B、列C、行D、表【正確答案】:A解析:

用途:為資源創(chuàng)建別名。88.使用ODPSSQL:createtablet1liket2:建表時,表t1不會具有表t2的哪種屬性()A、分區(qū)B、生命周期C、二級分區(qū)D、字段的注釋【正確答案】:B解析:

lifecycle指明此表的生命周期,createtablelike語句不會復制源表的生命周期屬性。除生命周期屬性外,列名、列注釋以及表注釋等均相同。備注:Createas同樣不會具有表t2的生命周期。但會獲取t2表的數(shù)據(jù)。89.ADS的普通表最多包含多少個列?A、2048個B、1024個C、4096個D、512個【正確答案】:B解析:

(1)一張事實表至少有一級Hash分區(qū)并且分區(qū)數(shù)不能小于8個;(2)一個事實表組最多可以創(chuàng)建256個事實表;(3)一個事實表最多不能超過1024個列。90.數(shù)據(jù)工場DataWorks(原DatalDE)中,SQL任務task1是按小時調(diào)度的周期性調(diào)度任務,任務配置為每1小時執(zhí)行次,結果會插入到表table1中去,table1為一個有兩個分區(qū)鍵(ds和hh)的分區(qū)表,其中ds取前一個小時的年月日(格式為yyyymmdd),hh取前一-小時的小時(格式為hh24),要使用調(diào)度系統(tǒng)提供的時間參數(shù)定義分區(qū),使得task1每次調(diào)度運行時自動替換時間值,task1應該如何配置?A、task1代碼里table1的分區(qū)ds=${cdate},hh=$(h),.任務參數(shù)配置:hh=$[hh24]B、task1代碼里table1的分區(qū)ds=${date},h=${h).任務參數(shù)配置:hh=$[hh24-1/24]C、task1代碼里table1的分區(qū)ds=${daytime},hh={h).任務參數(shù)配置:daytime=[yyyymmd-1/24]hh=$hh24-1/24]D、task1代碼里table1的分區(qū)ds=${daytime},hh=${h),任務參數(shù)配置:daytime=[yyyymmdd]hh=$[hh24-1/24]【正確答案】:D解析:

正確答案D。

符合yyyymmdd和hh24格式的,而且小時數(shù)需要減1的,只有一個選項“task1代碼里table1的分區(qū)ds=${daytime},hh=${h),任務參數(shù)配置:daytime=[yyyymmdd]hh=$[hh24-1/24]”A、ds=${date}指業(yè)務日期,每小時執(zhí)行的任務應取當前日期即cyctime或自定義參數(shù);

hh=$[hh24],無法滿足跨天執(zhí)行,hour的計算公式仍然是$[hh24-1/24]。B、同A,ds=${date}指業(yè)務日期,及前一天C、任務參數(shù)配置:daytime=[yyyymmd-1/24],無中生有不合理D、ds=${daytime},自定義參數(shù),通過自定義類型daytime=[yyyymmdd],[]代表取當前日期,yyyymmdd是日期格式化,如果想取前一天可采用${yyyymmdd},{}代表取前一天,yyyymmdd是日期格式化

91.使用數(shù)據(jù)工場DataWorks(原DataIDE)進行數(shù)據(jù)開發(fā)時,往往需要經(jīng)過數(shù)據(jù)抽取、加工和裝載的過程,即ETL過程,其中數(shù)據(jù)的抽取和裝載可以使用數(shù)據(jù)同步節(jié)點實現(xiàn)。關于數(shù)據(jù)同步說法錯誤的是()。A、支持毫秒級數(shù)據(jù)同步B、支持全量導入C、支持增量導入D、支持多表數(shù)據(jù)同步【正確答案】:A解析:

同步屬于離線同步,相應毫秒級一般無法達到,最細粒度5分鐘。92.DRDS和普通的關系型數(shù)據(jù)庫(如Mysql)相比,SQL優(yōu)化要特別考慮的是()A、磁盤IO開銷B、內(nèi)存開銷C、并發(fā)度D、網(wǎng)絡IO開銷【正確答案】:D解析:

DRDS是一個高效穩(wěn)定的分布式關系數(shù)據(jù)庫系統(tǒng)。但是,由于其處理的是分布式的關系查詢,因而它對于SQL的查詢優(yōu)化與傳統(tǒng)的單一數(shù)據(jù)庫(如Mysql,oracle)的查詢優(yōu)化有所不同。后者在查詢優(yōu)化時,主要考慮的就是磁盤IO的開銷,但前者在優(yōu)化時還需要考慮另外一個更為重要的IO開銷-網(wǎng)絡。93.針對ODPSSQL做邏輯分析的時候,會進行一些優(yōu)化,不包括以下哪種優(yōu)化()A、掃描方式B、列映射C、謂語動詞下沉D、常量表達式【正確答案】:A解析:

odps自帶的優(yōu)化引擎會對sql作業(yè)做一定的優(yōu)化處理,如列裁剪、分區(qū)裁剪和謂詞下推、常量表達式94.在大數(shù)據(jù)開發(fā)治理平臺Dataworks數(shù)據(jù)同步任務(云數(shù)據(jù)庫RDS數(shù)據(jù)同步至MaxCompute)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論