大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)_第1頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)_第2頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)_第3頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)_第4頁
大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)開發(fā)基礎(chǔ)大數(shù)據(jù)開發(fā)基礎(chǔ)(習(xí)題卷21)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)開發(fā)基礎(chǔ)第1部分:單項選擇題,共57題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.(__)為數(shù)據(jù)科學(xué)和大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)提供數(shù)據(jù)內(nèi)容的捕獲和獲取服務(wù)。A)數(shù)據(jù)源和APPsB)數(shù)據(jù)資源C)數(shù)據(jù)端D)基礎(chǔ)設(shè)施答案:A解析:[單選題]2.關(guān)于Flink的角色,下列哪-項說法是錯誤的?A)TaskManager負責(zé)從用戶提交的Flink程序配置中獲取JobManager的地址。B)Cient是Flink程序提交的客戶端,對用戶提交的Flink程序進行預(yù)處理,并提交到Flink集群中處理。C)JobManager扮演著集群中的管理者Master的角色,它是整個集群的協(xié)調(diào)者。D)TaskManager是實際負責(zé)執(zhí)行計算的Worker.答案:A解析:[單選題]3.云計算包括3種類型。只為特定用戶提供服務(wù),比如大型企業(yè)出于安全考慮自建的云環(huán)境,只為企業(yè)內(nèi)部提供服務(wù),這種云計算屬于:()A)有云B)私有云C)混合云D)獨立云答案:B解析:[單選題]4.關(guān)于數(shù)據(jù)倉庫Impala的描述錯誤的是:()A)Impala作為開源大數(shù)據(jù)分析引擎,支持實時計算,它提供了與Hive類似的功能,并在性能上比Hive高出3~30倍B)Impala是由Cloudera公司開發(fā)的查詢系統(tǒng)C)Impala提供了SQL語義,能查詢存儲在Hadoop的HDFS和HBase上的PB級別海量數(shù)據(jù)D)Impala最初是參照MySQL系統(tǒng)進行設(shè)計的答案:D解析:[單選題]5.以下()選項用于創(chuàng)建數(shù)據(jù)表時設(shè)置存儲引擎和字符集。--A)ENGINE和COLLATEB)ENGINE和CHARSETC)CHARSET和COLLATED)以上答案都不正確答案:B解析:[單選題]6.下面不屬于數(shù)據(jù)科學(xué)中特有的管理方法有(__)。A)關(guān)系數(shù)據(jù)庫B)NewSQLC)NoSQLD)關(guān)系云答案:A解析:[單選題]7.下面有關(guān)NameNode安全模式(safemode)說法錯誤的是()A)namespace處于安全模式時只能被讀取B)NameNode啟動時自動進入安全模式C)調(diào)用setSafeMode()函數(shù)能夠打開或關(guān)閉安全模式D)安全模式下不能夠復(fù)制或刪除文件中的數(shù)據(jù)塊答案:B解析:在啟動一個剛剛格式化的HDFS集群時,因為系統(tǒng)中還沒有任何塊,所以NameNode不會進入安全模式。[單選題]8.傳統(tǒng)處理數(shù)據(jù)的數(shù)據(jù)規(guī)模的單位是:()。A)TBB)EBC)PBD)GB答案:D解析:[單選題]9.()是Hadoop系統(tǒng)核心組件之一,主要解決海量數(shù)據(jù)的計算。A)HDFSB)MapReduceC)SparkD)HBase答案:B解析:[單選題]10.(__)是M-P神經(jīng)元,也稱為?閾值邏輯單元?。A)輸入層B)輸出層C)第一層D)第二層答案:B解析:[單選題]11.下列選擇Logistic回歸中的One-Vs-All方法中,()是真實的。A)我們需要在n類分類問題中適合n個模型B)我們需要適合n-1個模型來分類為n個類C)我們需要只適合1個模型來分類為n個類D)以上答案都不正確答案:A解析:如果存在n個類,那么n個單獨的邏輯回歸必須與之相適應(yīng),其中每個類的概率由剩余類的概率之和確定。[單選題]12.下列哪一點不是云計算的特點()A)通過網(wǎng)絡(luò)為用戶提供服務(wù)B)需要用到虛擬化技術(shù)C)非常昂貴D)可動態(tài)擴展和壓縮答案:C解析:[單選題]13.Spark默認的存儲級別()A)MEMORY_ONLYB)MEMORY_ONLY_SERC)MEMORY_AND_DISKD)MEMORY_AND_DISK_SER答案:A解析:[單選題]14.大數(shù)據(jù)的4V特性不包括A)Volume(大量)B)Velocity(高速)C)Visual(可視)D)Variety(多樣)答案:C解析:[單選題]15.以下哪些算法是基于規(guī)則的分類器()。A)C4.5B)KNNC)BayesD)ANN答案:A解析:[單選題]16.假設(shè)A班級的平均分是80,標準差是10,A考了90分;B班的平均分是400,標準差是100,B考了600分。采用Z-Score規(guī)范化以后,二者誰的成績更加優(yōu)秀:()A)A的成績更為優(yōu)秀B)B的成績更為優(yōu)秀C)二者一樣優(yōu)秀D)無法比較答案:B解析:[單選題]17.下面關(guān)于數(shù)據(jù)產(chǎn)品開發(fā)相關(guān)描述正確的有(__)。A)數(shù)據(jù)科學(xué)家的主要職責(zé)是?數(shù)據(jù)的管理?B)數(shù)據(jù)科學(xué)家一定是科學(xué)家C)?數(shù)據(jù)碼農(nóng)?可以勝任數(shù)據(jù)科學(xué)家D)數(shù)據(jù)科學(xué)家是為解決現(xiàn)實世界中問題提供直接指導(dǎo)、依據(jù)或參考的高級專家答案:D解析:[單選題]18.儀表板中的多個圖表,可以設(shè)置統(tǒng)一的篩選器,在BI工具中可以通過()功能實現(xiàn)A)全局設(shè)置B)聯(lián)動設(shè)置C)篩選器D)布局設(shè)置答案:A解析:[單選題]19.在抽樣估計中,隨著樣本容量的增大,樣本統(tǒng)計量接近總體參數(shù)的概率就越大,這一性質(zhì)稱為()A)無偏性B)有效性C)及時性D)一致性答案:D解析:[單選題]20.關(guān)于表連接算子的說法錯誤的是(?A)聚合操作如groupby會觸發(fā)NergeJoinB)表連接算子主要有NestloopMergeJoin.Minorjoin.HashJoinC)算子的選擇是SQL根據(jù)邏輯≡行選擇的,與人為無關(guān)。D)默認情況下,執(zhí)行效率來說Hashjoin最高。答案:D解析:[單選題]21.從日常工作月度考核獎中提?。ǎ?用于獎勵部門負責(zé)人A)20B)25C)30D)35答案:A解析:[單選題]22.典型的NoSQL數(shù)據(jù)庫是()A)HiveB)MySQLC)HbaseD)Oracle答案:C解析:[單選題]23.Oracle數(shù)據(jù)庫中,數(shù)據(jù)字典表和視圖存儲在()A)USERS表B)SYSTEM表空間C)TEMPORARY表空間D)ORACLE表空間答案:B解析:[單選題]24.下列關(guān)于欠擬合(under-fitting)的說法正確的是()。A)訓(xùn)練誤差較大,測試誤差較小B)訓(xùn)練誤差較小,測試誤差較大C)訓(xùn)練誤差較大,測試誤差較大D)訓(xùn)練誤差較小,測試誤差較小答案:C解析:欠擬合是指對訓(xùn)練樣本的一般性質(zhì)尚未學(xué)好,因此訓(xùn)練誤差和測試誤差均較大。[單選題]25.執(zhí)行以下代碼段pets=['dog','cat','dog','goldfish','cat','rabbit','cat']while'cat'inpets:pets.remove('cat')print(pets)時,輸出為()。A)['dog','cat','dog','goldfish','cat','rabbit','cat']B)['dog','dog','goldfish','rabbit']C)['dog','dog','goldfish','cat','rabbit','cat']D)['dog','dog','goldfish','rabbit','cat']答案:B解析:[單選題]26.以下描述中不正確的是(___)。A)歸納是指從特殊到一般的泛化過程B)歸納是指從具體的事實歸結(jié)出一般性規(guī)律C)演繹是指從特殊到一般的特化過程D)演繹是指從基礎(chǔ)原理推演出具體情況答案:C解析:[單選題]27.通過FusionlnsightManager不能完成以下哪個橾作A)安裝部署B(yǎng))性能監(jiān)控C)權(quán)限管理D)虛擬機分配答案:D解析:[單選題]28.某BI系統(tǒng)構(gòu)建在大數(shù)據(jù)計算服務(wù)上,某數(shù)據(jù)分析員在分析訂單的地域分布時,需要把訂單表order(占用存儲空間約10G)與地獄維表region(占用存儲空間100M)關(guān)聯(lián)起來,兩張表的結(jié)構(gòu)如下:createtableorder(order_idstring,region_idstring,orderamtbigint);createtableregion(region_idstring,region_namestring)在運行時發(fā)現(xiàn)由于訂單大量集中在上海地區(qū),數(shù)據(jù)的傾斜導(dǎo)致整體運行時間較長,運行的SQL語句如下:selectregion_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;此時可以考慮通過()優(yōu)化SQL的運行效率。A)使用mapjoinhint:select+mapjoin(t2)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;B)使用mapjoinhint:select+mapjoin(t1)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;C)調(diào)整兩張表的位置:selectregion_name,sum(order_amt)amtfromregiont1joint2ont1.region_id=t2.region_id;D)減小SQL的splitsize,增加計算資源答案:A解析:[單選題]29.下面()表示日期和時間的數(shù)據(jù)類型。--A)DECIMAL(6,2)B)DATEC)YEARD)TIMESTAMP答案:D解析:[單選題]30.在Graphbash上,創(chuàng)建一個新的圖,必須使用的參數(shù)是?A)graphNameB)lableC)edgeD)vertex答案:A解析:[單選題]31.在抽樣估計中,隨著樣本容量的增大,樣本統(tǒng)計量接近總體參數(shù)的概率就越大,這一性質(zhì)稱為()。A)無偏性B)有效性C)及時性D)一致性答案:D解析:一致性是指隨著樣本容量的增大,樣本統(tǒng)計量接近總體參數(shù)的概率就越大。對于給定的偏差控制水平,兩者間偏差高于此控制水平的可能性越小。[單選題]32.讓學(xué)習(xí)器不依賴外界交互、自動地利用未標記樣本來提升學(xué)習(xí)性能,就是(__)。A)有監(jiān)督學(xué)習(xí)B)全監(jiān)督學(xué)習(xí)C)無監(jiān)督學(xué)習(xí)D)半監(jiān)督學(xué)習(xí)答案:D解析:[單選題]33.一切以數(shù)據(jù)作為驅(qū)動或者核心的產(chǎn)品叫做()A)創(chuàng)新性產(chǎn)品B)數(shù)據(jù)產(chǎn)品C)風(fēng)控產(chǎn)品D)核心產(chǎn)品答案:B解析:[單選題]34.HBase元數(shù)據(jù)MetaRegion路由信息保存在哪里?A)ZookeeperB)Meta表C)HMasterD)Root表答案:B解析:[單選題]35.通過DMS管理后臺或者數(shù)據(jù)庫客戶端,連接RDS數(shù)據(jù)庫時,提示錯誤信息?max_user_connections?,代表()含義。A)IOPS超出極限B)RDS空間滿了C)網(wǎng)絡(luò)中斷D)RDS數(shù)據(jù)庫的連接數(shù)滿了答案:D解析:[單選題]36.代碼片段:x=10if(xA)28B)12C)16D)14答案:B解析:[單選題]37.下?哪個不是RDD的特點()A)可分區(qū)B)可序列化C)可修改D)可持久化答案:C解析:[單選題]38.下面描述錯誤的是:()A)?探針盒子?就是一款自動收集用戶隱私的產(chǎn)品B)許多顧客在使用WiFi之后會收到大量的廣告信息,甚至自己的手機號碼也會被當(dāng)做信息進行多次買賣C)在免費上網(wǎng)的背后,其實也存在著不小的信息安全風(fēng)險,或許一不小心,就落入了電腦黑客們設(shè)計的WiFi陷阱之中D)免費WIFI都是安全的,可以放心使用答案:D解析:[單選題]39.以下關(guān)于數(shù)據(jù)服務(wù)API開放方使用流程,描述正確的是:()。A)創(chuàng)建api并發(fā)布apiB)獲取APIC)調(diào)用APID)創(chuàng)建應(yīng)用并獲取授權(quán)答案:A解析:[單選題]40.HBase交互模式中,創(chuàng)建命名空間的語法是()A)createnamespace'自定義命名空間名稱'B)create_namespace'自定義命名空間名稱'C)alternamespace'自定義命名空間名稱'D)alter_namespace'自定義命名空間名稱'答案:B解析:[單選題]41.CREATETABLE與()一起使用可為新表復(fù)制已有的表結(jié)構(gòu)。--A)ASB)ISC)LIKED)以上的答案都不正確答案:C解析:[單選題]42.HBase針對邏輯模型的理解錯誤的選項是()A)一開始以時間戳版本為鍵,以數(shù)據(jù)(Data)為值(Value)建立單元(Cell)映射(Map)B)往下一層以列標識為鍵,以單元映射為值建立列簇映射C)再往上一層以列簇為鍵,以列簇映射為值建立行鍵映射D)最后以行鍵為鍵,以行鍵映射為值建立表映射答案:B解析:[單選題]43.給定訓(xùn)練樣例集,設(shè)法將樣例投影到一條直線上,使得同類樣例的投影點盡可能接近、異類樣例的投影點盡可能遠離,這說的是()算法。A)PCAB)SVMC)K-meansD)LDA答案:D解析:[單選題]44.對于ADS的hash分區(qū),()說法是正確的。A)ADS表的第一級分區(qū)必須為hash分區(qū),第二級沒有強制要求,目前可以為list或者hashB)hash分區(qū)時一種動態(tài)分區(qū)類型,需要指定具體的分區(qū)列,最多為2列C)ADS表的一級hash分區(qū)數(shù)最大為1000D)若一張表為batch更新類型,且僅有一級hash分區(qū),則每次導(dǎo)入數(shù)據(jù)時,會對已有數(shù)據(jù)進行全量覆蓋答案:D解析:[單選題]45.構(gòu)成狀態(tài)空間的4個要素是:()。A)開始狀態(tài)、目標狀態(tài)、規(guī)則與操作B)初始狀態(tài)、中間狀態(tài)、目標狀態(tài)與操作C)空間、狀態(tài)、規(guī)則與操作D)開始狀態(tài)、中間狀態(tài)、結(jié)束狀態(tài)與其他狀態(tài)答案:B解析:[單選題]46.與k均值算法類似,(__)也是試圖找到一組原型向量來刻畫聚類結(jié)構(gòu),但與一般聚類方法不同的是,該算法假設(shè)數(shù)據(jù)樣本帶有類別標記,學(xué)習(xí)過程利用樣本的這些監(jiān)督信息來輔助聚類。A)高斯混合聚類密度聚類B)學(xué)習(xí)向量量化C)k均值算法D)學(xué)習(xí)向量量化答案:B解析:[單選題]47.線性模型試圖學(xué)得一個屬性的(__)來進行預(yù)測的函數(shù)。A)線性組合B)非線性組合C)取值D)維度答案:A解析:[單選題]48.根據(jù)某個詞所連接所有詞匯的權(quán)重,重新計算該詞匯的權(quán)重,然后把重新計算的權(quán)重傳遞下去。直到這種變化達到均衡態(tài),權(quán)重數(shù)值不再發(fā)生改變。這種關(guān)鍵詞提取算法叫做()。A)TF-IDFB)TextRankC)LDAD)PCA答案:B解析:[單選題]49.MySQL中,預(yù)設(shè)的、擁有最高權(quán)限超級用戶的用戶名為()A)testB)AdministratorC)DAD)root答案:D解析:[單選題]50.下列關(guān)于多層前饋神經(jīng)網(wǎng)絡(luò)的描述錯誤的是()。A)輸出層與輸入層之間包含隱含層,且隱含層和輸出層都擁有激活函數(shù)的神經(jīng)元B)神經(jīng)元之間存在同層連接以及跨層連接C)輸入層僅僅是接收輸入,不進行函數(shù)處理D)每層神經(jīng)元上一層與下一層全互連答案:B解析:多層前饋神經(jīng)網(wǎng)絡(luò)的特點:①每層神經(jīng)元與下一層神經(jīng)元之間完全互連;②神經(jīng)元之間不存在同層連接;③神經(jīng)元之間不存在跨層連接。[單選題]51.關(guān)于云數(shù)據(jù)庫描述不對的是()A)云數(shù)據(jù)可支持關(guān)系型數(shù)據(jù)庫B)數(shù)據(jù)庫支持按量計費C)支持創(chuàng)建只讀實例D)支持備份與恢復(fù),可保留歷史2周數(shù)據(jù)答案:D解析:[單選題]52.Python中statsmodel庫和()庫關(guān)系密切。A)NumpyB)ScipyC)JiebaD)Pandas答案:D解析:statsmodels建立在Pandas之上。[單選題]53.對于神經(jīng)網(wǎng)絡(luò)的說法,下面說法正確的是()A)增加神經(jīng)網(wǎng)絡(luò)層數(shù),可能會增加測試數(shù)據(jù)集的分類錯誤率B)減少神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小測試數(shù)據(jù)集的分類錯誤率C)增加神經(jīng)網(wǎng)絡(luò)層數(shù),總是能減小訓(xùn)練數(shù)據(jù)集的分類錯誤率D)A、B都對答案:A解析:[單選題]54.()提供RESTHTTPAPI來讀寫hdfs。A)AvroB)HttPFSBC)MahoutD)Snappy答案:B解析:第2部分:多項選擇題,共23題,每題至少兩個正確答案,多選或少選均不得分。[多選題]55.云計算關(guān)鍵技術(shù)之一的軟件定義架構(gòu),包括()A)軟件定義計算B)軟件定義存儲C)軟件定義網(wǎng)絡(luò)D)軟件定義數(shù)據(jù)中心答案:ABC解析:[多選題]56.MaxCompute中實例運行可能出現(xiàn)下述()狀態(tài)。A)RunningB)SuccessC)FailedD)Terminated答案:ABC解析:[多選題]57.HAVING與WHERE的不同之處有()A)WHERE語句可以使用聚合函數(shù),而HAVING不能使用。B)HAVING只用于GROUPBY分組統(tǒng)計語句中。C)HAVING子句中的每一個元素必須出現(xiàn)在SELECT列表中。D)HAVING針對表中的列發(fā)揮作用,查詢數(shù)據(jù);WHERE針對查詢結(jié)果中的列發(fā)揮作用,篩選數(shù)據(jù)。答案:BC解析:[多選題]58.主要面向或關(guān)注"過去"的數(shù)據(jù)分析過程為()。A)描述性分析B)診斷性分析C)預(yù)測性分析D)規(guī)范性分析答案:AB解析:Gartner分析學(xué)價值扶梯模型認為,從復(fù)雜度及價值高低兩個維度,可以將數(shù)據(jù)分析分為描述性分析、診斷性分析、預(yù)測性分析和規(guī)范性分析四種,其中描述性分析和診斷性分析關(guān)注和面向的是"過去"的時間點。[多選題]59.以下關(guān)于動態(tài)分區(qū)的描述正確的是:()。A)動態(tài)分區(qū)插入時,動態(tài)分區(qū)列必須在select列表中B)在使用動態(tài)分區(qū)功能的SQL中,在分布式環(huán)境下,單個進程最多只能輸出512個動態(tài)分區(qū)C)在現(xiàn)階段,任意動態(tài)分區(qū)SQL不可以生成超過2000個動態(tài)分區(qū)D)動態(tài)生成的分區(qū)值可以為NULL答案:ABC解析:[多選題]60.GuassDB200的基本功能包含哪些?A)標準SQL支持B)提供安裝部署工具、集群啟停工具、集群狀態(tài)監(jiān)控工具、升級和擴容工具C)支持表空間,支持集群在線擴容功能D)支持標準JDBC4.0的特性但不支持ODBC答案:ABC解析:[多選題]61.以下提法中正確的是(___)。A)數(shù)據(jù)學(xué)科中的?數(shù)據(jù)?并不僅僅是?數(shù)值?,也不等同于?數(shù)值?B)數(shù)據(jù)科學(xué)中的?計算?并不僅僅是加、減、乘、除等?數(shù)學(xué)計算?,還包括數(shù)據(jù)的查詢、挖掘、洞見、分析、可視化等更多類型C)數(shù)據(jù)科學(xué)不僅需要理論知識和實踐經(jīng)驗,而且還涉及黑客精神D)數(shù)據(jù)科學(xué)強調(diào)的是?理論研究?,一般不涉及?領(lǐng)域?qū)崉?wù)知識?答案:ABC解析:[多選題]62.以下對數(shù)據(jù)描述正確的是()。A)數(shù)據(jù)只包含顯性數(shù)據(jù)和隱性數(shù)據(jù)B)數(shù)值是數(shù)據(jù)的一種形式C)數(shù)據(jù)到智慧是人們認知提升的過程D)數(shù)據(jù)是現(xiàn)實世界的記錄答案:BCD解析:[多選題]63.在GaussDB200中,關(guān)于Schema和Database,下面說法正確的是()A)二者都能實現(xiàn)資源隔離。B)Database之間無法直接訪問,但通過權(quán)限授子可以訪問數(shù)據(jù)。C)相比于Database,Schema的隔離更加的徹底。D)Schema和用戶強相關(guān)的,通過權(quán)限控制語法可以實現(xiàn)不同用戶對各Schema的權(quán)限。答案:ABD解析:[多選題]64.StructuredStreaming中OutPut定義的存儲方式包含以下哪幾種?A)ModifyModeB)AppendModeC)UpdateMode.D)CompleteMode答案:BCD解析:[多選題]65.以下對HDFS中提供文件讀寫的類描述正確的是?A)FSDataOutputStream是與DataNode交互的接口類。B)FSDataOutputStream是HOFSAPI中提供讀取文件的類,通過FileSystem的close方法獲取讀取數(shù)據(jù)流。C)FSDataOutputStream通過FileSystem的create和append方法獲取寫入數(shù)據(jù)流。D)FSDataOutputStream是HDFSAPI中提供文件寫入文件的類。答案:ACD解析:[多選題]66.下列是SVM核函數(shù)的是:()A)多項式核函數(shù)B)logistic核函數(shù)C)徑向基核函數(shù)D)Sigmoid核函數(shù)答案:ACD解析:[多選題]67.以下哪些是大數(shù)據(jù)技術(shù)在5G運營中的應(yīng)用場景()A)5G切片管理B)5G網(wǎng)絡(luò)精定位C)5G基站節(jié)能D)5G天線波束管理答案:ABCD解析:[多選題]68.下面關(guān)于k近鄰的表述中,正確的是(__)。A)當(dāng)k取不同值時,分類結(jié)果會有顯著不同B)若采用不同的距離計算方式,則找出的?近鄰?可能有顯著差別C)k近鄰可用來對數(shù)據(jù)進行分類D)k近鄰可用來對數(shù)據(jù)進行回歸答案:ABCD解析:[多選題]69.下列運算符中合法的是()。A)%=B)&=C)**=D)|=答案:AC解析:[多選題]70.下列有關(guān)Oracle數(shù)據(jù)庫描述正確的是()。A)一個表的唯一標識稱為主鍵B)Oracle數(shù)據(jù)庫結(jié)構(gòu)型數(shù)據(jù)庫C)主鍵的類型包括單一主鍵和復(fù)合主鍵D)Oracle數(shù)據(jù)庫是非結(jié)構(gòu)型數(shù)據(jù)庫答案:ABC解析:[多選題]71.在聚類分析當(dāng)中,()等技術(shù)可以處理任意形狀的簇。A)MIN(單鏈)B)MAX(全鏈)C)組平均D)Chameleon答案:AD解析:[多選題]72.數(shù)據(jù)可視化的作用()。A)數(shù)據(jù)表達B)數(shù)據(jù)操作C)數(shù)據(jù)分析D)挖掘答案:ABC解析:[多選題]73.Hive的自定義函數(shù)包括?A)UDAFB)UDCEC)UDTFD)UDE答案:ACD解析:[多選題]74.HDFS里包含哪些實例?A)NameNodeB)TaskManagerC)DataNodeD)JobManager答案:AC解析:[多選題]75.下列哪些假設(shè)是我們推導(dǎo)線性回歸參數(shù)時遵循的()?A)X與Y有線性關(guān)系(多項式關(guān)系)B)模型誤差在統(tǒng)計學(xué)上是獨立的C)誤差一般服從0均值和固定標準差的正態(tài)分布D)X是非隨機且測量沒有誤差的答案:ABCD解析:[多選題]76.從理論上講數(shù)據(jù)能力評價方法有(__)。A)評價理論B)評價結(jié)果C)評價過程D)評價質(zhì)量答案:BC解析:[多選題]77.以下哪些模塊是屬于Spark組件的?A)StreamingB)MLLibC)GraphXD)Hive答案:ABC解析:第3部分:判斷題,共16題,請判斷題目是否正確。[判斷題]78.云環(huán)境下的安全模型包括應(yīng)用服務(wù)安全、數(shù)據(jù)安全、虛擬化安全、基礎(chǔ)設(shè)施安全。A)正確B)錯誤答案:對解析:[判斷題]79.技術(shù)選型時應(yīng)該采用最新的技術(shù)不需要考慮技術(shù)的穩(wěn)定性。A)正確B)錯誤答案:錯解析:[判斷題]80.yarn-env.sh配置文件是用來保證Hadoop系統(tǒng)能夠正常執(zhí)行HDFS的守護進程NameNode、SecondaryNameNode和DataNode。A)正確B)錯誤答案:錯解析:hadoop-env.sh配置文件是用來保證Hadoop系統(tǒng)能夠正常執(zhí)行HDFS的守護進程NameNode、SecondaryNameNode和DataNode。[判斷題]81.大數(shù)據(jù)的價值重在挖掘,而挖掘就是分析。()A)正確B)錯誤答案:對解析:[判斷題]82.已知當(dāng)前文件夾中有一個文件readmeA)正確B)錯誤答案:對解析:[判斷題]83.已知x={1:1,2:2},那么語句x[3]=3無法正常執(zhí)行。A)正確B)錯誤答案:錯解析:[判斷題]84.大數(shù)據(jù)技術(shù)和云計算技術(shù)是兩門完全不相關(guān)的技術(shù)。A)正確B)錯誤答案:錯解析:[判斷題]85.在Spark中,SparkSQL是獨立的模塊,可以不依賴于SparkCore獨立完成SQL語句的解析、優(yōu)化和執(zhí)行等操作。A)正確B)錯誤答案:錯解析:[判斷題]86.多維數(shù)組操作索引時,可以將切片與整數(shù)索引混合使用。()A)正確B)錯誤答案:對解析:[判斷題]87.在沒有大數(shù)據(jù)的條件下,人才的發(fā)現(xiàn)與選拔都很難做到?全信息?,大數(shù)據(jù)能夠幫助人們解決這個問題。A)正確B)錯誤答案:對解析:[判斷題]88.表達式3>5andm

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論