大數(shù)據(jù)CDA考試(習(xí)題卷5)_第1頁(yè)
大數(shù)據(jù)CDA考試(習(xí)題卷5)_第2頁(yè)
大數(shù)據(jù)CDA考試(習(xí)題卷5)_第3頁(yè)
大數(shù)據(jù)CDA考試(習(xí)題卷5)_第4頁(yè)
大數(shù)據(jù)CDA考試(習(xí)題卷5)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

試卷科目:大數(shù)據(jù)CDA考試大數(shù)據(jù)CDA考試(習(xí)題卷5)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)CDA考試第1部分:?jiǎn)雾?xiàng)選擇題,共47題,每題只有一個(gè)正確答案,多選或少選均不得分。[單選題]1.在ID3算法中信息增益是指()。A)信息的溢出程度B)信息的增加效益C)熵增加的程度最大D)熵減少的程度最大答案:D解析:[單選題]2.貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。A)極大似然概率B)先驗(yàn)概率C)邊際概率D)后驗(yàn)概率答案:D解析:[單選題]3.分析顧客的消費(fèi)行為,以便有針對(duì)性的向其推薦感興趣的服務(wù),于()問(wèn)題A)關(guān)聯(lián)規(guī)則挖掘B)分類與回歸C)聚類分析D)時(shí)序預(yù)測(cè)答案:A解析:[單選題]4.17、19、22、24、25、28、34這組數(shù)的四分位差是()。A)24B)12C)9D)D17答案:C解析:[單選題]5.傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)單位?A)TBB)EBC)PBD)GB答案:D解析:[單選題]6.在Mapper類中,共有4個(gè)函數(shù):setup()、map()、()l、run)。A)Reducer()B)cleanup()C)Split()D)local()答案:B解析:[單選題]7.HadoopMapReduce支持多種語(yǔ)言編程,下列說(shuō)法不正確的是()。A)可以用JAVA語(yǔ)言編寫(xiě)MapReduce應(yīng)用程序B)可以用C/C++語(yǔ)言編寫(xiě)MapReduce應(yīng)用程序C)可以用Python語(yǔ)言編寫(xiě)MapReduce應(yīng)用程序D)可以用javascript語(yǔ)言編寫(xiě)MapReduce應(yīng)用程序答案:D解析:[單選題]8.統(tǒng)計(jì)圖形中,常用于檢查異常值的是()。A)Q-Q圖B)箱線圖C)帕累托圖D)氣泡圖答案:B解析:[單選題]9.在Flink技術(shù)架構(gòu)中,以下哪項(xiàng)是流處理和批處理的計(jì)算引擎?A)StandaloneB)RuntimeC)FlinkCoreD)Datasteam答案:B解析:[單選題]10.()表示在先決條件X發(fā)生的情況下,由關(guān)聯(lián)規(guī)則?X→Y?推出Y的概率。即在含有X的項(xiàng)集中,含有Y的可能性。A)置信度B)支持度C)關(guān)聯(lián)度D)以上都不是答案:A解析:[單選題]11.一個(gè)6面骰子連擲4次,得到至少一次六點(diǎn)的概率約為()。A)≈51.77%B)≈66.67%C)≈48.22%D)≈16.67%答案:A解析:1-(5/6)^4≈0.5177[單選題]12.使用JAVAAPI進(jìn)行HBase整表掃描操作,以下命令輸寫(xiě)正確的是()。A)table.getScanner(scan);B)table.scan(table)C)table.get(table).scan();D)table.Scanner(get);答案:A解析:[單選題]13.下面關(guān)于MapReduce的描述中正確的是()。A)MapReduce程序必須包含Mapper和Reduce。B)MapReduce程序的MapTask可以任意指定。C)MapReduce程序的ReduceTask可以任意指定D)MapReduce程序的ReduceTask可以任意指定答案:D解析:[單選題]14.下列關(guān)于HadoopAPI的說(shuō)法錯(cuò)誤的是()。A)Hadoop的API只適用于HDFS文件系統(tǒng)B)Configuration類的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C)FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D)FSDatalnputStream是java.io.DatalnputStream的子類答案:A解析:[單選題]15.HBase的物理存儲(chǔ)單元是什么?A)RegionB)ColumnFamilyC)ColumnD)ROW答案:B解析:[單選題]16.檢驗(yàn)單總體方差的過(guò)程中,檢驗(yàn)統(tǒng)計(jì)量服從()。A)標(biāo)準(zhǔn)正態(tài)分布B)正態(tài)分布C)卡方分布D)t分布答案:C解析:見(jiàn)單總體方差檢驗(yàn)概念[單選題]17.在創(chuàng)建對(duì)象時(shí)必須A)先聲明對(duì)象,然后才能使用對(duì)象B)先聲明對(duì)象,為對(duì)象分配內(nèi)存空間,然后才能使用對(duì)象C)先聲明對(duì)象,為對(duì)象分配內(nèi)存空間,對(duì)對(duì)象初始化,然后才能使用對(duì)象D)上述說(shuō)法都對(duì)答案:C解析:[單選題]18.以下表述錯(cuò)誤的是()。A)冗余屬性不會(huì)對(duì)決策樹(shù)的準(zhǔn)確率造成不利的影響B(tài))子樹(shù)可能在決策樹(shù)中重復(fù)多次C)決策樹(shù)算法對(duì)于噪聲的干擾非常敏感D)尋找最佳決策樹(shù)是NP完全問(wèn)題答案:C解析:[單選題]19.Java的字符類型采用的是Unicode編碼方案,每個(gè)Unicode碼占用()個(gè)比特位。A)8B)16C)32D)64答案:C解析:[單選題]20.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Bolt的某一個(gè)確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略()?A)局部字段分組B)廣播分組C)直接分組D)全局分組答案:C解析:[單選題]21.編譯Java源程序文件將產(chǎn)生相應(yīng)的字節(jié)碼文件,這些字節(jié)碼文件的擴(kuò)展名為A)byteB)classC)htmlD)exe答案:B解析:[單選題]22.無(wú)監(jiān)督學(xué)習(xí)中應(yīng)用最廣的是()。A)分類算法B)聚類算法C)關(guān)聯(lián)算法D)時(shí)序答案:B解析:[單選題]23.下列選項(xiàng)中無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?()A)商業(yè)模式發(fā)現(xiàn)B)信用評(píng)估C)商品推薦D)運(yùn)營(yíng)分析答案:A解析:[單選題]24.以下對(duì)最近鄰分類算法(KNN)的說(shuō)法錯(cuò)誤的是()。A)它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型B)分類一個(gè)測(cè)試樣例開(kāi)銷很大C)最近鄰分類器基于全局信息進(jìn)行預(yù)測(cè)D)可生產(chǎn)任意形狀的決策邊界答案:C解析:[單選題]25.Zookeeper在分布式應(yīng)用中主要的作用不包括以下哪些選項(xiàng)?A)選舉Master節(jié)點(diǎn)B)保證各節(jié)點(diǎn)上數(shù)據(jù)的C)分配集群資源D)存儲(chǔ)及群中答案:C解析:[單選題]26.hadoop平臺(tái)中要查看Yarn服務(wù)中一個(gè)application的信息,通常需要使用什么命令?A)containerB)jarC)application-attemptD)Application答案:D解析:[單選題]27.HBase依靠()存儲(chǔ)底層數(shù)據(jù)A)HDFSB)HadoopC)MemoryD)MapReduce答案:A解析:[單選題]28.以下哪個(gè)不屬于數(shù)據(jù)分析報(bào)告的開(kāi)篇部分。()A)索引B)前言C)目錄D)標(biāo)題答案:A解析:[單選題]29.Hadoop系統(tǒng)中關(guān)于客戶端向HDFS文件系統(tǒng)上傳文件說(shuō)法正確的是?A)客戶端的文件數(shù)據(jù)經(jīng)過(guò)NameNode傳遞給DataNodeB)客戶端將文件分為多個(gè)Bock,根據(jù)DataNode的地址信息,按順序?qū)懭朊恳粋€(gè)DataNode中C)客戶端根據(jù)DataNode的地址信息,按順序?qū)⒄麄€(gè)文件寫(xiě)入每一個(gè)DataNode中,然后由DataNode將文件劃分為多個(gè)BlockD)客戶端只上傳數(shù)據(jù)到一個(gè)DataNode,然后由Namenode負(fù)責(zé)Bock復(fù)制答案:B解析:[單選題]30.下列有關(guān)C4.5算法的說(shuō)法中不正確的是()A)每個(gè)節(jié)點(diǎn)的分支度只能為2B)使用gainratio作為節(jié)點(diǎn)分割的依據(jù)C)可以處理數(shù)值型態(tài)的字段D)可以處理空值的字段答案:A解析:[單選題]31.SOL語(yǔ)言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()。A)DELETEB)DROPC)CLEARD)REMORE答案:A解析:truncate與drop是DDL語(yǔ)句,執(zhí)行后無(wú)法回滾;delete是DML語(yǔ)句,可回滾。[單選題]32.下列選項(xiàng)中,關(guān)于Zookeeper可靠性含義說(shuō)法正確的是?A)可靠性通過(guò)主備部署模式實(shí)現(xiàn)B)可靠性是指更新更新只能成功或失敗沒(méi)有中間狀態(tài)C)可靠性是指無(wú)論個(gè)server,對(duì)外展示的均是同一個(gè)視圖D)可靠性是指一個(gè)消息被一個(gè)Server它將被所有的Server接受答案:D解析:[單選題]33.一個(gè)電瓶車(chē)制造商聲稱,其生產(chǎn)的電瓶車(chē)正常行駛條件下大于40公里,對(duì)一個(gè)由20輛電瓶車(chē)組成的隨機(jī)樣本作了試驗(yàn),測(cè)得平均值為50公里,標(biāo)準(zhǔn)差為10公里。已知電瓶車(chē)的行駛距離服從正態(tài)分布,我們希望檢驗(yàn)該制造商的產(chǎn)品同他所說(shuō)的標(biāo)準(zhǔn)相符?我們應(yīng)該選擇()A)單側(cè)t檢驗(yàn)B)雙側(cè)t檢驗(yàn)C)單側(cè)F檢驗(yàn)D)雙側(cè)F檢驗(yàn)答案:A解析:小樣本均值檢驗(yàn)用t檢驗(yàn)。[單選題]34.在測(cè)試Flask項(xiàng)目時(shí),使用()模塊可以根據(jù)需求產(chǎn)生不同類型和數(shù)量的虛擬數(shù)據(jù)0A)demoB)fakerC)testD)faker_data答案:B解析:[單選題]35.下列涉及通配符的操作,范圍最大的是()A)nameB)nameC)nameD)name答案:C解析:%匹配多個(gè)字符,_匹配一個(gè)字符。[單選題]36.對(duì)于Hive中關(guān)于普通表和外部表描述不正確的是?A)默認(rèn)創(chuàng)建普通表B)刪除外部表時(shí),只除外部表數(shù)據(jù)而不刪除元數(shù)據(jù)C)外部實(shí)質(zhì)是將已存在于HDFS上的文件路徑跟表關(guān)聯(lián)起來(lái)D)刪除普通表時(shí),元數(shù)據(jù)和數(shù)據(jù)同時(shí)被刪除答案:C解析:[單選題]37.下面哪些場(chǎng)景不是Flink組件擅長(zhǎng)的?A)批處理B)迭代計(jì)算C)流處理D)數(shù)據(jù)存儲(chǔ)答案:B解析:[單選題]38.在使用Flask-WTF自定義表單類時(shí),自定義的類需要繼承自()。A)FlaskFormB)FlaskFormsC)FlaskWTFD)Forms答案:A解析:[單選題]39.下面關(guān)于Zookeeper特性的描述錯(cuò)誤的是?A)消息更新只能成功或者失敗,沒(méi)有中間狀態(tài)B)Zookeeper節(jié)點(diǎn)數(shù)必須為奇數(shù)個(gè)C)一條消息要被超過(guò)半數(shù)的Server接收,它將可以成功寫(xiě)入磁盤(pán)D)客戶端所發(fā)送的更新會(huì)按照它們被發(fā)送的順序進(jìn)行應(yīng)用答案:B解析:[單選題]40.以下哪個(gè)操作是hive不支持的?()A)表增加列B)表刪除列C)表修改列D)修改表名答案:B解析:[單選題]41.在方差分析中,我們?nèi)缦螺敵錾媳碛???hào)的空格數(shù)值是多少()A)32B)33C)64D)66答案:C解析:組內(nèi)自由度等于觀察數(shù)66-組數(shù)2=64。[單選題]42.日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)錯(cuò)誤的是()。A)進(jìn)度性B)規(guī)范性C)時(shí)效性D)全面性答案:D解析:[單選題]43.以下關(guān)于K-Means算法錯(cuò)誤的是()。A)K值無(wú)法預(yù)先判斷,只適用于球形類的形狀的聚類B)算法可能收斂到局部最優(yōu)點(diǎn)C)算法對(duì)極值點(diǎn)及噪點(diǎn)較為敏感D)中心點(diǎn)的個(gè)數(shù),通常值是在8-10個(gè)之間答案:D解析:[單選題]44.若要對(duì)比各個(gè)國(guó)家之間的人均收入與人均支出的離散程度,應(yīng)使用以下哪種統(tǒng)計(jì)量()。A)方差B)離差C)離散系數(shù)D)相關(guān)系數(shù)答案:C解析:見(jiàn)離散系數(shù)定義[單選題]45.HBase的Region組成中,必須要有以下一項(xiàng)。A)StoreFileB)MemStoreC)HFileD)MetaStore答案:B解析:[單選題]46.以下關(guān)于fusioninsightCTbase的描述不正確的是?A)CThase的讀寫(xiě)數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動(dòng)進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B)CTHBase是基于Hbase的聚簇表開(kāi)發(fā)框架C)CTHbase提供了一套Webui進(jìn)行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計(jì)工具,降低表設(shè)D)CTHbase的javaAPI提供一套Hbase連接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶端應(yīng)用開(kāi)發(fā)難度。答案:B解析:[單選題]47.采用Flume傳輸數(shù)據(jù)過(guò)程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用以下哪種channel類型?A)MemoryChannelsB)FileChannelC)JDBCChannelD)HDFSChannel答案:B解析:第2部分:多項(xiàng)選擇題,共29題,每題至少兩個(gè)正確答案,多選或少選均不得分。[多選題]48.寧家駿委員指出,()主導(dǎo)了21世紀(jì)。A)云計(jì)算B)移動(dòng)支付C)大數(shù)據(jù)D)物聯(lián)網(wǎng)答案:ACD解析:[多選題]49.FusioninsightManager可以對(duì)哪些項(xiàng)目進(jìn)行健康檢查?()A)角色B)主機(jī)C)服務(wù)D)實(shí)例答案:ABCD解析:[多選題]50.下列關(guān)于Worker(工作進(jìn)程exector(線程)、Task(任務(wù))說(shuō)法正確的是?A)每個(gè)Executor(線程可以運(yùn)行多個(gè)task任務(wù)B)每個(gè)Worket運(yùn)行多個(gè)exector(線程)C)每個(gè)Workst只能為個(gè)拓?fù)溥\(yùn)行Executor(線程)D)每個(gè)Executor運(yùn)行不同組件(Spout或Bolt)的Task(任務(wù))答案:ABD解析:[多選題]51.可以用于表示某公司一年中每個(gè)月銷量變化的數(shù)據(jù)圖形類型是()。A)矩形豎圖B)柱狀圖C)堆積面積圖D)雷達(dá)圖答案:BC解析:[多選題]52.Streaming的處理節(jié)點(diǎn)Bolt中,可以完成以下哪些操作?()A)連接運(yùn)算B)過(guò)濾(Filter)C)連接數(shù)據(jù)庫(kù)D)業(yè)務(wù)處理答案:ABCD解析:[多選題]53.Hbase中包含的一些典型的Filter有哪些?()A)SingleColumValueFilterB)FilterListC)RowFilterD)KeyOnlyFilter答案:ABCD解析:[多選題]54.決策樹(shù)法分析問(wèn)題的主要步驟為()。A)結(jié)構(gòu)化問(wèn)題B)設(shè)計(jì)可能結(jié)果發(fā)生的概率C)設(shè)計(jì)結(jié)果的得益D)分析問(wèn)題答案:ABCD解析:[多選題]55.以下關(guān)丁KafkaPartition說(shuō)法正確的有?A)引入Partition機(jī)制,保證了Kafka的高吞吐能力B)每個(gè)Partition都是有序且不可變的消息隊(duì)列C)Partition數(shù)量決足了每個(gè)consumergroup中井發(fā)消費(fèi)者的最大數(shù)量D)每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)10g文件答案:ABCD解析:[多選題]56.下面關(guān)于Hbase的特性描述正確的是(1。A)高可靠性B)高性能C)面向列D)可伸縮答案:ABCD解析:[多選題]57.以下哪些是集中趨勢(shì)分析的指標(biāo)。()A)均值B)中位數(shù)C)眾數(shù)D)四分位數(shù)答案:ABCD解析:[多選題]58.Apriori算法的計(jì)算復(fù)雜度受哪些因素影響?()A)支持度閥值B)項(xiàng)數(shù)(維度)C)事務(wù)數(shù)D)事務(wù)平均寬度答案:ABCD解析:[多選題]59.以下對(duì)SPARK的描述,正確的是()?A)高性能內(nèi)存迭代計(jì)算框架B)內(nèi)存計(jì)算一站式解決方案C)性能差D)支持多語(yǔ)言快速開(kāi)發(fā)應(yīng)用答案:ABD解析:[多選題]60.FusioninsightHD系統(tǒng)中使用Streaming客戶端Shell命令提交了拓?fù)渲?使用StormUl查看發(fā)現(xiàn)該拓長(zhǎng)時(shí)間沒(méi)有處理數(shù)據(jù),可能原因有?()A)查看客戶端異常堆棧,判斷是否客戶端使用問(wèn)題B)查看主Nimbus的運(yùn)行日志,判斷是否Nimbus服務(wù)端異常C)查看Supervisor運(yùn)行日志,判斷是否Supervisor異常D)查看Worker運(yùn)行日志答案:AB解析:[多選題]61.光纜是數(shù)據(jù)傳輸中最有效的一種傳輸介質(zhì),它有()A)頻帶較寬B)電磁絕緣性能好C)衰減較小D)無(wú)中繼段長(zhǎng)答案:AB解析:[多選題]62.問(wèn)題結(jié)構(gòu)是由()構(gòu)成的。A)現(xiàn)狀B)直接原因C)間接原因D)最終原因答案:ABD解析:[多選題]63.某大樣本數(shù)據(jù)集的缺失值占比約10%。數(shù)據(jù)分析師小A首先刪除了所有有缺失值的樣本,建立了回歸模型。然后用某種方法進(jìn)行了缺失值處理后,重新建立了回歸模型,發(fā)現(xiàn)模型的VIF值較之前有了很大的增幅。請(qǐng)問(wèn)小A有可能采用的哪種方法進(jìn)行的缺失值處理?()A)均值填補(bǔ)B)K-means聚類填補(bǔ)C)回歸填補(bǔ)D)忽略缺失值的極大似然估計(jì)答案:BC解析:此題為本試卷最難題。A只涉及變量本身,D涉及數(shù)據(jù)集整體,這兩種方法都不會(huì)影響自變量之間的相關(guān)性,即不會(huì)讓VIF值產(chǎn)生顯著變化。而B(niǎo)C兩種方法都是以變量之間的聯(lián)系作為填補(bǔ)的基礎(chǔ),會(huì)在一定程度上改變變量之間的相關(guān)性,導(dǎo)致VIF值變化。[多選題]64.數(shù)據(jù)分析報(bào)告的金字塔原理所遵循的原則是()。A)歸類分組B)邏輯遞進(jìn)C)以下統(tǒng)上D)結(jié)論先行答案:ABD解析:[多選題]65.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說(shuō)法正確的是?()A)SparkSQL依賴HiVe的元數(shù)據(jù)B)SparkSQL的執(zhí)行引擎為Sparkcore.,Hive默認(rèn)執(zhí)行引擎為MapreduceC)SparkSQL不可以使用Hive的自定義函數(shù)D)SparkSQL兼容絕大部分Hive的語(yǔ)法和函數(shù)答案:ABCD解析:[多選題]66.ZKFC進(jìn)程部署在hdfs中的以下那個(gè)節(jié)點(diǎn)上?()A)activenamenodeB)standbynamenodeC)datanodeD)以上全部不對(duì)答案:AB解析:[多選題]67.ResoureManager主要作用是什么()?A)調(diào)度器B)應(yīng)用程序管理器C)節(jié)點(diǎn)資源管理D)節(jié)點(diǎn)資源管理答案:AC解析:[多選題]68.hive在load是不檢索數(shù)據(jù)是否符合schema的,hive遵循的是schemaonread(讀時(shí)模式)只有在讀時(shí)模式的時(shí)候才檢查hive的數(shù)據(jù)字段,shena,下關(guān)于Flink中transformation的說(shuō)法正確的是?A)可以通過(guò)window設(shè)定時(shí)間窗口B)filter操件是對(duì)每個(gè)元素執(zhí)行boolean函數(shù)C)flatmap是對(duì)文本進(jìn)行切分D)keyby是將源頭數(shù)據(jù)按照key進(jìn)行分組,以保證同一個(gè)key的元數(shù)據(jù)分到同樣的組中答案:ABD解析:[多選題]69.Yarn中,?從?節(jié)點(diǎn)負(fù)責(zé)以下哪些工作?A)集群中所有資源的一管理和分配B)監(jiān)督container的生命周期管理C)監(jiān)控每個(gè)Container的資源使用(內(nèi)存、CPU等)情況D)管理日志和不同應(yīng)用程序用到的附屬服務(wù)答案:BC解析:[多選題]70.預(yù)測(cè)性數(shù)據(jù)挖掘包括哪些方法?A)分類B)數(shù)據(jù)總結(jié)C)回歸D)時(shí)間序列答案:ACD解析:[多選題]71.以下屬于分類器模型評(píng)價(jià)指標(biāo)的有(A)預(yù)測(cè)準(zhǔn)確度B)recallC)模型描述的簡(jiǎn)潔度D)F1-Score答案:ABD解析:[多選題]72.邏輯回歸是數(shù)據(jù)挖掘算法中常用的模型算法,以下關(guān)于邏輯回歸的說(shuō)法正確的是()。A)異常值不會(huì)對(duì)模型造成很大的干擾。B)邏輯回歸的自變量必須是分類變量,因此要對(duì)連續(xù)型變量進(jìn)行離散化處理。C)邏輯回歸屬于分類算法。D)邏輯回歸對(duì)模型中自變量的多重共線性較為敏感。答案:CD解析:[多選題]73.Master的ElectedLeader事件后不做哪些操作()A)通知driverB)通知workerC)注冊(cè)applicationD)直接ALIVE答案:ABC解析:[多選題]74.張亮持有A、B、C、D、E五只股票,請(qǐng)問(wèn)以下不屬于時(shí)間序列問(wèn)題的有()。A)透過(guò)A只股票過(guò)去一年來(lái)的股價(jià)走勢(shì),預(yù)測(cè)明天A只股票的開(kāi)盤(pán)價(jià)格B)將E五只股票區(qū)分為賺錢(qián)與賠錢(qián)兩個(gè)類別C)將E五只股票區(qū)分為甲、乙、丙三個(gè)群體D)透過(guò)A,C,D三只股票過(guò)去一年來(lái)的走勢(shì),預(yù)測(cè)明天A只股票的開(kāi)盤(pán)價(jià)格答案:BC解析:[多選題]75.下列哪個(gè)場(chǎng)景可以使用決策樹(shù)構(gòu)建模型?()A)預(yù)測(cè)申辦信用卡的新客戶是否將來(lái)會(huì)變成卡奴B)保險(xiǎn)公司針對(duì)特定族群做人壽保險(xiǎn)的推銷C)找出購(gòu)物籃里商品購(gòu)買(mǎi)間的關(guān)聯(lián)D)根據(jù)生活作息推斷該病人得癌癥的機(jī)率答案:ABD解析:[多選題]76.云計(jì)算的特點(diǎn)包括以下哪些方面?A)服務(wù)可計(jì)算B)高性價(jià)比C)服務(wù)可租用D)低使用度答案:ABC解析:第3部分:判斷題,共24題,請(qǐng)判斷題目是否正確。[判斷題]77.數(shù)據(jù)分析時(shí),將影響業(yè)務(wù)發(fā)展的因素羅列出來(lái),對(duì)不同因素進(jìn)行主次辨析,井展開(kāi)遞進(jìn)分析,要比直接從?想當(dāng)然?的某個(gè)因素匆忙入手要準(zhǔn)確和有效得多A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]78.在Mapreduce編程中,代碼不僅要描述做什么,還要描述具體怎么做。A)正確B)錯(cuò)誤答案:錯(cuò)解析:[判斷題]79.折線圖主要用于顯示在相等時(shí)間間隔下數(shù)據(jù)的趨勢(shì)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]80.數(shù)據(jù)異常值檢方法以正態(tài)分布為前提,若數(shù)據(jù)偏離正態(tài)分布或樣本較小時(shí),則檢驗(yàn)結(jié)果未必可靠,校驗(yàn)是否正態(tài)分布可借助W檢驗(yàn)、D檢驗(yàn)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]81.Java源程序的文件名必須與public類的名稱完全一致A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]82.在Flink中,checkpoint機(jī)制能明在運(yùn)行過(guò)程中出現(xiàn)失敗時(shí),從某一個(gè)檢查點(diǎn)恢復(fù),在此過(guò)程中,流快照是根據(jù)數(shù)據(jù)流入依次創(chuàng)建的。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]83.SparkStreaming計(jì)算基于DStream將流式計(jì)算分解成一系列短小的批處理作業(yè)()A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]84.聚類將類似的值聚成簇。直觀的,落在簇集合之外的值被視為離群點(diǎn)。A)正確B)錯(cuò)誤答案:對(duì)解析:[判斷題]85.Kafka是一個(gè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論