華南理工大學(xué)《大數(shù)據(jù)及數(shù)據(jù)挖掘》2023-2024學(xué)年期末試卷_第1頁
華南理工大學(xué)《大數(shù)據(jù)及數(shù)據(jù)挖掘》2023-2024學(xué)年期末試卷_第2頁
華南理工大學(xué)《大數(shù)據(jù)及數(shù)據(jù)挖掘》2023-2024學(xué)年期末試卷_第3頁
華南理工大學(xué)《大數(shù)據(jù)及數(shù)據(jù)挖掘》2023-2024學(xué)年期末試卷_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

學(xué)校________________班級____________姓名____________考場____________準(zhǔn)考證號學(xué)校________________班級____________姓名____________考場____________準(zhǔn)考證號…………密…………封…………線…………內(nèi)…………不…………要…………答…………題…………第1頁,共3頁華南理工大學(xué)《大數(shù)據(jù)及數(shù)據(jù)挖掘》2023-2024學(xué)年期末試卷題號一二三總分得分一、單選題(本大題共20個(gè)小題,每小題2分,共40分.在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的.)1、數(shù)據(jù)清洗在大數(shù)據(jù)處理中的主要目的是()A.提高數(shù)據(jù)安全性B.減少數(shù)據(jù)量C.去除噪聲和錯(cuò)誤數(shù)據(jù)D.加密數(shù)據(jù)2、大數(shù)據(jù)中的數(shù)據(jù)預(yù)處理步驟不包括?()A.數(shù)據(jù)清洗B.數(shù)據(jù)轉(zhuǎn)換C.數(shù)據(jù)壓縮D.數(shù)據(jù)刪除3、Hadoop生態(tài)系統(tǒng)中的哪個(gè)組件用于實(shí)時(shí)流數(shù)據(jù)處理?()A.SparkStreamingB.FlinkC.StormD.KafkaStreams4、以下哪個(gè)不是大數(shù)據(jù)中的數(shù)據(jù)清洗工具?()A.OpenRefineB.DataWranglerC.ExcelD.TensorFlow5、以下哪種技術(shù)用于大數(shù)據(jù)的流處理?()A.FlinkB.HBaseC.HDFSD.YARN6、以下哪種技術(shù)用于大數(shù)據(jù)的圖計(jì)算?()A.GraphXB.Neo4jC.GiraphD.以上都是7、以下哪個(gè)不是大數(shù)據(jù)中的數(shù)據(jù)安全策略?()A.訪問控制B.數(shù)據(jù)備份C.數(shù)據(jù)加密D.數(shù)據(jù)公開8、Hadoop生態(tài)系統(tǒng)中的哪個(gè)組件用于日志收集?()A.FlumeB.KafkaC.ZooKeeperD.Hive9、大數(shù)據(jù)中的數(shù)據(jù)一致性模型不包括?()A.強(qiáng)一致性B.弱一致性C.最終一致性D.隨機(jī)一致性10、在大數(shù)據(jù)中,數(shù)據(jù)緩存的作用是()A.提高數(shù)據(jù)處理速度B.節(jié)省存儲(chǔ)空間C.保證數(shù)據(jù)一致性D.以上都不是11、以下哪個(gè)不是大數(shù)據(jù)的分析模式?()A.離線分析B.實(shí)時(shí)分析C.隨機(jī)分析D.近線分析12、以下哪種算法常用于大數(shù)據(jù)的聚類分析?()A.K-MeansB.AprioriC.SVMD.KNN13、大數(shù)據(jù)中的數(shù)據(jù)脫敏方法不包括?()A.替換B.加密C.亂序D.復(fù)制14、大數(shù)據(jù)中的數(shù)據(jù)可視化原則不包括()A.準(zhǔn)確性B.簡潔性C.復(fù)雜性D.交互性15、以下哪種數(shù)據(jù)庫適用于海量文本數(shù)據(jù)處理?()A.ElasticsearchB.MySQLC.OracleD.SQLServer16、大數(shù)據(jù)中的數(shù)據(jù)治理框架不包括?()A.元數(shù)據(jù)管理B.數(shù)據(jù)質(zhì)量管理C.數(shù)據(jù)安全管理D.數(shù)據(jù)刪除管理17、大數(shù)據(jù)中的數(shù)據(jù)融合方法不包括?()A.基于規(guī)則的融合B.基于機(jī)器學(xué)習(xí)的融合C.隨機(jī)融合D.基于本體的融合18、大數(shù)據(jù)中的數(shù)據(jù)壓縮算法不包括?()A.GzipB.Bzip2C.RARD.LZ419、大數(shù)據(jù)中的數(shù)據(jù)一致性保障方法不包括()A.分布式事務(wù)B.兩階段提交C.數(shù)據(jù)復(fù)制D.數(shù)據(jù)刪除20、以下哪種技術(shù)用于大數(shù)據(jù)的實(shí)時(shí)監(jiān)控?()A.PrometheusB.GrafanaC.以上都是D.以上都不是二、簡答題(本大題共4個(gè)小題,共40分)1、(本題10分)大數(shù)據(jù)如何推動(dòng)跨境電商的發(fā)展?2、(本題10分)大數(shù)據(jù)分析的主要方法有哪些?3、(本題10分)解釋大數(shù)據(jù)中的數(shù)據(jù)血緣追蹤工具。4、(本題10分)列舉大數(shù)據(jù)在人力資源管理中的應(yīng)用場景。三、綜合分析題(本大題共2個(gè)小題,共20分)1、(本題10分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論