版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGEPAGE1《大數(shù)據(jù)導(dǎo)論》期末考試復(fù)習(xí)題庫(kù)(含答案)一、單選題1.下面哪一項(xiàng)不是云數(shù)據(jù)庫(kù)的特性?()A、動(dòng)態(tài)可擴(kuò)展B、高成本C、易用性D、大規(guī)模并行處理答案:B2.下列關(guān)于流計(jì)算的說(shuō)法,哪項(xiàng)是錯(cuò)誤的?()A、實(shí)時(shí)獲取來(lái)自不同數(shù)據(jù)源的海量數(shù)據(jù),經(jīng)過(guò)實(shí)時(shí)分析處理,獲得有價(jià)值的信息B、流計(jì)算秉承一個(gè)基本理念,即數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而降低C、對(duì)于一個(gè)流計(jì)算系統(tǒng)來(lái)說(shuō),它應(yīng)該支持TB級(jí)甚至是PB級(jí)的數(shù)據(jù)規(guī)模D、流計(jì)算只需要保證較低的延遲時(shí)間,即只達(dá)到秒級(jí)別即可處理一切問(wèn)題答案:D3.以下哪個(gè)不是Spark的生態(tài)系統(tǒng)的組件:()A、SparkStreamingB、StructuredStreamingC、ZookeeperD、GraphX答案:C4.我國(guó)首家大數(shù)據(jù)交易所是:()A、貴陽(yáng)大數(shù)據(jù)交易所B、上海數(shù)據(jù)交易中心C、華東江蘇大數(shù)據(jù)交易中心D、浙江大數(shù)據(jù)交易中心答案:A5.以下哪個(gè)不是聚類方法:()A、GMMB、LDAC、DBSCAND、TPLINK答案:D6.關(guān)于公民的隱私權(quán),下面描述錯(cuò)誤的是:()A、修改權(quán)是隱私權(quán)利人具有的依法了解自身信息資料是否被行政主體利用的權(quán)利B、支配權(quán)是隱私權(quán)利人的基本權(quán)利之一,隱私權(quán)利人對(duì)自己的個(gè)人信息的收集、儲(chǔ)存、傳播、使用、開(kāi)放等享有支配權(quán)C、保障權(quán)是指公民有權(quán)要求政府在數(shù)據(jù)開(kāi)放的過(guò)程中保障涉及其個(gè)人隱私的信息資料不被開(kāi)放、不被濫用和不被泄露D、救濟(jì)權(quán)是公民在自身的合法權(quán)益受到侵害時(shí),按照法定程序采取法律手段維護(hù)自身權(quán)益的權(quán)利答案:A7.關(guān)于文檔數(shù)據(jù)庫(kù)的說(shuō)法,下列哪一項(xiàng)是錯(cuò)誤的:()A、數(shù)據(jù)是規(guī)則的B、性能好(高并發(fā))C、缺乏統(tǒng)一的查詢語(yǔ)法D、復(fù)雜性低答案:A8.關(guān)于推進(jìn)數(shù)據(jù)共享開(kāi)放的描述,錯(cuò)誤的是:()A、要改變政府職能部門“數(shù)據(jù)孤島”現(xiàn)象,立足于數(shù)據(jù)資源的共享互換,設(shè)定相對(duì)明確的數(shù)據(jù)標(biāo)準(zhǔn),實(shí)現(xiàn)部門之間的數(shù)據(jù)對(duì)接與共享B、要使不同省區(qū)市之間的數(shù)據(jù)實(shí)現(xiàn)對(duì)接與共享,解決數(shù)據(jù)“畫地為牢”的問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)共享共用C、在企業(yè)內(nèi)部,破除“數(shù)據(jù)孤島”,推進(jìn)數(shù)據(jù)融合D、不同企業(yè)之間,為了保護(hù)各自商業(yè)利益,不宜實(shí)現(xiàn)數(shù)據(jù)共享答案:D9.關(guān)于大數(shù)據(jù)交易在發(fā)展過(guò)程中遇到的問(wèn)題,下面描述錯(cuò)誤的是:()A、互聯(lián)網(wǎng)數(shù)據(jù)馬太效應(yīng)顯現(xiàn)B、市場(chǎng)信用體系缺失、監(jiān)管有待加強(qiáng)C、大數(shù)據(jù)交易規(guī)則和標(biāo)準(zhǔn)缺乏D、數(shù)據(jù)質(zhì)量評(píng)價(jià)與估值定價(jià)已經(jīng)很完善答案:D10.下面關(guān)于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的描述錯(cuò)誤的是:()A、機(jī)器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科B、數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中通過(guò)算法搜索隱藏于其中信息的過(guò)程。C、數(shù)據(jù)挖掘可以視為機(jī)器學(xué)習(xí)與數(shù)據(jù)庫(kù)的交叉D、數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)的底層技術(shù)答案:D11.下面關(guān)于政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放的描述,錯(cuò)誤的是:()A、政府信息公開(kāi)與政府?dāng)?shù)據(jù)開(kāi)放是一對(duì)既相互區(qū)別又相互聯(lián)系的概念B、信息是沒(méi)有經(jīng)過(guò)任何加工與解讀的原始記錄,沒(méi)有明確的含義,而數(shù)據(jù)則是經(jīng)過(guò)加工處理并被賦予一定含義的C、政府信息公開(kāi)主要是為了對(duì)公眾知情權(quán)的滿足而出現(xiàn)的D、政府?dāng)?shù)據(jù)開(kāi)放強(qiáng)調(diào)的是數(shù)據(jù)的再利用,公眾可以分享數(shù)據(jù)利用創(chuàng)造的經(jīng)濟(jì)和社會(huì)價(jià)值答案:B12.以下關(guān)于計(jì)算機(jī)視覺(jué),描述錯(cuò)誤的是:()A、計(jì)算機(jī)視覺(jué)是一門研究如何使機(jī)器“看”的科學(xué)B、是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺(jué)C、計(jì)算機(jī)視覺(jué)是一門綜合性的學(xué)科D、語(yǔ)音識(shí)別屬于計(jì)算機(jī)視覺(jué)的典型應(yīng)用答案:D13.下面關(guān)于政府?dāng)?shù)據(jù)孤島描述錯(cuò)誤的是:()A、有些政府部門錯(cuò)誤地將數(shù)據(jù)資源等同于一般資源,認(rèn)為占有就是財(cái)富,熱衷于搜集,但不愿共享B、有些部門只盯著自己的數(shù)據(jù)服務(wù)系統(tǒng),結(jié)果因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)、系統(tǒng)接口等技術(shù)原因,無(wú)法與外單位、外部門聯(lián)通C、有些地方,對(duì)大數(shù)據(jù)缺乏頂層設(shè)計(jì),導(dǎo)致各條線、各部門固有的本位主義作祟,壁壘林立,數(shù)據(jù)無(wú)法流動(dòng)D、即使涉及到工作機(jī)密、商業(yè)機(jī)密,政府也應(yīng)該毫不保留地共享數(shù)據(jù)答案:D14.下面關(guān)于關(guān)系數(shù)據(jù)庫(kù)特點(diǎn)的描述,錯(cuò)誤的是:()A、采用表格的儲(chǔ)存方式,數(shù)據(jù)以行和列的方式進(jìn)行存儲(chǔ),要讀取和查詢都十分方便B、為了規(guī)范化數(shù)據(jù)、減少重復(fù)數(shù)據(jù)以及充分利用好存儲(chǔ)空間,把數(shù)據(jù)按照最小關(guān)系表的形式進(jìn)行存儲(chǔ)C、由于關(guān)系數(shù)據(jù)庫(kù)將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)表中,數(shù)據(jù)操作的瓶頸出現(xiàn)在多張數(shù)據(jù)表的操作中,而且數(shù)據(jù)表越多這個(gè)問(wèn)題越嚴(yán)重D、關(guān)系數(shù)據(jù)庫(kù)采用非結(jié)構(gòu)化查詢語(yǔ)言來(lái)對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢答案:D15.以下哪個(gè)不是Flume的核心組件:()A、數(shù)據(jù)塊(Block)B、數(shù)據(jù)源(Source)C、數(shù)據(jù)通道(Channel)D、數(shù)據(jù)槽(Sink)答案:A16.聚類分析的常見(jiàn)應(yīng)用場(chǎng)景不包括:()A、發(fā)現(xiàn)關(guān)聯(lián)購(gòu)買行為B、目標(biāo)用戶的群體分類C、不同產(chǎn)品的價(jià)值組合D、探測(cè)發(fā)現(xiàn)離群點(diǎn)和異常值答案:A17.下列關(guān)于BigTable的描述,哪個(gè)是錯(cuò)誤的?()A、爬蟲持續(xù)不斷地抓取新頁(yè)面,這些頁(yè)面每隔一段時(shí)間地存儲(chǔ)到BigTable里B、igTable是一個(gè)分布式存儲(chǔ)系統(tǒng)C、BigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問(wèn)題D、網(wǎng)絡(luò)搜索應(yīng)用查詢建立好的索引,從BigTable得到網(wǎng)頁(yè)答案:A18.以下哪個(gè)組件是Spark中用于結(jié)構(gòu)化數(shù)據(jù)處理的組件:()A、SparkSQLB、SparkCoreC、SparkStreamingD、StructuredStreaming答案:A19.下面關(guān)于Timetoast的描述,哪個(gè)是錯(cuò)誤的?()A、Timetoast是在線創(chuàng)作基于時(shí)間軸事件記載服務(wù)的網(wǎng)站B、提供個(gè)性化的時(shí)間線服務(wù)C、Timetoast基于flash平臺(tái),可以在類似flash時(shí)間軸上任意加入事件D、Timetoast是一個(gè)提供復(fù)雜統(tǒng)計(jì)圖表的工具答案:D20.迪士尼MagicBand手環(huán),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A、我為人人,人人為我B、全樣而非抽樣C、效率而非精確相關(guān)而非因果答案:A21.下面關(guān)于網(wǎng)絡(luò)爬蟲的描述正確的是:()A、網(wǎng)絡(luò)爬蟲由控制節(jié)點(diǎn)、爬蟲節(jié)點(diǎn)和資源庫(kù)構(gòu)成B、網(wǎng)絡(luò)爬蟲中可以有多個(gè)控制節(jié)點(diǎn),每個(gè)控制節(jié)點(diǎn)下可以有多個(gè)爬蟲節(jié)點(diǎn)C、控制節(jié)點(diǎn)之間可以互相通信,控制節(jié)點(diǎn)和其下的各爬蟲節(jié)點(diǎn)之間也可以進(jìn)行互相通信D、屬于同一個(gè)控制節(jié)點(diǎn)下的各爬蟲節(jié)點(diǎn)間不可以互相通信答案:D22.假設(shè)有一個(gè)數(shù)據(jù)集X={4,8,15,21,21,24,25,28,34},這里采用基于平均值的等高分箱方法對(duì)其進(jìn)行平滑處理,則分箱處理結(jié)果是:()A、{8,8,8,22,22,22,29,29,29}B、{9,9,9,22,22,22,29,29,29}C、{9,9,9,21,21,21,29,29,29}D、{9,9,9,22,22,22,28,28,28}答案:B23.下面關(guān)于回歸分析的描述錯(cuò)誤的是:()A、是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法B、回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析C、按照因變量的多少,可分為線性回歸分析和非線性回歸分析D、在大數(shù)據(jù)分析中,回歸分析是一種預(yù)測(cè)性的建模技術(shù)答案:C24.下列關(guān)于可視化工具中高級(jí)分析工具的說(shuō)法,錯(cuò)誤的是?()A、R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件B、Weka主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形C、Gephi主要用于社交圖譜數(shù)據(jù)可視化分析,可以生成非??犰诺目梢暬瘓D形D、R通常用于大數(shù)據(jù)集的統(tǒng)計(jì)與分析答案:B25.以下關(guān)于人機(jī)交互,描述錯(cuò)誤的是:()A、人機(jī)交互是一門研究系統(tǒng)與用戶之間的交互關(guān)系的學(xué)科B、人機(jī)交互界面通常是指用戶不可見(jiàn)的部分C、系統(tǒng)可以是各種各樣的機(jī)器,也可以是計(jì)算機(jī)化的系統(tǒng)和軟件D、用戶通過(guò)人機(jī)交互界面與系統(tǒng)交流,并進(jìn)行操作答案:B26.“啤酒與尿布”的故事,體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A、我為人人,人人為我B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果答案:D27.下面關(guān)于Hadoop的描述錯(cuò)誤的是:()A、Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架B、作為并行分布式計(jì)算平臺(tái),Hadoop采用分布式存儲(chǔ)和分布式處理兩大核心技術(shù),能夠高效地處理PB級(jí)數(shù)據(jù)C、Hadoop只支持Java編程語(yǔ)言D、Hadoop可以高效穩(wěn)定地運(yùn)行在廉價(jià)的計(jì)算機(jī)集群上,可以擴(kuò)展到數(shù)以千計(jì)的計(jì)算機(jī)節(jié)點(diǎn)上答案:C28.云計(jì)算包括3種類型。只為特定用戶提供服務(wù),比如大型企業(yè)出于安全考慮自建的云環(huán)境,只為企業(yè)內(nèi)部提供服務(wù),這種云計(jì)算屬于:()A、公有云B、私有云C、混合云D、獨(dú)立云答案:B29.以下關(guān)于知識(shí)圖譜,描述錯(cuò)誤的是:()A、又稱為科學(xué)知識(shí)圖譜B、在圖書情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖C、知識(shí)圖譜屬于密碼學(xué)研究范疇D、知識(shí)圖譜可用于反欺詐、不一致性驗(yàn)證、組團(tuán)欺詐等公共安全保障領(lǐng)域答案:C30.下面屬于批處理技術(shù)的是:()A、MapReduceB、StormC、SparkStreamingD、GraphX答案:A31.下面關(guān)于大數(shù)據(jù)安全問(wèn)題,描述錯(cuò)誤的是:()A、大數(shù)據(jù)的價(jià)值并不單純地來(lái)源于它的用途,而更多地源自其二次利用B、對(duì)大數(shù)據(jù)的收集、處理、保存不當(dāng),會(huì)加劇數(shù)據(jù)信息泄露的風(fēng)險(xiǎn)C、大數(shù)據(jù)成為國(guó)家之間博弈的新戰(zhàn)場(chǎng)D、大數(shù)據(jù)對(duì)于國(guó)家安全沒(méi)有產(chǎn)生影響答案:D32.以下哪個(gè)不是Storm的特點(diǎn):()A、可擴(kuò)展性B、可靠的消息處理C、支持各種編程語(yǔ)言D、復(fù)雜的API答案:D33.以下關(guān)于分布式文件系統(tǒng),描述錯(cuò)誤的是:()A、是一種通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)文件在多臺(tái)主機(jī)上進(jìn)行分布式存儲(chǔ)的文件系統(tǒng)B、所有的分布式文件系統(tǒng)的設(shè)計(jì)都是采用“客戶機(jī)/服務(wù)器”(Client/Server)模式C、谷歌開(kāi)發(fā)了分布式文件系統(tǒng)GFSD、Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)是針對(duì)GFS的開(kāi)源實(shí)現(xiàn)答案:B34.下列哪個(gè)不屬于可視化工具?()A、GoogleChartAPIB、D3C、Visual.lyD、Spark答案:D35.下面關(guān)于數(shù)據(jù)權(quán)的描述,錯(cuò)誤的是:()A、數(shù)據(jù)權(quán)的概念發(fā)起于英國(guó),主要將其視為信息社會(huì)的一項(xiàng)基本公民權(quán)利B、數(shù)據(jù)權(quán)包括兩個(gè)方面:數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)利C、數(shù)據(jù)主權(quán)的主體是國(guó)家,是一個(gè)國(guó)家獨(dú)立自主對(duì)本國(guó)數(shù)據(jù)進(jìn)行管理和利用的權(quán)力D、數(shù)據(jù)主權(quán)的主體是公民,是相對(duì)應(yīng)于公民數(shù)據(jù)采集義務(wù)而形成的對(duì)數(shù)據(jù)利用的權(quán)利答案:D36.下面描述錯(cuò)誤的是:()A、數(shù)據(jù)挖掘的目標(biāo)明確,先做假設(shè),然后通過(guò)數(shù)據(jù)分析來(lái)驗(yàn)證假設(shè)是否正確,從而得到相應(yīng)的結(jié)論B、數(shù)據(jù)挖掘的重點(diǎn)在尋找未知的模式與規(guī)律C、數(shù)據(jù)分析一般都是得到一個(gè)指標(biāo)統(tǒng)計(jì)量結(jié)果,如總和、平均值等D、數(shù)據(jù)挖掘則是輸出模型或規(guī)則,并且可相應(yīng)得到模型得分或標(biāo)簽答案:A37.以下哪項(xiàng)不屬于大數(shù)據(jù)在城市管理中的應(yīng)用:()A、智能交通B、環(huán)保監(jiān)測(cè)C、城市規(guī)劃D、比賽預(yù)測(cè)答案:D38.下面組件哪個(gè)是負(fù)責(zé)在Hadoop和關(guān)系數(shù)據(jù)庫(kù)之間實(shí)現(xiàn)數(shù)據(jù)導(dǎo)入導(dǎo)出的:()A、MySQLB、HDFSC、SqoopD、Flume答案:C39.以下哪個(gè)步驟不屬于數(shù)據(jù)的采集與預(yù)處理:()A、利用ETL工具將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù),抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中B、利用日志采集工具把實(shí)時(shí)采集的數(shù)據(jù)作為流計(jì)算系統(tǒng)的輸入,進(jìn)行實(shí)時(shí)處理分析C、利用網(wǎng)頁(yè)爬蟲程序到互聯(lián)網(wǎng)網(wǎng)站中爬取數(shù)據(jù)D、對(duì)分析結(jié)果進(jìn)行可視化呈現(xiàn),幫助人們更好地理解數(shù)據(jù)、分析數(shù)據(jù)答案:D40.第3次信息化浪潮的標(biāo)志是:()A、個(gè)人計(jì)算機(jī)的普及B、互聯(lián)網(wǎng)的普及C、云計(jì)算、大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)的普及D、人工智能的普及答案:C41.早期的云計(jì)算產(chǎn)品AWS是由哪家企業(yè)提出的:()A、IBMB、微軟C、亞馬遜D、谷歌答案:C42.谷歌采用搜索引擎大數(shù)據(jù)進(jìn)行流感趨勢(shì)預(yù)測(cè),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A、我為人人,人人為我B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果答案:B43.下列關(guān)于數(shù)據(jù)處理流程,說(shuō)法有誤的是?()A、在傳統(tǒng)的數(shù)據(jù)處理流程中,存儲(chǔ)的數(shù)據(jù)是舊的B、在傳統(tǒng)的數(shù)據(jù)處理流程中,需要用戶主動(dòng)發(fā)出查詢來(lái)獲取結(jié)果C、傳統(tǒng)的數(shù)據(jù)處理流程,需要先采集數(shù)據(jù)并存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)等數(shù)據(jù)管理系統(tǒng)中D、流計(jì)算的處理流程一般包含三個(gè)階段:數(shù)據(jù)實(shí)時(shí)采集、數(shù)據(jù)批量計(jì)算、實(shí)時(shí)查詢服務(wù)答案:D44.下面哪個(gè)屬于圖數(shù)據(jù)庫(kù):()A、Neo4jB、MySQLC、HBaseD、Oracle答案:A45.假設(shè)屬性的最大值和最小值分別是87000元和11000元,現(xiàn)在需要利用Min-Max規(guī)范化方法,將“顧客收入”屬性的值映射到0~1的范圍內(nèi),則“顧客收入”屬性的值為72400元時(shí),對(duì)應(yīng)的轉(zhuǎn)換結(jié)果是:()A、0.808B、0.837C、0.769D、0.987答案:A46.下面組件哪個(gè)是數(shù)據(jù)挖掘庫(kù):()A、ZookeeperB、MahoutC、MySQLD、HBase答案:B47.下面描述錯(cuò)誤的是:()A、“探針盒子”就是一款自動(dòng)收集用戶隱私的產(chǎn)品B、許多顧客在使用WiFi之后會(huì)收到大量的廣告信息,甚至自己的手機(jī)號(hào)碼也會(huì)被當(dāng)做信息進(jìn)行多次買賣C、在免費(fèi)上網(wǎng)的背后,其實(shí)也存在著不小的信息安全風(fēng)險(xiǎn),或許一不小心,就落入了電腦黑客們?cè)O(shè)計(jì)的WiFi陷阱之中D、免費(fèi)WIFI都是安全的,可以放心使用答案:D48.下面關(guān)于Flink的描述錯(cuò)誤的是:()A、Flink是一個(gè)針對(duì)流數(shù)據(jù)和批數(shù)據(jù)的分布式計(jì)算框架B、Flink的設(shè)計(jì)思想主要來(lái)源于Hadoop、MPP數(shù)據(jù)庫(kù)、流計(jì)算系統(tǒng)等C、Flink主要是由Python代碼實(shí)現(xiàn)的D、Flink所要處理的主要場(chǎng)景是流數(shù)據(jù),批數(shù)據(jù)只是流數(shù)據(jù)的一個(gè)特例而已答案:C49.下面關(guān)于機(jī)械思維的核心思想,描述錯(cuò)誤的是:()A、世界變化的規(guī)律是確定的B、世界變化的規(guī)律是無(wú)法確定的C、規(guī)律不僅是可以被認(rèn)識(shí)的,而且可以用簡(jiǎn)單的公式或者語(yǔ)言描述清楚D、這些規(guī)律應(yīng)該是放之四海而皆準(zhǔn)的,可以應(yīng)用到各種未知領(lǐng)域指導(dǎo)實(shí)踐答案:B50.下面描述錯(cuò)誤的是:()A、數(shù)據(jù)分析可以分為廣義的數(shù)據(jù)分析和狹義的數(shù)據(jù)分析B、廣義的數(shù)據(jù)分析就包括狹義的數(shù)據(jù)分析和數(shù)據(jù)挖掘。C、數(shù)據(jù)挖掘就是指狹義的數(shù)據(jù)分析D、數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中挖掘出未知的、且有價(jià)值的信息和知識(shí)的過(guò)程答案:C51.云計(jì)算包括3種類型。面向所有用戶提供服務(wù),只要是注冊(cè)付費(fèi)的用戶都可以使用,這種云計(jì)算屬于:()A、公有云B、私有云C、混合云D、獨(dú)立云答案:A52.下面哪個(gè)不是Hadoop生態(tài)系統(tǒng)的組件:()A、HDFSB、SQLServerC、MapReduceD、HBase答案:B53.下面關(guān)于網(wǎng)絡(luò)爬蟲的描述錯(cuò)誤的是:()A、網(wǎng)絡(luò)爬蟲是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序B、為搜索引擎從萬(wàn)維網(wǎng)上下載網(wǎng)頁(yè),是搜索引擎的重要組成部分C、爬蟲從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件D、網(wǎng)絡(luò)爬蟲的行為和人們?cè)L問(wèn)網(wǎng)站的行為是完全不同的答案:D54.目前大數(shù)據(jù)交易市場(chǎng)上存在很多種定價(jià)機(jī)制,但是不包括以下哪項(xiàng):()A、平臺(tái)預(yù)定價(jià)B、自動(dòng)計(jì)價(jià)C、拍賣式定價(jià)D、隨機(jī)性定價(jià)答案:D55.下列關(guān)于列族數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:()A、查找速度慢,可擴(kuò)展性差B、功能較少,大都不支持強(qiáng)事務(wù)一致性C、容易進(jìn)行分布式擴(kuò)展D、復(fù)雜性低答案:A56.下面組件哪個(gè)是負(fù)責(zé)日志收集的:()A、mbariB、ZookeeperC、HDFSD、Flume答案:D57.以下哪個(gè)組件是Spark中的機(jī)器學(xué)習(xí)算法庫(kù):()A、MLlibB、SparkCoreC、MachineLeaningD、SparkSQL答案:A58.關(guān)于數(shù)據(jù)倉(cāng)庫(kù)Impala的描述錯(cuò)誤的是:()A、Impala作為開(kāi)源大數(shù)據(jù)分析引擎,支持實(shí)時(shí)計(jì)算,它提供了與Hive類似的功能,并在性能上比Hive高出3~30倍B、Impala是由Cloudera公司開(kāi)發(fā)的查詢系統(tǒng)C、Impala提供了SQL語(yǔ)義,能查詢存儲(chǔ)在Hadoop的HDFS和HBase上的PB級(jí)別海量數(shù)據(jù)D、Impala最初是參照MySQL系統(tǒng)進(jìn)行設(shè)計(jì)的答案:D59.下面關(guān)于反爬機(jī)制描述錯(cuò)誤的是:()A、簡(jiǎn)單低級(jí)的網(wǎng)絡(luò)爬蟲,數(shù)據(jù)采集速度快,偽裝度低,如果沒(méi)有反爬機(jī)制,它們可以很快地抓取大量數(shù)據(jù),甚至因?yàn)檎?qǐng)求過(guò)多,造成網(wǎng)站服務(wù)器不能正常工作,影響了企業(yè)的業(yè)務(wù)開(kāi)展B、反爬機(jī)制也是一把雙刃劍,一方面可以保護(hù)企業(yè)網(wǎng)站和網(wǎng)站數(shù)據(jù),但是,另一方面,如果反爬機(jī)制過(guò)于嚴(yán)格,可能會(huì)誤傷到真正的用戶請(qǐng)求C、如果既要和“網(wǎng)絡(luò)爬蟲”死磕,又要保證很低的誤傷率,那么又會(huì)增加網(wǎng)站研發(fā)的成本D、反爬機(jī)制不利于信息的自由流通,不利于網(wǎng)站發(fā)展,應(yīng)該堅(jiān)決取消答案:D60.下面屬于查詢分析計(jì)算技術(shù)的是:()A、SparkStreamingB、StormC、HiveD、Pregel答案:C61.以下哪項(xiàng)不屬于數(shù)據(jù)清洗的內(nèi)容:()A、一致性檢查B、精確度校驗(yàn)C、無(wú)效值和缺失值的處理D、成對(duì)刪除答案:B62.下列哪一個(gè)不屬于云數(shù)據(jù)庫(kù)產(chǎn)品?()A、本地安裝MySQLB、阿里云RDSC、OracleCloudD、百度云數(shù)據(jù)庫(kù)答案:A63.以下關(guān)于NoSQL數(shù)據(jù)庫(kù)描述錯(cuò)誤的是:()A、NoSQL是一種不同于關(guān)系數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)設(shè)計(jì)方式,是對(duì)非關(guān)系型數(shù)據(jù)庫(kù)的統(tǒng)稱B、NoSQL所采用的數(shù)據(jù)模型并非傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的關(guān)系模型,而是類似鍵/值、列族、文檔等非關(guān)系模型C、NoSQL數(shù)據(jù)庫(kù)有固定的表結(jié)構(gòu),通常存在較多連接操作D、與關(guān)系數(shù)據(jù)庫(kù)相比,NoSQL具有靈活的水平可擴(kuò)展性,可以支持海量數(shù)據(jù)存儲(chǔ)答案:C64.Shark與SparkSQL的關(guān)系是:()A、二者沒(méi)有任何關(guān)系B、Shark是SparkSQL的前身C、SparkSQL是Shark的前身D、二者是一個(gè)軟件的兩個(gè)不同名稱,本質(zhì)上是一個(gè)東西答案:B65.英國(guó)的大數(shù)據(jù)發(fā)展戰(zhàn)略是:()A、穩(wěn)步實(shí)施“三步走”戰(zhàn)略,打造面向未來(lái)的大數(shù)據(jù)創(chuàng)新生態(tài)B、通過(guò)發(fā)展創(chuàng)新性解決方案并應(yīng)用于實(shí)踐來(lái)促進(jìn)大數(shù)據(jù)發(fā)展C、以大數(shù)據(jù)等技術(shù)為核心應(yīng)對(duì)第四次工業(yè)革命D、緊抓大數(shù)據(jù)產(chǎn)業(yè)機(jī)遇,應(yīng)對(duì)脫歐后的經(jīng)濟(jì)挑戰(zhàn)答案:D66.下列關(guān)于云數(shù)據(jù)庫(kù)的描述,哪個(gè)是錯(cuò)誤的?()A、云數(shù)據(jù)庫(kù)是部署和虛擬化在云計(jì)算環(huán)境中的數(shù)據(jù)庫(kù)B、云數(shù)據(jù)庫(kù)是在云計(jì)算的大背景下發(fā)展起來(lái)的一種新興的共享基礎(chǔ)架構(gòu)的方法C、云數(shù)據(jù)庫(kù)價(jià)格不菲,維護(hù)費(fèi)用極其昂貴D、云數(shù)據(jù)庫(kù)具有高可擴(kuò)展性、高可用性、采用多租形式和支持資源有效分發(fā)等特點(diǎn)答案:C67.下面組件哪個(gè)是負(fù)責(zé)分布式資源調(diào)度與管理的:()A、YARNB、FlumeC、ZookeeperD、Kafka答案:A68.下面關(guān)于手機(jī)軟件采集個(gè)人信息的描述錯(cuò)誤的是:()A、在我們的日常生活中,部分手機(jī)APP往往會(huì)“私自竊密”B、有的APP在提供服務(wù)時(shí),采取特殊方式來(lái)獲得用戶授權(quán),這本質(zhì)上仍屬“未經(jīng)同意”C、在微信朋友圈廣泛傳播的各種測(cè)試小程序是安全的,不會(huì)竊取用戶個(gè)人信息D、手機(jī)APP過(guò)度采集個(gè)人信息呈現(xiàn)普遍趨勢(shì),最突出的是在非必要的情況下獲取位置信息和訪問(wèn)聯(lián)系人權(quán)限答案:C69.以下推薦方法中,哪一個(gè)是基于內(nèi)容的推薦:()A、由資深的專業(yè)人士來(lái)進(jìn)行物品的篩選和推薦B、基于統(tǒng)計(jì)信息進(jìn)行推薦C、通過(guò)機(jī)器學(xué)習(xí)的方法去描述內(nèi)容的特征,并基于內(nèi)容的特征來(lái)發(fā)現(xiàn)與之相似的內(nèi)容D、對(duì)多種推薦算法進(jìn)行有機(jī)組合,然后給出推薦結(jié)果答案:C70.下列哪一項(xiàng)不屬于NoSQL的四大類型:()A、文檔數(shù)據(jù)庫(kù)B、圖數(shù)據(jù)庫(kù)C、列族數(shù)據(jù)庫(kù)D、時(shí)間戳數(shù)據(jù)庫(kù)答案:D71.下列關(guān)于鍵值數(shù)據(jù)庫(kù)的描述,哪一項(xiàng)是錯(cuò)誤的:()A、擴(kuò)展性好,靈活性好B、大量寫操作時(shí)性能高C、無(wú)法存儲(chǔ)結(jié)構(gòu)化信息D、條件查詢效率高答案:D72.以下哪個(gè)不是典型的分類方法:()A、決策樹(shù)B、樸素貝葉斯C、K-MeansD、人工神經(jīng)網(wǎng)絡(luò)答案:C73.下面關(guān)于數(shù)據(jù)的說(shuō)法,錯(cuò)誤的是:()A、數(shù)據(jù)的根本價(jià)值在于可以為人們找出答案B、數(shù)據(jù)的價(jià)值會(huì)因?yàn)椴粩嗍褂枚鳒pC、數(shù)據(jù)的價(jià)值會(huì)因?yàn)椴粩嘀亟M而產(chǎn)生更大的價(jià)值D、目前階段,數(shù)據(jù)的產(chǎn)生不以人的意志為轉(zhuǎn)移答案:B74.以下哪個(gè)不是大數(shù)據(jù)的“4V”特性:()A、數(shù)據(jù)量大B、數(shù)據(jù)類型繁多C、處理速度快D、價(jià)值密度高答案:D75.以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的區(qū)別,描述錯(cuò)誤的是:()A、大數(shù)據(jù)側(cè)重于對(duì)海量數(shù)據(jù)的存儲(chǔ)、處理與分析,從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活B、云計(jì)算本質(zhì)上旨在整合和優(yōu)化各種IT資源并通過(guò)網(wǎng)絡(luò)以服務(wù)的方式,廉價(jià)地提供給用戶C、云計(jì)算旨在從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值,服務(wù)于生產(chǎn)和生活D、物聯(lián)網(wǎng)的發(fā)展目標(biāo)是實(shí)現(xiàn)物物相連,應(yīng)用創(chuàng)新是物聯(lián)網(wǎng)發(fā)展的核心答案:C76.下列關(guān)于MapReduce模型的描述,錯(cuò)誤的是哪一項(xiàng)?()A、MapReduce采用“分而治之”策略B、MapReduce設(shè)計(jì)的一個(gè)理念就是“計(jì)算向數(shù)據(jù)靠攏”C、MapReduce框架采用了Master/Slave架構(gòu)D、MapReduce應(yīng)用程序只能用Java來(lái)寫答案:D77.下面哪一個(gè)不屬于大數(shù)據(jù)倫理問(wèn)題:()A、隱私泄露問(wèn)題B、數(shù)據(jù)安全問(wèn)題C、數(shù)字鴻溝問(wèn)題D、數(shù)據(jù)冗余問(wèn)題答案:D78.大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效,體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A、以數(shù)據(jù)為中心B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果答案:A79.下面關(guān)于大數(shù)據(jù)倫理的描述,錯(cuò)誤的是:()A、大數(shù)據(jù)倫理屬于科技倫理的范疇B、大數(shù)據(jù)倫理問(wèn)題是指由于大數(shù)據(jù)技術(shù)的產(chǎn)生和使用而引發(fā)的社會(huì)問(wèn)題C、作為一種新的技術(shù),大數(shù)據(jù)技術(shù)像其他所有技術(shù)一樣,其本身是無(wú)所謂好壞的,而它的“善”與“惡”全然在于對(duì)大數(shù)據(jù)技術(shù)的使用者D、大數(shù)據(jù)技術(shù)本身就存在“善”和“惡”的區(qū)分答案:D80.下列說(shuō)法錯(cuò)誤的是?()A、大數(shù)據(jù)魔鏡是一款優(yōu)秀的國(guó)產(chǎn)數(shù)據(jù)分析軟件,可以讓用戶真正理解探索分析數(shù)據(jù)B、Tableau是桌面系統(tǒng)中最簡(jiǎn)單的商業(yè)智能工具軟件,是一個(gè)用于網(wǎng)頁(yè)作圖、生成互動(dòng)圖形的JavaScript函數(shù)庫(kù)C、GoogleFusionTables讓一般使用者也可以輕松制作出專業(yè)的統(tǒng)計(jì)地圖D、ModestMaps是一個(gè)小型、可擴(kuò)展、交互式的免費(fèi)庫(kù),提供了一套查看衛(wèi)星地圖的API答案:B81.關(guān)于大數(shù)據(jù)與區(qū)塊鏈的聯(lián)系,下面描述錯(cuò)誤的是:()A、區(qū)塊鏈?zhǔn)勾髷?shù)據(jù)極大降低信用成本B、區(qū)塊鏈?zhǔn)菢?gòu)建大數(shù)據(jù)時(shí)代的信任基石C、區(qū)塊鏈?zhǔn)谴龠M(jìn)大數(shù)據(jù)價(jià)值流通的管道D、區(qū)塊鏈會(huì)提升大數(shù)據(jù)的信用成本答案:D82.下面關(guān)于推薦系統(tǒng)的描述錯(cuò)誤的是:()A、推薦系統(tǒng)是自動(dòng)聯(lián)系用戶和物品的一種工具B、和搜索引擎相比,推薦系統(tǒng)通過(guò)研究用戶的興趣偏好,進(jìn)行個(gè)性化計(jì)算C、推薦系統(tǒng)可發(fā)現(xiàn)用戶的興趣點(diǎn),幫助用戶從海量信息中去發(fā)掘自己潛在的需求D、推薦系統(tǒng)是一種只能通過(guò)專家進(jìn)行人工推薦的系統(tǒng)答案:D83.假設(shè)屬性的取值范圍是-957~924,當(dāng)屬性的值為426時(shí),采用小數(shù)定標(biāo)規(guī)范化方法對(duì)應(yīng)的轉(zhuǎn)換結(jié)果是:()A、0.421B、0.433C、0.426D、0.489答案:C84.以下關(guān)于機(jī)器學(xué)習(xí),描述錯(cuò)誤的是:()A、是一門涉及統(tǒng)計(jì)學(xué)、系統(tǒng)辨識(shí)、逼近理論、神經(jīng)網(wǎng)絡(luò)、優(yōu)化理論、計(jì)算機(jī)科學(xué)、腦科學(xué)等諸多領(lǐng)域的交叉學(xué)科B、研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能C、機(jī)器學(xué)習(xí)強(qiáng)調(diào)三個(gè)關(guān)鍵詞:算法、模型、訓(xùn)練D、基于數(shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代智能技術(shù)中的重要方法之一答案:C85.下面關(guān)于棱鏡門事件描述錯(cuò)誤的是:()A、棱鏡計(jì)劃(PRISM)是一項(xiàng)由美國(guó)國(guó)家安全局(NSA)自2007年起開(kāi)始實(shí)施的絕密電子監(jiān)聽(tīng)計(jì)劃B、在該計(jì)劃中,美國(guó)國(guó)家安全局和聯(lián)邦調(diào)查局利用平臺(tái)和技術(shù)上的優(yōu)勢(shì),開(kāi)展全球范圍內(nèi)的監(jiān)聽(tīng)活動(dòng)C、該計(jì)劃的目的是為了促進(jìn)世界和平與發(fā)展D、該計(jì)劃對(duì)全世界重點(diǎn)地區(qū)、部門、公司甚至個(gè)人進(jìn)行布控答案:C86.我們?cè)谑褂弥悄苁謾C(jī)進(jìn)行導(dǎo)航來(lái)避開(kāi)城市擁堵路段時(shí),體現(xiàn)了哪種大數(shù)據(jù)思維方式:()A、我為人人,人人為我B、全樣而非抽樣C、效率而非精確D、相關(guān)而非因果答案:A87.以下哪個(gè)不是Scrapy體系架構(gòu)的組成部分:()A、Scrapy引擎(Engine)B、爬蟲(Spiders)C、支持者(Support)D、下載器(Downloader)答案:C88.下列關(guān)于數(shù)據(jù)可視化的描述,哪個(gè)是錯(cuò)誤的?()A、數(shù)據(jù)可視化是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示B、利用數(shù)據(jù)分析和開(kāi)發(fā)工具發(fā)現(xiàn)其中未知信息的處理過(guò)程C、數(shù)據(jù)可視化技術(shù)的基本思想是將數(shù)據(jù)庫(kù)中每一個(gè)數(shù)據(jù)項(xiàng)作為單個(gè)圖元素表示D、將數(shù)據(jù)的各個(gè)屬性值以一維數(shù)據(jù)的形式表示答案:D89.現(xiàn)在的互聯(lián)網(wǎng),基于大數(shù)據(jù)和人工智能的推薦應(yīng)用越來(lái)越多,越來(lái)越深入,我們一直被“喂食著”經(jīng)過(guò)智能化篩選推薦的信息,久而久之,會(huì)導(dǎo)致什么問(wèn)題:()A、信息繭房問(wèn)題B、隱形偏差問(wèn)題C、大數(shù)據(jù)殺熟問(wèn)題D、隱私泄露問(wèn)題答案:A90.下面關(guān)于Spark和Hadoop的關(guān)系,描述錯(cuò)誤的是:()A、Spark和Hadoop一樣,既包含了存儲(chǔ)的組件,也包含了計(jì)算的組件B、Spark作為計(jì)算框架,只能解決數(shù)據(jù)計(jì)算問(wèn)題,無(wú)法解決數(shù)據(jù)存儲(chǔ)問(wèn)題C、Spark只是取代了Hadoop生態(tài)系統(tǒng)中的計(jì)算框架MapReduce,而Hadoop中的其他組件依然在企業(yè)大數(shù)據(jù)系統(tǒng)中發(fā)揮著重要的作用D、越來(lái)越多的企業(yè)放棄MapReduce,轉(zhuǎn)而使用Spark開(kāi)發(fā)企業(yè)應(yīng)用答案:D91.下面關(guān)于協(xié)同過(guò)濾算法的描述錯(cuò)誤的是:()A、基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱UserCF算法)是推薦系統(tǒng)中最古老的算法,可以說(shuō),UserCF的誕生標(biāo)志著推薦系統(tǒng)的誕生B、基于物品的協(xié)同過(guò)濾算法(簡(jiǎn)稱ItemCF算法)是目前業(yè)界應(yīng)用最多的算法C、基于模型的協(xié)同過(guò)濾算法(ModelCF)是通過(guò)已經(jīng)觀察到的所有用戶給產(chǎn)品的打分,來(lái)推斷每個(gè)用戶的喜好并向用戶推薦適合的產(chǎn)品D、UserCF算法是給目標(biāo)用戶推薦那些和他們之前喜歡的物品相似的物品。答案:D92.以下哪項(xiàng)不屬于傳統(tǒng)的數(shù)據(jù)存儲(chǔ)和管理技術(shù):()A、NoSQL數(shù)據(jù)庫(kù)B、文件系統(tǒng)C、關(guān)系數(shù)據(jù)庫(kù)D、數(shù)據(jù)倉(cāng)庫(kù)答案:A93.假設(shè)A班級(jí)的平均分是80,標(biāo)準(zhǔn)差是10,A考了90分;B班的平均分是400,標(biāo)準(zhǔn)差是100,B考了600分。采用Z-Score規(guī)范化以后,二者誰(shuí)的成績(jī)更加優(yōu)秀:()A、的成績(jī)更為優(yōu)秀B、的成績(jī)更為優(yōu)秀C、二者一樣優(yōu)秀D、無(wú)法比較答案:B94.以下哪項(xiàng)不屬于大數(shù)據(jù)在零售領(lǐng)域的應(yīng)用:()A、大數(shù)據(jù)征信B、發(fā)現(xiàn)關(guān)聯(lián)購(gòu)物行為C、客戶群體劃分D、供應(yīng)鏈管理答案:A95.下面屬于流計(jì)算技術(shù)的是:()A、SparkMLLibB、GraphXC、S4D、Hive答案:C96.下面關(guān)于SparkStreaming和Storm的描述錯(cuò)誤的是:()A、SparkStreaming可以實(shí)現(xiàn)毫秒級(jí)的流計(jì)算B、Storm可以實(shí)現(xiàn)毫秒級(jí)響應(yīng)C、SparkStreaming構(gòu)建在SparkCore之上D、SparkStreaming可以同時(shí)兼容批量和實(shí)時(shí)數(shù)據(jù)處理的邏輯和算法答案:A97.在數(shù)據(jù)庫(kù)的發(fā)展歷史上,先后出現(xiàn)過(guò)多種數(shù)據(jù)庫(kù)類型,但是,不包括:()A、網(wǎng)狀數(shù)據(jù)庫(kù)B、球形數(shù)據(jù)庫(kù)C、層次數(shù)據(jù)庫(kù)D、關(guān)系數(shù)據(jù)庫(kù)答案:B98.下面關(guān)于NewSQL數(shù)據(jù)庫(kù)的描述,錯(cuò)誤的是:()A、NewSQL數(shù)據(jù)庫(kù)保持了傳統(tǒng)數(shù)據(jù)庫(kù)支持ACID和SQL等特性B、不同的NewSQL數(shù)據(jù)庫(kù)的內(nèi)部結(jié)構(gòu)基本相同C、都支持關(guān)系數(shù)據(jù)模型D、都使用SQL作為其主要的接口答案:B99.以下描述錯(cuò)誤的是:()A、傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)可以較好地支持結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和管理B、Web2.0的迅猛發(fā)展以及大數(shù)據(jù)時(shí)代的到來(lái),使關(guān)系數(shù)據(jù)庫(kù)的發(fā)展越來(lái)越力不從心C、傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)由于數(shù)據(jù)模型不靈活、水平擴(kuò)展能力較差等局限性,已經(jīng)無(wú)法滿足各種類型的非結(jié)構(gòu)化數(shù)據(jù)的大規(guī)模存儲(chǔ)需求D、傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)引以為豪的一些關(guān)鍵特性,如事務(wù)機(jī)制和支持復(fù)雜查詢,在Web2.0時(shí)代成為不可或缺的核心特性答案:D100.下面屬于圖計(jì)算技術(shù)的是:()A、PregelB、DremelC、ImpalaD、Stream答案:A101.物聯(lián)網(wǎng)的發(fā)展最終導(dǎo)致了人類社會(huì)數(shù)據(jù)量的第三次躍升,使得數(shù)據(jù)產(chǎn)生方式進(jìn)入了:()A、手工創(chuàng)建階段B、運(yùn)營(yíng)式系統(tǒng)階段C、用戶原創(chuàng)內(nèi)容階段D、感知式系統(tǒng)階段答案:D102.下面關(guān)于TensorFlow和TensorFlowOnSpark的描述錯(cuò)誤的是:()A、TensorFlow是一個(gè)采用數(shù)據(jù)流圖(DataFlowGraph)、用于數(shù)值計(jì)算的開(kāi)源軟件庫(kù)B、TensorFlow是一個(gè)開(kāi)源的、基于Java的機(jī)器學(xué)習(xí)框架C、TensorFlowOnSpark項(xiàng)目是由Yahoo開(kāi)源的一個(gè)軟件包,能將TensorFlow與Spark結(jié)合在一起使用D、TensorFlowOnSpark為ApacheHadoop和ApacheSpark集群帶來(lái)可擴(kuò)展的深度學(xué)習(xí)功能答案:B多選題1.數(shù)據(jù)倉(cāng)庫(kù)的特性包括:()A、面向主題的B、集成的C、相對(duì)穩(wěn)定的D、反映歷史變化的答案:ABCD2.信息科技為大數(shù)據(jù)時(shí)代提供技術(shù)支撐,主要體現(xiàn)在哪三個(gè)方面:()A、存儲(chǔ)設(shè)備容量不斷增加B、CPU處理能力大幅提升C、量子計(jì)算機(jī)全面普及D、網(wǎng)絡(luò)帶寬不斷增加答案:ABD3.數(shù)據(jù)脫敏的主要原則包括:()A、保持原有數(shù)據(jù)特征B、保持?jǐn)?shù)據(jù)之間的一致性C、保持業(yè)務(wù)規(guī)則的關(guān)聯(lián)性D、多次脫敏之間的數(shù)據(jù)一致性答案:ABCD4.區(qū)塊鏈的三要素是:()A、交易B、區(qū)塊C、鏈D、比特幣答案:ABC5.數(shù)據(jù)的類型主要包括:()A、文本B、圖片C、音頻D、視頻答案:ABCD6.下面關(guān)于大數(shù)據(jù)處理與分析的描述,正確的是:()A、在理論層面,數(shù)據(jù)分析需要統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等知識(shí)B、在技術(shù)層面,包括單機(jī)分析工具(比如SPSS、SAS等)或單機(jī)編程語(yǔ)言(比如Python、R),以及大數(shù)據(jù)處理與分析技術(shù)(比如MapReduce、Spark、Hive等)C、在大數(shù)據(jù)時(shí)代到來(lái)之前,數(shù)據(jù)分析主要以小規(guī)模的抽樣數(shù)據(jù)為主,一般使用單機(jī)分析工具(比如SPSS和SAS)或者單機(jī)編程(比如Python、R)的方式來(lái)實(shí)現(xiàn)分析程序D、到了大數(shù)據(jù)時(shí)代,數(shù)據(jù)量爆炸式地增長(zhǎng),數(shù)據(jù)分析就需要采用分布式實(shí)現(xiàn)技術(shù),比如使用MapReduce、Spark或Flink編寫分布式分析程序,借助于集群的多臺(tái)機(jī)器進(jìn)行并行數(shù)據(jù)處理分析答案:ABCD7.在比特幣區(qū)塊鏈中關(guān)于如何爭(zhēng)奪記賬權(quán)的問(wèn)題,下面描述正確的是:()A、采用的是POW機(jī)制,也就是“工作量證明機(jī)制”B、記賬節(jié)點(diǎn)通過(guò)計(jì)算數(shù)學(xué)題,來(lái)爭(zhēng)奪記賬權(quán)C、對(duì)于數(shù)學(xué)公式的計(jì)算,除了從零開(kāi)始遍歷隨機(jī)數(shù)碰運(yùn)氣以外,沒(méi)有其他辦法D、解題的過(guò)程,又叫“挖礦”,記賬節(jié)點(diǎn)被稱為礦工。誰(shuí)先解對(duì),誰(shuí)就獲得記賬權(quán)答案:ABCD8.下面關(guān)于MapReduce工作流程的描述,正確的是:()A、一個(gè)大的MapReduce作業(yè),會(huì)被拆分成許多個(gè)Map任務(wù)在多臺(tái)機(jī)器上并行執(zhí)行B、每個(gè)Map任務(wù)通常運(yùn)行在數(shù)據(jù)存儲(chǔ)的節(jié)點(diǎn)上C、當(dāng)Map任務(wù)結(jié)束后,會(huì)生成以<key,value-list>形式表示的許多中間結(jié)果D、Reduce任務(wù)會(huì)對(duì)中間結(jié)果進(jìn)行匯總計(jì)算得到最后結(jié)果答案:ABD9.大數(shù)據(jù)交易平臺(tái)的類型主要包括哪兩種:()A、綜合數(shù)據(jù)服務(wù)平臺(tái)B、實(shí)時(shí)數(shù)據(jù)交易平時(shí)C、零散數(shù)據(jù)交易平臺(tái)D、第三方數(shù)據(jù)交易平臺(tái)答案:AD10.以下關(guān)于大數(shù)據(jù)與人工智能的聯(lián)系,描述正確的是:()A、人工智能需要數(shù)據(jù)來(lái)建立其智能,特別是機(jī)器學(xué)習(xí)B、人工智能應(yīng)用的數(shù)據(jù)越多,其獲得的結(jié)果就越準(zhǔn)確C、大數(shù)據(jù)為人工智能提供了海量的數(shù)據(jù),使得人工智能技術(shù)有了長(zhǎng)足的發(fā)展D、大數(shù)據(jù)技術(shù)為人工智能提供了強(qiáng)大的存儲(chǔ)能力和計(jì)算能力答案:ABCD11.常見(jiàn)的關(guān)聯(lián)規(guī)則挖掘算法包括:()A、MP-Growth算法B、FP-Growth算法C、Apriori算法D、Bpriori算法答案:BC12.Kafka的架構(gòu)包括哪些組件:()A、話題(Topic)B、生產(chǎn)者(Producer)C、服務(wù)代理(Broker)D、消費(fèi)者(Consumer)答案:ABCD13.舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中明確指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是思維方式的3種轉(zhuǎn)變,具體包括:()A、全樣而非抽樣B、效率而非精確C、相關(guān)而非因果D、務(wù)實(shí)而非務(wù)虛答案:ABC14.大數(shù)據(jù)安全表現(xiàn)出與傳統(tǒng)數(shù)據(jù)安全不同的特征,具體來(lái)說(shuō)包括哪幾個(gè)方面:()A、大數(shù)據(jù)成為網(wǎng)絡(luò)攻擊的顯著目標(biāo)B、大數(shù)據(jù)加大隱私泄露風(fēng)險(xiǎn)C、大數(shù)據(jù)技術(shù)被應(yīng)用到攻擊手段中D、大數(shù)據(jù)成為高級(jí)可持續(xù)攻擊(APT)的載體答案:ABCD15.下面關(guān)于GoogleSpanner的描述正確的是:()A、Spanner是一個(gè)可擴(kuò)展的、全球分布式的數(shù)據(jù)庫(kù)B、在最高抽象層面,Spanner就是一個(gè)數(shù)據(jù)庫(kù),把數(shù)據(jù)分片存儲(chǔ)在許多Paxos狀態(tài)機(jī)上,這些機(jī)器位于遍布全球的數(shù)據(jù)中心內(nèi)C、隨著數(shù)據(jù)的變化和服務(wù)器的變化,Spanner會(huì)自動(dòng)把數(shù)據(jù)進(jìn)行重新分片,從而有效應(yīng)對(duì)負(fù)載變化和處理失敗D、Spanner被設(shè)計(jì)成可以擴(kuò)展到幾百萬(wàn)個(gè)機(jī)器節(jié)點(diǎn),跨越成百上千個(gè)數(shù)據(jù)中心,具備幾萬(wàn)億數(shù)據(jù)庫(kù)行的規(guī)模答案:ABCD16.一次BSP計(jì)算過(guò)程包括一系列全局超步(超步就是指計(jì)算中的一次迭代),每個(gè)超步主要包括哪幾個(gè)組件:()A、局部計(jì)算B、中間計(jì)算C、通信D、柵欄同步答案:ACD17.查詢分析系統(tǒng)Dremel的特點(diǎn)主要包括:()A、Dremel是一個(gè)面向小規(guī)模數(shù)據(jù)的、穩(wěn)定的系統(tǒng)B、Dremel的數(shù)據(jù)模型是嵌套的C、Dremel中的數(shù)據(jù)是用行式存儲(chǔ)的D、remel結(jié)合了Web搜索和并行DBMS的技術(shù)答案:BD18.下列關(guān)于圖數(shù)據(jù)庫(kù)的描述,哪些是正確的?()A、專門用于處理具有高度相互關(guān)聯(lián)關(guān)系的數(shù)據(jù)B、比較適合于社交網(wǎng)絡(luò)、模式識(shí)別、依賴分析、推薦系統(tǒng)以及路徑尋找等問(wèn)題C、靈活性高,支持復(fù)雜的圖算法D、復(fù)雜性高,只能支持一定的數(shù)據(jù)規(guī)模答案:ABCD19.大數(shù)據(jù)交易平臺(tái)的運(yùn)營(yíng)模式主要包括哪兩種:()A、具有交易實(shí)時(shí)顯示功能的交易平臺(tái)B、兼具中介和數(shù)據(jù)處理加工功能的交易平臺(tái)C、只具備中介功能的交易平臺(tái)D、只具備數(shù)據(jù)處理加工功能的交易平臺(tái)答案:BC20.Hive的系統(tǒng)架構(gòu)主要包括哪幾個(gè)模塊:()A、探查模塊B、驅(qū)動(dòng)模塊C、元數(shù)據(jù)存儲(chǔ)模塊D、用戶接口模塊答案:BCD21.下面關(guān)于數(shù)據(jù)獨(dú)裁的描述,正確的是:()A、所謂的“數(shù)據(jù)獨(dú)裁”是指在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)量的爆炸式增長(zhǎng),導(dǎo)致做出判斷和選擇的難度徒增,迫使人們必須完全依賴數(shù)據(jù)的預(yù)測(cè)和結(jié)論才能做出最終的決策B、從某個(gè)角度來(lái)講,數(shù)據(jù)獨(dú)裁就是讓數(shù)據(jù)統(tǒng)治人類,使人類徹底走向唯數(shù)據(jù)主義C、數(shù)據(jù)獨(dú)裁最終將導(dǎo)致人類思維被“空心化”,進(jìn)而是創(chuàng)新意識(shí)的喪失D、數(shù)據(jù)獨(dú)裁還可能使人們喪失了人的自主意識(shí)、反思和批判的能力,最終淪為數(shù)據(jù)的奴隸答案:ABCD22.人類自古以來(lái)在科學(xué)研究上先后歷經(jīng)了哪幾種范式:()A、實(shí)驗(yàn)科學(xué)B、理論科學(xué)C、計(jì)算科學(xué)D、數(shù)據(jù)密集型科學(xué)答案:ABCD23.消除數(shù)據(jù)孤島對(duì)于政府具有哪些重要的意義:()A、有助于提升資源利用率B、有助于推動(dòng)政府轉(zhuǎn)型C、有助于提高行政效率D、有助于促進(jìn)跨部門合作答案:ABCD24.以下關(guān)于大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)的聯(lián)系,描述正確的是:()A、從整體上看,大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)這三者是相輔相成的B、大數(shù)據(jù)根植于云計(jì)算,大數(shù)據(jù)分析的很多技術(shù)都來(lái)自于云計(jì)算C、大數(shù)據(jù)為云計(jì)算提供了“用武之地”D、物聯(lián)網(wǎng)需要借助于云計(jì)算和大數(shù)據(jù)技術(shù),實(shí)現(xiàn)物聯(lián)網(wǎng)大數(shù)據(jù)的存儲(chǔ)、分析和處理答案:ABCD25.云計(jì)算包括哪3種類型:()A、公有云B、獨(dú)立云C、私有云D、混合云答案:ACD26.數(shù)據(jù)脫敏的方法主要包括:()A、數(shù)據(jù)替換B、無(wú)效化C、隨機(jī)化D、偏移和取整答案:ABCD27.HBase的系統(tǒng)架構(gòu)包括哪幾個(gè)組成部分:()A、客戶端B、Zookeeper服務(wù)器C、Master主服務(wù)器D、Region服務(wù)器答案:ABCD28.一個(gè)完整的推薦系統(tǒng)通常包括哪3個(gè)組成模塊:()A、用戶建模模塊B、推薦對(duì)象建模模塊C、推薦算法模塊D、可視化模塊答案:ABC29.傳統(tǒng)的IT資源獲取方式的主要缺點(diǎn)是:()A、初期成本高,建設(shè)周期長(zhǎng)B、后期需要自己維護(hù),使用成本高C、IT資源供應(yīng)量有限D(zhuǎn)、IT資源供應(yīng)量無(wú)限答案:ABC30.Spark的集群部署方式包括:()A、SparkonMesos模式B、SparkonYARN模式C、SparkonKubernetes模式D、Local模式答案:ABC31.一個(gè)典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)通常包含哪幾個(gè)組成部分:()A、數(shù)據(jù)源B、數(shù)據(jù)存儲(chǔ)和管理C、OLAP服務(wù)器D、前端工具和應(yīng)用答案:ABCD32.傳統(tǒng)的數(shù)據(jù)安全的威脅主要包括:()A、計(jì)算機(jī)病毒B、黑客攻擊C、數(shù)據(jù)信息存儲(chǔ)介質(zhì)的損壞D、數(shù)據(jù)復(fù)制答案:ABC33.Hive底層所依賴的計(jì)算引擎可以是:()A、FlinkB、MapReduceC、TezD、Spark答案:BCD34.智慧醫(yī)療具有哪些優(yōu)點(diǎn):()A、促進(jìn)優(yōu)質(zhì)醫(yī)療資源的共享B、避免患者重復(fù)檢查C、促進(jìn)醫(yī)療智能化D、有助于實(shí)現(xiàn)全民免費(fèi)醫(yī)療答案:ABCD35.下面關(guān)于RDD的描述正確的是:()A、一個(gè)RDD就是一個(gè)分布式對(duì)象集合B、一個(gè)RDD本質(zhì)上是一個(gè)只讀的分區(qū)記錄集合C、RDD提供了一組豐富的操作以支持常見(jiàn)的數(shù)據(jù)運(yùn)算,分為“行動(dòng)”(Action)和“轉(zhuǎn)換”(Transformation)兩種類型D、RDD不適合對(duì)于數(shù)據(jù)集中元素執(zhí)行相同操作的批處理式應(yīng)用,而比較適合用于需要異步、細(xì)粒度狀態(tài)的應(yīng)用答案:ABC36.關(guān)于“大數(shù)據(jù)摩爾定律”,以下說(shuō)法正確的是:()A、人類社會(huì)產(chǎn)生的數(shù)據(jù)一直都在以每年50%的速度增長(zhǎng)B、人類社會(huì)的數(shù)據(jù)量大約每?jī)赡昃驮黾右槐禖、人類在最近兩年產(chǎn)生的數(shù)據(jù)量相當(dāng)于之前產(chǎn)生的全部數(shù)據(jù)量之和D、人類社會(huì)的數(shù)據(jù)量以每年10%的速度增長(zhǎng)答案:ABC37.數(shù)據(jù)采集的主要數(shù)據(jù)源包括:()A、傳感器數(shù)據(jù)B、互聯(lián)網(wǎng)數(shù)據(jù)C、日志文件D、企業(yè)業(yè)務(wù)系統(tǒng)數(shù)據(jù)答案:ABCD38.數(shù)據(jù)分析主要實(shí)現(xiàn)哪三大作用:()A、誤差分析B、現(xiàn)狀分析C、原因分析D、預(yù)測(cè)分析答案:BCD39.大數(shù)據(jù)處理分析技術(shù)主要包括哪幾種類型:()A、批處理計(jì)算B、流計(jì)算C、圖計(jì)算D、查詢分析計(jì)算答案:ABCD40.Hadoop的MapReduce的缺點(diǎn)包括:()A、表達(dá)能力有限B、磁盤IO開(kāi)銷大C、延遲高D、中間結(jié)果多答案:ABC41.Flink系統(tǒng)主要由哪兩個(gè)組件組成:()A、JobManagerB、TaskManagerC、JobTrackerD、TaskTracker答案:AB42.下面關(guān)于HDFS的體系結(jié)構(gòu)描述正確的是:()A、HDFS采用了主從(Master/Slave)結(jié)構(gòu)模型,一個(gè)HDFS集群包括一個(gè)名稱節(jié)點(diǎn)和若干個(gè)數(shù)據(jù)節(jié)點(diǎn)B、名稱節(jié)點(diǎn)作為中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的命名空間及客戶端對(duì)文件的訪問(wèn)C、集群中的數(shù)據(jù)節(jié)點(diǎn)一般是一個(gè)節(jié)點(diǎn)運(yùn)行一個(gè)數(shù)據(jù)節(jié)點(diǎn)進(jìn)程,負(fù)責(zé)處理文件系統(tǒng)客戶端的讀/寫請(qǐng)求D、名稱節(jié)點(diǎn)會(huì)周期性地向數(shù)據(jù)節(jié)點(diǎn)發(fā)送“心跳”信息,報(bào)告自己的狀態(tài)答案:ABC43.智能物流具有哪幾個(gè)方面的重要作用:()A、提高物流的信息化和智能化水平B、降低物流成本和提高物流效率C、提高物流活動(dòng)的一體化D、提高了物流的復(fù)雜性答案:ABC44.StructuredStreaming包括哪兩種處理模型:()A、微批處理B、高階處理C、分層處理D、持續(xù)處理答案:AD45.下面關(guān)于大數(shù)據(jù)編程框架Beam的描述正確的是:()A、Beam是由微軟公司貢獻(xiàn)的Apache頂級(jí)項(xiàng)目B、eam的目標(biāo)是為開(kāi)發(fā)者提供一個(gè)易于使用、卻又很強(qiáng)大的數(shù)據(jù)并行處理模型,能夠支持流處理和批處理C、Beam是一個(gè)開(kāi)源的統(tǒng)一的編程模型,開(kāi)發(fā)者可以使用BeamSDK來(lái)創(chuàng)建數(shù)據(jù)處理管道,然后,這些程序可以在任何支持的執(zhí)行引擎上運(yùn)行D、BeamSDK定義了開(kāi)發(fā)分布式數(shù)據(jù)處理任務(wù)業(yè)務(wù)邏輯的API接口,即提供一個(gè)統(tǒng)一的編程接口給到上層應(yīng)用的開(kāi)發(fā)者答案:BCD46.Spark的特點(diǎn)主要包括:()A、運(yùn)行速度快B、容易使用C、通用性D、運(yùn)行模式單一答案:ABC47.網(wǎng)絡(luò)爬蟲的類型主要包括:()A、通用網(wǎng)絡(luò)爬蟲B、聚焦網(wǎng)絡(luò)爬蟲C、增量式網(wǎng)絡(luò)爬蟲D、深層網(wǎng)絡(luò)爬蟲答案:ABCD48.云計(jì)算包括哪3種典型的服務(wù)模式:()A、IaaS(基礎(chǔ)設(shè)施即服務(wù))B、PaaS(平臺(tái)即服務(wù))C、MaaS(機(jī)器即服務(wù))D、SaaS(軟件即服務(wù))答案:ABD49.實(shí)現(xiàn)數(shù)據(jù)共享,在政府層面面臨的挑戰(zhàn)包括:()A、不愿共享開(kāi)放B、不敢共享開(kāi)放C、不會(huì)共享開(kāi)放D、數(shù)據(jù)中心共享開(kāi)放作用不強(qiáng)答案:ABCD50.HDFS的局限性包括:()A、不適合低延遲數(shù)據(jù)訪問(wèn)B、無(wú)法用于大規(guī)模數(shù)據(jù)存儲(chǔ)C、無(wú)法高效存儲(chǔ)大量小文件D、不支持多用戶寫入及任意修改文件答案:ACD51.下面關(guān)于并行數(shù)據(jù)庫(kù)的描述正確的是:()A、并行數(shù)據(jù)庫(kù)是指那些在無(wú)共享的體系結(jié)構(gòu)中進(jìn)行數(shù)據(jù)操作的數(shù)據(jù)庫(kù)系統(tǒng)B、大部分采用了關(guān)系數(shù)據(jù)模型并且支持SQL語(yǔ)句查詢C、并行數(shù)據(jù)庫(kù)系統(tǒng)具有較好的彈性D、并行數(shù)據(jù)庫(kù)的另一個(gè)問(wèn)題就是系統(tǒng)的容錯(cuò)性較差答案:ABD52.在實(shí)際應(yīng)用中,大數(shù)據(jù)處理主要包括哪幾種類型:()A、復(fù)雜的批量數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)十分鐘到數(shù)小時(shí)之間B、基于歷史數(shù)據(jù)的交互式查詢:時(shí)間跨度通常在數(shù)十秒到數(shù)分鐘之間C、基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理:時(shí)間跨度通常在數(shù)百毫秒到數(shù)秒之間D、基于歷史數(shù)據(jù)的流查詢:時(shí)間跨度在數(shù)十秒到數(shù)分鐘之間答案:ABC53.企業(yè)數(shù)據(jù)孤島產(chǎn)生的原因主要包括哪兩個(gè)方面:()A、以功能為標(biāo)準(zhǔn)的部門劃分導(dǎo)致數(shù)據(jù)孤島B、不同類型、不同版本的信息化管理系統(tǒng)導(dǎo)致數(shù)據(jù)孤島C、機(jī)構(gòu)設(shè)置不合理D、各個(gè)部門責(zé)權(quán)利不清晰答案:AB54.數(shù)據(jù)挖掘主要側(cè)重解決哪幾類問(wèn)題:()A、分類B、聚類C、關(guān)聯(lián)D、預(yù)測(cè)答案:ABCD55.關(guān)于政府?dāng)?shù)據(jù)開(kāi)放的意義,下面描述正確的是:()A、政府開(kāi)放數(shù)據(jù)有利于促進(jìn)開(kāi)放透明政府的形成B、政府開(kāi)放數(shù)據(jù)有利于創(chuàng)新創(chuàng)業(yè)和經(jīng)濟(jì)增長(zhǎng)C、政府開(kāi)放數(shù)據(jù)有利于社會(huì)治理創(chuàng)新D、政府開(kāi)放數(shù)據(jù)將會(huì)對(duì)政府正常運(yùn)作產(chǎn)生威脅答案:ABC56.SparkMLlib主要提供了哪幾個(gè)方面的工具:()A、算法工具B、特征化工具C、流水線D、實(shí)用工具答案:ABCD57.Hadoop的特性主要包括:()A、高可靠性B、高可擴(kuò)展性C、高容錯(cuò)性D、成本高答案:ABC58.下面關(guān)于SparkSQL的描述正確的是:()A、SparkSQL在Hive兼容層面僅依賴HiveQL解析和Hive元數(shù)據(jù)B、SparkSQL目前支持Scala、Java編程語(yǔ)言,暫時(shí)不支持Python語(yǔ)言C、SparkSQL執(zhí)行計(jì)劃生成和優(yōu)化都由Catalyst(函數(shù)式關(guān)系查詢優(yōu)化框架)負(fù)責(zé)D、SparkSQL增加了DataFrame(即帶有Schema信息的RDD),使用戶可以在SparkSQL中執(zhí)行SQL語(yǔ)句答案:ACD59.實(shí)現(xiàn)數(shù)據(jù)共享,在企業(yè)層面面臨的挑戰(zhàn)包括:()A、系統(tǒng)孤島挑戰(zhàn)B、組織架構(gòu)挑戰(zhàn)C、數(shù)據(jù)合作挑戰(zhàn)D、利潤(rùn)風(fēng)險(xiǎn)挑戰(zhàn)答案:ABC60.典型的數(shù)據(jù)采集方法包括:()A、系統(tǒng)日志采集B、分布式消息訂閱分發(fā)C、ETLD、網(wǎng)絡(luò)數(shù)據(jù)采集答案:ABCD61.需要清洗的數(shù)據(jù)的主要類型包括:()A、殘缺數(shù)據(jù)B、干凈數(shù)據(jù)C、錯(cuò)誤數(shù)據(jù)D、重復(fù)數(shù)據(jù)答案:ACD62.大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用主要包括:()A、高頻交易B、市場(chǎng)情緒分析C、信貸風(fēng)險(xiǎn)分析D、大數(shù)據(jù)征信答案:ABCD63.大數(shù)據(jù)產(chǎn)業(yè)是指一切與支撐大數(shù)據(jù)組織管理和價(jià)值發(fā)現(xiàn)相關(guān)的企業(yè)經(jīng)濟(jì)活動(dòng)的集合。以下哪些屬于大數(shù)據(jù)產(chǎn)業(yè)的某個(gè)環(huán)節(jié)():A、IT基礎(chǔ)設(shè)施層B、數(shù)據(jù)源層C、數(shù)據(jù)管理層D、數(shù)據(jù)分析層答案:ABCD64.比特幣要解決的兩個(gè)核心問(wèn)題是:()A、防篡改B、防丟失C、防貶值D、去中心化記賬答案:AD65.關(guān)于Hive與Hadoop生態(tài)系統(tǒng)中其他組件的關(guān)系,下面描述正確的是:()A、HDFS作為高可靠的底層存儲(chǔ),用來(lái)存儲(chǔ)海量數(shù)據(jù)B、MapReduce對(duì)這些海量數(shù)據(jù)進(jìn)行批處理,實(shí)現(xiàn)高性能計(jì)算C、用HiveQL語(yǔ)句編寫的處理邏輯,最終都要轉(zhuǎn)化為MapReduce任務(wù)來(lái)運(yùn)行D、Hive的目標(biāo)是取代HBase答案:ABC66.為了讓數(shù)據(jù)變得可用,需要對(duì)數(shù)據(jù)進(jìn)行三個(gè)步驟的處理,分別是:()A、數(shù)據(jù)清洗B、數(shù)據(jù)抽樣C、數(shù)據(jù)管理D、數(shù)據(jù)分析答案:ACD67.下面關(guān)于智能物流的描述,正確的是:A、又稱智慧物流,是利用智能化技術(shù),使物流系統(tǒng)能模仿人的智能,具有思維、感知、學(xué)習(xí)、推理判斷和自行解決物流中某些問(wèn)題的能力B、可以幫助實(shí)現(xiàn)物流資源優(yōu)化調(diào)度和有效配置,并且提升物流系統(tǒng)效率C、智能物流概念源自2010年IBM發(fā)布的研究報(bào)告《智慧的未來(lái)供應(yīng)鏈》D、智能物流概念經(jīng)歷了自動(dòng)化、信息化、網(wǎng)絡(luò)化3個(gè)發(fā)展階段答案:ABCD68.下面關(guān)于Storm框架設(shè)計(jì)描述正確的是:()A、Storm運(yùn)行在分布式集群中,其運(yùn)行任務(wù)的方式與Hadoop類似B、在Hadoop上運(yùn)行的是MapReduce作業(yè),而在Storm上運(yùn)行的是“Topology”C、Storm集群采用P2P架構(gòu)D、Storm采用了Zookeeper來(lái)作為分布式協(xié)調(diào)組件答案:ABD69.下面關(guān)于Flink的描述正確的是:()A、Flink和Spark一樣,都是基于磁盤的計(jì)算框架B、當(dāng)全部運(yùn)行在HadoopYARN之上時(shí),F(xiàn)link的性能甚至還要略好于SparkC、Flink的流計(jì)算性能和Storm差不多,可以支持毫秒級(jí)的響應(yīng)D、Spark的市場(chǎng)影響力和社區(qū)活躍度明顯超過(guò)Flink答案:BCD70.信息圖表是信息、數(shù)據(jù)、知識(shí)等的視覺(jué)化表達(dá),下列哪個(gè)說(shuō)法正確?()A、谷歌公司的制圖服務(wù)接口GoogleChartAPI,可以用來(lái)為統(tǒng)計(jì)數(shù)據(jù)并自動(dòng)生成圖片B、D3是最流行的可視化庫(kù)之一,是一個(gè)用于網(wǎng)頁(yè)作圖、生成互動(dòng)圖形的JavaScript函數(shù)庫(kù)C、ECharts是由百度公司前端數(shù)據(jù)可視化團(tuán)隊(duì)研發(fā)的圖表庫(kù),可以流暢地運(yùn)行在PC和移動(dòng)設(shè)備上D、大數(shù)據(jù)魔鏡是一款優(yōu)秀的國(guó)產(chǎn)數(shù)據(jù)分析軟件,它豐富的數(shù)據(jù)公式和算法可以讓用戶真正理解探索分析數(shù)據(jù)答案:ABCD71.下面關(guān)于數(shù)據(jù)分析與數(shù)據(jù)處理的描述,正確的是:()A、數(shù)據(jù)分析過(guò)程通常會(huì)伴隨著發(fā)生數(shù)據(jù)處理(或者說(shuō)伴隨著大量數(shù)據(jù)計(jì)算)B、數(shù)據(jù)分析和數(shù)據(jù)處理不存在緊密的關(guān)聯(lián)關(guān)系C、二者是融合在一起的,很難割裂開(kāi)來(lái)D、當(dāng)用戶在進(jìn)行數(shù)據(jù)分析的時(shí)候,底層的計(jì)算機(jī)系統(tǒng)會(huì)根據(jù)數(shù)據(jù)分析任務(wù)的要求,使用程序進(jìn)行大量的數(shù)據(jù)處理答案:ACD72.人類社會(huì)的數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了哪三個(gè)階段:()A、手工生產(chǎn)階段B、運(yùn)營(yíng)式系統(tǒng)階段C、用戶原創(chuàng)內(nèi)容階段D、感知式系統(tǒng)階段答案:BCD73.數(shù)據(jù)采集的三大要點(diǎn)是:()A、全面性B、多維性C、高效性D、精確性答案:ABC74.因數(shù)據(jù)而產(chǎn)生的壟斷問(wèn)題,主要包括哪幾種類型:()A、數(shù)據(jù)可能造成進(jìn)入壁壘或擴(kuò)張壁壘B、擁有大數(shù)據(jù)形成市場(chǎng)支配地位并濫用C、因數(shù)據(jù)產(chǎn)品而形成市場(chǎng)支配地位并濫用D、涉及數(shù)據(jù)方面的壟斷協(xié)議答案:ABCD75.交易產(chǎn)品的類型主要包括哪幾種:()A、PIB、數(shù)據(jù)包C、云服務(wù)D、解決方案答案:ABCD76.下面關(guān)于比特幣和區(qū)塊鏈之間關(guān)系的描述,正確的是:()A、比特幣和區(qū)塊鏈沒(méi)有任何關(guān)系B、區(qū)塊鏈?zhǔn)潜忍貛诺牡讓蛹夹g(shù)C、比特幣是區(qū)塊鏈的一種應(yīng)用D、比特幣是比區(qū)塊鏈更先進(jìn)的一種技術(shù)答案:BC77.云計(jì)算的主要優(yōu)點(diǎn)是:()A、初期投入大,需要用戶自己維護(hù)B、初期零成本,瞬時(shí)可獲得C、后期免維護(hù),使用成本低D、在供應(yīng)IT資源量方面“予取予求”答案:BCD78.協(xié)同過(guò)濾主要包括:()A、基于用戶的協(xié)同過(guò)濾B、基于物品的協(xié)同過(guò)濾C、基于模型的協(xié)同過(guò)濾D、基于分類的協(xié)同過(guò)濾答案:ABC79.下面關(guān)于隱私泄露問(wèn)題的描述,正確的是:()A、大數(shù)據(jù)時(shí)代下的隱私與傳統(tǒng)隱私的最大區(qū)別在于隱私的數(shù)據(jù)化,即隱私主要以“個(gè)人數(shù)據(jù)”的形式出現(xiàn)B、用戶在使用搜索引擎時(shí),搜索引擎可以精確地刻畫出該用戶的“數(shù)字肖像”C、通過(guò)數(shù)據(jù)預(yù)測(cè),可以預(yù)測(cè)個(gè)體“未來(lái)的隱私”D、“數(shù)據(jù)痕跡”往往永遠(yuǎn)無(wú)法徹底消除,會(huì)被永久保留記錄答案:ABCD80.消除數(shù)據(jù)孤島對(duì)于企業(yè)具有哪些重要的意義:()A、有助于企業(yè)做出有利于生產(chǎn)要素組合優(yōu)化的決策,使企業(yè)能夠合理配置資源,實(shí)現(xiàn)企業(yè)利益最大化B、有利于企業(yè)獲得更好的經(jīng)營(yíng)發(fā)展能力C、企業(yè)信息的增多可以增加做出正確選擇的能力,從而提高經(jīng)濟(jì)效率D、不利于企業(yè)長(zhǎng)遠(yuǎn)的發(fā)展答案:ABC81.Spark相對(duì)于MapReduce的優(yōu)點(diǎn)包括:()A、Spark的計(jì)算模式也屬于MapReduce,但不局限于Map和Reduce操作,還提供了多種數(shù)據(jù)集操作類型,編程模型比MapReduce更靈活B、Spark提供了內(nèi)存計(jì)算,中間結(jié)果直接放到內(nèi)存中,帶來(lái)了更高的迭代運(yùn)算效率C、Spark同時(shí)提供了存儲(chǔ)功能,而MapReduce不支持存儲(chǔ)D、Spark基于DAG的任務(wù)調(diào)度執(zhí)行機(jī)制,要優(yōu)于MapReduce的迭代執(zhí)行機(jī)制答案:ABD82.從技術(shù)架構(gòu)上看,物聯(lián)網(wǎng)主要包括哪幾層:()A、感知層B、網(wǎng)絡(luò)層C、處理層D、應(yīng)用層答案:ABCD83.常用的規(guī)范化處理方法包括:()A、Min-Max規(guī)范化B、Z-Score規(guī)范化C、曲面規(guī)范化D、小數(shù)定標(biāo)規(guī)范化答案:ABD84.下面關(guān)于搜索引擎“點(diǎn)擊模型”的描述正確的是:()A、隨著數(shù)據(jù)量的積累,點(diǎn)擊模型對(duì)搜索結(jié)果排名的預(yù)測(cè)越來(lái)越準(zhǔn)確,它的重要性也越來(lái)越大B、點(diǎn)擊模型的準(zhǔn)確性取決于數(shù)據(jù)量的大小C、一個(gè)搜索引擎使用的時(shí)間越長(zhǎng),數(shù)據(jù)的積累就越充分,對(duì)于長(zhǎng)尾搜索就做得越準(zhǔn)確D、當(dāng)整個(gè)搜索行業(yè)都意識(shí)到點(diǎn)擊數(shù)據(jù)的重要性后,這個(gè)市場(chǎng)上的競(jìng)爭(zhēng)就從技術(shù)競(jìng)爭(zhēng)變成了數(shù)據(jù)競(jìng)爭(zhēng)答案:ABCD85.計(jì)算機(jī)系統(tǒng)中的數(shù)據(jù)組織形式主要有兩種,分別是:()A、文件B、視頻C、音頻D、數(shù)據(jù)庫(kù)答案:AD86.大數(shù)據(jù)將會(huì)對(duì)社會(huì)發(fā)展產(chǎn)生深遠(yuǎn)的影響,具體表現(xiàn)在以下哪幾個(gè)方面:()A、大數(shù)據(jù)決策成為一種新的決策方式B、大數(shù)據(jù)成為提升國(guó)家治理能力的新途徑C、大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合D、大數(shù)據(jù)開(kāi)發(fā)推動(dòng)新技術(shù)和新應(yīng)用的不斷涌現(xiàn)答案:ABCD87.關(guān)于StructuredStreaming、SparkSQL、SparkStreaming,下面描述正確的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國(guó)民用航空飛行學(xué)院《漢語(yǔ)方言學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州理工職業(yè)學(xué)院《公路施工組織與概預(yù)算》2023-2024學(xué)年第一學(xué)期期末試卷
- 小學(xué)物品領(lǐng)用制度
- 浙江傳媒學(xué)院《建筑技術(shù)的設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 漳州城市職業(yè)學(xué)院《攝影技術(shù)與訓(xùn)練》2023-2024學(xué)年第一學(xué)期期末試卷
- 缺陷管理與生產(chǎn)效率提升措施
- 雙十二家居設(shè)計(jì)解析
- 專業(yè)基礎(chǔ)-房地產(chǎn)經(jīng)紀(jì)人《專業(yè)基礎(chǔ)》點(diǎn)睛提分卷1
- 房地產(chǎn)經(jīng)紀(jì)綜合能力-《房地產(chǎn)經(jīng)濟(jì)綜合能力》押題密卷
- 家長(zhǎng)會(huì)學(xué)生發(fā)言稿 馬曉麗
- GB/T 24474.1-2020乘運(yùn)質(zhì)量測(cè)量第1部分:電梯
- GB/T 12684-2006工業(yè)硼化物分析方法
- 定崗定編定員實(shí)施方案(一)
- 高血壓患者用藥的注意事項(xiàng)講義課件
- 特種作業(yè)安全監(jiān)護(hù)人員培訓(xùn)課件
- (完整)第15章-合成生物學(xué)ppt
- 太平洋戰(zhàn)爭(zhēng)課件
- 封條模板A4打印版
- T∕CGCC 7-2017 焙烤食品用糖漿
- 貨代操作流程及規(guī)范
- 常暗之廂(7規(guī)則-簡(jiǎn)體修正)
評(píng)論
0/150
提交評(píng)論