版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
2/2復(fù)習(xí)題一當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)是由(C)首先提出的。A:微軟B:百度C:谷歌D:阿里巴巴(D)反映數(shù)據(jù)的精細化程度,越細化的數(shù)據(jù),價值越高。A:規(guī)模B:活性C:關(guān)聯(lián)度D:顆粒度數(shù)據(jù)清洗的方法不包括(D)。A:缺失值處理B:噪聲數(shù)據(jù)清除C:一致性檢查D:重復(fù)數(shù)據(jù)記錄處理智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了(D)的數(shù)據(jù)采集技術(shù)的應(yīng)用。A:統(tǒng)計報表B:網(wǎng)絡(luò)爬蟲C:API接口D:傳感器下列關(guān)于數(shù)據(jù)重組的說法中,錯誤的是(A)。A:數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B:數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C:數(shù)據(jù)重組實現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D:數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的(B)。A:在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B:在分析方法上更注重相關(guān)分析而不是因果分析C:在分析效果上更追究效率而不是絕對精確D:在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)在數(shù)據(jù)生命周期管理實踐中,(B)是執(zhí)行方法。A:數(shù)據(jù)存儲和備份規(guī)范B:數(shù)據(jù)管理和維護C:數(shù)據(jù)價值發(fā)覺和利用D:數(shù)據(jù)應(yīng)用開發(fā)和管理下列關(guān)于網(wǎng)絡(luò)用戶行為的說法中,錯誤的是(C)。A:網(wǎng)絡(luò)公司能夠捕捉到用戶在其網(wǎng)站上的所有行為B:用戶離散的交互痕跡能夠為企業(yè)提升服務(wù)質(zhì)量提供參考C:數(shù)字軌跡用完即自動刪除D:用戶的隱私安全很難得以規(guī)范保護下列國家的大數(shù)據(jù)發(fā)展行動中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國家是(D)。A:美國B:日本C:中國D:韓國萬維網(wǎng)之父是(C)。A:彼得·德魯克B:舍恩伯格C:蒂姆·伯納斯-李D:斯科特·布朗MacOS系統(tǒng)的開發(fā)者是(C)。A:微軟公司B:惠普公司C:蘋果公司D:IBM公司大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是(D)。A:數(shù)據(jù)收集B:數(shù)據(jù)存儲C:數(shù)據(jù)分析D:數(shù)據(jù)再利用下列關(guān)于數(shù)據(jù)交易市場的說法中,錯誤的是(C)。A:數(shù)據(jù)交易市場是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展到一定程度的產(chǎn)物B:商業(yè)化的數(shù)據(jù)交易活動催生了多方參與的第三方數(shù)據(jù)交易市場C:數(shù)據(jù)交易市場通過生產(chǎn)數(shù)據(jù)、研發(fā)和分析數(shù)據(jù),為數(shù)據(jù)交易提供幫助D:數(shù)據(jù)交易市場是大數(shù)據(jù)資源化的必然產(chǎn)物數(shù)據(jù)倉庫的最終目的是(D)。A:收集業(yè)務(wù)需求B:建立數(shù)據(jù)倉庫邏輯模型C:開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析D:為用戶和業(yè)務(wù)部門提供決策支持支撐大數(shù)據(jù)業(yè)務(wù)的基礎(chǔ)是(B)。A:數(shù)據(jù)科學(xué)B:數(shù)據(jù)應(yīng)用C:數(shù)據(jù)硬件D:數(shù)據(jù)人才scala中valpa=(40,"Foo")如果要訪問40,正確的訪問語句是(B)A.pa._0B.pa._1C.pa._2D.pa._scala中importjava.util.{HashMap=>_,_}是(B)A.引入java.util包內(nèi)的HashMapB.引入java.util包內(nèi)除了HashMap之外的所有成員C.引入java.awt包內(nèi)所有成員且把引入的成員變?yōu)楹瘮?shù)D.引入java.awt包內(nèi)的所有返回值是HashMap的函數(shù)Worker是(B)A.主節(jié)點B.從節(jié)點C.執(zhí)行器D.上下文scala反編譯后是(D)A.C語言B.C++C.JAVAD.字節(jié)碼文件以下對hive操作描述不正確的是(D)A.Hive是在數(shù)據(jù)查詢時進行模式驗證,而不是加載的時候驗證B.數(shù)據(jù)加載時,overwrite關(guān)鍵字不是必須的C.hive的內(nèi)表和外表都可以修改location屬性D.刪除表時,表中的數(shù)據(jù)可以同時刪除掉在網(wǎng)絡(luò)爬蟲的爬行策略中,應(yīng)用最為基礎(chǔ)的是(AB)。A:深度優(yōu)先遍歷策略B:廣度優(yōu)先遍歷策略C:高度優(yōu)先遍歷策略D:反向鏈接策略當(dāng)前,大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的特點是(AC)。A:規(guī)模較大B:規(guī)模較小C:增速很快D:增速緩慢下列關(guān)于數(shù)據(jù)生命周期管理的核心認(rèn)識中,正確的是(ABC)。A:數(shù)據(jù)從產(chǎn)生到被刪除銷毀的過程中,具有多個不同的數(shù)據(jù)存在階段B:在不同的數(shù)據(jù)存在階段,數(shù)據(jù)的價值是不同的C:根據(jù)數(shù)據(jù)價值的不同應(yīng)該對數(shù)據(jù)采取不同的管理策略D:數(shù)據(jù)生命周期管理旨在產(chǎn)生效益的同時,降低生產(chǎn)成本下列關(guān)于基于大數(shù)據(jù)的營銷模式和傳統(tǒng)營銷模式的說法中,錯誤的是(AB)。A:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式投入更小B:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式針對性更強C:傳統(tǒng)營銷模式比基于大數(shù)據(jù)的營銷模式轉(zhuǎn)化率低D:基于大數(shù)據(jù)的營銷模式比傳統(tǒng)營銷模式實時性更強下列關(guān)于臟數(shù)據(jù)的說法中,正確的是(ABCD)。A:格式不規(guī)范B:編碼不統(tǒng)一C:意義不明確D:與實際業(yè)務(wù)關(guān)系不大數(shù)據(jù)再利用的意義在于(ABC)。A:挖掘數(shù)據(jù)的潛在價值B:實現(xiàn)數(shù)據(jù)重組的創(chuàng)新價值C:利用數(shù)據(jù)可擴展性拓寬業(yè)務(wù)領(lǐng)域D:優(yōu)化存儲設(shè)備,降低設(shè)備成本按照涉及自變量的多少,可以將回歸分析分為(CD)。A:線性回歸分析B:非線性回歸分析C:一元回歸分析D:多元回歸分析傳統(tǒng)數(shù)據(jù)密集型行業(yè)積極探索和布局大數(shù)據(jù)應(yīng)用的表現(xiàn)是(BC)。A:投資入股互聯(lián)網(wǎng)電商行業(yè)B:打通多源跨域數(shù)據(jù)C:提高分析挖掘能力D:自行開發(fā)數(shù)據(jù)產(chǎn)品大數(shù)據(jù)人才整體上需要具備(AB)等核心知識。A:數(shù)學(xué)與統(tǒng)計知識B:計算機相關(guān)知識C:馬克思主義哲學(xué)知識D:市場運營管理知識下列關(guān)于大數(shù)據(jù)的說法中,錯誤的是(AD)。A:大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時效性強的特征B:處理大數(shù)據(jù)需采用新型計算架構(gòu)和智能算法等新技術(shù)C:大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D:大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析在噪聲數(shù)據(jù)中,波動數(shù)據(jù)比離群點數(shù)據(jù)偏離整體水平更大。(F)對于大數(shù)據(jù)而言,最基本、最重要的要求就是減少錯誤、保證質(zhì)量。因此,大數(shù)據(jù)收集的信息量要盡量精確。(F)一般而言,分布式數(shù)據(jù)庫是指物理上分散在不同地點,但在邏輯上是統(tǒng)一的數(shù)據(jù)庫。因此分布式數(shù)據(jù)庫具有物理上的獨立性、邏輯上的一體性、性能上的可擴展性等特點。(T)“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。(T)政府2.0、政府3.0,與政府以后的治理改革和服務(wù)型政府建設(shè)的目標(biāo)是完全不一致的。(F)大數(shù)據(jù)能幫助教師改進教學(xué)。利用大數(shù)據(jù)方法,教師通過學(xué)生反饋回來的作業(yè),就可以發(fā)現(xiàn)到底是哪些學(xué)生并沒有真正聽懂,進而有針對性地加以輔導(dǎo)。(T)治理理論認(rèn)為,現(xiàn)代社會的發(fā)展必然要求公共服務(wù)多元化的供給。(T)習(xí)近平總書記指出,網(wǎng)信事業(yè)代表著新的生產(chǎn)力、新的發(fā)展方向,應(yīng)該也能夠在踐行新發(fā)展理念上先行一步。(T)根據(jù)涂子沛先生所講,因為數(shù)據(jù)的內(nèi)涵發(fā)生了改變,計算的內(nèi)涵也發(fā)生了改變。(T)大數(shù)據(jù)的思維會把原來銷售的概念變成服務(wù)的概念。(T)Hadoop中RecordReader的作用是什么?(1)以怎樣的方式從分片中讀取一條記錄,每讀取一條記錄都會調(diào)用RecordReader類;(2)系統(tǒng)默認(rèn)的RecordReader是LineRecordReader(3)LineRecordReader是用每行的偏移量作為map的key,每行的內(nèi)容作為map的value;(4)應(yīng)用場景:自定義讀取每一條記錄的方式;自定義讀入key的類型,如希望讀取的key是文件的路徑或名字而不是該行在文件中的偏移量。有可能使Hadoop任務(wù)輸出到多個目錄中么?如果可以,怎么做?1)可以輸出到多個目錄中,采用自定義OutputFormat。2)實現(xiàn)步驟:(1)自定義outputformat,(2)改寫recordwriter,具體改寫輸出數(shù)據(jù)的方法write()論述大數(shù)據(jù)開發(fā)與大數(shù)據(jù)平臺開發(fā)各自含義及特點首先,大數(shù)據(jù)開發(fā)通常指的是基于大數(shù)據(jù)產(chǎn)業(yè)鏈的一系列開發(fā)任務(wù),涉及到大數(shù)據(jù)平臺開發(fā)、大數(shù)據(jù)應(yīng)用開發(fā)、大數(shù)據(jù)分析等,另外還包括數(shù)據(jù)采集產(chǎn)品的開發(fā)、數(shù)據(jù)整理產(chǎn)品的開發(fā)等等,如果向上延伸的話,部分大數(shù)據(jù)開發(fā)任務(wù)與人工智能開發(fā)任務(wù)也具有密切的聯(lián)系。大數(shù)據(jù)平臺開發(fā)通常有兩層含義:一層是進行大數(shù)據(jù)平臺自身的開發(fā),這屬于研發(fā)級開發(fā)任務(wù),比如大數(shù)據(jù)平臺Hadoop就是采用Java語言開發(fā)的。整個大數(shù)據(jù)平臺還涉及到一系列產(chǎn)品,包括HBase、Hive、Avro、Zookeeper、Pig、Mahout、Cassandra等,開發(fā)這些產(chǎn)品也需要一個龐大的團隊。進行大數(shù)據(jù)平臺研發(fā)的程序員往往需要具備豐富的開發(fā)經(jīng)驗,同時具備較強的研發(fā)能力,能夠搭建出一個穩(wěn)定的分布式計算體系。另一層含義是在大數(shù)據(jù)平臺下進行應(yīng)用開發(fā),比如在Hadoop、Spark平臺下進行具體的大數(shù)據(jù)應(yīng)用開發(fā)等,這部分開發(fā)通常屬于應(yīng)用級開發(fā),難度要相對小一些,但是往往需要與具體的場景進行緊密的聯(lián)系,需要開發(fā)者具備一定的行業(yè)背景知識。目前大數(shù)據(jù)應(yīng)用開發(fā)主要的任務(wù)有兩個,其一是進行已有軟件產(chǎn)品的大數(shù)據(jù)改造;其二是針對于具體的大數(shù)據(jù)需求進行全新的大數(shù)據(jù)應(yīng)用開發(fā),目前由于是大數(shù)據(jù)落地應(yīng)用的初期,所以大數(shù)據(jù)改造的開發(fā)任務(wù)會相對多一些,未來新的大數(shù)據(jù)開發(fā)任務(wù)會逐漸增加。
復(fù)習(xí)題二下列關(guān)于舍恩伯格對大數(shù)據(jù)特點的說法中,錯誤的是(D)A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多樣C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價值密度高下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是(D)A.在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追求效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)下列關(guān)于普查的缺點的說法中,正確的是(A)A.工作量較大,容易導(dǎo)致調(diào)查內(nèi)容有限、產(chǎn)生重復(fù)和遺漏現(xiàn)象B、誤差不易被控制C、對樣本的依賴比較強D、評測結(jié)果不夠穩(wěn)定下列關(guān)于聚類挖掘技術(shù)的說法中,錯誤的是(B)A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小D、與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進行分類處理大數(shù)據(jù)的起源是(C)A.金融B、電信C、互聯(lián)網(wǎng)D、公共管理智慧城市的智慧之源是(C)A.數(shù)字城市B、物聯(lián)網(wǎng)C、大數(shù)據(jù)D、云計算假設(shè)一種基因同時導(dǎo)致兩件事情,一是使人喜歡抽煙,二是使這個人和肺癌就是(A)關(guān)系,而吸煙和肺癌則是(A)關(guān)系A(chǔ).因果相關(guān)B、相關(guān)因果C、并列相關(guān)D、因果并列下列演示方式中,不屬于傳統(tǒng)統(tǒng)計圖方式的是(D)A.柱狀圖B、餅狀圖C、曲線圖D、網(wǎng)絡(luò)圖當(dāng)前社會中,最為突出的大數(shù)據(jù)環(huán)境是(A)A.互聯(lián)網(wǎng)B、物聯(lián)網(wǎng)C、綜合國力D、自然資源可以對大數(shù)據(jù)進行深度分析的平臺工具是(C)A、傳統(tǒng)的機器學(xué)習(xí)和數(shù)據(jù)分析肛具B、第二代機器學(xué)習(xí)工具C、第二代機器學(xué)習(xí)工具D、未來機器學(xué)習(xí)工具面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務(wù)器等硬件、數(shù)據(jù)分析應(yīng)用軟件及技術(shù)運維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是(A)A.大數(shù)據(jù)解決方案模式B、大數(shù)據(jù)信息分類模式C、大數(shù)據(jù)處理服務(wù)模式D、大數(shù)據(jù)資源提供模式根據(jù)不同的業(yè)務(wù)需求來建立數(shù)據(jù)模型,抽取最有意義的向量,決定選取哪種(C)A.數(shù)據(jù)管理人員B、數(shù)據(jù)分析員C、研究科學(xué)家D、軟件開發(fā)工程師下列論據(jù)中,能夠支撐“大數(shù)據(jù)無所不能”的觀點的是(A)A.互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)存在泡沫C、大數(shù)據(jù)具有非常高的成本D、個人隱私泄露與信息安全擔(dān)憂
大數(shù)據(jù)正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力的(D)。A、
新一代信息技術(shù)B、
新一代服務(wù)業(yè)態(tài)C、
新一代技術(shù)平臺D、
新一代信息技術(shù)和服務(wù)業(yè)態(tài)
可以對大數(shù)據(jù)進行深度分析的工具是(C)。
A、淺層神經(jīng)網(wǎng)絡(luò)
B、Scala
C、深度學(xué)習(xí)
D、MapReduceSparkContext是(D)A.主節(jié)點B.從節(jié)點C.執(zhí)行器D.上下文scala中valx,y=100意味著(A)A.x,y都是100B.x沒有賦值,y是100C.x是0,y是100D.以上說法都不對Executor是(C)A.主節(jié)點B.從節(jié)點C.執(zhí)行器D.上下文以下不屬于線程安全的數(shù)據(jù)結(jié)構(gòu)是(A)A.HashMapB.HashTableC.CopyOnWriteArrayListD.ConcurrentHashMaphadoop2.x采用什么技術(shù)構(gòu)建源代碼(C)A.antB.ivyC.mavenD.makefile下列各國大數(shù)據(jù)發(fā)展路徑的描述中,對應(yīng)關(guān)系正確的是(ACD)A.日本:走尖端IT路線B、英國:視大數(shù)據(jù)為新的自然資源C、韓國:重視基礎(chǔ)、首都先行D、印度:以IT外包轉(zhuǎn)型為突破口若懸河按照服務(wù)目的不同,數(shù)據(jù)流通平臺可分為(AC)A.政府?dāng)?shù)據(jù)開放平臺B、企業(yè)數(shù)據(jù)開放平臺C、數(shù)據(jù)交易市場D數(shù)據(jù)研發(fā)市場大數(shù)據(jù)的價值體現(xiàn)在(ABCD)A.大數(shù)據(jù)給思維方式帶來了沖擊B、大數(shù)據(jù)為政策制定提供科學(xué)論據(jù)C、大數(shù)據(jù)助力智慧城市提升公共服務(wù)水平D、大數(shù)據(jù)實現(xiàn)了精準(zhǔn)營銷72.當(dāng)前大數(shù)據(jù)技術(shù)的基礎(chǔ)包括(ABD)A.分布式文件系統(tǒng)B、分布式并行計算C、關(guān)系型數(shù)據(jù)庫D、分布式數(shù)據(jù)庫可視化高維展示技術(shù)在展示數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)分析結(jié)果方面作(BD)A.能夠直觀反映成對數(shù)據(jù)之間的空間關(guān)系B、能夠直觀反映多維數(shù)據(jù)之間的空間關(guān)系C、能夠靜態(tài)演化事物的變化及變化的規(guī)律D、能夠動態(tài)演化事物的變化及變化的規(guī)律云計算的優(yōu)勢體現(xiàn)在以下哪些方面?(ABCD)A、云計算服務(wù)更加安全可靠B、云計算可以真正實現(xiàn)按需服務(wù)C、云計算可以有效提高資源利用率D、云計算可以大大降低成本和能耗醫(yī)療領(lǐng)域如何利用大數(shù)據(jù)?(ABCD)A、臨床決策支持B、個性化醫(yī)療C、社保資金安全D、用戶行為分析SparkContext可以從哪些位置讀取數(shù)據(jù)(ACD)A.本地磁盤B.webC.hdfsD.內(nèi)存scala語言中一個函數(shù)可以定義在(ABCD)A.構(gòu)造函數(shù)里B.class內(nèi)C.object內(nèi)D.main函數(shù)內(nèi)MLlib包括(ABCD)A.分類模型B.聚類模型C.特征抽取D.統(tǒng)計模型下列選項中,你認(rèn)為屬于貴州發(fā)展大數(shù)據(jù)的先天優(yōu)勢的是(ABCD)。A.空氣清新B.遠離地震帶C.氣候涼爽D.電力資源充沛決策樹是一種基于樹形結(jié)構(gòu)的預(yù)測模型,每一個樹形分叉代表一個分類條件,葉子節(jié)點代表最終的分類結(jié)果,其優(yōu)點在于易于實現(xiàn),決策時間短,并且適合處理非數(shù)值型數(shù)據(jù)。(T)信息生命周期管理是據(jù)生命周期管理的來源,最早由英國企業(yè)提出。(F)簡單隨機抽樣,是從總體N個對象中任意抽取n個對象作為樣本,最終以這些樣本作為調(diào)查對象。在抽取樣本時,總體中每個對象被抽中為調(diào)查樣本的概率可能會有差異。(F)第三方數(shù)據(jù)處理模式表現(xiàn)為:服務(wù)商通過軟件即服務(wù)或平臺即服務(wù)形式主義為用戶提供自己的數(shù)據(jù)上服務(wù)商的平臺上,由平臺進行分析處理,用戶可以在線查看相應(yīng)的結(jié)果(F)在美國的大數(shù)據(jù)大棋中,“五眼”是指配合美國進行全球監(jiān)控的包含美國、英國、加拿大、澳大利亞、新西蘭在內(nèi)的五個國家(T)當(dāng)前,企業(yè)提供的大數(shù)據(jù)解決方案大多基于Hadoop開源項目(T)Hadoop支持?jǐn)?shù)據(jù)的隨機讀寫。(錯)NameNode負(fù)責(zé)管理metadata,client端每次讀寫請求,它都會從磁盤中讀取或則會寫入metadata信息并反饋client端。(錯誤)Slave節(jié)點要存儲數(shù)據(jù),所以它的磁盤越大越好。(錯誤)Hadoop默認(rèn)調(diào)度器策略為FIFO(正確)概述FileInputFormat切片機制(1)簡單地按照文件的內(nèi)容長度進行切片(2)切片大小,默認(rèn)等于block大?。?)切片時不考慮數(shù)據(jù)集整體,而是逐個針對每一個文件單獨切片MapReduce怎么實現(xiàn)TopN?(排序取前10)可以自定義groupingcomparator,或者在map端對數(shù)據(jù)進行排序,然后再reduce輸出時,控制只輸出前n個數(shù)。就達到了topn輸出的目的。select*fromtableorderbyfielddesclimit10;什么是分布式計算答:分布式計算是一門計算機科學(xué),主要研究分布式系統(tǒng)。一個分布式系統(tǒng)包括若干通過網(wǎng)絡(luò)互聯(lián)的計算機。這些計算機互相配合以完成一個共同的目標(biāo)(我們將這個共同的目標(biāo)稱為“項目”)。具體的過程是:將需要進行大量計算的項目數(shù)據(jù)分割成小塊,由多臺計算機分別計算,再上傳運算結(jié)果后統(tǒng)一合并得出數(shù)據(jù)結(jié)論。在分布式系統(tǒng)上運行的計算機程序稱為分布式計算程序;分布式編程就是編寫上述程序的過程。
復(fù)習(xí)題三從大量數(shù)據(jù)中提取知識的過程通常稱為(A)。A、
數(shù)據(jù)挖掘B、
人工智能C、
數(shù)據(jù)清洗D、
數(shù)據(jù)倉庫大數(shù)據(jù)的4V特征中的Volume是指(D)。
A、價值密度低
B、處理速度快
C、數(shù)據(jù)類型繁多
D、數(shù)據(jù)體量巨大SecondaryNamenode的作用是(C)A.監(jiān)控NamenodeB.管理DatanodeC.合并fsimage和editlogsD.支持NamenodeHA表示主機名與IP地址映射關(guān)系的文件是(C)A./etc/host.confB./etc/hostnameC./etc/hostsD./etc/resolv.conf以下屬于oozie作用的是(C)A.作業(yè)監(jiān)控B.日志收集C.工作流調(diào)度D.集群管理以下7層OSI網(wǎng)絡(luò)模型按照正確順序排序的是(C)A.物理層數(shù)據(jù)鏈路層傳輸層網(wǎng)絡(luò)層會話層表示層應(yīng)用層B.物理層數(shù)據(jù)鏈路層會話層網(wǎng)絡(luò)層傳輸層表示層應(yīng)用層C.物理層數(shù)據(jù)鏈路層網(wǎng)絡(luò)層傳輸層會話層表示層應(yīng)用層D.網(wǎng)絡(luò)層傳輸層物理層數(shù)據(jù)鏈路層會話層表示層應(yīng)用層以下描述錯誤的是(A)A.MapFile的key是Writable類型B.SequenceFile中如果采用記錄壓縮方式,key是不壓縮的C.SequenceFile.Writer類支持append方法D.SequenceFile中如果采用塊壓縮方式,key也要被壓縮以下說法的錯誤是(B)A.使用Writable序列化方法不滿足可擴展的需求B.BytesWritable是不可變長度的C.VIntWritable是可變長度的D.使用protocobuffer需要自定義消息類型大數(shù)據(jù)的4V特征中的Variety是指(C)。
A、價值密度低
B、處理速度快
C、數(shù)據(jù)類型繁多
D、數(shù)據(jù)體量巨大
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行(B)。
A、數(shù)據(jù)信息
B、專業(yè)化處理
C、速度處理
D、內(nèi)容處理
大數(shù)據(jù)的核心就是(B)。
A、告知與許可
B、預(yù)測
C、匿名化
D、規(guī)?;铝嘘P(guān)于計算機存儲容量單位的說法中,錯誤的是(C)A、1KB<1MB<1GBB、基本單位是字節(jié)(Byte)C、一個漢字需要一個字節(jié)的存儲空間D、一個字節(jié)能夠容納一個英文字符經(jīng)過一系列處理,在基本保持原始數(shù)據(jù)完整性的基礎(chǔ)上,減小數(shù)據(jù)規(guī)模的是(C)A、數(shù)據(jù)清洗B、數(shù)據(jù)融合C、數(shù)據(jù)規(guī)約D、數(shù)據(jù)挖掘下列關(guān)于大數(shù)據(jù)預(yù)測的說法中,錯誤的是(D)A、人類的生活正在被大數(shù)據(jù)預(yù)測深刻改變B、預(yù)測性分析是大數(shù)據(jù)最核心的功能C、分析從“面向已經(jīng)發(fā)生的過去”轉(zhuǎn)向“面向即將發(fā)生的未來”是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的最大區(qū)別D、大數(shù)據(jù)預(yù)測則是基本大數(shù)據(jù)和預(yù)測模型去預(yù)測過去某件事情的概率一切事物及事物運動的狀態(tài),不僅銷售數(shù)據(jù)、價格這些客觀標(biāo)準(zhǔn)可以形成大數(shù)據(jù),甚至連顧客情緒(如色彩、空間的感知等)都可以測得,這體現(xiàn)了大數(shù)據(jù)思維維度中的(A)A、定量思維B、相關(guān)思維C、因果思維D、實驗思維下列國家的大數(shù)據(jù)發(fā)展行動中,堅持原則先行、謹(jǐn)慎發(fā)展的國家是(D)A、英國B、韓國C、印度D、澳大利亞下列論據(jù)中,體現(xiàn)“冷眼”看大數(shù)據(jù)的觀點是(B)A、互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)醫(yī)療正在走進平民百姓C、數(shù)據(jù)資產(chǎn)型企業(yè)前景光明D、個人隱私泄露與信息安全擔(dān)憂下列國家的大數(shù)據(jù)發(fā)展行動中,視大數(shù)據(jù)為新的自然資源的國家是(D)A、中國B、韓國C、印度D、新加坡scala反編譯后(C)A.可讀但不可執(zhí)行B.不可讀可以執(zhí)行C.可讀可執(zhí)行D.不可讀不可執(zhí)行scala中defmul(x:Int)(y:Int)=x*y稱作(A)A.柯里化函數(shù)B.匿名函數(shù)C.高階函數(shù)D.偏應(yīng)用函數(shù)中國大數(shù)據(jù)產(chǎn)業(yè)特征包括(BCD)A大數(shù)據(jù)整體解決方案成熟B.區(qū)域產(chǎn)業(yè)集聚現(xiàn)雛形C.大數(shù)據(jù)基礎(chǔ)研究受到重視D.互聯(lián)網(wǎng)企業(yè)表現(xiàn)強勢GBCP和諧三角指的是哪三個角色(ACD)A.政府B.社會組織C.企業(yè)D.公眾回答正確下面關(guān)于數(shù)據(jù)開放的陳述哪些是正確的(ABD)A.要提供應(yīng)用程序開放接口B.允許公眾免費查詢、下載C.要提供全部的原始數(shù)據(jù)D.允許公民要求數(shù)據(jù)開放數(shù)據(jù)大數(shù)據(jù)作為一種數(shù)據(jù)集合,它的含義包括(ACD)。A.數(shù)據(jù)很大B.很有價值C.構(gòu)成復(fù)雜D.變化很快我國的貴州發(fā)展大數(shù)據(jù)的頂層設(shè)計是要逐步建成三個中心,即(BCD)。A.大數(shù)據(jù)人才中心B.大數(shù)據(jù)金融中心C.大數(shù)據(jù)內(nèi)容中心D.大數(shù)據(jù)服務(wù)中心大數(shù)據(jù)帶來的挑戰(zhàn)有哪些(
ABCD)
A.會導(dǎo)致數(shù)據(jù)盲點
B.危及個人隱私
C.造成群體歧視
D.產(chǎn)生龐大能耗
要消除信息孤島,需要從以下哪幾個方面著手(
ABCD)
A.進行縱向信息系統(tǒng)整合
B.進行水平的電子政務(wù)信息系統(tǒng)整合
C.改變內(nèi)部管理觀念和態(tài)度
D.建立跨系統(tǒng)、跨平臺的政府綜合信息處理平臺
單純依據(jù)大數(shù)據(jù)預(yù)測做出決策需要遵循哪些原則(
ABC)
A.公開原則
B.公正原則
C.可反駁原則
D.確保個人動因能防范數(shù)據(jù)獨裁的危害
大數(shù)據(jù)的特征包含(ABCD
)
A.規(guī)模性
B.多樣性
C.高速性
D.價值密度低
大數(shù)據(jù)處理流程可以概括為以下哪幾步(
ABCD)
A.數(shù)據(jù)分析與挖掘
B.數(shù)據(jù)采集
C.數(shù)據(jù)儲存
D.結(jié)果展示
對于企業(yè)來說,給用戶進行各種促銷或者實施運營策略的時機也比較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年江西師范高等專科學(xué)校高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 2025年武漢電力職業(yè)技術(shù)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 航空運輸合同集錦
- 人工智能算法開發(fā)與應(yīng)用合同
- 幼兒園植樹節(jié)策劃方案2021【五篇】
- 桉樹造林工程承包合同書
- 新企業(yè)之間借款合同范本
- 采購法務(wù)與合同管理1
- 咨詢培訓(xùn)服務(wù)合同模板
- 校車租賃合同書
- 2025-2030年中國清真食品行業(yè)運行狀況及投資發(fā)展前景預(yù)測報告
- 廣東省茂名市電白區(qū)2024-2025學(xué)年七年級上學(xué)期期末質(zhì)量監(jiān)測生物學(xué)試卷(含答案)
- 數(shù)字化轉(zhuǎn)型中的職業(yè)能力重構(gòu)
- 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)專練:橢圓(含解析)
- 中國服裝零售行業(yè)發(fā)展環(huán)境、市場運行格局及前景研究報告-智研咨詢(2025版)
- 臨床提高膿毒性休克患者1h集束化措施落實率PDCA品管圈
- 汽車車身密封條設(shè)計指南
- 2024建安杯信息通信建設(shè)行業(yè)安全競賽題庫(試題含答案)
- JBT 14727-2023 滾動軸承 零件黑色氧化處理 技術(shù)規(guī)范 (正式版)
- 術(shù)后譫妄及護理
- 醫(yī)藥行業(yè)的市場營銷與渠道拓展
評論
0/150
提交評論