涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試_第1頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試_第2頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試_第3頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試_第4頁
涅盤計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

98分,標(biāo)綠為正確,標(biāo)紅為錯誤2020年中國電信云南公司涅槃計(jì)劃云及大數(shù)據(jù)技術(shù)初級培訓(xùn)考試-大數(shù)據(jù)技術(shù)單選題1.數(shù)據(jù)倉庫的最終目的是()單選題/2分收集業(yè)務(wù)需求為用戶和業(yè)務(wù)部門提供決策支持建立數(shù)據(jù)倉庫邏輯模型開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析待檢查2.數(shù)據(jù)清洗的方法不包括()單選題/2分一致性檢查重復(fù)數(shù)據(jù)記錄處理噪聲數(shù)據(jù)清除缺失值處理待檢查3.大數(shù)據(jù)的合理利用將成為提高核心競爭力的關(guān)鍵因素,各行各業(yè)的決策正在從“業(yè)務(wù)驅(qū)動”轉(zhuǎn)變?yōu)椋ǎ﹩芜x題/2分市場驅(qū)動產(chǎn)品驅(qū)動數(shù)據(jù)驅(qū)動需求驅(qū)動待檢查4.當(dāng)前社會中,最為突出的大數(shù)據(jù)環(huán)境是()單選題/2分物聯(lián)網(wǎng)互聯(lián)網(wǎng)綜合國力自然資源待檢查5.通常,在訓(xùn)練有監(jiān)督的機(jī)器學(xué)習(xí)模型的時候,會將數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集,劃分比例一般為()單選題/2分7:2:15:3:26:2:28:1:1待檢查6.從大量數(shù)據(jù)中提取知識的過程通常稱為()單選題/2分?jǐn)?shù)據(jù)挖掘數(shù)據(jù)倉庫人工智能數(shù)據(jù)清洗待檢查7.特征選擇是自動地選擇出對于問題最重要的那些的過程。()單選題/2分?jǐn)?shù)據(jù)特征子集字段信息待檢查8.大數(shù)據(jù)時代,數(shù)據(jù)使用的關(guān)鍵是()單選題/2分?jǐn)?shù)據(jù)存儲數(shù)據(jù)再利用數(shù)據(jù)收集數(shù)據(jù)分析待檢查9.K-means算法是一種()單選題/2分迭代算法關(guān)聯(lián)算法聚類算法分類算法待檢查10.大數(shù)據(jù)模型評估是關(guān)鍵工作,假設(shè),TP:樣本為正,預(yù)測結(jié)果為正;FP:樣本為負(fù),預(yù)測結(jié)果為正;TN:樣本為負(fù),預(yù)測結(jié)果為負(fù);FN:樣本為正,預(yù)測結(jié)果為負(fù)。精確率(precision)計(jì)算正確的公式為()單選題/2分precision和recall調(diào)和平均值,2PR/(P+R)TP/(TP+FP),正確預(yù)測為正占全部預(yù)測為正的比例(TP+TN)/(TP+FP+TN+FN)TP/(TP+FN),正確預(yù)測為正占全部正樣本的比例待檢查11.下列對數(shù)據(jù)挖掘描述正確的是()。單選題/2分?jǐn)?shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過電腦獲取隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過人工分析隱藏于其中信息的過程數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過人工發(fā)現(xiàn)隱藏于其中信息的過程待檢查12.Hadoop的三大核心組件是()單選題/2分Hbase、Sqoop、YARNHive、Pig、ZookeeperFlume、Hbase、HiveYARN、HDFS、MapReduce待檢查13.數(shù)據(jù)的最小的基本單位是bit,按順序給出所有單位,正確的是()單選題/2分bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB、BBbit、Byte、KB、MB、GB、TB、DB、EB、ZB、YB、BB、NB、PBbit、Byte、KB、MB、GB、TB、PB、DB、ZB、YB、BB、NB、EBbit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB待檢查14.經(jīng)過一系列處理,在基本保持原始數(shù)據(jù)完整性的基礎(chǔ)上,減小數(shù)據(jù)規(guī)模的是()單選題/2分?jǐn)?shù)據(jù)挖掘數(shù)據(jù)規(guī)約數(shù)據(jù)融合數(shù)據(jù)清洗待檢查15.以下對過擬合(over-fitting)描述正確的是()單選題/2分所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在驗(yàn)證樣本中表現(xiàn)得過于優(yōu)越,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及測試數(shù)據(jù)集中表現(xiàn)不佳。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在驗(yàn)證樣本中表現(xiàn)較差,模型無法正常運(yùn)行,無法輸出結(jié)果。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在測試樣本中表現(xiàn)較差,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及訓(xùn)練數(shù)據(jù)集中表現(xiàn)不佳。所謂過擬合(over-fitting)其實(shí)就是所建的機(jī)器學(xué)習(xí)模型或者是深度學(xué)習(xí)模型在訓(xùn)練樣本中表現(xiàn)得過于優(yōu)越,導(dǎo)致在驗(yàn)證數(shù)據(jù)集以及測試數(shù)據(jù)集中表現(xiàn)不佳。待檢查16.Python中在程序運(yùn)行時不會被更改的量稱之為()單選題/2分固定參數(shù)固定值常量定量待檢查17.有監(jiān)督學(xué)習(xí)的結(jié)果可分為兩類,分別是()單選題/2分關(guān)系分析、趨勢預(yù)測分類、聚類回歸、分類關(guān)聯(lián)、預(yù)測待檢查18.面向用戶提供大數(shù)據(jù)一站式部署方案,包括數(shù)據(jù)中心和服務(wù)器等硬件、數(shù)據(jù)分析應(yīng)用軟件及技術(shù)運(yùn)維支持等多方面內(nèi)容的大數(shù)據(jù)商業(yè)模式是()單選題/2分大數(shù)據(jù)資源提供模式大數(shù)據(jù)解決方案模式大數(shù)據(jù)處理服務(wù)模式大數(shù)據(jù)信息分類模式待檢查19.人工智能與大數(shù)據(jù)關(guān)系的描述正確的是()單選題/2分人工智能與大數(shù)據(jù)無交集,人工智能比大數(shù)據(jù)更加先進(jìn)。人工智能與大數(shù)據(jù)密不可分,可以將很多大數(shù)據(jù)的應(yīng)用(云計(jì)算平臺等)歸結(jié)為人工智現(xiàn)在興起的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能技術(shù),永遠(yuǎn)不可能改變數(shù)據(jù)世界里的算法和基礎(chǔ)理論。人工智能與大數(shù)據(jù)是不同領(lǐng)域,無關(guān)聯(lián)關(guān)系。待檢查20.大數(shù)據(jù)環(huán)境下的隱私擔(dān)憂,主要表現(xiàn)為()單選題/2分病毒入侵惡意廣告的推送個人信息的被識別與暴露用戶畫像的生成待檢查多選題21.在黨的十九大報告中,數(shù)字中國是中國的國家信息化范疇,數(shù)字中國的內(nèi)容包括()多選題/3分A.寬帶中國B.大數(shù)據(jù)C.互聯(lián)網(wǎng)D.云計(jì)算待檢查22.以下哪些是有監(jiān)督學(xué)習(xí)的算法()多選題/3分支持向量機(jī)決策樹線性回歸社交網(wǎng)絡(luò)分析算法待檢查23.數(shù)據(jù)資產(chǎn)管理(Dataassetmanagement簡稱DAM)是指()多選題/3分包括開發(fā)、執(zhí)行和監(jiān)督有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而控制、保護(hù)、交付和提高數(shù)據(jù)資產(chǎn)的價值。包括測試有關(guān)數(shù)據(jù)的計(jì)劃、政策、方案、項(xiàng)目、流程、方法和程序,從而減小數(shù)據(jù)資產(chǎn)的應(yīng)用面。規(guī)劃、控制和提供數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能管理、策劃和使用數(shù)據(jù)及信息資產(chǎn)的一組業(yè)務(wù)職能待檢查24.特征選擇必須確保不丟失重要信息,若重要信息缺失則學(xué)習(xí)效果會大打折扣。常見的特征選擇方法大致分為()多選題/3分包裹式(wrapper)過濾式(filter)留出法(leaveoneout)嵌入式(embedding)待檢查25.Python中的絕大部分?jǐn)?shù)據(jù)結(jié)構(gòu)可以被最終分解為三種類型:()多選題/3分序列(Sequence)標(biāo)量(Scaler)字符串(String)映射(Mapping)待檢查26.分類挖掘所獲的分類模型可以采用多種形式加以描述輸出,其中主要的表示方法有()多選題/3分決策樹數(shù)學(xué)公式神經(jīng)網(wǎng)絡(luò)分類規(guī)則待檢查27.Python的優(yōu)點(diǎn)包括()多選題/3分開發(fā)效率非常高可嵌入性強(qiáng)運(yùn)行速度快,Python的運(yùn)行速度比C語言快很多。豐富的擴(kuò)展庫待檢查28.評價大數(shù)據(jù)模型的常用方法有()多選題/3分過擬合隨機(jī)性精確率召回率欠擬合F值待檢查29.數(shù)據(jù)挖掘在電信行業(yè)的應(yīng)用包括()多選題/3分對欠費(fèi)/壞賬進(jìn)行預(yù)測和控制發(fā)掘潛在客戶預(yù)測哪些即將流失的客戶判斷客戶的欺詐行為特征待檢查30.大數(shù)據(jù)通常具有的特征為()多選題/3分?jǐn)?shù)據(jù)價值密度低(Value)數(shù)據(jù)規(guī)模大(Volume)數(shù)據(jù)處理速度快(Velocity)數(shù)據(jù)種類繁多(Variety)待檢查31.Hadoop是一個能夠讓用戶輕松架構(gòu)和使用的分布式計(jì)算平臺。用戶可以輕松地在Hadoop上開發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。它主要的優(yōu)點(diǎn)為()多選題/3分高效性。Hadoop能夠在節(jié)點(diǎn)之間動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點(diǎn)的動態(tài)平衡,因此處理速度非???。低成本。與一體機(jī)、商用數(shù)據(jù)倉庫以及QlikView、YonghongZ-Suite等數(shù)據(jù)集市相比,hadoop是開源的,項(xiàng)目的軟件成本因此會大大降低。高容錯性。Hadoop能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務(wù)重新分配。高可靠性。Hadoop按位存儲和處理數(shù)據(jù)的能力值得人們信賴。高擴(kuò)展性。Hadoop是在可用的計(jì)算機(jī)集簇間分配數(shù)據(jù)并完成計(jì)算任務(wù)的,這些集簇可以方便地?cái)U(kuò)展到數(shù)以千計(jì)的節(jié)點(diǎn)中。待檢查32.數(shù)據(jù)挖掘流程包括()多選題/3分評估(evaluation)數(shù)據(jù)準(zhǔn)備(datapreparation)建模(modeling)部署(deployment)業(yè)務(wù)理解(businessunderstanding)數(shù)據(jù)理解(dataunderstanding)待檢查33.數(shù)據(jù)挖掘利用了來自如下一些領(lǐng)域的思想()多選題/3分來自統(tǒng)計(jì)學(xué)的抽樣、估計(jì)和假設(shè)檢驗(yàn)。生命自然科學(xué)分布式存儲理論人工智能、模式識別和機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論。待檢查34.HDFS的缺點(diǎn)是()多選題/3分不適合小文件儲存高容錯構(gòu)建在廉價的機(jī)構(gòu)上低延遲的數(shù)據(jù)訪問待檢查35.以下哪些是機(jī)器學(xué)習(xí)的算法()多選題/3分決策樹神經(jīng)網(wǎng)絡(luò)隨機(jī)森林邏輯回歸待檢查判斷題36.大數(shù)據(jù)分析與挖掘只能使用Python實(shí)現(xiàn)判斷題/1分正確錯誤待檢查37.Tez是Apache開源的支持DAG作業(yè)的計(jì)算框架,通過DAG作業(yè)的方式運(yùn)行MapReduce作業(yè),提供了程序運(yùn)行的整體處理邏輯,就可以去除工作流當(dāng)中多余的Map階段,減少不必要的操作,提升數(shù)據(jù)處理的性能。判斷題/1分正確錯誤待檢查38.Hadoop的核心組件是Spark和Hive判斷題/1分正確錯誤待檢查39.HDFS是Hadoop技術(shù)框架中的分布式文件系統(tǒng),對部署在多臺獨(dú)立物理機(jī)器上的文件進(jìn)行管理。判斷題/1分正確錯誤待檢查40.聚類、關(guān)聯(lián)分析算法是有監(jiān)督學(xué)習(xí)判斷題/1分正確錯誤待檢查41.數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,而模型和算法只是逼近這個上限而已。判斷題/1分錯誤待檢查42.FlumeNG有三種角色的節(jié)點(diǎn):代理節(jié)點(diǎn)agent、收集節(jié)點(diǎn)collector、主節(jié)點(diǎn)master判斷題/1分正確錯誤待檢查43.在進(jìn)行大數(shù)據(jù)分析挖掘過程中,對數(shù)據(jù)樣本進(jìn)行處理時必須要保持樣本的原始性,補(bǔ)全缺失的數(shù)據(jù)必然導(dǎo)致最終分析的結(jié)果錯誤。判斷題/1分正確錯誤待檢查44.數(shù)據(jù)挖掘過程前期的數(shù)據(jù)準(zhǔn)備工作量超過整個過程的一半判斷題/1分正確錯誤待檢查45.MapReduce的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論