大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)_第1頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)_第2頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)_第3頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)_第4頁
大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

試卷科目:大數(shù)據(jù)挖掘技術(shù)練習(xí)大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術(shù)練習(xí)第1部分:單項選擇題,共51題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.區(qū)塊鏈本身并非是一項全新技術(shù),而是多項技術(shù)的集成式創(chuàng)新,其中不包括()A)分布式網(wǎng)絡(luò)B)數(shù)據(jù)加密C)共識機制、智能合約D)機械自動化答案:D解析:[單選題]2.如果規(guī)則集R中不存在兩條規(guī)則被同一條記錄觸發(fā),則稱規(guī)則集R中的規(guī)則為();A)無序規(guī)則B)窮舉規(guī)則C)互斥規(guī)則D)有序規(guī)則答案:C解析:[單選題]3.關(guān)聯(lián)規(guī)則的評價指標是:()。A)均方誤差、均方根誤差B)Kappa統(tǒng)計、顯著性檢驗C)支持度、置信度D)平均絕對誤差、相對誤差答案:C解析:[單選題]4.收到全省性的咪咕閱讀業(yè)務(wù)無法使用問題,下述維度中優(yōu)先排查的是哪個A)終端B)PGWC)地市D)MME答案:C解析:[單選題]5.如何檢查Namenode是否正常運行A)jpsB)java-versionC)jpsstatusD)namenodestatus答案:A解析:[單選題]6.關(guān)于OLAP和OLTP的說法,下列不正確的是:()A)OLAPB)OLAPC)OLTPD)OLTP答案:A解析:[單選題]7.已知x和y是兩個等長的整數(shù)列表,那么表達式sum((i*jfori,jinzip(x,y)))的作用是計算這兩個列表所表示的向量的()A)坐標B)內(nèi)積C)方向D)大小答案:B解析:[單選題]8.分析顧客消費行業(yè),以便有針對性的向其推薦感興趣的服務(wù),屬于()問題A)關(guān)聯(lián)規(guī)則挖掘B)分類與回歸C)聚類分析D)時序預(yù)測答案:A解析:[單選題]9.大數(shù)據(jù)的價值是通過數(shù)據(jù)共享、()、后獲取最大的數(shù)據(jù)價值A(chǔ))算法共享B)共享應(yīng)用C)數(shù)據(jù)交換D)交叉復(fù)用答案:D解析:[單選題]10.下面哪個業(yè)務(wù)不屬于即時通信類業(yè)務(wù)?A)微信B)QQC)陌陌D)淘寶答案:D解析:[單選題]11.檢查異常值常用的統(tǒng)計圖形是()A)柱狀圖B)箱線圖C)帕累托圖D)氣泡圖答案:B解析:[單選題]12.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?A)變量代換B)離散化C)聚集D)估計遺漏值答案:D解析:[單選題]13.下列()不屬于人工智能新突破取得的產(chǎn)品A)科大訊飛的翻譯器、記錄儀B)天貓精靈等智能AI音箱C)佳能相機D)某酒店通過人臉識別認證身份信息答案:C解析:[單選題]14.SELECT語句中的WHERE用于說明______。A)查詢數(shù)據(jù)B)查詢條件C)查詢分組D)查詢排序答案:B解析:[單選題]15.通用人工智能面對大型即時策略游戲,面臨很多亟待解決的問題,不包括()A)通用人工智能需要平衡價值目標和策略目標,價值目標服務(wù)于長期目標,策略目標服務(wù)于短期目標。這就需要通用人工智能,掌握博弈論的精髓B)通用人工智能,需要能夠主動挖掘游戲情報,并通過局部信息或不完美的信息做出游戲決策C)像許多現(xiàn)實世界的問題一樣,因果關(guān)系不是即時的。這意味著游戲早期采取的行動可能無法在很長一段時間內(nèi)獲得回報。這就需要通用人工智能,具有長期規(guī)劃能力D)智能匹配隊友答案:D解析:[單選題]16.若MySQL數(shù)據(jù)表中有姓名為?李建華?的記錄,下列無法查出?李建華?的表達式是______。A)Like"華"B)Like"%華"C)Like"%華%"D)Like"__華"答案:A解析:[單選題]17.LTE系統(tǒng)網(wǎng)絡(luò)架構(gòu)EPS系統(tǒng)是由什么組成的?A)EPCB)eNodeBC)UED)以上都正確答案:D解析:[單選題]18.下列不是金融科技公司的是()A)諾亞財富B)高盛公司C)文藝復(fù)興公司D)中國平安答案:A解析:[單選題]19.檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備安全配置合規(guī)率情況,安全配置合規(guī)率應(yīng)不低于()A)99%B)95%C)90%D)85%答案:D解析:[單選題]20.樸素貝葉斯分類中得到條件概率的方法錯誤的是()。A)對于定量屬性,將取值離散化變?yōu)閰^(qū)間,再當(dāng)做定性屬性處理B)對于定性屬性,將轉(zhuǎn)化為定量屬性,再計算相應(yīng)的概率C)對于定量屬性,假設(shè)變量服從某種概率分布,通過訓(xùn)練數(shù)據(jù)集估計分布的參數(shù)D)對于定性屬性,計算某一類別的樣本中某種屬性取該值的樣本所占比例來近似答案:B解析:[單選題]21.根據(jù)聚類形成的簇的特點,如果有交集的簇之間必然存在包含關(guān)系,這種聚類稱為()。A)層次型聚類B)重疊聚類C)劃分型聚類D)以上均不是答案:A解析:[單選題]22.以下屬于關(guān)聯(lián)分析的是A)CPU性能預(yù)測B)購物籃分析C)自動判斷鳶尾花類別D)股票趨勢建模答案:B解析:[單選題]23.在上網(wǎng)業(yè)務(wù)問題診斷中,以下哪一種錯誤現(xiàn)象需要進一步定位用戶側(cè)問題?A)發(fā)送SNY_ack后用戶端無ackB)附著失敗返回#96C)DNS解析失敗返回#3D)HTTP失敗返回#400-500答案:A解析:[單選題]24.下列哪個描述是正確的?()A)分類和聚類都是有監(jiān)督的學(xué)習(xí)B)分類和聚類都是無監(jiān)督的學(xué)習(xí)C)分類是有監(jiān)督的學(xué)習(xí),聚類是無監(jiān)督的學(xué)習(xí)D)分類是無監(jiān)督的學(xué)習(xí),聚類是有監(jiān)督的學(xué)習(xí)答案:C解析:[單選題]25.使用最小-最大法進行數(shù)據(jù)規(guī)范化,需要映射的目標區(qū)間為[0,100],原來的取值范圍是[-10,10]。根據(jù)等比映射的原理,一個值8映射到新區(qū)間后的值是()。A)95B)90C)85D)80答案:B解析:[單選題]26.()是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產(chǎn)生的A)邊界點B)質(zhì)心C)離群點D)核心點答案:C解析:[單選題]27.最小-最大法中,假設(shè)需要映射到目標區(qū)間為[L,R],原來的取值范圍為[l,r]。一個值x映射到新區(qū)間后的值v的計算方法是()。A)v=(r-l)/(x-l)*(R-L)+LB)v=(x-l)/(r-l)*(R-L)+LC)v=(r-l)/(x-l)*(x-L)+LD)v=(x-l)/(r-l)*(x-L)+L答案:B解析:[單選題]28.AlphaGo使用()徹底解決了圍棋游戲搜索空間巨大的問題A)深度神經(jīng)網(wǎng)絡(luò)和蒙特卡羅樹搜索B)狂暴算力和窮舉法C)總結(jié)新的圍棋范式D)收集大量棋局數(shù)據(jù)答案:A解析:[單選題]29.有如下兩個表:部門(部門號,部門名,負責(zé)人,電話),職工(部門號,職工號,姓名,性別,出生日期)??梢哉_查詢1980年8月20日出生的職工信息的SQLSELECT命令是______。A)SELECT*FROM職工WHERE出生日期=1980-8-20;B)SELECT*FROM職工WHERE出生日期='1980-8-20';C)SELECT*FROM職工WHERE出生日期={1980-8-20};D)SELECT*FROM職工WHERE出生白期=[1980-8-20];答案:B解析:[單選題]30.使用離差平方和法聚類時,計算樣品間的距離必須采用()A)曼哈頓距離B)歐氏距離C)切比雪夫距離D)絕對值距離答案:B解析:[單選題]31.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分,分為()A)結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)B)強結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)C)截面數(shù)據(jù)、面板數(shù)據(jù)D)一級數(shù)據(jù)、二級數(shù)據(jù)、三級數(shù)據(jù)答案:A解析:[單選題]32.若P(H)=0.5,P(x)=0.8,P(X|H)=0.7,則P(H|X)為()A)0.475B)0.57C)0.4375D)0.5答案:C解析:[單選題]33.PageRank是一個函數(shù),它對Web中的每個網(wǎng)頁賦予一個實數(shù)值。它的意圖在于網(wǎng)頁的PageRank越高,那么它就A)越重要B)越顯著C)越新D)越復(fù)雜答案:A解析:[單選題]34.在回歸分析中,要求相關(guān)的兩個變量()。A)都是確定型變量B)都是隨機變量C)自變量是確定型變量,因變量是隨機變量D)因變量是確定型變量,自變量是隨機變量答案:C解析:[單選題]35.決策樹算法是一種()數(shù)據(jù)挖掘算法A)關(guān)聯(lián)分析B)預(yù)測C)分類D)聚類答案:C解析:[單選題]36.下列()不是將主觀信息加入到模式發(fā)現(xiàn)任務(wù)中的方法。A)與同一時期其他數(shù)據(jù)對比B)可視化C)基于模板的方法D)主觀興趣度答案:A解析:[單選題]37.Mapreduce適用于()A)任意可在windowsservet2008上運行的程序B)任意應(yīng)用程序C)可以串行處理的應(yīng)用程序D)可以并行處理的應(yīng)用程序答案:C解析:[單選題]38.在某文章很多話中部分或全部提到了顧客的年齡,性別,收入和工作地點,想查找這四個詞之間的聯(lián)系以及聯(lián)系的強弱,可以用()A)回歸方法B)分類方法C)聚類方法D)關(guān)聯(lián)分析答案:D解析:[單選題]39.以下哪個算法是無監(jiān)督學(xué)習(xí)算法:()A)樸素貝葉斯B)LinearRegressionC)K-MeansD)支持向量機答案:C解析:[單選題]40.基于《中國移動DPI識別能力規(guī)范》新浪微博屬于哪一類業(yè)務(wù)()A)微博社區(qū)B)即時通信C)社交D)網(wǎng)頁瀏覽答案:A解析:[單選題]41.邏輯回歸適用于以下哪種問題()A)回歸問題B)二分類問題C)聚類問題D)關(guān)聯(lián)規(guī)則答案:B解析:[單選題]42.假如學(xué)生考試成績以?優(yōu)?.?良?.?及格?和?不及格?來記錄,為了說明全班同學(xué)考試成績的水平高低,其集中趨勢的測度()A)可以采用算術(shù)平均數(shù)B)可以采用眾數(shù)或中位數(shù)C)只能采用眾數(shù)D)只能采用四分位數(shù)答案:C解析:[單選題]43.在TDLTE網(wǎng)絡(luò)中,MME到PDNGateway的接口是A)GxB)S11C)SgiD)Rx答案:B解析:[單選題]44.()用于計算最近鄰的算法A)metric_params=NoneB)metric='minkowski'C)algorithm='auto'D)weights='uniform'答案:C解析:[單選題]45.關(guān)于頻繁模式,下面哪一個陳述是正確的()A)K項集頻繁則K-1項則必定不頻繁B)K項集不頻繁則K-1項則必定不頻繁C)K項集頻繁則K-1項則必定頻繁D)以上說法都不正確答案:C解析:[單選題]46.如下哪些不是最近鄰分類器的特點A)它使用具體的訓(xùn)練實例進行預(yù)測,不必維護源自數(shù)據(jù)的模型B)分類一個測試樣例開銷很大C)最近鄰分類器基于全局信息進行預(yù)測D)可以生產(chǎn)任意形狀的決策邊界答案:C解析:[單選題]47.以下關(guān)于文件的描述錯誤的選項是()A)readlines()函數(shù)讀入文件內(nèi)容后返回一個列表,元素劃分依據(jù)是文本文件中的換行符B)read()一次性讀入文本文件的全部內(nèi)容后,返回一個字符串C)readline()函數(shù)讀入文本文件的一行,返回一個字符串D)二進制文件和文本文件都是可以用文本編輯器編輯的文件答案:D解析:[單選題]48.C4.5算法以()作為分類選擇的依據(jù)。A)信息熵最大B)條件熵最大C)信息增益最大D)信息增益率最大答案:D解析:[單選題]49.VoLTE始呼接續(xù)時長統(tǒng)計點為()A)從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息B)從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)180響應(yīng)消息C)從主叫側(cè)SBC收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)SBC向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息D)從主叫側(cè)CSCF收到VoLTE語音或視頻的Invite始呼請求開始,到主叫側(cè)CSCF向主叫用戶成功轉(zhuǎn)發(fā)200響應(yīng)消息答案:B解析:[單選題]50.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()A)支持度B)置信度C)滿意度D)提升度答案:C解析:[單選題]51.()將兩個簇的鄰近度定義為不同簇的所有點對的平均逐對鄰近度,它是一種凝聚層次聚類技術(shù)。A)MIN(單鏈)B)MAX(全鏈)C)組平均D)Ward方法答案:C解析:第2部分:多項選擇題,共17題,每題至少兩個正確答案,多選或少選均不得分。[多選題]52.以下說法正確的是A)用戶使用王者榮耀流量越多,視頻流量消耗的越少B)在20點-24點,用戶使用的視頻流量增多,即時通信類流量減少C)在CBD商圈,微信業(yè)務(wù)的流量最高D)使用淘寶的用戶中女性多于男性答案:ABCD解析:[多選題]53.在集團公司四維十輪網(wǎng)絡(luò)質(zhì)量評估體系中,新業(yè)務(wù)包括:A)統(tǒng)一認證B)咪咕音樂C)共享單車D)和交通答案:ABC解析:[多選題]54.以下哪些指標屬于網(wǎng)頁瀏覽類KQI?()A)流媒體停頓占比B)頁面顯示時長C)頁面下載速率D)頁面響應(yīng)成功率答案:BCD解析:[多選題]55.以下關(guān)于IMEI的說法正確的是()A)IMEI是國際移動設(shè)備身份碼的縮寫,國際移動裝備辨識碼B)IMEI為TAC+FAC+SNR+SP+NSC)雙卡雙待手機會有兩個IMEID)IMEI不標識移動式筆記本電腦答案:ACD解析:[多選題]56.Attach成功率的指標來源可能是A)網(wǎng)管系統(tǒng)B)網(wǎng)優(yōu)平臺C)集中性能平臺D)大數(shù)據(jù)平臺答案:ABCD解析:[多選題]57.在評價不平衡類問題分類的度量方法有如下幾種,A)F1度量B)召回率(recall)C)精度(precision)D)真正率(turepositiverate,TPR)答案:ABCD解析:[多選題]58.與傳統(tǒng)的分布式程序設(shè)計相比,Mapreduce封裝了()等細節(jié),還提供了一個簡單而強大的接口。A)并行處理B)容錯處理C)本地化計算D)負載均衡簡答題答案:ABCD解析:[多選題]59.智能手機市場10年混戰(zhàn)之后,僅剩下()陣營A)蘋果IOSB)谷歌AndroidC)微軟D)聯(lián)想答案:AB解析:[多選題]60.IP報文在網(wǎng)絡(luò)傳送途中被分片生成多個新的IP包,則以下說法正確的是A)新的IP包有相同的標志(MF、DF)字段B)新的IP包有相同的標識(Identification)字段C)新的IP包有相同的片偏移字段D)新的IP包有相同的目的地址字段答案:BD解析:[多選題]61.TDLTE網(wǎng)絡(luò)架構(gòu)特征主要有?A)控制和承載的分離B)支持端到端的QoS保證C)全面分組化D)增加對實時業(yè)務(wù)的支持答案:ABCD解析:[多選題]62.數(shù)據(jù)類型:A)離散Q型B)連續(xù)性C)符號型D)文本型答案:ABCD解析:[多選題]63.層次聚類的聚類方式有()A)凝聚方式聚類B)分解方式聚類C)Q型聚類D)R型聚類答案:AB解析:[多選題]64.數(shù)據(jù)挖掘的挖掘方法包括:()A)聚類分析B)關(guān)聯(lián)分析C)回歸分析D)決策樹算法答案:ACD解析:[多選題]65.TAU請求成功次數(shù)為統(tǒng)計一定的時間粒度及網(wǎng)元粒度下,滿足以下哪兩個條件()的S1-MME接口XDR的個數(shù)A)ProcedureType=5B)ProcedureStatus=0C)ProcedureType=1D)ProcedureStatus=1答案:AB解析:[多選題]66.能消除時間序列中的不規(guī)則變動和季節(jié)變動的方法是()A)移動平均法B)指數(shù)平滑法C)時間序列乘法模型D)季節(jié)指數(shù)答案:AD解析:[多選題]67.打點模型把視頻業(yè)務(wù)分為接入階段與播放階段。其中接入階段又被細分為()A)初始緩沖準備階段B)初始緩沖階段C)播放階段D)播放準備階段答案:AB解析:[多選題]68.傳統(tǒng)的聚類分析計算方法主要有以下哪幾種()A)基于劃分的聚類B)基于層次的聚類C)基于密度的聚類D)基于密度的聚類E)基于模型的聚類答案:ABCDE解析:第3部分:判斷題,共20題,請判斷題目是否正確。[判斷題]69.對文件進行讀寫操作之后必須顯式關(guān)閉文件以確保所有內(nèi)容都得到保存。A)正確B)錯誤答案:對解析:[判斷題]70.當(dāng)以指定?鍵?為下標給字典對象賦值時,若該?鍵?存在則表示修改該?鍵?對應(yīng)的?值?,若不存在則表示為字典對象添加一個新的?鍵-值對?。A)正確B)錯誤答案:對解析:[判斷題]71.召回率是完全性的度量,即正元組被標記為正類的百分比。()A)正確B)錯誤答案:對解析:[判斷題]72.時序預(yù)測回歸預(yù)測一樣,也是用已知的數(shù)據(jù)預(yù)測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時間的不同。()A)正確B)錯誤答案:錯解析:[判斷題]73.資金本身具有時間價值。()A)正確B)錯誤答案:錯解析:[判斷題]74.Bayes法是一種在已知后驗概率與類條件概率的情況下的模式分類方法,待分樣本的分類結(jié)果取決于各類域中樣本的全體。()A)正確B)錯誤答案:錯解析:[判斷題]75.爬蟲是手動請求萬維網(wǎng)網(wǎng)站且提取網(wǎng)頁數(shù)據(jù)的程序。A)正確B)錯誤答案:錯解析:[判斷題]76.具有較高的支持度的項集具有較高的置信度。A)正確B)錯誤答案:錯解析:[判斷題]77.《中華人民共和國數(shù)據(jù)安全法》是我國第一部有關(guān)數(shù)據(jù)安全的專門法律。A)正確B)錯誤答案:對解析:[判斷題]78.通用爬蟲用于將互聯(lián)網(wǎng)上的網(wǎng)頁下載到本地,形成一個互聯(lián)網(wǎng)內(nèi)容的鏡像備份。A)正確B)錯誤答案:對解析:[判斷題]79.擴展庫os中的方法remove()可以刪除帶有只讀屬性的文件。A)正確B)錯誤答案:錯解析:[判斷題]80.屬性的測量值與屬性的值的意義是完全對等的A)正確B)錯誤答案:錯解析:[判斷題]81.SQL語言中,條件年齡BETWEEN15AND35,表示年齡在15至35之間,且包括15歲但不包括35歲。A)正確B)錯誤答案:錯解析:[判斷題]82.如果一個項集是不頻繁的,則其所有的超集都是不頻繁的。利用這一性質(zhì)可以簡化Apriori算法中的計算過程。A)正確B)錯誤答案:對解析:[判斷題]83.POST請求的安全性更高,使用場合比GET請求多。A)正確B)錯誤答案:對解析:[判斷題]84.如果路徑表達式以?/?開始,那么該路徑就代表著到達某個節(jié)點的絕對路徑。A)正確B)錯誤答案:對解析:[判斷題]85.凝聚層次聚類法中每次簇的合并可以更改。A)正確B)錯誤答案:錯解析:[判斷題]86.文件對象的tell()方法用來返回文件指針的當(dāng)前位置。A)正確B)錯誤答案:對解析:[判斷題]87.標準庫os的rename()方法可以實現(xiàn)文件移動操作。A)正確B)錯誤答案:對解析:[判斷題]88.在主成分分析中,每個主成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論