![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)_第1頁](http://file4.renrendoc.com/view/3ab63556e440d309f72cfde2da0db037/3ab63556e440d309f72cfde2da0db0371.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)_第2頁](http://file4.renrendoc.com/view/3ab63556e440d309f72cfde2da0db037/3ab63556e440d309f72cfde2da0db0372.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)_第3頁](http://file4.renrendoc.com/view/3ab63556e440d309f72cfde2da0db037/3ab63556e440d309f72cfde2da0db0373.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)_第4頁](http://file4.renrendoc.com/view/3ab63556e440d309f72cfde2da0db037/3ab63556e440d309f72cfde2da0db0374.gif)
![大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)_第5頁](http://file4.renrendoc.com/view/3ab63556e440d309f72cfde2da0db037/3ab63556e440d309f72cfde2da0db0375.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
試卷科目:大數(shù)據(jù)挖掘技術(shù)練習(xí)大數(shù)據(jù)挖掘技術(shù)練習(xí)(習(xí)題卷3)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大數(shù)據(jù)挖掘技術(shù)練習(xí)第1部分:單項選擇題,共144題,每題只有一個正確答案,多選或少選均不得分。[單選題]1.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標(biāo)之間的數(shù)量關(guān)系()NPV>0A)當(dāng)PI<1,時,IRR>iNPV>0B)當(dāng)PI>1,時,IRR>iNPV<0C)當(dāng)PI<1時,IRR>i,NPV<0、當(dāng)DPI>1IRR>i,時,[單選題]2.在無線數(shù)據(jù)端到端指標(biāo)體系中,即時通信首包響應(yīng)時延的指標(biāo)定義是?A)即時通信業(yè)務(wù)第一個HTTP響應(yīng)包時延的平均值B)即時通信業(yè)務(wù)最后一個HTTP數(shù)據(jù)包時延的平均值C)即時通信業(yè)務(wù)所有HTTP數(shù)據(jù)包時延的平均值[單選題]3.《客戶滿意度畫像分析》應(yīng)用落地手冊中采用的核心算法是()A)聚類算法B)C4.5決策樹C)隨機森林D)梯度提升樹[單選題]4.利用內(nèi)置函數(shù),定義一個1行6列元素全為1的數(shù)組N3A)N3=np.ones(6).reshape(1,6)B)N3=np.ones(6).shape(1,6)C)N3=np.arange(6).reshape(1,6)D)N3=np.arange(6).shape(1,6)[單選題]5.VOLTE業(yè)務(wù)評估體系中,VOLTE語音掉線率屬于哪一類指標(biāo)?A)保持性B)接入性C)完整性D)移動性[單選題]6.HTTP響應(yīng)中404代碼指的是()A)請求被服務(wù)器拒絕B)服務(wù)器無法找到請求的URLC)不允許使用此方法請求相應(yīng)的URLD)服務(wù)器內(nèi)部錯誤[單選題]7.#003400380032003000371582425285338以下關(guān)于Python語言中?縮進?說法正確的是:A)縮進統(tǒng)一為4個空格B)縮進在程序中長度統(tǒng)一且強制使用C)縮進是非強制的,僅為了提高代碼可讀性D)縮進可以用在任何語句之后,表示語句間的包含關(guān)系[單選題]8.若{a,b}、{a,c}、{b,c}和(a,b,c}都是頻繁項集,它們的計數(shù)分別是6、5、4、3,則關(guān)聯(lián)規(guī)則aandc→b的置信度是()A)1/2B)3/5C)3/4D)以上都不對[單選題]9.區(qū)塊鏈本身并非是一項全新技術(shù),而是多項技術(shù)的集成式創(chuàng)新,其中不包括()A)分布式網(wǎng)絡(luò)B)數(shù)據(jù)加密C)共識機制、智能合約D)機械自動化[單選題]10.假設(shè)某分類器在一個測試數(shù)據(jù)集上的分類結(jié)果的混淆矩陣如下所示,該分類器的召回率為()。PredictedyesnoActualyes155no1020A)75%B)80%C)60%D)70%[單選題]11.如下表所示,交易號(D)商品(tems)1beer,diaper,nuts2beer,biscuit,diaper3bread,butter,cheese4beer,cheese,diaper,nuts5beer,butter,cheese,nuts1)X={butter,cheese},則支持度support()=()。A)2/5B)4/5C)1/5D)3/5[單選題]12.以下哪個聚類算法不屬于基于網(wǎng)格的聚類算法()A)STINGB)MAFIAC)BIRCHD)WaveCluster[單選題]13.在下列抽樣方法中,需要預(yù)先將樣本指定多個組的抽樣方法是()。A)有放回的簡單隨機抽樣B)無放回的簡單隨機抽樣C)分層抽樣D)漸進抽樣[單選題]14.數(shù)據(jù)科學(xué)家可能會同時使用多個算法(模型)進行預(yù)測,并且最后把這些算法的結(jié)果集成起來進行最后的預(yù)測(集成學(xué)習(xí)),以下對集成學(xué)習(xí)說法正確的是A)單個模型之間有高相關(guān)性B)單個模型之間有低相關(guān)性C)在集成學(xué)習(xí)中使用?平均權(quán)重?而不是?投票?會比較好D)單個模型都是用的一個算法[單選題]15.什么是KDD?()A)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B)領(lǐng)域知識發(fā)現(xiàn)C)文檔知識發(fā)現(xiàn)D)動態(tài)知識發(fā)現(xiàn)[單選題]16.什么是KDD?A)數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B)領(lǐng)域知識發(fā)現(xiàn)C)文檔知識發(fā)現(xiàn)D)動態(tài)知識發(fā)現(xiàn)[單選題]17.在基本DBSCAN的參數(shù)選擇方法中,點到它的K個最近鄰的距離中的K選作為哪一個參數(shù)()A)EpsB)MinPtsC)質(zhì)心D)邊界[單選題]18.假設(shè)file是文本文件對象,下列選項中,哪個用于讀取一行?()A)file.read()B)file.read(200)C)file.readline()D)file.readlines()[單選題]19.下列選項中,屬于非結(jié)構(gòu)化數(shù)據(jù)的是:A)圖像B)HTMLC)XMLD)JSON[單選題]20.假設(shè)某分類器在一個測試數(shù)據(jù)集上的分類結(jié)果的混淆矩陣如下所示,該分類器的準(zhǔn)確率accuracy為()。A)75%B)80%C)66.7%D)70%[單選題]21.當(dāng)前國內(nèi)社會中,最為突出的大數(shù)據(jù)環(huán)境是()A)互聯(lián)網(wǎng)B)物聯(lián)網(wǎng)C)綜合國力D)自然資源[單選題]22.RFM方法中的F說明客戶的()A)興趣度B)粘性C)當(dāng)前價值D)未來價值[單選題]23.OLAP技術(shù)路線分類不包括A)ROLAPB)MOLAPC)HOLAPD)VoLAP[單選題]24.分類器效果檢驗中的準(zhǔn)確率是指()A)預(yù)測正確的數(shù)據(jù)在總數(shù)據(jù)中的比例B)預(yù)測為正的數(shù)據(jù)在總數(shù)據(jù)中的比例C)預(yù)測為正的數(shù)據(jù)中實際為正的數(shù)據(jù)所占比例D)實際為正的數(shù)據(jù)中被預(yù)測為正的數(shù)據(jù)所占比例[單選題]25.下列對學(xué)生相關(guān)屬性描述中,不是標(biāo)稱屬性的是()A)身高B)頭發(fā)顏色C)學(xué)號D)婚姻狀況[單選題]26.在一個C類地址的網(wǎng)段中要劃分出15個子網(wǎng),下面哪個子網(wǎng)掩碼比較適合A)52B)40C)48D)55[單選題]27.運行以下代碼Fromsklearn.datasetsimportload_irisIris_data=load_iris()Iris_data.data.shape輸出結(jié)果為(150,4)。則表示iris數(shù)據(jù)集包括樣本個數(shù)為()。A)150B)154C)600D)4[單選題]28.考慮值集{1、2、3、4、5、90},其截斷均值(p=20%)是)A)2B)3C)3.5D)5[單選題]29.數(shù)據(jù)集成的內(nèi)容不包括()A)實體識別B)冗余處理C)數(shù)據(jù)規(guī)約D)數(shù)值沖突處理[單選題]30.下列哪個不屬于個人信息影響評估原則()A)個人信息的處理目的、處理方式等是否合法、正當(dāng)、必要B)對個人的影響及風(fēng)險程度C)誰主管誰負(fù)責(zé)D)所采取的安全保護措施是否合法、有效并與風(fēng)險程度相適應(yīng)。[單選題]31.以下哪一點不是PCI規(guī)劃需要重點關(guān)注的A)頻率B)RS位置C)小區(qū)位置關(guān)系D)TA歸屬[單選題]32.已知x和y是兩個等長的整數(shù)列表,那么表達式sum((i*jfori,jinzip(x,y)))的作用是計算這兩個列表所表示的向量的()A)坐標(biāo)B)內(nèi)積C)方向D)大小[單選題]33.使用人工智能,面對數(shù)據(jù)被記錄,隱私被泄漏的風(fēng)險,應(yīng)該()A)寧愿放棄便捷,也要選擇隱私B)完全不擔(dān)心隱私泄露C)不放棄數(shù)據(jù)帶來便捷和智能,但是互聯(lián)網(wǎng)公司要像銀行一樣,有責(zé)任保護我們的數(shù)據(jù)安全D)無所謂[單選題]34.以下哪些算法是基于規(guī)則的分類器A)C4.5B)KNNC)Na?veBayesD)ANN[單選題]35.正則表達式?[^a-z]?,可以匹配下列的字符串為()。A)aB)zC)2D)m[單選題]36.ODS是指()A)企業(yè)數(shù)據(jù)中心;B)數(shù)據(jù)倉庫C)操作型存儲D)總線[單選題]37.下列哪個描述是正確的?()A)分類和聚類都是有監(jiān)督的學(xué)習(xí)B)分類和聚類都是無監(jiān)督的學(xué)習(xí)C)分類是有監(jiān)督的學(xué)習(xí),聚類是無監(jiān)督的學(xué)習(xí)D)分類是無監(jiān)督的學(xué)習(xí),聚類是有監(jiān)督的學(xué)習(xí)[單選題]38.物聯(lián)網(wǎng)業(yè)務(wù)的DNS解析環(huán)節(jié)DNS解析返回的錯誤碼為Resultcode=1,代表何種含義A)成功B)格式錯誤,無法解析C)域名服務(wù)器錯誤D)DNS不支持該請求[單選題]39.若P(H)==0.5,P(X)==0.8,P(X|H)=0.7.則P(H|X)為()。A)0.475B)0.57C)0.4375D)0.5[單選題]40.OLAP系統(tǒng)按照其數(shù)據(jù)在存儲器中的存儲格式可以分為()三種類型。A)關(guān)系OLAP、對象OLAP、混合型OLAPB)關(guān)系OLAP、混合型OLAP、多維OLAPC)對象OLAP、混合型OLAP、多維OLAPD)關(guān)系OLAP、對象OLAP、多維OLAP[單選題]41.利用?linear_model.LinearRegression()?訓(xùn)練模型時調(diào)用.fit()方法需要傳遞的第一個參數(shù)是()。A)樣本特征XB)樣本權(quán)重C)是否考慮計算截距D)樣本標(biāo)簽Y[單選題]42.下面有關(guān)分類算法的準(zhǔn)確率、召回率、F1值的描述,錯誤的是()A)準(zhǔn)確率是檢索出相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率,衡量的是檢索系統(tǒng)的查準(zhǔn)率B)召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率,衡量的是檢索系統(tǒng)的查全率C)正確率、召回率和F值取值都在0和1之間,數(shù)值越接近0,查準(zhǔn)率或查全率就越高D)為了解決準(zhǔn)確率和召回率沖突問題,引入了F1分?jǐn)?shù)[單選題]43.下述哪種方法可以對評估模型發(fā)現(xiàn)模型存在偏差的問題進行改進A)增加特征B)減少特征C)增加數(shù)據(jù)D)減少數(shù)據(jù)[單選題]44.連接控制、流控制、報文分段等屬于哪一層的功能A)物理層B)數(shù)據(jù)鏈路層C)網(wǎng)絡(luò)層D)傳輸層[單選題]45.被廣泛用于購物籃分析的是()。A)關(guān)聯(lián)分析;B)分類和預(yù)測C)聚類分析D)演變分析[單選題]46.樸素貝葉斯分類算法為()A)生成式模型B)判別式模型C)統(tǒng)計模型D)預(yù)算模型[單選題]47.IMEI中哪部分與終端型號相關(guān)()A)SNRB)TACC)CDD)MSISDN[單選題]48.某小區(qū)60%居民訂晚報,45%訂青年報,30%兩報均訂,隨機抽一戶。則至少訂一種報的概率為()A)0.82B)0.85C)0.80D)0.75[單選題]49.在多元回歸模型的檢驗中,目的是檢驗每一個自變量與因變量在指定顯著性水平上是否存在線性相關(guān)關(guān)系的檢驗是()A)r檢驗B)t檢驗C)f檢驗D)DW檢驗[單選題]50.數(shù)據(jù)倉庫是隨著時間變化的,下面的描述不正確的是A)數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容;B)捕捉到的新數(shù)據(jù)會覆蓋原來的快照;C)數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容;D)數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合.[單選題]51.對于下圖,一個比較好的主成分選擇是多少?A)7B)30C)35D)不能確定[單選題]52.關(guān)于OLAP和OLTP的說法,下列不正確的是:A)OLAP事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高.B)OLAP的最終數(shù)據(jù)來源與OLTP不一樣.C)OLTP面對的是決策人員和高層管理人員.D)OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動的.[單選題]53.個人信息保護影響評估報告和處理情況記錄應(yīng)當(dāng)至少保存()年。A)一B)十C)五D)三[單選題]54.CART算法采用的是基尼(Gini)指數(shù)(選Gini指數(shù)最小的特征s)作為分裂標(biāo)準(zhǔn),同時它也包含后剪枝操作。CART算法生成的是一棵()。A)二叉樹B)三叉樹C)決策樹D)FP樹[單選題]55.在數(shù)據(jù)清洗中,對?臟?數(shù)據(jù)源需要進行操作處理,不包括以下哪個方面A)完全清除某些輸入字段B)自動替換掉某些錯誤數(shù)據(jù)值C)對分配和調(diào)整的規(guī)則進行完備的文檔記錄D)補入一些丟失的數(shù)據(jù)[單選題]56.打開文件進行讀寫,操作完成后應(yīng)該調(diào)用()方法關(guān)閉文件,以釋放資源A)closeB)openC)writeD)read[單選題]57.下面關(guān)于time庫引用不正確的是()A)from*importtimeB)importtimeC)fromtimeimport*D)fromtimeimportstrftime[單選題]58.在上網(wǎng)業(yè)務(wù)問題診斷中,以下哪一種錯誤現(xiàn)象需要進一步定位用戶側(cè)問題?A)發(fā)送SNY_ack后用戶端無ackB)附著失敗返回#96C)DNS解析失敗返回#3D)HTTP失敗返回#400-500[單選題]59.以下那一項不是大數(shù)據(jù)提供的用戶交互方式是()。A)企業(yè)報表;B)查詢C)大數(shù)據(jù)分析挖掘D)可視化[單選題]60.下列selenium庫的方法中,通過元素名稱進行單元素定位的是()A)find_element_by_nameB)find_elements_by_nameC)find_elements_by_idD)find_elements_by_class_name[單選題]61.以下有關(guān)貝葉斯信念網(wǎng)絡(luò)(BBN)的敘述中錯誤的是()A)BBN是一個有向無環(huán)圖B)BBN中每個結(jié)點代表一個隨機變量C)BBN中每條有向邊表示變量之間的依賴關(guān)系D)BBN中最多只有一個輸出結(jié)點[單選題]62.利用?linear_model.LinearRegression()?訓(xùn)練模型時調(diào)用.fit()方法需要傳遞的第一個參數(shù)是()。A)是否考慮計算截距B)樣本權(quán)重C)樣本特征XD)樣本標(biāo)簽Y[單選題]63.在DPI規(guī)范中,視頻對應(yīng)的業(yè)務(wù)大類ID為()A)3B)4C)5D)6[單選題]64.數(shù)據(jù)框中方法中dropna()的作用是A)去掉空值,并以默認(rèn)值填充B)去掉空值所在的行C)去掉指定的某行D)去掉指定的某些值[單選題]65.MME附著用戶數(shù)的指標(biāo)來源是A)網(wǎng)管系統(tǒng)B)網(wǎng)優(yōu)平臺C)集中性能平臺D)大數(shù)據(jù)平臺[單選題]66.以下哪些網(wǎng)元不是VoLTE特有網(wǎng)元A)MGCFB)S-CSCFC)MMED)SBC[單選題]67.基于()算法,實現(xiàn)人流量、業(yè)務(wù)量、話務(wù)量等因素對無線資源的精準(zhǔn)預(yù)測A)神經(jīng)網(wǎng)絡(luò)B)K-meansC)K-medoidsD)FP-growth[單選題]68.已知顧客的消費記錄:I1:西紅柿、排骨、雞蛋I2:西紅柿、茄子I3:雞蛋、襪子I4:西紅柿、排骨、茄子西紅柿茄子的支持度是(),置信度是()A)0.50.67B)0.50.5C)0.670.5D)0.250.67[單選題]69.C4.5算法以()作為分類選擇的依據(jù)。A)信息熵最大B)條件熵最大C)信息增益最大D)信息增益率最大[單選題]70.以下哪個算法是無監(jiān)督學(xué)習(xí)算法:()A)樸素貝葉斯B)LinearRegressionC)K-MeansD)支持向量機[單選題]71.以下哪種情況對Kmeans模型的影響較?。ǎ)給定錯誤聚類個數(shù)B)簇的大小分布不均衡C)不同簇的方差相差較大D)數(shù)據(jù)有各向異性分布[單選題]72.有關(guān)頻繁項集的敘述中正確的是()。A)頻繁項集是滿足最小支持度閾值和最小置信度閾值的項集B)頻繁項集是滿足最小支持度閾值的項集C)頻繁項集是滿足最小置信度閾值的項集D)頻繁項集是任何項集[單選題]73.面對人工智能可能存在高度風(fēng)險,暗藏危機,我們應(yīng)()A)因人類的生物進化速度相當(dāng)有限,終將被人工智能淘汰,所以要阻斷人工智能發(fā)展B)人工智能對人類造成威脅論調(diào)沒有科研依據(jù),人工智能可以隨意發(fā)展C)以盡力發(fā)展為前提,擁抱AI技術(shù)的同時,多多考慮如何避免損害人類D)不必去面對此類問題[單選題]74.AlphaGo使用()徹底解決了圍棋游戲搜索空間巨大的問題A)深度神經(jīng)網(wǎng)絡(luò)和蒙特卡羅樹搜索B)狂暴算力和窮舉法C)總結(jié)新的圍棋范式D)收集大量棋局?jǐn)?shù)據(jù)[單選題]75.通過加入特定的____,可以將爬蟲發(fā)出的請求偽裝成瀏覽器。A)RequestB)openerC)HeadersD)User_Agent[單選題]76.有些數(shù)據(jù)挖掘算法,要求數(shù)據(jù)屬性是標(biāo)稱類別,當(dāng)數(shù)據(jù)中包含數(shù)值屬性時,為了使用這些算法需要將數(shù)值屬性轉(zhuǎn)換成標(biāo)稱屬性。通過采取各種方法將數(shù)值屬性的值域劃分成一些小的區(qū)間,并將這連續(xù)的小區(qū)間與離散的值關(guān)聯(lián)起來,每個區(qū)間看作一個類別。例如,某個問題中的年齡屬性一種可能的劃分成類別操作是:[0…11]→兒童,[12…17]→青少年,[18…44]→青年,[45…69]→中年,[69…∞]→老年。這種將連續(xù)變量劃分成不同類別的過程通常稱為()。A)特征化B)優(yōu)化C)標(biāo)準(zhǔn)化D)離散化[單選題]77.為了可以把多個評估器鏈接成一個復(fù)合評估器,sklearn中提供了PipeLine機制,下面關(guān)于PipeLine描述不正確的是()A)管道中的最后一個評估器一定要是一個實現(xiàn)了predict方法的學(xué)習(xí)器B)管道中的所有評估器,除了最后一個評估器,管道中的所有評估器必須都是轉(zhuǎn)換器。C)管道中的評估器參數(shù)可以通過<estimator>__語義來訪問D)管道中的評估器可以通過索引或名稱訪問[單選題]78.pow(x,0.5)能夠計算x的平方根,計算負(fù)數(shù)的平方根將產(chǎn)生:A)程序崩潰B)復(fù)數(shù)C)ValueError錯誤D)無輸出[單選題]79.線性模型中使用的函數(shù)不包括()A)g(x)聯(lián)系函數(shù)B)單位階躍函數(shù)C)Sigmoid函數(shù)D)API函數(shù)[單選題]80.字典的()方法返回字典的?鍵?列表A)keys()B)key()C)values()D)items()[單選題]81.下列關(guān)于DPI規(guī)則識別中業(yè)務(wù)大類的說法錯誤的是?A)業(yè)務(wù)大類為1的是即時通信類業(yè)務(wù)B)數(shù)據(jù)流量業(yè)務(wù)大類分類除了其他業(yè)務(wù)外一共有15類C)視頻大類不包括傳統(tǒng)意義上基于P2P技術(shù)的視頻業(yè)務(wù)D)彩信單獨屬于一類業(yè)務(wù)大類[單選題]82.當(dāng)你輸入hadoopfsck/造成?connectionrefusedjavaexception??時,系統(tǒng)究竟發(fā)生了什么?A)datanode出現(xiàn)故障B)resoucemanger出現(xiàn)故障C)nodemanger出現(xiàn)故障D)Namenode出現(xiàn)故障[單選題]83.下面關(guān)于構(gòu)建模型樹的說法中,錯誤的是()。A)如果當(dāng)前結(jié)點t所關(guān)聯(lián)的數(shù)據(jù)集Dt中樣本個數(shù)小于給定閾值或者Dt中樣本的目標(biāo)屬性取值的標(biāo)準(zhǔn)差小于給定閾值,則將該結(jié)點標(biāo)記為葉子節(jié)點B)創(chuàng)建一個結(jié)點t,與結(jié)點t關(guān)聯(lián)的數(shù)據(jù)集記為DtC)在選擇分類屬性時,應(yīng)選擇時SDR值最小的屬性D)SDR代表誤差的期望減少[單選題]84.下列哪項活動屬于數(shù)據(jù)挖掘A)根據(jù)性別劃分公司的顧客B)使用歷史記錄預(yù)測公司未來的股票價格C)預(yù)測骰子的結(jié)果D)計算公司的總銷售額[單選題]85.樸素貝葉斯分類中得到條件概率的方法錯誤的是()。A)對于定量屬性,假設(shè)變量服從某種概率分布,通過訓(xùn)練數(shù)據(jù)集估計分布的參數(shù)B)對于定性屬性,計算某一類別的樣本中某種屬性取該值的樣本所占比例來近似C)對于定量屬性,將取值離散化變?yōu)閰^(qū)間,再當(dāng)做定性屬性處理D)對于定性屬性,將轉(zhuǎn)化為定量屬性,再計算相應(yīng)的概率[單選題]86.Python中Pandas的Series對象中查看數(shù)據(jù)集中有多少個觀察值,采用哪個命令A(yù))headB)infoC)shapeD)columns[單選題]87.為支撐市場營銷,除下述哪個用戶終端特征識別外,均能用于提高批開用戶的VoLTE轉(zhuǎn)化成功率A)軟件版本B)軟開關(guān)狀態(tài)識別C)VoLTE版本D)芯片版本[單選題]88.eNodeB對哪種類型的數(shù)據(jù)進行完整性保護()A)RRCsignallingB)NASsignallingC)UserplanedataD)SystemInformation[單選題]89.下列不屬于標(biāo)稱屬性的是()。A)眼球顏色B)性別C)溫度D)郵政編碼[單選題]90.如何退出vi編輯器輸入模式?1按ESC;2鍵入:q(如果你沒有輸入任何當(dāng)下)3或者鍵入:wq(如果你已經(jīng)輸入當(dāng)下)4按下Enter。A)1、3、2、4B)3、2、1、4C)2、1、3、4D)1、2、3、4[單選題]91.如何檢查Namenode是否正常運行A)jpsB)java-versionC)jpsstatusD)namenodestatus[單選題]92.回歸分析的第一步是()A)確定解釋量和被解釋變量B)確定回歸模型C)建立回歸方程D)進行檢驗[單選題]93.如下表所示,X={butter,cheese},Y={beer},則置信度confidence(X→Y)=()。交易號(TID)商品(Items)1beer,diaper,nuts2beer,biscuit,diaper3bread,butter,cheese4beer,cheese,diaper,nuts5beer,butter,cheese,nutsA)2/5B)1/3C)1/2D)1/4[單選題]94.在一個表中有字段?專業(yè)?,要查找包含?信息?兩個字的記錄,正確的表達式是______。A)LEFT(專業(yè),2)="信息"B)LIKE"%信息%"C)LIKE"_信息_"D)RIGHT(專業(yè),2)="信息"[單選題]95.SPSS最突出的特點是A)處理效率高B)界面友好C)結(jié)果準(zhǔn)確D)操作方便[單選題]96.使用urlopen()方法發(fā)送請求后,服務(wù)器會返回一個____類型的對象。A)HTTPResponseB)ResponseHTTPC)ResponseD)ServiceResponse[單選題]97.有如下的數(shù)據(jù)表:部門(部門號,部門名稱),職工(部門號,職工號,姓名,基本工資)。檢索有職工的基本工資大于或等于?11?部門中任意一名職工工資的?部門號?,正確的語句是______。A)SELECTDISTINCT部門號FROM職工WHERE基本工資>=ANY(SELECT基本工資FROM職工WHERE部門號='11');B)SELECTDISTINCT部門號FROM職工WHERE基本工資>=ALL(SELECT基本工資FROM職工WHERE部門號='11');C)SELECTDISTINCT部門號FROM職工WHERE基本工資>=ANY(SELECTMAX(基本工資)FROM職工WHERE部門號='11');D)SELECTDISTINCT部門號FROM職工WHERE基本工資>=ALL(SELECTMIN(基本工資)FROM職工WHERE部門號='11');[單選題]98.下面哪個不是PythonRequests庫提供的方法?A)head()B)post()C)push()D)get()[單選題]99.下列哪項最恰當(dāng)?shù)孛枋隽私CP連接時?第一次握手?所做的工作A)?連接發(fā)起方?向?接收方?發(fā)送一個SYN-ACK段B)?接收方?向?連接發(fā)起方?發(fā)送一個SYN-ACK段C)?連接發(fā)起方?向目標(biāo)主機的TCP進程發(fā)送一個SYN段D)?接收方?向源主機的TCP進程發(fā)送一個SYN段作為應(yīng)答[單選題]100.性能分析主要包括采集原始的性能指標(biāo)、性能指標(biāo)的預(yù)處理、()、對網(wǎng)絡(luò)優(yōu)化工作完成情況進行跟蹤和評估四個階段A)生成性能分析報告B)生成性能告警C)制定性能分析規(guī)則D)性能與故障、投訴關(guān)聯(lián)[單選題]101.使能一臺IP地址為的主機訪問Internet的必要技術(shù)是A)靜態(tài)路由B)動態(tài)路由C)路由引入D)NAT[單選題]102.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展差、數(shù)據(jù)挖掘能力強等特點的分析工具是()。A)WekaB)SPSSC)SASD)R[單選題]103.蘋果的FaceID基于3D結(jié)構(gòu)光技術(shù),硬件上不需要()A)點發(fā)射器B)紅外發(fā)射器C)紅外攝像頭D)數(shù)據(jù)線[單選題]104.可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。A)決策樹、對數(shù)回歸、關(guān)聯(lián)模式B)K均值法、SOM神經(jīng)網(wǎng)絡(luò)C)Apriori算法、FP-Tree算法D)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹[單選題]105.正則表達式字符集中,()表示非數(shù)字A)\dB)\DC)\sD)\w[單選題]106.MySQL是()A)操作系統(tǒng);B)數(shù)據(jù)庫C)聊天軟件D)瀏覽器[單選題]107.在FP-GROWTH算法中,已構(gòu)造FP-Tree如圖則項I5的條件模式基為A)<(I1,I2:1)>、<I1,I3:1>B)<(I2,I1:1)>、<I2,I1,I3:1>C)<(I2,I1:1)>、<I1,I3,I2:1>D)<(I1,I2:1)>、<I2,I1,I3:1>[單選題]108.關(guān)于字符編碼的類型中,用于指明瀏覽器可接受簡體中文的是()A)gb2312B)iso-8859-1C)utf-8D)utf[單選題]109.某牙膏廠原來生產(chǎn)兩面針?biāo)幬镅栏?現(xiàn)在又增加牙刷生產(chǎn),這屬于()A)同心多元化B)水平多元化C)集團多元化D)相關(guān)多元化[單選題]110.統(tǒng)計檔案表中學(xué)生來自多少個城市,下面SQL語句正確的是______。A)SELCETSUM(DISTINCT家庭住址)FROM檔案表;B)SELCETDISTINCT家庭住址FROM檔案表;C)SELCETCOUNT(家庭住址)FROM檔案表;D)SELCETCOUNT(DISTINCT家庭住址)FROM檔案表;[單選題]111.在中移動的集中性能管理應(yīng)用落地-物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析手冊中,其定界流程是基于:A)八元六階B)七元五階C)六元四階D)五元三階[單選題]112.可以對按城市匯總的銷售數(shù)據(jù)進行(),來觀察按國家總的數(shù)據(jù)。A)上卷B)下鉆C)切片D)切塊[單選題]113.時間序列對象一般使用pandas的()生成A)concat()函數(shù)B)append()方法C)date_range()函數(shù)D)time()函數(shù)[單選題]114.用戶能正常使用VOLTE終端,打VOLTE電話,然后用戶VOLTE終端關(guān)機,將SIM卡放入2G終端,并且撥打電話后,再關(guān)機,將SIM卡放回原VOLTE終端,開機后,這時用戶撥打電話會出現(xiàn)以下哪個現(xiàn)象A)用戶通話CSFB回落B)用戶能正常打通VOLTE高清電話C)用戶通話失敗,終端話筒無聲D)VOLTE終端出現(xiàn)脫網(wǎng)[單選題]115.S1-MME接口信息中,ProcedureStatus超時的標(biāo)識為A)0B)1C)2D)255[單選題]116.下列有關(guān)熵的描述,錯誤的是()A)在信息論中,是接收的每條信息中包含的信息平均量B)表示隨機變量不確定性的度量C)比較不可能發(fā)生的事情,當(dāng)它發(fā)生了,會提供更多的信息D)熵越大,隨機變量的不確定性就越小[單選題]117.在以下不同的場景中,使用的分析方法不正確的是?()A)根據(jù)商家最近一年的經(jīng)營及服務(wù)數(shù)據(jù),用聚類算法判斷出天貓商家在各自主營類目下所屬的商家層級B)根據(jù)商家近幾年的成交數(shù)據(jù),用聚類算法擬合出用戶未來一個月可能的消費金額公式C)用關(guān)聯(lián)規(guī)則算法分析出購買了汽車坐墊的買家,是否適合推薦汽車腳墊D)根據(jù)用戶最近購買的商品信息,用決策樹算法識別出淘寶買家可能是男還是女[單選題]118.下面哪個說法是不正確的?A)一個HTML文檔與BeautifulSoup對象等價B)標(biāo)簽樹上除了標(biāo)簽外,節(jié)點還可能是字符串(NavigableString)類型。C)一個HTML文檔與一個標(biāo)簽樹等價D)一個HTML文檔可以包含多個標(biāo)簽樹[單選題]119.DPI采集中,需要獲取VoLTEeSRVCC切換信息,需要采集的接口是()A)GmB)MwC)SvD)Mg[單選題]120.下列方法中,能夠用來設(shè)置代理服務(wù)器的是____。A)urlopenB)ProxyHandlerC)urldecodeD)Proxy[單選題]121.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()A)CREATESCHEMAB)CREATETABLEC)CREATEVIEWD)CREATEDATABASE[單選題]122.下面哪個業(yè)務(wù)不屬于即時通信類業(yè)務(wù)?A)微信B)QQC)陌陌D)淘寶[單選題]123.即時通信業(yè)務(wù)的XDR類型編碼是A)100B)101C)110D)113[單選題]124.OLAM技術(shù)一般簡稱為?數(shù)據(jù)聯(lián)機分析挖掘?,下面說法正確的是:A)OLAP和OLAM都基于客戶機/服務(wù)器模式,只有后者有與用戶的交互性;B)由于OLAM的立方體和用于OLAP的立方體有本質(zhì)的區(qū)別.C)基于WEB的OLAM是WEB技術(shù)與OLAM技術(shù)的結(jié)合.D)OLAM服務(wù)器通過用戶圖形借口接收用戶的分析指令,在元數(shù)據(jù)的知道下,對超級立方體作一定的操作.[單選題]125.關(guān)聯(lián)規(guī)則的評價指標(biāo)是:()。A)均方誤差、均方根誤差B)Kappa統(tǒng)計、顯著性檢驗C)支持度、置信度D)平均絕對誤差、相對誤差[單選題]126.缺失值處理方法中錯誤的是()。A)對于所有屬性都可以使用均值B)對于離散屬性或定性屬性,使用眾數(shù)C)對于分類屬性,使用同類對象屬性值的均值D)轉(zhuǎn)換為分類問題或數(shù)值預(yù)測問題[單選題]127.只要具有適當(dāng)?shù)恼咄苿?大數(shù)據(jù)的使用將成為未來提高競爭力、生產(chǎn)力、創(chuàng)新能力以及()的關(guān)鍵要素。A)提高消費B)提高GDPC)提高生活水平D)創(chuàng)造消費者盈余[單選題]128.收到全省性的咪咕閱讀業(yè)務(wù)無法使用問題,下述維度中優(yōu)先排查的是哪個A)終端B)PGWC)地市D)MME[單選題]129.為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問題屬于數(shù)據(jù)挖掘的哪一類任務(wù)?A)探索性數(shù)據(jù)分析B)建模描述C)預(yù)測建模D)尋找模式和規(guī)則[單選題]130.T檢驗比較A)兩個方差B)兩個比值C)兩個平均數(shù)的差異是否顯著D)標(biāo)準(zhǔn)差[單選題]131.下述方法不屬于聚類方法的是()A)K-均值B)K-中心性C)DBSCAN算法D)神經(jīng)網(wǎng)絡(luò)[單選題]132.大數(shù)據(jù)是指()A)一個圖書館內(nèi)的書籍信息B)無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)C)城市管理信息D)Facebook用戶信息[單選題]133.DPI技術(shù)主要應(yīng)用在ISO分層的哪一層?A)網(wǎng)絡(luò)層B)會話層C)應(yīng)用層D)數(shù)據(jù)鏈路層[單選題]134.下列關(guān)于數(shù)據(jù)規(guī)范化說法錯誤的是()。A)數(shù)據(jù)規(guī)范化是為了給重要的屬性賦予更大的權(quán)重B)數(shù)據(jù)規(guī)范化又稱為數(shù)據(jù)標(biāo)準(zhǔn)化C)數(shù)據(jù)規(guī)范化是將屬性的取值范圍統(tǒng)一D)數(shù)據(jù)規(guī)范化是為了避免不同屬性的不平等地位[單選題]135.關(guān)于OLAP和OLTP的說法,下列不正確的是:()A)OLAPB)OLAPC)OLTPD)OLTP[單選題]136.有關(guān)數(shù)據(jù)倉庫建模的敘述中正確的是()。A)因為需求分析中已經(jīng)考慮主題,建模時不再需要確定主題域B)因為需求分析中已經(jīng)確定項目的所有功能,沒有必要再進行數(shù)據(jù)倉庫建模工作C)數(shù)據(jù)倉庫建模是設(shè)計概念模型,繼而導(dǎo)出邏輯模型D)數(shù)據(jù)倉庫建模是設(shè)計物理模型[單選題]137.以下關(guān)于字符串.strip()方法功能說明正確的是:A)連接兩個字符串序列B)替換字符串中特定字符C)按照指定字符分割字符串為數(shù)組D)去掉字符串兩側(cè)指定字符[單選題]138.下面哪項是集中性能管理面向終端專題()A)2/3G高流量小區(qū)遷移B)終端在網(wǎng)質(zhì)量評估分析C)客戶投訴溯源分析D)網(wǎng)絡(luò)實時性能監(jiān)控[單選題]139.用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任務(wù)?A)根據(jù)內(nèi)容檢索B)建模描述C)預(yù)測建模D)尋找模式和規(guī)則[單選題]140.一個神經(jīng)元接收輸人信號為x(1<i<n),權(quán)值為w;(1≤i<n),輸出為y=f(net),其中f稱為激活函數(shù)或激勵函數(shù),通常net的取值是()。A)AB)BC)CD)D[單選題]141.企業(yè)要建立預(yù)測模型,需準(zhǔn)備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是()A)數(shù)據(jù)越多越好B)盡可能多的適合的數(shù)據(jù)C)數(shù)據(jù)越少越好D)以上三條都不正確[單選題]142.用簡單隨機重復(fù)抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量需要擴大到原來的()A)2倍B)3倍C)4倍D)5倍[單選題]143.根據(jù)聚類形成的簇的特點,如果有交集的簇之間必然存在包含關(guān)系,這種聚類稱為()。A)重疊聚類B)層次型聚類C)劃分型聚類D)以上均不是[單選題]144.關(guān)于谷歌瀏覽器開發(fā)者工具描述錯誤的是()A)元素面板可查看元素在頁面的對應(yīng)位置B)源代碼面板可以查看HTML源碼C)網(wǎng)絡(luò)面板可以查看HTML源碼D)網(wǎng)絡(luò)面板可以查看HTTP頭部信息第2部分:多項選擇題,共47題,每題至少兩個正確答案,多選或少選均不得分。[多選題]145.KNN的優(yōu)點有()A)對測試樣本分類時的計算量大,內(nèi)存開銷大B)簡單,易于理解,易于實現(xiàn),無需估計參數(shù),無需訓(xùn)練C)適合對稀有事件進行分類(例如當(dāng)流失率很低時,比如低于0.5%,構(gòu)造流失預(yù)測模型)D)特別適合于多分類問題(multi-modal,對象具有多個類別標(biāo)簽),例如根據(jù)基因特征來判斷其功能分類,KNN比SVM的表現(xiàn)要好[多選題]146.主成分分析計算選擇相關(guān)系數(shù)計算法時,確定主成分個數(shù)的致原則包括()A)特征根值大于1B)特征根值大于3C)累積特征根值加總占總特征根值的80%以上D)累積特征根值加總占總特征根值的90%以上[多選題]147.在聚類分析當(dāng)中,可以處理任意形狀的簇的方法包括:A)MIN(單鏈)B)ChameleonC)MAX(全鏈)D)組平均[多選題]148.以下屬于數(shù)據(jù)預(yù)處理的是()A)缺失值填充B)噪聲數(shù)據(jù)剔除C)異常值識別D)數(shù)據(jù)可視化[多選題]149.數(shù)據(jù)挖掘的挖掘方法包括:()A)聚類分析B)回歸分析C)神經(jīng)網(wǎng)絡(luò)D)決策樹算法[多選題]150.以下哪些數(shù)據(jù)挖掘工具是開源的()A)KNIMEB)SPSSC)WEKAD)Orange[多選題]151.數(shù)據(jù)挖掘的算法,根據(jù)算法分析數(shù)據(jù)的方式可分為:A)假設(shè)檢驗型算法(Top-Down)B)知識發(fā)現(xiàn)型算法(Bottom-Up)C)掃描類比型算法(Left-Right)D)排除干擾型算法(Noise-Clean)[多選題]152.()都屬于簇有效性的監(jiān)督度量。A)輪廓系數(shù)B)共性分類相關(guān)系數(shù)C)熵D)F度量[多選題]153.下面關(guān)于季度模型的敘述,不正確的是()A)季度模型以季度數(shù)據(jù)為樣本B)季度模型主要用于季度預(yù)測C)季度模型注重長期行為的描述D)季度模型一般規(guī)模較大[多選題]154.TCP協(xié)議通過()來區(qū)分不同的連接A)IP地址B)映射名C)網(wǎng)絡(luò)域名D)端口號[多選題]155.《實時業(yè)務(wù)質(zhì)量監(jiān)控保障》落地手冊中提出的實時數(shù)據(jù)處理架構(gòu),給出了哪些參考架構(gòu)A)基于開源框架的流數(shù)據(jù)處理架構(gòu)B)基于自主研發(fā)的精簡XDR架構(gòu)C)基于MPP數(shù)據(jù)庫架構(gòu)D)基于Spark框架架構(gòu)[多選題]156.KQI與KPI指標(biāo)做關(guān)聯(lián)分析,通??刹捎媚膬深愃惴ǚ謩e做強、弱關(guān)聯(lián)關(guān)系的識別A)聚類B)相關(guān)系數(shù)C)決策樹D)邏輯回歸[多選題]157.文本挖掘的工具有A)IBMDB2intelligentMinerB)SASTextMinerC)SPSSTextMiningD)SPPTextMining[多選題]158.概率分析中,應(yīng)計算出()表明該風(fēng)險因素的風(fēng)險程度。A)變異系數(shù)B)期望值C)方差D)標(biāo)準(zhǔn)差[多選題]159.IP報文在網(wǎng)絡(luò)傳送途中被分片生成多個新的IP包,則以下說法正確的是A)新的IP包有相同的標(biāo)志(MF、DF)字段B)新的IP包有相同的標(biāo)識(Identification)字段C)新的IP包有相同的片偏移字段D)新的IP包有相同的目的地址字段[多選題]160.以下屬于聚類算法的是()。A)K均值B)DBSCANC)AprioriD)Jarvis-Patrick(JP)[多選題]161.以下哪些方法可以用于分類模型的特征選擇()A)chi2B)f_classifC)mutual_info_classifD)f_regression[多選題]162.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要,將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù)的過程。數(shù)據(jù)離散化的方法有()A)隨機取值B)等距離散法C)數(shù)值規(guī)約D)等頻離散法[多選題]163.下列哪些指標(biāo)用于評估回歸模型()A)R2B)F1C)MSED)MAE[多選題]164.大數(shù)據(jù)指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到()成為幫助企業(yè)經(jīng)營決策更積極目的的信息A)擷取B)管理C)處理D)整理[多選題]165.下面給出的t檢驗的結(jié)果,()表明接受原假設(shè),顯著性水平為0.05。A)0.000B)0.039C)0.092D)0.124[多選題]166.Scikit-Learn的數(shù)據(jù)表示包括A)數(shù)據(jù)表B)特征矩陣C)目標(biāo)數(shù)據(jù)D)傳遞函數(shù)[多選題]167.LTE中常用的集中動態(tài)資源調(diào)度算法A)輪詢調(diào)度算法RRB)最大載干比調(diào)度算法MaxC/IC)比例公平算法PFD)半持續(xù)調(diào)度算法SPS[多選題]168.下列哪些是hadoop的配置文件?A)core-site.xmlB)hdfs-site.xmlC)mapred-site.xmlD)hadoop-env.sh[多選題]169.關(guān)于DNS下列敘述正確的是()A)子節(jié)點能識別父節(jié)點的IP地址B)DNS采用客戶服務(wù)器工作模式C)域名的命名原則是采用層次結(jié)構(gòu)的命名樹D)域名不能反映計算機所在的物理地址[多選題]170.有了()和()之后,向量就可以在另一個坐標(biāo)系中進行表示A)方向B)大小C)特征值D)特征向量[多選題]171.下列何種算法可以幫助我們做數(shù)值的預(yù)測(Prediction)?A)AprioriB)DecisionTreeC)NaiveBayesD)LinearRegression[多選題]172.根據(jù)集中性能管理應(yīng)用《物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量分析》落地手冊,物聯(lián)網(wǎng)端到端定界的分析方法包括?()A)關(guān)聯(lián)分析B)回溯分析C)聚類分析D)根因分析[多選題]173.Web內(nèi)容挖掘?qū)崿F(xiàn)技術(shù)()A)文本總結(jié)B)文本分類C)文本聚類D)關(guān)聯(lián)規(guī)則[多選題]174.方差分析的基本假設(shè)前提包括()A)各處理條件下的樣本均來自正態(tài)總體B)各處理條件下的樣本相互獨立C)各處理條件下樣本的方差都相等D)各處理條件下樣本均值相等,方差可以不等[多選題]175.下邊關(guān)于字典的定義正確的是:A){'name':'Tom','age':18,'score':[91,92,93]}B){'name':'Tom','score':18,'score':[91,92,93]}C){'name':'Tom','chengji':18,[91,92,93]:'score'}D){'name':'Tom',18:'chengji','score':[91,92,93]}[多選題]176.偽分布模式中的注意點?A)偽分布式適用于開發(fā)和測試環(huán)境B)所有守護進程都在同一臺機器上運行C)守護進程在不同的機器上運行D)偽分布模式不能用于開發(fā)分布式代碼[多選題]177.根據(jù)《中國移動大數(shù)據(jù)安全管控分類分級實施指南》,以下哪些數(shù)據(jù)屬于B類數(shù)據(jù)A)短信、彩信、話音等通信內(nèi)容B)用戶通訊錄、好友列表、群組列表等用戶資料數(shù)據(jù)C)用戶上網(wǎng)訪問內(nèi)容D)即時通信內(nèi)容[多選題]178.數(shù)據(jù)挖掘主要構(gòu)建四大模型描述錯誤的是()A)聚類是依據(jù)歷史數(shù)據(jù)形成刻畫用戶特征的類標(biāo)識,進而可以預(yù)測未來數(shù)據(jù)的歸類情況B)分類指將物理或抽象對象的集合分組為由類似的對象組成的多個類的分析過程C)預(yù)測是基于輸入的用戶信息,通過模型的訓(xùn)練學(xué)習(xí),找出數(shù)據(jù)中的規(guī)律和趨勢,以確定未來目標(biāo)數(shù)據(jù)的預(yù)測值D)關(guān)聯(lián)分析又稱關(guān)聯(lián)挖掘,在數(shù)據(jù)或其他信息載體中,查找存在于項目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)[多選題]179.常用的非線性函數(shù)除了多項式函數(shù)之外,還包括()。A)冪函數(shù)B)對數(shù)函數(shù)C)雙曲函數(shù)D)指數(shù)函數(shù)[多選題]180.以下sklearn中的模型,哪些是解決回歸分析的?()A)LinearRegressionB)SVRC)LogisticRegressionD)Ridge[多選題]181.支持向量機中的非線性映射可以通過核函數(shù)來實現(xiàn),常用的核函數(shù)包括()A)高斯核函數(shù)B)多項式核函數(shù)C)S形核函數(shù)D)線性核[多選題]182.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲基礎(chǔ),其特點為()A)支持超大文件B)基于商用硬件C)流式數(shù)據(jù)訪問D)高吞吐量[多選題]183.促銷預(yù)算的方法主要有()。A)量入為出法B)競爭對等法C)銷售比例法D)目標(biāo)任務(wù)法[多選題]184.智能手機市場10年混戰(zhàn)之后,僅剩下()陣營A)蘋果IOSB)谷歌AndroidC)微軟D)聯(lián)想[多選題]185.非頻繁模式____A)其支持度小于閾值B)都是不讓人感興趣的C)包含負(fù)模式和負(fù)相關(guān)模式D)正確異常數(shù)據(jù)項敏感[多選題]186.Hadoop可以安裝在哪些操作系統(tǒng)?A)redhatlinuxB)centosC)UbuntuD)windows[多選題]187.()這些數(shù)據(jù)特性都是對聚類分析具有很強影響的。A)高維性B)規(guī)模C)稀疏性D)噪聲和離群點[多選題]188.在探索性數(shù)據(jù)分析中,認(rèn)為最有代表性,最能反映數(shù)據(jù)重要特征的五數(shù)概括,包括:A)中位數(shù)Q2B)四分位數(shù)Q3C)最小值D)最大值[多選題]189.下列屬于不同的有序數(shù)據(jù)的有?A)時序數(shù)據(jù)B)序列數(shù)據(jù)C)時間序列數(shù)據(jù)D)事務(wù)數(shù)據(jù)E)空間數(shù)據(jù)[多選題]190.統(tǒng)一DPI分應(yīng)用場景包括()A)PS側(cè)B)IDC出口C)省網(wǎng)出口D)省網(wǎng)網(wǎng)間出口E)骨干網(wǎng)網(wǎng)間出口[多選題]191.以下哪些地址是9/28子網(wǎng)內(nèi)的主機可用地址?A)4B)9C)6D)1E)Noneoftheabove第3部分:判斷題,共55題,請判斷題目是否正確。[判斷題]192.在主成分分析中,每個主成分都是原始變量的線性組合,且各個主成分之間互不相關(guān)。A)正確B)錯誤[判斷題]193.已知x={1:1,2:2},那么語句x[3]=3無法正常執(zhí)行。A)正確B)錯誤[判斷題]194.聚類算法運行的條件需要所有的訓(xùn)練樣本都有類別標(biāo)簽。()A)正確B)錯誤[判斷題]195.分類問題屬于有監(jiān)督學(xué)習(xí)任務(wù)。A)正確B)錯誤[判斷題]196.基于獨立事件假設(shè)是貝葉斯分類的一個優(yōu)點。A)正確B)錯誤[判斷題]197.概率為0的事件是不可能事件,概率為1的事件是必然事件。A)正確B)錯誤[判斷題]198.使用print()函數(shù)無法將信息寫入文件。A)正確B)錯誤[判斷題]199.在聚類分析當(dāng)中,簇內(nèi)得相似性越大,簇間得差別越大,聚類得效果就越差。A)正確B)錯誤[判斷題]200.已知x為非空列表,那么執(zhí)行語句x[0]=3之后,列表對象x的內(nèi)存地址不變。A)正確B)錯誤[判斷題]201.Web數(shù)據(jù)挖掘是通過數(shù)據(jù)庫仲的一些屬性來預(yù)測另一個屬性,它在驗證用戶提出的假設(shè)過程中提取信息.()A)正確B)錯誤[判斷題]202.正則表達式中,字符?*?表示前面字符的零個或者無限個。A)正確B)錯誤[判斷題]203.文件對象是可以迭代的。A)正確B)錯誤[判斷題]204.具體來講,若一個項集X的支持度大于用戶給定的一個最小支持度閾值,則X被稱為頻繁項集(或頻繁模式)。A)正確B)錯誤[判斷題]205.使用Python列表的方法insert()為列表插入元素時會改變列表中插入位置之后元素的索引。A)正確B)錯誤[判斷題]206.置信水平是假設(shè)檢驗中犯第一類錯誤的概率。A)正確B)錯誤[判斷題]207.聚類分析的相異度矩陣是用于存儲所有對象兩兩之間相異度的矩陣,為一個nn維的單模矩陣。()A)正確B)錯誤[判斷題]208.一般來說數(shù)據(jù)庫中行對應(yīng)于數(shù)據(jù)對象,而列對應(yīng)于屬性。A)正確B)錯誤[判斷題]209.四分位數(shù)極差(IQR)是第1個和第2個四分位數(shù)之間的距離。A)正確B)錯誤[判斷題]210.大數(shù)據(jù)思維,是指一種意識,認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)可以為人類急需解決的問題提供答案。()A)正確B)錯誤[判斷題]211.SVM是這樣一個分類器,他尋找具有最小邊緣的超平面,因此它也經(jīng)常被稱為最小邊緣分類器(minimalmarginclassifier)A)正確B)錯誤[判斷題]212.正確于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,移去或者減少這些樣本正確分類結(jié)果沒有影響。A)正確B)錯誤[判斷題]213.Python集合可以包含相同的元素。A)正確B)錯誤[判斷題]214.k中心點算法在每個簇中選出一個最靠近均值的實際的對象來代表該簇。A)正確B)錯誤[判斷題]215.樸素貝葉斯分類器在估計類條件概率時假設(shè)屬性之間條件獨立。()A)正確B)錯誤[判斷題]216.可以使用del刪除集合中的部分元素。A)正確B)錯誤[判斷題]217.在決策樹中,隨著樹中結(jié)點數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗誤差開始增大,這是出現(xiàn)了模型擬合不足的問題。A)正確B)錯誤[判斷題]218.離群點可以是合法的數(shù)據(jù)對象或者值。A)正確B)錯誤[判斷題]219.創(chuàng)建只包含一個元素的元組時,必須在元素后面加一個逗號,例如(3,)。A)正確B)錯誤[判斷題]220.主成分分析能夠達到去除冗余、降低噪音和降維的目的,但無法得到反映事物本質(zhì)的新變量。A)正確B)錯誤[判斷題]221.在網(wǎng)絡(luò)爬蟲的系統(tǒng)框架中,主過程由控制器,解析器,資源庫三部分組成。A)正確B)錯誤[判斷題]222.如果一個項集是不頻繁的,則其所有的超集都是不頻繁的。利用這一性質(zhì)可以簡化Apriori算法中的計算過程。A)正確B)錯誤[判斷題]223.聚類(clustering)是這樣的過程:它找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測類標(biāo)記未知的對象類。A)正確B)錯誤[判斷題]224.Python列表、元組、字符串都屬于有序序列。A)正確B)錯誤[判斷題]225.歸納法是一種從個別到一般的推理方法。A)正確B)錯誤[判斷題]226.SELECT*FROMtable只查詢了表的一個列。A)正確B)錯誤[判斷題]227.標(biāo)準(zhǔn)庫os的rename()方法可以實現(xiàn)文件移動操作。A)正確B)錯誤[判斷題]228.DSS主要是基于數(shù)據(jù)倉庫.聯(lián)機數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的應(yīng)用。A)正確B)錯誤[判斷題]229.數(shù)據(jù)規(guī)范化主要包括數(shù)據(jù)同趨化處理和無量綱化處理兩個方面,可以使屬性值按比例落入到一個特定區(qū)間,如[-1,1]或[0,1]。A)正確B)錯誤[判斷題]230.購買了此商品后還會購買的商品,它們的地位是平等的,其中涉及了時間和順序的概念,強調(diào)的是一個規(guī)則,也就是我們所說的關(guān)聯(lián)規(guī)則。A)正確B)錯誤[判斷題]231.擴展庫os中的方法remove()可以刪除帶有只讀屬性的文件。A)正確B)錯誤[判斷題]232.關(guān)聯(lián)規(guī)則挖掘過程是發(fā)現(xiàn)滿足最小支持度的所有項集代表的規(guī)則。A)正確B)錯誤[判斷題]233.表達式pow(3,2)==3**2的值為True。A)正確B)錯誤[判斷題]234.在一元回歸分析中,用r表示因變量對自變量的相關(guān)系數(shù),當(dāng)|r|接近1時,說明因變量與自變量之間的線性關(guān)系就好。A)正確B)錯誤[判斷題]235.決策樹方法通常用于關(guān)聯(lián)規(guī)則挖掘。A)正確B)錯誤[判斷題]236.決策樹的思想是自頂向下遞歸的構(gòu)建過程,關(guān)鍵點是在于分裂屬性和分裂條件的選擇。A)正確B)錯誤[判斷題]237.時序預(yù)測回歸預(yù)測一樣,也是用已知的數(shù)據(jù)預(yù)測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時間的不同。()A)正確B)錯誤[判斷題]238.一旦服務(wù)器端出現(xiàn)錯誤,返回的狀態(tài)碼為403。A)正確B)錯誤[判斷題]239.Python支持使用字典的?鍵?作為下標(biāo)來訪問字典中的值。A)正確B)錯誤[判斷題]240.分類預(yù)測時,準(zhǔn)確率和召回率存在矛盾關(guān)系,不能同時增大,所以要考慮他們的綜合影響,即F1-Score。A)正確B)錯誤[判斷題]241.在模型樹的剪枝過程中,兩個葉子結(jié)點的期望誤差通過加權(quán)求和結(jié)合在一起作為子樹誤差。A)正確B)錯誤[判斷題]242.在一定時期和一定產(chǎn)銷量范圍內(nèi),固定成本與產(chǎn)品的產(chǎn)銷量多少沒有關(guān)系,只有可變成本才與產(chǎn)品產(chǎn)銷量的增減變化發(fā)生關(guān)系。A)正確B)錯誤[判斷題]243.在模型樹的構(gòu)建過程中,應(yīng)選擇使SDR值最小的屬性。A)正確B)錯誤[判斷題]244.如果一個規(guī)則X→Y同時滿足support(X→Y)≥minsup和confidence(X→Y)≥minconf,則稱該規(guī)則在數(shù)據(jù)庫D中成立,其中minsup和minconA)正確B)錯誤[判斷題]245.字典中鍵必須唯一,但值不必。A)正確B)錯誤[判斷題]246.召回率是完全性的度量,即正元組被標(biāo)記為正類的百分比。()A)正確B)錯誤第4部分:問答題,共14題,請在空白處填寫正確答案。[問答題]247.數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清理、數(shù)據(jù)集成、()和()。[問答題]248.字典對象的___方法返回字典中的?鍵-值對?列表。__方法返回字典的?鍵?列表。____方法返回字典的?值?列表。[問答題]249.主成分分析(PCA)是一種廣泛用于不同領(lǐng)域的無監(jiān)督線性數(shù)據(jù)轉(zhuǎn)換技術(shù)。其目標(biāo)是在高維數(shù)據(jù)中找到____的方向,并將數(shù)據(jù)映射到一個維度小得多的新子空間上。借助于____,將其分量相關(guān)的原隨機向量轉(zhuǎn)化成其分量不相關(guān)的新隨機向量。[問答題]250.Jaccard系數(shù)適用于衡量用________二值屬性描述的對象間的相似度。[問答題]251.回歸與分類的區(qū)別在于:______可用于預(yù)測連續(xù)的目標(biāo)變量,______可用于預(yù)測離散的目標(biāo)變量。[問答題]252.算法DIANA(自頂向下分裂算法)輸入:n個對象,終止條件簇的數(shù)目k。輸出:k個簇,達到終止條件規(guī)定簇數(shù)目。(1)將_____整個當(dāng)成一個初始簇;(2)FOR(i=1;i≠k;i++)DOBEGIN(3)在所有簇中挑出具有____的簇C;(4)找出C中與其它點____最大的一個點p并把p放入分裂簇,剩余的放在C簇中;(5)REPEAT(6)在C簇里找出到最近的分裂簇中的點的距離____到C簇中最近點的距離的點,并將該點加入分裂簇。(7)UNTIL沒有新的C簇的點被分配給分裂簇;(8)分裂簇和C簇為被選中的簇分裂成的兩個簇,與其它簇一起組成新的簇集合。(9)END.[問答題]253.列表、元組、字符串是Python的___(有序?無序)序列。[問答題]254.表達式re.split(?.+?,?alpha.beta…gamma..delta?)的值為______。[問答題]255.特征A對訓(xùn)練數(shù)據(jù)集D的____G(D,A)定義為集合D的經(jīng)驗熵H(D)與特征A給定條件下D的經(jīng)驗條件熵H(D∣A)之差。[問答題]256.____是Python內(nèi)置的HTTP請求庫,可以看作處理URL的組件集合。[問答題]257.在FP-Growth算法中,F(xiàn)P-Tree的構(gòu)建過程是將事務(wù)數(shù)據(jù)表中的各個事務(wù)數(shù)據(jù)項按照()排序后,把每個事務(wù)中的數(shù)據(jù)項按()依次插入到一棵以()為根結(jié)點的樹中,同時在每個結(jié)點處記錄該結(jié)點出現(xiàn)的()。[問答題]258.分類的任務(wù)就是通過學(xué)習(xí)得到一個____?,把每個____x映射到一個預(yù)先定義的____y[問答題]259.給定一個頻繁負(fù)項集X,我們可以從中發(fā)現(xiàn)隱含的負(fù)關(guān)聯(lián)規(guī)則。負(fù)項集和負(fù)關(guān)聯(lián)規(guī)則統(tǒng)稱為_____。[問答題]260.分類分析主要包含有()和()兩個階段。1.答案:B解析:2.答案:A解析:3.答案:C解析:4.答案:A解析:5.答案:A解析:6.答案:B解析:7.答案:B解析:Python語言的縮進只要統(tǒng)一即可,不一定是4個空格(盡管這是慣例)。8.答案:B解析:9.答案:D解析:10.答案:A解析:11.答案:A解析:12.答案:C解析:13.答案:C解析:14.答案:B解析:15.答案:A解析:16.答案:A解析:17.答案:B解析:18.答案:C解析:File.read():讀取全部內(nèi)容File.read(200):讀取200個字節(jié)內(nèi)容File.readline():讀取一行內(nèi)容File.readlines():讀取所有行,返回一個list對象,每一行對應(yīng)list對象的一個元素。19.答案:A解析:20.答案:D解析:21.答案:A解析:22.答案:A解析:23.答案:D解析:24.答案:C解析:25.答案:A解析:26.答案:B解析:27.答案:C解析:28.答案:C解析:29.答案:C解析:30.答案:C解析:31.答案:D解析:32.答案:B解析:33.答案:C解析:34.答案:A解析:35.答案:C解析:36.答案:B解析:37.答案:C解析:38.答案:B解析:39.答案:C解析:40.答案:B解析:41.答案:A解析:42.答案:C解析:43.答案:A解析:44.答案:D解析:45.答案:A解析:46.答案:A解析:47.答案:B解析:48.答案:D解析:49.答案:B解析:50.答案:C解析:51.答案:B解析:52.答案:A解析:53.答案:D解析:54.答案:A解析:55.答案:C解析:56.答案:A解析:57.答案:A解析:58.答案:A解析:59.答案:A解析:60.答案:A解析:61.答案:D解析:62.答案:C解析:63.答案:C解析:64.答案:B
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國全硅化干粉行業(yè)投資前景及策略咨詢研究報告
- 2025至2030年中國霓虹燈沖擊變壓器數(shù)據(jù)監(jiān)測研究報告
- 2025年度供水工程勞務(wù)分包合同范本
- 2025年度私人二手車置換合同范本
- 2025年度地鐵廣告裝飾裝修與維護服務(wù)合同
- 2025年度知識產(chǎn)權(quán)授權(quán)與許可合同修訂版
- 可編程控制器應(yīng)用基礎(chǔ)實訓(xùn)報告
- 2025年度國家A級住宅裝修合同標(biāo)準(zhǔn)實施細(xì)則
- 二零二五年度主播線下簽約合同:互動營銷合作協(xié)議3篇
- 2024空地租賃合同范本2
- JJF(石化)007-2018鉛筆硬度計校準(zhǔn)規(guī)范
- GB/T 13364-2008往復(fù)泵機械振動測試方法
- 植物的類群及演化
- 老年社會工作課件
- 最新記24小時出入量、護理文書書寫規(guī)范課件
- 普通生物學(xué)考試大綱
- DB23T 2714-2020 農(nóng)村生活垃圾非焚燒低溫處理設(shè)施大氣污染物排放標(biāo)準(zhǔn)
- 【人教版】免疫系統(tǒng)的組成和功能課件1
- 農(nóng)信社運營主管述職報告【三篇】
- 48個國際音標(biāo)表(打印版)已整理
- 建標(biāo) 198-2022 城市污水處理工程項目建設(shè)標(biāo)準(zhǔn)
評論
0/150
提交評論