版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
階段測試[復(fù)制]您的姓名:[填空題]*_________________________________基本信息:[矩陣文本題]*班級:________________________1.()是最常用的標準化方法,即每一變量值與其平均值之差除以該變量的標準差。[單選題]*A、min-max標準化B、log函數(shù)轉(zhuǎn)換C、atan函數(shù)轉(zhuǎn)換D、z-score標準化(正確答案)2.SQL語言允許使用通配符進行字符串匹配的操作,其中‘%’可以表示()[單選題]*A、零個字符B、1個字符C、多個字符D、以上都可以(正確答案)3.要查詢book表中所有書名中以“中國”開頭的書籍的價格,可用()語句。[單選題]*A、SELECTpriceFROMbookWHEREbook_name=‘中國*’B、SELECTpriceFROMbookWHEREbook_nameLIKE‘中國*’C、SELECTpriceFROMbookWHEREbook_name=‘中國%’D、SELECTpriceFROMbookWHEREbook_nameLIKE‘中國%’(正確答案)4.錯誤值(WrongValue)的處理是在知識發(fā)掘處理(KnowledgeDiscoveryProcess)中的哪一個階段?()[單選題]*A、數(shù)據(jù)清洗(正確答案)B、數(shù)據(jù)選擇C、數(shù)據(jù)編碼D、數(shù)據(jù)擴充5.SQL語言中,刪除一個表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()[單選題]*A、DELETE(正確答案)B、DROPC、CLEARD、REMORE6.一個關(guān)聯(lián)規(guī)則同時滿足最小支持度和最小置信度,我們稱之為()[單選題]*A、強關(guān)聯(lián)規(guī)則(正確答案)B、頻繁項集C、有效關(guān)聯(lián)規(guī)則D、頻繁閉項集7.有一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的(confidence)為60%,則代表()[單選題]*A、買B商品的顧客中,有60%的顧客會同時購買AB、同時購買A,B兩商品的顧客,占所有顧客的60%C、買A商品的顧客中,有60%的顧客會同時購買B(正確答案)D、兩商品A,B在交易數(shù)據(jù)庫中同時被購買的機率為60%8.某同學由x與y之間的一組數(shù)據(jù)求得兩個變量間的線性回歸方程為y=bx+a,已知:數(shù)據(jù)x的平均值為2,數(shù)據(jù)y的平均值為3,則()。[單選題]*A、回歸直線必過點(2,3)(正確答案)B、回歸直線一定不過點(2,3)C、點(2,3)在回歸直線上方D、點(2,3)在回歸直線下方9.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()[單選題]*A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析(正確答案)C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)10.某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?()
[單選題]*A.關(guān)聯(lián)規(guī)則(正確答案)B.聚類C.分類D.自然語言處理11.()是一個觀測值,它與其他觀測值的差別如此之大,以至于懷疑它是由不同的機制產(chǎn)生的。[單選題]*A.邊界點B.質(zhì)心C.離群點(正確答案)D.核心點12.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()
[單選題]*A變量代換B離散化C聚集D估計遺漏值(正確答案)13.大數(shù)據(jù)應(yīng)用需依托的新技術(shù)有()[單選題]*A、大規(guī)模儲存與計算B、數(shù)據(jù)分析處理C、智能化D、三個選項都是(正確答案)14.大數(shù)據(jù)之父是()[單選題]*A、彼得德魯克B、舍恩伯格(正確答案)C、蒂姆伯納斯李D、斯科特布朗15.下面哪個不屬于數(shù)據(jù)的屬性類型()。[單選題]*A.標稱B.序數(shù)C.區(qū)間D.相異(正確答案)16.將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)()[單選題]*A、數(shù)據(jù)獲取B、分類和預(yù)測C、數(shù)據(jù)預(yù)處理(正確答案)D、數(shù)據(jù)可視化17.某省發(fā)布年度全省職工平均工資為66560元,月平均工資為6320元。眾多網(wǎng)友直呼“被平均”,你認為下面哪種統(tǒng)計量測度平均工資會更被信服()[單選題]*A、幾何平均數(shù)B、眾數(shù)C、極差D、中位數(shù)(正確答案)18.主成分分析的主要作用有()[單選題]*A、對變量進行降維(正確答案)B、對變量進行判別C、對變量進行聚類D、以上都不對19.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、并行計算、海量存儲和海量管理等。[單選題]*A、點計算B、線計算C、云計算(正確答案)D、面計算20.欲比較兩地30年來肺癌和胃癌死亡率的上升速度,最好選用()[單選題]*A、折線圖(正確答案)B、條形圖C、雷達圖D、餅圖21.()的目的在于縮小數(shù)據(jù)的取值范圍,使其更適合數(shù)據(jù)挖掘算法的需要,并且能夠得到和原始數(shù)據(jù)相同的分析結(jié)果。[單選題]*A、數(shù)據(jù)清洗B、數(shù)據(jù)集成C、數(shù)據(jù)歸約(正確答案)D、數(shù)據(jù)變換22.數(shù)據(jù)清洗的方法不包括()[單選題]*A、缺失值處理B、噪聲數(shù)據(jù)清除C、一致性檢查D、重復(fù)數(shù)據(jù)記錄處理(正確答案)23.做聚類分析,若數(shù)據(jù)量較大,下面哪種方式比較合適?()[單選題]*A、系統(tǒng)聚類B、快速聚類(k-means)(正確答案)C、A和B都可以D、A和B都不可以24.下面的問題中,是連續(xù)型隨機變量的是()[單選題]*A、某座大橋,一天之內(nèi)經(jīng)過的汽車的數(shù)量B、某網(wǎng)站,一首歌在一天內(nèi)被點擊的次數(shù)C、北京市,某一天內(nèi)的溫度(正確答案)D、射手對目標進行射擊,擊中得1分,未擊中得0分,該射手在一次射擊中的得分。25.一組數(shù)據(jù)排序后處于25%和75%位置上的值稱為()[單選題]*A、主體數(shù)B、中位數(shù)C、四分位數(shù)(正確答案)D、均衡數(shù)26.當一個連續(xù)變量的缺失值占比在75%左右時,以下哪種方式最合理()[單選題]*A、直接使用該變量B、根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量(正確答案)C、使用多重插補的方法進行缺失值填補D、直接刪除該變量27.錄入數(shù)據(jù)時誤將“456”錄入為了“3456”,那么當數(shù)據(jù)均為()左右的數(shù)據(jù)時,“3456”就會被識別為異常值。[單選題]*A、200B、300C、400(正確答案)D、50028.關(guān)于大數(shù)據(jù)的來源,以下理解不正確的是()[單選題]*A、大數(shù)據(jù)是數(shù)據(jù)量變積累達到質(zhì)變的結(jié)果B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時間(正確答案)C、我們每個人都是數(shù)據(jù)的制造者D、當今的世界,基本上一切都可以用數(shù)字表達,所以叫數(shù)字化的世界29.關(guān)于算術(shù)平均數(shù)的描述不正確的是()[單選題]*A、容易受到異常值影響B(tài)、綜合反映全部數(shù)據(jù)的信息C、既適用于連續(xù)型數(shù)據(jù),也適用于離散型數(shù)據(jù)(正確答案)D、可用于推算總體中的總量指標30.阿里巴巴的電子商務(wù)模式屬于()。[單選題]*A.B2B(正確答案)B.B2CC.C2CD.C2B31.在網(wǎng)上輸入關(guān)鍵字查詢信息的方式屬于()技術(shù)。[單選題]*A.推送B.數(shù)據(jù)挖掘C.廣播D.檢索(正確答案)32.下面有關(guān)HAVING子句描述錯誤的是()[單選題]*A、HAVING子句必須與GROUPBY子句同時使用,不能單獨使用B、使用HAVING子句的同時不能使用WHERE子句(正確答案)C、使用HAVING子句的同時可以使用WHERE子句D、使用HAVING子句的作用是限定分組的條件33.價格(X,元)與需求量(Y,噸)之間的回歸方程為:Y=356-1.5Xi,說明價格每上漲一元,需求量減少()噸。[單選題]*A、1.5(正確答案)B、0.5C、-1.5D、-0.534.在電子商務(wù)分類中,CtoC是指()[單選題]*A、消費者-消費者電子商務(wù)(正確答案)B、企業(yè)-企業(yè)電子商務(wù)C、企業(yè)-消費者電子商務(wù)D、企業(yè)內(nèi)部電子商務(wù)35.建立一個模型,通過這個模型根據(jù)已知的變量值來預(yù)測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()[單選題]*A.根據(jù)內(nèi)容檢索B.建模描述C.預(yù)測建模(正確答案)D.尋找模式和規(guī)則36.MECE原則是能夠讓人思路清晰、思維縝密的原則,其中ME的意思是:[單選題]*A相互獨立(正確答案)B完全窮盡C無遺漏D分凈37.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為(
)[單選題]*A、0.716(正確答案)B、1.224C、1.458D、0.82138.AARRR模型不包括以下哪個()[單選題]*A、referB、revenueC、retentionD、requirement(正確答案)39.什么是KDD?()[單選題]*A.知識發(fā)現(xiàn)(正確答案)B.領(lǐng)域知識發(fā)現(xiàn)C.文檔知識發(fā)現(xiàn)D.動態(tài)知識發(fā)現(xiàn)40.作為國家制定政策和規(guī)劃長期發(fā)展的依據(jù),通常所做的搜集數(shù)據(jù)的方式為()[單選題]*A、普查(正確答案)B、統(tǒng)計報表C、重點調(diào)查D、抽樣41.當不知道數(shù)據(jù)所帶標簽時,可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離?()[單選題]*A.分類B.聚類(正確答案)C.關(guān)聯(lián)分析D.隱馬爾可夫鏈42.約有()的客戶由頁面ICON位進入[單選題]*A、5%B、10%C、30%(正確答案)D、60%43.SQL語言是()語言。[單選題]*A、層次數(shù)據(jù)庫B、網(wǎng)絡(luò)數(shù)據(jù)庫C、關(guān)系數(shù)據(jù)庫(正確答案)D、系統(tǒng)數(shù)據(jù)庫44.把雞蛋放在一只籃子里的做法是什么戰(zhàn)略的形象表述()[單選題]*A、集中化戰(zhàn)略(正確答案)B、一體化戰(zhàn)略C、差異性戰(zhàn)略D、多元化戰(zhàn)略45.對于大批量的數(shù)據(jù),最適合描述其分布的圖形是()[單選題]*A、條形圖B、莖葉圖C、直方圖(正確答案)D、餅圖46.現(xiàn)在有越來越多的消費者通過互聯(lián)網(wǎng)來訂購車船機票和購買產(chǎn)品,這要求企業(yè)在制定市場營銷組合戰(zhàn)略時還應(yīng)當著重考慮()[單選題]*A、人口環(huán)境B、技術(shù)環(huán)境(正確答案)C、經(jīng)濟環(huán)境D、社會文化環(huán)境47.Apriori算法的加速過程依賴于以下哪個策略()[單選題]*A、抽樣B、剪枝(正確答案)C、緩沖D、并行48.下列關(guān)于舍恩伯格對大數(shù)據(jù)特點的說法中,錯誤的是()[單選題]*A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度木材行業(yè)市場調(diào)研與營銷策劃合同4篇
- 2025年企業(yè)投資貸款合同
- 2025年家具家電購買合同
- 2025年分期付款汽車銷售合同
- 2025年天然氣輸氣管道合作協(xié)議
- 2025版住宅小區(qū)水電暖消防系統(tǒng)改造與節(jié)能評估服務(wù)合同3篇
- 2025年健身健康檢測合同
- 2025年二手房合同樣本
- 二零二五至二零二五年度通信設(shè)備采購合同2篇
- 2025版屋面防水勞務(wù)分包合同(含防水檢測服務(wù))3篇
- 獅子王影視鑒賞
- 一年級數(shù)學加減法口算題每日一練(25套打印版)
- 2024年甘肅省武威市、嘉峪關(guān)市、臨夏州中考英語真題
- DL-T573-2021電力變壓器檢修導(dǎo)則
- 繪本《圖書館獅子》原文
- 安全使用公共WiFi網(wǎng)絡(luò)的方法
- 2023年管理學原理考試題庫附答案
- 【可行性報告】2023年電動自行車相關(guān)項目可行性研究報告
- 歐洲食品與飲料行業(yè)數(shù)據(jù)與趨勢
- 放療科室規(guī)章制度(二篇)
- 中高職貫通培養(yǎng)三二分段(中職階段)新能源汽車檢測與維修專業(yè)課程體系
評論
0/150
提交評論