2019年公需培訓數(shù)據挖掘答案.doc_第1頁
2019年公需培訓數(shù)據挖掘答案.doc_第2頁
2019年公需培訓數(shù)據挖掘答案.doc_第3頁
2019年公需培訓數(shù)據挖掘答案.doc_第4頁
2019年公需培訓數(shù)據挖掘答案.doc_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據挖掘1、(單選,4分)以下哪項不屬于知識發(fā)現(xiàn)的過程?( )A、數(shù)據清理 B、數(shù)據挖掘 C、知識可視化表達 D、數(shù)據測試 答案:D2、(單選,4分)以下哪些不屬于數(shù)據挖掘的內容?( )A、分類 B、聚類 C、離群點檢測 D、遞歸分析 答案:D3、(單選,4分)以下哪個不是常見的屬性類型? ( )A、A標稱屬性 B、數(shù)值屬性 C、高維屬性 D、序數(shù)屬性 答案:C4、(單選,4分)以下哪個度量屬于數(shù)據散度的描述? ( )A、均值 B、中位數(shù) C、標準差 D、眾數(shù) 答案:C5、(單選,4分)以下哪個度量不屬于數(shù)據中心趨勢度描述?( D )A、A均值 B、中位數(shù) C、眾數(shù) D、四分位數(shù) 答案:D6、(單選,4分)對數(shù)據進行數(shù)據清理、集成、變換、規(guī)約是數(shù)據挖掘哪個步驟的任務?( )A、頻繁模式挖掘 B、分類和預測 C、數(shù)據預處理 D、噪聲檢測 答案:C7、(單選,4分)聚類分析是數(shù)據挖掘的一種重要技術,以下哪個算法不屬于聚類算法?( )A、K-Means B、DBSCAN C、SVM D、EM 答案:C8、(單選,4分)建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數(shù)據挖掘的哪一類任務?( )A、根據內容檢索 B、建模描述 C、預測建模 D、尋找模式和規(guī)則 答案:C9、(單選,4分)當不知道數(shù)據所帶標簽時. 可以使用哪種技術促使帶同類標簽的數(shù)據與帶其他標簽的數(shù)據相分離?( )A、分類 B、聚類 C、關聯(lián)分析 D、隱馬爾可夫鏈 答案:B10、(單選,4分)在構造決策樹時,以下哪種不是選擇屬性的度量的方法? ( )A、信息增益 B、信息增益率 C、基尼指數(shù) D、距離 答案:D11、(單選,4分)知識發(fā)現(xiàn)流程最核心的步驟是什么? ( )A、數(shù)據挖掘 B、數(shù)據預處理 C、模式評估 D、知識表示 答案:A12、(單選,4分)將原始數(shù)據進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務?( )A、頻繁模式挖掘 B、分類和預測 C、數(shù)據預處理 D、數(shù)據流挖掘 答案:C13、(單選,4分)以下哪個度量屬于數(shù)據中心性的描述? ( )A、均值 B、極差 C、眾數(shù) D、標準差 答案:A14、(單選,4分)類分析是數(shù)據挖掘的一種重要技術,以下哪個算法不屬于聚類算法?( )A、K-Means B、DBSCAN C、KNN D、EM 答案:C15、(單選,4分)某超市研究銷售紀錄數(shù)據后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據挖掘的哪類問題? ( )A、關聯(lián)規(guī)則發(fā)現(xiàn) B、聚類 C、分類 D、自然語言處理 答案:A16、(單選,4分)以下哪些算法是分類算法?( )A、DBSCAN B、C4.5 C、K-Mean D、EM 答案:B17、(單選,4分)K-means算法的缺點不包括?( )A、K必須是事先給定的 B、選擇初始聚類中心 C、對于“噪聲”和孤立點數(shù)據是敏感的 D、可伸縮、高效 答案:D18、(單選,4分)機器學習中,下面哪些方法不可以避免分類中的過擬合問題?( )A、增加樣本數(shù)量 B、增加模型復雜度 C、去除噪聲 D、正則化 答案:B19、(單選,4分)下面那個不屬于知識發(fā)現(xiàn)過程。( )A、數(shù)據清理與集成 B、數(shù)據統(tǒng)計 C、數(shù)據挖掘 D、模式評估和知識表示 答案:B20、(單選,4分)在構造決策樹時,以下那個不屬于選擇屬性的度量? ( )A、信息增益 B、信息增益率 C、基尼指數(shù) D、信息熵 答案:D21、(單選,4分)關于頻繁模式,下面哪一個陳述是正確的? ( )A、K項集頻繁則K-1項則必定不頻繁 B、K項集頻繁則K-1項則必定頻繁 C、K項集不頻繁則K-1項則必定頻繁 D、以上都不正確 答案:B22、(單選,4分)DBSCAN算法最大的挑戰(zhàn)是? ( )A、確定聚類個數(shù) B、確定聚類形狀 C、確定半徑及MINPTS D、確定評估指標 答案:C23、(單選,4分)以下那個不屬于分類算法? ( )A、KNN B、樸素貝葉斯 C、K-MEANS D、SVM 答案:C24、(單選,4分)以下哪些陳述是不正確的? ( )A、聚類可以發(fā)現(xiàn)數(shù)據內部結構 B、聚類可以作為其他任務的預處理 C、聚

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論