![CPDA考試真題與答案_第1頁](http://file4.renrendoc.com/view14/M0B/28/06/wKhkGWYk8mCAeEOvAAC5O2xO3Uk180.jpg)
![CPDA考試真題與答案_第2頁](http://file4.renrendoc.com/view14/M0B/28/06/wKhkGWYk8mCAeEOvAAC5O2xO3Uk1802.jpg)
![CPDA考試真題與答案_第3頁](http://file4.renrendoc.com/view14/M0B/28/06/wKhkGWYk8mCAeEOvAAC5O2xO3Uk1803.jpg)
![CPDA考試真題與答案_第4頁](http://file4.renrendoc.com/view14/M0B/28/06/wKhkGWYk8mCAeEOvAAC5O2xO3Uk1804.jpg)
![CPDA考試真題與答案_第5頁](http://file4.renrendoc.com/view14/M0B/28/06/wKhkGWYk8mCAeEOvAAC5O2xO3Uk1805.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、判斷題(題數(shù):15,共15.0分)
1.定量屬性可以是整數(shù)值或者是連續(xù)值。()
正確答案:V
2.分類模型的誤差大致分為兩種:訓(xùn)練誤差(trainingerror)和泛化誤差(generalization
errorb()
正確答案:V
3.在決策樹中,隨著樹中結(jié)點數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗誤
差開始增大,這是出現(xiàn)了模型擬合不足的問題。()
正確答案:x
4.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()
正確答案:x
5.聚類分析可以看作是一種非監(jiān)督的分類。()
正確答案:V
6.如果一個對象不強屬于任何簇,那么該對象是基于聚類的寓群點。()
正確答案:V
7.允許誤差應(yīng)根據(jù)錯誤記錄對整個系統(tǒng)可能帶來的破壞來確定,通常正是那些低使用率的產(chǎn)
品或不常使用的產(chǎn)品為庫存誤差帶來很大麻煩,因此應(yīng)結(jié)合數(shù)量方差百分比和絕對值方差來
確定誤差。()
正確答案:N
8.召回率反映的是預(yù)測為正中的樣本中正例的概率。()
正確答案:x
9.支持度表示前項與后項在一個數(shù)據(jù)集中同時出現(xiàn)的頻率。()
正確答案:N
10.最大最小值標(biāo)準(zhǔn)化法也叫極值法,該方法適用于已知數(shù)據(jù)集的最小值或最大值情況。(
正確答案:V
11.波特五力模型中五個壓力來源是供應(yīng)商議價能力、購買者的議價能力、行業(yè)新進入者的
威脅、替代產(chǎn)品的威脅及企業(yè)內(nèi)部的管理壓力。()
(1.0分)1.0分
正確答案:X
12.異常值在數(shù)理統(tǒng)計里一般是指一組觀測值中與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測定值。
()
正確答案:x
13.數(shù)據(jù)可視化可以便于人們對數(shù)據(jù)的理解。()
正確答案:V
14.大數(shù)據(jù)思維,是指一種意識,認為公開的數(shù)據(jù)一旦處理得當(dāng)可以為人類急需解決的問題
提供答案。()
正確答案:V
15.資金本身具有時間價值。()
正確答案:X
二、單選題(題數(shù):30,共45.0分)
1.某超市研究銷售記錄發(fā)現(xiàn),購買牛奶的人很大概率會購買面包,這種屬于數(shù)據(jù)挖掘的哪類
問題?()
A、聚類分析
B、關(guān)聯(lián)規(guī)則
C、分類分析
D、自然語言處理
正確答案:B
2.以下兩種描述分別對應(yīng)哪兩種對分類算法的評價標(biāo)準(zhǔn)?()
(a)警察抓殺人犯,描述警察抓的人中有多少個是殺人犯的標(biāo)準(zhǔn)。
(b)描述有多少比例的殺人犯給警察抓了的標(biāo)準(zhǔn)。
A、Precision,Recall
B、Recall,Precision
C、Precision,ROC
D、Recall,ROC
正確答案:A
3.將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?()
A、數(shù)據(jù)獲取
B、分類和預(yù)測
C、數(shù)據(jù)預(yù)處理
D、數(shù)據(jù)可視化
正確答案:C
4.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)
相分離?()
A、分類
B、聚類
C、關(guān)聯(lián)分析
D、主成分分析
正確答案:B
5.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()
A、變量代換
B、離散化
C、聚集
D、估計遺漏值
正確答案:D
6.假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215
使用等寬劃分(寬度為50)方法將它們劃分成四個箱,求15在哪個箱子里?()
A、第一個
B、第二個
C、第三個
D、第四個
正確答案:A
7.以下哪些算法是分類算法?()
A、DBSCAN
B、C4.5
C、K-Mean
D、K-medoids
正確答案:B
8.以下哪些分類方法可以較好地避免樣本的不平衡問題?()
A、KNN
B、SVM
C、Bayes
D、神經(jīng)網(wǎng)絡(luò)
正確答案:A
9.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是(\
A、K均值丟棄被它識別為噪聲的對象,而DBSCAN一般聚類所有對象
B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀
的簇
D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并
有重疊的簇
正確答案:A
10.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()
A、支持度
B、置信度
C、滿意度
D、提升度
正確答案:C
11.因子分析的主要作用有()
A、對變量進行降維
B、對變量進行判別
C、對變量進行聚類
D、以上都不對
正確答案:A
12.ROC曲線凸向哪個角,代表模型越理想?()
A、左上角
B、左下角
C、右上角
D、右下角
正確答案:A
13.SQL語句中刪除表的命令是()
A、DROPTABLE
B、DELETETABLE
C、ERASETABLE
D、DELETEDBF
正確答案:A
14.在多元回歸模型的檢驗中,目的是檢驗每一個自變量與因變量在指定顯著性水平上是否
存在線性相關(guān)關(guān)系的檢驗是()
A、r檢驗
B、t檢驗
C、f檢驗
D、DW檢驗
正確答案:B
15.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、并行
計算、海量存儲和海量管理等。
A、點計算
B、線計算
C、云計算
D、面計算
正確答案:C
16.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。
A、統(tǒng)計報表
B、網(wǎng)絡(luò)爬蟲
C、API接口
D、傳感器
正確答案:D
17.下列關(guān)于數(shù)據(jù)重組的說法中,錯誤的是()
A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集
B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒
C、數(shù)據(jù)重組實現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成
D、數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新
正確答案:A
18.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與
洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()
A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B、在分析方法上更注重相關(guān)分析而不是因果分析
C、在分析效果上更追究效率而不是絕對精確
D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)
正確答案:B
19.當(dāng)前國內(nèi)社會中,最為突出的大數(shù)據(jù)環(huán)境是()
A、互聯(lián)網(wǎng)
B、物聯(lián)網(wǎng)
C、綜合國力
D、自然資源
正確答案:A
20.下列關(guān)于聚類挖掘技術(shù)的說法中,錯誤的是()
A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別
B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小
C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小
D、與分類挖掘技術(shù)相似的是,都是要對數(shù)據(jù)進行分類處理
正確答案:B
21.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯誤的是()
A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)
B、在分析方法上更注重相關(guān)分析而不是因果分析
C、在分析效果上更追究效率而不是絕對精確
D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)
正確答案:D
22.對于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()
A、數(shù)據(jù)收集
B、數(shù)據(jù)存儲
C、數(shù)據(jù)分析
D、數(shù)據(jù)再利用
正確答案:D
23.數(shù)據(jù)倉庫的最終目的是()
A、收集業(yè)務(wù)需求
B、建立數(shù)據(jù)倉庫邏輯模型
C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析
D、為用戶和業(yè)務(wù)部門提供決策支持
正確答案:D
24.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()
A、建立數(shù)據(jù)科學(xué)
B、完成數(shù)據(jù)應(yīng)用
C、配備數(shù)據(jù)硬件
D、吸納數(shù)據(jù)人才
正確答案:B
25.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()
A、CREATESCHEMA
B、CREATETABLE
C、CREATEVIEW
D、CREATEDATABASE
正確答案:D
26.下列四項中,不屬于數(shù)據(jù)庫特點的是()
A、數(shù)據(jù)共享
B、數(shù)據(jù)完整性
C、數(shù)據(jù)冗余很高
D、數(shù)據(jù)獨立性高
正確答案:C
27.資金的時間價值是()
A、同一資金在同一時點上價值量的差額
B、同一資金在不同時點上價值量的差額
C、不同資金在同一時點上價值量的差額
D、不同資金在不同時點上價值量的差額
正確答案:B
28.下列選項中屬于現(xiàn)金流入的項目是()
A、所得稅
B、建設(shè)投資
C、經(jīng)營成本
D、營業(yè)收入
正確答案:D
29.下列關(guān)于計算機存儲容量單位的說法中,錯誤的是()
A、1KB<1MB<1GB
B、基本單位是字節(jié)(Byte)
C、一個漢字需要一個字節(jié)的存儲空間
D、一個字節(jié)能夠容納一個英文字符
正確答案:C
30.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分,分為()
A、結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)
B、強結(jié)構(gòu)化數(shù)據(jù)弱結(jié)構(gòu)化數(shù)據(jù)
C、截面數(shù)據(jù)面板數(shù)據(jù)
D、一級數(shù)據(jù)二級數(shù)據(jù)三級數(shù)據(jù)
正確答案:A
三、多選題(題數(shù):20,共40.0分)
1.以下屬于數(shù)據(jù)預(yù)處理的是()
A、缺失值填充
B、噪聲數(shù)據(jù)剔除
C、異常值識別
D、數(shù)據(jù)可視化
正確答案:ABC
2.缺失值的處理方法有哪些?()
A、用平均值填充
B、忽略缺失記錄
C、以任意數(shù)據(jù)填充
D、用默認值填充
正確答案:ABD
3.以下屬于數(shù)據(jù)規(guī)約方法的是()
A、數(shù)據(jù)寓散化
B、數(shù)據(jù)標(biāo)準(zhǔn)化
C、噪聲數(shù)據(jù)識別
D、數(shù)據(jù)壓縮
正確答案:AD
4.數(shù)據(jù)挖掘的預(yù)測建模任務(wù)主要包括哪幾大類問題?(
A、分類
B、回歸
C、模式發(fā)現(xiàn)
D、模式匹配
正確答案:AB
5.以下說法正確的有哪些?()
A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大
B、大數(shù)據(jù)對傳統(tǒng)行業(yè)有幫助
C、大數(shù)據(jù)會帶來機器智能
D、大數(shù)據(jù)是一種思維方式
正確答案:BCD
6.關(guān)于大數(shù)據(jù)的來源,以下理解正確的是()
A、大數(shù)據(jù)是數(shù)據(jù)量變積累達到質(zhì)變的結(jié)果
B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時間
C、我們每個人都是數(shù)據(jù)的制造者
D、當(dāng)今的世界,基本上一切都可以用數(shù)字表達,所以叫數(shù)字化的世界
正確答案:ACD
7.大數(shù)據(jù)在今天這個時間點上爆發(fā)的原因有哪些?()
A、各種傳感器無時無刻不在為我們提供大量的數(shù)據(jù)
B、各種監(jiān)控設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)
C、各種智能設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)
D、互聯(lián)網(wǎng)的收集和積累
正確答案:ABCD
8.()這些數(shù)據(jù)特性都是對聚類分析具有很強影響的。
A、高維性
B、規(guī)模
C、稀疏性
D、噪聲和離群點
正確答案:ABCD
9.以下哪個分布是右偏分布?()
A、均勻分布
B、卡方分布
C、F分布
D、對數(shù)正態(tài)分布
正確答案:BCD
10.以下哪些變量使用RFM方法構(gòu)造出來的?()
A、最近3期境外消費金額
B、最近6期網(wǎng)銀消費交易筆數(shù)
C、信用額度
D、距最近一次逾期的月數(shù)
正確答案:ABD
11.如下表student中,如何篩選type為包含數(shù)學(xué)或語文的記錄?()
A、select*fromstudentwheretype="數(shù)學(xué)"andtype="語文"
B、select*fromstudentwheretype="數(shù)學(xué)"ortype="語文"
C、select*fromstudentwheretypein(“數(shù)學(xué)”,“語文”)
D、select*fromstudentwheretypein("數(shù)學(xué)"?"語文")
正確答案:BC
12.主成分分析計算選擇相關(guān)系數(shù)計算法時,確定主成分個數(shù)的大致原則包括(
A、特征根值大于1
B、特征根值大于0.8
C、累積特征根值加總占總特征根值的80%以上
D、累積特征根值加總占總特征根值的90%以上
正確答案:AC
13.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。
A、潛在客戶
B、響應(yīng)客戶
C、即得客戶
D、流失客戶
正確答案:ABCD
14.分箱方法有哪些?()
(2.0分)0.0分
A、等深分箱
B、等寬分箱
C、數(shù)據(jù)標(biāo)準(zhǔn)化
D、自定義區(qū)間法
正確答案:ABD
15.利用Apriori
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代城市公共安全體系建設(shè)
- 環(huán)保教育在廠區(qū)綠色轉(zhuǎn)型中的作用
- 生產(chǎn)線智能化改造的步驟與技巧
- 煙臺的綠色交通系統(tǒng)與低碳出行模式
- 環(huán)保法規(guī)下的企業(yè)生態(tài)環(huán)境預(yù)警管理
- 環(huán)境影響評估在交通運輸規(guī)劃中的角色
- 4《選舉產(chǎn)生班委會 》第三課時(說課稿)部編版道德與法治五年級上冊
- 11 屹立在世界的東方 說課稿-2023-2024學(xué)年道德與法治五年級下冊統(tǒng)編版
- 17《要是你在野外迷了路》說課稿2023-2024學(xué)年統(tǒng)編版語文二年級下冊001
- 16-2《六國論》(說課稿)-2024-2025學(xué)年高一語文下學(xué)期同步教學(xué)說課稿專輯(統(tǒng)編版必修下冊)001
- 2025版林木砍伐與生態(tài)修復(fù)工程承包合同2篇
- 2025年南京信息職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2025-2030年中國硫酸鉀行業(yè)深度調(diào)研及投資戰(zhàn)略研究報告
- 課題申報參考:社會網(wǎng)絡(luò)視角下村改居社區(qū)公共空間優(yōu)化與“土客關(guān)系”重構(gòu)研究
- 鄉(xiāng)鎮(zhèn)衛(wèi)生院2025年工作計劃
- 2024年山東省泰安市初中學(xué)業(yè)水平生物試題含答案
- 住建局條文解讀新規(guī)JGJT46-2024《施工現(xiàn)場臨時用電安全技術(shù)標(biāo)準(zhǔn)》
- 物流公司軟件售后服務(wù)流程方案
- 機械工程類基礎(chǔ)知識單選題100道及答案解析
- 微生物組與膽汁性肝硬化
- 建筑工程技術(shù)資料管理.ppt
評論
0/150
提交評論