CPDA考試真題與答案_第1頁
CPDA考試真題與答案_第2頁
CPDA考試真題與答案_第3頁
CPDA考試真題與答案_第4頁
CPDA考試真題與答案_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

一、判斷題(題數(shù):15,共15.0分)

1.定量屬性可以是整數(shù)值或者是連續(xù)值。()

正確答案:V

2.分類模型的誤差大致分為兩種:訓(xùn)練誤差(trainingerror)和泛化誤差(generalization

errorb()

正確答案:V

3.在決策樹中,隨著樹中結(jié)點(diǎn)數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗(yàn)誤

差開始增大,這是出現(xiàn)了模型擬合不足的問題。()

正確答案:x

4.在聚類分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類的效果就越差。()

正確答案:x

5.聚類分析可以看作是一種非監(jiān)督的分類。()

正確答案:V

6.如果一個(gè)對(duì)象不強(qiáng)屬于任何簇,那么該對(duì)象是基于聚類的寓群點(diǎn)。()

正確答案:V

7.允許誤差應(yīng)根據(jù)錯(cuò)誤記錄對(duì)整個(gè)系統(tǒng)可能帶來的破壞來確定,通常正是那些低使用率的產(chǎn)

品或不常使用的產(chǎn)品為庫存誤差帶來很大麻煩,因此應(yīng)結(jié)合數(shù)量方差百分比和絕對(duì)值方差來

確定誤差。()

正確答案:N

8.召回率反映的是預(yù)測為正中的樣本中正例的概率。()

正確答案:x

9.支持度表示前項(xiàng)與后項(xiàng)在一個(gè)數(shù)據(jù)集中同時(shí)出現(xiàn)的頻率。()

正確答案:N

10.最大最小值標(biāo)準(zhǔn)化法也叫極值法,該方法適用于已知數(shù)據(jù)集的最小值或最大值情況。(

正確答案:V

11.波特五力模型中五個(gè)壓力來源是供應(yīng)商議價(jià)能力、購買者的議價(jià)能力、行業(yè)新進(jìn)入者的

威脅、替代產(chǎn)品的威脅及企業(yè)內(nèi)部的管理壓力。()

(1.0分)1.0分

正確答案:X

12.異常值在數(shù)理統(tǒng)計(jì)里一般是指一組觀測值中與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測定值。

()

正確答案:x

13.數(shù)據(jù)可視化可以便于人們對(duì)數(shù)據(jù)的理解。()

正確答案:V

14.大數(shù)據(jù)思維,是指一種意識(shí),認(rèn)為公開的數(shù)據(jù)一旦處理得當(dāng)可以為人類急需解決的問題

提供答案。()

正確答案:V

15.資金本身具有時(shí)間價(jià)值。()

正確答案:X

二、單選題(題數(shù):30,共45.0分)

1.某超市研究銷售記錄發(fā)現(xiàn),購買牛奶的人很大概率會(huì)購買面包,這種屬于數(shù)據(jù)挖掘的哪類

問題?()

A、聚類分析

B、關(guān)聯(lián)規(guī)則

C、分類分析

D、自然語言處理

正確答案:B

2.以下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類算法的評(píng)價(jià)標(biāo)準(zhǔn)?()

(a)警察抓殺人犯,描述警察抓的人中有多少個(gè)是殺人犯的標(biāo)準(zhǔn)。

(b)描述有多少比例的殺人犯給警察抓了的標(biāo)準(zhǔn)。

A、Precision,Recall

B、Recall,Precision

C、Precision,ROC

D、Recall,ROC

正確答案:A

3.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?()

A、數(shù)據(jù)獲取

B、分類和預(yù)測

C、數(shù)據(jù)預(yù)處理

D、數(shù)據(jù)可視化

正確答案:C

4.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)

相分離?()

A、分類

B、聚類

C、關(guān)聯(lián)分析

D、主成分分析

正確答案:B

5.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()

A、變量代換

B、離散化

C、聚集

D、估計(jì)遺漏值

正確答案:D

6.假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215

使用等寬劃分(寬度為50)方法將它們劃分成四個(gè)箱,求15在哪個(gè)箱子里?()

A、第一個(gè)

B、第二個(gè)

C、第三個(gè)

D、第四個(gè)

正確答案:A

7.以下哪些算法是分類算法?()

A、DBSCAN

B、C4.5

C、K-Mean

D、K-medoids

正確答案:B

8.以下哪些分類方法可以較好地避免樣本的不平衡問題?()

A、KNN

B、SVM

C、Bayes

D、神經(jīng)網(wǎng)絡(luò)

正確答案:A

9.關(guān)于K均值和DBSCAN的比較,以下說法不正確的是(\

A、K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCAN一般聚類所有對(duì)象

B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

C、K均值很難處理非球形的簇和不同大小的簇,DBSCAN可以處理不同大小和不同形狀

的簇

D、K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會(huì)合并

有重疊的簇

正確答案:A

10.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()

A、支持度

B、置信度

C、滿意度

D、提升度

正確答案:C

11.因子分析的主要作用有()

A、對(duì)變量進(jìn)行降維

B、對(duì)變量進(jìn)行判別

C、對(duì)變量進(jìn)行聚類

D、以上都不對(duì)

正確答案:A

12.ROC曲線凸向哪個(gè)角,代表模型越理想?()

A、左上角

B、左下角

C、右上角

D、右下角

正確答案:A

13.SQL語句中刪除表的命令是()

A、DROPTABLE

B、DELETETABLE

C、ERASETABLE

D、DELETEDBF

正確答案:A

14.在多元回歸模型的檢驗(yàn)中,目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性水平上是否

存在線性相關(guān)關(guān)系的檢驗(yàn)是()

A、r檢驗(yàn)

B、t檢驗(yàn)

C、f檢驗(yàn)

D、DW檢驗(yàn)

正確答案:B

15.()提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問題,比如虛擬化技術(shù)、并行

計(jì)算、海量存儲(chǔ)和海量管理等。

A、點(diǎn)計(jì)算

B、線計(jì)算

C、云計(jì)算

D、面計(jì)算

正確答案:C

16.智能健康手環(huán)的應(yīng)用開發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。

A、統(tǒng)計(jì)報(bào)表

B、網(wǎng)絡(luò)爬蟲

C、API接口

D、傳感器

正確答案:D

17.下列關(guān)于數(shù)據(jù)重組的說法中,錯(cuò)誤的是()

A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集

B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒

C、數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成

D、數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新

正確答案:A

18.美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制了新的航海路線圖,標(biāo)明了大風(fēng)與

洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

正確答案:B

19.當(dāng)前國內(nèi)社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()

A、互聯(lián)網(wǎng)

B、物聯(lián)網(wǎng)

C、綜合國力

D、自然資源

正確答案:A

20.下列關(guān)于聚類挖掘技術(shù)的說法中,錯(cuò)誤的是()

A、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別

B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小

C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能小

D、與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理

正確答案:B

21.下列關(guān)于大數(shù)據(jù)的分析理念的說法中,錯(cuò)誤的是()

A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)

B、在分析方法上更注重相關(guān)分析而不是因果分析

C、在分析效果上更追究效率而不是絕對(duì)精確

D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)

正確答案:D

22.對(duì)于企業(yè)來說,數(shù)據(jù)使用的關(guān)鍵是()

A、數(shù)據(jù)收集

B、數(shù)據(jù)存儲(chǔ)

C、數(shù)據(jù)分析

D、數(shù)據(jù)再利用

正確答案:D

23.數(shù)據(jù)倉庫的最終目的是()

A、收集業(yè)務(wù)需求

B、建立數(shù)據(jù)倉庫邏輯模型

C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析

D、為用戶和業(yè)務(wù)部門提供決策支持

正確答案:D

24.大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()

A、建立數(shù)據(jù)科學(xué)

B、完成數(shù)據(jù)應(yīng)用

C、配備數(shù)據(jù)硬件

D、吸納數(shù)據(jù)人才

正確答案:B

25.在SQL中,創(chuàng)建數(shù)據(jù)庫用的命令是()

A、CREATESCHEMA

B、CREATETABLE

C、CREATEVIEW

D、CREATEDATABASE

正確答案:D

26.下列四項(xiàng)中,不屬于數(shù)據(jù)庫特點(diǎn)的是()

A、數(shù)據(jù)共享

B、數(shù)據(jù)完整性

C、數(shù)據(jù)冗余很高

D、數(shù)據(jù)獨(dú)立性高

正確答案:C

27.資金的時(shí)間價(jià)值是()

A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額

B、同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額

C、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額

D、不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額

正確答案:B

28.下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是()

A、所得稅

B、建設(shè)投資

C、經(jīng)營成本

D、營業(yè)收入

正確答案:D

29.下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說法中,錯(cuò)誤的是()

A、1KB<1MB<1GB

B、基本單位是字節(jié)(Byte)

C、一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間

D、一個(gè)字節(jié)能夠容納一個(gè)英文字符

正確答案:C

30.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分,分為()

A、結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)

B、強(qiáng)結(jié)構(gòu)化數(shù)據(jù)弱結(jié)構(gòu)化數(shù)據(jù)

C、截面數(shù)據(jù)面板數(shù)據(jù)

D、一級(jí)數(shù)據(jù)二級(jí)數(shù)據(jù)三級(jí)數(shù)據(jù)

正確答案:A

三、多選題(題數(shù):20,共40.0分)

1.以下屬于數(shù)據(jù)預(yù)處理的是()

A、缺失值填充

B、噪聲數(shù)據(jù)剔除

C、異常值識(shí)別

D、數(shù)據(jù)可視化

正確答案:ABC

2.缺失值的處理方法有哪些?()

A、用平均值填充

B、忽略缺失記錄

C、以任意數(shù)據(jù)填充

D、用默認(rèn)值填充

正確答案:ABD

3.以下屬于數(shù)據(jù)規(guī)約方法的是()

A、數(shù)據(jù)寓散化

B、數(shù)據(jù)標(biāo)準(zhǔn)化

C、噪聲數(shù)據(jù)識(shí)別

D、數(shù)據(jù)壓縮

正確答案:AD

4.數(shù)據(jù)挖掘的預(yù)測建模任務(wù)主要包括哪幾大類問題?(

A、分類

B、回歸

C、模式發(fā)現(xiàn)

D、模式匹配

正確答案:AB

5.以下說法正確的有哪些?()

A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大

B、大數(shù)據(jù)對(duì)傳統(tǒng)行業(yè)有幫助

C、大數(shù)據(jù)會(huì)帶來機(jī)器智能

D、大數(shù)據(jù)是一種思維方式

正確答案:BCD

6.關(guān)于大數(shù)據(jù)的來源,以下理解正確的是()

A、大數(shù)據(jù)是數(shù)據(jù)量變積累達(dá)到質(zhì)變的結(jié)果

B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時(shí)間

C、我們每個(gè)人都是數(shù)據(jù)的制造者

D、當(dāng)今的世界,基本上一切都可以用數(shù)字表達(dá),所以叫數(shù)字化的世界

正確答案:ACD

7.大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些?()

A、各種傳感器無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

B、各種監(jiān)控設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

C、各種智能設(shè)備無時(shí)無刻不在為我們提供大量的數(shù)據(jù)

D、互聯(lián)網(wǎng)的收集和積累

正確答案:ABCD

8.()這些數(shù)據(jù)特性都是對(duì)聚類分析具有很強(qiáng)影響的。

A、高維性

B、規(guī)模

C、稀疏性

D、噪聲和離群點(diǎn)

正確答案:ABCD

9.以下哪個(gè)分布是右偏分布?()

A、均勻分布

B、卡方分布

C、F分布

D、對(duì)數(shù)正態(tài)分布

正確答案:BCD

10.以下哪些變量使用RFM方法構(gòu)造出來的?()

A、最近3期境外消費(fèi)金額

B、最近6期網(wǎng)銀消費(fèi)交易筆數(shù)

C、信用額度

D、距最近一次逾期的月數(shù)

正確答案:ABD

11.如下表student中,如何篩選type為包含數(shù)學(xué)或語文的記錄?()

A、select*fromstudentwheretype="數(shù)學(xué)"andtype="語文"

B、select*fromstudentwheretype="數(shù)學(xué)"ortype="語文"

C、select*fromstudentwheretypein(“數(shù)學(xué)”,“語文”)

D、select*fromstudentwheretypein("數(shù)學(xué)"?"語文")

正確答案:BC

12.主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的大致原則包括(

A、特征根值大于1

B、特征根值大于0.8

C、累積特征根值加總占總特征根值的80%以上

D、累積特征根值加總占總特征根值的90%以上

正確答案:AC

13.在客戶關(guān)系管理中,客戶的生命周期都包括()階段。

A、潛在客戶

B、響應(yīng)客戶

C、即得客戶

D、流失客戶

正確答案:ABCD

14.分箱方法有哪些?()

(2.0分)0.0分

A、等深分箱

B、等寬分箱

C、數(shù)據(jù)標(biāo)準(zhǔn)化

D、自定義區(qū)間法

正確答案:ABD

15.利用Apriori

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論