CPDA考試真題與答案_第1頁(yè)
CPDA考試真題與答案_第2頁(yè)
CPDA考試真題與答案_第3頁(yè)
CPDA考試真題與答案_第4頁(yè)
CPDA考試真題與答案_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1、 判斷題(題數(shù):15,共 分)1. 定量屬性可以是整數(shù)值或者是連續(xù)值。正確答案:V2. 分類(lèi)模型的誤差大致分為兩種:訓(xùn)練誤差 ( training error ) 和泛化誤差( generalizationerror ) 。 ()正確答案:,3. 在決策樹(shù)中,隨著樹(shù)中結(jié)點(diǎn)數(shù)變得太大,即使模型的訓(xùn)練誤差還在繼續(xù)減低,但是檢驗(yàn)誤差開(kāi)始增大,這是出現(xiàn)了模型擬合不足的問(wèn)題。()正確答案:X4. 在聚類(lèi)分析當(dāng)中,簇內(nèi)的相似性越大,簇間的差別越大,聚類(lèi)的效果就越差。()正確答案:x5. 聚類(lèi)分析可以看作是一種非監(jiān)督的分類(lèi)。()正確答案:,6. 如果一個(gè)對(duì)象不強(qiáng)屬于任何簇,那么該對(duì)象是基于聚類(lèi)的離群點(diǎn)。

2、()正確答案:,7. 允許誤差應(yīng)根據(jù)錯(cuò)誤記錄對(duì)整個(gè)系統(tǒng)可能帶來(lái)的破壞來(lái)確定,通常正是那些低使用率的產(chǎn)品或不常使用的產(chǎn)品為庫(kù)存誤差帶來(lái)很大麻煩,因此應(yīng)結(jié)合數(shù)量方差百分比和絕對(duì)值方差來(lái)確定誤差。()正確答案:,8. 召回率反映的是預(yù)測(cè)為正中的樣本中正例的概率。()正確答案:x9. 支持度表示前項(xiàng)與后項(xiàng)在一個(gè)數(shù)據(jù)集中同時(shí)出現(xiàn)的頻率。()正確答案:,10. 最大最小值標(biāo)準(zhǔn)化法也叫極值法,該方法適用于已知數(shù)據(jù)集的最小值或最大值情況。()11. 波特五力模型中五個(gè)壓力來(lái)源是供應(yīng)商議價(jià)能力、購(gòu)買(mǎi)者的議價(jià)能力、行業(yè)新進(jìn)入者的威脅、替代產(chǎn)品的威脅及企業(yè)內(nèi)部的管理壓力。()(分) 分正確答案:X12. 異常值在數(shù)

3、理統(tǒng)計(jì)里一般是指一組觀測(cè)值中與平均值的偏差超過(guò)三倍標(biāo)準(zhǔn)差的測(cè)定值。()正確答案:X13. 數(shù)據(jù)可視化可以便于人們對(duì)數(shù)據(jù)的理解。()正確答案:,14. 大數(shù)據(jù)思維,是指一種意識(shí),認(rèn)為公開(kāi)的數(shù)據(jù)一旦處理得當(dāng)可以為人類(lèi)急需解決的問(wèn)題提供答案。()正確答案:,15. 資金本身具有時(shí)間價(jià)值。()正確答案:X2、 單選題(題數(shù):30,共分)1. 某超市研究銷(xiāo)售記錄發(fā)現(xiàn),購(gòu)買(mǎi)牛奶的人很大概率會(huì)購(gòu)買(mǎi)面包,這種屬于數(shù)據(jù)挖掘的哪類(lèi)問(wèn)題?()A聚類(lèi)分析日關(guān)聯(lián)規(guī)則C分類(lèi)分析D自然語(yǔ)言處理正確答案:B2. 以下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類(lèi)算法的評(píng)價(jià)標(biāo)準(zhǔn)?()(a) 警察抓殺人犯,描述警察抓的人中有多少個(gè)是殺人犯的標(biāo)準(zhǔn)。

4、(b) 描述有多少比例的殺人犯給警察抓了的標(biāo)準(zhǔn)。A、 Precision, RecallB、 Recall, PrecisionC、 Precision, ROCD、 Recall, ROC正確答案:A3. 將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)?()A數(shù)據(jù)獲取 日分類(lèi)和預(yù)測(cè) C數(shù)據(jù)預(yù)處理 D數(shù)據(jù)可視化正確答案:C4. 當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類(lèi)標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?()A分類(lèi) 日聚類(lèi) C關(guān)聯(lián)分析 DX主成分分析正確答案:B5. 下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()A變量代換 日離散化 C聚集 D估計(jì)遺漏值正確答案:D6. 假設(shè)

5、 12 個(gè)銷(xiāo)售價(jià)格記錄組已經(jīng)排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204,215 使用等寬劃分(寬度為50)方法將它們劃分成四個(gè)箱,求15 在哪個(gè)箱子里?()A第一個(gè) 日第二個(gè) C第三個(gè) D第四個(gè)正確答案:A7. 以下哪些算法是分類(lèi)算法?()A、 DBSCANB、C、 K-MeanD、 K-medoids正確答案:B8. 以下哪些分類(lèi)方法可以較好地避免樣本的不平衡問(wèn)題?()A、 KNNB、 SVMC、 BayesDX神經(jīng)網(wǎng)絡(luò)正確答案:A9. 關(guān)于K均值和DBSCANJ比較,以下說(shuō)法不正確的是()。A K均值丟棄被它識(shí)別為噪聲的對(duì)象,而DBSCA

6、十般聚類(lèi)所有對(duì)象B K均值使用簇的基于原型的概念,而DBSCAN1用基于密度的概念C K均值很難處理非球形的簇和不同大小的簇,DBSCANT以處理不同大小和不同形狀的簇D K均值可以發(fā)現(xiàn)不是明顯分離的簇,即便簇有重疊也可以發(fā)現(xiàn),但是DBSCA由合并有重疊的簇正確答案:A10. 下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()A支持度日置信度C滿(mǎn)意度D提升度正確答案:C11. 因子分析的主要作用有()A對(duì)變量進(jìn)行降維以對(duì)變量進(jìn)行判別C對(duì)變量進(jìn)行聚類(lèi)D以上都不對(duì)正確答案:A曲線(xiàn)凸向哪個(gè)角,代表模型越理想?(A左上角B左下角C右上角D右下角正確答案:A13. SQL 語(yǔ)句中刪除表的命令是()A、 DROP TA

7、BLEB、 DELETE TABLEC、 ERASE TABLED、 DELETE DBF正確答案:A14. 在多元回歸模型的檢驗(yàn)中,目的是檢驗(yàn)每一個(gè)自變量與因變量在指定顯著性水平上是否存在線(xiàn)性相關(guān)關(guān)系的檢驗(yàn)是()A、 r 檢驗(yàn)B、 t 檢驗(yàn)C、 f 檢驗(yàn)DX 口陽(yáng)驗(yàn)正確答案:B15. ( )提供的支撐技術(shù),有效解決了大數(shù)據(jù)分析、研發(fā)的問(wèn)題,比如虛擬化技術(shù)、并行計(jì)算、海量存儲(chǔ)和海量管理等。A、點(diǎn)計(jì)算日線(xiàn)計(jì)算C云計(jì)算DX面計(jì)算正確答案:C16. 智能健康手環(huán)的應(yīng)用開(kāi)發(fā),體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)用。A統(tǒng)計(jì)報(bào)表 日網(wǎng)絡(luò)爬蟲(chóng) C、 API 接口D傳感器正確答案:D17. 下列關(guān)于數(shù)據(jù)重組的說(shuō)法中,

8、錯(cuò)誤的是(A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集日數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新正確答案:A18. 美國(guó)海軍軍官莫里通過(guò)對(duì)前人航海日志的分析,繪制了新的航海路線(xiàn)圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)日在分析方法上更注重相關(guān)分析而不是因果分析C在分析效果上更追究效率而不是絕對(duì)精確D在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)正確答案:B19. 當(dāng)前國(guó)內(nèi)社會(huì)中,最為突出的大數(shù)據(jù)環(huán)境是()A互聯(lián)網(wǎng)以物聯(lián)網(wǎng)C綜合國(guó)力D自然資源正確答案:A20. 下列關(guān)于

9、聚類(lèi)挖掘技術(shù)的說(shuō)法中,錯(cuò)誤的是()A、不預(yù)先設(shè)定數(shù)據(jù)歸類(lèi)類(lèi)目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類(lèi)別 日要求同類(lèi)數(shù)據(jù)的內(nèi)容相似度盡可能小C要求不同類(lèi)數(shù)據(jù)的內(nèi)容相似度盡可能小D與分類(lèi)挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類(lèi)處理正確答案:B21. 下列關(guān)于大數(shù)據(jù)的分析理念的說(shuō)法中,錯(cuò)誤的是()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)日在分析方法上更注重相關(guān)分析而不是因果分析C在分析效果上更追究效率而不是絕對(duì)精確D在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)正確答案:D22. 對(duì)于企業(yè)來(lái)說(shuō),數(shù)據(jù)使用的關(guān)鍵是()A數(shù)據(jù)收集日數(shù)據(jù)存儲(chǔ)C數(shù)據(jù)分析D數(shù)據(jù)再利用正確答案:D23. 數(shù)據(jù)倉(cāng)庫(kù)的最終目的是()A收集

10、業(yè)務(wù)需求日建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型C開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用分析D為用戶(hù)和業(yè)務(wù)部門(mén)提供決策支持正確答案:D24. 大數(shù)據(jù)背景下,數(shù)據(jù)支撐業(yè)務(wù)的目的是()A建立數(shù)據(jù)科學(xué)日完成數(shù)據(jù)應(yīng)用C配備數(shù)據(jù)硬件D吸納數(shù)據(jù)人才正確答案:B25. 在SQL中,創(chuàng)建數(shù)據(jù)庫(kù)用的命令是()A、 CREATE SCHEMAB、 CREATE TABLEC、 CREATE VIEWD、 CREATE DATABASE正確答案:D26. 下列四項(xiàng)中,不屬于數(shù)據(jù)庫(kù)特點(diǎn)的是()A數(shù)據(jù)共享日數(shù)據(jù)完整性C數(shù)據(jù)冗余很高D數(shù)據(jù)獨(dú)立性高正確答案:C27. 資金的時(shí)間價(jià)值是()A、同一資金在同一時(shí)點(diǎn)上價(jià)值量的差額 日同一資金在不同時(shí)點(diǎn)上價(jià)值量的差額C

11、不同資金在同一時(shí)點(diǎn)上價(jià)值量的差額DX不同資金在不同時(shí)點(diǎn)上價(jià)值量的差額正確答案:B28. 下列選項(xiàng)中屬于現(xiàn)金流入的項(xiàng)目是()A所得稅日建設(shè)投資C經(jīng)營(yíng)成本D營(yíng)業(yè)收入正確答案:D29. 下列關(guān)于計(jì)算機(jī)存儲(chǔ)容量單位的說(shuō)法中,錯(cuò)誤的是()A、 1KB1MB1GB日基本單位是字節(jié)(Byte )C 一個(gè)漢字需要一個(gè)字節(jié)的存儲(chǔ)空間D 一個(gè)字節(jié)能夠容納一個(gè)英文字符正確答案:C30. 按數(shù)據(jù)的結(jié)構(gòu)程度來(lái)劃分,分為()A、結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)以強(qiáng)結(jié)構(gòu)化數(shù)據(jù)弱結(jié)構(gòu)化數(shù)據(jù)C截面數(shù)據(jù)面板數(shù)據(jù)D 一級(jí)數(shù)據(jù)二級(jí)數(shù)據(jù)三級(jí)數(shù)據(jù)正確答案:A三、 多選題(題數(shù):20,共 分)A缺失值填充日噪聲數(shù)據(jù)剔除C異常值識(shí)別D數(shù)據(jù)

12、可視化正確答案:ABC2. 缺失值的處理方法有哪些?()A用平均值填充以忽略缺失記錄C以任意數(shù)據(jù)填充D用默認(rèn)值填充正確答案:ABD3. 以下屬于數(shù)據(jù)規(guī)約方法的是()A數(shù)據(jù)離散化日數(shù)據(jù)標(biāo)準(zhǔn)化C噪聲數(shù)據(jù)識(shí)別D數(shù)據(jù)壓縮正確答案:AD4. 數(shù)據(jù)挖掘的預(yù)測(cè)建模任務(wù)主要包括哪幾大類(lèi)問(wèn)題?()A分類(lèi)日回歸C模式發(fā)現(xiàn)D模式匹配正確答案:AB5. 以下說(shuō)法正確的有哪些?()A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大日大數(shù)據(jù)對(duì)傳統(tǒng)行業(yè)有幫助C大數(shù)據(jù)會(huì)帶來(lái)機(jī)器智能D大數(shù)據(jù)是一種思維方式正確答案:BCD6. 關(guān)于大數(shù)據(jù)的來(lái)源,以下理解正確的是()A、大數(shù)據(jù)是數(shù)據(jù)量變積累達(dá)到質(zhì)變的結(jié)果日 數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長(zhǎng)時(shí)間C我們每個(gè)人都是

13、數(shù)據(jù)的制造者D當(dāng)今的世界,基本上一切都可以用數(shù)字表達(dá),所以叫數(shù)字化的世界正確答案:ACD7. 大數(shù)據(jù)在今天這個(gè)時(shí)間點(diǎn)上爆發(fā)的原因有哪些?()A、各種傳感器無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)日各種監(jiān)控設(shè)備無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)C各種智能設(shè)備無(wú)時(shí)無(wú)刻不在為我們提供大量的數(shù)據(jù)D互聯(lián)網(wǎng)的收集和積累正確答案:ABCD8. ( )這些數(shù)據(jù)特性都是對(duì)聚類(lèi)分析具有很強(qiáng)影響的。A高維性日規(guī)模C稀疏性D噪聲和離群點(diǎn)正確答案:ABCD9. 以下哪個(gè)分布是右偏分布?()A均勻分布日卡方分布C、 F 分布DX對(duì)數(shù)正態(tài)分布正確答案:BCD10. 以下哪些變量使用 RFM方法構(gòu)造出來(lái)的?()A最近3期境外消費(fèi)金額日

14、最近6期網(wǎng)銀消費(fèi)交易筆數(shù)C信用額度D距最近一次逾期的月數(shù)正確答案:ABD11. 如下表 student 中 , 如何篩選type 為包含數(shù)學(xué)或語(yǔ)文的記錄?()A、 select * from student where type=“數(shù)學(xué)”and type= “語(yǔ)文”B、 select * from student where type=“數(shù)學(xué)”or type= “語(yǔ)文”C、 select * from student where type in ( “數(shù)學(xué)” , “語(yǔ)文”) D、 select * from student wh ere type in ( “數(shù)學(xué)” ? “語(yǔ)文”)正確答案:B

15、C12. 主成分分析計(jì)算選擇相關(guān)系數(shù)計(jì)算法時(shí),確定主成分個(gè)數(shù)的大致原則包括()A、特征根值大于1日特征根值大于C累積特征根值加總占總特征根值的80%D累積特征根值加總占總特征根值的90%正確答案:AC13. 在客戶(hù)關(guān)系管理中,客戶(hù)的生命周期都包括()階段。A潛在客戶(hù)日響應(yīng)客戶(hù)C即得客戶(hù)D流失客戶(hù)正確答案:ABCD14. 分箱方法有哪些?()(分) 分A等深分箱日等寬分箱C數(shù)據(jù)標(biāo)準(zhǔn)化D自定義區(qū)間法正確答案:ABD15. 利用 Apriori 算法計(jì)算頻繁項(xiàng)集可以有效降低計(jì)算頻繁集的時(shí)間復(fù)雜度。在以下的購(gòu)物籃中產(chǎn)生支持度不小于3 的候選 3- 項(xiàng)集,在候選2-項(xiàng)集中需要剪枝的是() ID 項(xiàng)集。1 面包、牛奶2 面包、尿布、啤酒、雞蛋3 牛奶、尿布、啤酒、可樂(lè)4 面包、牛奶、尿布、啤酒5 面包、牛奶、尿布、可樂(lè)A啤酒、尿布日啤酒、面包C面包、尿布D啤酒、牛奶正確答案:BD16. 我們可以用哪種方式來(lái)避免決策樹(shù)過(guò)度擬合的問(wèn)題?()A、利用修剪法來(lái)限制樹(shù)的深度日利用盆栽法規(guī)定每個(gè)節(jié)點(diǎn)下的最小的記錄數(shù)目C利用逐步回歸法來(lái)刪除部分?jǐn)?shù)據(jù)D目前并無(wú)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論