大數(shù)據(jù)挖掘分析專業(yè)考試題及答案

上傳人：1*** IP屬地：河北上傳時間：2024-05-06 格式：DOCX 頁數(shù)：129 大小：122.65KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩124頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

單選題1.通過(),計算頻數(shù)、眾數(shù)、中位數(shù)等一個或多個數(shù)據(jù)A、概率統(tǒng)計法C、可視化法D、分類統(tǒng)計法2.MapReduce是一種()計算模型C、離散式D、放射式3.一種商品價格變動與由此引起另外一種商品需求量相對變動的比率稱為()A、需求價格彈性B、供給價格彈性D、供給交叉彈性4.請問以下何者屬于時間序列的問題?A、信用卡發(fā)卡銀行偵測潛在的卡奴B、基金經(jīng)理人針對個股做出未來價格預測C、電信公司將人戶區(qū)分為數(shù)個群體5.非參數(shù)檢驗是針對()分布情況做的假設(shè)。6.分類器效果檢驗中的準確率是指()A、預測正確的數(shù)據(jù)在總數(shù)據(jù)中的比例B、預測為正的數(shù)據(jù)在總數(shù)據(jù)中的比例C、預測為正的數(shù)據(jù)中實際為正的數(shù)據(jù)所占比例D、實際為正的數(shù)據(jù)中被預測為正的數(shù)據(jù)所占比例7.《數(shù)據(jù)安全法》發(fā)布執(zhí)行時間()。C、2021年11月1日8.實際接入的指標數(shù)占應(yīng)接指標總數(shù)的比例，統(tǒng)計時又分線上和線下接入率稱為()A、指標數(shù)據(jù)自動采集率；B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率；D、指標數(shù)據(jù)完整率9.關(guān)于回歸分析，下列說法中錯誤的是()A、作回歸分析的變量之間要有實際意義，不能把毫無關(guān)聯(lián)的兩種現(xiàn)象隨意進行回歸分析，要結(jié)合專業(yè)知識對兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。B、在進行線性回歸分析進行的數(shù)據(jù)準備的時候，要求因變量y和自變量x都是符合總體正態(tài)的隨機變量。C、回歸直線不要隨意外延D、所有非線性回歸都可以轉(zhuǎn)化為線性回歸10.凈現(xiàn)值、內(nèi)部收益率、獲利指數(shù)指標之間的數(shù)量關(guān)系()NPV>011.關(guān)于K均值和DBSCAN的比較，以下說法不正確的是()A、K均值丟棄被它識別為噪聲的對象，而DBSCAN一般聚類所B、K均值使用簇的基于原型的概念，而DBSCAN使用基于密度C、K均值很難處理非球形的簇和不同大小的簇，DBSCAN可以處理不同大小和不同形狀的簇。D、K均值可以發(fā)現(xiàn)不是明顯分離的簇，即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會合并有重疊的簇。12.人們購買制冷用空調(diào)主要是為了在夏天獲得涼爽空氣，空調(diào)產(chǎn)品整體概念中的()A、有形產(chǎn)品B、直接產(chǎn)品C、核心產(chǎn)品D、主要產(chǎn)品13.某牙膏廠原來生產(chǎn)兩面針藥物牙膏，現(xiàn)在又增屬于()C、集團多元化當立即采取()措施，按照規(guī)定及時告知用戶并向有關(guān)主管部門報告。()15.回歸分析的第一步是()A、確定解釋量和被解釋變量B、確定回歸模型D、進行檢驗16.當所有觀測值都落在回歸直線上，則這兩個變量之間的相關(guān)系數(shù)為()17.()是進行項目投資效益評價的最終依據(jù)。A、現(xiàn)金流量B、盈虧平衡點C、凈現(xiàn)金流量D、現(xiàn)金流入量B、分類和預測D、演變分析19.下面哪種不屬于數(shù)據(jù)預處理的方法?()D、估計遺漏值20.下列不屬于關(guān)聯(lián)分析的關(guān)鍵要素的是()D、提升度21.NoSQL含義是指()22.資金的時間價值是()A、同一資金在同一時點上價值量的差額B、同一資金在不同時點上價值量的差額C、不同資金在同一時點上價值量的差額D、不同資金在不同時點上價值量的差額23.以下哪種方法不屬于于監(jiān)督學習模型()D、判別分析在指定顯著性水平上是否存在線性相關(guān)關(guān)系的檢驗是()C、f檢驗27.下面關(guān)于因子分析的說法正確的是()A、因子分析就是主成分分析B、因子之間可相關(guān)也可不相關(guān)C、因子受量綱的影響D、可以對因子進行旋轉(zhuǎn)，使其意義更明顯28.快速實現(xiàn)簡單的MapReduce統(tǒng)計，不必開發(fā)專門的MapReduce應(yīng)用，十分適合數(shù)據(jù)倉庫的統(tǒng)計分析的是()。29.企業(yè)要建立預測模型，需準備建模數(shù)數(shù)據(jù)集正確的是()A、數(shù)據(jù)越多越好B、盡可能多的適合的數(shù)據(jù)C、數(shù)據(jù)越少越好D、以上三條都不正確30.以下哪個類型的變量在作預測客戶流失的模型中最有解釋力A、人口基本數(shù)據(jù)，比如年齡和性別B、基本社會狀態(tài)數(shù)據(jù)，比如收入和職業(yè)C、業(yè)務(wù)數(shù)據(jù)，比如消費頻次D、業(yè)務(wù)數(shù)據(jù)的衍生變量，比如最近3個月消費頻次的變化情況31.將復雜的地址簡化成北、中、南、東四區(qū)，是在進行?B、數(shù)據(jù)一般化C、數(shù)據(jù)離散化D、數(shù)據(jù)整合32.Hadoop是一個開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺，是Appach的一個用()語言實現(xiàn)開源軟件框架。C、R語言C、價值高D、系統(tǒng)多34.Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法，它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻繁項集的算法，利用()搜索的方法挖掘頻繁項集。A、逐層35.分類算法以()定理為基礎(chǔ)，采用概率方法對數(shù)據(jù)進行建模A、決策樹36.自然界中某種事物發(fā)生時其他事物也會發(fā)生，則這種聯(lián)系稱之D、聯(lián)系38.下列哪個不屬于個人信息影響評估原則()A、個人信息的處理目的、處理方式等是否合法、正當、必要B、對個人的影響及風險程度D、所采取的安全保護措施是否合法、有效并與風險程度相適應(yīng)。39.以下哪項關(guān)于決策樹的說法是錯誤的()A、冗余屬性不會對決策樹的準確率造成不利的影響B(tài)、子樹可能在決策樹中重復多次C、決策樹算法對于噪聲的干擾非常敏感D、尋找最佳決策樹是NP完全問題40.Hadoop框架中兩大核心是：()和MapReducE41.將數(shù)據(jù)轉(zhuǎn)換為可視化的形式，便于直觀快速發(fā)現(xiàn)數(shù)據(jù)規(guī)律。的數(shù)據(jù)探索方法是()。B、概率統(tǒng)計法42.矩估計的基本原理是()A、用樣本矩估計總體矩B、使得似然函數(shù)達到最大C、使得似然函數(shù)達到最小D、小概率事件在一次試驗中是不可能發(fā)生的43.數(shù)據(jù)預處理目前常用的異常數(shù)據(jù)識別方法包括業(yè)務(wù)判別法、()、箱線圖判別法、統(tǒng)計判別法C、抽樣判別法44.算法的核心思想是()逐層構(gòu)造一個樹。45.下列關(guān)于大數(shù)據(jù)的分析理念的說法中，錯誤的是()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)A、數(shù)據(jù)挖掘與知識發(fā)現(xiàn)B、領(lǐng)域知識發(fā)現(xiàn)C、文檔知識發(fā)現(xiàn)D、動態(tài)知識發(fā)現(xiàn)47.某家長為了使孩子在第3-6年上大學的4年中，每年年初得到10000元助學基金，他應(yīng)在2年前在銀行存入多少錢?(年利率按5%計算)()48.關(guān)于K均值和DBSCAN的比較，以下說法不正確的是()。A、K均值丟棄被它識別為噪聲的對象，而DBSCAN一般聚類所有對象B、K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念C、K均值很難處理非球形的簇和不同大小的簇，DBSCAN可以處理不同大小和不同形狀的簇D、K均值可以發(fā)現(xiàn)不是明顯分離的簇，即便簇有重疊也可以發(fā)現(xiàn)，但是DBSCAN會合并有重疊的簇49.SQL查詢語句中HAVING子句的作用是()A、指出分組查詢的范圍B、指出分組查詢的值C、指出分組查詢的條件D、指出分組查詢的內(nèi)容50.一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)稱為()。B、中位數(shù)C、眾數(shù)51.JSON中的中括號一般來表示()。B、標點符號C、對象52.模型構(gòu)建指基于()數(shù)據(jù)構(gòu)建數(shù)據(jù)挖掘模型。B、線下C、實時D、歷史53.Tableau在處理離線地圖時，需要將54.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯誤的有()A、神經(jīng)網(wǎng)絡(luò)對訓練數(shù)據(jù)中的噪聲非常魯棒B、可以處理冗余特征C、訓練ANN是一個很耗時的過程D、至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)55.美國海軍軍官莫里通過對前人航海日志的分析，繪制了新的航海路線圖，標明了大風與洋流可能發(fā)生的地點。這體現(xiàn)了大數(shù)據(jù)分析理念中的()A、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析C、在分析效果上更追究效率而不是絕對精確D、在數(shù)據(jù)規(guī)模上強調(diào)相對數(shù)據(jù)而不是絕對數(shù)據(jù)56.當時間序列的環(huán)比增長速度大體相同時，適宜擬合()A、指數(shù)曲線C、直線D、對數(shù)曲線57.將多個指標轉(zhuǎn)化為少數(shù)幾個指標的一種統(tǒng)計分析方法是()。D、假設(shè)檢驗合理()量62.因子分析的主要作用有()A、對變量進行降維B、對變量進行判別C、對變量進行聚類63.數(shù)據(jù)中心側(cè)的數(shù)據(jù)流轉(zhuǎn)方式未為()64.給定歷史時間數(shù)據(jù)，通過擬合時序模型，分析研究時序數(shù)據(jù)的發(fā)展變化規(guī)律，得出觀測數(shù)據(jù)的歷史統(tǒng)計特征，再據(jù)此進行外推預測目標的分析方法是()。B、回歸C、時間序列D、匯總統(tǒng)計65.智能健康手環(huán)的應(yīng)用開發(fā)，體現(xiàn)了()的數(shù)據(jù)采集技術(shù)的應(yīng)。A、統(tǒng)計報表B、網(wǎng)絡(luò)爬蟲C、API接口D、傳感器66.假設(shè)檢驗中顯著性水平是()A、推斷時犯取偽錯誤的概率B、推斷時取偽棄真的概率C、正確推斷的概率D、是推斷的可信度67.以下哪些算法是分類算法()68.以下關(guān)于大數(shù)據(jù)應(yīng)用說法錯誤的是()。B、目前金融、電信、零售、公共服務(wù)等領(lǐng)域在積極的探索和應(yīng)C、互聯(lián)網(wǎng)是大數(shù)據(jù)的發(fā)源地；D、互聯(lián)網(wǎng)上形成了多種相對成熟的應(yīng)用模式。69.下列關(guān)于計算機存儲容量單位的說法中，錯誤的是()B、基本單位是字節(jié)(Byte)C、一個漢字需要一個字節(jié)的存儲空間D、一個字節(jié)能夠容納一個英文字符70.當置信水平一定時，置信區(qū)間的寬度()A、隨著樣本量的增大而減小B、隨著樣本量的增大而增大C、與樣本量的大小無關(guān)D、先隨著樣本量的增大而減小，到一定程度后會隨著樣本量的72.個人信息保護影響評估報告和處理情況記錄應(yīng)當至少保存()74.有一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的信心水平(confidence)為60則代表()A、買B商品的顧客中，有60%的顧客會同時購買AC、買A商品的顧客中，有60%的顧客會同時購買BD、兩商品A,B在交易數(shù)據(jù)庫中同時被購買的機率為60%75.有一組數(shù)據(jù)其均值是20,對其中的每一個數(shù)據(jù)都加上10,那么得到的這組新數(shù)據(jù)的均值是()。76.與大數(shù)據(jù)密切相關(guān)的技術(shù)是()。77.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴展強、數(shù)據(jù)挖掘能力強等特點的分析工具是()。78.用于分類與回歸應(yīng)用的主要算法有：()B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹C、K均值法、SOM神經(jīng)網(wǎng)絡(luò)D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯79.()提供的支撐技術(shù)，有效解決了大數(shù)據(jù)分析、研發(fā)的問題，比如虛擬化技術(shù)、并行計算、海量存儲和海量管理等。B、線計算D、面計算80.描述一組對稱(或正態(tài))分布數(shù)據(jù)的離散程度時，最適宜選擇的指標是()B、標準差D、變異系數(shù)則由候選產(chǎn)生過程得到4-項集不包含()82.相關(guān)分析與回歸分析的一個重要區(qū)別是()A、前者研究變量之間關(guān)系的密切程度，后者研究變量間的變動關(guān)系，并用方程式表示B、前者研究變量之間的變動關(guān)系，后者研究變量間關(guān)系的密切程度C、兩者都研究變量間的變動關(guān)系D、兩者都不研究變量間的變動關(guān)系83.SQL語句中刪除表的命令是()84.已知事件A的概率P(A)=0.6,U為必然事件，則P(A+U)=1,P(A85.邁克爾·波特的“五力模型”中，五種競爭力量中不包括()A、新進入者B、供應(yīng)商議價能力C、其他利益相關(guān)者力量D、行業(yè)中現(xiàn)有競爭者箱，求15在哪個箱子?()87.()是研究一種或者多種因素的變化對試驗結(jié)果的觀測值是否有顯著影響的統(tǒng)計方法。B、數(shù)據(jù)降維C、方差分析D、假設(shè)檢驗88.某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn)，買啤酒的人很大概率也會購買尿布，這種屬于數(shù)據(jù)挖掘的哪類問題?()A、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)89.以下哪個指標不能用于線性回歸中的模型比較()B、調(diào)整R方90.下面關(guān)于聚類分析說法錯誤的是()A、一定存在一個最優(yōu)的分類B、聚類分析是無監(jiān)督學習C、聚類分析可以用于判斷異常值D、聚類分析即：物以類聚，人以群分91.分類變量使用以下哪個統(tǒng)計量進行缺失值填補較合適B、最大值D、中位數(shù)92.若數(shù)據(jù)量較大，下面哪種方式比較適合()C、A和B都可以D、A和B都不可以93.在對歷史數(shù)據(jù)集進行分區(qū)之前進行數(shù)據(jù)清洗(缺失值填補等)的缺點是什么A、違反了建模的假設(shè)條件B、加大了處理的難度C、無法針對分區(qū)后各個數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗D、無法對不同數(shù)據(jù)清理的方法進行比較，以選擇最優(yōu)方法94.數(shù)據(jù)倉庫是隨著時間變化的，下面的描述不正確的是()A、數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容B、捕捉到的新數(shù)據(jù)會覆蓋原來的快照C、數(shù)據(jù)倉庫隨時間變化不斷刪去舊的數(shù)據(jù)內(nèi)容D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù)，這些綜合數(shù)據(jù)會隨著時間的變化不斷地進行重新綜合95.SQL語言中，刪除一個表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是()96.依照《中華人民共和國數(shù)據(jù)安全法》和有關(guān)法規(guī)定，()負責統(tǒng)籌協(xié)調(diào)網(wǎng)絡(luò)數(shù)據(jù)安全和相關(guān)監(jiān)管工作。A、工業(yè)和信息化部B、國家安全部門C、國家網(wǎng)信部門D、通信主管部門97.假設(shè)屬性ine的最大最小值分別是12000元和98000元。利用最大-最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性ine的73600元將被轉(zhuǎn)化為()98.建立一個模型，通過這個模型根據(jù)已知的變量值來預測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()A、根據(jù)內(nèi)容檢索B、建模描述C、預測建模D、尋找模式和規(guī)則99.自動化高級分析實驗室，實現(xiàn)與統(tǒng)一數(shù)據(jù)資源庫互聯(lián)，實現(xiàn)數(shù)據(jù)的自助組表、自助分析功能，滿足不同層級、不同水平的用戶需求的是()C、系統(tǒng)聚類D、高級分析100.下列選項中屬于現(xiàn)金流入的項目是()B、建設(shè)投資C、經(jīng)營成本D、營業(yè)收入101.一組N個觀測值按數(shù)值大小排列，分成100份，處于X%位置的值稱第X個百分位數(shù)稱為()。102.開始將N個樣品各自作為一類，將規(guī)定樣品之間的距離和類與類之間的距離，然后將距離最近的兩類合并成一個新類，計算新類與其他類的距離，重復進行兩個最近類的合并，每次減少一類，直至所有的樣品合并為一類，此種聚類方法是()D、有序聚類103.指數(shù)平滑法可以用以下哪種指標來反映對時間序列資料的修正程度()B、指數(shù)平滑數(shù)初始值D、季節(jié)指數(shù)104.變量的量綱比如以厘米或者米為單位對下面哪種方法會有影響()B、回歸分析D、主成分分析105.關(guān)于Tableau的特點，以下說法錯誤的是()C、開發(fā)快速，分享便捷；D、需要IT大量人員參與106.在ID3算法中信息增益是指()B、信息的增加效益C、熵增加的程度最大D、熵減少的程度最大107.一組數(shù)據(jù)中最大值與最小值的差值稱為(),也稱全A、極差B、極距C、距離D、方差108.()是一種開源軟件編程語言，主要用于統(tǒng)計分析，繪圖和數(shù)據(jù)挖掘，內(nèi)置多種統(tǒng)計及分析功能。B、使樹成長C、處理缺失值和異常值D、砍樹110.泊松回歸是一種廣泛應(yīng)用的()回歸模型。A、線性A、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)和用戶B、數(shù)據(jù)文件、命令文件和報表C、數(shù)據(jù)庫文件結(jié)構(gòu)和數(shù)據(jù)D、常量、變量和函數(shù)112.下列四項中，不屬于數(shù)據(jù)庫特點的是()B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨立性高113.某小區(qū)60%居民訂晚報，45%訂青年報，30%兩報均訂，隨機抽一戶。則至少訂一種報的概率為()A、面臨大數(shù)據(jù)，統(tǒng)計學的研究對象有所改變；B、在大數(shù)據(jù)環(huán)境中，需要首先將未知的問題轉(zhuǎn)化為可用的統(tǒng)計C、在大數(shù)據(jù)分析過程中，傳統(tǒng)的統(tǒng)計分析過程“定量一定位一再定性”轉(zhuǎn)變?yōu)椤岸恳欢ㄐ浴?D、在大數(shù)據(jù)環(huán)境中，需要將統(tǒng)計研究的對象范圍擴展到一切數(shù)數(shù)據(jù)挖掘能力強等特點的分析工具是()。116.下列說明錯誤的是()A、性別=“男”=>職業(yè)=“司機”,是布爾型關(guān)聯(lián)規(guī)則B、性別=“女”=>avg(收入)=2300,是一個數(shù)值型關(guān)聯(lián)規(guī)則C、肝炎=>ALT(丙氨酸轉(zhuǎn)氨酶)升高，是一個單層關(guān)聯(lián)規(guī)則D、性別=“女”=>職業(yè)=“秘書”,是多維關(guān)聯(lián)規(guī)則117.Hive是基于Hadoop的一個數(shù)據(jù)()工具D、可視化118.數(shù)據(jù)記錄內(nèi)容完整比例，包括指標單位維度、業(yè)務(wù)維度組合記錄條數(shù)完整，指標字段值完整稱為()A、指標數(shù)據(jù)自動采集率；B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率；D、指標數(shù)據(jù)完整率119.EXCEL中，求標準差的函數(shù)是()最為適宜，其值是()。B、中位數(shù)，8.5C、眾數(shù)，8D、以上都可以121.《個人信息保護法》發(fā)布執(zhí)行時間()。122.檢測一元正態(tài)分布中的離群點，屬于異常檢測中的基于()的離群點檢測A、統(tǒng)計方法B、鄰近度D、聚類技術(shù)123.下列關(guān)于聚類挖掘技術(shù)的說法中，錯誤的是()A、不預先設(shè)定數(shù)據(jù)歸類類目，完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能C、要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能D、與分類挖掘技術(shù)相似的是，都是要對數(shù)據(jù)進行分類處理124.按數(shù)據(jù)的結(jié)構(gòu)程度來劃分，分為()A、結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)B、強結(jié)構(gòu)化數(shù)據(jù)、弱結(jié)構(gòu)化數(shù)據(jù)C、截面數(shù)據(jù)、面板數(shù)據(jù)D、一級數(shù)據(jù)、二級數(shù)據(jù)、三級數(shù)據(jù)125.當前國內(nèi)社會中，最為突出的大數(shù)據(jù)環(huán)境是()126.()是一種松散耦合的服務(wù)和應(yīng)用之間標準的集成方式。127.在建立線性回歸(LinearRegression)之前我們可以利用何種方法挑選重要屬性，以降低模型的復雜度?A、皮爾森相關(guān)系數(shù)C、T-檢定128.給定一個置信概率和置信區(qū)域，若誤差超過置信區(qū)域，則認為誤差不是隨機誤差引起，視為異常值的判別方法()。D、統(tǒng)計判別法129.ROC曲線凸向哪個角，代表模型越理想?D、右下角130.給出下列結(jié)論：1)在回歸分析中，可用指數(shù)系數(shù)R方的值判模型的擬合效果越好；(3)在回歸分析中，可用相關(guān)系數(shù)r的值判斷模型的擬合效果，r越小，模型的擬合效果越好；(4)在回歸分析中，可用殘差圖判斷模型的擬合效果，殘差點比較均勻地落在水平的帶狀區(qū)域中，說明這樣的模型比較合適.帶狀區(qū)域的寬度越寬，說明模型的擬合精度越高.以上結(jié)論中，正確的有()個131.回歸是一種預測建模技術(shù)，研究()和()的依存關(guān)系。A、預測值、實際值B、自變量、因變量C、絕對誤差、平方誤差D、測試樣本、集合132.0DS是指()D、總線133.用簡單隨機重復抽樣方法抽取樣本單位，如果要使抽樣平均誤差降低50%,則樣本容量需要擴大到原來的()B、3倍D、5倍度()哪個步驟的任務(wù)?()B、分類和預測C、數(shù)據(jù)預處理D、數(shù)據(jù)可視化137.在有指導的數(shù)據(jù)挖掘中，有關(guān)測試集的說法錯誤的是()A、測試集和訓練集是相互聯(lián)系的B、測試集是用以測試模型的數(shù)據(jù)集C、通常測試集大約占總樣本的三分之一D、K-次交叉驗證中，測試集只有1個，訓練集有K-1個138.以下那一項不是大數(shù)據(jù)提供的用戶交互方式是()。C、大數(shù)據(jù)分析挖掘D、可視化139.表示職稱為副教授、性別為男的表達式為()A、職稱=’副教授’OR性別=’男’B、職稱=’副教授’AND性別=’男’C、BETWEEN'副教授’AND'男’D、IN(副教授’,’男’)()分類變量預測和概率預測。B、三值D、一值141.檢查異常值常用的統(tǒng)計圖形是()A、柱狀圖142.以下哪條屬于個人信息影響的評估場景：()A、處理敏感個人信息，利用個人信息進行自動化決策B、委托處理個人信息、向第三方提供個人信息、公開個人信息C、向境外提供個人信息D、以上皆是143.《個人信息保護法》對于企業(yè)的影響不包括()A、需要強化個人信息處理這主體責任B、明確了可以量化的中國版執(zhí)行罰則C、需要設(shè)立負責處理個人信息保護相關(guān)事務(wù)的專門機構(gòu)和指定代表D、收集和處理數(shù)據(jù)時可以不遵循“最小化”原則144.實際由源業(yè)務(wù)系統(tǒng)自動接入的指標數(shù)據(jù)占指標體系中應(yīng)接指標總數(shù)的比例稱為()A、指標數(shù)據(jù)自動采集率；B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率；D、指標數(shù)據(jù)完整率145.假設(shè)檢驗中，拒絕域的邊界稱為()C、置信水平D、邊際值146.以下關(guān)于大數(shù)據(jù)的概念和理解不正確的是()A、大數(shù)據(jù)是指無法再容許的時間內(nèi)用常規(guī)的軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合，大數(shù)據(jù)規(guī)模的標準是持續(xù)變化的，當前泛指單一的數(shù)據(jù)集的大小在幾十TB和PB之間；B、大數(shù)據(jù)是一項技術(shù)，能夠?qū)碗s海量數(shù)據(jù)進行實時獲取、傳輸、存儲、加工和利用的高薪技術(shù)；C、大數(shù)據(jù)是一種挑戰(zhàn)，現(xiàn)有的數(shù)據(jù)采集、傳輸、存儲、處理和分析技術(shù)已無法適用于現(xiàn)有的需要；D、大數(shù)據(jù)是一個時代，擁有大數(shù)據(jù)是時代的特征、解讀大數(shù)據(jù)是時代的任務(wù)、應(yīng)用大數(shù)據(jù)是時代的機遇。147.數(shù)據(jù)收集的標準為()而非動用企業(yè)全部數(shù)據(jù)。A、一致性、可靠性、時效性B、相同性、可靠性、時效性C、C相關(guān)性、可靠性、時效性D、一致性、可靠性、實際性A、操作系統(tǒng)；B、數(shù)據(jù)庫C、聊天軟件D、瀏覽器149.當不知道數(shù)據(jù)所帶標簽時，可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離?()D、主成分分析150.某超市研究銷售記錄發(fā)現(xiàn)，購買奶的很概率會購買包，這種屬于數(shù)據(jù)挖掘的哪類問題?()A、聚類分析B、關(guān)聯(lián)規(guī)則151.蘋果公司對IPHONE的降價行為屬于()A、地域性差別定價B、時間性差別定價C、非線性定價或數(shù)量折扣定價D、其他形式的定價152.當不知道數(shù)據(jù)所帶標簽時，可以使用哪種技術(shù)促使帶同類標簽的數(shù)據(jù)與帶其他標簽的數(shù)據(jù)相分離?D、隱馬爾可夫鏈C、時間序列D、關(guān)聯(lián)規(guī)則154.《中華人民共和國數(shù)據(jù)安全法》中的數(shù)據(jù)，是指任何以電子或者其他方式對()的記錄。D、知識155.下列不屬于原始數(shù)據(jù)來源的是()D、實驗156.數(shù)據(jù)挖掘技術(shù)包括三個主要的部分()A、數(shù)據(jù)、模型、技術(shù)B、算法、技術(shù)、領(lǐng)域知識C、數(shù)據(jù)、建模能力、算法與技術(shù)D、建模能力、算法與技術(shù)、領(lǐng)域知識C、垂直結(jié)構(gòu)樹形式是()屬于()問題。A、關(guān)聯(lián)規(guī)則挖掘C、聚類分析D、時序預測160.在有關(guān)數(shù)據(jù)倉庫測試，下列說法不正確的是()A、在完成數(shù)據(jù)倉庫的實施過程中，需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B、當數(shù)據(jù)倉庫的每個單獨組件完成后，就需要對他們進行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試D、在測試之前沒必要制定詳細的測試計劃161.Byte代表一個字節(jié)，及()的數(shù)值范圍。162.目前常用的識別異常數(shù)據(jù)的方法有物理判別法和()。B、統(tǒng)計判別法C、靜態(tài)判別法D、動態(tài)判別法163.下列有關(guān)Apriori算法的說法中不正確的是()A、Apriori算法是關(guān)聯(lián)分析中最常用的算法之一。B、應(yīng)用Apriori算法時，需要先設(shè)定模型的最小支持度、最小置信度等閾值。C、應(yīng)用Apriori算法時，輸入的數(shù)據(jù)可以是連續(xù)型數(shù)據(jù)也可以是D、Apriori算法掃描數(shù)據(jù)庫的次數(shù)依賴于最大頻繁項集中項的數(shù)164.VBA語言中，聲明變量的關(guān)鍵字是()。165.下列四項中，不屬于數(shù)據(jù)庫特點的是()A、數(shù)據(jù)共享B、數(shù)據(jù)完整性C、數(shù)據(jù)冗余很高D、數(shù)據(jù)獨立性高166.維度規(guī)約是在以下哪個步驟的任務(wù)?()A、頻繁模式挖掘C、數(shù)據(jù)預處理D、數(shù)據(jù)流挖掘167.屬于財務(wù)專業(yè)明細數(shù)據(jù)表的是()B、應(yīng)收票據(jù)信息表；C、公司分壓線損統(tǒng)計表；D、供應(yīng)計劃表168.以下哪個變量可以反映客戶的忠誠度?()B、購買金額C、最后一次購買時間D、購買金額波動率169.某項目預計運行5年后的凈現(xiàn)值為4500萬元，如折現(xiàn)率為16%,其終值應(yīng)為()萬元(說明：結(jié)果保留兩位小數(shù))170.數(shù)據(jù)在規(guī)定的時間前和頻度周期內(nèi)接入系統(tǒng)的比例稱為()A、指標數(shù)據(jù)自動采集率；B、指標數(shù)據(jù)接入率C、指標數(shù)據(jù)接入及時率；D、指標數(shù)據(jù)完整率171.數(shù)據(jù)正規(guī)化(DataNormalization)是在知識發(fā)掘處理(KnowledgeDiscoveryProcess)中的哪一個階段進行?A、數(shù)據(jù)清洗B、數(shù)據(jù)選擇C、數(shù)據(jù)編碼分析方法中的()C、分類173.以下敘述正確的是()A、極差較少受異常值的影響B(tài)、四分位差較少受異常值的影響C、方差較少受異常值的影響D、標準差較少受異常值的影響174.大數(shù)據(jù)應(yīng)用需求分為年度需求和()兩類。B、月度需求D、即時需求175.關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系，典型例子是購物籃分析，常見算法有Apriori關(guān)聯(lián)算法和()算法。D、聚類算法176.無監(jiān)督學習，應(yīng)用最廣的是()算法D、文本挖掘177.以下哪些分類方法可以較好地避免樣本的不平衡問題?()178.數(shù)據(jù)倉庫的最終目的是()A、收集業(yè)務(wù)需求B、建立數(shù)據(jù)倉庫邏輯模型C、開發(fā)數(shù)據(jù)倉庫的應(yīng)用分析D、為用戶和業(yè)務(wù)部門提供決策支持179.下列不屬于分類算法的是()180.如下哪個不是最近鄰分類器的特點()A、它使用具體的訓練實例進行預測，不必維護源自數(shù)據(jù)的模型B、分類一個測試樣例開銷很大C、最近鄰分類器基于全局信息進行預測D、可以生產(chǎn)任意形狀的決策邊界181.個人信息的收集、處理和利用應(yīng)當遵循()的原則，不得違反法律、法規(guī)的規(guī)定和雙方的約定收集、處理和利用個人信息。()A、正規(guī)、合法、必要B、合法、正當、必要C、合法、合規(guī)、正當D、合法、合理、合規(guī)182.Tableau能夠?qū)?shù)據(jù)進行處理包括()。A、將多個數(shù)據(jù)源數(shù)據(jù)拼接為一個寬表；B、修改、刪除、新增數(shù)據(jù)行；C、對數(shù)據(jù)進行行列轉(zhuǎn)換、重命名、格式修改；D、對數(shù)據(jù)進行計算、合并生成新的數(shù)據(jù)列183.()是數(shù)據(jù)倉庫體系架構(gòu)的重要組成部分，具備數(shù)據(jù)倉庫的部分特征和OLTP系統(tǒng)的部分特征。184.RFM方法中的F說明客戶的()C、當前價值D、未來價值185.關(guān)于主成分數(shù)目的選取，正確的是()A、保留多少個主成分取決于累計方差在方差總和中所占百分比B、一般選擇50%以上C、選擇前兩個就可以D、選擇的數(shù)目和變量的個數(shù)一致186.下列關(guān)于數(shù)據(jù)重組的說法中，錯誤的是()A、數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集B、數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒C、數(shù)據(jù)重組實現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成D、數(shù)據(jù)重組有利于實現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新187.在SQL中，創(chuàng)建數(shù)據(jù)庫用的命令是()188.當時間序列數(shù)據(jù)點的一階差分近似為一常數(shù)，可配合以下哪種預測模型()A、直線B、二次拋物線C、三次拋物線D、指數(shù)曲線189.對于企業(yè)來說，數(shù)據(jù)使用的關(guān)鍵是()A、數(shù)據(jù)收集D、數(shù)據(jù)再利用190.線性回歸算法尋找()與預測目標之間的線性關(guān)系。A、屬性191.下面不屬于明細數(shù)據(jù)質(zhì)量評價指標的是()。C、及時率D、完整率192.以下哪些分類方法可以較好地避免樣本的不平衡問題?()D、神經(jīng)網(wǎng)絡(luò)193.()算法是最廣泛使用的聚類算法，算法簡單，易于理解和操194貝葉斯決策是根據(jù)()進行決策的一種方法。A、極大似然概率D、后驗概率多選題1.下列何種算法可以幫助我們做數(shù)值的預測(Prediction)?2.層次聚類的聚類方式有()A、凝聚方式聚類B、分解方式聚類D、R型聚類3.有下列情形之一的，個人信息處理者應(yīng)當事前進行個人信息保護影響評估，并對處理情況進行記錄：A、處理敏感個人信息；B、利用個人信息進行自動化決策；E、其他對個人權(quán)益有重大影響的個人信息處理活動。4.以下有關(guān)隨機森林算法的說法正確的是()A、隨機森林算法的分類精度不會隨著決策樹數(shù)量的增加而提高。B、隨機森林算法對異常值和缺失值不敏感。C、隨機森林算法不需要考慮過擬合問題。D、決策樹之間相關(guān)系數(shù)越低.每棵決策樹分類精度越高的隨機森林模型的分類效果越好。A、政府監(jiān)管類B、公益服務(wù)類C、商務(wù)增值類D、公開開放類6.敏感性分析的計算指標有()A、盈虧平衡點B、敏感度系數(shù)D、凈現(xiàn)值7.描述變量離期望值大小的指標是()A、方差B、變異系數(shù)C、標準差D、期望8.以下哪個分布是右偏分布()B、卡方分布C、F分布D、對數(shù)正態(tài)分布9.天貓分析人員希望通過聚類方法定位代商家刷信用級別的違規(guī)者，以下那種操作不應(yīng)該進行()A、對變量進行標準化B、對變量進行百分位秩或Turkey正態(tài)性轉(zhuǎn)換C、對變量進行因子分析或聚類分析D、對變量進行分箱處理A、任一企業(yè)無法操縱市場B、少數(shù)企業(yè)可以影響交易數(shù)量C、多個競爭企業(yè)同時存在D、企業(yè)必須采取隨行就市定價法12.關(guān)于大數(shù)據(jù)的來源，以下理解正確的是()A、大數(shù)據(jù)是數(shù)據(jù)量變積累達到質(zhì)變的結(jié)果B、數(shù)據(jù)的產(chǎn)生需要經(jīng)歷很長時間C、我們每個人都是數(shù)據(jù)的制造者D、當今的世界，基本上一切都可以用數(shù)字表達，所以叫數(shù)字化的世界13.對于計算期不等的項目(方案)比選，可采納的決策方法有()A、最小公倍數(shù)法C、等年值法D、獲利指數(shù)法14.隨機對比實驗的調(diào)查方法的優(yōu)點是()A、能夠測算實驗誤差B、可以提高實驗結(jié)果的可靠性C、可以節(jié)省分析過程和時間D、費用開支小15.NoSQL數(shù)據(jù)庫采用“數(shù)據(jù)分布技術(shù)”主要是為了實現(xiàn)()A、復雜查詢能力C、提升服務(wù)器端的數(shù)據(jù)處理能力D、提高故障恢復能力及保障服務(wù)質(zhì)量16.相關(guān)分析的任務(wù)有()A、判定現(xiàn)象之間有無關(guān)系B、判定現(xiàn)象之間關(guān)系的方向C、判定相關(guān)關(guān)系的緊密程度D、說明現(xiàn)象之間聯(lián)系的具體形式該問題的各種方法有()A、直接刪除B、.使用屬性的平均值填充空缺值C、使用一個全局常量填充空缺D、使用與給定元組屬同一類的所有樣本的平均值18.如下表student中，如何篩選type為包含數(shù)學或語文的記錄?IDtypescoreA01數(shù)學78A02語文76AO3英語90A04數(shù)學68A05英A、select*fromstudentwheretype=”19.以下哪些變量使用RFM方法構(gòu)造出來的?()A、最近3期境外消費金額B、最近6期網(wǎng)銀消費交易筆數(shù)D、距最近一次逾期的月數(shù)20.以下關(guān)于邏輯回歸的說法正確的是()A、應(yīng)用邏輯回歸時，異常值會對模型造成很大的干擾。B、邏輯回歸的自變量必須是分類變量，因此要對連續(xù)型變量進C、邏輯回歸對模型中自變量的多重共線性較為敏感。D、邏輯回歸屬于分類算法。21.主成分分析計算選擇相關(guān)系數(shù)計算法時，確定主成分原則包括()A、特征根值大于1B、特征根值大于3C、累積特征根值加總占總特征根值的80%以上D、累積特征根值加總占總特征根值的90%以上22.大數(shù)據(jù)應(yīng)用建設(shè)及運營過程中如發(fā)生數(shù)據(jù)安全問題，應(yīng)立即暫停大數(shù)據(jù)應(yīng)用建設(shè)或運營工作，向()部門匯報。A、互聯(lián)網(wǎng)部B、安監(jiān)部C、法規(guī)部D、相關(guān)專業(yè)管理部門D、兩個定基發(fā)展速度之商等于相應(yīng)的環(huán)比發(fā)展速度C、回歸D、對比D、收集媒體信息29.貨幣時間價值用相對值來表示時，在數(shù)量上應(yīng)當理解為扣除()后的社會平均利潤率。B、通貨膨脹因素D、風險因素B、B2C--商家對人31.以下屬于聚類算法的是()A、K均值32.KANO模型定義的顧客需求層次有()B、喜愛型需求C、基本型需求D、期望型需求33.根據(jù)分析內(nèi)容和側(cè)重面不同，風險分析的方法有()A、敏感性分析C、經(jīng)濟效益分析D、盈虧平衡分析34.在全面調(diào)查和抽樣調(diào)查中都存在的誤差是()A、系統(tǒng)誤差D、技術(shù)性誤差35.敏感個人信息劃定依據(jù)()C、不滿十四周歲未成年人的個人信息D、與公司管理要求相關(guān)36.在客戶關(guān)系管理中，客戶的生命周期都包括()階段。37.以下屬于數(shù)據(jù)預處理的是()A、缺失值填充B、噪聲數(shù)據(jù)剔除C、異常值識別D、數(shù)據(jù)可視化38.我們可以用哪種方式來避免決策樹過度擬合的問題?()A、利用修剪法來限制樹的深度B、利用盆栽法規(guī)定每個節(jié)點下的最小的記錄數(shù)C、利用逐步回歸法來刪除部分數(shù)據(jù)D、目前并無適合的方法來處理這問題39.在有關(guān)數(shù)據(jù)倉庫測試，下列說法中正確的是()A、在完成數(shù)據(jù)倉庫的實施過程中，需要對數(shù)據(jù)倉庫進行各種測試.測試工作中要包括單元測試和系統(tǒng)測試B、當數(shù)據(jù)倉庫的每個單獨組件完成后，就需要對他們進行單元測試C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進行大量的功能測試和回歸測試D、在測試之前可以不制定詳細的測試計劃，測試過程中實時調(diào)40.關(guān)于基準收益率的表述，正確的是()A、基準收益率越高越好B、基準收益率越低越好，但不能低于銀行貸款利率C、可以采用項目加權(quán)平均資金成本為基礎(chǔ)確定基準收益率D、可以采用國家有關(guān)部門或行業(yè)統(tǒng)一發(fā)布的行業(yè)基準收益率41.分箱方法有哪些?()A、等深分箱C、數(shù)據(jù)標準化D、文本型43.營銷觀念是營銷過程中如何處理()利益關(guān)系。A、企業(yè)B、員工C、顧客D、社會44.HDFS(分布式文件系統(tǒng))作為Hadoop生態(tài)系統(tǒng)的數(shù)據(jù)存儲基礎(chǔ)，其特點為()A、支持超大文件C、流式數(shù)據(jù)訪問D、高吞吐量45.隨機抽樣方法有()A、等距隨機抽樣B、綜合隨機抽樣D、分群隨機抽樣46.能消除時間序列中的不規(guī)則變動和季節(jié)變動的方法是()A、移動平均法B、指數(shù)平滑法C、時間序列乘法模型D、季節(jié)指數(shù)A、經(jīng)驗科學是第一范式，主要研究模型是科學實驗；B、理論科學是第二范式，主要研究模型是數(shù)學模型；C、計算科學是第三范式，主要研究模型是計算機仿真和模擬，第三范式是“人腦+電腦”,人腦是主角；D、數(shù)據(jù)密集型科學是第四范式，的主要研究模型是數(shù)據(jù)挖掘和機器學習，特別是機器學習，第四范式是“電腦+人腦”,電腦是48.如下表student中，如何篩選type為包含數(shù)學或語文的記錄?()A、select*fromstudentwh49.下列項目中，其變動可以改變盈虧平衡點位置的因素有()50.某種產(chǎn)品的生產(chǎn)總費用2003年為50萬元，比2002年多2萬元，而單位產(chǎn)品成本2003年比2002年降低5%,則()A、生產(chǎn)費用總指數(shù)為104.17%B、生產(chǎn)費用指數(shù)為108.56%C、單位成本指數(shù)為95%D、產(chǎn)量指數(shù)為109.65%E、由于成本降低而節(jié)約的生產(chǎn)費用為2.63萬元51.按照性質(zhì)，預測方法大致可分為()。C、時間序列預測52.以下屬于分類器評價或比較尺度的有()A、預測準確度C、模型描述的簡潔度53.如下哪些不是基于規(guī)則的分類器的特點()A、規(guī)則集的表達能力遠不如決策樹好B、基于規(guī)則的分類器都對屬性空間進行直線劃分，并將類指派C、無法被用來產(chǎn)生更易于解釋的描述性模型D、非常適合處理類分布不平衡的數(shù)據(jù)集54.數(shù)據(jù)離散化是指為了數(shù)據(jù)分析的需要，將連續(xù)數(shù)據(jù)轉(zhuǎn)換型數(shù)據(jù)的過程。數(shù)據(jù)離散化的方法有()B、等距離散法C、數(shù)值規(guī)約D、等頻離散法55.缺失值的處理方法有哪些?()A、用平均值填充C、以任意數(shù)據(jù)填充D、用默認值填充56.()這些數(shù)據(jù)特性都是對聚類分析具有很強影響的。A、高維性D、噪聲和離群點57.以下屬于數(shù)據(jù)規(guī)約方法的是()B、數(shù)據(jù)標準化C、噪聲數(shù)據(jù)識別D、數(shù)據(jù)壓縮58.在假設(shè)檢驗中，當我們做出拒絕原假設(shè)而接受備擇假設(shè)的時，表示()A、有充足的理由否定原假設(shè)B、原假設(shè)必定是錯誤的C、犯錯誤的概率不大于aD、犯錯誤的概率不大于bE、在H。成立的情況下發(fā)生了小概率事件A、電子管D、大規(guī)?；虺笠?guī)模集成電路60.若檢驗統(tǒng)計量F近似等于1,說明()A、組間方差中不包含系統(tǒng)因素的影響B(tài)、組內(nèi)方差中不包含系統(tǒng)因素的影響C、組間方差中包含系統(tǒng)因素的影響D、方差分析中不應(yīng)拒絕原假設(shè)61.統(tǒng)計決策的基本原則是()B、發(fā)展性D、經(jīng)濟性A、量入為出法63.以下哪個分布是右偏分布?()D、對數(shù)正態(tài)分布64.大數(shù)據(jù)在今天這個時間點上爆發(fā)的原因有哪些?()A、各種傳感器無時無刻不在為我們提供大量的數(shù)據(jù)B、各種監(jiān)控設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)C、各種智能設(shè)備無時無刻不在為我們提供大量的數(shù)據(jù)D、互聯(lián)網(wǎng)的收集和積累65.數(shù)據(jù)挖掘的預測建模任務(wù)主要包括哪幾大類問題?()B、回歸C、模式發(fā)現(xiàn)D、模式匹配66.從復雜度及價值高低兩個維度，可以將數(shù)據(jù)分析分為()67.下面有關(guān)HAVING子句的說法中正確的是()A、HAVING子句必須與GROUPBY子句同時使用，不能單獨使用B、使用HAVING子句的同時不能使用WHERE子句C、使用HAVING子句的同時可以使用WHERE子句D、使用HAVING子句的作用是限定分組的條件68.在作邏輯回歸時，如果區(qū)域這個變量，當Region=A時Y取值均為1,無法確定是否出現(xiàn)的是哪個問題?A、共線性C、擬完全分離(Quasi-pleteseparaD、缺失值69.以下哪個聚類分析的方法是利用統(tǒng)計學定義的距離進行度量A、層次聚類法B、快速聚類法(K-Means)C、基于密度的聚類法D、基于網(wǎng)格的聚類法70.方差分析的基本假設(shè)前提包括()A、各處理條件下的樣本均來自正態(tài)總體B、各處理條件下的樣本相互獨立C、各處理條件下樣本的方差都相等D、各處理條件下樣本均值相等，方差可以不等71.季節(jié)變動主要是由()引起的。72.以下說法正確的有哪些?()A、大數(shù)據(jù)僅僅是講數(shù)據(jù)的體量大B、大數(shù)據(jù)對傳統(tǒng)行業(yè)有幫助C、大數(shù)據(jù)會帶來機器智能D、大數(shù)據(jù)是一種思維方式73.下列公式正確的是()A、流動資金=流動資產(chǎn)-流動負債B、流動資產(chǎn)=應(yīng)收賬款+存貨C、流動負債=應(yīng)付賬款+預收賬款D、流動資金本年增加額=本年流動資金-上年流動資金74.決策樹法分析問題的主要步驟包括()。B、設(shè)計可能結(jié)果發(fā)生的概率C、設(shè)計結(jié)果的得益75.下列說法中不正確的是()A、任何兩個變量都具有相關(guān)關(guān)系B、人的知識與其年齡具有相關(guān)關(guān)系C、散點圖中的各點是分散的沒有規(guī)律D、根據(jù)散點圖求得的回歸直線方程都是有意義的76.投資項目的現(xiàn)金流量中經(jīng)營成本與會計中的“總成本費用”概念有根本的不同，不包括A、利息支出D、維修費77.符合下列情形之一的，個人信息處理者方可處理個人信息B、為訂立.履行個人作為一方當事人的合同所必需，或者按照依法制定的勞動規(guī)章制度和依法簽訂的集體合同實施人力資源管C、為履行法定職責或者法定義務(wù)所必需；D、為應(yīng)對突發(fā)公共衛(wèi)生事件，或者緊急情況下為保護自然人的生命健

人人文庫> 全部分類> 教育資料 > 中學教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)挖掘分析專業(yè)考試題及答案

文檔簡介

溫馨提示

最新文檔

評論

大數(shù)據(jù)挖掘分析專業(yè)考試題及答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔