計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共109題)_第1頁
計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共109題)_第2頁
計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共109題)_第3頁
計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共109題)_第4頁
計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共109題)_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷1(共4套)(共109題)計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷第1套一、選擇題(本題共15題,每題1.0分,共15分。)1、設(shè)有m個的用戶集合US={u1,…,um},現(xiàn)對他們的行為數(shù)據(jù)進行處理,使得每個用戶ui對應(yīng)一個n維向量Vi=[vi1,…,vin],用于表示用戶ui的特征。設(shè)有函數(shù)sim(Vi,Vj)用于判定用戶ui與用戶uj之間的相似性。若有算法A,能根據(jù)用戶間的相似性,將US劃分成k個子集合,并使屬于同一子集合的客戶間的相似性盡可能大,不屬于同一子集合的客戶間的相似性盡可能小。則算法A屬于一種()A、聚類算法B、分類算法C、關(guān)聯(lián)分析算法D、回預(yù)測法標準答案:A知識點解析:聚類將一個數(shù)據(jù)集中的數(shù)據(jù)進行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同。它與分類的一個不同點在于,它強調(diào)同一個組中的對象有較高的相似度,不同組中的對象之間差別很大。分類和聚類的區(qū)別在于,分類事先知道有哪些類別可以分。聚類,事先不知道將要分成哪些類,需有聚類算法來自動確定。綜上可知,算法A屬于聚類算法。2、下面說法正確的是()A、數(shù)據(jù)倉庫是從數(shù)據(jù)庫中導(dǎo)入的大量數(shù)據(jù),并對結(jié)構(gòu)和存儲進行組織以提高查詢效率B、使用數(shù)據(jù)倉庫的目的在于對已有數(shù)據(jù)進行高速的匯總和統(tǒng)計C、數(shù)據(jù)挖掘采用適當?shù)乃惴?,從?shù)據(jù)倉庫的海量數(shù)據(jù)中提取具有潛在價值的信息和知識D、OLAP技術(shù)為提高處理效率,必須繞過DBMS直接對物理數(shù)據(jù)進行讀寫標準答案:C知識點解析:數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的,且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策。建立數(shù)據(jù)倉庫的主要目的:根據(jù)決策需求對企業(yè)的數(shù)據(jù)采取適當?shù)氖侄芜M行集成,形成一個綜合的、面向分析的數(shù)據(jù)環(huán)境,用于支持企業(yè)的信息型、決策型的分析應(yīng)用。數(shù)據(jù)挖掘采用適當?shù)乃惴?,從?shù)據(jù)倉庫的海量數(shù)據(jù)中提取具有潛在價值的信息和知識。因此A和B錯誤,C正確。OLAP(on-lineanalyticalprocessing)是聯(lián)系分析處理的英文縮寫,它仍使用DBMS存取數(shù)據(jù),即D的描述錯誤。3、現(xiàn)有一個基于SQLServer2008的數(shù)據(jù)倉庫系統(tǒng),其數(shù)據(jù)均來源于生產(chǎn)系統(tǒng),生產(chǎn)系統(tǒng)每天將新數(shù)據(jù)導(dǎo)入倉庫系統(tǒng),導(dǎo)入后的數(shù)據(jù)只讀。下列有關(guān)該數(shù)據(jù)倉庫應(yīng)設(shè)置的恢復(fù)模式,最恰當?shù)氖?)。A、完整恢復(fù)模式B、大容量日志恢復(fù)模式C、簡單恢復(fù)模式D、關(guān)鍵日志恢復(fù)模式標準答案:C知識點解析:SQLServer2008支持三種恢復(fù)模式:簡單恢復(fù)模式、完整恢復(fù)模式和大容量日志恢復(fù)模式。其中,簡單恢復(fù)模式只用于測試和開發(fā)數(shù)據(jù)庫,或用于主要包含只讀數(shù)據(jù)的數(shù)據(jù)庫(如數(shù)據(jù)倉庫)。因此選擇C選項。4、某電子商務(wù)平臺為實現(xiàn)精準營銷,提高向用戶推薦商品的成功率,欲建立數(shù)據(jù)倉庫系統(tǒng),作為數(shù)據(jù)挖掘程序的數(shù)據(jù)源。假設(shè)業(yè)務(wù)型數(shù)據(jù)主要存放于銷售數(shù)據(jù)表T1中,用戶信息存放于用戶表T2中。數(shù)據(jù)倉庫將近5年的銷售細節(jié)數(shù)據(jù)存放在數(shù)據(jù)表T3中,并在數(shù)據(jù)倉庫中根據(jù)需要存放一些匯總數(shù)據(jù)。為達到這些要求,有如下一些方案:Ⅰ.T3與T1實時更新,即每產(chǎn)生一條銷售記錄,同時寫到T1和T3中,并觸發(fā)數(shù)據(jù)挖掘程序運行,以增加數(shù)據(jù)挖掘結(jié)果的準確性Ⅱ.用戶每次產(chǎn)生新的銷售記錄,觸發(fā)數(shù)據(jù)挖掘程序執(zhí)行并得到針對該用戶的推薦商品列表,然后寫回T2中。T3每天定時從T1進行批量更新Ⅲ.T3與T1實時更新,每天定時運行數(shù)據(jù)挖掘程序,將運行結(jié)果,也就是針對用戶的推薦商品列表寫回數(shù)據(jù)倉庫的用戶商品推薦表中Ⅳ.T3每天做一次批量更新,并在數(shù)據(jù)倉庫中生成相應(yīng)的匯總數(shù)據(jù),數(shù)據(jù)挖掘程序以細節(jié)數(shù)據(jù)或匯總數(shù)據(jù)作為數(shù)據(jù)源,將運行結(jié)果即針對用戶的推薦商品列表寫回數(shù)據(jù)倉庫的用戶商品推薦表中上述方案中不合理的是()。A、僅Ⅰ和ⅣB、僅Ⅱ和ⅣC、僅Ⅰ、Ⅱ和ⅣD、僅Ⅰ、Ⅱ和Ⅲ標準答案:D知識點解析:數(shù)據(jù)倉庫是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織的新技術(shù)。它的建立能充分利用已有的數(shù)據(jù)資源,把數(shù)據(jù)轉(zhuǎn)換為信息,從中挖掘出知識,最終創(chuàng)造出效益。數(shù)據(jù)倉庫有若干基本特征,包括不可更新性和隨時間變化性。所謂不可更新性就是用戶在提取倉庫中的數(shù)據(jù)進行分析時并不會同時對數(shù)據(jù)倉庫中的數(shù)據(jù)進行更新操作,而數(shù)據(jù)變化性是數(shù)據(jù)倉庫每隔一段時間進行數(shù)據(jù)的更新和處理。綜上可以看出,數(shù)據(jù)倉庫的更新與時間間隔有關(guān),所以不會實時更新,即排除A、C,又因為對用戶進行推薦時要結(jié)合以往的歷史數(shù)據(jù)而不是僅通過當前數(shù)據(jù)分析,即B錯。故選擇D選項。5、關(guān)于商場的DBAS,設(shè)有如下數(shù)據(jù)內(nèi)容Ⅰ.數(shù)據(jù)庫結(jié)構(gòu)說明Ⅱ.顧客名單Ⅲ.數(shù)據(jù)清洗規(guī)則Ⅳ.訂單細節(jié)數(shù)據(jù)Ⅴ.商品分類銷售匯總數(shù)據(jù)上述選項中是元數(shù)據(jù)的是()A、僅Ⅰ、Ⅱ、Ⅲ和ⅣB、僅Ⅰ、Ⅱ、Ⅲ和ⅤC、僅Ⅰ和ⅢD、全部都是標準答案:C知識點解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對數(shù)據(jù)庫、表、列等其他對象的定義。因此可推出,Ⅰ、Ⅲ屬于元數(shù)據(jù)。選C。6、下列關(guān)于OLAP和OLTP的說法,錯誤的是()。A、OLAP系統(tǒng)一般需要處理大量事務(wù),且執(zhí)行的事務(wù)內(nèi)容比較簡單且重復(fù)率高B、OLTP系統(tǒng)是生成數(shù)據(jù)的系統(tǒng),OLAP系統(tǒng)則是利用數(shù)據(jù)的系統(tǒng)C、OLTP系統(tǒng)一般面向企業(yè)外部人員和企業(yè)內(nèi)部基礎(chǔ)業(yè)務(wù)人員,而OLAP主要面向企業(yè)內(nèi)部各層次決策人員D、OLTP系統(tǒng)主要面向企業(yè)基礎(chǔ)業(yè)務(wù),OLAP主要面向企業(yè)的數(shù)據(jù)分析利用需求標準答案:A知識點解析:OLTP系統(tǒng)一般需要處理大量事務(wù),且執(zhí)行的事務(wù)內(nèi)容比較簡單且重復(fù)率高,而A選項敘述的是OLAP,錯誤。故答案為A項。7、數(shù)據(jù)集成是數(shù)據(jù)倉庫建立的重要環(huán)節(jié),下列關(guān)于數(shù)據(jù)集成的說法,錯誤的是()。A、數(shù)據(jù)集成就是把企業(yè)里的所有數(shù)據(jù)集成到數(shù)據(jù)倉庫中B、數(shù)據(jù)集成不僅涉及技術(shù)問題,也經(jīng)常涉及管理問題C、集成時需要將來自不同數(shù)據(jù)源的數(shù)據(jù)按目標要求進行格式轉(zhuǎn)換D、數(shù)據(jù)集成的一個重要目的是合理地組織企業(yè)數(shù)據(jù),實現(xiàn)企業(yè)級數(shù)據(jù)視圖標準答案:A知識點解析:數(shù)據(jù)集成是將源自不同數(shù)據(jù)源的數(shù)據(jù)經(jīng)過抽取、轉(zhuǎn)換、清理、裝載等操作載入數(shù)據(jù)倉庫的過程,用戶只有從數(shù)據(jù)源中抽取出所需數(shù)據(jù),再經(jīng)過數(shù)據(jù)清洗,并加載到按照先前所設(shè)計的數(shù)據(jù)倉庫中以后,才能對數(shù)據(jù)倉庫中的數(shù)據(jù)進行報表分析、多維分析和數(shù)據(jù)挖掘等,而并不是把企業(yè)里的所有數(shù)據(jù)集成到數(shù)據(jù)倉庫中。故答案為A項。8、關(guān)于數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、決策支持系統(tǒng)和機器學(xué)習(xí)的相關(guān)概念或說法,下列說法一般情況下錯誤的是()。A、數(shù)據(jù)倉庫是服務(wù)于決策支持的數(shù)據(jù)集合B、決策支持系統(tǒng)是指輔助需要決策的人或系統(tǒng)進行決策的系統(tǒng)C、數(shù)據(jù)挖掘一般是指數(shù)據(jù)分析師根據(jù)個人經(jīng)驗針對細節(jié)數(shù)據(jù)進行分析總結(jié),挖掘出有用的知識的過程D、機器學(xué)習(xí)是指機器采用一些方法或模型從數(shù)據(jù)中習(xí)得知識的過程標準答案:C知識點解析:數(shù)據(jù)倉庫是一個面向主題、集成的、非易失的、且隨時間變化的數(shù)據(jù)集合,用來支持管理人員決策。決策支持系統(tǒng)是輔助決策者通過數(shù)據(jù)、模型和知識,以人機交互方式進行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的計算機應(yīng)用系統(tǒng)。數(shù)據(jù)挖掘就是從數(shù)據(jù)庫中的所有數(shù)據(jù)記錄中歸納總結(jié)出知識,讓人們從抽象復(fù)雜的數(shù)據(jù)中看到客觀規(guī)律,以便做出決策。數(shù)據(jù)挖掘是從人工智能機器學(xué)習(xí)中發(fā)展起來的。它研究各種方法和技術(shù),從大量的數(shù)據(jù)中挖掘出有用的信息和知識。機器學(xué)習(xí)是研究便計算機模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,即讓計算機自動獲取知識。故答案為C選項。9、在數(shù)據(jù)挖掘或機器學(xué)習(xí)概念中,有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)是常見的學(xué)習(xí)方法,下列學(xué)習(xí)任務(wù)屬于有監(jiān)督學(xué)習(xí)的是()。A、將未知類別的一組數(shù)據(jù),采用聚類方法,分成不同的組B、機器人在動態(tài)環(huán)境中自主學(xué)習(xí)掌握行走方法C、根據(jù)樣本數(shù)據(jù),采用分類算法,訓(xùn)練分類器D、不基于人類歷史棋譜數(shù)據(jù),訓(xùn)練出下圍棋的智能軟件標準答案:C知識點解析:監(jiān)督學(xué)習(xí)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達到所要求性能的過程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。常見應(yīng)用場景如分類問題和回歸問題。本題中A選項根據(jù)樣本數(shù)據(jù),采用分類算法,訓(xùn)練分類器屬于監(jiān)督學(xué)習(xí)。故答案為C選項。10、設(shè)有某電子商務(wù)平臺,該平臺業(yè)務(wù)繁忙。為實現(xiàn)面向用戶的精確營銷,提高向用戶推薦商品的成功率,需要建立數(shù)據(jù)倉庫系統(tǒng),并將數(shù)據(jù)倉庫作為數(shù)據(jù)挖掘應(yīng)用程序的數(shù)據(jù)源。設(shè)電子商務(wù)平臺的OLTP環(huán)境中有銷售數(shù)據(jù)表T1和用戶信息表T2。數(shù)據(jù)倉庫用表T3保存近5年的銷售細節(jié)數(shù)據(jù),同時有用戶信息表T4和用戶商品推薦表T5。下列方案一般情況下最為合理的是()A、實時更新T3,即每產(chǎn)生一條銷售記錄,就將該記錄同時寫到T1和T3中,并觸發(fā)數(shù)據(jù)挖掘程序運行,以增加數(shù)據(jù)挖掘結(jié)果的準確性和實時性B、當一個銷售事務(wù)完成并生成銷售記錄后,觸發(fā)數(shù)據(jù)挖掘程序在T1上執(zhí)行并得到針對該用戶的商品推薦列表,然后將商品推薦列表寫到T5中。每隔數(shù)小時從T1獲取新數(shù)據(jù)批量更新T3C、根據(jù)T1的變化實時更新T3,每天定時運行數(shù)據(jù)挖掘程序,生成用戶商品推薦列表,并將其寫到T5中D、每天根據(jù)T1對T3做一次批量更新,數(shù)據(jù)挖掘程序根據(jù)新數(shù)據(jù)生成用戶商品推薦列表,并將其寫到T5中標準答案:D知識點解析:數(shù)據(jù)倉庫是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織的新技術(shù)。它的建立能充分利用已有的數(shù)據(jù)資源,把數(shù)據(jù)轉(zhuǎn)換為信息,從中挖掘出知識,最終創(chuàng)造出效益。數(shù)據(jù)倉庫有若干基本特征,包括不可更新性和隨時間變化性。所謂不可更新性就是用戶在提取倉庫中的數(shù)據(jù)進行分析時并不會同時對數(shù)據(jù)倉庫中的數(shù)據(jù)進行更新操作,而數(shù)據(jù)變化性是數(shù)據(jù)倉庫每隔一段時間進行數(shù)據(jù)的更新和處理。綜上可以看出,數(shù)據(jù)倉庫的更新與時間間隔有關(guān),所以不會實時更新,即排除A、C,又因為對用戶進行推薦時要結(jié)合以往的歷史數(shù)據(jù)而不是僅通過當前數(shù)據(jù)分析,即B錯。綜上可知,選項D正確。11、在超市所從事的信息活動中,下列屬于挖掘時間序列模式的是()A、針對匿名客戶,記錄其購買某種商品時,與該商品有關(guān)的優(yōu)惠B、針對注冊用戶,分析他們的購買,向他們設(shè)定下次可能購買的優(yōu)惠規(guī)則C、針對所有客戶,對其籃子里的商品進行分析D、針對注冊用戶,進行客戶分類,確定重要客戶及服務(wù)對策標準答案:B知識點解析:時間序列分析也可以稱為數(shù)據(jù)演變分析,描述行為對象隨時間變化的規(guī)律或趨勢,并進行建模的數(shù)據(jù)挖掘方法。B項中記錄客戶當前的購買,指定下次的優(yōu)惠規(guī)則,屬于描述對象隨著時間的變化規(guī)律。12、設(shè)某數(shù)據(jù)庫中一組客戶數(shù)據(jù),表示具有m個客戶的集合CS={c1,…,cm}??蛻魯?shù)據(jù)經(jīng)過處理后,每個客戶ci對應(yīng)有一個n維向量Vi=[vi1,…,vin],用于表示客戶ci的特征。設(shè)有函數(shù)sim(Vi,Vj)用于判定ci與cj之間的相似性。若有算法A,能根據(jù)客戶間的相似性,將CS劃分成k個子集合,并使屬于同一子集合的客戶間的相似性盡可能大,不屬于同一子集合的客戶間的相似性盡可能小。則算法A屬于()。A、分類算法B、回歸預(yù)測法C、關(guān)聯(lián)分析算法D、聚類算法標準答案:D知識點解析:聚類就是將一個數(shù)據(jù)集中的數(shù)據(jù)進行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能地相似而不同組間的數(shù)據(jù)盡可能地不同它強調(diào)同一個組中的對象之間具有較高的相似度,而在不同組中的對象之間有很大的差別。本題中算法A符合聚類算法的思想,故答案為D項。13、設(shè)某應(yīng)用環(huán)境有一組關(guān)于某設(shè)備的狀態(tài)樣本集S,其數(shù)據(jù)模式為(a1,a2,…,an,x),其中ai(i=1…n)為設(shè)備的基礎(chǔ)屬性,屬性x的取值范圍為{正常,不正常}?,F(xiàn)有算法A,將s作為輸入,并最終得到一個程序c,C能根據(jù)實時檢測到的設(shè)備狀態(tài)數(shù)據(jù)的n個基礎(chǔ)屬性的取值,判定設(shè)備的狀態(tài)為正?;虿徽?。則A和C分別是()。A、聚類算法、分類器B、分類算法、分類器C、聚類算法、聚類工具D、回歸分析算法、預(yù)測模型標準答案:B知識點解析:分類的過程一般分為兩個步驟:首先是通過已知數(shù)據(jù)集(訓(xùn)練集),建立分類函數(shù),構(gòu)造分類器;其次是利用所獲得的分類函數(shù)對未知類別標記的數(shù)據(jù)項進行分類操作。在構(gòu)造分類器時,需要一個訓(xùn)練樣本數(shù)據(jù)集作為輸入。訓(xùn)練集由一組數(shù)據(jù)庫記錄或元組構(gòu)成,每個元組是一個由有關(guān)字段(屬性或特征)值組成的特征向量。故答案為B項。14、在數(shù)據(jù)倉庫設(shè)計中,數(shù)據(jù)的粒度級設(shè)計是一個重要的問題。在粒度級設(shè)計中,設(shè)有下列考慮因素:Ⅰ.用戶查詢所涉及數(shù)據(jù)的最低細節(jié)程度Ⅱ.高粒度數(shù)據(jù)所需的存儲空間Ⅲ.用戶查詢的平均性能需求Ⅳ.系統(tǒng)的可用存儲空間Ⅴ.低粒度級數(shù)據(jù)的規(guī)模Ⅵ.用戶查詢所涉及的數(shù)據(jù)的最高粒度級在以上因素中,屬于次要或不需要考慮的因素是()。A、僅Ⅰ和ⅢB、僅Ⅳ和ⅤC、僅Ⅰ和ⅥD、僅Ⅱ和Ⅵ標準答案:D知識點解析:在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題,它影響到數(shù)據(jù)倉庫的數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。在進行粒度級設(shè)計時,在可用的存儲空間中保存粗細程度不同的主題數(shù)據(jù),以盡可能滿足各種應(yīng)用的多角度、多層次數(shù)據(jù)查詢要求,同時在總體上提高查詢的設(shè)計效率。粒度越小,則細節(jié)程度越高,綜合程度就越低,回答查詢的類型也越多,數(shù)據(jù)量比較大,空間代價也大。用戶查詢所涉及的數(shù)據(jù)的最低細節(jié)程度、用戶查詢的平均性能需求、系統(tǒng)的可用存儲空間、低粒度級數(shù)據(jù)的規(guī)模都屬于主要考慮的因素。故答案為D選項。15、設(shè)有某網(wǎng)購平臺業(yè)務(wù)系統(tǒng)與大數(shù)據(jù)平臺,其中存在如下各種數(shù)據(jù)或文檔:Ⅰ.商品清單表Ⅱ.廠家清單表Ⅲ.業(yè)務(wù)系統(tǒng)與大數(shù)據(jù)平臺的ER圖及說明文檔Ⅳ.業(yè)務(wù)系統(tǒng)中DBMS中的數(shù)據(jù)字典Ⅴ.銷售數(shù)據(jù)明細Ⅵ.業(yè)務(wù)系統(tǒng)數(shù)據(jù)與大數(shù)據(jù)平臺數(shù)據(jù)的對應(yīng)關(guān)系數(shù)據(jù)Ⅶ.客服聊天記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()A、僅Ⅲ、Ⅳ和ⅥB、僅Ⅰ、Ⅱ和ⅥC、僅Ⅰ、Ⅱ、Ⅳ和ⅥD、僅Ⅳ、Ⅴ和Ⅶ標準答案:A知識點解析:元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項內(nèi)容。①在傳統(tǒng)的數(shù)據(jù)庫中,元數(shù)據(jù)描述了數(shù)據(jù)庫中的各個對象,如數(shù)據(jù)庫中的數(shù)據(jù)字典就是一種元數(shù)據(jù)。②在關(guān)系數(shù)據(jù)庫中,元數(shù)據(jù)描述對數(shù)據(jù)庫、表、列等其他對象的定義。③在數(shù)據(jù)倉庫中,元數(shù)據(jù)定義了數(shù)據(jù)倉庫中許多對象--表、列、查詢、商業(yè)規(guī)則及數(shù)據(jù)倉庫內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。因此可推出Ⅲ、Ⅳ和Ⅵ屬于元數(shù)據(jù)。故答案為A項。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)16、數(shù)據(jù)倉庫是一個面向主題、集成的、時變的、非易失的數(shù)據(jù)集合,支持管理部門的決策過程,數(shù)據(jù)倉庫通過數(shù)據(jù)轉(zhuǎn)移從多個數(shù)據(jù)源提取數(shù)據(jù),為了解決不同數(shù)據(jù)源格式上的不統(tǒng)一,需要進行的數(shù)據(jù)操作是________。標準答案:轉(zhuǎn)換知識點解析:數(shù)據(jù)倉庫的數(shù)據(jù)來自多種數(shù)據(jù)源。不同的數(shù)據(jù)源可能由不同的平臺開發(fā),使用不同的數(shù)據(jù)庫管理系統(tǒng),數(shù)據(jù)格式也可能不同。源數(shù)據(jù)在被裝載到數(shù)據(jù)倉庫之前,需要進行一定的數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換的主要任務(wù)是對數(shù)據(jù)粒度以及不一致的數(shù)據(jù)進行轉(zhuǎn)換。17、在數(shù)據(jù)倉庫設(shè)計和建設(shè)過程中,設(shè)計者需要調(diào)查用戶的決策或數(shù)據(jù)處理需求,并將功能相近且需要相關(guān)聯(lián)數(shù)據(jù)支持的需求進行歸類,得到不同的需求集合,并在企業(yè)數(shù)據(jù)模型中尋找能夠滿足各個需求集合的數(shù)據(jù)集合,然后針對各個數(shù)據(jù)集合開展數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計。這種設(shè)計方法稱為________的設(shè)計方法。標準答案:面向主題知識點解析:面向主題的數(shù)據(jù)組織方式,就是在較高層次上對分析對象數(shù)據(jù)的一個完整并且一致的描述,能刻畫各個分析對象所涉及的企業(yè)各項數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。所謂較高層次是相對面向應(yīng)用的數(shù)據(jù)組織方式而言的,即按照主題進行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級別。與傳統(tǒng)數(shù)據(jù)庫面向應(yīng)用進行數(shù)據(jù)組織的特點相對應(yīng),數(shù)據(jù)倉庫中的數(shù)據(jù)面向主題進行組織。例如,一個生產(chǎn)企業(yè)的數(shù)據(jù)倉庫所組織的主題可能有產(chǎn)品訂貨分析和貨物發(fā)運分析等。18、粒度是反映數(shù)據(jù)庫系統(tǒng)中綜合程度的指標。設(shè)有表T1(商品標識,銷售時間,銷售量)、T2(商品標識,日期,總銷售量)和T3(商品類別,月份,總銷售量),其中粒度最大的表是________。標準答案:T3知識點解析:粒度問題是設(shè)計數(shù)據(jù)倉庫的一個最重要方面。粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別。細化程度越高,粒度級就越??;相反,細化程度越低,粒度級就越大。由題意可知,粒度最大的表應(yīng)是T3。19、數(shù)據(jù)倉庫的數(shù)據(jù)模型一般被劃分為概念模型、________模型和物理模型。標準答案:邏輯知識點解析:數(shù)據(jù)倉庫的結(jié)構(gòu)采用三級數(shù)據(jù)模型的方式,具體如下:概念模型:也就是業(yè)務(wù)模型.由企業(yè)決策者、商務(wù)領(lǐng)域知識專家和IT專家共同企業(yè)級地跨領(lǐng)域業(yè)務(wù)系統(tǒng)需求分析的結(jié)果。邏輯模型:用來構(gòu)建數(shù)據(jù)倉庫的數(shù)據(jù)庫邏輯模型。根據(jù)分析系統(tǒng)的實際需求決策構(gòu)建數(shù)據(jù)庫邏輯關(guān)系模型.定義數(shù)據(jù)庫物理結(jié)構(gòu)及其關(guān)系。它關(guān)聯(lián)著數(shù)據(jù)倉庫的邏輯模型和物理模型這兩頭。物理模型:構(gòu)建數(shù)據(jù)倉庫的物理分布模型,主要包含數(shù)據(jù)倉庫的軟硬件配置,資源情況以及數(shù)據(jù)倉庫模式。20、在數(shù)據(jù)倉庫的數(shù)據(jù)組織中,描述數(shù)據(jù)的綜合或細節(jié)程度的指標稱為________。標準答案:粒度知識點解析:在數(shù)據(jù)倉庫的數(shù)據(jù)組織中,描述數(shù)據(jù)的綜合或細節(jié)程度的指標稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。21、在數(shù)據(jù)倉庫中,元數(shù)據(jù)一般分成技術(shù)型元數(shù)據(jù)和________型元數(shù)據(jù)。標準答案:業(yè)務(wù)或business知識點解析:在數(shù)據(jù)倉庫中,元數(shù)據(jù)分為技術(shù)型元數(shù)據(jù)和業(yè)務(wù)型元數(shù)據(jù)。技術(shù)元數(shù)據(jù)是存儲關(guān)于商業(yè)智能系統(tǒng)技術(shù)細節(jié)的數(shù)據(jù),是用于開發(fā)和管理商業(yè)智能系統(tǒng)使用的數(shù)據(jù)。業(yè)務(wù)元數(shù)據(jù)從業(yè)務(wù)角度描述了商業(yè)智能系統(tǒng)中的數(shù)據(jù),是介于使用者和真實系統(tǒng)之間的語義層,使得不懂計算機技術(shù)的業(yè)務(wù)人員也能夠“理解”商業(yè)智能系統(tǒng)中的數(shù)據(jù)。故答案為業(yè)務(wù)或business。22、在企業(yè)數(shù)據(jù)倉庫中,操作型數(shù)據(jù)存儲層(ODS),一般用以支撐即時OLAP和________型OLTP應(yīng)用。標準答案:全局或跨專業(yè)或綜合知識點解析:在ODS上可實行的全局應(yīng)用大致可分為:實現(xiàn)企業(yè)全局的OLTP操作、實現(xiàn)即時的OLAP操作。故答案為全局或跨專業(yè)或綜合。23、在數(shù)據(jù)倉庫中,元數(shù)據(jù)主要分為________元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)兩類。標準答案:技術(shù)知識點解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)可以幫助數(shù)據(jù)倉庫管理員和數(shù)據(jù)倉庫的開發(fā)人員非常方便地找到他們所關(guān)心的數(shù)據(jù)。元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù),可將其按用途的不同分為兩類:技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。24、粒度是用于描述數(shù)據(jù)環(huán)境中數(shù)據(jù)綜合程度的概念。設(shè)某系統(tǒng)中有商品銷售表(商品號,店鋪標識,銷售量,單價,日期,時間)和商品周銷售表(商品號,店鋪標識,周銷售量,周),則商品銷售表的粒度級________商品周銷售表的粒度級。標準答案:低于或小于或<知識點解析:粒度是用于描述數(shù)據(jù)環(huán)境中數(shù)據(jù)綜合程度的概念。粒度越大,綜合程度越高,細節(jié)程度越低,能回答的查詢就越少;粒度越小,綜合程度越低,細節(jié)程度越高,能回答的查詢就越多。25、在數(shù)據(jù)倉庫的導(dǎo)出數(shù)據(jù)或物化視圖(實視圖)的維護策略中,只在用戶查詢時發(fā)現(xiàn)數(shù)據(jù)已經(jīng)過期才進行更新的策略稱為________維護策略。標準答案:延時或延期或推遲知識點解析:在數(shù)據(jù)倉庫的導(dǎo)出數(shù)據(jù)或物化視圖(實視圖)的維護策略中,只在用戶查詢時發(fā)現(xiàn)數(shù)據(jù)已經(jīng)過期才進行更新的策略稱為延時維護策略。26、在數(shù)據(jù)倉庫中,根據(jù)數(shù)據(jù)源的變化量在維護對象原有數(shù)據(jù)的基礎(chǔ)上對數(shù)據(jù)進行維護的方法稱為________維護法。標準答案:增量或增長知識點解析:數(shù)據(jù)倉庫維護的基本思想是:根據(jù)某種維護策略,在一定條件下觸發(fā)維護操作;維護操作捕捉到數(shù)據(jù)源的數(shù)據(jù)變化;通過一定策略對數(shù)據(jù)倉庫中的數(shù)據(jù)進行相應(yīng)的更新操作,以保持兩者的一致性。增量式維護指的是根據(jù)數(shù)據(jù)源的變化量在維護對象原有數(shù)據(jù)和基礎(chǔ)上進行數(shù)據(jù)添加和修改。故答案為增量或增長。27、在企業(yè)數(shù)據(jù)環(huán)境中,關(guān)于數(shù)據(jù)的數(shù)據(jù)一般被稱為________數(shù)據(jù)。標準答案:元或meta或metadata知識點解析:在企業(yè)數(shù)據(jù)環(huán)境中,關(guān)于數(shù)據(jù)的數(shù)據(jù)一般被稱為元數(shù)據(jù),對數(shù)據(jù)進行描述。故答案為元或meta或metadata。計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷第2套一、選擇題(本題共16題,每題1.0分,共16分。)1、許多大中型企業(yè)處于多種原因建立了數(shù)據(jù)倉庫,以下哪項不是建立數(shù)據(jù)倉庫的合理理由()A、將企業(yè)的各種應(yīng)用系統(tǒng)集中在一起B(yǎng)、充分利用企業(yè)信息系統(tǒng)生成的各種數(shù)據(jù)C、解決企業(yè)業(yè)務(wù)應(yīng)用和數(shù)據(jù)分析應(yīng)用的性能沖突D、以面向主題、集成的方式合理的組織數(shù)據(jù)標準答案:A知識點解析:建立數(shù)據(jù)倉庫不是簡單的把企業(yè)的各種應(yīng)用集中在一起,而是利用企業(yè)信息系統(tǒng)生成的數(shù)據(jù)%以面向主題#集成的方式合理組織數(shù)據(jù),解決數(shù)據(jù)分析應(yīng)用和企業(yè)基本業(yè)務(wù)之間的性能沖突問題。2、下列數(shù)據(jù)模式中,粒度級最高的是()A、(地區(qū),商品大類,月份,總銷售額)B、(地區(qū),商品小類,季度,總銷售額)C、(地區(qū),商品大類,季度,總銷售額)D、(商店,商品小類,月份,總銷售額)標準答案:C知識點解析:粒度是系統(tǒng)中存在不同綜合級別的數(shù)據(jù),一般將綜合級別稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。故答案為C選項。3、下列哪一條不是數(shù)據(jù)倉庫的基本特征()A、反映當前準確數(shù)據(jù)B、數(shù)據(jù)是相對穩(wěn)定的C、數(shù)據(jù)是集成的D、數(shù)據(jù)是面向主題的標準答案:A知識點解析:數(shù)據(jù)倉庫有四個特點:①面向主題,操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉庫中的數(shù)據(jù)按照一定的主題域進行組織。主題是一個抽象概念,是指用戶使用數(shù)據(jù)倉庫進行決策時所關(guān)心的重點方面,一個主題通常與多個操作型信息系統(tǒng)相關(guān);②集成的,面向事務(wù)處理的操作型數(shù)據(jù)庫通常與某些特定的應(yīng)用相關(guān),數(shù)據(jù)庫之間相互獨立,并且往往是異構(gòu)的。而數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息;③穩(wěn)定的,操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實時更新,數(shù)據(jù)根據(jù)需要及時發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新;④反映歷史變化,操作型數(shù)據(jù)庫主要關(guān)心當前某一個時間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點(如開始應(yīng)用數(shù)據(jù)倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。4、在大型企業(yè)的數(shù)據(jù)庫應(yīng)用系統(tǒng)中,聯(lián)機事務(wù)處理(OLTP)和聯(lián)機分析處理(OLAP)是常見的數(shù)據(jù)庫管理和數(shù)據(jù)分析形式。關(guān)于OLTP和OLAP,一般情況下,下列說法正確的是()A、OLTP系統(tǒng)的安全性要求比OLAP系統(tǒng)的低,也比較容易實現(xiàn)B、OLTP系統(tǒng)在訪問數(shù)據(jù)時,一般以單條記錄訪問為主,集合訪問為輔,OLAP系統(tǒng)則相反C、OLTP系統(tǒng)要求系統(tǒng)必須具有很高的響應(yīng)速度,而OLAP對系統(tǒng)的響應(yīng)速度要求較為寬松D、OLTP系統(tǒng)一般由企業(yè)的中上層或決策使用,而OLAP系統(tǒng)一般由企業(yè)的中下層業(yè)務(wù)人員使用標準答案:C知識點解析:聯(lián)機事務(wù)處理OLTP也稱面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計算機中心進行處理,并在很短的時間內(nèi)給出處理結(jié)果,可以即時的處理輸入的數(shù)據(jù),及時回答。因此系統(tǒng)要求必須具有很高的響應(yīng)速度。聯(lián)機分析處理OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。典型的應(yīng)用就是復(fù)雜的動態(tài)的報表系統(tǒng)。OLAP的特點一般有:實時性要求不是很高、數(shù)據(jù)量大、決策支持,查詢動態(tài),隨時提出查詢的要求。OLTP的安全性比OLAP要高,實施起來也比較困難。A和B都不正確。D項OLTP一般由企業(yè)中下層使用,OLAP由企業(yè)中上層使用。5、設(shè)有如下所示的某商場購物記錄集合,每個購物籃中包含若干商品現(xiàn)在要基于該數(shù)據(jù)集進行關(guān)聯(lián)規(guī)則挖掘。如果設(shè)置最小支持度為60%,最小置信度為80%,則如下關(guān)聯(lián)規(guī)則中,符合條件的是()A、啤酒→尿布B、(面包,尿布)→牛奶C、面包→牛奶D、(面包,啤酒)→尿布標準答案:A知識點解析:關(guān)聯(lián)規(guī)則是形如X->Y的蘊涵表達式。關(guān)聯(lián)規(guī)則的強度可以用它的支持度(s)和置信度(c)度量。支持度確定規(guī)則可以用于給定數(shù)據(jù)集的頻繁程度,而置信度確定Y在包含X的事務(wù)中出現(xiàn)的頻繁程度。兩者可以用公式表示:從題目中可以看到事務(wù)總數(shù)是5,A的{啤酒、尿布}支持度計數(shù)是3,{啤酒}支持計數(shù)是3,所以s=0.6,c=1。同理可得B{面包、尿布}支持計數(shù)為3,{面包、尿布、牛奶}支持計數(shù)是2,所以s=0.4,c=2╱3。C中,{面包、牛奶}支持計數(shù)為3,{面包}支持計數(shù)為4,所以s=0.6,c=0.75。D中,{面包、啤酒}支持計數(shù)為2,{面包、啤酒、尿布}支持計數(shù)為2,所以s=0.4,c=1。綜上所述,結(jié)果選A。6、現(xiàn)在許多中大型企業(yè)建有企業(yè)數(shù)據(jù)倉庫。關(guān)于數(shù)據(jù)倉庫中數(shù)據(jù)的特點,下列說法一般情況下正確的是()。A、數(shù)據(jù)倉庫中的數(shù)據(jù)主要服務(wù)于企業(yè)的基礎(chǔ)業(yè)務(wù)需求,其設(shè)計應(yīng)重點針對單點查詢進行優(yōu)化B、數(shù)據(jù)倉庫中的數(shù)據(jù)一般源自企業(yè)的OLTP環(huán)境,因此,其中的數(shù)據(jù)與OLTP環(huán)境中的數(shù)據(jù)一樣,允許對數(shù)據(jù)做直接更改C、數(shù)據(jù)倉庫中的數(shù)據(jù)集合具有集成性,實現(xiàn)企業(yè)數(shù)據(jù)的集成有助實現(xiàn)企業(yè)范圍的跨部門視圖D、數(shù)據(jù)倉庫中的數(shù)據(jù)具有時變性,是指數(shù)據(jù)倉庫一般對數(shù)據(jù)操作與訪問的實時性要求很高標準答案:C知識點解析:在傳統(tǒng)的OLTP(On-LineTransactionProcessing,聯(lián)機事務(wù)處理系統(tǒng))中,數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)一般是以面向企業(yè)基本業(yè)務(wù)需要的方式進行組織的,而數(shù)據(jù)倉庫中的數(shù)據(jù)是以面向主題的方式進行組織的。故A選項錯誤。數(shù)據(jù)倉庫中的數(shù)據(jù)是一個集成的,易于訪問的,一致的,包含大量歷史數(shù)據(jù)的和經(jīng)過優(yōu)化處理的數(shù)據(jù)。因此數(shù)據(jù)倉庫具有面向主題性、集成性、不可更新性和時間特性。這里面的不可更新并不意味著不再向數(shù)據(jù)倉庫中追加新的數(shù)據(jù),只是表示一般不在對進入數(shù)據(jù)倉庫中的原始數(shù)據(jù)進行修改。選項B錯。數(shù)據(jù)倉庫的時變性是指數(shù)據(jù)倉庫中的每個數(shù)據(jù)單元都有時間標志,記錄一般都加有時間戳,有時記錄可能包含有事務(wù)的發(fā)生時間。同時,數(shù)據(jù)倉庫隨時間變化的特性還指數(shù)據(jù)倉庫在運行中必須不斷捕捉操作性環(huán)境中的數(shù)據(jù),并將新的數(shù)據(jù)集成后追加到其中。并不是指對數(shù)據(jù)操作與訪問的實時性要求很高。故D選項錯誤。7、下列關(guān)于建立數(shù)據(jù)倉庫的目標的描述,不恰當?shù)氖?)。A、充分利用企業(yè)信息系統(tǒng)生成的數(shù)據(jù)B、把企業(yè)各種類型的應(yīng)用集中在一起C、解決數(shù)據(jù)分析應(yīng)用和企業(yè)基本業(yè)務(wù)應(yīng)用之間的性能沖突問題,減輕OLTP系統(tǒng)的負擔D、以面向主題的方式合理組織數(shù)據(jù),實現(xiàn)跨部門視圖標準答案:B知識點解析:建立數(shù)據(jù)倉庫的主要目的在于根據(jù)決策需求對企業(yè)的數(shù)據(jù)采取適當?shù)氖侄芜M行集成,形成一個綜合的、面向分析的數(shù)據(jù)環(huán)境,用于支持企業(yè)的信息性、決策性的分析應(yīng)用。故答案為B項。8、設(shè)有某大型連鎖商場,建立有面向基礎(chǔ)業(yè)務(wù)的數(shù)據(jù)庫應(yīng)用系統(tǒng)和面向決策支持的數(shù)據(jù)倉庫系統(tǒng),數(shù)據(jù)倉庫系統(tǒng)每天夜間需要從數(shù)據(jù)庫應(yīng)用系統(tǒng)的數(shù)據(jù)庫導(dǎo)入新數(shù)據(jù)。在下列數(shù)據(jù)表中,最不適合采用快照方式從數(shù)據(jù)庫應(yīng)用系統(tǒng)獲取數(shù)據(jù)的是()。A、各商品銷售明細表B、各商場員工表C、商品表和商品類別表D、各商場收銀點信息表標準答案:A知識點解析:快照(Snapshot)是指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品,適合更新變化量少的數(shù)據(jù)。各商品銷售明細表是屬于一個動態(tài)信息表,每個時刻的信息都不一樣,因此各商品銷售明細表不適合用快照方式更新。故答案為A選項。9、在下面列出的每組描述特性中,均不屬于數(shù)據(jù)倉庫數(shù)據(jù)特點的是()。A、面向主題、可直接修改、性能要求較為寬松B、集成的、可直接修改、相對OLTP環(huán)境性能要求高C、面向業(yè)務(wù)應(yīng)用、可直接修改、相對OLTP環(huán)境性能要求高D、面向業(yè)務(wù)應(yīng)用、集成的、批量訪問標準答案:C知識點解析:數(shù)據(jù)倉庫數(shù)據(jù)特點包括面向主題性、集成性、不可更新性和時間特性等。故答案為C選項。10、有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)是常見典型的機器學(xué)習(xí)方法,下列學(xué)習(xí)任務(wù)屬于無監(jiān)督學(xué)習(xí)的是()。A、將一組無標簽數(shù)據(jù),采用一定的機器學(xué)習(xí)算法將數(shù)據(jù)分成不同的組B、根據(jù)一組小規(guī)模樣本數(shù)據(jù),采用某種小樣本學(xué)習(xí)算法,訓(xùn)練分類器C、根據(jù)專家標定的一組有標簽時間序列數(shù)據(jù),訓(xùn)練異常發(fā)現(xiàn)算法D、不基于人類歷史棋譜數(shù)據(jù),訓(xùn)練出下圍棋的智能軟件標準答案:A知識點解析:監(jiān)督學(xué)習(xí)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達到所要求性能的過程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。無監(jiān)督學(xué)習(xí)是指對未知的標簽數(shù)據(jù)進行學(xué)習(xí)和分組。強化學(xué)習(xí)又稱再勵學(xué)習(xí)、評價學(xué)習(xí)或增強學(xué)習(xí),是機器學(xué)習(xí)的范式和方法論之一,用于描述和解決智能體在與環(huán)境的交互過程中通過學(xué)習(xí)策略達成回報最大化或?qū)崿F(xiàn)特定目標的問題。故答案為A選項。11、以下是某商場的購物記錄集合,每個購物籃中包含若干商品?,F(xiàn)在要基于該數(shù)據(jù)集進行關(guān)聯(lián)規(guī)則挖掘,如果設(shè)置最小支持度為60%,最小置信度為80%,則在以下列出的關(guān)聯(lián)規(guī)則中,符合條件的是()。A、A→BB、B→CC、C→BD、D→C標準答案:D知識點解析:由關(guān)聯(lián)規(guī)則Q→D計算過程可知:支持度=事務(wù)中同時包含X、Y的百分比,置信度=在事務(wù)已經(jīng)包含X的情況下包含Y的百分比。則可以計算出事務(wù)同時包含C、D的支持度為:3╱5=60%,在包含D的情況下,包含c的百分比為:3╱3=100%,因此D選項滿足要求,其他選項均不滿足最小支持度或者最小置信度。12、對對象進行分類是數(shù)據(jù)挖掘的一項非常重要的任務(wù),下列算法模型無法直接用于分類的是()A、邏輯回歸B、K-meansC、神經(jīng)網(wǎng)絡(luò)D、決策樹標準答案:B知識點解析:K-means算法是很典型的基于距離的聚類<http:╱╱baike.baidu.com╱view╱31801.htm>算法,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。故答案為B項。13、設(shè)有某通信公司的業(yè)務(wù)支撐系統(tǒng),該系統(tǒng)中存在如下各種數(shù)據(jù)或文檔Ⅰ.通話詳單Ⅱ.短信數(shù)據(jù)Ⅲ.系統(tǒng)ER圖及說明文檔Ⅳ.物理平臺的數(shù)據(jù)字典及其說明文檔Ⅴ.用戶名單Ⅵ.用戶每月費用支出分類匯總數(shù)據(jù)Ⅶ.用戶繳費記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()。A、僅Ⅰ、Ⅱ和ⅤB、僅Ⅲ、Ⅳ、Ⅴ和ⅦC、僅Ⅳ、Ⅵ和ⅦD、僅Ⅲ和Ⅳ標準答案:D知識點解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項的內(nèi)容。題干中只有Ⅲ和Ⅳ符合定義,其余的內(nèi)容都是用戶數(shù)據(jù)。故答案為D項。14、ETL工具是指從OLTP系統(tǒng)或其他數(shù)據(jù)環(huán)境中抽取數(shù)據(jù)的工具。在實踐中,人們采用ETL工具從OLTP系統(tǒng)抽取出數(shù)據(jù)再進行分析利用,而不是在OLTP系統(tǒng)中直接進行數(shù)據(jù)分析利用的最主要原因是()。A、解決企業(yè)中的數(shù)據(jù)共享問題B、解決企業(yè)中的數(shù)據(jù)孤島問題C、解決蜘蛛網(wǎng)式的企業(yè)信息系統(tǒng)架構(gòu)帶來的各種問題D、解決分析型應(yīng)用程序與OLTP應(yīng)用程序之間的性能沖突問題標準答案:D知識點解析:ETL是英文Extract-Transform-Load的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽取(extract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程。采用數(shù)據(jù)抽取程序從OLTP系統(tǒng)中抽取數(shù)據(jù)的主要原因是解決不同類型應(yīng)用程序之間的性能沖突問題。故答案為D選項。15、設(shè)有某移動通信公司的業(yè)務(wù)支撐系統(tǒng),該系統(tǒng)中存在如下各種數(shù)據(jù)或文檔Ⅰ.用戶通話詳單Ⅱ.用戶短信記錄Ⅲ.系統(tǒng)ER圖及說明文檔Ⅳ.DBMS中的數(shù)據(jù)字典Ⅴ.用戶名單數(shù)據(jù)Ⅵ.用戶每月費用支出分類匯總數(shù)據(jù)Ⅶ.用戶繳費記錄以上各類數(shù)據(jù),屬于元數(shù)據(jù)的是()。A、僅Ⅲ和ⅣB、僅Ⅰ、Ⅱ和ⅤC、僅Ⅲ、Ⅳ、Ⅴ和ⅦD、僅Ⅳ、Ⅵ和Ⅶ標準答案:A知識點解析:元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項內(nèi)容。①在傳統(tǒng)的數(shù)據(jù)庫中,元數(shù)據(jù)描述了數(shù)據(jù)庫中的各個對象,如數(shù)據(jù)庫中的數(shù)據(jù)字典就是一種元數(shù)據(jù)。②在關(guān)系數(shù)據(jù)庫中,元數(shù)據(jù)描述對數(shù)據(jù)庫、表、列等其他對象的定義。③在數(shù)據(jù)倉庫中,元數(shù)據(jù)定義了數(shù)據(jù)倉庫中許多對象——表、列、查詢、商業(yè)規(guī)則及數(shù)據(jù)倉庫內(nèi)部的數(shù)據(jù)轉(zhuǎn)移等。因此可推出Ⅰ、Ⅱ、Ⅴ、Ⅵ、Ⅶ不屬于元數(shù)據(jù)。故答案為A項。16、在企業(yè)的信息系統(tǒng)環(huán)境中,設(shè)有下列類別的數(shù)據(jù):Ⅰ.交易數(shù)據(jù)Ⅱ.關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)字典內(nèi)容Ⅲ.數(shù)據(jù)模型設(shè)計文檔Ⅳ.建庫腳本Ⅴ.HDFS的命名結(jié)點中保存的主要數(shù)據(jù)Ⅵ.客戶數(shù)據(jù)以上類別數(shù)據(jù)中,不屬于元數(shù)據(jù)的是()。A、僅Ⅳ和ⅤB、僅Ⅱ和ⅣC、僅Ⅰ和ⅥD、僅Ⅲ和Ⅳ標準答案:C知識點解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對數(shù)據(jù)庫、表、列等其他對象的定義。因此可推出,Ⅰ和Ⅵ不屬于元數(shù)據(jù)。故答案為C項。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)17、在數(shù)據(jù)庫并發(fā)控制中,鎖的粒度越________,事務(wù)并發(fā)執(zhí)行程度就越小,數(shù)據(jù)庫系統(tǒng)開銷也越小。標準答案:大或粗知識點解析:數(shù)據(jù)庫管理系統(tǒng)對事務(wù)的并發(fā)執(zhí)行進行控制,以保證數(shù)據(jù)庫一致性,最常用的方法是封鎖的方法。封鎖粒度與系統(tǒng)的并發(fā)度和并發(fā)控制的開銷密切相關(guān)。封鎖的粒度越大,并發(fā)度就越小,同時系統(tǒng)的開銷就越小。封鎖的粒度越小,并發(fā)度就越大,同時系統(tǒng)的開銷就越大。故答案為大或粗。18、OLAP主要用于支持復(fù)雜的分析操作,側(cè)重對決策人員和高層管理人員的數(shù)據(jù)支持。OLAP的實現(xiàn)方式主要有三種:MOLAP、________和HOLAP。標準答案:ROLAP知識點解析:OLAP的實現(xiàn)技術(shù)主要分為以下三類:①基于關(guān)系型數(shù)據(jù)庫的OLAP(ROLAP,RelationalOLAP);②基于多維數(shù)據(jù)庫的OLAP(MOLAP,Multi-DimensionalOLAP);③混合型OLAP(HOLAP,HybridOLAP)19、在OLAP的實現(xiàn)方式中,以多維數(shù)組作為存儲結(jié)構(gòu)的被稱作________OLAP。標準答案:M知識點解析:MOLAP稱為基于多維數(shù)據(jù)庫的OLAP,這種OLAP的核心是多維數(shù)據(jù)庫技術(shù)。MOLAP工具以多維數(shù)據(jù)庫的形式將元數(shù)據(jù)、基礎(chǔ)事實數(shù)據(jù)和導(dǎo)出數(shù)據(jù)存儲在以多維數(shù)組為基本存儲結(jié)構(gòu)的多維數(shù)據(jù)庫中。20、給定一個銷售交易數(shù)據(jù)庫,從中找出這些交易中的某些物品和其他物品之間的關(guān)系,這種數(shù)據(jù)挖掘一般稱為________挖掘。標準答案:關(guān)聯(lián)或關(guān)聯(lián)分析或關(guān)聯(lián)規(guī)則知識點解析:給定一個銷售交易數(shù)據(jù)庫,從中找出這些交易中的某些物品和其他物品之間的關(guān)系,這種數(shù)據(jù)挖掘一般稱為關(guān)聯(lián)(或關(guān)聯(lián)分析、關(guān)聯(lián)規(guī)則)挖掘。21、對一個數(shù)據(jù)集的數(shù)據(jù)進行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同,這樣數(shù)據(jù)挖掘方法稱為________算法。標準答案:聚類或clustering知識點解析:本題考查的是聚類算法的定義。對一個數(shù)據(jù)集的數(shù)據(jù)進行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能的不同,這樣數(shù)據(jù)挖掘方法稱為聚類算法。22、在多維數(shù)據(jù)分析中,從高粒度級數(shù)據(jù)視圖切換到低粒度級數(shù)據(jù)視圖的分析操作稱為________操作。標準答案:鉆取或下鉆或drilldown知識點解析:所謂鉆取(drilldown)是指對應(yīng)于某一維逐步向更細節(jié)層方向觀察數(shù)據(jù),鉆取是改變展現(xiàn)數(shù)據(jù)維度的層次,變換分析的粒度,它包括向上鉆取和向下鉆取。故答案為鉆取或下鉆或drilldown。23、在企業(yè)信息系統(tǒng)的應(yīng)用類型中,OLAP應(yīng)用是指聯(lián)機________處理應(yīng)用。標準答案:分析知識點解析:在企業(yè)信息系統(tǒng)的應(yīng)用類型中,OLAP應(yīng)用(OnlineAnalyticalProcessing)是指聯(lián)機分析處理應(yīng)用。故答案是分析。24、在數(shù)據(jù)倉庫中,數(shù)據(jù)的________越小,表明數(shù)據(jù)的細節(jié)程度越高,可以回答查詢的種類就越多。標準答案:粒度或granularity知識點解析:在數(shù)據(jù)倉庫中,數(shù)據(jù)的粒度越小,表明數(shù)據(jù)的細節(jié)程度越高,可以回答查詢的種類就越多。25、在關(guān)聯(lián)規(guī)則挖掘中,關(guān)聯(lián)規(guī)則的成立與否一般用________度和置信度兩個指標進行描述。標準答案:支持知識點解析:在關(guān)聯(lián)規(guī)則挖掘中,關(guān)聯(lián)規(guī)則的成立與否一般用支持度和置信度兩個指標進行描述。26、在企業(yè)數(shù)據(jù)倉庫架構(gòu)中,操作型數(shù)據(jù)存儲ODS一般情況下主要用來支持即時OLAP和全局型________兩類應(yīng)用。標準答案:OLTP或事務(wù)處理知識點解析:在ODS上可實行的全局應(yīng)用大致可分為:實現(xiàn)企業(yè)全局的OLTP操作、實現(xiàn)即時的OLAP操作。27、根據(jù)事物發(fā)展的延續(xù)性和規(guī)律性,基于變量歷史時間點上的順序數(shù)據(jù),推測變量未來后續(xù)時間點的發(fā)展趨勢的任務(wù)稱為________分析。標準答案:時間序列或預(yù)測或時序知識點解析:時間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨時間變化的對象的規(guī)律或趨勢,并對其進行建模,用時間序列分析方法可以推測變量未來后續(xù)時間點的發(fā)展趨勢。故答案為時間序列或預(yù)測或時序。28、在數(shù)據(jù)分析方法中,將一組數(shù)據(jù)對象采取一定方法劃分成若干個組,并使組內(nèi)數(shù)據(jù)對象盡可能相似,組間對象盡可能不同的過程稱為________。標準答案:聚類知識點解析:聚類就是將一組數(shù)據(jù)對象采取一定方法劃分成若干個組,并使組內(nèi)數(shù)據(jù)對象盡可能相似,組間對象盡可能不同,故答案是聚類。計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷第3套一、選擇題(本題共15題,每題1.0分,共15分。)1、某網(wǎng)上書店根據(jù)用戶的歷史購書記錄,采用某種數(shù)據(jù)挖掘算法分析出用戶最可能屬于某一類書的愛好者,應(yīng)該采用()A、關(guān)聯(lián)分析B、分類分析C、時間序列分析D、回歸分析標準答案:B知識點解析:常見的數(shù)據(jù)挖掘任務(wù)包括分類、估計、預(yù)測、相關(guān)性分組或關(guān)聯(lián)規(guī)則、聚類和描述、可視化以及復(fù)雜數(shù)據(jù)類型挖掘(Text、Web、圖形圖像、視頻和音頻等)等。分類分析首先從數(shù)據(jù)中選出已經(jīng)分好類的訓(xùn)練集,在該訓(xùn)練集上運用數(shù)據(jù)挖掘分類的技術(shù),建立分類模型,對于沒有分類的數(shù)據(jù)進行分類。該需求要求根據(jù)購書記錄將用戶映射到傾向于喜歡某種書的顧客特性中,而分類挖掘模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別的某一個中。2、某大型超市的數(shù)據(jù)庫應(yīng)用系統(tǒng)中,設(shè)有下列數(shù)據(jù):Ⅰ.商品清單Ⅱ.商品銷售細節(jié)數(shù)據(jù)Ⅲ.DBMS中的數(shù)據(jù)字典Ⅳ.數(shù)據(jù)庫結(jié)構(gòu)說明文檔Ⅴ.前端應(yīng)用程序表中數(shù)據(jù)項的定義及說明文檔Ⅵ.商品分類銷售匯總數(shù)據(jù)以上數(shù)據(jù)中,一般不屬于元數(shù)據(jù)的是()A、僅Ⅰ、Ⅲ和ⅥB、僅Ⅱ、Ⅴ和ⅥC、僅Ⅰ、Ⅱ和ⅥD、僅Ⅱ、Ⅳ和Ⅴ標準答案:C知識點解析:元數(shù)據(jù)被定義為描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù),是關(guān)于數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)用于描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法,可將其按用途的不同分為技術(shù)元數(shù)據(jù)和業(yè)務(wù)元數(shù)據(jù)。一般來說,它有兩個主要的用途:首先能夠提供基于用戶的信息,其次能支持系統(tǒng)對數(shù)據(jù)的管理和維護。在傳統(tǒng)的數(shù)據(jù)庫中,元數(shù)據(jù)描述了數(shù)據(jù)庫中的各個對象,如數(shù)據(jù)庫中數(shù)據(jù)字典就是一種元數(shù)據(jù),在關(guān)系數(shù)據(jù)庫中,這種描述就是對數(shù)據(jù)庫、表、列等對象的定義。DBMS數(shù)據(jù)字典、數(shù)據(jù)庫結(jié)構(gòu)證明文檔、前端應(yīng)用程序表中數(shù)據(jù)庫的定義及說明文檔都是元數(shù)據(jù)。而Ⅰ、Ⅱ和Ⅵ都是提供了基于用戶數(shù)據(jù)的信息,與元數(shù)據(jù)的定義不符,因此Ⅰ、Ⅱ、Ⅵ不屬于元數(shù)據(jù)。3、現(xiàn)有一個具有多個分店的大型連鎖超市,該連鎖超市使用統(tǒng)一的連鎖業(yè)務(wù)經(jīng)營管理系統(tǒng)管理其日常業(yè)務(wù)。已知其中的銷售數(shù)據(jù)明細表結(jié)構(gòu)為(銷售記錄ID,商品ID,價格,數(shù)量,總金額,銷售時間,分店ID),該表數(shù)據(jù)量很大。為了提高數(shù)據(jù)訪問效率,系統(tǒng)將每年每個分店的銷售數(shù)據(jù)劃分成獨立的數(shù)據(jù)表,這種劃分方式被稱為()A、輪轉(zhuǎn)劃分B、范圍劃分C、散列劃分D、多維劃分標準答案:D知識點解析:輪轉(zhuǎn)法:對關(guān)系順序掃描,將第i個元組存儲到標號為Dimod的磁盤上,該方式保證了元組在多個磁盤上均勻分布。散列劃分:選定一個值域為{0,1,…,n-1}的散列函數(shù),對關(guān)系中的元組基于劃分屬性進行散列,如果散列函數(shù)返回i,則將其存儲到第i個磁盤。范圍劃分:根據(jù)表中某個屬性取值區(qū)間劃分成不同的子區(qū)間,然后根據(jù)表中的屬性值屬于的不同區(qū)間將表分成不同的子表。多維劃分:維是人們觀察事物的角度,同樣的數(shù)據(jù)從不同的維進行觀察可能會得到不同的結(jié)果,如從各個分店的角度、各種商品的角度(商品ID)等,而每個維度又可按粒度的不同劃分成多個層次,稱為維度成員。本題中將總表按分店號與時間劃分成不同的子表,屬于多維劃分,所以選D。4、數(shù)據(jù)挖掘可以簡單地理解為從大量的數(shù)據(jù)中發(fā)現(xiàn)或挖掘知識。設(shè)某公司的客戶關(guān)系管理系統(tǒng)中有客戶表A(CID,v1,v2,…,vn)。給定一個訓(xùn)練集S(v1,v2,…,vn,c),其中c為客戶類別、vi(i=1…n)為客戶其他屬性。若對表A中任一客戶x,要使系統(tǒng)能判定x所屬的客戶類別,較合理的方案是()A、將x對應(yīng)的元組中的特征向量(v1,v2,…,vn)與訓(xùn)練集S中的元組進行匹配,從而判定x所屬的客戶類別B、對訓(xùn)練集S設(shè)計適當?shù)乃惴?,?gòu)造一個分類器M,將x對應(yīng)的特征向量(v1,v2,…,vn)作為M的輸入,用M判定x所屬的客戶類別C、采用關(guān)聯(lián)規(guī)則挖掘算法構(gòu)成一個關(guān)聯(lián)式分類器M,用M判定x所屬的類別D、采用適當?shù)木垲愃惴?,對表A中的所有元組進行聚類,將每個元組歸入訓(xùn)練集S各元組的c列所給出的客戶類別中,從而實現(xiàn)x所屬客戶類別的判定標準答案:B知識點解析:對于訓(xùn)練集S,測試集A利用數(shù)據(jù)挖掘中的分類算法,通過訓(xùn)練集構(gòu)建一個分類器,將測試集A作為分類器輸入,經(jīng)過分類器后會得到相應(yīng)的類別號。即使相同的類別編號的訓(xùn)練集也可能對應(yīng)不同的屬性集,所以單純的通過對屬性集差別的比較來識別類別不準確,故A錯。關(guān)聯(lián)規(guī)則挖掘是發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品之間的聯(lián)系,而本題是對數(shù)據(jù)進行分類,與題意不符,故C錯。D項屬于無監(jiān)督學(xué)習(xí)算法,對類別并沒有規(guī)定明確的前提條件,與本題所給的條件無關(guān)。綜上可知,選項B正確。5、給定如下三個關(guān)系表:銷售明細表(商品標識,銷售時間,單價,數(shù)量,金額)日銷售表(商品標識,銷售日,總數(shù)量,總金額)月銷售額(商品標識,銷售月份,總數(shù)量,總金額)下列說法正確的是()A、銷售明細表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最大B、日銷售表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最小C、月銷售表的數(shù)據(jù)粒度最大,數(shù)據(jù)量最小D、月銷售表的數(shù)據(jù)粒度最小,數(shù)據(jù)量最小標準答案:C知識點解析:數(shù)據(jù)粒度劃分標準可以將數(shù)據(jù)倉庫中的數(shù)據(jù)劃分為詳細數(shù)據(jù)、輕度總結(jié)、高度總結(jié)三級或更多級。確立粒度的原則:細化程度越高,粒度越??;細化程度越低,粒度越大,綜合程度越高。如果數(shù)據(jù)倉庫不保存低粒度的數(shù)據(jù)而只有粗粒度的數(shù)據(jù),則需要存儲的數(shù)據(jù)量就較少。所以A、D錯。B項中已是最小粒度,所以沒有最大、最小之分。C中月銷售表可以分成粒度更小的日銷售表。6、下列關(guān)于數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、機器學(xué)習(xí)與決策支持系統(tǒng)中的相關(guān)概念或說法,錯誤的是()。A、數(shù)據(jù)倉庫是服務(wù)于決策支持的數(shù)據(jù)集合B、數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識的方法或過程C、機器學(xué)習(xí)是指機器采用一些方法或模型根據(jù)數(shù)據(jù)去習(xí)得知識的過程D、決策支持系統(tǒng)一般是指企業(yè)中以數(shù)據(jù)為基礎(chǔ)對重要業(yè)務(wù)或事務(wù)實施決策的信息系統(tǒng)標準答案:D知識點解析:決策支持系統(tǒng)一般是指企業(yè)中以數(shù)據(jù)為基礎(chǔ)對重要業(yè)務(wù)或事務(wù)實施輔助決策的信息系統(tǒng)。故答案為D項。7、在建立數(shù)據(jù)倉庫的數(shù)據(jù)集成工作中,需要采用適當?shù)牟呗詮臄?shù)據(jù)源獲取變化數(shù)據(jù)。下列數(shù)據(jù)表中,一般情況下不適宜采用快照方式從業(yè)務(wù)系統(tǒng)獲取數(shù)據(jù)的是()。A、顧客表、商品類別表B、門店表、銷售人員表C、商場商品銷售表、電信公司通話詳單D、商品清單、商品類別表標準答案:C知識點解析:快照是關(guān)于指定數(shù)據(jù)集合的一個完全可用拷貝,該拷貝包括相應(yīng)數(shù)據(jù)在某個時間點(拷貝開始的時間點)的映像??煺湛梢允瞧渌硎镜臄?shù)據(jù)的一個副本,也可以是數(shù)據(jù)的一個復(fù)制品。它反映的是某個時間點內(nèi)的數(shù)據(jù),該數(shù)據(jù)具有不可以改變性。而商場商品銷售表、電信公司通話詳單屬于動態(tài)數(shù)據(jù),不適合用快照的方式獲取數(shù)據(jù)。故答案為C項。8、下列關(guān)于企業(yè)數(shù)據(jù)倉庫環(huán)境中數(shù)據(jù)特點的說法,錯誤的是()。A、數(shù)據(jù)按面向決策支持應(yīng)用主題的方法進行組織B、數(shù)據(jù)經(jīng)常以批量方式訪問C、數(shù)據(jù)可以直接修改D、數(shù)據(jù)可用性要求相比OLTP環(huán)境較為寬松標準答案:C知識點解析:數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的,且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策,有面向主題性、集成性、不可更新性和時間特性等幾個重要特性。不可更新并不意味著不向數(shù)據(jù)倉庫中追加新的數(shù)據(jù),只是表示一般不再對進入數(shù)據(jù)倉庫中的原始數(shù)據(jù)進行修改。故答案為C選項。9、數(shù)據(jù)倉庫是服務(wù)于決策支持的數(shù)據(jù)集合,面向主題是其中的一個重要特征。下列關(guān)于面向主題的理解,一般情況下錯誤的是()。A、面向主題要求進行數(shù)據(jù)倉庫數(shù)據(jù)模型設(shè)計和組織時需要針對特定主題的決策支持需求集進行B、面向主題是指進行數(shù)據(jù)倉庫的應(yīng)用開發(fā)和部署時要采用面向主題的開發(fā)工具和實施平臺C、面向主題一般會要求數(shù)據(jù)倉庫中必須集成企業(yè)或組織機構(gòu)中多個來源的數(shù)據(jù)集D、面向主題中的主題是指一組決策支持需求的集合標準答案:B知識點解析:在傳統(tǒng)的OLTP環(huán)境下,數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)一般是以面向企業(yè)基本業(yè)務(wù)應(yīng)用的方式進行組織的。在數(shù)據(jù)倉庫中數(shù)據(jù)是以面向主題的方式進行組織的,主題是一個抽象的概念,主題也可以稱為分析主題或分析領(lǐng)域,用于表達某一宏觀的分析領(lǐng)域所涉及的對象,以及與對象有關(guān)的數(shù)據(jù)集合。故答案為B選項。10、在對某商場的顧客進行流失預(yù)測分析時,先取得一個顧客樣本集S,其模式為(id,a1,a2,…an,c),其中id為顧客的唯一標識,ai(i=1,2,…,n)為顧客的屬性,如年齡、性別、消費時間間隔等,c的取值為{流失,未流失}?,F(xiàn)有算法A對樣本S進行處理,輸出結(jié)果為P,P能根據(jù)該樣本集外的顧客u的n個屬性,確定u的c屬性值,以對顧客的流失作出預(yù)測。那么,A和P分別是()A、聚類算法,聚類工具B、分類算法,分類器C、關(guān)聯(lián)規(guī)則算法,規(guī)則集D、多維分析算法,OLAP工具標準答案:B知識點解析:由于有樣本集和測試集之分,又有已有的類別標簽,所以屬于監(jiān)督學(xué)習(xí)。分類:通過學(xué)習(xí)得到一個目標函數(shù)f,把每個屬性集x映射到一個預(yù)先定義的類標號y。分類屬于監(jiān)督學(xué)習(xí)。聚類:根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對象及其關(guān)系的信息,將數(shù)據(jù)對象分組,組內(nèi)的對象相互之間是相似的,而不同組中的對象則不同。組內(nèi)的相似性越大,組間差別越大,聚類就越好,屬于無監(jiān)督學(xué)習(xí)。關(guān)聯(lián)規(guī)則挖掘:發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的有意義的聯(lián)系。多維分析是指各級管理決策人員從木同的角度、快速靈活地對數(shù)據(jù)倉庫中的數(shù)據(jù)進行復(fù)雜查詢多維分析處理。根據(jù)題意顯然是符合分類。所以選B。11、設(shè)某企業(yè)的在線事務(wù)處理(OLTP)系統(tǒng)中有銷售記錄表T1,它每天約產(chǎn)生50萬條新記錄,OLTP系統(tǒng)保存半年數(shù)據(jù)。在企業(yè)的數(shù)據(jù)倉庫中,用表T2保存近2年的銷售細節(jié)數(shù)據(jù),用表T3保存5年內(nèi)每日各個商品銷售匯總數(shù)據(jù)。為了實現(xiàn)從OLTP系統(tǒng)到數(shù)據(jù)倉庫的銷售數(shù)據(jù)的集成,一般情況下,下列方案最為合理的是()。A、每天將表T1的數(shù)據(jù)全部復(fù)制到表T2中,并根據(jù)表T2的內(nèi)容重新計算表T3B、每天將表T1的數(shù)據(jù)全部復(fù)制到數(shù)據(jù)倉庫中,根據(jù)復(fù)制的數(shù)據(jù)與表T2的區(qū)別,生成變化數(shù)據(jù),并根據(jù)變化數(shù)據(jù)重新計算表T3C、在OLTP系統(tǒng)中采用技術(shù)手段記錄表T1的所有新記錄NT,每天將NT復(fù)制到數(shù)據(jù)倉庫中,將NT1合并到表T2中,根據(jù)表T2重新計算表T3D、在OLTP系統(tǒng)中采用技術(shù)手段記錄表T1的所有新記錄NT,每天將NT復(fù)制到數(shù)據(jù)倉庫中,將NT合并到表T2中,根據(jù)NT和表T3重新計算表T3標準答案:D知識點解析:聯(lián)機事務(wù)處理系統(tǒng)(OLTP)能對數(shù)據(jù)進行即時更新或其他操作,系統(tǒng)內(nèi)的數(shù)據(jù)總是保持在最新狀態(tài)。數(shù)據(jù)倉庫主要功能仍是將組織透過資訊系統(tǒng)之聯(lián)機事務(wù)處理(OLTP)經(jīng)年累月所累積的大量資料,透過數(shù)據(jù)倉庫理論所特有的資料儲存架構(gòu),做有系統(tǒng)的分析整理。根據(jù)題意,銷售記錄表T1每天產(chǎn)生50萬條新記錄,而且都是最新產(chǎn)生的數(shù)據(jù),所以最適合存放在OLTP系統(tǒng)中用NT表保存。當新記錄NT表中數(shù)據(jù)超過半年,就需要將表中數(shù)據(jù)復(fù)制到數(shù)據(jù)倉庫中,也就是將NT表中的數(shù)據(jù)合并到T2(保存近2年的銷售細節(jié)數(shù)據(jù))。當新記錄NT表中數(shù)據(jù)超過2年,那就需要存放到T3表中,T3表需要重新計算。故答案為D選項。12、為了進行數(shù)據(jù)分析,將OLTP系統(tǒng)中數(shù)據(jù)利用抽取程序抽取出來的最主要原因是()。A、減輕OLTP系統(tǒng)的數(shù)據(jù)存儲負擔,將數(shù)據(jù)轉(zhuǎn)移出OLTP系統(tǒng)B、通過建立數(shù)據(jù)的獨立性來確保數(shù)據(jù)分析應(yīng)用的安全性C、解決OLTP應(yīng)用與分析型應(yīng)用之間的性能沖突問題D、解決企業(yè)整體信息系統(tǒng)的數(shù)據(jù)體系存在的蛾―網(wǎng)問題標準答案:C知識點解析:為了進行數(shù)據(jù)分析,將OLTP系統(tǒng)中數(shù)據(jù)利用抽取程序抽取出來的最主要原因是解決OLTP應(yīng)用與分析型應(yīng)用之間的性能沖突問題。故答案為C項。13、分類算法服務(wù)于數(shù)據(jù)挖掘或機器學(xué)習(xí)中分類任務(wù),下列算法中不屬于分類算法的是()。A、SVM算法B、BP神經(jīng)網(wǎng)絡(luò)算法C、決策樹算法D、K-means算法標準答案:D知識點解析:分類器的構(gòu)造方法有統(tǒng)計方法、機器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。統(tǒng)計方法包括貝葉斯法和非參數(shù)法;機器學(xué)習(xí)方法包括決策樹法和規(guī)則歸納法;神經(jīng)網(wǎng)絡(luò)方法主要是BP算法。K-means屬于聚類算法。故答案為D選項。14、在企業(yè)數(shù)據(jù)倉庫設(shè)計中,數(shù)據(jù)的粒度級設(shè)計是一個重要的問題,在粒度級設(shè)計中,設(shè)有下列考慮因素:Ⅰ.用戶查詢所涉及的數(shù)據(jù)的最低細節(jié)程度Ⅱ.高粒度級數(shù)據(jù)所需的存儲空間Ⅲ.用戶查詢的平均性能需求Ⅳ.系統(tǒng)的可用存儲空間Ⅴ.低粒度級數(shù)據(jù)的規(guī)模Ⅵ.用戶查詢所涉及的數(shù)據(jù)最高粒度級在以上因素中,屬于設(shè)計時需要考慮的主要因素是()A、僅Ⅰ和ⅢB、僅Ⅰ、Ⅲ、Ⅳ和ⅤC、僅Ⅳ和ⅤD、僅Ⅰ、Ⅲ和Ⅵ標準答案:B知識點解析:在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題,它影響到數(shù)據(jù)倉庫的數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。在進行粒度級設(shè)計時,在可用的存儲空間中保存粗細程度不同的主題數(shù)據(jù),以盡可能滿足各種應(yīng)用的多角度、多層次數(shù)據(jù)查詢要求,同時在總體上提高查詢的設(shè)計效率。粒度越小,則細節(jié)程度越高,綜合程度就越低,回答查詢的類型也越多,數(shù)據(jù)量比較大,空間代價也大。用戶查詢所涉及的數(shù)據(jù)的最低細節(jié)程度、用戶查詢的平均性能需求、系統(tǒng)的可用存儲空間、低粒度級數(shù)據(jù)的規(guī)模都屬于主要考慮的因素。故答案為B選項。15、設(shè)數(shù)據(jù)倉庫平臺中有三個物化視圖(實體化視圖)V1、V2和V3,若有分別針對這三個視圖進行的查詢Q1、Q2和Q3,查詢過程或結(jié)果有如下現(xiàn)象:Ⅰ.Q1查詢到的是V1視圖所對應(yīng)原始數(shù)據(jù)的4小時前的數(shù)據(jù)Ⅱ.Q2每次查詢到的都是V2視圖所對應(yīng)原始數(shù)據(jù)的1分鐘前的數(shù)據(jù)Ⅲ.Q3查詢V3時,發(fā)現(xiàn)V3不是最新數(shù)據(jù),實時啟動對V3的更新程序,刷新后得到最新數(shù)據(jù)有關(guān)V1、V2和V3所采用的物化視圖更新維護策略的說法,正確的是()。A、對V1采用的是快照維護策略,V2是實時近實時維護策略,V3是延時維護策略B、對V1、V2和V3都采用的是延時維護策略C、對V1和V2采用的是快照維護策略,V3是延時維護策略D、對V1和V2采用的是延時維護策略,V3是實時近實時維護策略標準答案:A知識點解析:數(shù)據(jù)倉庫中的數(shù)據(jù)維護策略分為3種:實時維護、延時維護和快照維護。實時維護在數(shù)據(jù)源發(fā)生變化時,立即更新數(shù)據(jù)倉庫中數(shù)據(jù)。實時維護操作的觸發(fā)條件是數(shù)據(jù)源進行了數(shù)據(jù)的更新操作。這種策略能夠保證用戶總查到最新的數(shù)據(jù)(V2)。延時維護工作并不是在數(shù)據(jù)源的更新事務(wù)中完成,而是在數(shù)據(jù)倉庫中的視圖被查詢時完成更新(V3)。延時維護操作的觸發(fā)條件是用戶在數(shù)據(jù)源發(fā)生變化后首次對數(shù)據(jù)倉庫執(zhí)行查詢操作??煺站S護策略定期對數(shù)據(jù)倉庫進行維護,維護操作的觸發(fā)條件是時間。這種策略不會給源數(shù)據(jù)的更新事務(wù)或者數(shù)據(jù)倉庫的查詢事務(wù)增加任何負擔,但通常無法提供最新的數(shù)據(jù)(V1)。故答案為A選項。二、應(yīng)用題(本題共12題,每題1.0分,共12分。)16、知識發(fā)現(xiàn)主要由三個步驟組成,它們是________、數(shù)據(jù)挖掘、結(jié)果的解釋評估。標準答案:數(shù)據(jù)準備知識點解析:知識發(fā)現(xiàn)指的是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的以及最終可理解的模式的非平凡過程。知識發(fā)現(xiàn)將信息變?yōu)橹R,從數(shù)據(jù)礦山中找到蘊藏的知識金塊,將為知識創(chuàng)新和知識經(jīng)濟的發(fā)展作出貢獻,也是所謂“數(shù)據(jù)挖掘”的一種更廣義的說法。知識發(fā)現(xiàn)過程由以下三個階段組成:數(shù)據(jù)準備、數(shù)據(jù)挖掘、結(jié)果的解釋評估。17、數(shù)據(jù)倉庫是一個面向________的、集成的、非易失的、且隨時間變化的數(shù)據(jù)集合。標準答案:主題知識點解析:數(shù)據(jù)倉庫是為了構(gòu)建新的分析處理環(huán)境而出現(xiàn)的一種數(shù)據(jù)存儲和組織技術(shù),基本特征包括:數(shù)據(jù)是面向主題的、集成的、非易失的、隨時間不斷變化的。主題是一個在較高層次上對數(shù)據(jù)的抽象,這使得面向主題的數(shù)據(jù)組織可以獨立于數(shù)據(jù)的處理邏輯,因而可以在這種數(shù)據(jù)環(huán)境上方便地開發(fā)新的分析型應(yīng)用。18、在數(shù)據(jù)倉庫設(shè)計和建設(shè)過程中,設(shè)計者需要調(diào)查用戶的決策或數(shù)據(jù)處理需求,并將功能相近且需要相關(guān)聯(lián)數(shù)據(jù)支持的需求進行歸類,得到不同的需求集合,并在企業(yè)數(shù)據(jù)模型中尋找能夠滿足各個需求集合的數(shù)據(jù)集合,然后針對各個數(shù)據(jù)集合開展數(shù)據(jù)倉庫數(shù)據(jù)模型的設(shè)計。這種設(shè)計方法稱為________的設(shè)計方法。標準答案:面向主題知識點解析:面向主題的數(shù)據(jù)組織方式,就是在較高層次上對分析對象數(shù)據(jù)的一個完整并且一致的描述,能刻畫各個分析對象所涉及的企業(yè)各項數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。所謂較高層次是相對面向應(yīng)用的數(shù)據(jù)組織方式而言的,即按照主題進行數(shù)據(jù)組織的方式具有更高的數(shù)據(jù)抽象級別。與傳統(tǒng)數(shù)據(jù)庫面向應(yīng)用進行數(shù)據(jù)組織的特點相對應(yīng),數(shù)據(jù)倉庫中的數(shù)據(jù)面向主題進行組織。例如,一個生產(chǎn)企業(yè)的數(shù)據(jù)倉庫所組織的主題可能有產(chǎn)品訂貨分析和貨物發(fā)運分析等。19、數(shù)據(jù)從操作型環(huán)境轉(zhuǎn)移到數(shù)據(jù)倉庫過程中所用到ETL工具通常需要完成的處理操作包括抽取、轉(zhuǎn)換和________。標準答案:裝載或裝入或加載知識點解析:ETL是實現(xiàn)數(shù)據(jù)集成的主要技術(shù),即填充更新數(shù)據(jù)倉庫的數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的數(shù)據(jù)采集過程。20、時間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨________變化的對象的規(guī)律或趨勢,并對其進行建模。標準答案:時間知識點解析:時間序列分析也可以稱為數(shù)據(jù)演變分析,它能描述行為隨時間變化的對象的規(guī)律或趨勢,并對其進行建模。21、在數(shù)據(jù)倉庫環(huán)境中,數(shù)據(jù)的________設(shè)計是一種重要的設(shè)計問題,它會影響到數(shù)據(jù)倉庫中數(shù)據(jù)量以及系統(tǒng)能回答的查詢的類型。標準答案:粒度或granularity知識點解析:粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別。細化程度越高,粒度級就越小;相反,細化程度越低,粒度級就越大。數(shù)據(jù)的粒度一直是一個設(shè)計問題。在數(shù)據(jù)倉庫環(huán)境中粒度之所以是主要的設(shè)計問題,是因為它深深地影響存放在數(shù)據(jù)倉庫中的數(shù)據(jù)量的大小,同時影響向數(shù)據(jù)倉庫所能回答的查詢類型。在數(shù)據(jù)倉庫中的數(shù)據(jù)量大小與查詢的詳細程度之間要作出權(quán)衡。故答案為粒度。22、在企業(yè)數(shù)據(jù)倉庫中,操作型數(shù)據(jù)存儲層(ODS),一般用以支撐即時________和全局型OLTP應(yīng)用。標準答案:OLAP或分析知識點解析:在企業(yè)數(shù)據(jù)倉庫中,操作型數(shù)據(jù)存儲層(ODS),主要包括即時OLAP和全局型OLTP應(yīng)用。故答案為OLAP或分析。23、在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題。粒度越________,細節(jié)程度越高,能回答的查詢就越多,數(shù)據(jù)量就比較大。標準答案:小知識點解析:一般將綜合級別稱為粒度,粒度越大,表示綜合程度越高,粒度越小,表示細節(jié)程度越高。24、數(shù)據(jù)倉庫共有四個特性,分別是面向主題、________、非易失和隨時間變化。標準答案:集成知識點解析:數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的,且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策。這個概念指出了數(shù)據(jù)倉庫的幾個重要的特性,即面向主題性、集成性、不可更新性和時間特性。25、數(shù)據(jù)倉庫是一個面向主題的、________的、非易失的,且隨時間變化的數(shù)據(jù)集合。標準答案:集成知識點解析:本題考查的是數(shù)據(jù)倉庫的定義。數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的,且隨時間變化的數(shù)據(jù)集合。26、在關(guān)聯(lián)規(guī)則挖掘中,為了發(fā)現(xiàn)有意義的關(guān)聯(lián)規(guī)則,需要給定最小________度和最小可信度兩個閾值。標準答案:支持知識點解析:關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘的主要任務(wù)就是在事務(wù)數(shù)據(jù)庫中找出給定的具有最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,同時滿足最小支持度閾值和最小置信度規(guī)閾值的規(guī)則成為強規(guī)則。故答案為支持。27、數(shù)據(jù)倉庫與大數(shù)據(jù)平臺的前端需要有ETL工具,其中的E是指________。標準答案:抽取或提取或Extract知識點解析:ETL工具是(ExtractTransformLoad)的縮寫,是實現(xiàn)數(shù)據(jù)集成的主要技術(shù)。故答案為抽取或提取或Extract。計算機三級數(shù)據(jù)庫技術(shù)(數(shù)據(jù)倉庫與數(shù)據(jù)挖掘)機試模擬試卷第4套一、選擇題(本題共15題,每題1.0分,共15分。)1、對于ODS體系,有下列說法:Ⅰ.ODSⅠ:第一類ODS數(shù)據(jù)更新頻率是天級,一般隔夜后將數(shù)據(jù)更新到ODS中Ⅱ.ODSⅡ:第二類ODS的數(shù)據(jù)更新頻率是小時級,如4小時更新一次Ⅲ.ODSⅢ:第三類ODS的數(shù)據(jù)更新頻率是秒級,即操作型系統(tǒng)中的數(shù)據(jù)發(fā)生改變后,幾乎是立即傳送到ODS中,這類ODS建設(shè)難度大Ⅳ.ODSⅣ:第四類ODS是根據(jù)數(shù)據(jù)來源方向和類型劃分的,不僅包含來自操作型環(huán)境的數(shù)據(jù),也包含由數(shù)據(jù)倉庫層和數(shù)據(jù)集市層的應(yīng)用反饋給ODs的一些決策結(jié)果或一些報表信息以上說法正確的是()A、僅Ⅰ和ⅡB、僅Ⅰ和ⅢC、僅Ⅱ和ⅣD、Ⅰ、Ⅱ、Ⅲ和Ⅳ標準答案:C知識點解析:ODS(OperationalDataStore)是數(shù)據(jù)倉庫體系結(jié)構(gòu)中的一個可選部分,ODS具備數(shù)據(jù)倉庫的部分特征和OLTP系統(tǒng)的部分特征,它是“面向主題的、集成的、當前或接近當前的、不斷變化的”數(shù)據(jù)。第一類ODS數(shù)據(jù)更新頻率是秒級,第二類ODS的數(shù)據(jù)更新頻率是小時級,第三類ODS的數(shù)據(jù)更新頻率是天級,上述三類是根據(jù)數(shù)據(jù)更新的速度劃分的,ODSⅣ:第四類ODS是根據(jù)數(shù)據(jù)來源方向和類型劃分的。2、關(guān)于操作型數(shù)據(jù)和DSS型數(shù)據(jù)特征有如下說法Ⅰ.操作型數(shù)據(jù)更新頻率高,DSS型數(shù)據(jù)一般不更新Ⅱ.操作型數(shù)據(jù)對性能要求寬松,DSS型數(shù)據(jù)對性能要求高Ⅲ.操作型數(shù)據(jù)是詳細的,DSS型數(shù)據(jù)是綜合的Ⅳ.操作型數(shù)據(jù)有冗余,DSS型數(shù)據(jù)無冗余Ⅴ.操作型數(shù)據(jù)處理需求事先可知,DSS型數(shù)據(jù)處理需求事先不明確以上說法正確的是()A、Ⅰ、Ⅱ、ⅤB、Ⅱ、Ⅲ、ⅣC、Ⅰ、Ⅲ、ⅤD、Ⅲ、Ⅳ、Ⅴ標準答案:C知識點解析:操作型數(shù)據(jù)對性能要求較高、無冗余。操作型數(shù)據(jù)與分析型數(shù)據(jù)的區(qū)別如以下所示。3、一個在線書評、樂評分享網(wǎng)站,建有面向業(yè)務(wù)的數(shù)據(jù)庫系統(tǒng)和面向分析的數(shù)據(jù)倉庫系統(tǒng),數(shù)據(jù)倉庫系統(tǒng)需要每天從數(shù)據(jù)庫應(yīng)用系統(tǒng)的數(shù)據(jù)庫導(dǎo)入新數(shù)據(jù)。有下列數(shù)據(jù)表:Ⅰ.書籍表和書籍類別表Ⅱ.用戶表和好友關(guān)系表Ⅲ.書評表和樂評表Ⅳ.音樂專輯表和音樂分類表上述表中,適合采用快照方式從數(shù)據(jù)庫應(yīng)用系統(tǒng)獲取數(shù)據(jù)的是()。A、僅Ⅰ和ⅣB、僅Ⅱ和ⅣC、僅Ⅰ、Ⅱ和ⅣD、僅Ⅰ、Ⅱ和Ⅲ標準答案:C知識點解析:快照:該方法通過對當前數(shù)據(jù)表進行“照相”,記錄當前的數(shù)據(jù)表信息“相片”,然后將當前的“相片”與以前的數(shù)據(jù)表“相片”進行比較,如果不一致將通過一定的方式傳到數(shù)據(jù)倉庫,從而實現(xiàn)數(shù)據(jù)的一致性,這種方式適合于更新頻率較低的數(shù)據(jù)表。題目中的書評表和樂評表主要用于記載用戶的評論,里面的內(nèi)容更新頻率較高,而數(shù)據(jù)倉庫的更新頻率較低,因此書評表和樂評表不適合用于快照的方法。而其它三個選項的更新頻率相對較低,比較適合快照模式,故選擇C選項。4、在大型企業(yè)的數(shù)據(jù)庫應(yīng)用系統(tǒng)中,聯(lián)機事務(wù)處理(OLTP)和聯(lián)機分析處理(OLAP)是常見的數(shù)據(jù)管理與數(shù)據(jù)分析形式。關(guān)于OLTP和OLAP,一般情況下,下列說法正確的是()A、OLTP系統(tǒng)的安全性要求比OLAP系統(tǒng)的低,也比較容易實現(xiàn)B、OLAP系統(tǒng)在訪問數(shù)據(jù)時,一般以訪問少量記錄為主,OLTP系統(tǒng)則相反C、OLTP要求系統(tǒng)必須具有很高的響應(yīng)速度,而OLAP對系統(tǒng)響應(yīng)速度的要求較為寬松D、OLTP系統(tǒng)一般由企業(yè)的中上層或決策層使用,而OLAP系統(tǒng)一般由企業(yè)的中下層業(yè)務(wù)人員使用標準答案:C知識點解析:OLTP是對數(shù)據(jù)庫聯(lián)機的日常操作,通常是對一條記錄的查詢和修改,要求快速響應(yīng)用戶的請求,對數(shù)據(jù)的安全性、完整性及事物吞吐量要求很高。而OLAP是對數(shù)據(jù)的查詢和分析操作,通常是對海量歷史數(shù)據(jù)的查詢和分析,要訪問的數(shù)據(jù)量非常大,查詢和分析操作十分復(fù)雜。所以A、B錯。又因為OLAP為宏觀分析,OLTP為微現(xiàn)操作,所以前者面向中上層和決策者使用,而后者面向企業(yè)的中下層業(yè)務(wù)人員使用。所以D錯。因此選C。5、下列關(guān)于數(shù)據(jù)倉庫粒度的說法,錯誤的是()。A、在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題,它影響到數(shù)據(jù)倉庫的數(shù)據(jù)量和系統(tǒng)能夠回答的查詢的類型B、一般在進行數(shù)據(jù)倉庫的數(shù)據(jù)組織時,需要根據(jù)當前應(yīng)用的需求來進行多粒度級設(shè)計C、粒度越小,數(shù)據(jù)量越小,空間代價越小D、粒度越大,綜合程度越高標準答案:C知識點解析:在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題,它影響到數(shù)據(jù)倉庫的數(shù)量以及系統(tǒng)能夠回答的查詢的類型。粒度越小,則詳細程度越高,綜合程度就越低,回答詢問的種類也越多,數(shù)據(jù)量比較大,空間代價也大;粒度越大,綜合程度就越高。綜上所述可知C選項錯誤。故選擇C選項。6、下列關(guān)于數(shù)據(jù)倉庫粒度的說法,錯誤的是()。A、在數(shù)據(jù)倉庫環(huán)境中,粒度是一個重要的設(shè)計問題,它影響到數(shù)據(jù)倉庫的數(shù)據(jù)量和系統(tǒng)能夠回答的查詢的類型B、一般在進行數(shù)據(jù)倉庫的數(shù)據(jù)組織時,需要根據(jù)當前應(yīng)用的需求來進行多粒度級設(shè)計C、數(shù)據(jù)粒度越小,說明數(shù)據(jù)綜合程度越低D、數(shù)據(jù)粒度越大,數(shù)據(jù)量越大,空間代價越大標準答案:D知識點解析:粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低。粒度越小,細節(jié)程度越高,數(shù)據(jù)量就比較大,空間代價也大。故答案為D項。7、數(shù)據(jù)倉庫是服務(wù)于企業(yè)決策支持的數(shù)據(jù)集合。下列選項中,一般情況下不屬于數(shù)據(jù)倉庫中數(shù)據(jù)特征的是()。A、可修改B、面向主題C、集成的D、隨時間變化標準答案:A知識點解析:數(shù)據(jù)倉庫中數(shù)據(jù)特征包括面向主題性,集成性,不可更新性,時間特性。故答案為A項。8、在具有數(shù)據(jù)倉庫的企業(yè)數(shù)據(jù)環(huán)境中,數(shù)據(jù)倉庫數(shù)據(jù)一般都具有許多特點,下列都屬于其特點的是()。A、面向主題、不可直接修改、批量訪問B、面向主題、可直接修改、性能要求較為寬松C、集成的、不可直接修改、性能要求高D、集成的、可直接修改、批量訪問標準答案:A知識點解析:數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的,且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策,有面向主題性、集成性、不可更新性和時間特性等幾個重要特性。故答案為A選項。9、設(shè)某數(shù)據(jù)倉庫系統(tǒng)中有下列數(shù)據(jù)表:Ⅰ.商品銷售表(商品號,店鋪標識,銷售量,單價,日期,時間)Ⅱ.各店商品周銷售表(商品號,店鋪標識,周銷售量,周)Ⅲ.各店商品月銷售表(商品號,店鋪標識,月銷售量,月)Ⅳ.各小類各店商品月銷售表(商品小類,店鋪標識,月銷售量,月)以上各個表中數(shù)據(jù),粒度級最低和最高的表分別是()。A、僅Ⅰ和ⅡB、僅Ⅱ和ⅢC、僅Ⅰ和ⅣD、僅Ⅲ和Ⅳ標準答案:C知識點解析:粒度是系統(tǒng)中存在不同綜合級別的數(shù)據(jù),一般將綜合級別稱為粒度。粒度越大,表示綜合程度越高,粒度越小,表示綜合程度越低。粒度級最低是各小類各店商品月銷售表,粒度級最高是商品銷售表。故答案為C選項。10、設(shè)某銀行有基于關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)倉庫系統(tǒng),其中有下列數(shù)據(jù)Ⅰ.賬戶余額快照數(shù)據(jù)Ⅱ.DBMS的數(shù)據(jù)字典Ⅲ.賬戶存取明細數(shù)據(jù)Ⅳ.數(shù)據(jù)表結(jié)構(gòu)說明文檔Ⅴ.數(shù)據(jù)抽取日志以上數(shù)據(jù)不屬于元數(shù)據(jù)的是()A、僅Ⅰ和ⅢB、僅Ⅳ和ⅤC、僅Ⅱ和ⅣD、僅Ⅰ、Ⅲ和Ⅴ標準答案:D知識點解析:元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),或者叫做描述數(shù)據(jù)的數(shù)據(jù)。元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、鏈和索引等項內(nèi)容。在關(guān)系數(shù)據(jù)中,這種描述就是對數(shù)據(jù)庫、表、列等其他對象的定義。因此可推出,Ⅰ、Ⅲ和Ⅴ不屬于元數(shù)據(jù)。所以選D。11、下列關(guān)于數(shù)據(jù)倉庫設(shè)計方法特點的描述,錯誤的是()。A、數(shù)據(jù)倉庫的數(shù)據(jù)分析需求一般在設(shè)計初期就能夠并需要完全整理出來B、數(shù)據(jù)倉庫設(shè)計方法一般是一種數(shù)據(jù)驅(qū)動的方法,以數(shù)據(jù)源系統(tǒng)分析和企業(yè)主題數(shù)據(jù)模型的設(shè)計作為起點C、企業(yè)數(shù)據(jù)倉庫的設(shè)計一般是一個不斷循環(huán)、迭代完善的過程D、在進行數(shù)據(jù)倉庫數(shù)據(jù)粒度設(shè)計時需要綜合考慮數(shù)據(jù)規(guī)模、查詢需求、硬件和運維成本等因素標準答案:A知識點解析:數(shù)據(jù)倉庫的數(shù)據(jù)分析需求

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論