



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、提示:務(wù)必寫上學(xué)號(hào)和姓名數(shù)據(jù)倉庫與數(shù)據(jù)挖掘I.選擇題,為每個(gè)問題選擇最合適的答案(10X2%=20%)1 .數(shù)據(jù)倉庫上的業(yè)務(wù)處理稱作。A.聯(lián)機(jī)事務(wù)處理B.聯(lián)機(jī)分析處理C.聯(lián)機(jī)輸入處理D.聯(lián)機(jī)查詢處理2 .在自然演化體系結(jié)構(gòu)中,關(guān)于導(dǎo)致數(shù)據(jù)缺乏可信性的原因的說法哪個(gè)不正確?A.數(shù)據(jù)無時(shí)基B.抽取程序的算法有差異C.抽取的層次不同D.缺乏集成性3 .下面哪項(xiàng)關(guān)于OLTP與OLAP訪問特點(diǎn)的說法是不正確的。A. OLTP和OLAP對(duì)于響應(yīng)時(shí)間的要求都高B. OLTP訪問頻率高,OLAP訪問頻率低C. OLAP訪問大量的歷史,執(zhí)行大量統(tǒng)計(jì)操作D. OLTP數(shù)據(jù)處理具有并發(fā)性4 .下面關(guān)于數(shù)據(jù)倉庫中數(shù)據(jù)
2、的說法錯(cuò)誤的是?A.數(shù)據(jù)越詳細(xì),粒度越小,層次級(jí)別就越高。B.在估計(jì)直接存儲(chǔ)設(shè)備數(shù)時(shí),如數(shù)據(jù)超過1000萬行必須強(qiáng)制采取雙重粒度級(jí)。C.數(shù)據(jù)倉庫大部分分析是針對(duì)被壓縮的、存取效率高的輕度級(jí)數(shù)據(jù)進(jìn)行的。D.數(shù)據(jù)分割便于數(shù)據(jù)的重構(gòu)、重組和恢復(fù),以提高創(chuàng)建索引和順序掃描的效率。5 .下面關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù)存儲(chǔ)方式的說法哪個(gè)是不正確的?E.虛擬存儲(chǔ)方式中,數(shù)據(jù)倉庫的數(shù)據(jù)仍然在源數(shù)據(jù)中。F.星型模式下的維表規(guī)范化的,而雪花模式下的不需要規(guī)范化G.在查詢效率方面,星型模式效率更高H.在事實(shí)星座模式中有多個(gè)事實(shí)表,且它們共享相同的維表6 .下面關(guān)于星型模型的說法哪個(gè)是不正確的?1. 有一個(gè)包含大量數(shù)據(jù)的事實(shí)
3、表J.有一組小的附屬表,稱為維表,每維一個(gè)。K.事實(shí)表的每個(gè)字段都是事實(shí)度量字段L.事實(shí)中每條元組都含有指向各個(gè)維表的外鍵和一些相應(yīng)的度量數(shù)據(jù)。7 .下面關(guān)于數(shù)據(jù)倉庫的數(shù)據(jù)追加的說法哪個(gè)是不正確的?A.時(shí)標(biāo)法需要為記錄數(shù)據(jù)增加一個(gè)時(shí)間標(biāo)志。B.前后映像文件方法需要掃描整個(gè)數(shù)據(jù)庫,占用較多資源,對(duì)性能有較大影響C.DELTA不需要掃描整個(gè)數(shù)據(jù)庫,效率較高,應(yīng)用普遍D.日志文件法也不需要掃描整個(gè)數(shù)據(jù)庫,是固有機(jī)制。8 .假設(shè)收入屬性的最小與最大分別是10000和90000,現(xiàn)在想把當(dāng)前值30000映射到區(qū)間0,1,若采用最大最小數(shù)據(jù)規(guī)范方法,計(jì)算結(jié)果是多少?A. 0.25B. 0.375C. 0.
4、125D. 0.59 .下面關(guān)于維的概念哪個(gè)是不正確的?A.維是人們觀察數(shù)據(jù)的特定角度。B.維的層次性是由觀察數(shù)據(jù)細(xì)致程度不同造成的。C. 某年某月某日”是時(shí)間維的層次。D. 月、季、年”是時(shí)間維的層次。10 .數(shù)據(jù)倉庫開發(fā)應(yīng)用周期可分為三個(gè)階段,下列哪項(xiàng)不是其中某個(gè)階段?A.規(guī)劃分析階段B.體系結(jié)構(gòu)設(shè)計(jì)階段C.設(shè)計(jì)實(shí)施階段D.使用維護(hù)階段11 .簡答題(4X5%=20%)1 .在現(xiàn)實(shí)世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的,描述處理該問題的方法?(至少給出5種不同的方法)2 .簡述數(shù)據(jù)倉庫的四個(gè)基本特征?3 .簡述輪轉(zhuǎn)綜合數(shù)據(jù)存儲(chǔ)的過程?4 .簡述數(shù)據(jù)庫數(shù)據(jù)與數(shù)據(jù)倉庫數(shù)據(jù)的異同?II.設(shè)
5、計(jì)題(5X12%=60%)1、假定大學(xué)的數(shù)據(jù)倉庫包含4個(gè)維student學(xué)生、course課程、semester學(xué)期、instructor教師,2個(gè)度量count和avg_grade。在最低的概念層(例如對(duì)于給定的學(xué)生、課程、學(xué)期和教師組合),度量avg_grade存放學(xué)生的實(shí)際成績。在較高概念層,avg_grade存放給定組合的平均成績。a)為數(shù)據(jù)倉庫畫出雪花模式圖8%b)由基本立方體學(xué)生、課程、學(xué)期、教師開始,列出大學(xué)每個(gè)學(xué)生的計(jì)算機(jī)導(dǎo)論”課程的平均成績,應(yīng)當(dāng)使用哪些OLAP操作(如由學(xué)期上卷到年)?4%2、假定數(shù)據(jù)倉庫包含4個(gè)維date時(shí)間,spectatorMA,location地區(qū)和
6、game節(jié)目,2個(gè)度量count和charge。其中,charge是觀眾在給定的日期觀看節(jié)目的付費(fèi)。觀眾可以是學(xué)生、成年人或老人,每類觀眾有不同的收費(fèi)標(biāo)準(zhǔn)。a)畫出該數(shù)據(jù)倉庫的星形模式圖8%b)由基本立方體date,spectator,location,game開始,為列出2011年觀眾在GM-Place的總付費(fèi),應(yīng)當(dāng)執(zhí)行哪些OLAP操作?4%3、假定下面的表從面向?qū)傩缘臍w納導(dǎo)出。類出生地人數(shù)程序員江蘇180其它120銷售員江蘇20其它80a)將該表轉(zhuǎn)換成顯示相關(guān)t-權(quán)和d-權(quán)的交叉表6%b)將類“程序員”轉(zhuǎn)換成(雙向的)量化描述規(guī)則。例如VX,Programmer(X)仁(birth_pla
7、ce(X)=江蘇"A.)t:x%,d:y%.v(.)(t:w%,d:z%4、數(shù)據(jù)庫有事物。設(shè)min_sup=60%,min_conf=80%TID日期購買的物品T100T200T300T400a)使用Apriori99/10/1599/10/1599/10/19C,A,B,E99/10/22B,A,DK,A,D,BD,A,C,E,Bb)列出所有強(qiáng)關(guān)聯(lián)規(guī)則(帶支持度s和置信度c),它們與下面的元規(guī)則匹配,其中,X是代算法找出頻繁項(xiàng)集6%表顧客的變量,item是表示項(xiàng)的變量(例如,“A,"B”等)6%_xtransaction,buys(X,item1)buys(X,item2)=buys(X,item3)s,c5、假設(shè)數(shù)據(jù)集D含有9個(gè)數(shù)據(jù)對(duì)象(用2維空間的點(diǎn)表示):A(3,2),A2(3,9),A3(8,6),Bi(9,5),B2(2,4),B3(3,10),Ci(2,6),C2(9,6),C3(2,2)采用k-均值方法進(jìn)行聚類,距離函數(shù)采用歐幾里德距離,取k=3,假設(shè)初始的三
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年生活哲學(xué)考試題及答案
- 保潔招聘全職合同范例
- 借款合同范例 質(zhì)押
- 養(yǎng)牛廠家合作合同范例
- 做生意轉(zhuǎn)讓合同范本
- 興寧租房合同范例
- 人才公寓咨詢合同范例
- 家中不安全因素
- 供地合同解除合同范例
- 內(nèi)部升職合同范例
- 2024-2025年第二學(xué)期一年級(jí)語文教學(xué)進(jìn)度表
- 企業(yè)員工職務(wù)犯罪預(yù)防
- 2025年貴州省高職單招醫(yī)學(xué)類職業(yè)技能測試題庫及答案(備考刷題)
- 5《水污染》教學(xué)設(shè)計(jì)-2023-2024學(xué)年科學(xué)六年級(jí)下冊冀人版
- 2025年安徽電氣工程職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 幼兒園開學(xué)教職工安全教育培訓(xùn)
- 2025-2030年中國發(fā)酵豆粕行業(yè)運(yùn)行態(tài)勢及投資前景規(guī)劃研究報(bào)告
- 酒店建設(shè)項(xiàng)目施工總承包合同
- 2025年政府采購代理機(jī)構(gòu)考試題庫及答案
- 第14課《第一次世界大戰(zhàn)》中職高一下學(xué)期高教版(2023)世界歷史全一冊
- 2024年司法考試完整真題及答案
評(píng)論
0/150
提交評(píng)論