《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)方案報(bào)告模板_第1頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)方案報(bào)告模板_第2頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)方案報(bào)告模板_第3頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)方案報(bào)告模板_第4頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計(jì)方案報(bào)告模板_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、江西理工大學(xué)應(yīng)用科學(xué)學(xué)院數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)報(bào)告題目: 某超市數(shù)據(jù)集的 OLAP 分析及數(shù)據(jù)挖掘系別:班級(jí):姓名:二一二年六月目錄1. 一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源2. 任務(wù)描述23. 建立數(shù)據(jù)倉庫數(shù)據(jù)庫3. 設(shè)置數(shù)據(jù)源 .二、銷售數(shù)據(jù) OLAP 分析.1. 任務(wù)描述 .2. 設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales) .3. 設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理 .4. OLAP 分析.三、人力資源數(shù)據(jù) OLAP 分析.1. 任務(wù)描述.2. 設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR).3. 修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu).4. 設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理.5. OLAP 分析.四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作 .1

2、.任務(wù)描述.2.設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限.3.查看元數(shù)據(jù).4.創(chuàng)建對(duì)策.5.鉆取.6.建立遠(yuǎn)程 Internet 連接.五、數(shù)據(jù)倉庫高級(jí)操作 .1. 任務(wù)描述 .2. 創(chuàng)建分區(qū) .3. 創(chuàng)建虛擬多維數(shù)據(jù)集 .4. DTS 調(diào)度多維數(shù)據(jù)集處理.5. 備份/還原數(shù)據(jù)倉庫 .六、數(shù)據(jù)挖掘 .1. 任務(wù)描述 .2. 創(chuàng)建揭示客戶模式的決策樹挖掘模型.3. 決策樹挖掘結(jié)果分析 .4. 創(chuàng)建聚類挖掘模型 .5. 聚類挖掘結(jié)果分析 .6. 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型.7. 瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖 .一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源1、任務(wù)描述數(shù)據(jù)倉庫數(shù)據(jù)庫是將要在其中存放多維數(shù)據(jù)集、

3、角色、數(shù)據(jù)源、共享維度和挖掘模型的一種結(jié)構(gòu)。然后跟預(yù)先設(shè)置好的 ODBC 數(shù)據(jù)源建立連接。2、建立數(shù)據(jù)倉庫數(shù)據(jù)庫(1) 展開樹視圖的 Analysis Servers;(2) 單擊服務(wù)器名或右擊選擇連接,與 Analysis Servers 建立連接;(3) 右擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令;(4) 在“數(shù)據(jù)庫”對(duì)話框中輸入數(shù)據(jù)庫名“教程 DW”,單擊<確定>;3、設(shè)置數(shù)據(jù)源(5) 展開剛創(chuàng)建的“教程 DW”數(shù)據(jù)庫,可看到如下工程:數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色(6) 右擊“教程 DW”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令;(7) 在“數(shù)

4、據(jù)鏈接屬性”對(duì)話框中,單擊“提供程序”選項(xiàng)卡,選擇“Microsoft OLE DB Provider for ODBC Drivers”;(8) 單擊“連接”選項(xiàng)卡,選擇建好的 ODBC 數(shù)據(jù)源“FoodMart 2000”;(9) 單擊<確定>按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對(duì)話框圖表 1 連接數(shù)據(jù)源二、銷售數(shù)據(jù) OLAP 分析1. 任務(wù)描述以多維方式建立數(shù)據(jù)模型可簡(jiǎn)化聯(lián)機(jī)業(yè)務(wù)分析,提高查詢性能。通過創(chuàng)建多維數(shù)據(jù)集,Analysis Manager 可將存儲(chǔ)在關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為具有實(shí)際含義并且易于查詢的業(yè)務(wù)信息。2. 設(shè)計(jì)星型架構(gòu)多維數(shù)據(jù)集(Sales)星型架構(gòu)的多維數(shù)據(jù)集由一個(gè)

5、事實(shí)數(shù)據(jù)表和鏈接到該事實(shí)數(shù)據(jù)表的多個(gè)維度表組成。下面針對(duì) FoodMart 超市 1998 年的銷售業(yè)務(wù)數(shù)據(jù),建立一個(gè)多維數(shù)據(jù)集,以便按產(chǎn)品和顧客 2 個(gè)主題展開分析。具體操作如下:(1) 展開樹窗格的“教程 DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”“向?qū)А辈藛蚊?,打開如下“多維數(shù)據(jù)集向?qū)А睂?duì)話框。(2) 向多維數(shù)據(jù)集添加度量值(事實(shí)) :(3) 單擊<下一步>,在“從數(shù)據(jù)源中選擇事實(shí)數(shù)據(jù)表”步驟中,展開“FoodMart”數(shù) 據(jù)源,然后單擊“sales_fact_1998”;(4) 單擊< 下一步> , 設(shè)置多維數(shù)據(jù)集的度量 值列: store_sales

6、 、store_cost 、unit_sales;(5) 單擊<下一步>,建立維度表。單擊<新建維度>,打開“維度向?qū)А睂?duì)話框;1) 向多維數(shù)據(jù)集添加時(shí)間維:(1)選擇維度類型為“星型架構(gòu):?jiǎn)蝹€(gè)維度表”; (2)單擊<下一步>,選擇維度表“time_by_day”; (3)單擊<下一步>,選擇維度類型為“時(shí)間維度”;(4) 單擊<下一步>,選擇時(shí)間級(jí)別為“年、季度、月”;(5) 單擊<下一步>,單擊<下一步>,輸入時(shí)間維名稱 : Time,并設(shè)為“共享”方式,單擊<完成>,OK!2) 向多維數(shù)據(jù)集添

7、加產(chǎn)品維:(1) 再次單擊<新建維度>,打開“維度向?qū)А睂?duì)話框;(2) 選擇創(chuàng)建維度的方式為“雪花架構(gòu):多個(gè)相關(guān)維度表”; (3)單擊<下一步>,選擇維度表“Product”和“product_class”。(4) 單擊<下一步>,查看連接方式,在這里可刪除不要的連接,添加需要的連 接;(5) 單 擊 < 下一 步 > , 依 次 選 擇 product_category 、 product_subcategory 和brand_name 三個(gè)維度級(jí)別;(6) 單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列; (7)單擊<下

8、一步>,在“高級(jí)選項(xiàng)”步驟中,根據(jù)需要選擇;(8)單擊<下一步 >,輸入產(chǎn)品維名稱 : Product,并設(shè)為 “共享”方式,單擊 <完成>,OK!3) 向多維數(shù)據(jù)集添加客戶維度:(1)再次單擊<新建維度>,打開“維度向?qū)А睂?duì)話框; (2)選擇創(chuàng)建維度的方式為“星型架構(gòu):?jiǎn)蝹€(gè)維度表”; (3)單擊<下一步>,選擇維度表“Customer”。(4) 單擊<下一步>,選擇維度類型為“標(biāo)準(zhǔn)維度”;(5) 單擊<下一步>,依次選擇 Country、State_Province、City 和 lname 四個(gè)維度級(jí)別;(6)

9、單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列; (7)單擊<下一步>,在“高級(jí)選項(xiàng)”步驟中,根據(jù)需要選擇;(8)單擊<下一步>,輸入客戶維名稱 : Customer,并設(shè)為“共享”方式,單擊 <完成>,OK!4) 生成多維數(shù)據(jù)集:(1) 回到多維數(shù)據(jù)集向?qū)?duì)話框,這里已到了新建的 4 個(gè)維度;(2) 單擊<下一步>,在“是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)提問時(shí),單擊<是>,開始計(jì)算。(3) 計(jì)算完成后,命名多維數(shù)據(jù)集為:Sales,單擊<完成>,OK!(4) 關(guān)閉向?qū)?,隨之啟動(dòng)多維數(shù)據(jù)集編輯器,其中可看到剛剛創(chuàng)建的多

10、維數(shù)據(jù)集。單擊藍(lán)色或黃色的標(biāo)題欄,對(duì)表進(jìn)行排列,使其符合下圖所示的樣子圖表 2“Sales 多維數(shù)據(jù)集編輯器”窗口3. 設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理:設(shè)計(jì)好 Sales 多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲(chǔ)模式(MOLAP、ROLAP 或 HOLAP),并指定要存儲(chǔ)的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇 MOLAP 作為存儲(chǔ)模式,創(chuàng)建 Sales 多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從 ODBC 源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。(1) 展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲(chǔ)”菜單命令,彈出“存 儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;也可在多維數(shù)據(jù)集編輯窗口中選擇 “工具|設(shè)

11、計(jì)存儲(chǔ)”菜單命令,打開“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;(2) 單擊<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲(chǔ)類型 ;(3) 單擊<下一步>,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”作為指定百分 比,以此優(yōu)化能力平衡查詢性能和存儲(chǔ)空間大小。(4) 單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對(duì)使用額外磁盤空間的需求。(5) 單擊<下一步>,選擇“立即處理”,并單擊<完成>,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理, 處理聚合一般要花費(fèi)較長一些時(shí)間。(6) 處理完成后點(diǎn)擊<關(guān)閉>,回到 Analysis Manager 窗

12、口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。4. OLAP 分析:聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式 (稱為多維數(shù)據(jù)集)提供對(duì)數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能。圖表 3 OLAP 分析圖三、人力資源數(shù)據(jù) OLAP 分析1. 任務(wù)描述:建立一個(gè)人力資源(HR)多維數(shù)據(jù)集,以進(jìn)行雇員工資分析。先把 Employee 維度創(chuàng)建為父子維度,然后使用該維度以及常規(guī)維度來生成 HR 多維數(shù)據(jù)集2. 設(shè)計(jì)父子維度的多維數(shù)據(jù)集(HR):(1) 展開“教程 DW”,右擊“共享維度”,選擇“新建維度

13、|向?qū)А辈藛蚊睿?打開“新建維度向?qū)А睂?duì)話框。(2) 單擊<下一步>,選擇維度結(jié)構(gòu)為“父子:?jiǎn)蝹€(gè)維度表中相關(guān)的兩列”; (3)單擊<下一步>,選擇維度表 employee;(4) 單擊<下一步>,選擇 employee_id 為成員鍵,選擇 supervisor_id 為父鍵列,選擇 full_name 為成員名。(5) 單擊<下一步>,直到最后一步,輸入維度名稱: employee。(6) 單擊<完成>,回到維度編輯器。OK!3. 修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)(1) 展開“教程 DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集|向

14、導(dǎo)”菜單命令,打開多維數(shù)據(jù)集向?qū)?duì)話框。(2) 點(diǎn)擊<下一步>,選擇 salary(工資)作事實(shí)數(shù)據(jù)表;(3) 點(diǎn)擊<下一步>,選擇 salary_paid、vacation_used 為度量值列;(4) 點(diǎn)擊<下一步>,選擇 Employee(雇員)、Store(商店)、Time(時(shí)間)作維度;(5) 點(diǎn)擊<下一步>,在提示是否計(jì)算事實(shí)數(shù)據(jù)表行數(shù)時(shí)選“是”。最后輸入人力資源多維數(shù)據(jù)集的名稱 NR,點(diǎn)擊<完成>,OK!(6) 回到編輯器窗口,手工建立 time_by_day 表到 salary 表的聯(lián)接,再建立 store 表到 em

15、ployee 表中的聯(lián)接,刪除多余的聯(lián)接。最后如下圖所示。4. 設(shè)計(jì)存儲(chǔ)和數(shù)據(jù)集處理設(shè)計(jì)好 Sales 多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲(chǔ)模式 (MOLAP、ROLAP 或 HOLAP),并指定要存儲(chǔ)的預(yù)先計(jì)算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇 MOLAP 作為存儲(chǔ)模式,創(chuàng)建 Sales 多維數(shù)據(jù)集的聚合設(shè)計(jì),然后從ODBC 源中裝載數(shù)據(jù)并按照聚合設(shè)計(jì)中的定義計(jì)算匯總值。(1) 展開樹窗格,右擊“ Sales”多維數(shù)據(jù)集,選擇“設(shè)計(jì)存儲(chǔ)”菜單命令, 彈出“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計(jì)存儲(chǔ)”菜單命令,打開“存儲(chǔ)設(shè)計(jì)向?qū)А睂?duì)話框;(2) 單擊

16、<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲(chǔ)類型 ;(3) 單擊<下一步>,設(shè)置聚合選項(xiàng)為“性能提升達(dá)到”,并輸入“40”作為指定百分比,以此優(yōu)化能力平衡查詢性能和存儲(chǔ)空間大小。(4) 單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對(duì)使用額外磁盤空間的需求。圖表 4 性能與大小(5) 單擊<下一步>,選擇“立即處理”,并單擊 <完成>,系統(tǒng)開始進(jìn)行數(shù)據(jù)處理,處理聚合一般要花費(fèi)較長一些時(shí)間。(6) 處理完成后點(diǎn)擊<關(guān)閉>,回到 Analysis Manager 窗口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)

17、了。5. OLAP 分析聯(lián)機(jī)分析處理(OLAP)是使用多維數(shù)據(jù)表達(dá)式(稱為多維數(shù)據(jù)集)提供對(duì)數(shù)據(jù)倉庫數(shù)據(jù)進(jìn)行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實(shí)數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能。四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作1 任務(wù)描述多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對(duì)象,以及對(duì)這些對(duì)象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對(duì)象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級(jí)別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。我們要?jiǎng)?chuàng)建Sales 和 HR 角色分別用于訪問多維數(shù)據(jù)集Sales 和

18、HR。Management 角色用于管理整個(gè)數(shù)據(jù)倉庫。2 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對(duì)象,以及對(duì)這些對(duì)象的訪問類型。角色是保護(hù)多維數(shù)據(jù)集內(nèi)對(duì)象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級(jí)別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。本例中,我們要?jiǎng)?chuàng)建 Sales 和 HR 角色分別用于訪問多維數(shù)據(jù)集 Sales 和HR。Management 角色用于管理整個(gè)數(shù)據(jù)倉庫。具體操作如下:2.1 創(chuàng)建多維數(shù)據(jù)集角色:(1) 展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角

19、色”命令,打開“多維數(shù)據(jù)集角色管理器”;(2) 目前還沒角色顯示在角色列表中。點(diǎn)擊 <新建>,打開新建角色對(duì)話框,并輸入角色名:Marketing,表示市場(chǎng)部;(3) 在“成員資格”選項(xiàng)卡中單擊 <添加>按鈕,接著在“添加用戶和組” 對(duì)話框中,添加該角色的網(wǎng)絡(luò)用戶名(如 hzm),單擊<確定>回到新建對(duì)話框框框;(4) 其它選項(xiàng)可暫不設(shè)定,直接點(diǎn) <確定>,回到角色管理器窗口,角色Marketing 就已在列表中了。在這里可以看到各個(gè)角色的權(quán)限,也可修改它們的權(quán)限。(5) <關(guān)閉>角色管理器。然后用同樣的方法創(chuàng)建多維數(shù)據(jù)集HR 的角色

20、HR。2.2 創(chuàng)建數(shù)據(jù)庫角色:數(shù)據(jù)庫角色是可在數(shù)據(jù)庫范圍內(nèi)使用的角色,可指派給該數(shù)據(jù)庫的一個(gè)或多個(gè)多維數(shù)據(jù)集。本例中我們可以為經(jīng)理創(chuàng)建一個(gè)數(shù)據(jù)庫角色,然后將其指派到Sales 和 HR 兩個(gè)多維數(shù)據(jù)集。具體操作如下:(1) 在“教程 DW”數(shù)據(jù)庫下右擊“數(shù)據(jù)庫角色”,然后選擇“管理角色” 命令,打開“數(shù)據(jù)庫角色管理器”窗口;(2) 這里顯示了“ 教程 DW ” 數(shù)據(jù)庫中現(xiàn)有角色的列表( 包括剛建的Marketing 和 HR 多維數(shù)據(jù)集角色);(3) 單擊<新建>,在彈出的對(duì)話框中輸入角色名: Management,然后為該角色添加用戶或組(如 admin),并勾選多維數(shù)據(jù)集 Sa

21、les 和 HR。最后點(diǎn)擊< 關(guān)閉>退出3 查看元數(shù)據(jù)(1) 元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息,此信息顯示在Analysis Manager 右窗格中。(2) 查看多維數(shù)據(jù)集的元數(shù)據(jù):展開“多維數(shù)據(jù)集”文件夾,單擊某多維數(shù)據(jù)集,再單擊右窗格的“元數(shù)據(jù)”;(3) 查看維度的元數(shù)據(jù):展開“共享維度”文件夾,單擊一個(gè)維度,再單擊右窗格的“元數(shù)據(jù)”。4 創(chuàng)建對(duì)策對(duì)策是指由最終用戶啟動(dòng)的、在所選多維數(shù)據(jù)集或其某部分上執(zhí)行的操作。Analysis Services 管理員可以定義以下幾種類型的對(duì)策:命令行、URL、OLE DB 語句或多維表達(dá)式 (MDX) 語句。本例假設(shè)市場(chǎng)部想要針對(duì)上一

22、節(jié)中創(chuàng)建的 Sales 多維數(shù)據(jù)集,能在分析過程的某一點(diǎn)跳轉(zhuǎn)到 Internet,以便能夠搜索并找到關(guān)于某個(gè)特定客戶的信息。操作步驟如下:(1) 展開“教程 DW”數(shù)據(jù)庫,右擊“ Sales”多維數(shù)據(jù)集,然后選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;(2) 右擊“對(duì)策”文件夾,然后選擇“新建對(duì)策”命令,啟動(dòng)對(duì)策向?qū)В?點(diǎn)擊<下一步>;(3) 在“目標(biāo)” 框中選 擇“此多維數(shù)據(jù)集中的某一維度”, 并單擊“Customer”,點(diǎn)擊<下一步> ;(4) 保持“對(duì)策類型”列表不變,繼續(xù)單擊<下一步>;(5) 在“ 定義對(duì)策語法” 步驟中鍵入: “ results.as

23、p?q= ” + C,意思是“通過瀏覽器調(diào)用 MSN 搜索引擎搜索 Customer 維度中的當(dāng)前客戶的信息。圖表 5對(duì)策語法圖(6) 繼續(xù)單擊<下一步>,輸入對(duì)策名稱:Customer Info,點(diǎn)擊完成。OK!5 鉆取本例假設(shè)市場(chǎng)部希望對(duì)商店和客戶按從上到下進(jìn)行分析,最終深化到關(guān)系數(shù)據(jù)庫中的事務(wù)級(jí)別。為此,我們要在Sales 多維數(shù)據(jù)集內(nèi)啟用鉆取,然后瀏覽數(shù)據(jù)并深化到事務(wù)。具體操作如下:(1) 展開“教程 DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集并選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;(2) 單擊“工具|鉆取選項(xiàng)”菜單命令

24、,打開“鉆取選項(xiàng)”對(duì)話框;(3) 選擇“啟用鉆取”復(fù)選框,并單擊 <全選>以選中所有列,然后單擊<確定>,關(guān)閉對(duì)話框;(4) 接下來為不同的角色分配鉆取權(quán)限。(5) 右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開角色管理器;(6) 單擊前面創(chuàng)建的“Management”角色,然后在“鉆取”列中單擊 <.> 按鈕,打開角色權(quán)限設(shè)置對(duì)話框;(7) 選中“允許鉆取”復(fù)選框,然后單擊<確定>返回角色管理器; 這時(shí)可看到“Management”角色已獲得鉆取權(quán)。(8) 關(guān)閉角色管理器,回到分析管理器,右擊“ Sales”多維數(shù)據(jù)集,并選擇“瀏覽

25、數(shù)據(jù)”命令,打開數(shù)據(jù)瀏覽器;(9) 雙擊展開統(tǒng)計(jì)列以顯示不同級(jí)別的聚集數(shù)據(jù)。右擊某數(shù)據(jù) (如 USACABerkeley 的銷售額)并選擇“鉆取”命令,稍等將打開明細(xì)數(shù)據(jù)查看窗口,顯示原始數(shù)據(jù)源中的明細(xì)數(shù)據(jù)。圖表 6 鉆取6 建立遠(yuǎn)程 Internet 連接SQL Server Analysis Services 能讓用戶借助客戶端工具, 通過Internet 連接訪問分析服務(wù)器數(shù)據(jù)庫和多維數(shù)據(jù)集。本示例介紹通過 HTTP 從 Excel 連接到分析服務(wù)器并訪問多維數(shù)據(jù)集的操作。具體步驟如下:(1)準(zhǔn)備:在分析服務(wù)器上安裝 Web 服務(wù)(如 IIS),從分析服務(wù)器的 bin 文件夾中復(fù)制 Ms

26、olap.asp 文件到默認(rèn)站點(diǎn)文件夾(C:Inetpubwwwroot)中; (2)啟動(dòng)客戶端 Excel,選擇“數(shù)據(jù)|數(shù)據(jù)透視表和數(shù)據(jù)透視圖報(bào)表”菜單命令;(3) 在向?qū)У?1 步中選擇“外部數(shù)據(jù)源”,然后單擊<下一步>;(4) 在向?qū)У牡?2 步,單擊<獲取數(shù)據(jù)>,打開“選擇數(shù)據(jù)源”對(duì)話框,然后選擇“OLAP 多維數(shù)據(jù)集”選項(xiàng)卡,并選中“ <新數(shù)據(jù)源>”,然后單擊<確定>;(5) 在接下來的對(duì)話框中,輸入數(shù)據(jù)源名稱: RemoteSales,在驅(qū)動(dòng)程序列表中選擇“Microsoft OLE DB Provider for OLAP Serv

27、ices 8.0”,然后單擊<連接>;(6) 在接下來的對(duì)話框中,選中“分析服務(wù)器”并輸入 URL(如 ,然后單擊<下一步>;(7) 從連接到的遠(yuǎn)程分析服務(wù)器上選擇數(shù)據(jù)庫列表(如教程 DW),然后單擊< 完成>,回到上級(jí)對(duì)話框;(8) 選定包含所需數(shù)據(jù)的多維數(shù)據(jù)集(如 Sales),然后單擊<確定>,最后一步點(diǎn)擊<完成>,回到 Excel 工作表;(9) 接下來就可以在客戶端電子表格中執(zhí)行 OLAP 了。五、數(shù)據(jù)倉庫高級(jí)操作1. 任務(wù)描述多維數(shù)據(jù)集的數(shù)據(jù)可以存儲(chǔ)在一個(gè)或多個(gè)分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時(shí)系統(tǒng)會(huì)自動(dòng)為其分配一個(gè)默認(rèn)分區(qū)。合理

28、地將一個(gè)邏輯多維數(shù)據(jù)集劃分為多個(gè)單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯(cuò)誤。2. 創(chuàng)建分區(qū)多維數(shù)據(jù)集的數(shù)據(jù)可以存儲(chǔ)在一個(gè)或多個(gè)分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時(shí)系統(tǒng)會(huì)自動(dòng)為其分配一個(gè)默認(rèn)分區(qū)。合理地將一個(gè)邏輯多維數(shù)據(jù)集劃分為多個(gè)單獨(dú)的物理分區(qū),常??梢愿倪M(jìn)查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯(cuò)誤。為多維數(shù)據(jù)集創(chuàng)建分區(qū)的步驟如下:(1)展開“Sales”多維數(shù)據(jù)集,右擊“分區(qū)”文件夾,然后選擇“新建分區(qū)” 命令,打開分區(qū)向?qū)В瑔螕?lt;下一步>;( 2 ) 在“ 指定數(shù)據(jù)源和事實(shí)數(shù)據(jù)表” 步驟中, 單擊< 更改> , 然后選擇“FoodMard”數(shù)據(jù)源的 s

29、ales_fact_1997 表,然后單擊<確定>;(3)繼續(xù)單擊<下一步>,在“選擇數(shù)據(jù)切片(可選)”步驟中,選擇“Time”維度,展(4)開“所有 Time”級(jí)別并選擇 1997,繼續(xù)單擊<下一步>;(5) 在“指定分區(qū)類型”步驟中,選擇“本地”并單擊<下一步>;(6) 輸入分區(qū)名稱: Sales 97,并選擇“從現(xiàn)有的分區(qū)(Sales)中復(fù)制聚合設(shè)計(jì)”和“完成時(shí)處理分區(qū)”,最后單擊<完成>;圖表 7 分區(qū)(7) 處理完成后單擊<關(guān)閉>,97 年多維數(shù)據(jù)集將位于另一個(gè)名為 Sales 97 的分區(qū)上了。將來 99、20

30、00、的數(shù)據(jù)也可分別存儲(chǔ)在不同的分區(qū)上,這樣既便于管理,也可提高查詢的效率,特別對(duì)大型數(shù)據(jù)集,效果更加明顯。3. 創(chuàng)建虛擬多維數(shù)據(jù)集虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。使用虛擬維度可基于成員屬性對(duì)多維數(shù)據(jù)集數(shù)據(jù)進(jìn)行分析。其優(yōu)點(diǎn)是不占用磁盤空間或處理時(shí)間。下面創(chuàng)建一個(gè)帶有Yearly Income(年收入)成員屬性的虛擬維度,然后將這個(gè)新創(chuàng)建的維度添加到 Sales 多維數(shù)據(jù)集中。操作步驟如下:(1) 右擊“共享維度”文件夾,選擇“新建維度|向?qū)А辈藛蚊睿?2) 單擊<下一步>,選擇“虛擬維度:另一個(gè)維度的成員屬

31、性”,再單擊< 下一步>;(3) 在“選擇帶有成員屬性的維度”步驟中,單擊“ Customer”維度,再單擊 < 下一步 >;在“選擇虛擬維度的級(jí)別”步驟中,添加“ Lname.Yearly Income”成員屬性后再單擊 <下一步>,在“高級(jí)選項(xiàng)”步驟中直接單擊 <下一步>;(4) 在“完成”步驟中,輸入維度名稱 “Yearly Income”;(5) 單擊<完成>。關(guān)閉向?qū)?。新建的虛擬維度“Yearly Income”已在共享維度列表中了。接下來就可向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度了。4. DTS 調(diào)度多維數(shù)據(jù)集處理本例為 Sales

32、、HR 和 Expense Budget 三多維數(shù)據(jù)集創(chuàng)建自動(dòng)化過程,確保在每天早上 3 點(diǎn)鐘從 OLTP 和 ERP 導(dǎo)入前一天的新增業(yè)務(wù)數(shù)據(jù)。處理完成后再給管理員和關(guān)鍵用戶發(fā)送電子郵件通知他們處理任務(wù)已順利完成。具體操作如下:(1) 選擇“開始|程序|Microsoft SQL Server|企業(yè)管理器”菜單命令,啟動(dòng)SQL Server 企業(yè)管理器;(2) 逐級(jí)展開,直到看到“數(shù)據(jù)轉(zhuǎn)換服務(wù)”文件夾下的“本地包”,右擊“本地包”并選擇“新建包”命令,打開 DTS 包窗口,接下來為 2 個(gè)多維數(shù)據(jù)集定義處理任務(wù);(3) 點(diǎn)擊 DTS 包窗口的左窗格中的“Analysis Services 處

33、理任務(wù)”圖標(biāo),并將其拖動(dòng)到空白窗格中,彈出“Analysis Services 處理任務(wù)”對(duì)話框;(4) 在對(duì)話框中,給第 1 個(gè)任務(wù)輸入名稱為 Sales,并輸入相應(yīng)的描述,如Sales 任務(wù);展開樹窗格的“教程 DW”數(shù)據(jù)倉庫,單擊“ Sales”多維數(shù)據(jù)集,然后在右窗格選擇處(5)理選項(xiàng),選擇“完整處理”;(6) 同樣的方法為“HR”多維數(shù)據(jù)集創(chuàng)建另 1 個(gè)處理任務(wù):HR 任務(wù);(7) 接下來指定任務(wù)執(zhí)行的順序:按住<Ctrl>鍵,依次選擇 Sales 任務(wù)和 HR 任務(wù),然后選擇“工作流|完成時(shí)”菜單命令;(8) 將左窗格中的“發(fā)送電子郵件”圖標(biāo)拖至右窗格中,彈出“發(fā)送郵件

34、任務(wù)屬性”對(duì)話框,設(shè)置好相關(guān)參數(shù)后點(diǎn)<確定>,然后設(shè)置其處理順序。最后以“Cubes 處理”為名保存該包。(9) 回到企業(yè)管理器窗口,剛創(chuàng)建的包位于“本地包”文件夾中,接下來要為該包設(shè)置執(zhí)行時(shí)間;(10) 右擊“Cube 處理”包,選擇“調(diào)度包”命令,彈出“作業(yè)調(diào)度”對(duì)話框;在“每月”頻率下,設(shè)置“第末一天,每 1 個(gè)月”,在“每日頻率”下設(shè)置: “一次發(fā)生于:3:00:00AM”,單擊<確定>;(11) 至此,多維數(shù)據(jù)集定期處理任務(wù)已定制完成,可以退出企業(yè)管理器了。OK!5. 備份/還原數(shù)據(jù)倉庫5.1 以下 3 種情況可能需要對(duì)數(shù)據(jù)倉庫進(jìn)行存檔:5.1.1 創(chuàng)建數(shù)據(jù)倉

35、庫的壓縮備份;(1) 數(shù)據(jù)倉庫不再用于日常分析了,先存檔后刪除,以后需要時(shí)還可還原;(2) 將數(shù)據(jù)倉庫從一臺(tái)服務(wù)器復(fù)制到另一臺(tái)服務(wù)器。5.1.2 具體操作如下:(1) 在 Analysis Manager 樹窗格中右擊“教程 DW”,然后單擊“將數(shù)據(jù)庫存檔”命令,打開存檔對(duì)話框;(2) 輸入存檔文件(.cab)保存位置及文件名,如 d:Program FilesMicrosoft Analysis ServicesSamples教程.cab,最后點(diǎn)擊<存檔>。OK!圖表 8備份5.2 刪除/還原數(shù)據(jù)倉庫(1) 在要?jiǎng)h除的數(shù)據(jù)倉庫(如“教程 DW”)上右擊,然后選擇“刪除”命令,提示

36、確認(rèn)時(shí)點(diǎn)擊<是>,該數(shù)據(jù)倉庫將被刪除。刪除數(shù)據(jù)倉庫之前最好先存檔!(2) 利用數(shù)據(jù)倉庫的存檔 CAB 文件可將其還原到任一臺(tái)分析服務(wù)器上。具體操作如下:右擊 Analysis Manager 的服務(wù)器名,然后選擇“還原數(shù)據(jù)庫”,在接下來的對(duì)話框中選擇存檔文件,最后點(diǎn)擊 <還原>,稍等,存檔的數(shù)據(jù)倉庫就會(huì)被還原。六、數(shù)據(jù)挖掘1. 任務(wù)描述將通過實(shí)例介紹如何創(chuàng)建用于揭示客戶模式的數(shù)據(jù)挖掘模型。這里將創(chuàng)建一個(gè)數(shù)據(jù)挖掘模型以訓(xùn)練銷售數(shù)據(jù),并使用“ Microsoft 決策樹” 算法在客戶群中找出會(huì)員卡選擇模式。將需要挖掘的維度設(shè)置為客戶,將 Member_Card 屬性設(shè)置為挖

37、掘算法識(shí)別模式的參考信息。然后從人口統(tǒng)計(jì)特征列表中確定模式:婚姻狀況、年收入、在家子女?dāng)?shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠?yàn)g覽樹視圖并從中讀取模式。市場(chǎng)部將根據(jù)這些模式設(shè)計(jì)新的會(huì)員卡,實(shí)際上就是對(duì)會(huì)員卡重新分類2. 創(chuàng)建揭示客戶模式的決策樹挖掘模型(1) 展開“多維數(shù)據(jù)集”文件夾,右擊“ Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?2) 在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“ Microsoft 決策樹”,然后單擊 <下一步>;(3) 在“選擇事例”步驟中,選擇維度為 Customer, 級(jí)別選擇 Lname,然后單擊<下一步>;(4)

38、 在“選擇被預(yù)測(cè)實(shí)體”步驟中,選擇“事例級(jí)別的成員屬性”,并選擇“Member Card”,繼續(xù)單擊<下一步>;(5) 在“選擇訓(xùn)練數(shù)據(jù)”步驟中,取消 Customer 維度的 Country、State Province和 City 聚集成員前的勾,繼續(xù)單擊<下一步>;圖表 9勾選成員(6) 接下來輸入新維度名“ Customer Patterns”, “虛擬多維數(shù)據(jù)集名“ Trained Cube”,繼續(xù)單擊<下一步>;(7) 在最后的步驟輸入模型名“Customer patterns discovery”,并選擇“保存并開始處理”,然后單擊<完成

39、>;圖表 10模型向?qū)?8) 處理完成后,單擊<關(guān)閉>,然后“OLAP 挖掘模型編輯器”將打開,最大化編輯器窗口,右窗格中就能看到生成的決策樹。右窗格分為 4 個(gè)區(qū)域,分別以不同的方式顯示挖掘結(jié)果。3. 決策樹挖掘結(jié)果分析(1) 在“內(nèi)容詳情”窗格的決策樹區(qū)域中,顏色深淺代表“事例”的密度點(diǎn)擊某節(jié)點(diǎn)能從“特性”框查看其出現(xiàn)的事例數(shù),從這里還看到不同類型客戶選擇金、 銀、銅及普通卡的比例(偏好)情況。(2) 樹的第一個(gè)級(jí)別“ yearly income”,說明該屬性的重要性最高(信息增益率最大),其中年收入為 35 萬的人最多。(3) 在右下角設(shè)置“樹顏色基于: Golden”,則可方便地看出偏好選擇金卡的客戶群為:年收入 15 萬以上的已婚簇。從特性框中可以看出其購買金卡的概率達(dá)到45.09%,另外還有 47.4%購買了銀卡。再往下展開決策樹可以看到,購買金卡的主要為已婚簇,未婚簇則購買銀卡為主。(4) 同樣也可以查看其它卡的客戶類型及分布情況。市場(chǎng)部可以根據(jù)上述決策樹挖掘結(jié)果來確定最可能選擇某種類型卡的客戶的特征。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論