《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板_第1頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板_第2頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板_第3頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板_第4頁
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板PAGE1江西理工大學(xué)應(yīng)用科學(xué)學(xué)院《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告題目:某超市數(shù)據(jù)集的OLAP分析及數(shù)據(jù)挖掘系別:班級:姓名:二〇一二年六月《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第1頁。

目錄《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第1頁。一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源 1任務(wù)描述 2建立數(shù)據(jù)倉庫數(shù)據(jù)庫 設(shè)置數(shù)據(jù)源 二、銷售數(shù)據(jù)OLAP分析 任務(wù)描述 設(shè)計星型架構(gòu)多維數(shù)據(jù)集(Sales) 設(shè)計存儲和數(shù)據(jù)集處理 OLAP分析 三、人力資源數(shù)據(jù)OLAP分析 任務(wù)描述 設(shè)計父子維度的多維數(shù)據(jù)集(HR) 修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu) 設(shè)計存儲和數(shù)據(jù)集處理 OLAP分析 四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作 任務(wù)描述 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限 查看元數(shù)據(jù) 創(chuàng)建對策 鉆取 建立遠程Internet連接 五、數(shù)據(jù)倉庫高級操作 任務(wù)描述 創(chuàng)建分區(qū) 創(chuàng)建虛擬多維數(shù)據(jù)集 DTS調(diào)度多維數(shù)據(jù)集處理 備份/還原數(shù)據(jù)倉庫 六、數(shù)據(jù)挖掘 任務(wù)描述 創(chuàng)建揭示客戶模式的決策樹挖掘模型 決策樹挖掘結(jié)果分析 創(chuàng)建聚類挖掘模型 聚類挖掘結(jié)果分析 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型 《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第2頁。瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖 《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第2頁。PAGE14一、建立數(shù)據(jù)倉庫數(shù)據(jù)庫結(jié)構(gòu)和設(shè)置數(shù)據(jù)源1、任務(wù)描述數(shù)據(jù)倉庫數(shù)據(jù)庫是將要在其中存放多維數(shù)據(jù)集、角色、數(shù)據(jù)源、共享維度和挖掘模型的一種結(jié)構(gòu)。然后跟預(yù)先設(shè)置好的ODBC數(shù)據(jù)源建立連接。2、建立數(shù)據(jù)倉庫數(shù)據(jù)庫展開樹視圖的AnalysisServers;單擊服務(wù)器名或右擊選擇連接,與AnalysisServers建立連接;右擊服務(wù)器名,然后單擊“新建數(shù)據(jù)庫”命令;在“數(shù)據(jù)庫”對話框中輸入數(shù)據(jù)庫名“教程DW”,單擊<確定>;3、設(shè)置數(shù)據(jù)源展開剛創(chuàng)建的“教程DW”數(shù)據(jù)庫,可看到如下項目:數(shù)據(jù)源、多維數(shù)據(jù)集、共享維度、挖掘模型、數(shù)據(jù)庫角色右擊“教程DW”數(shù)據(jù)庫下的“數(shù)據(jù)源”文件夾,然后單擊“新數(shù)據(jù)源”命令;在“數(shù)據(jù)鏈接屬性”對話框中,單擊“提供程序”選項卡,選擇“MicrosoftOLEDBProviderforODBCDrivers”;單擊“連接”選項卡,選擇建好的ODBC數(shù)據(jù)源“FoodMart2000”;單擊<確定>按鈕關(guān)閉“數(shù)據(jù)鏈接屬性”對話框圖表SEQ圖表\*ARABIC1連接數(shù)據(jù)源二、銷售數(shù)據(jù)OLAP分析任務(wù)描述《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第3頁。以多維方式建立數(shù)據(jù)模型可簡化聯(lián)機業(yè)務(wù)分析,提高查詢性能。通過創(chuàng)建多維數(shù)據(jù)集,AnalysisManager可將存儲在關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)轉(zhuǎn)換為具有實際含義并且易于查詢的業(yè)務(wù)信息?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第3頁。設(shè)計星型架構(gòu)多維數(shù)據(jù)集(Sales)星型架構(gòu)的多維數(shù)據(jù)集由一個事實數(shù)據(jù)表和鏈接到該事實數(shù)據(jù)表的多個維度表組成。下面針對FoodMart超市1998年的銷售業(yè)務(wù)數(shù)據(jù),建立一個多維數(shù)據(jù)集,以便按產(chǎn)品和顧客2個主題展開分析。具體操作如下:(1)展開樹窗格的“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集”→“向?qū)А辈藛蚊睿蜷_如下“多維數(shù)據(jù)集向?qū)А睂υ捒颉?2)向多維數(shù)據(jù)集添加度量值(事實):(3)單擊<下一步>,在“從數(shù)據(jù)源中選擇事實數(shù)據(jù)表”步驟中,展開“FoodMart”數(shù)據(jù)源,然后單擊“sales_fact_1998”(4)單擊<下一步>,設(shè)置多維數(shù)據(jù)集的度量值列:store_sales、store_cost、unit_sales;(5)單擊<下一步>,建立維度表。單擊<新建維度>,打開“維度向?qū)А睂υ捒?;向多維數(shù)據(jù)集添加時間維:(1)選擇維度類型為“星型架構(gòu):單個維度表”;(2)單擊<下一步>,選擇維度表“time_by_day”;(3)單擊<下一步>,選擇維度類型為“時間維度”;(4)單擊<下一步>,選擇時間級別為“年、季度、月”;(5)單擊<下一步>,單擊<下一步>,輸入時間維名稱:Time,并設(shè)為“共享”方式,單擊<完成>,OK!向多維數(shù)據(jù)集添加產(chǎn)品維:(1)再次單擊<新建維度>,打開“維度向?qū)А睂υ捒颍?2)選擇創(chuàng)建維度的方式為“雪花架構(gòu):多個相關(guān)維度表”;(3)單擊<下一步>,選擇維度表“Product”和“product_class”;(4)單擊<下一步>,查看連接方式,在這里可刪除不要的連接,添加需要的連接;(5)單擊<下一步>,依次選擇product_category、product_subcategory和brand_name三個維度級別;(6)單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列;(7)單擊<下一步>,在“高級選項”步驟中,根據(jù)需要選擇;(8)單擊<下一步>,輸入產(chǎn)品維名稱:Product,并設(shè)為“共享”方式,單擊<完成>,OK!向多維數(shù)據(jù)集添加客戶維度:(1)再次單擊<新建維度>,打開“維度向?qū)А睂υ捒颍?2)選擇創(chuàng)建維度的方式為“星型架構(gòu):單個維度表”;(3)單擊<下一步>,選擇維度表“Customer”;(4)單擊<下一步>,選擇維度類型為“標準維度”;(5)單擊<下一步>,依次選擇Country、State_Province、City和lname四個維度級別;(6)單擊<下一步>,指定成員鍵列步驟中,不需改變主鍵列;(7)單擊<下一步>,在“高級選項”步驟中,根據(jù)需要選擇;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第4頁。(8)單擊<下一步>,輸入客戶維名稱:Customer,并設(shè)為“共享”方式,單擊<完成>,OK!《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第4頁。生成多維數(shù)據(jù)集:(1)回到多維數(shù)據(jù)集向?qū)υ捒颍@里已到了新建的4個維度;(2)單擊<下一步>,在“是否計算事實數(shù)據(jù)表行數(shù)提問時,單擊<是>,開始計算。(3)計算完成后,命名多維數(shù)據(jù)集為:Sales,單擊<完成>,OK!(4)關(guān)閉向?qū)?,隨之啟動多維數(shù)據(jù)集編輯器,其中可看到剛剛創(chuàng)建的多維數(shù)據(jù)集。單擊藍色或黃色的標題欄,對表進行排列,使其符合下圖所示的樣子圖表SEQ圖表\*ARABIC2“Sales多維數(shù)據(jù)集編輯器”窗口設(shè)計存儲和數(shù)據(jù)集處理:設(shè)計好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲模式(MOLAP、ROLAP或HOLAP),并指定要存儲的預(yù)先計算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集。本例選擇MOLAP作為存儲模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計,然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計中的定義計算匯總值。(1)展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計存儲…”菜單命令,彈出“存儲設(shè)計向?qū)А睂υ捒?;也可在多維數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計存儲…”菜單命令,打開“存儲設(shè)計向?qū)А睂υ捒颍?2)單擊<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型;(3)單擊<下一步>,設(shè)置聚合選項為“性能提升達到”,并輸入“40”(4)單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。(5)單擊<下一步>,選擇“立即處理”,并單擊<完成>,系統(tǒng)開始進行數(shù)據(jù)處理,處理聚合一般要花費較長一些時間。(6)處理完成后點擊<關(guān)閉>,回到AnalysisManager窗口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。OLAP分析:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第5頁。聯(lián)機分析處理(OLAP)是使用多維數(shù)據(jù)表達式(稱為多維數(shù)據(jù)集)提供對數(shù)據(jù)倉庫數(shù)據(jù)進行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第5頁。圖表SEQ圖表\*ARABIC3OLAP分析圖三、人力資源數(shù)據(jù)OLAP分析任務(wù)描述:建立一個人力資源(HR)多維數(shù)據(jù)集,以進行雇員工資分析。先把Employee維度創(chuàng)建為父子維度,然后使用該維度以及常規(guī)維度來生成HR多維數(shù)據(jù)集設(shè)計父子維度的多維數(shù)據(jù)集(HR):展開“教程DW”,右擊“共享維度”,選擇“新建維度|向?qū)А辈藛蚊?,打開“新建維度向?qū)А睂υ捒颉螕?lt;下一步>,選擇維度結(jié)構(gòu)為“父子:單個維度表中相關(guān)的兩列”;單擊<下一步>,選擇維度表employee;單擊<下一步>,選擇employee_id為成員鍵,選擇supervisor_id為父鍵列,選擇full_name為成員名。單擊<下一步>,直到最后一步,輸入維度名稱:employee;單擊<完成>,回到維度編輯器。OK!修改多維數(shù)據(jù)集(HR)的結(jié)構(gòu)展開“教程DW”,右擊“多維數(shù)據(jù)集”,選擇“新建多維數(shù)據(jù)集|向?qū)А辈藛蚊睿蜷_多維數(shù)據(jù)集向?qū)υ捒?。點擊<下一步>,選擇salary(工資)作事實數(shù)據(jù)表;點擊<下一步>,選擇salary_paid、vacation_used為度量值列;點擊<下一步>,選擇Employee(雇員)、Store(商店)、Time(時間)作維度;點擊<下一步>,在提示是否計算事實數(shù)據(jù)表行數(shù)時選“是”。最后輸入人力資源多維數(shù)據(jù)集的名稱NR,點擊<完成>,OK!回到編輯器窗口,手工建立time_by_day表到salary表的聯(lián)接,再建立store表到employee表中的聯(lián)接,刪除多余的聯(lián)接。最后如下圖所示。設(shè)計存儲和數(shù)據(jù)集處理《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第6頁。設(shè)計好Sales多維數(shù)據(jù)集的結(jié)構(gòu)之后,需要選擇數(shù)據(jù)的存儲模式(MOLAP、ROLAP或HOLAP),并指定要存儲的預(yù)先計算好的值的數(shù)量,然后用數(shù)據(jù)填充多維數(shù)據(jù)集?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第6頁。本例選擇MOLAP作為存儲模式,創(chuàng)建Sales多維數(shù)據(jù)集的聚合設(shè)計,然后從ODBC源中裝載數(shù)據(jù)并按照聚合設(shè)計中的定義計算匯總值。(1)展開樹窗格,右擊“Sales”多維數(shù)據(jù)集,選擇“設(shè)計存儲…”菜單命令,彈出“存儲設(shè)計向?qū)А睂υ捒颍灰部稍诙嗑S數(shù)據(jù)集編輯窗口中選擇“工具|設(shè)計存儲…”菜單命令,打開“存儲設(shè)計向?qū)А睂υ捒颍?2)單擊<下一步>,然后選擇“MOLAP”作為數(shù)據(jù)存儲類型;(3)單擊<下一步>,設(shè)置聚合選項為“性能提升達到”,并輸入“40”(4)單擊<開始>,完成后可看到“性能與大小”圖,從中可看出增加性能提升對使用額外磁盤空間的需求。圖表SEQ圖表\*ARABIC4性能與大小(5)單擊<下一步>,選擇“立即處理”,并單擊<完成>,系統(tǒng)開始進行數(shù)據(jù)處理,處理聚合一般要花費較長一些時間。(6)處理完成后點擊<關(guān)閉>,回到AnalysisManager窗口。(7)接下來就可瀏覽多維數(shù)據(jù)集的數(shù)據(jù)了。OLAP分析聯(lián)機分析處理(OLAP)是使用多維數(shù)據(jù)表達式(稱為多維數(shù)據(jù)集)提供對數(shù)據(jù)倉庫數(shù)據(jù)進行快速訪問的常用方法。多維數(shù)據(jù)集為維度表中的數(shù)據(jù)和數(shù)據(jù)倉庫中的事實數(shù)據(jù)表建立模型,并為客戶端應(yīng)用程序提供完善的查詢和分析功能。四、數(shù)據(jù)倉庫及多維數(shù)據(jù)集其它操作任務(wù)描述多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對象,以及對這些對象的訪問類型。角色是保護多維數(shù)據(jù)集內(nèi)對象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第7頁。我們要創(chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個數(shù)據(jù)倉庫?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第7頁。 設(shè)置數(shù)據(jù)倉庫及多維數(shù)據(jù)集角色及權(quán)限多維數(shù)據(jù)集角色用于定義可以訪問和查詢多維數(shù)據(jù)集的用戶或組,指出其可以訪問的對象,以及對這些對象的訪問類型。角色是保護多維數(shù)據(jù)集內(nèi)對象和數(shù)據(jù)安全的主要方法,可以在多維數(shù)據(jù)集的不同粒度級別上設(shè)置安全性。要定義安全性必須先創(chuàng)建角色,然后向這些角色授予權(quán)限。本例中,我們要創(chuàng)建Sales和HR角色分別用于訪問多維數(shù)據(jù)集Sales和HR。Management角色用于管理整個數(shù)據(jù)倉庫。具體操作如下:創(chuàng)建多維數(shù)據(jù)集角色:展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色”命令,打開“多維數(shù)據(jù)集角色管理器”;目前還沒角色顯示在角色列表中。點擊<新建…>,打開新建角色對話框,并輸入角色名:Marketing,表示市場部;在“成員資格”選項卡中單擊<添加>按鈕,接著在“添加用戶和組”對話框中,添加該角色的網(wǎng)絡(luò)用戶名(如hzm),單擊<確定>回到新建對話框框框;其它選項可暫不設(shè)定,直接點<確定>,回到角色管理器窗口,角色Marketing就已在列表中了。在這里可以看到各個角色的權(quán)限,也可修改它們的權(quán)限。<關(guān)閉>角色管理器。然后用同樣的方法創(chuàng)建多維數(shù)據(jù)集HR的角色HR。創(chuàng)建數(shù)據(jù)庫角色:數(shù)據(jù)庫角色是可在數(shù)據(jù)庫范圍內(nèi)使用的角色,可指派給該數(shù)據(jù)庫的一個或多個多維數(shù)據(jù)集。本例中我們可以為經(jīng)理創(chuàng)建一個數(shù)據(jù)庫角色,然后將其指派到Sales和HR兩個多維數(shù)據(jù)集。具體操作如下:在“教程DW”數(shù)據(jù)庫下右擊“數(shù)據(jù)庫角色”,然后選擇“管理角色”命令,打開“數(shù)據(jù)庫角色管理器”窗口;這里顯示了“教程DW”數(shù)據(jù)庫中現(xiàn)有角色的列表(包括剛建的Marketing和HR多維數(shù)據(jù)集角色);單擊<新建>,在彈出的對話框中輸入角色名:Management,然后為該角色添加用戶或組(如admin),并勾選多維數(shù)據(jù)集Sales和HR。最后點擊<關(guān)閉>退出 查看元數(shù)據(jù)《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第8頁。元數(shù)據(jù)是關(guān)于數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)的信息,此信息顯示在AnalysisManager右窗格中。《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第8頁。查看多維數(shù)據(jù)集的元數(shù)據(jù):展開“多維數(shù)據(jù)集”文件夾,單擊某多維數(shù)據(jù)集,再單擊右窗格的“元數(shù)據(jù)”;查看維度的元數(shù)據(jù):展開“共享維度”文件夾,單擊一個維度,再單擊右窗格的“元數(shù)據(jù)”。 創(chuàng)建對策對策是指由最終用戶啟動的、在所選多維數(shù)據(jù)集或其某部分上執(zhí)行的操作。AnalysisServices管理員可以定義以下幾種類型的對策:命令行、URL、OLEDB語句或多維表達式(MDX)語句。本例假設(shè)市場部想要針對上一節(jié)中創(chuàng)建的Sales多維數(shù)據(jù)集,能在分析過程的某一點跳轉(zhuǎn)到Internet,以便能夠搜索并找到關(guān)于某個特定客戶的信息。操作步驟如下:(1)展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集,然后選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;(2)右擊“對策”文件夾,然后選擇“新建對策”命令,啟動對策向?qū)?,點擊<下一步>;(3)在“目標”框中選擇“此多維數(shù)據(jù)集中的某一維度”,并單擊“Customer”,點擊<下一步>;(4)保持“對策類型”列表不變,繼續(xù)單擊<下一步>;(5)在“定義對策語法”步驟中鍵入:“/results.asp?q=”+[Customer].,意思是“通過瀏覽器調(diào)用MSN搜索引擎搜索Customer維度中的當前客戶的信息。圖表SEQ圖表\*ARABIC5對策語法圖(6)繼續(xù)單擊<下一步>,輸入對策名稱:CustomerInfo,點擊完成。OK! 鉆取 本例假設(shè)市場部希望對商店和客戶按從上到下進行分析,最終深化到關(guān)系數(shù)據(jù)庫中的事務(wù)級別。為此,我們要在Sales多維數(shù)據(jù)集內(nèi)啟用鉆取,然后瀏覽數(shù)據(jù)并深化到事務(wù)。具體操作如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第9頁。(1)展開“教程DW”數(shù)據(jù)庫,右擊“Sales”多維數(shù)據(jù)集并選擇“編輯”命令,打開多維數(shù)據(jù)集編輯器;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第9頁。(2)單擊“工具|鉆取選項…”菜單命令,打開“鉆取選項”對話框;(3)選擇“啟用鉆取”復(fù)選框,并單擊<全選>以選中所有列,然后單擊<確定>,關(guān)閉對話框;(4)接下來為不同的角色分配鉆取權(quán)限。(5)右擊“Sales”多維數(shù)據(jù)集,并選擇“管理角色…”命令,打開角色管理器;(6)單擊前面創(chuàng)建的“Management”角色,然后在“鉆取”列中單擊<...>按鈕,打開角色權(quán)限設(shè)置對話框;(7)選中“允許鉆取”復(fù)選框,然后單擊<確定>返回角色管理器;這時可看到“Management”角色已獲得鉆取權(quán)。(8)關(guān)閉角色管理器,回到分析管理器,右擊“Sales”多維數(shù)據(jù)集,并選擇“瀏覽數(shù)據(jù)…”命令,打開數(shù)據(jù)瀏覽器;(9)雙擊展開統(tǒng)計列以顯示不同級別的聚集數(shù)據(jù)。右擊某數(shù)據(jù)(如USA→CA→Berkeley的銷售額)并選擇“鉆取”命令,稍等將打開明細數(shù)據(jù)查看窗口,顯示原始數(shù)據(jù)源中的明細數(shù)據(jù)。圖表SEQ圖表\*ARABIC6鉆取建立遠程Internet連接SQLServerAnalysisServices能讓用戶借助客戶端工具,通過Internet連接訪問分析服務(wù)器數(shù)據(jù)庫和多維數(shù)據(jù)集。本示例介紹通過HTTP從Excel連接到分析服務(wù)器并訪問多維數(shù)據(jù)集的操作。具體步驟如下:(1)準備:在分析服務(wù)器上安裝Web服務(wù)(如IIS),從分析服務(wù)器的bin文件夾中復(fù)制Msolap.asp文件到默認站點文件夾(C:\Inetpub\wwwroot)中;(2)啟動客戶端Excel,選擇“數(shù)據(jù)|數(shù)據(jù)透視表和數(shù)據(jù)透視圖報表…”菜單命令;(3)在向?qū)У?步中選擇“外部數(shù)據(jù)源”,然后單擊<下一步>;(4)在向?qū)У牡?步,單擊<獲取數(shù)據(jù)>,打開“選擇數(shù)據(jù)源”對話框,然后選擇“OLAP多維數(shù)據(jù)集”選項卡,并選中“<新數(shù)據(jù)源>”,然后單擊<確定>;(5)在接下來的對話框中,輸入數(shù)據(jù)源名稱:RemoteSales,在驅(qū)動程序列表中選擇“MicrosoftOLEDBProviderforOLAPServices8.0”(6)在接下來的對話框中,選中“分析服務(wù)器”并輸入URL(如http://Localhost,然后單擊<下一步>;(7)從連接到的遠程分析服務(wù)器上選擇數(shù)據(jù)庫列表(如教程DW),然后單擊<完成>,回到上級對話框;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第10頁。(8)選定包含所需數(shù)據(jù)的多維數(shù)據(jù)集(如Sales),然后單擊<確定>,最后一步點擊<完成>,回到Excel工作表;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第10頁。(9)接下來就可以在客戶端電子表格中執(zhí)行OLAP了。 五、數(shù)據(jù)倉庫高級操作任務(wù)描述多維數(shù)據(jù)集的數(shù)據(jù)可以存儲在一個或多個分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時系統(tǒng)會自動為其分配一個默認分區(qū)。合理地將一個邏輯多維數(shù)據(jù)集劃分為多個單獨的物理分區(qū),常??梢愿倪M查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯誤。 創(chuàng)建分區(qū)多維數(shù)據(jù)集的數(shù)據(jù)可以存儲在一個或多個分區(qū)上,在創(chuàng)建多維數(shù)據(jù)集時系統(tǒng)會自動為其分配一個默認分區(qū)。合理地將一個邏輯多維數(shù)據(jù)集劃分為多個單獨的物理分區(qū),常??梢愿倪M查詢的性能,但不正確地分區(qū)也可能導(dǎo)致錯誤。為多維數(shù)據(jù)集創(chuàng)建分區(qū)的步驟如下:(1)展開“Sales”多維數(shù)據(jù)集,右擊“分區(qū)”文件夾,然后選擇“新建分區(qū)”命令,打開分區(qū)向?qū)?,單?lt;下一步>;(2)在“指定數(shù)據(jù)源和事實數(shù)據(jù)表”步驟中,單擊<更改>,然后選擇“FoodMard”數(shù)據(jù)源的sales_fact_1997表,然后單擊<確定>;(3)繼續(xù)單擊<下一步>,在“選擇數(shù)據(jù)切片(可選)”步驟中,選擇“Time”維度,展(4)開“所有Time”級別并選擇1997,繼續(xù)單擊<下一步>;(5)在“指定分區(qū)類型”步驟中,選擇“本地”并單擊<下一步>;(6)輸入分區(qū)名稱:Sales97,并選擇“從現(xiàn)有的分區(qū)(Sales)中復(fù)制聚合設(shè)計”和“完成時處理分區(qū)”,最后單擊<完成>;圖表SEQ圖表\*ARABIC7分區(qū)(7)處理完成后單擊<關(guān)閉>,97年多維數(shù)據(jù)集將位于另一個名為Sales97的分區(qū)上了。將來99、2000、…的數(shù)據(jù)也可分別存儲在不同的分區(qū)上,這樣既便于管理,也可提高查詢的效率,特別對大型數(shù)據(jù)集,效果更加明顯。 創(chuàng)建虛擬多維數(shù)據(jù)集虛擬維度是基于物理維度內(nèi)容的邏輯維度。這些內(nèi)容可以是物理維度中的現(xiàn)有成員屬性,也可以是物理維度的表中的列。使用虛擬維度可基于成員屬性對多維數(shù)據(jù)集數(shù)據(jù)進行分析。其優(yōu)點是不占用磁盤空間或處理時間。下面創(chuàng)建一個帶有YearlyIncome(年收入)成員屬性的虛擬維度,然后將這個新創(chuàng)建的維度添加到Sales多維數(shù)據(jù)集中。操作步驟如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第11頁。右擊“共享維度”文件夾,選擇“新建維度|向?qū)А辈藛蚊?;《?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第11頁。單擊<下一步>,選擇“虛擬維度:另一個維度的成員屬性”,再單擊<下一步>;在“選擇帶有成員屬性的維度”步驟中,單擊“Customer”維度,再單擊<下一步>;在“選擇虛擬維度的級別”步驟中,添加“Lname.YearlyIncome”成員屬性后再單擊<下一步>,在“高級選項”步驟中直接單擊<下一步>;在“完成”步驟中,輸入維度名稱“YearlyIncome”;單擊<完成>。關(guān)閉向?qū)?。新建的虛擬維度“YearlyIncome”已在共享維度列表中了。接下來就可向現(xiàn)有多維數(shù)據(jù)集添加虛擬維度了。 DTS調(diào)度多維數(shù)據(jù)集處理 本例為Sales、HR和ExpenseBudget三多維數(shù)據(jù)集創(chuàng)建自動化過程,確保在每天早上3點鐘從OLTP和ERP導(dǎo)入前一天的新增業(yè)務(wù)數(shù)據(jù)。處理完成后再給管理員和關(guān)鍵用戶發(fā)送電子郵件通知他們處理任務(wù)已順利完成。具體操作如下:(1)選擇“開始|程序|MicrosoftSQLServer|企業(yè)管理器”菜單命令,啟動SQLServer企業(yè)管理器;(2)逐級展開,直到看到“數(shù)據(jù)轉(zhuǎn)換服務(wù)”文件夾下的“本地包”,右擊“本地包”并選擇“新建包”命令,打開DTS包窗口,接下來為2個多維數(shù)據(jù)集定義處理任務(wù);(3)點擊DTS包窗口的左窗格中的“AnalysisServices處理任務(wù)”圖標,并將其拖動到空白窗格中,彈出“AnalysisServices處理任務(wù)”對話框;(4)在對話框中,給第1個任務(wù)輸入名稱為Sales,并輸入相應(yīng)的描述,如Sales任務(wù);展開樹窗格的“教程DW”數(shù)據(jù)倉庫,單擊“Sales”多維數(shù)據(jù)集,然后在右窗格選擇處(5)理選項,選擇“完整處理”;(6)同樣的方法為“HR”多維數(shù)據(jù)集創(chuàng)建另1個處理任務(wù):HR任務(wù);(7)接下來指定任務(wù)執(zhí)行的順序:按住<Ctrl>鍵,依次選擇Sales任務(wù)和HR任務(wù),然后選擇“工作流|完成時”菜單命令;(8)將左窗格中的“發(fā)送電子郵件”圖標拖至右窗格中,彈出“發(fā)送郵件任務(wù)屬性”對話框,設(shè)置好相關(guān)參數(shù)后點<確定>,然后設(shè)置其處理順序。最后以“Cubes處理”為名保存該包。(9)回到企業(yè)管理器窗口,剛創(chuàng)建的包位于“本地包”文件夾中,接下來要為該包設(shè)置執(zhí)行時間;(10)右擊“Cube處理”包,選擇“調(diào)度包…”命令,彈出“作業(yè)調(diào)度”對話框;在“每月”頻率下,設(shè)置“第末一天,每1個月”,在“每日頻率”下設(shè)置:“一次發(fā)生于:3:00:00AM”,單擊<確定>;(11)至此,多維數(shù)據(jù)集定期處理任務(wù)已定制完成,可以退出企業(yè)管理器了。OK!備份/還原數(shù)據(jù)倉庫5.1以下3種情況可能需要對數(shù)據(jù)倉庫進行存檔:5.1.1創(chuàng)建數(shù)據(jù)倉庫的壓縮備份;(1)數(shù)據(jù)倉庫不再用于日常分析了,先存檔后刪除,以后需要時還可還原;(2)將數(shù)據(jù)倉庫從一臺服務(wù)器復(fù)制到另一臺服務(wù)器。5.1.2具體操作如下:《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第12頁。(1)在AnalysisManager樹窗格中右擊“教程DW”,然后單擊“將數(shù)據(jù)庫存檔”命令,打開存檔對話框;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第12頁。(2)輸入存檔文件(.cab)保存位置及文件名,如d:\ProgramFiles\MicrosoftAnalysisServices\Samples\教程.cab,最后點擊<存檔>。OK!圖表SEQ圖表\*ARABIC8備份5.2刪除/還原數(shù)據(jù)倉庫(1)在要刪除的數(shù)據(jù)倉庫(如“教程DW”)上右擊,然后選擇“刪除”命令,提示確認時點擊<是>,該數(shù)據(jù)倉庫將被刪除。刪除數(shù)據(jù)倉庫之前最好先存檔!(2)利用數(shù)據(jù)倉庫的存檔CAB文件可將其還原到任一臺分析服務(wù)器上。具體操作如下:右擊AnalysisManager的服務(wù)器名,然后選擇“還原數(shù)據(jù)庫…”,在接下來的對話框中選擇存檔文件,最后點擊<還原>,稍等,存檔的數(shù)據(jù)倉庫就會被還原。 六、數(shù)據(jù)挖掘任務(wù)描述將通過實例介紹如何創(chuàng)建用于揭示客戶模式的數(shù)據(jù)挖掘模型。這里將創(chuàng)建一個數(shù)據(jù)挖掘模型以訓(xùn)練銷售數(shù)據(jù),并使用“Microsoft決策樹”算法在客戶群中找出會員卡選擇模式。將需要挖掘的維度設(shè)置為客戶,將Member_Card屬性設(shè)置為挖掘算法識別模式的參考信息。然后從人口統(tǒng)計特征列表中確定模式:婚姻狀況、年收入、在家子女數(shù)和教育程度。下一步需要訓(xùn)練模型,以便能夠瀏覽樹視圖并從中讀取模式。市場部將根據(jù)這些模式設(shè)計新的會員卡,實際上就是對會員卡重新分類 創(chuàng)建揭示客戶模式的決策樹挖掘模型(1)展開“多維數(shù)據(jù)集”文件夾,右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?2)在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft決策樹”,然后單擊<下一步>;(3)在“選擇事例”步驟中,選擇維度為Customer,級別選擇Lname,然后單擊<下一步>;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第13頁。(4)在“選擇被預(yù)測實體”步驟中,選擇“事例級別的成員屬性”,并選擇“MemberCard”,繼續(xù)單擊<下一步>;《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第13頁。(5)在“選擇訓(xùn)練數(shù)據(jù)”步驟中,取消Customer維度的Country、StateProvince和City聚集成員前的勾√,繼續(xù)單擊<下一步>;圖表SEQ圖表\*ARABIC9勾選成員(6)接下來輸入新維度名“CustomerPatterns”,“虛擬多維數(shù)據(jù)集名“TrainedCube”,繼續(xù)單擊<下一步>;(7)在最后的步驟輸入模型名“Customerpatternsdiscovery”,并選擇“保存并開始處理”,然后單擊<完成>;圖表SEQ圖表\*ARABIC10模型向?qū)?8)處理完成后,單擊<關(guān)閉>,然后“OLAP挖掘模型編輯器”將打開,最大化編輯器窗口,右窗格中就能看到生成的決策樹。右窗格分為4個區(qū)域,分別以不同的方式顯示挖掘結(jié)果。 決策樹挖掘結(jié)果分析 (1)在“內(nèi)容詳情”窗格的決策樹區(qū)域中,顏色深淺代表“事例”的密度點擊某節(jié)點能從“特性”框查看其出現(xiàn)的事例數(shù),從這里還看到不同類型客戶選擇金、銀、銅及普通卡的比例(偏好)情況。(2)樹的第一個級別“yearlyincome”,說明該屬性的重要性最高(信息增益率最大),其中年收入為3~5萬的人最多。(3)在右下角設(shè)置“樹顏色基于:Golden”,則可方便地看出偏好選擇金卡的客戶群為:年收入15萬以上的已婚簇。從特性框中可以看出其購買金卡的概率達到45.09%,另外還有47.4%購買了銀卡。再往下展開決策樹可以看到,購買金卡的主要為已婚簇,未婚簇則購買銀卡為主。(4)同樣也可以查看其它卡的客戶類型及分布情況?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第14頁。市場部可以根據(jù)上述決策樹挖掘結(jié)果來確定最可能選擇某種類型卡的客戶的特征。根據(jù)這些特征(年收入、子女數(shù)、婚姻狀況等),可以重新定義會員卡服務(wù)和方案,以便更好地針對其客戶?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第14頁。創(chuàng)建聚類挖掘模型目標:通過創(chuàng)建聚類挖掘模型將客戶群劃分為不同的邏輯簇。操作步驟如下:(1)右擊“Sales”多維數(shù)據(jù)集,然后選擇“新建挖掘模型”命令,打開新建挖掘模型向?qū)В?2)在“選擇數(shù)據(jù)挖掘技術(shù)”步驟中,選擇“Microsoft聚集”,單擊<下一步>;在“選擇事例”步驟中,選擇維度“Customer”,級別為“Lname”,單擊<下一步>;(3)在“選擇訓(xùn)練數(shù)據(jù)”步聚中,清除“Customer”維度的Country、StateProvince和City復(fù)選框(因為沒有必要使用匯總級別劃分客戶群),然后在“度量值”維度中選擇“StoreSales”,單擊<下一步>;(4)輸入挖掘模型的名稱“Customersegmentation”,選中“保存,但現(xiàn)在不處理”,然后單擊<完成>。 聚類挖掘結(jié)果分析通過分析,市場部可以知道:Cluster1主要由中等收入的客戶構(gòu)成,而且全部為單身,每年在FoodMart商店平均花費72.42美元,由此可進一步采取有針對的營銷策略。同樣可找出Cluster2和Cluster3中的客戶特征。 創(chuàng)建基于關(guān)系數(shù)據(jù)表的決策樹挖掘模型通過建立基于關(guān)系數(shù)據(jù)表的挖掘模型,可以挖掘出更詳細的信息。具體操作如下:(1)右擊“挖掘模型”文件夾,然后選擇“新建挖掘模型”命令,打開挖掘模型向?qū)В?2)單擊<下一步>,在“選擇源類型”步驟中,單擊“關(guān)系數(shù)據(jù)”,繼續(xù)單擊<下一步>;(3)在“選擇事例表”步驟中,單擊“單個表包含數(shù)據(jù)”并選擇“Customer”,然后單擊<下一步>;(4)選擇挖掘技術(shù)為“Microsoft決策樹”,繼續(xù)<下一步>;(5)選擇“事例鍵列”為“customer_id”,繼續(xù)<下一步>; 瀏覽“相關(guān)性網(wǎng)絡(luò)”視圖《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第15頁。相關(guān)性網(wǎng)絡(luò)是Microsoft決策樹另一視圖模型,是對樹瀏覽器的補充。樹瀏覽器可以使觀察者的注意力集中在單個特性的詳細關(guān)系上,而相關(guān)性網(wǎng)絡(luò)則顯示所有特性的高級關(guān)系,給出數(shù)據(jù)中相關(guān)性的俯視圖?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第15頁。圖表SEQ圖表\*ARABIC11相關(guān)性瀏覽視圖《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》課程設(shè)計報告模板全文共18頁,當前為第16頁?!稊?shù)據(jù)倉庫與數(shù)據(jù)挖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論