版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)倉(cāng)庫(kù)建模方法論........數(shù)據(jù)倉(cāng)庫(kù)建模方法論....1
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....2數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的兩位大師BillInmon數(shù)據(jù)倉(cāng)庫(kù)之父,數(shù)據(jù)倉(cāng)庫(kù)概念的創(chuàng)始人理論:CorporateInformationFactory(CIF)主要著作:《數(shù)據(jù)倉(cāng)庫(kù)》、《企業(yè)信息工廠》主要著作:《數(shù)據(jù)倉(cāng)庫(kù)工具箱-維度建模的完全指南》、《數(shù)據(jù)倉(cāng)庫(kù)生命周期工具箱-設(shè)計(jì)、開發(fā)和部署數(shù)據(jù)倉(cāng)庫(kù)的專家方法》RalphKimball數(shù)據(jù)倉(cāng)庫(kù)方面的知名學(xué)者理論:MutildimensionalArchitecture(MD)
........數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的兩位大師BillInmon主要著作:《數(shù)據(jù)倉(cāng)3企業(yè)數(shù)據(jù)倉(cāng)庫(kù)EDW企業(yè)數(shù)據(jù)倉(cāng)庫(kù)定義:詳細(xì)交易及相關(guān)業(yè)務(wù)數(shù)據(jù)的集合包含必要的內(nèi)部與外部信息來(lái)自于多個(gè)數(shù)據(jù)源/業(yè)務(wù)操作系統(tǒng)保存一定的時(shí)間周期按照企業(yè)內(nèi)業(yè)務(wù)規(guī)則所決定的模型來(lái)存儲(chǔ)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)作用:基于數(shù)據(jù)/信息來(lái)回答相關(guān)的業(yè)務(wù)問(wèn)題和提供決策支持,并確保:一致、集成的數(shù)據(jù)存儲(chǔ)任意的數(shù)據(jù)粒度在整個(gè)企業(yè)的業(yè)務(wù)范圍保持企業(yè)內(nèi)一致的信息視圖企業(yè)內(nèi)一致的信息視圖(SingleVersionoftheTruth)>集成的企業(yè)信息(Integratedcorporateinformation)>不針對(duì)特定應(yīng)用(Applicationneutral)>無(wú)冗余(Nonredundant)>用于報(bào)表和決策支持(Reportinganddecisionmaking)最詳細(xì)的數(shù)據(jù)和信息(DetailedData)任何時(shí)候,針對(duì)任意數(shù)據(jù),提出任意業(yè)務(wù)問(wèn)題(Askanyquestion,anydata,anytime)........企業(yè)數(shù)據(jù)倉(cāng)庫(kù)EDW企業(yè)數(shù)據(jù)倉(cāng)庫(kù)定義:企業(yè)數(shù)據(jù)倉(cāng)庫(kù)作用:企業(yè)內(nèi)4數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)........數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)....5企業(yè)信息工廠........企業(yè)信息工廠....6數(shù)據(jù)倉(cāng)庫(kù)總線........數(shù)據(jù)倉(cāng)庫(kù)總線....7企業(yè)總線........企業(yè)總線....8總線架構(gòu)矩陣........總線架構(gòu)矩陣....9多維體系結(jié)構(gòu)與企業(yè)信息工廠體系結(jié)構(gòu)比較方面多維體系結(jié)構(gòu)企業(yè)信息工廠體系結(jié)構(gòu)范圍優(yōu)先考慮業(yè)務(wù)單位范圍優(yōu)先考慮企業(yè)總體范圍角度關(guān)心業(yè)務(wù)部門的需求多維建模師以企業(yè)視角,建立一致性維度。從企業(yè)角度解決供應(yīng)源數(shù)據(jù)的問(wèn)題,但并不是整個(gè)企業(yè)的數(shù)據(jù)必須在項(xiàng)目第一個(gè)階段都處理。相反而是選擇企業(yè)所有數(shù)據(jù)的一個(gè)子集。數(shù)據(jù)流實(shí)施方法采用自底向上的:如何快速的獲取由用戶控制的業(yè)務(wù)部門專有的數(shù)據(jù),并最小限度的考慮整個(gè)企業(yè)的使用快速需求收集和實(shí)現(xiàn)過(guò)程使得為整個(gè)環(huán)境提供一致而可靠數(shù)據(jù)的任務(wù)變得復(fù)雜。實(shí)施方法是自頂向下的:企業(yè)數(shù)據(jù)利用業(yè)務(wù)需求將數(shù)據(jù)從數(shù)據(jù)源推至需要這些數(shù)據(jù)的地方,其核心問(wèn)題是從最初的項(xiàng)目開始為任何數(shù)據(jù)集市的使用而集成企業(yè)數(shù)據(jù)。為了制定盡可能在整個(gè)企業(yè)范圍內(nèi)一致的主題域和業(yè)務(wù)數(shù)據(jù)需要增加模型開銷,需要更多的時(shí)間和代價(jià)。但后續(xù)項(xiàng)目則需要較少時(shí)間和代價(jià),尤其對(duì)于使用現(xiàn)有的、健全的主題域的業(yè)務(wù)單位更是如此。實(shí)現(xiàn)對(duì)存儲(chǔ)空間最小需求,非冗余方式防止了在多個(gè)位置存儲(chǔ)數(shù)據(jù)。這種特性使更新或刪除異常最小化或者消除。易失性聚集數(shù)據(jù)集市:當(dāng)業(yè)務(wù)過(guò)程發(fā)生變化,為了消除或減少對(duì)事實(shí)表重建,需要增加新的維或改變維。原子數(shù)據(jù)集市:由于事實(shí)表可能包含幾億甚至更多的數(shù)據(jù),重建將會(huì)帶來(lái)嚴(yán)重后果數(shù)據(jù)倉(cāng)庫(kù)模型是與過(guò)程無(wú)關(guān)的,它摒棄了由于處理過(guò)程影響而帶來(lái)的變化數(shù)據(jù)倉(cāng)庫(kù)模型的設(shè)計(jì)依賴于企業(yè)的業(yè)務(wù)規(guī)則,而不依賴與在其上將運(yùn)行什么查詢。如果一個(gè)已經(jīng)建好的數(shù)據(jù)集市需要改變或加強(qiáng),可以根據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的細(xì)節(jié)數(shù)據(jù)合理且快速地進(jìn)行重建靈活性多維設(shè)計(jì)是很多業(yè)務(wù)過(guò)程聚集在一起的結(jié)果。當(dāng)處理請(qǐng)求發(fā)生變化時(shí),多維數(shù)據(jù)庫(kù)的設(shè)計(jì)未必能夠適度地變化。數(shù)據(jù)倉(cāng)庫(kù)模型存放數(shù)據(jù)粒度級(jí)別為原子級(jí)別,原子級(jí)別可以任意組合。故可以支持將來(lái)未知需求。復(fù)雜性數(shù)據(jù)集市模型易于業(yè)務(wù)人員理解??梢院苋菀讟?gòu)建數(shù)據(jù)集市,然而,當(dāng)一個(gè)一個(gè)地建立數(shù)據(jù)集市時(shí),由于數(shù)據(jù)的企業(yè)視圖的復(fù)雜性,對(duì)于這種結(jié)構(gòu),完成更新時(shí)相當(dāng)復(fù)雜的。數(shù)據(jù)倉(cāng)庫(kù)中的細(xì)節(jié)數(shù)據(jù)是與處理過(guò)程無(wú)關(guān)的,因此數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型使得數(shù)據(jù)不一致的風(fēng)險(xiǎn)最小。功能性為多維處理提供了理想環(huán)境,切片和切塊、上鉆和下鉆等查詢提供良好的性能支持?jǐn)?shù)據(jù)挖掘、統(tǒng)計(jì)分析和即席查詢持續(xù)維護(hù)總體目標(biāo)是防止由于環(huán)境的后續(xù)構(gòu)建、調(diào)整和優(yōu)化而產(chǎn)生的高昂的代價(jià)。一個(gè)良好的數(shù)據(jù)倉(cāng)庫(kù)模型將為企業(yè)提供長(zhǎng)久的服務(wù),將提供如下回報(bào):整個(gè)環(huán)境端到端一致性和集成性易于建立新的數(shù)據(jù)集市加強(qiáng)現(xiàn)有數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)和有關(guān)數(shù)據(jù)集市的維護(hù)和可持續(xù)發(fā)展........多維體系結(jié)構(gòu)與企業(yè)信息工廠體系結(jié)構(gòu)比較方面多維體系結(jié)構(gòu)企業(yè)信10OLTP與OLAP針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和數(shù)據(jù)分析技術(shù)滿足對(duì)數(shù)據(jù)進(jìn)行多角度、快速、一致、交互、深入觀察使用預(yù)定義的多維數(shù)據(jù)視圖對(duì)數(shù)據(jù)進(jìn)行分析處理,支持對(duì)數(shù)據(jù)的切片、切塊、鉆取。多維數(shù)據(jù)庫(kù)是一種以多維數(shù)據(jù)存儲(chǔ)形式來(lái)組織數(shù)據(jù)的數(shù)據(jù)管理系統(tǒng),在使用時(shí)需要將數(shù)據(jù)從關(guān)系數(shù)據(jù)庫(kù)中轉(zhuǎn)載到多維數(shù)據(jù)庫(kù)中方可訪問(wèn)。也稱為面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計(jì)算中心進(jìn)行處理,并在很短的時(shí)間內(nèi)給出處理結(jié)果。這樣做的最大優(yōu)點(diǎn)是可以即時(shí)地處理輸入的數(shù)據(jù),及時(shí)地回答。也稱為實(shí)時(shí)系統(tǒng)(RealtimeSystem)。衡量聯(lián)機(jī)事務(wù)處理系統(tǒng)的一個(gè)重要性能指標(biāo)是系統(tǒng)性能,具體體現(xiàn)為實(shí)時(shí)響應(yīng)時(shí)間(ResponseTime),即用戶在終端上送入數(shù)據(jù)之后,到計(jì)算機(jī)對(duì)這個(gè)請(qǐng)求給出答復(fù)所需要的時(shí)間。
OLTP數(shù)據(jù)庫(kù)旨在使事務(wù)應(yīng)用程序僅寫入所需的數(shù)據(jù),以便盡快處理單個(gè)事務(wù)。On-LineAnalyticalProcessingOn-LineTransactionProcessing........OLTP與OLAP針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和數(shù)據(jù)分析技術(shù)11OLTP與OLAPOLTPOLAP用戶操作人員,低層管理人員決策人員,高級(jí)管理人員功能日常操作處理分析決策DB設(shè)計(jì)面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的,最新的細(xì)節(jié)的,二維的歷史的,聚集的,多維的集成的,統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬(wàn)條記錄工作單位簡(jiǎn)單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個(gè)上百個(gè)DB大小100MB-GB100GB-TBROLAP表示基于關(guān)系數(shù)據(jù)庫(kù)的OLAP實(shí)現(xiàn)(RelationalOLAP)MOLAP表示基于多維數(shù)據(jù)組織的OLAP實(shí)現(xiàn)(MultidimensionalOLAP)........OLTP與OLAPOLTPOLAP用戶操作人員,低層管理人員12ROLAPMOLAP沿用現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)技術(shù)專用技術(shù)響應(yīng)速度相對(duì)molap要慢性能好,響應(yīng)速度快數(shù)據(jù)轉(zhuǎn)載計(jì)算速度快數(shù)據(jù)轉(zhuǎn)載速度慢存儲(chǔ)空間耗費(fèi)小,維數(shù)沒(méi)有限制需要進(jìn)行預(yù)計(jì)算,可能導(dǎo)致數(shù)據(jù)爆炸,維數(shù)有限,無(wú)法支持維的動(dòng)態(tài)變化借助rdbms對(duì)數(shù)據(jù)存儲(chǔ),無(wú)文件大小限制受操作系統(tǒng)平臺(tái)文件大小限制,難以達(dá)到tb級(jí)可以通過(guò)sql語(yǔ)句實(shí)現(xiàn)詳細(xì)數(shù)據(jù)和概要數(shù)據(jù)的存儲(chǔ)缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問(wèn)的標(biāo)準(zhǔn)不支持預(yù)計(jì)算的讀寫操作無(wú)法完成維之間的運(yùn)算無(wú)法完成多行計(jì)算支持高性能的決策支持計(jì)算復(fù)雜的跨維計(jì)算多用戶讀寫操作行級(jí)計(jì)算ROLAP
vsMOLAP........ROLAPMOLAP沿用現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)技術(shù)專用技術(shù)響應(yīng)速度相13
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....14數(shù)據(jù)架構(gòu)形態(tài)........數(shù)據(jù)架構(gòu)形態(tài)....15各數(shù)據(jù)架構(gòu)比較........各數(shù)據(jù)架構(gòu)比較....16源系統(tǒng)ODSEDW獨(dú)立數(shù)據(jù)集市DataMart#1DataMart#2Non-conformedDimensionsandFacts從屬數(shù)據(jù)集市DataMart#1DataMart#2ConformedDimensionsandConformedFactsDataMart數(shù)據(jù)集市類型........源系統(tǒng)ODSEDW獨(dú)立數(shù)據(jù)集市DataMart#1Dat17活期存款定期存款零售信貸公司信貸債券投資票據(jù)信息同業(yè)拆借儲(chǔ)蓄國(guó)債衍生品儲(chǔ)蓄國(guó)債參與者交易流水會(huì)計(jì)單元理財(cái)產(chǎn)品風(fēng)險(xiǎn)緩釋市場(chǎng)數(shù)據(jù)計(jì)量結(jié)果公共信息數(shù)據(jù)挖掘模型風(fēng)險(xiǎn)引擎數(shù)據(jù)接口星型模型報(bào)表模型多維分析模型風(fēng)險(xiǎn)計(jì)算引擎信用風(fēng)險(xiǎn)績(jī)效衡量和資本分配合規(guī)性與披露市場(chǎng)風(fēng)險(xiǎn)操作風(fēng)險(xiǎn)流動(dòng)性風(fēng)險(xiǎn)防欺詐和反洗錢EnterpriseDateWarehouseODS風(fēng)險(xiǎn)計(jì)量結(jié)果返回ODS多維分析匯總層應(yīng)用層監(jiān)管報(bào)表風(fēng)險(xiǎn)數(shù)據(jù)集市數(shù)據(jù)架構(gòu)........活期存款定期存款零售信貸公司信貸債券投資票據(jù)信息同業(yè)拆借儲(chǔ)蓄18風(fēng)險(xiǎn)數(shù)據(jù)集市建設(shè)目標(biāo)........風(fēng)險(xiǎn)數(shù)據(jù)集市建設(shè)目標(biāo)....19
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)模型
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....20為什么需要邏輯數(shù)據(jù)模型為復(fù)雜的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)實(shí)施提供了規(guī)范和基礎(chǔ)結(jié)構(gòu)-藍(lán)圖促進(jìn)業(yè)務(wù)部門用戶和IT分析人員之間的有效溝通明確業(yè)務(wù)需求解決業(yè)務(wù)問(wèn)題形成對(duì)重要業(yè)務(wù)定義和術(shù)語(yǔ)的統(tǒng)一認(rèn)識(shí)具備跨部門,能夠表達(dá)所有的業(yè)務(wù)........為什么需要邏輯數(shù)據(jù)模型為復(fù)雜的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)實(shí)施提供了規(guī)范和基21
技術(shù)緩沖層ETL專用的純技術(shù)層完全與源系統(tǒng)結(jié)構(gòu)一致近源模型層基本依照源系統(tǒng)建模盡量保持業(yè)務(wù)系統(tǒng)原貌整合模型層面向整合主題設(shè)計(jì)提供規(guī)范和共享應(yīng)用集市層面向應(yīng)用按需定制多維建模匯總數(shù)據(jù)核心系統(tǒng)對(duì)公信貸票據(jù)系統(tǒng)儲(chǔ)蓄國(guó)債市場(chǎng)數(shù)據(jù)核心系統(tǒng)對(duì)公信貸票據(jù)系統(tǒng)儲(chǔ)蓄國(guó)債市場(chǎng)數(shù)據(jù)…..…..復(fù)雜交易復(fù)雜交易數(shù)據(jù)挖掘模型風(fēng)險(xiǎn)引擎數(shù)據(jù)接口星型模型報(bào)表模型多維分析模型匯總層當(dāng)事人財(cái)務(wù)產(chǎn)品資產(chǎn)事件內(nèi)部機(jī)構(gòu)協(xié)議計(jì)量結(jié)果市場(chǎng)數(shù)據(jù)LDM在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的地位........技術(shù)緩沖層ETL專用的純22ODSEDWDataMartDataMining目標(biāo)?短期的,細(xì)節(jié)的,同源的數(shù)據(jù)存儲(chǔ);?直接提供基于源系統(tǒng)結(jié)構(gòu)的簡(jiǎn)單原貌訪問(wèn);?為BI環(huán)境中適合的業(yè)務(wù)需求提供支持?長(zhǎng)期的,細(xì)節(jié)的,整合的數(shù)據(jù)存儲(chǔ);?為BI環(huán)境中適合的業(yè)務(wù)需求提供支持
?服務(wù)特定應(yīng)用
?長(zhǎng)期歷史分析性指標(biāo)匯總?為企業(yè)提供預(yù)測(cè)性、趨勢(shì)分析性需求提供支持原則?簡(jiǎn)單處理,不考慮整合;?關(guān)注保留策略;
?面向全局,數(shù)據(jù)整合?中性設(shè)計(jì),靈活擴(kuò)展?提供規(guī)范和共享?面向具體應(yīng)用?按需設(shè)計(jì)
?針對(duì)業(yè)務(wù)目標(biāo)、挖掘算法設(shè)計(jì)數(shù)據(jù)模型形式?偏源系統(tǒng)模型;?根據(jù)支持應(yīng)用情況可以保留短期歷史?面向主題設(shè)計(jì);?偏范式化;?長(zhǎng)期保留歷史
?形式各異,依具體應(yīng)用不同;
?一條記錄表示一個(gè)觀測(cè)?多條記錄表示一個(gè)觀測(cè)重點(diǎn)?理解源結(jié)構(gòu)
?主題定義?框架設(shè)計(jì)?整合策略?實(shí)施方法?整體性?一致性?業(yè)務(wù)理解?數(shù)據(jù)理解?數(shù)據(jù)準(zhǔn)備用途?業(yè)務(wù)原貌查詢?即時(shí)報(bào)表?數(shù)據(jù)質(zhì)量檢查?靈活查詢?整合規(guī)則檢查?特定應(yīng)用?特定業(yè)務(wù)專題設(shè)計(jì)思路比較........ODSEDWDataMartDataMining目標(biāo)?短23EDW邏輯數(shù)據(jù)模型設(shè)計(jì)目標(biāo)中性的,共享的:不針對(duì)某個(gè)特別的應(yīng)用而設(shè)計(jì);靈活的,可擴(kuò)展的:存放最詳盡的歷史數(shù)據(jù),業(yè)務(wù)發(fā)生變化時(shí)易于擴(kuò)展,適應(yīng)復(fù)雜的實(shí)際業(yè)務(wù)情況;穩(wěn)定的,經(jīng)得起考驗(yàn)的:能夠在很長(zhǎng)時(shí)間內(nèi)保持穩(wěn)定性,回答不斷產(chǎn)生、不斷變化且無(wú)法預(yù)先定義的業(yè)務(wù)問(wèn)題;規(guī)范的,易懂的:使用業(yè)務(wù)語(yǔ)言進(jìn)行模型設(shè)計(jì),易于讓業(yè)務(wù)人員理解和使用,有助于IT和業(yè)務(wù)部門人員的溝通........EDW邏輯數(shù)據(jù)模型設(shè)計(jì)目標(biāo)...2425邏輯視圖(第三級(jí))細(xì)節(jié)(第三級(jí))主題區(qū)域(第一級(jí))概念(第二級(jí))邏輯數(shù)據(jù)模型的不同級(jí)別........25邏輯視圖細(xì)節(jié)主題區(qū)域概念邏輯數(shù)據(jù)模型的不同級(jí)別...25邏輯數(shù)據(jù)模型的主題域........邏輯數(shù)據(jù)模型的主題域....26主題域模型案例-市場(chǎng)風(fēng)險(xiǎn)數(shù)據(jù)集市........主題域模型案例-市場(chǎng)風(fēng)險(xiǎn)數(shù)據(jù)集市...27主題域模型案例-信用卡數(shù)據(jù)集市........主題域模型案例-信用卡數(shù)據(jù)集市...28主題域模型優(yōu)點(diǎn)
指導(dǎo)業(yè)務(wù)數(shù)據(jù)模型開發(fā)有助于數(shù)據(jù)一致性,避免冗余。當(dāng)確定一個(gè)新的實(shí)體時(shí),基于定義可以確定實(shí)體的恰當(dāng)?shù)刂黝}域。根據(jù)主題域劃分工作量,可使重復(fù)工作量最小化,并有利于相互協(xié)調(diào)指導(dǎo)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目選擇為基于數(shù)據(jù)的項(xiàng)目分組提供了一種高層次劃分方法。在確定項(xiàng)目開發(fā)順序時(shí),應(yīng)該同時(shí)考慮業(yè)務(wù)優(yōu)先級(jí)、技術(shù)實(shí)現(xiàn)難度、人員可用性等信息指導(dǎo)數(shù)據(jù)倉(cāng)庫(kù)開發(fā)有助于確定哪些相關(guān)的業(yè)務(wù)專家主題域模型目標(biāo)
提供廣泛的理解提供對(duì)每一個(gè)主題域的理解,包括各個(gè)主題域的名稱和定義,通過(guò)業(yè)務(wù)規(guī)則將這些主題域聯(lián)系起來(lái),形象地表達(dá)這些主題之間依賴關(guān)系和規(guī)則。因?yàn)樵谥黝}域?qū)哟?,所以,主題域模型更容易覆蓋廣泛的領(lǐng)域。業(yè)務(wù)規(guī)則使主題域模型增加更多的準(zhǔn)確性和清晰性。
確定范圍通過(guò)形象地表達(dá)主題域和他們的業(yè)務(wù)規(guī)則,我們能夠更容易地識(shí)別出將要分析的模型的范圍。
指引方向主題域模型能夠提供全景視圖,可以幫助我們確定:計(jì)劃中的應(yīng)用程序和現(xiàn)有的應(yīng)用程序?qū)⒃鯓庸泊?。下一步,企業(yè)將需要什么樣新功能。主題域模型提供方向和指南。建立對(duì)業(yè)務(wù)的高層次理解,為邏輯數(shù)據(jù)分析和建模打下基礎(chǔ)主題域模型........主題域模型優(yōu)點(diǎn)主題域模型目標(biāo)主題域模型...29概念模型........概念模型....30影響數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別的主要因素匯總數(shù)據(jù)匯總數(shù)據(jù)能夠改善數(shù)據(jù)交付處理性能,匯總數(shù)據(jù)不會(huì)節(jié)省存儲(chǔ)空間,因?yàn)閯?chuàng)建匯總的細(xì)節(jié)可能會(huì)繼續(xù)被保留。匯總提供的好處主要包括:在線存儲(chǔ)需求減少
分析的標(biāo)準(zhǔn)化以及數(shù)據(jù)交付性能的改善合并實(shí)體通過(guò)減少連接操作的數(shù)量,提高了數(shù)據(jù)交付處理的性能,并且可以增強(qiáng)一致性。分離數(shù)據(jù)根據(jù)穩(wěn)定性和用法來(lái)分離數(shù)據(jù)。穩(wěn)定性分析根據(jù)各個(gè)數(shù)據(jù)屬性是否經(jīng)常變化的特性將這些屬性進(jìn)行分組。影響因素描述當(dāng)前業(yè)務(wù)需求粒度級(jí)別必須足以回答定位在該數(shù)據(jù)倉(cāng)庫(kù)迭代范圍內(nèi)的每一個(gè)業(yè)務(wù)問(wèn)題。提供高的粒度級(jí)別增加了數(shù)據(jù)倉(cāng)庫(kù)和項(xiàng)目的開發(fā)成本,如果業(yè)務(wù)不需要細(xì)節(jié),則增加的成本就沒(méi)有商業(yè)價(jià)值。未來(lái)業(yè)務(wù)需求按照目前明確需求建立數(shù)據(jù)倉(cāng)庫(kù),但在建立并抽取數(shù)據(jù)時(shí)要適應(yīng)考慮未來(lái)的需求數(shù)據(jù)挖掘需求數(shù)據(jù)挖掘算法需要細(xì)節(jié)級(jí)明細(xì)數(shù)據(jù)派生數(shù)據(jù)需求派生數(shù)據(jù)在計(jì)算時(shí)使用了其它的數(shù)據(jù)元素,除非在代價(jià)和開發(fā)時(shí)間方面有很大增長(zhǎng),否則所選的粒度級(jí)別應(yīng)該適用于存儲(chǔ)所有用于派生其它數(shù)據(jù)元素的元素。操作系統(tǒng)粒度操作源系統(tǒng)中有效的細(xì)節(jié)級(jí)別,對(duì)于不同粒度的源系統(tǒng)需要決定是否在最低的公共級(jí)別上抽取數(shù)據(jù),以使所有的數(shù)據(jù)很好的整合,或者從每一個(gè)系統(tǒng)中根據(jù)他的有效粒度來(lái)抽取數(shù)據(jù)。存儲(chǔ)開銷粒度級(jí)別對(duì)存儲(chǔ)開銷有很大影響備份和恢復(fù)數(shù)據(jù)倉(cāng)庫(kù)需要周期性地進(jìn)行備份和恢復(fù),細(xì)節(jié)越多,日常備份需要的時(shí)間也越多。數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別........影響數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別的主要因素匯總數(shù)據(jù)影響因素描述當(dāng)前業(yè)務(wù)需31逆規(guī)范化指南問(wèn)題類型解決方法關(guān)系類型層次關(guān)系:子對(duì)父通常有很強(qiáng)的依賴性。傾向于將把這些概念逆規(guī)范化到一個(gè)實(shí)體同等關(guān)系:在獨(dú)立的表中保存獨(dú)立的實(shí)體,可以保證設(shè)計(jì)與業(yè)務(wù)規(guī)則保持一致。一對(duì)一關(guān)系:如果當(dāng)一個(gè)實(shí)體值僅與來(lái)自另一個(gè)實(shí)體的一個(gè)實(shí)體值相關(guān),反之亦然。傾向于逆規(guī)范化。確定關(guān)系:父實(shí)體決定子實(shí)體的意義。通常為事務(wù)處理數(shù)據(jù)到引用數(shù)據(jù)的關(guān)系和關(guān)系實(shí)體,在多對(duì)多關(guān)系引入的關(guān)系表被認(rèn)為是子,而參與多對(duì)多關(guān)系的兩個(gè)表被認(rèn)為是父。在事務(wù)處理引用關(guān)系中,事務(wù)處理表是子,而引用表是父。通常,子表很大且易變。父表通常穩(wěn)定的多且小。所以傾向于把這兩個(gè)實(shí)體保存在各自的表中。參與率確定關(guān)系中每個(gè)實(shí)體的參與性。對(duì)于一個(gè)給定的父實(shí)體數(shù)值,大概會(huì)有幾個(gè)子實(shí)體數(shù)值。父子關(guān)系越接近一對(duì)一,將父實(shí)體逆規(guī)范化到子實(shí)體,將有最小數(shù)量的冗余。父實(shí)體中有多少數(shù)據(jù)元素如果將父實(shí)體逆規(guī)范化到子實(shí)體,保證子實(shí)體中具有存放父實(shí)體的數(shù)據(jù)元素額外空間。使用率兩個(gè)實(shí)體的耦合或相關(guān)程度如何。如果在許多用戶查詢和發(fā)布中,來(lái)自兩個(gè)實(shí)體的數(shù)據(jù)元素將一起出現(xiàn),那么,如果這些信息在同一表中而不是分布于多個(gè)表之內(nèi),則信息獲取將會(huì)更快捷。父實(shí)體是否變化如果未來(lái)父實(shí)體不需要加入更多的數(shù)據(jù)元素或關(guān)系,那么新業(yè)務(wù)規(guī)則不會(huì)對(duì)父實(shí)體引起完整性和強(qiáng)制性影響。進(jìn)行逆規(guī)范化的可行性就較強(qiáng)。如果未來(lái)父實(shí)體需要加入更多的數(shù)據(jù)元素或關(guān)系,那么新父實(shí)體數(shù)據(jù)元素會(huì)引起額外的冗余和空間。為了避免將來(lái)的維護(hù)和冗余問(wèn)題,需要保持兩個(gè)實(shí)體的獨(dú)立性。變動(dòng)對(duì)比率在同一時(shí)間周期內(nèi),兩個(gè)實(shí)體的插入和更新頻率是否相近。主要考慮性能和數(shù)據(jù)同步問(wèn)題。即數(shù)據(jù)穩(wěn)定性。........逆規(guī)范化指南問(wèn)題類型解決方法關(guān)系類型層次關(guān)系:子對(duì)父通常有很32風(fēng)險(xiǎn)數(shù)據(jù)集市-匯總層........風(fēng)險(xiǎn)數(shù)據(jù)集市-匯總層....33風(fēng)險(xiǎn)數(shù)據(jù)集市-應(yīng)用層........風(fēng)險(xiǎn)數(shù)據(jù)集市-應(yīng)用層....34
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....35步驟任務(wù)項(xiàng)目準(zhǔn)備與策劃模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相關(guān)的項(xiàng)目實(shí)施策略,包括確定數(shù)據(jù)源范圍,明確最終提交物和項(xiàng)目日程等。此外,模型設(shè)計(jì)人員在進(jìn)場(chǎng)前可參與提出客戶相關(guān)資料的具體需求,,包括一些參考模板,以保證后續(xù)工作的輸入。項(xiàng)目啟動(dòng)模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制定、標(biāo)準(zhǔn)文檔的客戶化,負(fù)責(zé)在整個(gè)項(xiàng)目組范圍內(nèi)組織模型培訓(xùn),明確LDM在整個(gè)信息架構(gòu)中的定位和作用,并就工作方法達(dá)成共識(shí)。系統(tǒng)需求模型設(shè)計(jì)人員參與業(yè)務(wù)訪談、數(shù)據(jù)和功能的需求分析系統(tǒng)設(shè)計(jì)系統(tǒng)設(shè)計(jì)工作是模型組工作的主體,主要由模型小組主導(dǎo)。它包括:信息調(diào)研、構(gòu)建概念模型、邏輯數(shù)據(jù)模型詳細(xì)設(shè)計(jì),以及物理數(shù)據(jù)模型設(shè)計(jì)。系統(tǒng)開發(fā)與單元測(cè)試模型設(shè)計(jì)人員主要起到支持的作用,為開發(fā)人員解釋模型設(shè)計(jì),協(xié)助驗(yàn)證單元測(cè)試的結(jié)果等,并根據(jù)測(cè)試發(fā)現(xiàn)的問(wèn)題進(jìn)行相應(yīng)修改和變更。數(shù)據(jù)模型標(biāo)準(zhǔn)工藝概述........步驟任務(wù)項(xiàng)目準(zhǔn)備與策劃模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相36項(xiàng)目準(zhǔn)備與策劃在項(xiàng)目準(zhǔn)備與策劃階段,模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相關(guān)的項(xiàng)目實(shí)施策略,包括確定數(shù)據(jù)源范圍,明確最終提交物和項(xiàng)目日程等。此外,模型設(shè)計(jì)人員在進(jìn)場(chǎng)前可參與提出客戶相關(guān)資料的具體需求,包括一些參考模板,以保證后續(xù)工作的輸入。確定項(xiàng)目人員本階段將確定參與項(xiàng)目實(shí)施的所有人員名單,包括全職和兼職人員。其中,在確定模型人員時(shí),需考慮對(duì)人員進(jìn)行如下要求:熟悉使用建模工具擁有豐富模型設(shè)計(jì)經(jīng)驗(yàn)熟悉銀行業(yè)務(wù)較強(qiáng)的溝通表達(dá)能力具備數(shù)據(jù)敏感性收集資料資料名稱資料說(shuō)明相關(guān)模板名稱系統(tǒng)數(shù)據(jù)結(jié)構(gòu)相關(guān)系統(tǒng)完整的數(shù)據(jù)結(jié)構(gòu)(含字段/代碼的取值說(shuō)明和索引等信息)供分析用源系統(tǒng)數(shù)據(jù)字典模板.xls業(yè)務(wù)需求客戶提供的各種業(yè)務(wù)需求材料
部門職能調(diào)查問(wèn)卷對(duì)目標(biāo)訪問(wèn)部門的職能/業(yè)務(wù)范圍進(jìn)行調(diào)研
訪談材料現(xiàn)狀介紹/業(yè)務(wù)調(diào)查問(wèn)卷/數(shù)據(jù)調(diào)查問(wèn)卷
制定實(shí)施策略明確與模型相關(guān)的數(shù)據(jù)源范圍里程碑提交物工作日程........項(xiàng)目準(zhǔn)備與策劃在項(xiàng)目準(zhǔn)備與策劃階段,模型設(shè)計(jì)人員的主要職責(zé)是37項(xiàng)目啟動(dòng)在項(xiàng)目啟動(dòng)階段,模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制定、標(biāo)準(zhǔn)文檔的客戶化,負(fù)責(zé)在整個(gè)項(xiàng)目組范圍內(nèi)組織模型培訓(xùn),明確數(shù)據(jù)模型在整個(gè)信息架構(gòu)中的定位和作用,并就工作方法達(dá)成共識(shí)。制定工作流程劃分不同小組的工作邊界確定模型組人員的工作分工確定項(xiàng)目組內(nèi)部以及對(duì)外的工作模式對(duì)公司標(biāo)準(zhǔn)項(xiàng)目實(shí)施流程進(jìn)行客戶化進(jìn)行模型培訓(xùn)介紹源系統(tǒng)由客戶介紹源系統(tǒng),內(nèi)容包括:系統(tǒng)架構(gòu)/設(shè)計(jì)思想/系統(tǒng)定位業(yè)務(wù)功能/重要流程關(guān)鍵數(shù)據(jù)表以及關(guān)系和其他系統(tǒng)的關(guān)系培訓(xùn)內(nèi)容相關(guān)模板名稱數(shù)據(jù)模型的基本概念、定位及常用的建模方法數(shù)據(jù)模型培訓(xùn)模板.ppt模型設(shè)計(jì)規(guī)范邏輯數(shù)據(jù)模型設(shè)計(jì)規(guī)范模板.pdf數(shù)據(jù)模型設(shè)計(jì)工具
模型產(chǎn)品培訓(xùn)
【可選,依是否使用模型產(chǎn)品而定】
........項(xiàng)目啟動(dòng)在項(xiàng)目啟動(dòng)階段,模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制38系統(tǒng)需求在系統(tǒng)需求階段,模型設(shè)計(jì)人員參與配合業(yè)務(wù)顧問(wèn)(以業(yè)務(wù)顧問(wèn)為主導(dǎo)),進(jìn)行需求分析、業(yè)務(wù)訪談工作,對(duì)需求人員所編寫的《業(yè)務(wù)需求說(shuō)明書》就模型相關(guān)部分進(jìn)行確認(rèn)。業(yè)務(wù)訪談業(yè)務(wù)訪談階段
訪談議程及內(nèi)容設(shè)定:訪談目的/訪談方式/調(diào)查問(wèn)卷調(diào)查問(wèn)卷填寫:填寫說(shuō)明/雙方交流問(wèn)卷反饋內(nèi)容
訪談過(guò)程記錄:專人負(fù)責(zé)記錄/錄音
聯(lián)系人員確認(rèn):確定對(duì)口聯(lián)系人,跟進(jìn)未盡事宜
模型設(shè)計(jì)人員參與業(yè)務(wù)訪談過(guò)程內(nèi)容總結(jié)階段
模型設(shè)計(jì)人員參與文檔整理:訪談紀(jì)要的整理發(fā)送/調(diào)查問(wèn)卷的收集整理/不明確問(wèn)題的確認(rèn)
業(yè)務(wù)調(diào)研總結(jié)報(bào)告報(bào)告編寫、確認(rèn)總結(jié)報(bào)告需求分析業(yè)務(wù)數(shù)據(jù)分析涉及的指標(biāo)查詢條件分析維度統(tǒng)計(jì)口徑計(jì)算公式處理周期功能分析
目的與用途流程調(diào)研報(bào)表格式、展現(xiàn)方式權(quán)限分配、用戶管理補(bǔ)錄數(shù)據(jù)對(duì)《業(yè)務(wù)需求說(shuō)明書》的模型相關(guān)內(nèi)容要求報(bào)表類需求需包含:對(duì)報(bào)表需求分類,簡(jiǎn)述報(bào)表的目的。報(bào)表的訪問(wèn)頻度、使用部門、權(quán)限要求報(bào)表數(shù)據(jù)項(xiàng)定義、查詢條件報(bào)表樣式分析類需求需包含:對(duì)分析類需求分類,簡(jiǎn)述分析的目的訪問(wèn)頻度、使用部門、權(quán)限要求分析維度定義分析指標(biāo)定義........系統(tǒng)需求在系統(tǒng)需求階段,模型設(shè)計(jì)人員參與配合業(yè)務(wù)顧問(wèn)(以業(yè)務(wù)39信息調(diào)研本階段工作由模型設(shè)計(jì)人員主導(dǎo),在系統(tǒng)需求調(diào)研的基礎(chǔ)上進(jìn)行系統(tǒng)數(shù)據(jù)滿足度分析。模型設(shè)計(jì)人員解讀《業(yè)務(wù)需求說(shuō)明書》中產(chǎn)生的問(wèn)題,記入《業(yè)務(wù)需求問(wèn)題跟蹤單》進(jìn)行跟蹤確認(rèn).業(yè)務(wù)顧問(wèn)需根據(jù)數(shù)據(jù)滿足度中的數(shù)據(jù)缺口,確認(rèn)或變更相應(yīng)業(yè)務(wù)需求說(shuō)明書的內(nèi)容。........信息調(diào)研本階段工作由模型設(shè)計(jì)人員主導(dǎo),在系統(tǒng)需求調(diào)研的基40構(gòu)建概念模型本階段工作由模型設(shè)計(jì)人員主導(dǎo)進(jìn)行,主要工作包括建立主題域,確認(rèn)重要業(yè)務(wù)關(guān)系,生成概念模型。如果項(xiàng)目中有規(guī)范小組,則由規(guī)范小組主導(dǎo)“規(guī)范關(guān)鍵定義”的工作。........構(gòu)建概念模型本階段工作由模型設(shè)計(jì)人員主導(dǎo)進(jìn)行,主要工作包括41邏輯數(shù)據(jù)模型詳細(xì)設(shè)計(jì)本階段工作由模型設(shè)計(jì)人員主導(dǎo),進(jìn)行邏輯數(shù)據(jù)模型設(shè)計(jì)。業(yè)務(wù)人員需對(duì)模型人員提出的重要規(guī)則及處理原則進(jìn)行確認(rèn)。........邏輯數(shù)據(jù)模型詳細(xì)設(shè)計(jì)本階段工作由模型設(shè)計(jì)人員主導(dǎo),進(jìn)行邏輯42物理數(shù)據(jù)模型設(shè)計(jì)本階段的工作由技術(shù)人員主導(dǎo),將邏輯數(shù)據(jù)模型轉(zhuǎn)化成可具體實(shí)施的物理數(shù)據(jù)模型,邏輯模型設(shè)計(jì)人員提供支持。物理數(shù)據(jù)模型與平臺(tái)緊密相關(guān),在實(shí)際的數(shù)據(jù)庫(kù)平臺(tái)上談?wù)撐锢頂?shù)據(jù)模型具有更高的可操作性........物理數(shù)據(jù)模型設(shè)計(jì)本階段的工作由技術(shù)人員主導(dǎo),將邏輯數(shù)據(jù)模型43系統(tǒng)開發(fā)與單元測(cè)試在系統(tǒng)開發(fā)與單元測(cè)試階段,模型設(shè)計(jì)人員主要起到支持的作用,為開發(fā)人員解釋模型,支持開發(fā)人員的數(shù)據(jù)映射和關(guān)聯(lián)關(guān)系驗(yàn)證等工作,協(xié)助驗(yàn)證單元測(cè)試的結(jié)果,并根據(jù)測(cè)試發(fā)現(xiàn)的問(wèn)題進(jìn)行相應(yīng)修改和變更。支持模塊開發(fā)對(duì)模型進(jìn)行說(shuō)明和解釋支持?jǐn)?shù)據(jù)映射支持關(guān)聯(lián)關(guān)系驗(yàn)證協(xié)助模塊單元測(cè)試協(xié)助單元測(cè)試結(jié)果驗(yàn)證協(xié)助進(jìn)行錯(cuò)誤原因分析
修改、完善設(shè)計(jì)
根據(jù)開發(fā)和測(cè)試中發(fā)現(xiàn)的問(wèn)題調(diào)整模型,進(jìn)行模型變更........系統(tǒng)開發(fā)與單元測(cè)試在系統(tǒng)開發(fā)與單元測(cè)試階段,模型設(shè)計(jì)人員主要44完善優(yōu)化邏輯數(shù)據(jù)模型健康性檢查邏輯數(shù)據(jù)模型健康性檢查是針對(duì)邏輯數(shù)據(jù)模型設(shè)計(jì)與維護(hù)中的關(guān)鍵項(xiàng)目定期進(jìn)行評(píng)估與回顧的活動(dòng),及早發(fā)現(xiàn)可能存在的問(wèn)題與不足,提升人員認(rèn)知,給出合理化改進(jìn)建議,完善規(guī)范與流程,保持邏輯數(shù)據(jù)模型健康持續(xù)發(fā)展,從而為各項(xiàng)工作提供邏輯清晰、設(shè)計(jì)規(guī)范、架構(gòu)合理、使用方便的邏輯數(shù)據(jù)模型,提升數(shù)據(jù)服務(wù)質(zhì)量。架構(gòu)層面健康性檢查整體架構(gòu)檢查
檢查主題是否完整檢查主題間關(guān)系是否完整、準(zhǔn)確檢查涵蓋的業(yè)務(wù)范圍是否合理檢查支持和服務(wù)的應(yīng)用領(lǐng)域是否合理主題架構(gòu)檢查
檢查各主題的核心分類是否符合現(xiàn)狀、是否具備擴(kuò)展性檢查核心實(shí)體的業(yè)務(wù)定義是否準(zhǔn)確和清晰檢查是否采用了父子結(jié)構(gòu)和重要關(guān)聯(lián)關(guān)系表等技術(shù)檢查業(yè)務(wù)規(guī)則的表達(dá)是否合理檢查是否有細(xì)分的子主題,劃分的詳略程度是否合適管理流程健康性檢查版本檢查
檢查有沒(méi)有使用工具進(jìn)行版本控制檢查不同版本的劃分是否具有標(biāo)準(zhǔn)核實(shí)每次發(fā)生版本變化的主要原因是什么檢查歷史版本如何管理、版本是否有簡(jiǎn)要說(shuō)明維護(hù)檢查
檢查是否有源系統(tǒng)變更管理流程檢查是否有分析需求變更管理流程檢查是否有統(tǒng)計(jì)匯總加工規(guī)則變化管理流程元數(shù)據(jù)檢查檢查模型是否具備發(fā)布機(jī)制檢查模型是否能夠與元數(shù)據(jù)保持同步檢查業(yè)務(wù)人員是否能查詢到所需信息業(yè)務(wù)層面健康性檢查易用性檢查
檢查用戶了解模型與數(shù)據(jù)的所有方式檢查是否有幫助文檔檢查是否有培訓(xùn)體系一致性檢查
檢查現(xiàn)有業(yè)務(wù)規(guī)則的處理是否為大家接受檢查新的或者變化的業(yè)務(wù)規(guī)則的處理方法了解使用中的主要問(wèn)題有哪些方面檢查業(yè)務(wù)規(guī)則在不同層次之間是否一致完整性檢查
檢查業(yè)務(wù)應(yīng)用中是否發(fā)現(xiàn)缺失的業(yè)務(wù)信息核實(shí)缺失業(yè)務(wù)信息的原因檢查已采納的業(yè)務(wù)數(shù)據(jù)是否完整、是否一致........完善優(yōu)化邏輯數(shù)據(jù)模型健康性檢查架構(gòu)層面健康性檢查管理流程健康45完善優(yōu)化物理數(shù)據(jù)模型優(yōu)化檢查進(jìn)行物理數(shù)據(jù)模型優(yōu)化的工作要點(diǎn)
檢查字段命名是否符合規(guī)范參考物理模型設(shè)計(jì)階段制定的命名規(guī)則進(jìn)行檢查;對(duì)不符合規(guī)范的字段了解原因,并決定是否進(jìn)行修改;
檢查字段數(shù)據(jù)類型是否符合規(guī)范檢查字段的數(shù)據(jù)類型是否符合加工規(guī)則、加載需求及應(yīng)用需求;如果制訂了數(shù)據(jù)類型規(guī)范,則應(yīng)對(duì)照數(shù)據(jù)類型規(guī)范進(jìn)行檢查;
對(duì)數(shù)據(jù)量大小排在前二十名表找出所有加載這二十張表的腳本;找出所有使用這二十張表的腳本和查詢;考察這些腳本和查詢中對(duì)這些大表的常見用法(比如如何下條件等)以及其實(shí)際性能表現(xiàn);結(jié)合上述信息分析其所用數(shù)據(jù)庫(kù)物理特性是否合理(比如分區(qū)、索引等),如不合理討論是否應(yīng)該修改;考察是否還有進(jìn)一步加入其他物理特性的必要性(比如對(duì)大表是否需要進(jìn)行拆分處理、對(duì)目前拆的過(guò)散的表是否需要進(jìn)行合并處理等);在初步測(cè)試后給出修改建議;對(duì)運(yùn)行最慢的前二十個(gè)腳本,以及有代表性及重用性的一些較慢的隨機(jī)查詢找出導(dǎo)致這些腳本及查詢運(yùn)行較慢的關(guān)鍵表;分析導(dǎo)致其運(yùn)行效率較差的原因,判斷是否有進(jìn)一步物理優(yōu)化的可能性;在初步測(cè)試后給出修改建議;.設(shè)計(jì)規(guī)范健康性檢查建模工具檢查業(yè)務(wù)規(guī)則檢查技術(shù)標(biāo)準(zhǔn)檢查外觀美學(xué)檢查物理數(shù)據(jù)模型優(yōu)化檢查物理模型優(yōu)化檢查是針對(duì)整個(gè)系統(tǒng)運(yùn)行情況評(píng)估和回顧的一部分,及時(shí)檢查并發(fā)現(xiàn)物理模型設(shè)計(jì)過(guò)程中的一些問(wèn)題和不足,并及時(shí)加以改進(jìn)和完善,使得整個(gè)系統(tǒng)運(yùn)行更加穩(wěn)定、高效。進(jìn)行物理數(shù)據(jù)模型優(yōu)化的時(shí)機(jī)系統(tǒng)運(yùn)行一段時(shí)間后,出現(xiàn)空間容量、執(zhí)行效率、資源分配的問(wèn)題時(shí)數(shù)據(jù)庫(kù)版本升級(jí)后........完善優(yōu)化物理數(shù)據(jù)模型優(yōu)化檢查設(shè)計(jì)規(guī)范健康性檢查物理數(shù)據(jù)模型優(yōu)46............47態(tài)度決定一切細(xì)節(jié)影響成敗謝謝您的關(guān)注!........態(tài)度決定一切....48數(shù)據(jù)倉(cāng)庫(kù)建模方法論........數(shù)據(jù)倉(cāng)庫(kù)建模方法論....49
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....50數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的兩位大師BillInmon數(shù)據(jù)倉(cāng)庫(kù)之父,數(shù)據(jù)倉(cāng)庫(kù)概念的創(chuàng)始人理論:CorporateInformationFactory(CIF)主要著作:《數(shù)據(jù)倉(cāng)庫(kù)》、《企業(yè)信息工廠》主要著作:《數(shù)據(jù)倉(cāng)庫(kù)工具箱-維度建模的完全指南》、《數(shù)據(jù)倉(cāng)庫(kù)生命周期工具箱-設(shè)計(jì)、開發(fā)和部署數(shù)據(jù)倉(cāng)庫(kù)的專家方法》RalphKimball數(shù)據(jù)倉(cāng)庫(kù)方面的知名學(xué)者理論:MutildimensionalArchitecture(MD)
........數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的兩位大師BillInmon主要著作:《數(shù)據(jù)倉(cāng)51企業(yè)數(shù)據(jù)倉(cāng)庫(kù)EDW企業(yè)數(shù)據(jù)倉(cāng)庫(kù)定義:詳細(xì)交易及相關(guān)業(yè)務(wù)數(shù)據(jù)的集合包含必要的內(nèi)部與外部信息來(lái)自于多個(gè)數(shù)據(jù)源/業(yè)務(wù)操作系統(tǒng)保存一定的時(shí)間周期按照企業(yè)內(nèi)業(yè)務(wù)規(guī)則所決定的模型來(lái)存儲(chǔ)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)作用:基于數(shù)據(jù)/信息來(lái)回答相關(guān)的業(yè)務(wù)問(wèn)題和提供決策支持,并確保:一致、集成的數(shù)據(jù)存儲(chǔ)任意的數(shù)據(jù)粒度在整個(gè)企業(yè)的業(yè)務(wù)范圍保持企業(yè)內(nèi)一致的信息視圖企業(yè)內(nèi)一致的信息視圖(SingleVersionoftheTruth)>集成的企業(yè)信息(Integratedcorporateinformation)>不針對(duì)特定應(yīng)用(Applicationneutral)>無(wú)冗余(Nonredundant)>用于報(bào)表和決策支持(Reportinganddecisionmaking)最詳細(xì)的數(shù)據(jù)和信息(DetailedData)任何時(shí)候,針對(duì)任意數(shù)據(jù),提出任意業(yè)務(wù)問(wèn)題(Askanyquestion,anydata,anytime)........企業(yè)數(shù)據(jù)倉(cāng)庫(kù)EDW企業(yè)數(shù)據(jù)倉(cāng)庫(kù)定義:企業(yè)數(shù)據(jù)倉(cāng)庫(kù)作用:企業(yè)內(nèi)52數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)........數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)....53企業(yè)信息工廠........企業(yè)信息工廠....54數(shù)據(jù)倉(cāng)庫(kù)總線........數(shù)據(jù)倉(cāng)庫(kù)總線....55企業(yè)總線........企業(yè)總線....56總線架構(gòu)矩陣........總線架構(gòu)矩陣....57多維體系結(jié)構(gòu)與企業(yè)信息工廠體系結(jié)構(gòu)比較方面多維體系結(jié)構(gòu)企業(yè)信息工廠體系結(jié)構(gòu)范圍優(yōu)先考慮業(yè)務(wù)單位范圍優(yōu)先考慮企業(yè)總體范圍角度關(guān)心業(yè)務(wù)部門的需求多維建模師以企業(yè)視角,建立一致性維度。從企業(yè)角度解決供應(yīng)源數(shù)據(jù)的問(wèn)題,但并不是整個(gè)企業(yè)的數(shù)據(jù)必須在項(xiàng)目第一個(gè)階段都處理。相反而是選擇企業(yè)所有數(shù)據(jù)的一個(gè)子集。數(shù)據(jù)流實(shí)施方法采用自底向上的:如何快速的獲取由用戶控制的業(yè)務(wù)部門專有的數(shù)據(jù),并最小限度的考慮整個(gè)企業(yè)的使用快速需求收集和實(shí)現(xiàn)過(guò)程使得為整個(gè)環(huán)境提供一致而可靠數(shù)據(jù)的任務(wù)變得復(fù)雜。實(shí)施方法是自頂向下的:企業(yè)數(shù)據(jù)利用業(yè)務(wù)需求將數(shù)據(jù)從數(shù)據(jù)源推至需要這些數(shù)據(jù)的地方,其核心問(wèn)題是從最初的項(xiàng)目開始為任何數(shù)據(jù)集市的使用而集成企業(yè)數(shù)據(jù)。為了制定盡可能在整個(gè)企業(yè)范圍內(nèi)一致的主題域和業(yè)務(wù)數(shù)據(jù)需要增加模型開銷,需要更多的時(shí)間和代價(jià)。但后續(xù)項(xiàng)目則需要較少時(shí)間和代價(jià),尤其對(duì)于使用現(xiàn)有的、健全的主題域的業(yè)務(wù)單位更是如此。實(shí)現(xiàn)對(duì)存儲(chǔ)空間最小需求,非冗余方式防止了在多個(gè)位置存儲(chǔ)數(shù)據(jù)。這種特性使更新或刪除異常最小化或者消除。易失性聚集數(shù)據(jù)集市:當(dāng)業(yè)務(wù)過(guò)程發(fā)生變化,為了消除或減少對(duì)事實(shí)表重建,需要增加新的維或改變維。原子數(shù)據(jù)集市:由于事實(shí)表可能包含幾億甚至更多的數(shù)據(jù),重建將會(huì)帶來(lái)嚴(yán)重后果數(shù)據(jù)倉(cāng)庫(kù)模型是與過(guò)程無(wú)關(guān)的,它摒棄了由于處理過(guò)程影響而帶來(lái)的變化數(shù)據(jù)倉(cāng)庫(kù)模型的設(shè)計(jì)依賴于企業(yè)的業(yè)務(wù)規(guī)則,而不依賴與在其上將運(yùn)行什么查詢。如果一個(gè)已經(jīng)建好的數(shù)據(jù)集市需要改變或加強(qiáng),可以根據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的細(xì)節(jié)數(shù)據(jù)合理且快速地進(jìn)行重建靈活性多維設(shè)計(jì)是很多業(yè)務(wù)過(guò)程聚集在一起的結(jié)果。當(dāng)處理請(qǐng)求發(fā)生變化時(shí),多維數(shù)據(jù)庫(kù)的設(shè)計(jì)未必能夠適度地變化。數(shù)據(jù)倉(cāng)庫(kù)模型存放數(shù)據(jù)粒度級(jí)別為原子級(jí)別,原子級(jí)別可以任意組合。故可以支持將來(lái)未知需求。復(fù)雜性數(shù)據(jù)集市模型易于業(yè)務(wù)人員理解??梢院苋菀讟?gòu)建數(shù)據(jù)集市,然而,當(dāng)一個(gè)一個(gè)地建立數(shù)據(jù)集市時(shí),由于數(shù)據(jù)的企業(yè)視圖的復(fù)雜性,對(duì)于這種結(jié)構(gòu),完成更新時(shí)相當(dāng)復(fù)雜的。數(shù)據(jù)倉(cāng)庫(kù)中的細(xì)節(jié)數(shù)據(jù)是與處理過(guò)程無(wú)關(guān)的,因此數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型使得數(shù)據(jù)不一致的風(fēng)險(xiǎn)最小。功能性為多維處理提供了理想環(huán)境,切片和切塊、上鉆和下鉆等查詢提供良好的性能支持?jǐn)?shù)據(jù)挖掘、統(tǒng)計(jì)分析和即席查詢持續(xù)維護(hù)總體目標(biāo)是防止由于環(huán)境的后續(xù)構(gòu)建、調(diào)整和優(yōu)化而產(chǎn)生的高昂的代價(jià)。一個(gè)良好的數(shù)據(jù)倉(cāng)庫(kù)模型將為企業(yè)提供長(zhǎng)久的服務(wù),將提供如下回報(bào):整個(gè)環(huán)境端到端一致性和集成性易于建立新的數(shù)據(jù)集市加強(qiáng)現(xiàn)有數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)和有關(guān)數(shù)據(jù)集市的維護(hù)和可持續(xù)發(fā)展........多維體系結(jié)構(gòu)與企業(yè)信息工廠體系結(jié)構(gòu)比較方面多維體系結(jié)構(gòu)企業(yè)信58OLTP與OLAP針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和數(shù)據(jù)分析技術(shù)滿足對(duì)數(shù)據(jù)進(jìn)行多角度、快速、一致、交互、深入觀察使用預(yù)定義的多維數(shù)據(jù)視圖對(duì)數(shù)據(jù)進(jìn)行分析處理,支持對(duì)數(shù)據(jù)的切片、切塊、鉆取。多維數(shù)據(jù)庫(kù)是一種以多維數(shù)據(jù)存儲(chǔ)形式來(lái)組織數(shù)據(jù)的數(shù)據(jù)管理系統(tǒng),在使用時(shí)需要將數(shù)據(jù)從關(guān)系數(shù)據(jù)庫(kù)中轉(zhuǎn)載到多維數(shù)據(jù)庫(kù)中方可訪問(wèn)。也稱為面向交易的處理系統(tǒng),其基本特征是顧客的原始數(shù)據(jù)可以立即傳送到計(jì)算中心進(jìn)行處理,并在很短的時(shí)間內(nèi)給出處理結(jié)果。這樣做的最大優(yōu)點(diǎn)是可以即時(shí)地處理輸入的數(shù)據(jù),及時(shí)地回答。也稱為實(shí)時(shí)系統(tǒng)(RealtimeSystem)。衡量聯(lián)機(jī)事務(wù)處理系統(tǒng)的一個(gè)重要性能指標(biāo)是系統(tǒng)性能,具體體現(xiàn)為實(shí)時(shí)響應(yīng)時(shí)間(ResponseTime),即用戶在終端上送入數(shù)據(jù)之后,到計(jì)算機(jī)對(duì)這個(gè)請(qǐng)求給出答復(fù)所需要的時(shí)間。
OLTP數(shù)據(jù)庫(kù)旨在使事務(wù)應(yīng)用程序僅寫入所需的數(shù)據(jù),以便盡快處理單個(gè)事務(wù)。On-LineAnalyticalProcessingOn-LineTransactionProcessing........OLTP與OLAP針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和數(shù)據(jù)分析技術(shù)59OLTP與OLAPOLTPOLAP用戶操作人員,低層管理人員決策人員,高級(jí)管理人員功能日常操作處理分析決策DB設(shè)計(jì)面向應(yīng)用面向主題數(shù)據(jù)當(dāng)前的,最新的細(xì)節(jié)的,二維的歷史的,聚集的,多維的集成的,統(tǒng)一的存取讀/寫數(shù)十條記錄讀上百萬(wàn)條記錄工作單位簡(jiǎn)單的事務(wù)復(fù)雜的查詢用戶數(shù)上千個(gè)上百個(gè)DB大小100MB-GB100GB-TBROLAP表示基于關(guān)系數(shù)據(jù)庫(kù)的OLAP實(shí)現(xiàn)(RelationalOLAP)MOLAP表示基于多維數(shù)據(jù)組織的OLAP實(shí)現(xiàn)(MultidimensionalOLAP)........OLTP與OLAPOLTPOLAP用戶操作人員,低層管理人員60ROLAPMOLAP沿用現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)技術(shù)專用技術(shù)響應(yīng)速度相對(duì)molap要慢性能好,響應(yīng)速度快數(shù)據(jù)轉(zhuǎn)載計(jì)算速度快數(shù)據(jù)轉(zhuǎn)載速度慢存儲(chǔ)空間耗費(fèi)小,維數(shù)沒(méi)有限制需要進(jìn)行預(yù)計(jì)算,可能導(dǎo)致數(shù)據(jù)爆炸,維數(shù)有限,無(wú)法支持維的動(dòng)態(tài)變化借助rdbms對(duì)數(shù)據(jù)存儲(chǔ),無(wú)文件大小限制受操作系統(tǒng)平臺(tái)文件大小限制,難以達(dá)到tb級(jí)可以通過(guò)sql語(yǔ)句實(shí)現(xiàn)詳細(xì)數(shù)據(jù)和概要數(shù)據(jù)的存儲(chǔ)缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問(wèn)的標(biāo)準(zhǔn)不支持預(yù)計(jì)算的讀寫操作無(wú)法完成維之間的運(yùn)算無(wú)法完成多行計(jì)算支持高性能的決策支持計(jì)算復(fù)雜的跨維計(jì)算多用戶讀寫操作行級(jí)計(jì)算ROLAP
vsMOLAP........ROLAPMOLAP沿用現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)技術(shù)專用技術(shù)響應(yīng)速度相61
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....62數(shù)據(jù)架構(gòu)形態(tài)........數(shù)據(jù)架構(gòu)形態(tài)....63各數(shù)據(jù)架構(gòu)比較........各數(shù)據(jù)架構(gòu)比較....64源系統(tǒng)ODSEDW獨(dú)立數(shù)據(jù)集市DataMart#1DataMart#2Non-conformedDimensionsandFacts從屬數(shù)據(jù)集市DataMart#1DataMart#2ConformedDimensionsandConformedFactsDataMart數(shù)據(jù)集市類型........源系統(tǒng)ODSEDW獨(dú)立數(shù)據(jù)集市DataMart#1Dat65活期存款定期存款零售信貸公司信貸債券投資票據(jù)信息同業(yè)拆借儲(chǔ)蓄國(guó)債衍生品儲(chǔ)蓄國(guó)債參與者交易流水會(huì)計(jì)單元理財(cái)產(chǎn)品風(fēng)險(xiǎn)緩釋市場(chǎng)數(shù)據(jù)計(jì)量結(jié)果公共信息數(shù)據(jù)挖掘模型風(fēng)險(xiǎn)引擎數(shù)據(jù)接口星型模型報(bào)表模型多維分析模型風(fēng)險(xiǎn)計(jì)算引擎信用風(fēng)險(xiǎn)績(jī)效衡量和資本分配合規(guī)性與披露市場(chǎng)風(fēng)險(xiǎn)操作風(fēng)險(xiǎn)流動(dòng)性風(fēng)險(xiǎn)防欺詐和反洗錢EnterpriseDateWarehouseODS風(fēng)險(xiǎn)計(jì)量結(jié)果返回ODS多維分析匯總層應(yīng)用層監(jiān)管報(bào)表風(fēng)險(xiǎn)數(shù)據(jù)集市數(shù)據(jù)架構(gòu)........活期存款定期存款零售信貸公司信貸債券投資票據(jù)信息同業(yè)拆借儲(chǔ)蓄66風(fēng)險(xiǎn)數(shù)據(jù)集市建設(shè)目標(biāo)........風(fēng)險(xiǎn)數(shù)據(jù)集市建設(shè)目標(biāo)....67
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)模型
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....68為什么需要邏輯數(shù)據(jù)模型為復(fù)雜的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)實(shí)施提供了規(guī)范和基礎(chǔ)結(jié)構(gòu)-藍(lán)圖促進(jìn)業(yè)務(wù)部門用戶和IT分析人員之間的有效溝通明確業(yè)務(wù)需求解決業(yè)務(wù)問(wèn)題形成對(duì)重要業(yè)務(wù)定義和術(shù)語(yǔ)的統(tǒng)一認(rèn)識(shí)具備跨部門,能夠表達(dá)所有的業(yè)務(wù)........為什么需要邏輯數(shù)據(jù)模型為復(fù)雜的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)實(shí)施提供了規(guī)范和基69
技術(shù)緩沖層ETL專用的純技術(shù)層完全與源系統(tǒng)結(jié)構(gòu)一致近源模型層基本依照源系統(tǒng)建模盡量保持業(yè)務(wù)系統(tǒng)原貌整合模型層面向整合主題設(shè)計(jì)提供規(guī)范和共享應(yīng)用集市層面向應(yīng)用按需定制多維建模匯總數(shù)據(jù)核心系統(tǒng)對(duì)公信貸票據(jù)系統(tǒng)儲(chǔ)蓄國(guó)債市場(chǎng)數(shù)據(jù)核心系統(tǒng)對(duì)公信貸票據(jù)系統(tǒng)儲(chǔ)蓄國(guó)債市場(chǎng)數(shù)據(jù)…..…..復(fù)雜交易復(fù)雜交易數(shù)據(jù)挖掘模型風(fēng)險(xiǎn)引擎數(shù)據(jù)接口星型模型報(bào)表模型多維分析模型匯總層當(dāng)事人財(cái)務(wù)產(chǎn)品資產(chǎn)事件內(nèi)部機(jī)構(gòu)協(xié)議計(jì)量結(jié)果市場(chǎng)數(shù)據(jù)LDM在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中的地位........技術(shù)緩沖層ETL專用的純70ODSEDWDataMartDataMining目標(biāo)?短期的,細(xì)節(jié)的,同源的數(shù)據(jù)存儲(chǔ);?直接提供基于源系統(tǒng)結(jié)構(gòu)的簡(jiǎn)單原貌訪問(wèn);?為BI環(huán)境中適合的業(yè)務(wù)需求提供支持?長(zhǎng)期的,細(xì)節(jié)的,整合的數(shù)據(jù)存儲(chǔ);?為BI環(huán)境中適合的業(yè)務(wù)需求提供支持
?服務(wù)特定應(yīng)用
?長(zhǎng)期歷史分析性指標(biāo)匯總?為企業(yè)提供預(yù)測(cè)性、趨勢(shì)分析性需求提供支持原則?簡(jiǎn)單處理,不考慮整合;?關(guān)注保留策略;
?面向全局,數(shù)據(jù)整合?中性設(shè)計(jì),靈活擴(kuò)展?提供規(guī)范和共享?面向具體應(yīng)用?按需設(shè)計(jì)
?針對(duì)業(yè)務(wù)目標(biāo)、挖掘算法設(shè)計(jì)數(shù)據(jù)模型形式?偏源系統(tǒng)模型;?根據(jù)支持應(yīng)用情況可以保留短期歷史?面向主題設(shè)計(jì);?偏范式化;?長(zhǎng)期保留歷史
?形式各異,依具體應(yīng)用不同;
?一條記錄表示一個(gè)觀測(cè)?多條記錄表示一個(gè)觀測(cè)重點(diǎn)?理解源結(jié)構(gòu)
?主題定義?框架設(shè)計(jì)?整合策略?實(shí)施方法?整體性?一致性?業(yè)務(wù)理解?數(shù)據(jù)理解?數(shù)據(jù)準(zhǔn)備用途?業(yè)務(wù)原貌查詢?即時(shí)報(bào)表?數(shù)據(jù)質(zhì)量檢查?靈活查詢?整合規(guī)則檢查?特定應(yīng)用?特定業(yè)務(wù)專題設(shè)計(jì)思路比較........ODSEDWDataMartDataMining目標(biāo)?短71EDW邏輯數(shù)據(jù)模型設(shè)計(jì)目標(biāo)中性的,共享的:不針對(duì)某個(gè)特別的應(yīng)用而設(shè)計(jì);靈活的,可擴(kuò)展的:存放最詳盡的歷史數(shù)據(jù),業(yè)務(wù)發(fā)生變化時(shí)易于擴(kuò)展,適應(yīng)復(fù)雜的實(shí)際業(yè)務(wù)情況;穩(wěn)定的,經(jīng)得起考驗(yàn)的:能夠在很長(zhǎng)時(shí)間內(nèi)保持穩(wěn)定性,回答不斷產(chǎn)生、不斷變化且無(wú)法預(yù)先定義的業(yè)務(wù)問(wèn)題;規(guī)范的,易懂的:使用業(yè)務(wù)語(yǔ)言進(jìn)行模型設(shè)計(jì),易于讓業(yè)務(wù)人員理解和使用,有助于IT和業(yè)務(wù)部門人員的溝通........EDW邏輯數(shù)據(jù)模型設(shè)計(jì)目標(biāo)...7273邏輯視圖(第三級(jí))細(xì)節(jié)(第三級(jí))主題區(qū)域(第一級(jí))概念(第二級(jí))邏輯數(shù)據(jù)模型的不同級(jí)別........25邏輯視圖細(xì)節(jié)主題區(qū)域概念邏輯數(shù)據(jù)模型的不同級(jí)別...73邏輯數(shù)據(jù)模型的主題域........邏輯數(shù)據(jù)模型的主題域....74主題域模型案例-市場(chǎng)風(fēng)險(xiǎn)數(shù)據(jù)集市........主題域模型案例-市場(chǎng)風(fēng)險(xiǎn)數(shù)據(jù)集市...75主題域模型案例-信用卡數(shù)據(jù)集市........主題域模型案例-信用卡數(shù)據(jù)集市...76主題域模型優(yōu)點(diǎn)
指導(dǎo)業(yè)務(wù)數(shù)據(jù)模型開發(fā)有助于數(shù)據(jù)一致性,避免冗余。當(dāng)確定一個(gè)新的實(shí)體時(shí),基于定義可以確定實(shí)體的恰當(dāng)?shù)刂黝}域。根據(jù)主題域劃分工作量,可使重復(fù)工作量最小化,并有利于相互協(xié)調(diào)指導(dǎo)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目選擇為基于數(shù)據(jù)的項(xiàng)目分組提供了一種高層次劃分方法。在確定項(xiàng)目開發(fā)順序時(shí),應(yīng)該同時(shí)考慮業(yè)務(wù)優(yōu)先級(jí)、技術(shù)實(shí)現(xiàn)難度、人員可用性等信息指導(dǎo)數(shù)據(jù)倉(cāng)庫(kù)開發(fā)有助于確定哪些相關(guān)的業(yè)務(wù)專家主題域模型目標(biāo)
提供廣泛的理解提供對(duì)每一個(gè)主題域的理解,包括各個(gè)主題域的名稱和定義,通過(guò)業(yè)務(wù)規(guī)則將這些主題域聯(lián)系起來(lái),形象地表達(dá)這些主題之間依賴關(guān)系和規(guī)則。因?yàn)樵谥黝}域?qū)哟?,所以,主題域模型更容易覆蓋廣泛的領(lǐng)域。業(yè)務(wù)規(guī)則使主題域模型增加更多的準(zhǔn)確性和清晰性。
確定范圍通過(guò)形象地表達(dá)主題域和他們的業(yè)務(wù)規(guī)則,我們能夠更容易地識(shí)別出將要分析的模型的范圍。
指引方向主題域模型能夠提供全景視圖,可以幫助我們確定:計(jì)劃中的應(yīng)用程序和現(xiàn)有的應(yīng)用程序?qū)⒃鯓庸泊?。下一步,企業(yè)將需要什么樣新功能。主題域模型提供方向和指南。建立對(duì)業(yè)務(wù)的高層次理解,為邏輯數(shù)據(jù)分析和建模打下基礎(chǔ)主題域模型........主題域模型優(yōu)點(diǎn)主題域模型目標(biāo)主題域模型...77概念模型........概念模型....78影響數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別的主要因素匯總數(shù)據(jù)匯總數(shù)據(jù)能夠改善數(shù)據(jù)交付處理性能,匯總數(shù)據(jù)不會(huì)節(jié)省存儲(chǔ)空間,因?yàn)閯?chuàng)建匯總的細(xì)節(jié)可能會(huì)繼續(xù)被保留。匯總提供的好處主要包括:在線存儲(chǔ)需求減少
分析的標(biāo)準(zhǔn)化以及數(shù)據(jù)交付性能的改善合并實(shí)體通過(guò)減少連接操作的數(shù)量,提高了數(shù)據(jù)交付處理的性能,并且可以增強(qiáng)一致性。分離數(shù)據(jù)根據(jù)穩(wěn)定性和用法來(lái)分離數(shù)據(jù)。穩(wěn)定性分析根據(jù)各個(gè)數(shù)據(jù)屬性是否經(jīng)常變化的特性將這些屬性進(jìn)行分組。影響因素描述當(dāng)前業(yè)務(wù)需求粒度級(jí)別必須足以回答定位在該數(shù)據(jù)倉(cāng)庫(kù)迭代范圍內(nèi)的每一個(gè)業(yè)務(wù)問(wèn)題。提供高的粒度級(jí)別增加了數(shù)據(jù)倉(cāng)庫(kù)和項(xiàng)目的開發(fā)成本,如果業(yè)務(wù)不需要細(xì)節(jié),則增加的成本就沒(méi)有商業(yè)價(jià)值。未來(lái)業(yè)務(wù)需求按照目前明確需求建立數(shù)據(jù)倉(cāng)庫(kù),但在建立并抽取數(shù)據(jù)時(shí)要適應(yīng)考慮未來(lái)的需求數(shù)據(jù)挖掘需求數(shù)據(jù)挖掘算法需要細(xì)節(jié)級(jí)明細(xì)數(shù)據(jù)派生數(shù)據(jù)需求派生數(shù)據(jù)在計(jì)算時(shí)使用了其它的數(shù)據(jù)元素,除非在代價(jià)和開發(fā)時(shí)間方面有很大增長(zhǎng),否則所選的粒度級(jí)別應(yīng)該適用于存儲(chǔ)所有用于派生其它數(shù)據(jù)元素的元素。操作系統(tǒng)粒度操作源系統(tǒng)中有效的細(xì)節(jié)級(jí)別,對(duì)于不同粒度的源系統(tǒng)需要決定是否在最低的公共級(jí)別上抽取數(shù)據(jù),以使所有的數(shù)據(jù)很好的整合,或者從每一個(gè)系統(tǒng)中根據(jù)他的有效粒度來(lái)抽取數(shù)據(jù)。存儲(chǔ)開銷粒度級(jí)別對(duì)存儲(chǔ)開銷有很大影響備份和恢復(fù)數(shù)據(jù)倉(cāng)庫(kù)需要周期性地進(jìn)行備份和恢復(fù),細(xì)節(jié)越多,日常備份需要的時(shí)間也越多。數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別........影響數(shù)據(jù)倉(cāng)庫(kù)粒度級(jí)別的主要因素匯總數(shù)據(jù)影響因素描述當(dāng)前業(yè)務(wù)需79逆規(guī)范化指南問(wèn)題類型解決方法關(guān)系類型層次關(guān)系:子對(duì)父通常有很強(qiáng)的依賴性。傾向于將把這些概念逆規(guī)范化到一個(gè)實(shí)體同等關(guān)系:在獨(dú)立的表中保存獨(dú)立的實(shí)體,可以保證設(shè)計(jì)與業(yè)務(wù)規(guī)則保持一致。一對(duì)一關(guān)系:如果當(dāng)一個(gè)實(shí)體值僅與來(lái)自另一個(gè)實(shí)體的一個(gè)實(shí)體值相關(guān),反之亦然。傾向于逆規(guī)范化。確定關(guān)系:父實(shí)體決定子實(shí)體的意義。通常為事務(wù)處理數(shù)據(jù)到引用數(shù)據(jù)的關(guān)系和關(guān)系實(shí)體,在多對(duì)多關(guān)系引入的關(guān)系表被認(rèn)為是子,而參與多對(duì)多關(guān)系的兩個(gè)表被認(rèn)為是父。在事務(wù)處理引用關(guān)系中,事務(wù)處理表是子,而引用表是父。通常,子表很大且易變。父表通常穩(wěn)定的多且小。所以傾向于把這兩個(gè)實(shí)體保存在各自的表中。參與率確定關(guān)系中每個(gè)實(shí)體的參與性。對(duì)于一個(gè)給定的父實(shí)體數(shù)值,大概會(huì)有幾個(gè)子實(shí)體數(shù)值。父子關(guān)系越接近一對(duì)一,將父實(shí)體逆規(guī)范化到子實(shí)體,將有最小數(shù)量的冗余。父實(shí)體中有多少數(shù)據(jù)元素如果將父實(shí)體逆規(guī)范化到子實(shí)體,保證子實(shí)體中具有存放父實(shí)體的數(shù)據(jù)元素額外空間。使用率兩個(gè)實(shí)體的耦合或相關(guān)程度如何。如果在許多用戶查詢和發(fā)布中,來(lái)自兩個(gè)實(shí)體的數(shù)據(jù)元素將一起出現(xiàn),那么,如果這些信息在同一表中而不是分布于多個(gè)表之內(nèi),則信息獲取將會(huì)更快捷。父實(shí)體是否變化如果未來(lái)父實(shí)體不需要加入更多的數(shù)據(jù)元素或關(guān)系,那么新業(yè)務(wù)規(guī)則不會(huì)對(duì)父實(shí)體引起完整性和強(qiáng)制性影響。進(jìn)行逆規(guī)范化的可行性就較強(qiáng)。如果未來(lái)父實(shí)體需要加入更多的數(shù)據(jù)元素或關(guān)系,那么新父實(shí)體數(shù)據(jù)元素會(huì)引起額外的冗余和空間。為了避免將來(lái)的維護(hù)和冗余問(wèn)題,需要保持兩個(gè)實(shí)體的獨(dú)立性。變動(dòng)對(duì)比率在同一時(shí)間周期內(nèi),兩個(gè)實(shí)體的插入和更新頻率是否相近。主要考慮性能和數(shù)據(jù)同步問(wèn)題。即數(shù)據(jù)穩(wěn)定性。........逆規(guī)范化指南問(wèn)題類型解決方法關(guān)系類型層次關(guān)系:子對(duì)父通常有很80風(fēng)險(xiǎn)數(shù)據(jù)集市-匯總層........風(fēng)險(xiǎn)數(shù)據(jù)集市-匯總層....81風(fēng)險(xiǎn)數(shù)據(jù)集市-應(yīng)用層........風(fēng)險(xiǎn)數(shù)據(jù)集市-應(yīng)用層....82
數(shù)據(jù)倉(cāng)庫(kù)概念
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)架構(gòu)
邏輯數(shù)據(jù)模型數(shù)據(jù)模型標(biāo)準(zhǔn)化工藝流程主題........數(shù)據(jù)倉(cāng)庫(kù)概念主題....83步驟任務(wù)項(xiàng)目準(zhǔn)備與策劃模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相關(guān)的項(xiàng)目實(shí)施策略,包括確定數(shù)據(jù)源范圍,明確最終提交物和項(xiàng)目日程等。此外,模型設(shè)計(jì)人員在進(jìn)場(chǎng)前可參與提出客戶相關(guān)資料的具體需求,,包括一些參考模板,以保證后續(xù)工作的輸入。項(xiàng)目啟動(dòng)模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制定、標(biāo)準(zhǔn)文檔的客戶化,負(fù)責(zé)在整個(gè)項(xiàng)目組范圍內(nèi)組織模型培訓(xùn),明確LDM在整個(gè)信息架構(gòu)中的定位和作用,并就工作方法達(dá)成共識(shí)。系統(tǒng)需求模型設(shè)計(jì)人員參與業(yè)務(wù)訪談、數(shù)據(jù)和功能的需求分析系統(tǒng)設(shè)計(jì)系統(tǒng)設(shè)計(jì)工作是模型組工作的主體,主要由模型小組主導(dǎo)。它包括:信息調(diào)研、構(gòu)建概念模型、邏輯數(shù)據(jù)模型詳細(xì)設(shè)計(jì),以及物理數(shù)據(jù)模型設(shè)計(jì)。系統(tǒng)開發(fā)與單元測(cè)試模型設(shè)計(jì)人員主要起到支持的作用,為開發(fā)人員解釋模型設(shè)計(jì),協(xié)助驗(yàn)證單元測(cè)試的結(jié)果等,并根據(jù)測(cè)試發(fā)現(xiàn)的問(wèn)題進(jìn)行相應(yīng)修改和變更。數(shù)據(jù)模型標(biāo)準(zhǔn)工藝概述........步驟任務(wù)項(xiàng)目準(zhǔn)備與策劃模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相84項(xiàng)目準(zhǔn)備與策劃在項(xiàng)目準(zhǔn)備與策劃階段,模型設(shè)計(jì)人員的主要職責(zé)是參與制定模型相關(guān)的項(xiàng)目實(shí)施策略,包括確定數(shù)據(jù)源范圍,明確最終提交物和項(xiàng)目日程等。此外,模型設(shè)計(jì)人員在進(jìn)場(chǎng)前可參與提出客戶相關(guān)資料的具體需求,包括一些參考模板,以保證后續(xù)工作的輸入。確定項(xiàng)目人員本階段將確定參與項(xiàng)目實(shí)施的所有人員名單,包括全職和兼職人員。其中,在確定模型人員時(shí),需考慮對(duì)人員進(jìn)行如下要求:熟悉使用建模工具擁有豐富模型設(shè)計(jì)經(jīng)驗(yàn)熟悉銀行業(yè)務(wù)較強(qiáng)的溝通表達(dá)能力具備數(shù)據(jù)敏感性收集資料資料名稱資料說(shuō)明相關(guān)模板名稱系統(tǒng)數(shù)據(jù)結(jié)構(gòu)相關(guān)系統(tǒng)完整的數(shù)據(jù)結(jié)構(gòu)(含字段/代碼的取值說(shuō)明和索引等信息)供分析用源系統(tǒng)數(shù)據(jù)字典模板.xls業(yè)務(wù)需求客戶提供的各種業(yè)務(wù)需求材料
部門職能調(diào)查問(wèn)卷對(duì)目標(biāo)訪問(wèn)部門的職能/業(yè)務(wù)范圍進(jìn)行調(diào)研
訪談材料現(xiàn)狀介紹/業(yè)務(wù)調(diào)查問(wèn)卷/數(shù)據(jù)調(diào)查問(wèn)卷
制定實(shí)施策略明確與模型相關(guān)的數(shù)據(jù)源范圍里程碑提交物工作日程........項(xiàng)目準(zhǔn)備與策劃在項(xiàng)目準(zhǔn)備與策劃階段,模型設(shè)計(jì)人員的主要職責(zé)是85項(xiàng)目啟動(dòng)在項(xiàng)目啟動(dòng)階段,模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制定、標(biāo)準(zhǔn)文檔的客戶化,負(fù)責(zé)在整個(gè)項(xiàng)目組范圍內(nèi)組織模型培訓(xùn),明確數(shù)據(jù)模型在整個(gè)信息架構(gòu)中的定位和作用,并就工作方法達(dá)成共識(shí)。制定工作流程劃分不同小組的工作邊界確定模型組人員的工作分工確定項(xiàng)目組內(nèi)部以及對(duì)外的工作模式對(duì)公司標(biāo)準(zhǔn)項(xiàng)目實(shí)施流程進(jìn)行客戶化進(jìn)行模型培訓(xùn)介紹源系統(tǒng)由客戶介紹源系統(tǒng),內(nèi)容包括:系統(tǒng)架構(gòu)/設(shè)計(jì)思想/系統(tǒng)定位業(yè)務(wù)功能/重要流程關(guān)鍵數(shù)據(jù)表以及關(guān)系和其他系統(tǒng)的關(guān)系培訓(xùn)內(nèi)容相關(guān)模板名稱數(shù)據(jù)模型的基本概念、定位及常用的建模方法數(shù)據(jù)模型培訓(xùn)模板.ppt模型設(shè)計(jì)規(guī)范邏輯數(shù)據(jù)模型設(shè)計(jì)規(guī)范模板.pdf數(shù)據(jù)模型設(shè)計(jì)工具
模型產(chǎn)品培訓(xùn)
【可選,依是否使用模型產(chǎn)品而定】
........項(xiàng)目啟動(dòng)在項(xiàng)目啟動(dòng)階段,模型設(shè)計(jì)人員參與模型相關(guān)的工作流程制86系統(tǒng)需求在系統(tǒng)需求階段,模型設(shè)計(jì)人員參與配合業(yè)務(wù)顧問(wèn)(以業(yè)務(wù)顧問(wèn)為主導(dǎo)),進(jìn)行需求分析、業(yè)務(wù)訪談工作,對(duì)需求人員所編寫的《業(yè)務(wù)需求說(shuō)明書》就模型相關(guān)部分進(jìn)行
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于冠狀動(dòng)脈CTA評(píng)估性別、年齡對(duì)左冠狀動(dòng)脈前降支心肌橋解剖結(jié)構(gòu)及血流儲(chǔ)備分?jǐn)?shù)的影響
- 成都高一上冊(cè)數(shù)學(xué)試卷
- 二零二四年度醫(yī)院間緊急救援物資調(diào)配與轉(zhuǎn)診服務(wù)協(xié)議3篇
- 2025年度鉆井安全應(yīng)急預(yù)案合同范本4篇
- 2025年度茶葉電商平臺(tái)流量互換合作合同4篇
- 4 選舉產(chǎn)生班委會(huì) 說(shuō)課稿-2024-2025學(xué)年道德與法治五年級(jí)上冊(cè)統(tǒng)編版
- 二零二五年度公共廁所智能化改造與運(yùn)維服務(wù)合同4篇
- 四年級(jí)數(shù)學(xué)(小數(shù)加減運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案
- 2025版木托盤安全檢測(cè)與認(rèn)證合同4篇
- 2025年度體育賽事場(chǎng)地租賃及賽事組織服務(wù)協(xié)議9篇
- 泌尿:膀胱腫瘤病人的護(hù)理查房王雪-課件
- 標(biāo)點(diǎn)符號(hào)的研究報(bào)告
- 服務(wù)器報(bào)價(jià)表
- 2025年高考化學(xué)試題分析及復(fù)習(xí)策略講座
- 2024-2029年中國(guó)制漿系統(tǒng)行業(yè)市場(chǎng)現(xiàn)狀分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告
- 大門封條模板
- 【“凡爾賽”網(wǎng)絡(luò)流行語(yǔ)的形成及傳播研究11000字(論文)】
- ppr管件注塑工藝
- 液化氣站其他危險(xiǎn)和有害因素辨識(shí)及分析
- 高中語(yǔ)文教學(xué)課例《勸學(xué)》課程思政核心素養(yǎng)教學(xué)設(shè)計(jì)及總結(jié)反思
- 中國(guó)農(nóng)業(yè)銀行小微企業(yè)信貸業(yè)務(wù)貸后管理辦法規(guī)定
評(píng)論
0/150
提交評(píng)論