




已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
商業(yè)智能實施方案,2020年5月18日,1、實施方法,2、實施步驟,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,項目具體實施步驟,項目前期準備,業(yè)務探索,信息探索,邏輯數據模型,1.項目前期準備2.業(yè)務探索(BusinessDiscovery)3.信息探索(InformationDiscovery)4.邏輯數據模型設計5.系統(tǒng)體系結構設計6.物理數據庫設計7.數據轉換加載ETL8.前端應用開發(fā)9.數據挖掘服務10.元數據管理11.數據倉庫管理(處理流程與操作)12.解決方案集成(測試驗收與試運行),2.1項目前期準備,主要任務:項目啟動會議(Kick-offMeeting)確認項目范圍和主要目標確認項目階段性驗收及總體驗收標準確認項目實施計劃成立項目組確定各項目小組的成員及各自的工作職責確定各項目小組的階段性工作目標確定教育訓練計劃確定服務流程及方式交付項目:項目組織機構項目人員組成,項目前期準備,業(yè)務探索,信息探索,邏輯數據模型,2.2業(yè)務探索(BusinessDiscovery),主要任務:確定重點用戶與數據源用戶需求調研與確認數據源確認用戶需求和數據源的篩選和分析交付項目:業(yè)務需求說明書BRL(BusinessRequirementList)概念數據模型CDM(ConceptualDataModel),項目前期準備,業(yè)務探索,信息探索,邏輯數據模型,2.3信息探索(InformationDiscovery),主要任務:分析用戶需求數據源分析進行工具評估系統(tǒng)安全性設計系統(tǒng)命名規(guī)范設計交付項目:功能需求列表FRL(FunctionRequirementList)系統(tǒng)安全性設計說明書系統(tǒng)命名規(guī)范說明書數據質量分析,項目前期準備,業(yè)務探索,信息探索,邏輯數據模型,2.4邏輯數據模型設計,主要任務:進行原始數據分析建立實體模型建立實體間依賴關系完善并填入所有屬性建立數據庫邏輯模型利用工具:Erwin/PowerDesigner交付項目:數據倉庫邏輯數據模型LDM邏輯數據模型說明書,項目前期準備,業(yè)務探索,信息探索,邏輯數據模型,2.4邏輯數據模型概念,邏輯數據模型是用來發(fā)現、記錄和溝通業(yè)務的詳細“藍圖”,基于概念數據模型(CDM)由一系列表和實體詳細描述組成通用的業(yè)務語言便于業(yè)務與業(yè)務之間的功能理解集成當前和未來數據的藍圖獨立于技術為物理數據庫設計作準備是IT人員和業(yè)務人員溝通的工具,2.4邏輯數據模型(LDM)示例,2.5系統(tǒng)體系結構設計,主要任務:對業(yè)務、技術環(huán)境及企業(yè)文化的充分了解,從技術、組織、教育和支持等方面對系統(tǒng)進行全面評估定義業(yè)務驅動力定義數據倉庫成功的關鍵因素定義數據倉庫的實施原則對系統(tǒng)體系結構各個組件進行詳細設計交付項目:系統(tǒng)體系結構設計說明書,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.5體系結構設計組件,用戶類型拓撲結構網絡存取與互連組織機構安全性數據體系結構邏輯數據模型元數據數據質量命名規(guī)范數據采集與轉換用戶存取及工具備份系統(tǒng)操作管理,2.6物理數據庫設計,主要任務:轉換邏輯數據模型(LDM)為物理數據模型定義主索引、次索引非正則化處理數據庫建立設計優(yōu)化數據庫功能測試使用工具:ERWwin交付項目:物理數據模型(LDM)物理數據模型說明書數據庫描述語言DDL,建模方法:第三范式3NF星型結構雪花狀結構,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.6數據模型的演變,概念數據模型(CDMConceptualDataModel)主要實體和它們的關系(MajorEntitiesandTheirRelationships)邏輯數據模型(LDM-LogicalDataModel)業(yè)務模型加(CDMPlus):所有的表及簡單的數據(AllTableswithSampleData)輔助的表及簡單的數據(MinorTableswithSampleData)主鍵與外鍵的關系(PK&FKRelationships)數據約束(Constraints)屬性(Attributes)擴展邏輯數據模型(ELDM-ExtendedLogicalDataModel)邏輯數據模型加(LDMPlus):存取詳細描述(AccessDemographics)數據詳細描述(DataDemographics)物理數據模型(PDM-PhysicalDataModel)擴張邏輯數據模型(ELDMPlus):索引(Indices)非正則化(Denormalization),2.6非正則化處理(Denormalization),非正則化的兩種類型:物理非正則化派生數據(DerivedData)匯總表(SummaryTables)重復的Groups(RepeatingGroups)多物理表(MultiplePhysicalTables)預連接(Pre-joins)子實體(Sub-entities)邏輯非正則化視圖(Views)邏輯星型結構(LogicalStarSchemas)物理非正則化對模型的靈活性會有影響邏輯非正則化是一個優(yōu)選的方法(OLAP實現),2.6物理數據模型(PDM),2.7數據轉換與加載(ETL),主要任務:數據源及其特性定義數據析取、轉換和加載策略設計構建和測試初始加載的程序和處理流程構建和測試日常加載的程序和處理流程40%的工作量在數據轉換與加載上使用工具:Sagent或Datastage、Informatic交付項目:數據轉換加載設計說明書數據映射(DataMapping)說明書數據轉換加載腳本(ETLScripts)加載流程控制(ETLProcessControl),數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.7數據清洗方法,在源系統(tǒng)上進行清洗(數據析取前)在加載服務器上進行清洗(數據析取后、加載前)在數據倉庫里進行清洗(數據加載后),源系統(tǒng),ETL服務器,數據倉庫,2.7數據轉換常用手段,析取Extracting條件Conditioning剔除Scrubbing合并Merging濃縮Enrichment確認Validating加載Loading評分Scoring關系識別Householding,2.8前端應用開發(fā),主要任務:前端應用體系結構設計OLAP應用設計(Summary/Fact表及Cub的產生)前端應用開發(fā)(隨機查詢、預定義報表、OLAP應用)撰寫用戶使用手冊用戶測試驗收使用工具:查詢報表工具(Hyperionperformancesuit)OLAP工具(Essbase)基于Web的開發(fā)工具(J2EE)其他開發(fā)工具,如:Portal交付項目:前端應用體系結構設計說明書應用模塊設計說明書用戶使用手冊,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.10元數據管理,元數據(Metadata)是指關于數據的數據,即用來描述數據的類型、來源、定義、存儲位置,使得業(yè)務用戶可以正確地使用數據倉庫。,主要任務:定義元數據使用功能設計元數據環(huán)境邏輯結構設計元數據環(huán)境物理結構選擇合適的元數據管理工具建立元數據倉庫(MetadataRepository)建立和測試元數據接口使用工具:ETLTOOLS交付項目:元數據管理說明書,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.10元數據開發(fā),元數據的開發(fā)應該包含在數據倉庫實施過程的每一步驟中,下圖是元數據各部分內容與數據倉庫開發(fā)過程的對應關系:,2.11數據倉庫管理,主要任務:設計和開發(fā)數據倉庫支持體系結構開發(fā)和測試數據倉庫日常運作流程開發(fā)和測試性能監(jiān)視程序開發(fā)和測試數據備份與恢復程序開發(fā)和測試安全系統(tǒng)設計和開發(fā)操作人員/最終用戶培訓計劃建立用戶支持和培訓材料使用工具:系統(tǒng)監(jiān)控工具和管理工具交付項目:數據倉庫管理過程說明書數據備份過程設計說明書安全管理模塊設計說明書用戶培訓計劃及用戶使用手冊,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,2.12解決方案集成,主要任務:建立并執(zhí)行集成測試計劃建立并執(zhí)行數據倉庫平臺測試計劃建立并執(zhí)行系統(tǒng)驗收測試計劃移植開發(fā)系統(tǒng)到生產系統(tǒng)執(zhí)行用戶培訓計劃實施數據倉庫管理基礎設施項目實施完成回顧項目狀態(tài)交付項目:數據轉換管理系統(tǒng)測試報告數據訪問和信息發(fā)布系統(tǒng)測試報告數據倉庫平臺測試報告數據倉庫管理過程測試報告系統(tǒng)回顧報告,數據倉庫管理,物理數據模型,數據轉換,應用開發(fā),數據挖掘服務,系統(tǒng)體系結構設計,元數據管理,解決方案集成,總結:主要步驟及文檔間關系,BusinessDiscovery(業(yè)務探索)業(yè)務需求說明書(BRL)概念數據模型(CDM),物理數據庫設計物理數據模型(PDM)數據庫描述語言(DDL)數據轉換加載(ETL)數據加載設計說明書數據映射(DataMapping)轉換加載腳本(ETLScripts)加載流程控制(ETLControl)前端應用設計前端應用體系結構前端應用設計說明書Summa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 戰(zhàn)略投資與風險評估方式試題及答案
- 法學概論考試中的選擇題技巧與試題及答案
- 行政法學的歷史與發(fā)展及試題
- 軟件設計師備考常見問題將解答試題及答案
- 加強公司財務內控的工作計劃
- 隨州市隨縣事業(yè)單位2025年統(tǒng)一公開招聘筆試歷年典型考題及考點剖析附帶答案詳解
- 硬件接口設計基礎知識試題及答案
- 行政管理考試知識體系建立:試題及答案
- 分布式系統(tǒng)的設計與實現能力測試試題及答案
- 重要信息處理軟件試題及答案參考
- 畜牧養(yǎng)殖大型沼氣項目可行性研究報告
- 陳志海-發(fā)熱伴血小板減少綜合征
- 2024年武漢長江科創(chuàng)科技發(fā)展有限公司招聘筆試參考題庫附帶答案詳解
- 《土石壩瀝青混凝土面板和心墻設計規(guī)范》
- 世紀大道石灰固化土QC成果
- 人工打樁施工計劃書
- 傳奇輔助腳本
- 宗教場所消防安全培訓課件
- 2024年廣東湛江交通投資集團招聘筆試參考題庫含答案解析
- 中華人民共和國人民武裝警察法釋義
- 華為經營管理-華為供應鏈管理(6版)
評論
0/150
提交評論