




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、為什么選擇數(shù)據(jù)倉庫隨著信息化建立的不斷推進,產(chǎn)生了大量的數(shù)據(jù)。必需合文科學的運用這些數(shù)據(jù),為業(yè)務決策提供強有力的數(shù)據(jù)支持。簡單的報表運用曾經(jīng)無法滿足需求,因此需求運用更強大數(shù)據(jù)倉庫及其相關運用。平臺作為財政數(shù)據(jù)平臺有著規(guī)范化的存儲構造和全面多樣的業(yè)務數(shù)據(jù),可以作為財政數(shù)據(jù)倉庫的可靠數(shù)據(jù)來源。.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實例引見.數(shù)據(jù)倉庫概念歷史 數(shù)據(jù)倉庫概念始于上世紀80年代中期,初次出現(xiàn)是在被譽為“數(shù)據(jù)倉庫之父William H . Inmon的一書中。定義 數(shù)據(jù)倉庫是在管理和決策中面向主題的、集成的、隨時間變化的、相
2、對穩(wěn)定的數(shù)據(jù)集合按技術劃分 抽取、存儲與管理、數(shù)據(jù)的表現(xiàn)決策支持系統(tǒng)(DSS, Decision Support System) 準確、平安、可靠地取出數(shù)據(jù),經(jīng)過加工轉換成有規(guī)律信息之后,再供管理人員進展分析運用。.商業(yè)智能的概念BI 商業(yè)智能的中心內(nèi)容是從業(yè)務處置系統(tǒng)的數(shù)據(jù)中,提取出有用的數(shù)據(jù),進展清理以保證數(shù)據(jù)的正確性,然后經(jīng)過抽取Extraction、轉換Transformation和裝載Load,即ETL 過程,整合到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)信息的一個全局視圖,在此根底上利用適宜的查詢和分析工具、數(shù)據(jù)發(fā)掘工具等對數(shù)據(jù)倉庫里的數(shù)據(jù)進展分析和處置,構成信息,甚至進一步把信息提煉
3、出輔助決策的知識,最后把知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。.商業(yè)智能的概念BI.傳統(tǒng)的決策方式.商業(yè)智能環(huán)境下的決策流程.數(shù)據(jù)倉庫與商業(yè)智能關系 數(shù)據(jù)倉庫是商業(yè)智能的根底。數(shù)據(jù)倉庫 數(shù)據(jù)倉庫從概念上更多地偏重在對各類信息的整合任務,包括了數(shù)據(jù)的遷移,數(shù)據(jù)的組織和存儲,數(shù)據(jù)的管理與維護這些我們平常稱之為后臺的根底性的數(shù)據(jù)預備任務。商業(yè)智能 商業(yè)智能那么偏重在數(shù)據(jù)查詢和報告、多維/聯(lián)機數(shù)據(jù)分析、數(shù)據(jù)發(fā)掘和數(shù)據(jù)可視化工具這些平常稱之為所謂前臺的數(shù)據(jù)運用方面,其中數(shù)據(jù)發(fā)掘是商業(yè)智能中比較高層次的一種運用。.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構造主流數(shù)據(jù)
4、倉庫產(chǎn)品對比分析實例引見.數(shù)據(jù)倉庫、商業(yè)智能的體系構造數(shù)據(jù)源ETL數(shù)據(jù)倉庫數(shù)據(jù)集市元數(shù)據(jù)OLAP.1.數(shù)據(jù)源平臺數(shù)據(jù)庫外部數(shù)據(jù)格式:txt、excel、dbf等文件格式其它數(shù)據(jù)庫.2、ETLE : Extract 從源數(shù)據(jù)抽取數(shù)據(jù)T : Transform 把抽取的數(shù)據(jù)進展轉換L : Load 把轉換好的數(shù)據(jù)裝載到數(shù)據(jù)倉庫中。.3、數(shù)據(jù)倉庫數(shù)據(jù)倉庫的一個目的就是把企業(yè)的信息訪問根底從一種非構造化的改動成一種構造化、開展中的環(huán)境改動成規(guī)劃良好的環(huán)境。業(yè)務處置系統(tǒng)是面向運用來設計的,更準確地說是面向買賣來設計。而數(shù)據(jù)倉庫普通來說是按主題(Subject)來建模, 是面向查詢主題的。.3.數(shù)據(jù)倉庫數(shù)
5、據(jù)倉庫的關鍵特征星型方式粒度分割.3.數(shù)據(jù)倉庫-關鍵特征面向主題的subject-oriented集成的integrated時變的time-variant非易失的nonvolatile 數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)存 儲,它充任決策支持數(shù)據(jù)模型的物理實現(xiàn),并存放業(yè)務決策所需信息。數(shù)據(jù)倉庫經(jīng)過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一同而構造,支持構造化的和專門的查詢、分析報告和決策。.3.數(shù)據(jù)倉庫-星型方式.3.數(shù)據(jù)倉庫-星型方式.3.數(shù)據(jù)倉庫-粒度 粒度是對數(shù)據(jù)倉庫中的數(shù)據(jù)的匯總程度高低的一個度量,按省級匯總或按市級匯總就是不同的粒度它既影響數(shù)據(jù)倉庫中的數(shù)據(jù)量的多少,也影響數(shù)據(jù)倉庫所能回答訊問信息的種類
6、。在數(shù)據(jù)倉庫中,多維粒度是必不可少的。由于數(shù)據(jù)倉庫的主要作用是多維分析,因此絕大多數(shù)查詢都基于一定程度的匯總數(shù)據(jù)之上的,只需極少數(shù)查詢涉及到細節(jié)。.分割 分割,目的在于提高效率。它是將數(shù)據(jù)分散到各自的物理單元中去, 以便能分別獨立處置,以實現(xiàn)查詢操作的并行。有許多數(shù)據(jù)分割的規(guī)范可供參考:如時間、地域、業(yè)務領域等等,也可以是其組合。普通而言,分割規(guī)范總應包括一些能讓它非常自然而且分割均勻的工程,例如時間項。.4、數(shù)據(jù)集市 數(shù)據(jù)集市分兩種,獨立的數(shù)據(jù)集市Independent Data Mart和從屬的數(shù)據(jù)集市Dependent Data Mart。.兩種數(shù)據(jù)集市對比對比優(yōu)點缺點從屬數(shù)據(jù)集市 保證
7、數(shù)據(jù)一致性;架構比較理想,可擴展能力強依賴與中心數(shù)據(jù)倉庫的實施;實施周期長;實施成本高;獨立數(shù)據(jù)集市實施周期短;實施成本低;沒有消除信息分割;可擴展能力弱;后期整合困難。財政領域運用在平臺實施的根底上以從屬數(shù)據(jù)集市為主。.5.元數(shù)據(jù)(Meta-data) 定義: “關于數(shù)據(jù)的數(shù)據(jù),是描畫和管理數(shù)據(jù)倉庫本身內(nèi)容對象、用來表示數(shù)據(jù)項的意義及其在系統(tǒng)各組成部件之間的關系的數(shù)據(jù)。數(shù)據(jù)倉庫的元數(shù)據(jù)包括:1數(shù)據(jù)資源:包括各個數(shù)據(jù)源的模型,描畫源數(shù)據(jù)表字段屬性及業(yè)務含義,源數(shù)據(jù)到數(shù)據(jù)倉庫的映射關系;2數(shù)據(jù)組織:數(shù)據(jù)倉庫、數(shù)據(jù)集市表的構造、屬性及業(yè)務含義,多維構造等;3數(shù)據(jù)運用:查詢與報表輸出格式描畫、OLA
8、P、數(shù)據(jù)發(fā)掘等的數(shù)據(jù)模型的信息展現(xiàn)、商業(yè)術語;4數(shù)據(jù)管理:這里包括數(shù)據(jù)倉庫過程以及數(shù)據(jù)倉庫操作結果的模型,包括描畫數(shù)據(jù)抽取和清洗規(guī)那么、數(shù)據(jù)加載控制、暫時表構造、用途和運用情況、數(shù)據(jù)匯總控制。.5.元數(shù)據(jù)類型業(yè)務元數(shù)據(jù) 用業(yè)務稱號、定義、描畫和別名來表示數(shù)據(jù)倉庫和業(yè)務系統(tǒng)中的各種屬性,直接供最終用戶運用。業(yè)務元數(shù)據(jù)使最終用戶可以更好了解、運用數(shù)據(jù)倉庫,成為最終用戶在數(shù)據(jù)倉庫中的業(yè)務信息地圖。技術元數(shù)據(jù) 技術元數(shù)據(jù)描畫了源系統(tǒng)、數(shù)據(jù)轉換、抽取過程、任務流、加載戰(zhàn)略以及目的數(shù)據(jù)庫的定義等。用來進展影響分析、變化管理、數(shù)據(jù)庫優(yōu)化、義務調度和平安管理等。操作元數(shù)據(jù) 操作元數(shù)據(jù)描畫了目的表中的信息,如粒
9、度、創(chuàng)建目的表和索引的信息、刷新時間、記錄數(shù)、按時執(zhí)行義務的設置以及有權訪問數(shù)據(jù)的用戶。操作元數(shù)據(jù)用于數(shù)據(jù)倉庫的維護和分布。.多維分析OLAPOLAP (On-Line analytical Processing) 在線分析處置切片和切塊(Slice and Dice)鉆取(Drill)旋轉(Rotate).6 、OLAP分析是一類軟件技術分析人員能從多個角度獲得對數(shù)據(jù)的更深化了解特點:快速、一致、交互多維視圖分析數(shù)據(jù)的工具根據(jù)用戶常用的多種分析角度,事先計算好一些輔助構造,以便在查詢時能盡快訪問到所要的匯總數(shù)字,并快速地從一維轉變到另一維,將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展
10、如今用戶面前。.切片和切塊(Slice and Dice)切片取二維數(shù)據(jù),稱為切片。切塊 取三維數(shù)據(jù),稱為切塊。.切片和切塊(Slice and Dice).鉆取(Drill) 鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)操作, 鉆取的深度與維所劃分的層次相對應。.旋轉(Rotate).數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實例引見.主流數(shù)據(jù)倉庫產(chǎn)品對比分析1.數(shù)據(jù)倉庫產(chǎn)品引見2.產(chǎn)品支撐技術.主要數(shù)據(jù)倉庫產(chǎn)品供應商引見OracleIBMMicrosoftSASTeradataSybaseBusiness
11、Objects(SAP).Oracle 引見 Oracle公司的數(shù)據(jù)倉庫處理方案包含了數(shù)據(jù)庫平臺、開發(fā)工具和運用系統(tǒng),可以提供一系列的數(shù)據(jù)倉庫工具集和效力,具有多用戶數(shù)據(jù)倉庫管理才干,多種分區(qū)方式,與OLAP工具的交互才干,及數(shù)據(jù)挪動機制等特性。Oracle的優(yōu)勢在于大多數(shù)業(yè)務系統(tǒng)采用oracle數(shù)據(jù)庫。.IBM 引見 IBM公司的數(shù)據(jù)倉庫產(chǎn)品稱為DB2 Data Warehouse Edition,它結合了DB2數(shù)據(jù)效力器的優(yōu)點和IBM的商業(yè)智能根底設備,集成了用于倉庫管理、數(shù)據(jù)轉換、數(shù)據(jù)發(fā)掘以及OLAP分析和報告的中心組件,提供了一套基于可視數(shù)據(jù)倉庫的商業(yè)智能處理方案。IBM的優(yōu)勢在于處理
12、方案比較完善。.Microsoft 引見 微軟的SQL Server提供了三大效力和一個工具來實現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構建典型和創(chuàng)新的分析運用程序所需的各種特性、工具和功能,可以實現(xiàn)建模、ETL、建立查詢分析或圖表、定制KPI、建立報表和構造數(shù)據(jù)發(fā)掘運用及發(fā)布等功能。微軟的優(yōu)勢在于簡單易用。.SAS SAS公司的數(shù)據(jù)倉庫處理方案是一個由30多個公用模塊構成的架構體系,順應于對企業(yè)級的數(shù)據(jù)進展重新整合,支持多維、快速查詢,提供效力于OLAP操作和決策支持的數(shù)據(jù)采集、管理、處置和展現(xiàn)功能。SAS優(yōu)勢在于數(shù)據(jù)發(fā)掘和統(tǒng)計分析。.Teradata Teradata公司提出了可擴展數(shù)據(jù)倉
13、庫根本架構,包括數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個部分,是高端數(shù)據(jù)倉庫市場最有力競爭者,主要運轉在基于Unix操作系統(tǒng)平臺的NCR硬件設備上,在銀行領域運用廣泛。.Sybase 引見 Sybase提供了稱為Warehouse Studio的一整套覆蓋整個數(shù)據(jù)倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)集成和轉換、數(shù)據(jù)存儲和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視化分析等產(chǎn)品。.Business ObjectsSAP 引見 Business Objects是BI工具,集查詢、報表和OLAP技術為一身的智能決策支持系統(tǒng),具有較好的查詢和報表功能,提供多維分析技術,支持多種數(shù)據(jù)庫,同時它還支持基于Web閱讀器的查
14、詢、報表和分析決策。被SAP收買后,目前還沒有完好數(shù)據(jù)倉庫處理方案。.主流數(shù)據(jù)倉庫產(chǎn)品對比分析數(shù)據(jù)倉庫產(chǎn)品引見支撐技術.數(shù)據(jù)倉庫技術1、數(shù)據(jù)庫技術2、ETL技術3、OLAP技術4、報表技術5、數(shù)據(jù)發(fā)掘技術.數(shù)據(jù)庫技術 數(shù)據(jù)庫技術是支撐數(shù)據(jù)倉庫技術的根底技術。雖然在數(shù)據(jù)倉庫技術存儲模型方面,基于數(shù)據(jù)庫技術而開展的關系方式的理念曾經(jīng)被顛覆,取而代之是各種各樣的數(shù)據(jù)倉庫數(shù)據(jù)模型,如星型模型,雪花模型等。然而,在已有的數(shù)據(jù)倉庫實際中,關系數(shù)據(jù)庫依然是本質的數(shù)據(jù)庫存儲工具,只是將數(shù)據(jù)庫表改稱為了現(xiàn)實表和維表,將屬性域之間的關系重新定義為維度,量度,層次,粒度等。.數(shù)據(jù)倉庫后臺數(shù)據(jù)庫比較產(chǎn)品供應商數(shù)據(jù)庫產(chǎn)
15、品效率兼容性管理磁盤空間OracleOracle優(yōu)IBMDB2優(yōu)MicrosoftSQL Server優(yōu)SASTeradataTeradata差差SybaseSybase IQ優(yōu)優(yōu)SAP.ETL技術 數(shù)據(jù)倉庫系統(tǒng)是集成的、與時間相關的數(shù)據(jù)集合,ETL作為數(shù)據(jù)倉庫的中心,擔任將分布的、異構數(shù)據(jù)源中的數(shù)據(jù)進展抽取、清洗、轉換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機分析處置、數(shù)據(jù)發(fā)掘的根底。ETL可以按照一致的規(guī)那么集成并提高數(shù)據(jù)的價值,是擔任完成數(shù)據(jù)從數(shù)據(jù)源向目的數(shù)據(jù)倉庫轉化的過程,是實施數(shù)據(jù)倉庫的重要步驟。要實現(xiàn)數(shù)據(jù)倉庫中數(shù)據(jù)的自動更新運轉,ETL技術是必不可少的關鍵技術之一。.產(chǎn)品供應
16、商ETL 工具特點OracleOracle Warehouse Builder (OWB)數(shù)據(jù)倉庫組件IBMIBM WebSphere DataStage整個ETL過程提供了一個圖形化的開發(fā)環(huán)境,支持對多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉換和維護,并將其輸入數(shù)據(jù)集或數(shù)據(jù)倉庫MicrosoftIntegration Services數(shù)據(jù)倉庫組件SASETL Studio管理ETL流程和建立數(shù)據(jù)倉庫、數(shù)據(jù)集市和OLAP結構的單控制點TeradataETL Automation利用Teradata數(shù)據(jù)庫本身的并行處理能力,通過SQL語句實現(xiàn)數(shù)據(jù)的轉換,提供對ETL流程的支持,包括前后依賴、執(zhí)行和監(jiān)控等Syb
17、aseData Integration Suite數(shù)據(jù)倉庫組件SAPData Integrator數(shù)據(jù)倉庫組件InformaticaPowerCenter二次開發(fā)、集成和開放性強于其它.OLAP技術 聯(lián)機分析處置(OLAP)是針對特定問題的聯(lián)機數(shù)據(jù)訪問和分析,經(jīng)過對信息進展快速、穩(wěn)定、一致和交互式的存取,對數(shù)據(jù)進展多層次、多階段的分析處置,以獲得高度歸納的分析結果。聯(lián)機事務處置(OLTP)已不能滿足終端用戶對數(shù)據(jù)庫查詢分析的需求,SQL對大數(shù)據(jù)庫進展的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需求對關系數(shù)據(jù)庫進展大量計算才干得到結果,而查詢的結果并不能滿足決策者提出的需求,由此出現(xiàn)了多維
18、數(shù)據(jù)庫和多維分析的概念。.產(chǎn)品供應商OLAP產(chǎn)品OLAP分析工具數(shù)據(jù)庫特點OracleExpress/Discoverer支持DB2,Oracle,SQL Server,Sybase等對自己的數(shù)據(jù)庫產(chǎn)品的支持均好于其它數(shù)據(jù)庫,分析工具基于開放的OLE DB標準,可以訪問支持OLE DB標準的數(shù)據(jù)立方體IBMCOGNOSMicrosoftAnalysis ServicesSASOLAP ServerTeradata提供了相關技術,用于提升運行于Teradata數(shù)據(jù)庫上的OLAP應用系統(tǒng)的性能SybasePower Dimension標準OLAP API能夠對Microsoft、IBM等OLAP數(shù)
19、據(jù)進行劃分、鉆取等處理,兼容第三方報表和展現(xiàn)工具SAPOLAP Intelligence.報表技術 報表技術主要是將集成在數(shù)據(jù)模型里的數(shù)據(jù),按照復雜的格式、指定行列統(tǒng)計項,計算構成的特殊表格。普通的簡單報表可以運用通用的前臺展現(xiàn)技術實現(xiàn),而復雜的報表那么需求運用特定的報表技術。主流的報表技術都可以靈敏的制定各種報表模版庫和目的庫,并根據(jù)每個區(qū)塊或單元格的需求援用目的,實現(xiàn)一系列復雜的符合要求的報表的自動生成。.產(chǎn)品供應商報表工具特點OracleOracle Reports提供了自由的數(shù)據(jù)格式方式,可以自動生成個性化字母或矩陣風格的布局,包括動態(tài)、數(shù)據(jù)驅動的圖表IBMCOGNOS覆蓋了各種報表需
20、求,包括管理報表、商業(yè)報表、賬單和發(fā)票等。基于Olap server 實現(xiàn)查詢分析操作.MicrosoftReporting Services (SSRS)(含)處理組件、一整套可用于創(chuàng)建和管理報表的工具、在自定義應用程序中集成和擴展數(shù)據(jù)和報表處理的APISASReport Studio功能、性能、二次開發(fā)等方面都還存在著一定的差距TeradataBTEQSybaseInfoMakerSAPCrystal Reports提供了一個完整的企業(yè)報表解決方案Crystal Reports Server,支持通過Web快速便捷的創(chuàng)建、管理和交付報表.數(shù)據(jù)發(fā)掘技術 當數(shù)據(jù)積累到一定數(shù)量時,某些潛在聯(lián)絡、
21、分類、推導結果和待發(fā)現(xiàn)價值隱藏在其中,可以運用數(shù)據(jù)開掘工具協(xié)助發(fā)現(xiàn)這些有價值的數(shù)據(jù)。數(shù)據(jù)發(fā)掘就是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又能夠有用的信息和知識的過程。經(jīng)過數(shù)據(jù)發(fā)掘能找出數(shù)據(jù)庫中隱藏的信息,實現(xiàn)用模型來擬合數(shù)據(jù)、探求型數(shù)據(jù)分析,數(shù)據(jù)驅動型的發(fā)現(xiàn),演繹型學習等功能。.產(chǎn)品供應商挖掘工具特點OracleOracle Data Miner提供圖形用戶界面,通過向導來指導完成數(shù)據(jù)準備、數(shù)據(jù)挖掘、模型評估和模型評價過程,根據(jù)需要自動生成將數(shù)據(jù)挖掘步驟轉換成一個集成的數(shù)據(jù)挖掘/BI應用程序所需的代碼IBMIBM Intelligent Miner數(shù)據(jù)集自動生成、關聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)
22、現(xiàn)、概念性分類和可視化呈現(xiàn),可以自動實現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉換、數(shù)據(jù)發(fā)掘和結果呈現(xiàn)這一整套數(shù)據(jù)發(fā)掘操作Microsoft數(shù)據(jù)挖掘平臺不同于傳統(tǒng)數(shù)據(jù)挖掘應用程序,它支持組織中數(shù)據(jù)的整個開發(fā)生命周期,允許第三方添加自定義算法以支持特定的挖掘需求,支持實時根據(jù)挖掘的數(shù)據(jù)集進行數(shù)據(jù)驗證。SASSAS Enterprise Miner數(shù)據(jù)挖掘過程簡單流程化,支持關聯(lián)、聚類、決策樹、神經(jīng)元網(wǎng)絡和經(jīng)典的統(tǒng)計回歸技術TeradataTeradata Warehouse Miner將數(shù)據(jù)挖掘技術整合到數(shù)據(jù)倉庫來簡化數(shù)據(jù)挖掘流程,還可實現(xiàn)將多家廠商的數(shù)據(jù)挖掘技術嵌入Teradata企業(yè)級數(shù)據(jù)倉庫環(huán)境中運行Sybase
23、無SAP無.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實例引見.實例引見1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.數(shù)據(jù)建模業(yè)務梳理整理并提取出維度、度量和現(xiàn)實表建立模型.數(shù)據(jù)建模-業(yè)務系統(tǒng)數(shù)據(jù)庫構造關系型數(shù)據(jù)庫1.目的表單位代碼功能分類id項目編碼經(jīng)濟分類id金額001001203010120080101301010120333.00 2.方案表單位代碼功能分類id項目編碼經(jīng)濟分類id金額00100120301012008010
2400 3.支付表單位代碼功能分類id項目編碼經(jīng)濟分類id金額0010012030101200801013010101333.00 .模型-星型模型預算單位 業(yè)務表現(xiàn)實表功能分類目的來源資金性質業(yè)務處室目的類型預算工程支付方式.數(shù)據(jù)建模過程業(yè)務系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)倉庫1.目的表單位代碼功能分類id項目編碼經(jīng)濟分類id金額001001203010120080101301010120333.00 2.方案表單位代碼功能分類id項目編碼經(jīng)濟分類id金額0010012030101200801013010101444.00 3.支付表單位代碼功能分類id項目編碼經(jīng)濟分類id金額00100
25、12030101200801013010101333.00 .數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.ETL的本質ETL代表抽取(Extract),轉換(Transform),裝載(Load ),ETL的過程就是數(shù)據(jù)流動的過程,從不同的異構數(shù)據(jù)源流向一致的目的數(shù)據(jù),其間,數(shù)據(jù)的抽取、清洗、轉換和裝載構成串行或并行的過程 。.數(shù)據(jù)倉庫中ETL的特點數(shù)據(jù)同步ETL周期性的,經(jīng)常性的活動,不是一次性完成的。數(shù)據(jù)量 ETL的數(shù)據(jù)量普通都是宏大的,值得將數(shù)據(jù)流動過程拆分為E、T、L。.工程實施中ETL的特點實施時間長整個工程實施任務量的60%70%過程復雜貫穿
26、整個業(yè)務建模和存儲的整個過程決議工程成敗的關鍵數(shù)據(jù)的準確性、過程的執(zhí)行勝利與否.ETL設計戰(zhàn)略真實可行的ETL設計戰(zhàn)略抽取戰(zhàn)略在數(shù)據(jù)抽取分析時需求對業(yè)務深化了解不能簡單的了解,哪一個表取不是隨意的、簡單的,一定要了解其中的含義這就需求對業(yè)務非常的清楚轉換戰(zhàn)略將數(shù)據(jù)由原來的格式轉換成數(shù)據(jù)倉庫格式 。包括數(shù)據(jù)格式轉換數(shù)據(jù)類型、轉換數(shù)據(jù)匯總計算、數(shù)據(jù)拼接等等,但這些任務可以在不同的過程中處置視詳細情況而定比如可以在數(shù)據(jù)抽取時轉換可以在數(shù)據(jù)加載時轉換 裝載戰(zhàn)略.維表加載戰(zhàn)略.現(xiàn)實表加載戰(zhàn)略.援用約束問題.數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos4、與Portal整合.COGNOS主要
27、模塊 Query Studio 查詢:自助報表生成工具 Report Studio 查詢:專有報表構筑工具 Analysis Studio 分析:多維數(shù)據(jù)展現(xiàn)工具 Transformer 分析:多維數(shù)據(jù)設計工具 Framework Manager 查詢:業(yè)務數(shù)據(jù)組織工具.幾個模塊在Cognos體系中的位置 應用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Framework Manager Framework Manager是一個元數(shù)據(jù)建模工具
28、,它運用數(shù)據(jù)查詢來獲取數(shù)據(jù),模型中能包含多個數(shù)據(jù)源的各種物理信息和業(yè)務信息的元數(shù)據(jù),以滿足報表顯現(xiàn)和數(shù)據(jù)分析的需求。Framework Manager能根據(jù)業(yè)務需求創(chuàng)建面向報表的關系型,或面向OLAP分析和報表的維度化建模關系型(DMR) 。.Framework Manager任務流程 Framework Manager將生成的模型發(fā)布到Content Store中,這些模型為Tansformer或前端展現(xiàn)工具提供數(shù)據(jù)效力。.幾個模塊在Cognos體系中的位置 應用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Ma
29、nager分析Analysis StudioTransformer.Transformer Transformer是Cognos BI的數(shù)據(jù)建模工具,用戶能運用它建立一個多數(shù)據(jù)源的多維業(yè)務模型。在選定了言語、維度、度量和業(yè)務視圖后,Transformer將以這些條件建立數(shù)據(jù)方pq,這些數(shù)據(jù)方被發(fā)布到Cognos的Content Store中后,前端展現(xiàn)工具,如Analysis Studio等,能圍繞這些PwoerCube進展各種OLAP分析。.Transformer的任務界面.了解Cognos ConnectionCognos Connection 是Cognos8的門戶。Query Stud
30、io,Report Studio 和Analysis Studio的入口都被組織在了這個門戶中。進入門戶: /Cognos8在Cognos Connection 門戶中可以: 1創(chuàng)建和運轉報表 2執(zhí)行管理性義務,例如調度報表可以經(jīng)過在文件夾中創(chuàng)建和儲存條目來對Cognos Connection 中的數(shù)據(jù)進展組織。.Cognos的任務區(qū).Query Studio 應用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Query Studio Quer
31、y Studio是業(yè)務人員即時查詢數(shù)據(jù)的日常工具,此工具普通運用直接數(shù)據(jù)源,可以對業(yè)務系統(tǒng)或數(shù)據(jù)倉庫中的某類或某條明細信息進展檢索,可將這些查詢保管,以供日后再次運用。此工具提供了最簡單的非正式的報表功能,報表在設計的同時即展現(xiàn)出報表結果。.進入Query Studio在Query Studio中創(chuàng)建報表.Report Studio 應用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Report Studio Report Studio是用來制
32、造更加精細的專有報表的工具,專有報表的設計和運轉兩個過程是分開的。Report Studio中可以建立列表,交叉表,圖表等各種類型的報表,并能實現(xiàn)報表的鉆取功能。對于報表的數(shù)據(jù)源,可以設置復雜的匯總、過濾、分組、重新計算等操作。表樣可精細加工成用戶所需求的款式。.進入Report Studio.用Report Studio創(chuàng)建報表.Report Studio交叉表界面.定義交叉表行.定義交叉表列.定義交叉表度量.交叉表運轉效果.表樣一:預算目的執(zhí)行情況表.表樣二:用款方案執(zhí)行情況表.表樣三:預算支出情況表.圖表結合報表第一步 先制定相應的交叉表第二步 插入圖.圖表結合報表.表樣四:部門月度方案.表樣五:業(yè)務數(shù)據(jù)對比.表樣六:業(yè)務目的對比.Analysis Studio 應用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.什么是Anal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO/TS 20428:2024 EN Genomics Informatics - Data elements and their metadata for describing structured clinical genomic sequence information in electronic health records
- 【正版授權】 ISO 6900:2025 EN Dried red jujubes - Specification and test methods
- 2025年度大型企事業(yè)單位公務車輛租賃服務協(xié)議合同范本
- 2025年變配電保護自動化項目合作計劃書
- 離職管理與退出面談流程計劃
- 秋季信息化教學推進計劃
- 2025年酸堿平衡調節(jié)藥合作協(xié)議書
- 智研咨詢發(fā)布-2025年中國智慧環(huán)保行業(yè)產(chǎn)業(yè)鏈全景分析及發(fā)展趨勢預測報告
- 2025年特異性植物源農(nóng)藥項目合作計劃書
- 2025年醫(yī)用氧化亞氮系統(tǒng)合作協(xié)議書
- 電力電子技術全套課件
- 配電箱(剩余電流動作斷路器)檢測報告
- 編外人員錄用審批表
- 倪海廈《天紀》講義
- DB32T 4004-2021 水質 17種全氟化合物的測定 高效液相色譜串聯(lián)質譜法
- 建設年飼養(yǎng)240萬只蛋雛雞培育基地項目可行性研究報告
- 大連理工畫法幾何電子教案2003第八章
- 中國數(shù)學發(fā)展歷史(課堂PPT)
- 黃金太陽漆黑的黎明金手指
- 車間、設備改造項目建議書范文
- 化學成份及性能對照表新
評論
0/150
提交評論