版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、為什么選擇數(shù)據(jù)倉庫隨著信息化建立的不斷推進(jìn),產(chǎn)生了大量的數(shù)據(jù)。必需合文科學(xué)的運(yùn)用這些數(shù)據(jù),為業(yè)務(wù)決策提供強(qiáng)有力的數(shù)據(jù)支持。簡單的報表運(yùn)用曾經(jīng)無法滿足需求,因此需求運(yùn)用更強(qiáng)大數(shù)據(jù)倉庫及其相關(guān)運(yùn)用。平臺作為財政數(shù)據(jù)平臺有著規(guī)范化的存儲構(gòu)造和全面多樣的業(yè)務(wù)數(shù)據(jù),可以作為財政數(shù)據(jù)倉庫的可靠數(shù)據(jù)來源。.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構(gòu)造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實(shí)例引見.數(shù)據(jù)倉庫概念歷史 數(shù)據(jù)倉庫概念始于上世紀(jì)80年代中期,初次出現(xiàn)是在被譽(yù)為“數(shù)據(jù)倉庫之父William H . Inmon的一書中。定義 數(shù)據(jù)倉庫是在管理和決策中面向主題的、集成的、隨時間變化的、相
2、對穩(wěn)定的數(shù)據(jù)集合按技術(shù)劃分 抽取、存儲與管理、數(shù)據(jù)的表現(xiàn)決策支持系統(tǒng)(DSS, Decision Support System) 準(zhǔn)確、平安、可靠地取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)展分析運(yùn)用。.商業(yè)智能的概念BI 商業(yè)智能的中心內(nèi)容是從業(yè)務(wù)處置系統(tǒng)的數(shù)據(jù)中,提取出有用的數(shù)據(jù),進(jìn)展清理以保證數(shù)據(jù)的正確性,然后經(jīng)過抽取Extraction、轉(zhuǎn)換Transformation和裝載Load,即ETL 過程,整合到一個企業(yè)級的數(shù)據(jù)倉庫里,從而得到企業(yè)信息的一個全局視圖,在此根底上利用適宜的查詢和分析工具、數(shù)據(jù)發(fā)掘工具等對數(shù)據(jù)倉庫里的數(shù)據(jù)進(jìn)展分析和處置,構(gòu)成信息,甚至進(jìn)一步把信息提煉
3、出輔助決策的知識,最后把知識呈現(xiàn)給管理者,為管理者的決策過程提供支持。.商業(yè)智能的概念BI.傳統(tǒng)的決策方式.商業(yè)智能環(huán)境下的決策流程.數(shù)據(jù)倉庫與商業(yè)智能關(guān)系 數(shù)據(jù)倉庫是商業(yè)智能的根底。數(shù)據(jù)倉庫 數(shù)據(jù)倉庫從概念上更多地偏重在對各類信息的整合任務(wù),包括了數(shù)據(jù)的遷移,數(shù)據(jù)的組織和存儲,數(shù)據(jù)的管理與維護(hù)這些我們平常稱之為后臺的根底性的數(shù)據(jù)預(yù)備任務(wù)。商業(yè)智能 商業(yè)智能那么偏重在數(shù)據(jù)查詢和報告、多維/聯(lián)機(jī)數(shù)據(jù)分析、數(shù)據(jù)發(fā)掘和數(shù)據(jù)可視化工具這些平常稱之為所謂前臺的數(shù)據(jù)運(yùn)用方面,其中數(shù)據(jù)發(fā)掘是商業(yè)智能中比較高層次的一種運(yùn)用。.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構(gòu)造主流數(shù)據(jù)
4、倉庫產(chǎn)品對比分析實(shí)例引見.數(shù)據(jù)倉庫、商業(yè)智能的體系構(gòu)造數(shù)據(jù)源ETL數(shù)據(jù)倉庫數(shù)據(jù)集市元數(shù)據(jù)OLAP.1.數(shù)據(jù)源平臺數(shù)據(jù)庫外部數(shù)據(jù)格式:txt、excel、dbf等文件格式其它數(shù)據(jù)庫.2、ETLE : Extract 從源數(shù)據(jù)抽取數(shù)據(jù)T : Transform 把抽取的數(shù)據(jù)進(jìn)展轉(zhuǎn)換L : Load 把轉(zhuǎn)換好的數(shù)據(jù)裝載到數(shù)據(jù)倉庫中。.3、數(shù)據(jù)倉庫數(shù)據(jù)倉庫的一個目的就是把企業(yè)的信息訪問根底從一種非構(gòu)造化的改動成一種構(gòu)造化、開展中的環(huán)境改動成規(guī)劃良好的環(huán)境。業(yè)務(wù)處置系統(tǒng)是面向運(yùn)用來設(shè)計(jì)的,更準(zhǔn)確地說是面向買賣來設(shè)計(jì)。而數(shù)據(jù)倉庫普通來說是按主題(Subject)來建模, 是面向查詢主題的。.3.數(shù)據(jù)倉庫數(shù)
5、據(jù)倉庫的關(guān)鍵特征星型方式粒度分割.3.數(shù)據(jù)倉庫-關(guān)鍵特征面向主題的subject-oriented集成的integrated時變的time-variant非易失的nonvolatile 數(shù)據(jù)倉庫是一種語義上一致的數(shù)據(jù)存 儲,它充任決策支持?jǐn)?shù)據(jù)模型的物理實(shí)現(xiàn),并存放業(yè)務(wù)決策所需信息。數(shù)據(jù)倉庫經(jīng)過將異種數(shù)據(jù)源中的數(shù)據(jù)集成在一同而構(gòu)造,支持構(gòu)造化的和專門的查詢、分析報告和決策。.3.數(shù)據(jù)倉庫-星型方式.3.數(shù)據(jù)倉庫-星型方式.3.數(shù)據(jù)倉庫-粒度 粒度是對數(shù)據(jù)倉庫中的數(shù)據(jù)的匯總程度高低的一個度量,按省級匯總或按市級匯總就是不同的粒度它既影響數(shù)據(jù)倉庫中的數(shù)據(jù)量的多少,也影響數(shù)據(jù)倉庫所能回答訊問信息的種類
6、。在數(shù)據(jù)倉庫中,多維粒度是必不可少的。由于數(shù)據(jù)倉庫的主要作用是多維分析,因此絕大多數(shù)查詢都基于一定程度的匯總數(shù)據(jù)之上的,只需極少數(shù)查詢涉及到細(xì)節(jié)。.分割 分割,目的在于提高效率。它是將數(shù)據(jù)分散到各自的物理單元中去, 以便能分別獨(dú)立處置,以實(shí)現(xiàn)查詢操作的并行。有許多數(shù)據(jù)分割的規(guī)范可供參考:如時間、地域、業(yè)務(wù)領(lǐng)域等等,也可以是其組合。普通而言,分割規(guī)范總應(yīng)包括一些能讓它非常自然而且分割均勻的工程,例如時間項(xiàng)。.4、數(shù)據(jù)集市 數(shù)據(jù)集市分兩種,獨(dú)立的數(shù)據(jù)集市Independent Data Mart和從屬的數(shù)據(jù)集市Dependent Data Mart。.兩種數(shù)據(jù)集市對比對比優(yōu)點(diǎn)缺點(diǎn)從屬數(shù)據(jù)集市 保證
7、數(shù)據(jù)一致性;架構(gòu)比較理想,可擴(kuò)展能力強(qiáng)依賴與中心數(shù)據(jù)倉庫的實(shí)施;實(shí)施周期長;實(shí)施成本高;獨(dú)立數(shù)據(jù)集市實(shí)施周期短;實(shí)施成本低;沒有消除信息分割;可擴(kuò)展能力弱;后期整合困難。財政領(lǐng)域運(yùn)用在平臺實(shí)施的根底上以從屬數(shù)據(jù)集市為主。.5.元數(shù)據(jù)(Meta-data) 定義: “關(guān)于數(shù)據(jù)的數(shù)據(jù),是描畫和管理數(shù)據(jù)倉庫本身內(nèi)容對象、用來表示數(shù)據(jù)項(xiàng)的意義及其在系統(tǒng)各組成部件之間的關(guān)系的數(shù)據(jù)。數(shù)據(jù)倉庫的元數(shù)據(jù)包括:1數(shù)據(jù)資源:包括各個數(shù)據(jù)源的模型,描畫源數(shù)據(jù)表字段屬性及業(yè)務(wù)含義,源數(shù)據(jù)到數(shù)據(jù)倉庫的映射關(guān)系;2數(shù)據(jù)組織:數(shù)據(jù)倉庫、數(shù)據(jù)集市表的構(gòu)造、屬性及業(yè)務(wù)含義,多維構(gòu)造等;3數(shù)據(jù)運(yùn)用:查詢與報表輸出格式描畫、OLA
8、P、數(shù)據(jù)發(fā)掘等的數(shù)據(jù)模型的信息展現(xiàn)、商業(yè)術(shù)語;4數(shù)據(jù)管理:這里包括數(shù)據(jù)倉庫過程以及數(shù)據(jù)倉庫操作結(jié)果的模型,包括描畫數(shù)據(jù)抽取和清洗規(guī)那么、數(shù)據(jù)加載控制、暫時表構(gòu)造、用途和運(yùn)用情況、數(shù)據(jù)匯總控制。.5.元數(shù)據(jù)類型業(yè)務(wù)元數(shù)據(jù) 用業(yè)務(wù)稱號、定義、描畫和別名來表示數(shù)據(jù)倉庫和業(yè)務(wù)系統(tǒng)中的各種屬性,直接供最終用戶運(yùn)用。業(yè)務(wù)元數(shù)據(jù)使最終用戶可以更好了解、運(yùn)用數(shù)據(jù)倉庫,成為最終用戶在數(shù)據(jù)倉庫中的業(yè)務(wù)信息地圖。技術(shù)元數(shù)據(jù) 技術(shù)元數(shù)據(jù)描畫了源系統(tǒng)、數(shù)據(jù)轉(zhuǎn)換、抽取過程、任務(wù)流、加載戰(zhàn)略以及目的數(shù)據(jù)庫的定義等。用來進(jìn)展影響分析、變化管理、數(shù)據(jù)庫優(yōu)化、義務(wù)調(diào)度和平安管理等。操作元數(shù)據(jù) 操作元數(shù)據(jù)描畫了目的表中的信息,如粒
9、度、創(chuàng)建目的表和索引的信息、刷新時間、記錄數(shù)、按時執(zhí)行義務(wù)的設(shè)置以及有權(quán)訪問數(shù)據(jù)的用戶。操作元數(shù)據(jù)用于數(shù)據(jù)倉庫的維護(hù)和分布。.多維分析OLAPOLAP (On-Line analytical Processing) 在線分析處置切片和切塊(Slice and Dice)鉆取(Drill)旋轉(zhuǎn)(Rotate).6 、OLAP分析是一類軟件技術(shù)分析人員能從多個角度獲得對數(shù)據(jù)的更深化了解特點(diǎn):快速、一致、交互多維視圖分析數(shù)據(jù)的工具根據(jù)用戶常用的多種分析角度,事先計(jì)算好一些輔助構(gòu)造,以便在查詢時能盡快訪問到所要的匯總數(shù)字,并快速地從一維轉(zhuǎn)變到另一維,將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展
10、如今用戶面前。.切片和切塊(Slice and Dice)切片取二維數(shù)據(jù),稱為切片。切塊 取三維數(shù)據(jù),稱為切塊。.切片和切塊(Slice and Dice).鉆取(Drill) 鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)操作, 鉆取的深度與維所劃分的層次相對應(yīng)。.旋轉(zhuǎn)(Rotate).數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構(gòu)造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實(shí)例引見.主流數(shù)據(jù)倉庫產(chǎn)品對比分析1.數(shù)據(jù)倉庫產(chǎn)品引見2.產(chǎn)品支撐技術(shù).主要數(shù)據(jù)倉庫產(chǎn)品供應(yīng)商引見OracleIBMMicrosoftSASTeradataSybaseBusiness
11、Objects(SAP).Oracle 引見 Oracle公司的數(shù)據(jù)倉庫處理方案包含了數(shù)據(jù)庫平臺、開發(fā)工具和運(yùn)用系統(tǒng),可以提供一系列的數(shù)據(jù)倉庫工具集和效力,具有多用戶數(shù)據(jù)倉庫管理才干,多種分區(qū)方式,與OLAP工具的交互才干,及數(shù)據(jù)挪動機(jī)制等特性。Oracle的優(yōu)勢在于大多數(shù)業(yè)務(wù)系統(tǒng)采用oracle數(shù)據(jù)庫。.IBM 引見 IBM公司的數(shù)據(jù)倉庫產(chǎn)品稱為DB2 Data Warehouse Edition,它結(jié)合了DB2數(shù)據(jù)效力器的優(yōu)點(diǎn)和IBM的商業(yè)智能根底設(shè)備,集成了用于倉庫管理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)發(fā)掘以及OLAP分析和報告的中心組件,提供了一套基于可視數(shù)據(jù)倉庫的商業(yè)智能處理方案。IBM的優(yōu)勢在于處理
12、方案比較完善。.Microsoft 引見 微軟的SQL Server提供了三大效力和一個工具來實(shí)現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構(gòu)建典型和創(chuàng)新的分析運(yùn)用程序所需的各種特性、工具和功能,可以實(shí)現(xiàn)建模、ETL、建立查詢分析或圖表、定制KPI、建立報表和構(gòu)造數(shù)據(jù)發(fā)掘運(yùn)用及發(fā)布等功能。微軟的優(yōu)勢在于簡單易用。.SAS SAS公司的數(shù)據(jù)倉庫處理方案是一個由30多個公用模塊構(gòu)成的架構(gòu)體系,順應(yīng)于對企業(yè)級的數(shù)據(jù)進(jìn)展重新整合,支持多維、快速查詢,提供效力于OLAP操作和決策支持的數(shù)據(jù)采集、管理、處置和展現(xiàn)功能。SAS優(yōu)勢在于數(shù)據(jù)發(fā)掘和統(tǒng)計(jì)分析。.Teradata Teradata公司提出了可擴(kuò)展數(shù)據(jù)倉
13、庫根本架構(gòu),包括數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個部分,是高端數(shù)據(jù)倉庫市場最有力競爭者,主要運(yùn)轉(zhuǎn)在基于Unix操作系統(tǒng)平臺的NCR硬件設(shè)備上,在銀行領(lǐng)域運(yùn)用廣泛。.Sybase 引見 Sybase提供了稱為Warehouse Studio的一整套覆蓋整個數(shù)據(jù)倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)集成和轉(zhuǎn)換、數(shù)據(jù)存儲和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視化分析等產(chǎn)品。.Business ObjectsSAP 引見 Business Objects是BI工具,集查詢、報表和OLAP技術(shù)為一身的智能決策支持系統(tǒng),具有較好的查詢和報表功能,提供多維分析技術(shù),支持多種數(shù)據(jù)庫,同時它還支持基于Web閱讀器的查
14、詢、報表和分析決策。被SAP收買后,目前還沒有完好數(shù)據(jù)倉庫處理方案。.主流數(shù)據(jù)倉庫產(chǎn)品對比分析數(shù)據(jù)倉庫產(chǎn)品引見支撐技術(shù).數(shù)據(jù)倉庫技術(shù)1、數(shù)據(jù)庫技術(shù)2、ETL技術(shù)3、OLAP技術(shù)4、報表技術(shù)5、數(shù)據(jù)發(fā)掘技術(shù).數(shù)據(jù)庫技術(shù) 數(shù)據(jù)庫技術(shù)是支撐數(shù)據(jù)倉庫技術(shù)的根底技術(shù)。雖然在數(shù)據(jù)倉庫技術(shù)存儲模型方面,基于數(shù)據(jù)庫技術(shù)而開展的關(guān)系方式的理念曾經(jīng)被顛覆,取而代之是各種各樣的數(shù)據(jù)倉庫數(shù)據(jù)模型,如星型模型,雪花模型等。然而,在已有的數(shù)據(jù)倉庫實(shí)際中,關(guān)系數(shù)據(jù)庫依然是本質(zhì)的數(shù)據(jù)庫存儲工具,只是將數(shù)據(jù)庫表改稱為了現(xiàn)實(shí)表和維表,將屬性域之間的關(guān)系重新定義為維度,量度,層次,粒度等。.數(shù)據(jù)倉庫后臺數(shù)據(jù)庫比較產(chǎn)品供應(yīng)商數(shù)據(jù)庫產(chǎn)
15、品效率兼容性管理磁盤空間OracleOracle優(yōu)IBMDB2優(yōu)MicrosoftSQL Server優(yōu)SASTeradataTeradata差差SybaseSybase IQ優(yōu)優(yōu)SAP.ETL技術(shù) 數(shù)據(jù)倉庫系統(tǒng)是集成的、與時間相關(guān)的數(shù)據(jù)集合,ETL作為數(shù)據(jù)倉庫的中心,擔(dān)任將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)展抽取、清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處置、數(shù)據(jù)發(fā)掘的根底。ETL可以按照一致的規(guī)那么集成并提高數(shù)據(jù)的價值,是擔(dān)任完成數(shù)據(jù)從數(shù)據(jù)源向目的數(shù)據(jù)倉庫轉(zhuǎn)化的過程,是實(shí)施數(shù)據(jù)倉庫的重要步驟。要實(shí)現(xiàn)數(shù)據(jù)倉庫中數(shù)據(jù)的自動更新運(yùn)轉(zhuǎn),ETL技術(shù)是必不可少的關(guān)鍵技術(shù)之一。.產(chǎn)品供應(yīng)
16、商ETL 工具特點(diǎn)OracleOracle Warehouse Builder (OWB)數(shù)據(jù)倉庫組件IBMIBM WebSphere DataStage整個ETL過程提供了一個圖形化的開發(fā)環(huán)境,支持對多種操作數(shù)據(jù)源的數(shù)據(jù)抽取、轉(zhuǎn)換和維護(hù),并將其輸入數(shù)據(jù)集或數(shù)據(jù)倉庫MicrosoftIntegration Services數(shù)據(jù)倉庫組件SASETL Studio管理ETL流程和建立數(shù)據(jù)倉庫、數(shù)據(jù)集市和OLAP結(jié)構(gòu)的單控制點(diǎn)TeradataETL Automation利用Teradata數(shù)據(jù)庫本身的并行處理能力,通過SQL語句實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換,提供對ETL流程的支持,包括前后依賴、執(zhí)行和監(jiān)控等Syb
17、aseData Integration Suite數(shù)據(jù)倉庫組件SAPData Integrator數(shù)據(jù)倉庫組件InformaticaPowerCenter二次開發(fā)、集成和開放性強(qiáng)于其它.OLAP技術(shù) 聯(lián)機(jī)分析處置(OLAP)是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析,經(jīng)過對信息進(jìn)展快速、穩(wěn)定、一致和交互式的存取,對數(shù)據(jù)進(jìn)展多層次、多階段的分析處置,以獲得高度歸納的分析結(jié)果。聯(lián)機(jī)事務(wù)處置(OLTP)已不能滿足終端用戶對數(shù)據(jù)庫查詢分析的需求,SQL對大數(shù)據(jù)庫進(jìn)展的簡單查詢也不能滿足用戶分析的需求。用戶的決策分析需求對關(guān)系數(shù)據(jù)庫進(jìn)展大量計(jì)算才干得到結(jié)果,而查詢的結(jié)果并不能滿足決策者提出的需求,由此出現(xiàn)了多維
18、數(shù)據(jù)庫和多維分析的概念。.產(chǎn)品供應(yīng)商OLAP產(chǎn)品OLAP分析工具數(shù)據(jù)庫特點(diǎn)OracleExpress/Discoverer支持DB2,Oracle,SQL Server,Sybase等對自己的數(shù)據(jù)庫產(chǎn)品的支持均好于其它數(shù)據(jù)庫,分析工具基于開放的OLE DB標(biāo)準(zhǔn),可以訪問支持OLE DB標(biāo)準(zhǔn)的數(shù)據(jù)立方體IBMCOGNOSMicrosoftAnalysis ServicesSASOLAP ServerTeradata提供了相關(guān)技術(shù),用于提升運(yùn)行于Teradata數(shù)據(jù)庫上的OLAP應(yīng)用系統(tǒng)的性能SybasePower Dimension標(biāo)準(zhǔn)OLAP API能夠?qū)icrosoft、IBM等OLAP數(shù)
19、據(jù)進(jìn)行劃分、鉆取等處理,兼容第三方報表和展現(xiàn)工具SAPOLAP Intelligence.報表技術(shù) 報表技術(shù)主要是將集成在數(shù)據(jù)模型里的數(shù)據(jù),按照復(fù)雜的格式、指定行列統(tǒng)計(jì)項(xiàng),計(jì)算構(gòu)成的特殊表格。普通的簡單報表可以運(yùn)用通用的前臺展現(xiàn)技術(shù)實(shí)現(xiàn),而復(fù)雜的報表那么需求運(yùn)用特定的報表技術(shù)。主流的報表技術(shù)都可以靈敏的制定各種報表模版庫和目的庫,并根據(jù)每個區(qū)塊或單元格的需求援用目的,實(shí)現(xiàn)一系列復(fù)雜的符合要求的報表的自動生成。.產(chǎn)品供應(yīng)商報表工具特點(diǎn)OracleOracle Reports提供了自由的數(shù)據(jù)格式方式,可以自動生成個性化字母或矩陣風(fēng)格的布局,包括動態(tài)、數(shù)據(jù)驅(qū)動的圖表IBMCOGNOS覆蓋了各種報表需
20、求,包括管理報表、商業(yè)報表、賬單和發(fā)票等。基于Olap server 實(shí)現(xiàn)查詢分析操作.MicrosoftReporting Services (SSRS)(含)處理組件、一整套可用于創(chuàng)建和管理報表的工具、在自定義應(yīng)用程序中集成和擴(kuò)展數(shù)據(jù)和報表處理的APISASReport Studio功能、性能、二次開發(fā)等方面都還存在著一定的差距TeradataBTEQSybaseInfoMakerSAPCrystal Reports提供了一個完整的企業(yè)報表解決方案Crystal Reports Server,支持通過Web快速便捷的創(chuàng)建、管理和交付報表.數(shù)據(jù)發(fā)掘技術(shù) 當(dāng)數(shù)據(jù)積累到一定數(shù)量時,某些潛在聯(lián)絡(luò)、
21、分類、推導(dǎo)結(jié)果和待發(fā)現(xiàn)價值隱藏在其中,可以運(yùn)用數(shù)據(jù)開掘工具協(xié)助發(fā)現(xiàn)這些有價值的數(shù)據(jù)。數(shù)據(jù)發(fā)掘就是從海量數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又能夠有用的信息和知識的過程。經(jīng)過數(shù)據(jù)發(fā)掘能找出數(shù)據(jù)庫中隱藏的信息,實(shí)現(xiàn)用模型來擬合數(shù)據(jù)、探求型數(shù)據(jù)分析,數(shù)據(jù)驅(qū)動型的發(fā)現(xiàn),演繹型學(xué)習(xí)等功能。.產(chǎn)品供應(yīng)商挖掘工具特點(diǎn)OracleOracle Data Miner提供圖形用戶界面,通過向?qū)碇笇?dǎo)完成數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模型評估和模型評價過程,根據(jù)需要自動生成將數(shù)據(jù)挖掘步驟轉(zhuǎn)換成一個集成的數(shù)據(jù)挖掘/BI應(yīng)用程序所需的代碼IBMIBM Intelligent Miner數(shù)據(jù)集自動生成、關(guān)聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)
22、現(xiàn)、概念性分類和可視化呈現(xiàn),可以自動實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)發(fā)掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)發(fā)掘操作Microsoft數(shù)據(jù)挖掘平臺不同于傳統(tǒng)數(shù)據(jù)挖掘應(yīng)用程序,它支持組織中數(shù)據(jù)的整個開發(fā)生命周期,允許第三方添加自定義算法以支持特定的挖掘需求,支持實(shí)時根據(jù)挖掘的數(shù)據(jù)集進(jìn)行數(shù)據(jù)驗(yàn)證。SASSAS Enterprise Miner數(shù)據(jù)挖掘過程簡單流程化,支持關(guān)聯(lián)、聚類、決策樹、神經(jīng)元網(wǎng)絡(luò)和經(jīng)典的統(tǒng)計(jì)回歸技術(shù)TeradataTeradata Warehouse Miner將數(shù)據(jù)挖掘技術(shù)整合到數(shù)據(jù)倉庫來簡化數(shù)據(jù)挖掘流程,還可實(shí)現(xiàn)將多家廠商的數(shù)據(jù)挖掘技術(shù)嵌入Teradata企業(yè)級數(shù)據(jù)倉庫環(huán)境中運(yùn)行Sybase
23、無SAP無.數(shù)據(jù)倉庫數(shù)據(jù)倉庫、商業(yè)智能(BI)的概念數(shù)據(jù)倉庫、商業(yè)智能(BI)的體系構(gòu)造主流數(shù)據(jù)倉庫產(chǎn)品對比分析實(shí)例引見.實(shí)例引見1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.數(shù)據(jù)建模業(yè)務(wù)梳理整理并提取出維度、度量和現(xiàn)實(shí)表建立模型.數(shù)據(jù)建模-業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫構(gòu)造關(guān)系型數(shù)據(jù)庫1.目的表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額001001203010120080101301010120333.00 2.方案表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額00100120301012008010
2400 3.支付表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101333.00 .模型-星型模型預(yù)算單位 業(yè)務(wù)表現(xiàn)實(shí)表功能分類目的來源資金性質(zhì)業(yè)務(wù)處室目的類型預(yù)算工程支付方式.數(shù)據(jù)建模過程業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)倉庫1.目的表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額001001203010120080101301010120333.00 2.方案表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額0010012030101200801013010101444.00 3.支付表單位代碼功能分類id項(xiàng)目編碼經(jīng)濟(jì)分類id金額00100
25、12030101200801013010101333.00 .數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos84、與Portal整合.ETL的本質(zhì)ETL代表抽取(Extract),轉(zhuǎn)換(Transform),裝載(Load ),ETL的過程就是數(shù)據(jù)流動的過程,從不同的異構(gòu)數(shù)據(jù)源流向一致的目的數(shù)據(jù),其間,數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換和裝載構(gòu)成串行或并行的過程 。.數(shù)據(jù)倉庫中ETL的特點(diǎn)數(shù)據(jù)同步ETL周期性的,經(jīng)常性的活動,不是一次性完成的。數(shù)據(jù)量 ETL的數(shù)據(jù)量普通都是宏大的,值得將數(shù)據(jù)流動過程拆分為E、T、L。.工程實(shí)施中ETL的特點(diǎn)實(shí)施時間長整個工程實(shí)施任務(wù)量的60%70%過程復(fù)雜貫穿
26、整個業(yè)務(wù)建模和存儲的整個過程決議工程成敗的關(guān)鍵數(shù)據(jù)的準(zhǔn)確性、過程的執(zhí)行勝利與否.ETL設(shè)計(jì)戰(zhàn)略真實(shí)可行的ETL設(shè)計(jì)戰(zhàn)略抽取戰(zhàn)略在數(shù)據(jù)抽取分析時需求對業(yè)務(wù)深化了解不能簡單的了解,哪一個表取不是隨意的、簡單的,一定要了解其中的含義這就需求對業(yè)務(wù)非常的清楚轉(zhuǎn)換戰(zhàn)略將數(shù)據(jù)由原來的格式轉(zhuǎn)換成數(shù)據(jù)倉庫格式 。包括數(shù)據(jù)格式轉(zhuǎn)換數(shù)據(jù)類型、轉(zhuǎn)換數(shù)據(jù)匯總計(jì)算、數(shù)據(jù)拼接等等,但這些任務(wù)可以在不同的過程中處置視詳細(xì)情況而定比如可以在數(shù)據(jù)抽取時轉(zhuǎn)換可以在數(shù)據(jù)加載時轉(zhuǎn)換 裝載戰(zhàn)略.維表加載戰(zhàn)略.現(xiàn)實(shí)表加載戰(zhàn)略.援用約束問題.數(shù)據(jù)倉庫創(chuàng)建過程1、數(shù)據(jù)建模2、ETL過程3、Cognos4、與Portal整合.COGNOS主要
27、模塊 Query Studio 查詢:自助報表生成工具 Report Studio 查詢:專有報表構(gòu)筑工具 Analysis Studio 分析:多維數(shù)據(jù)展現(xiàn)工具 Transformer 分析:多維數(shù)據(jù)設(shè)計(jì)工具 Framework Manager 查詢:業(yè)務(wù)數(shù)據(jù)組織工具.幾個模塊在Cognos體系中的位置 應(yīng)用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Framework Manager Framework Manager是一個元數(shù)據(jù)建模工具
28、,它運(yùn)用數(shù)據(jù)查詢來獲取數(shù)據(jù),模型中能包含多個數(shù)據(jù)源的各種物理信息和業(yè)務(wù)信息的元數(shù)據(jù),以滿足報表顯現(xiàn)和數(shù)據(jù)分析的需求。Framework Manager能根據(jù)業(yè)務(wù)需求創(chuàng)建面向報表的關(guān)系型,或面向OLAP分析和報表的維度化建模關(guān)系型(DMR) 。.Framework Manager任務(wù)流程 Framework Manager將生成的模型發(fā)布到Content Store中,這些模型為Tansformer或前端展現(xiàn)工具提供數(shù)據(jù)效力。.幾個模塊在Cognos體系中的位置 應(yīng)用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Ma
29、nager分析Analysis StudioTransformer.Transformer Transformer是Cognos BI的數(shù)據(jù)建模工具,用戶能運(yùn)用它建立一個多數(shù)據(jù)源的多維業(yè)務(wù)模型。在選定了言語、維度、度量和業(yè)務(wù)視圖后,Transformer將以這些條件建立數(shù)據(jù)方pq,這些數(shù)據(jù)方被發(fā)布到Cognos的Content Store中后,前端展現(xiàn)工具,如Analysis Studio等,能圍繞這些PwoerCube進(jìn)展各種OLAP分析。.Transformer的任務(wù)界面.了解Cognos ConnectionCognos Connection 是Cognos8的門戶。Query Stud
30、io,Report Studio 和Analysis Studio的入口都被組織在了這個門戶中。進(jìn)入門戶: /Cognos8在Cognos Connection 門戶中可以: 1創(chuàng)建和運(yùn)轉(zhuǎn)報表 2執(zhí)行管理性義務(wù),例如調(diào)度報表可以經(jīng)過在文件夾中創(chuàng)建和儲存條目來對Cognos Connection 中的數(shù)據(jù)進(jìn)展組織。.Cognos的任務(wù)區(qū).Query Studio 應(yīng)用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Query Studio Quer
31、y Studio是業(yè)務(wù)人員即時查詢數(shù)據(jù)的日常工具,此工具普通運(yùn)用直接數(shù)據(jù)源,可以對業(yè)務(wù)系統(tǒng)或數(shù)據(jù)倉庫中的某類或某條明細(xì)信息進(jìn)展檢索,可將這些查詢保管,以供日后再次運(yùn)用。此工具提供了最簡單的非正式的報表功能,報表在設(shè)計(jì)的同時即展現(xiàn)出報表結(jié)果。.進(jìn)入Query Studio在Query Studio中創(chuàng)建報表.Report Studio 應(yīng)用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.Report Studio Report Studio是用來制
32、造更加精細(xì)的專有報表的工具,專有報表的設(shè)計(jì)和運(yùn)轉(zhuǎn)兩個過程是分開的。Report Studio中可以建立列表,交叉表,圖表等各種類型的報表,并能實(shí)現(xiàn)報表的鉆取功能。對于報表的數(shù)據(jù)源,可以設(shè)置復(fù)雜的匯總、過濾、分組、重新計(jì)算等操作。表樣可精細(xì)加工成用戶所需求的款式。.進(jìn)入Report Studio.用Report Studio創(chuàng)建報表.Report Studio交叉表界面.定義交叉表行.定義交叉表列.定義交叉表度量.交叉表運(yùn)轉(zhuǎn)效果.表樣一:預(yù)算目的執(zhí)行情況表.表樣二:用款方案執(zhí)行情況表.表樣三:預(yù)算支出情況表.圖表結(jié)合報表第一步 先制定相應(yīng)的交叉表第二步 插入圖.圖表結(jié)合報表.表樣四:部門月度方案.表樣五:業(yè)務(wù)數(shù)據(jù)對比.表樣六:業(yè)務(wù)目的對比.Analysis Studio 應(yīng)用(Consumer) 專業(yè) (profession)查詢Query StudioReport StudioFramework Manager分析Analysis StudioTransformer.什么是Anal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024裝修增加項(xiàng)目施工合同模板
- 個人經(jīng)營貸款合同樣本
- 2024建筑單包工合同范文
- 2024股份擔(dān)保借款合同范本
- 2024個人住房公積金的借款合同
- 2024動產(chǎn)家具無償寄托合同
- 房產(chǎn)項(xiàng)目合作開發(fā)協(xié)議書
- 三輪車買賣合同完整協(xié)議2024年
- 倉配租賃合同模板
- 工業(yè)用地投資協(xié)議
- 2025年日歷英文版縱向排版周一開始
- S7-1200PLC技術(shù)及應(yīng)用 課件 項(xiàng)目17 步進(jìn)電機(jī)控制
- 《生物技術(shù)制藥》課程介紹與教學(xué)大綱
- 《現(xiàn)代農(nóng)業(yè)技術(shù)推廣》課件-第七組 農(nóng)民問題專題調(diào)研
- 第30課 家居收納技巧 課件 2023-2024學(xué)年蘇教版初中勞動技術(shù)七年級上冊
- 2024中國一汽校園招聘1000+崗位高頻考題難、易錯點(diǎn)模擬試題(共500題)附帶答案詳解
- GB/T 19533-2024汽車用壓縮天然氣鋼瓶定期檢驗(yàn)與評定
- 婦產(chǎn)科護(hù)士晉升述職報告
- 骨髓腔內(nèi)輸液(IOI)技術(shù)
- 建筑幕墻工程(鋁板、玻璃、石材)監(jiān)理實(shí)施細(xì)則(全面版)
- 小學(xué)數(shù)學(xué)與思政融合課教學(xué)設(shè)計(jì)
評論
0/150
提交評論