版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)倉庫商業(yè)智能解決方案XXX公司BI系統(tǒng)方案建議書二0二0年一月目錄第一章概述1第二章商業(yè)智能綜述22.1 商業(yè)智能基本結(jié)構(gòu)22.1.1 XXX數(shù)據(jù)倉庫架構(gòu)32.1.2 數(shù)據(jù)倉庫:用于抽取、整合、分布、存儲有用的信息42.1.3 多維分析:全方位了解現(xiàn)狀42.1.4 前臺分析工具52.1.5 數(shù)據(jù)挖掘52.2 商業(yè)智能方案實(shí)施原則52.2.1 分階段、循序漸進(jìn)的原則52.2.2 實(shí)用原則62.2.3 知識原則6第三章XXX公司BI系統(tǒng)方案73.1 XXX公司BI系統(tǒng)的需求分析73.2 XXX的解決方案73.3 建議架構(gòu)9第四章所選XXX產(chǎn)品簡介114.1 DB2UDB114.1.1 概述:D
2、B2家族(Family)與DB2通用數(shù)據(jù)庫(UDB)V7.2114.1.2 DB2通用數(shù)據(jù)庫(UDB)V7.2的特色124.1.3 DB2通用數(shù)據(jù)庫(UDB)的其他先進(jìn)功能224.2 DB2WAREHOUSEMANAGER(數(shù)據(jù)倉庫管理器)264.2.1 DB2WarehouseManager的主要部件264.2.2 數(shù)據(jù)抽取、車專換和加載(ETL)功能274.2.3 元數(shù)據(jù)(MetaData)管理314.2.4 DB2WarehouseManager的其它技術(shù)特點(diǎn)314.3 XXXOLAPSERVER(多維數(shù)據(jù)庫服務(wù)器)334.3.1 DB2OLAPServer引擎334.3.2 DB2OL
3、APServer各個(gè)附件344.3.3 DB2OLAPServer與DB2WarehouseManager集成364.3.4 DB2OLAPServer支持的前端工具364.4 DB2OLAPANALYZER374.5 數(shù)據(jù)挖掘工具(XXXINTELLIGENTMINER)374.5.1 數(shù)據(jù)挖掘的實(shí)現(xiàn)方法384.5.2 數(shù)據(jù)挖掘基本方法394.5.3 數(shù)據(jù)挖掘與多維分析相結(jié)合40第五章工程服務(wù)和售后服務(wù)415.1 工程服務(wù)415.2 售后服務(wù)415.2.1 XXX數(shù)據(jù)倉庫的安裝及配置服務(wù)415.2.2 XXX數(shù)據(jù)倉庫的維護(hù)服務(wù)415.2.3 XXX數(shù)據(jù)倉庫的顧問服務(wù)425.2.4 XXX培訓(xùn)
4、I服務(wù)425.3 技術(shù)文檔42數(shù)據(jù)倉庫商業(yè)智能解決方案第一章概述隨著市場競爭的日益激烈,各家公司紛紛把提高決策的科學(xué)性、合理性提高到一個(gè)新的認(rèn)識高度。在此背景下,利用信息技術(shù)的最新手段,利用業(yè)務(wù)數(shù)據(jù)進(jìn)行面向決策的分析這一方法紛紛被國內(nèi)外許多公司所采用。通過有目的、有選擇地采集業(yè)務(wù)數(shù)據(jù),并將其轉(zhuǎn)換為對決策有用的信息,用于智能化的分析、預(yù)測和模擬等目的,這樣的應(yīng)用被稱為商業(yè)智能應(yīng)用。從國內(nèi)外各行各業(yè)的發(fā)展經(jīng)驗(yàn)看,實(shí)施商業(yè)智能是提高企業(yè)進(jìn)行高效的業(yè)務(wù)分析和科學(xué)決策的有效手段。作為一個(gè)具有八十多年歷史,以開發(fā)信息技術(shù)和商業(yè)應(yīng)用而聞名的“藍(lán)色巨人”,XXX在這一領(lǐng)域進(jìn)行了多年的研究,發(fā)展出完備的商業(yè)智能
5、技術(shù),為商業(yè)數(shù)據(jù)自動轉(zhuǎn)化為商業(yè)知識提供了現(xiàn)實(shí)的方案。商業(yè)智能的本質(zhì),是提取收集到的數(shù)據(jù),進(jìn)行智能化的分析,揭示企業(yè)運(yùn)作和市場情況,幫助管理層做出正確明智的經(jīng)營決定。一般現(xiàn)代化的業(yè)務(wù)操作,通常都會產(chǎn)生大量的數(shù)據(jù),如話單、賬單以及客戶資料等,其中一部分是決策關(guān)鍵數(shù)據(jù),但并不是所有的數(shù)據(jù)都對決策有決定意義。商業(yè)智能包括收集、清理、管理和分析這些數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后及時(shí)分發(fā)到企業(yè)各處,用于改善業(yè)務(wù)決策。企業(yè)可以利用它的信息和結(jié)論進(jìn)行更加靈活的階段性的決策:如采用什么產(chǎn)品、針對哪類客戶、如何選擇和有效地推出服務(wù)等等,也可以實(shí)現(xiàn)高效的財(cái)務(wù)分析、銷售分析、風(fēng)險(xiǎn)管理、分銷和后勤管理等等。這一切都
6、是為了降低成本、提高利潤率和擴(kuò)大市場分額。第40頁業(yè)務(wù)數(shù)據(jù)第二章商業(yè)智能綜述2.1 商業(yè)智能基本結(jié)構(gòu)當(dāng)今,許多企業(yè)認(rèn)識到只有靠充分利用,發(fā)掘其現(xiàn)有數(shù)據(jù),才能實(shí)現(xiàn)更大的商業(yè)效益。日常的商務(wù)應(yīng)用生成了大量的數(shù)據(jù),這些數(shù)據(jù)若用于決策支持則會帶來顯著的附加值。若再加上市場分析報(bào)告、獨(dú)立的市場調(diào)查、質(zhì)量評測結(jié)果和顧問評估等外來數(shù)據(jù)時(shí),上述處理過程產(chǎn)生的效益可進(jìn)一步增強(qiáng)。而數(shù)據(jù)倉庫正是匯總這些商用信息后,進(jìn)而支持?jǐn)?shù)據(jù)發(fā)掘、多維數(shù)據(jù)分析等當(dāng)今尖端技術(shù)和傳統(tǒng)的查詢及表報(bào)功能,這些對于在當(dāng)今激烈的商業(yè)競爭中保持領(lǐng)先是至關(guān)重要的。那么怎樣把這樣大量的數(shù)據(jù)轉(zhuǎn)換成可靠的、商用的信息以便于決策支持呢?建立數(shù)據(jù)倉庫正被廣
7、泛地公認(rèn)為最好的轉(zhuǎn)換手段。建立數(shù)據(jù)倉庫的過程轉(zhuǎn)換工具*商業(yè)主題成員映射商業(yè)視圖圖i數(shù)據(jù)倉庫建立過程根據(jù)IDC的調(diào)查,使用數(shù)據(jù)倉庫的投資回報(bào)率平均超過400%,尤其是從小型數(shù)據(jù)倉庫開始實(shí)施的平均超過500%。2.1.1 XXX數(shù)據(jù)倉庫架構(gòu)XXX早在90年代初期,就投入大量優(yōu)秀技術(shù)人員和資金開始了數(shù)據(jù)倉庫的研究,并啟動了Star-Burst大型科研項(xiàng)目。該項(xiàng)目主要就是為了攻克數(shù)據(jù)倉庫領(lǐng)域的一些技術(shù)難題,例如優(yōu)化星型連接(Star-join),實(shí)現(xiàn)多維分析。因此,XXX現(xiàn)在發(fā)布的數(shù)據(jù)倉庫產(chǎn)品都是經(jīng)過反復(fù)推敲和久經(jīng)考驗(yàn)的?;趯?shù)據(jù)倉庫結(jié)構(gòu)的深刻理解和多年積累的經(jīng)驗(yàn),XXX設(shè)計(jì)了自己的數(shù)據(jù)倉庫結(jié)構(gòu),見
8、下圖:數(shù)據(jù)倉庫的組成。作為一個(gè)開發(fā)式結(jié)構(gòu),它方便了用戶的產(chǎn)品選擇、實(shí)施和今后的擴(kuò)展。數(shù)據(jù)集市數(shù)據(jù)倉庫趨勢 分析DSSDSS銷銷存務(wù)信 售量庠財(cái)貿(mào) 零批h 4訂OLTP業(yè)務(wù)系統(tǒng)圖2XXX數(shù)據(jù)倉庫架構(gòu)上圖為XXX三層次數(shù)據(jù)倉庫結(jié)構(gòu):從第一層OLTP業(yè)務(wù)系統(tǒng)到第二層數(shù)據(jù)倉庫為建倉過程,從第二層到第三層數(shù)據(jù)集市為按主題分類建立應(yīng)用的過程。第一步包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分布等步驟,按照統(tǒng)一的數(shù)據(jù)格式標(biāo)準(zhǔn)進(jìn)行統(tǒng)一的數(shù)據(jù)轉(zhuǎn)換,建立可被企業(yè)各部門充分共享的數(shù)據(jù)倉庫。其中,數(shù)據(jù)抽取階段完成對各種數(shù)據(jù)源的訪問,數(shù)據(jù)轉(zhuǎn)換階段完成對數(shù)據(jù)的清洗、匯總和整合等,數(shù)據(jù)分布階段完成對結(jié)果數(shù)據(jù)存儲的分配。這三個(gè)階段通常緊密
9、結(jié)合在一起,由一個(gè)產(chǎn)品或幾個(gè)產(chǎn)品配合實(shí)現(xiàn)。例如,DB2WarehouseManager既可獨(dú)立完成,又可結(jié)合DataJoiner、DataPropagator實(shí)現(xiàn)對異構(gòu)數(shù)據(jù)和數(shù)據(jù)復(fù)制的處理。DB2WarehouseManager可進(jìn)行數(shù)據(jù)映射的定義,以定期地抽取、轉(zhuǎn)換和分布數(shù)據(jù);DataJoiner可訪問的各種關(guān)系型數(shù)據(jù)庫包括DB2數(shù)據(jù)庫家族、ORACLE、SYBASE、INFORMIX和MSSQLServer等;DataPropagator主要用于數(shù)據(jù)復(fù)制,采用數(shù)據(jù)復(fù)制的方式可對業(yè)務(wù)數(shù)據(jù)倉庫進(jìn)行增量數(shù)據(jù)更新,避免對作業(yè)系統(tǒng)事物處理性能的影響和大量重復(fù)抽取數(shù)據(jù)。數(shù)據(jù)的存儲由DB2家族產(chǎn)品來完成
10、,以保證數(shù)據(jù)倉庫始終高性能地運(yùn)轉(zhuǎn),提供完整、準(zhǔn)確的數(shù)據(jù),便于將來的升級和擴(kuò)展。第二步,在按主題分類建立應(yīng)用時(shí),若既想擁有多維數(shù)據(jù)庫的獨(dú)特功能,又要把數(shù)據(jù)存放在關(guān)系型數(shù)據(jù)庫中以便管理,則DB2OLAPServer是用戶的最佳選擇。DB2WarehouseManager中提供的InformationCatalog通過描述性數(shù)據(jù)幫助用戶查找和理解數(shù)據(jù)倉庫中的數(shù)據(jù),IntelligentMiner用于數(shù)據(jù)挖掘以便幫助決策者預(yù)測或發(fā)現(xiàn)隱藏的關(guān)系。最后,我們以報(bào)表或圖形的方式將結(jié)果數(shù)據(jù)呈現(xiàn)給用戶,這通常由第三方產(chǎn)品來實(shí)現(xiàn),它們包括:HyperionAnalyzer,Cognos,Brio,Business
11、Objects等。商業(yè)智能的實(shí)現(xiàn)方式多種多樣,其規(guī)模和特點(diǎn)由用戶的需求來決定。但萬變不離其宗,其基本體系結(jié)構(gòu)往往包括三個(gè)部分。2.1.2 數(shù)據(jù)倉庫:用于抽取、整合、分布、存儲有用的信息一個(gè)企業(yè)的信息往往分布在不同的部門和分支機(jī)構(gòu),管理者要綜觀全局、運(yùn)籌帷幄,必須能迅速地找到能反映真實(shí)情況的數(shù)據(jù),這些數(shù)據(jù)也許是當(dāng)前的現(xiàn)實(shí)數(shù)據(jù),也可能是過去的歷史數(shù)據(jù)。因此,有必要把各個(gè)區(qū)域的數(shù)據(jù)集合起來,去其糟粕、取其精華,將真實(shí)的、對決策有用的數(shù)據(jù)保留下來,隨時(shí)準(zhǔn)備管理人員使用。因此,數(shù)據(jù)倉庫不僅僅是個(gè)數(shù)據(jù)的儲存?zhèn)}庫,更重要的是它提供了豐富的工具來清洗、轉(zhuǎn)換和從各地提取數(shù)據(jù),使得放在倉庫里的數(shù)據(jù)有條有理,易于使
12、用。2.1.3 多維分析:全方位了解現(xiàn)狀管理人員往往希望從不同的角度來審視業(yè)務(wù)數(shù)值,比如從時(shí)間、地域、產(chǎn)品來看同一類業(yè)務(wù)的總額。每一個(gè)分析的角度可以叫作一個(gè)維,因此,我們把多角度分析方式稱為多維分析。以前,每一個(gè)分析的角度需要制作一張報(bào)表。由此產(chǎn)生了在線多維分析工具,它的主要功能,是根據(jù)用戶常用的多種分析角度,事先計(jì)算好一些輔助結(jié)構(gòu),以便在查詢時(shí)能盡快抽取到所要的記錄,并快速地從一維轉(zhuǎn)變到另一維,將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展現(xiàn)在您面前。2.1.4 前臺分析工具提供簡單易用的圖形化界面給管理人員,由他們自由選擇要分析的數(shù)據(jù)、定義分析角度、顯示分析結(jié)果。往往與多維分析工具配
13、合,作為多維分析服務(wù)器的前臺界面。以上三部分是商業(yè)智能的基礎(chǔ)。它完成的是對用戶數(shù)據(jù)的整理和觀察,可以說,它的工作是總結(jié)過去。在此基礎(chǔ)結(jié)構(gòu)之上,商業(yè)智能可以發(fā)揮更進(jìn)一步的作用,利用數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)問題、找出規(guī)律,達(dá)到真正的智能效果:預(yù)測將來2.1.5 數(shù)據(jù)挖掘正如在礦井中可以挖掘出珍貴的礦石,在數(shù)據(jù)倉庫的數(shù)據(jù)里也常??梢酝诰虺鰳I(yè)務(wù)人員意想不到的信息。它比多維分析更進(jìn)一步。例如,如果管理人員要求比較各個(gè)區(qū)域某類業(yè)務(wù)在過去一年的情況,可以從多維分析中找答案。但是,如果管理人員要問為何一種業(yè)務(wù)在某地區(qū)的情況突然變得特別好或是不好,或者問該業(yè)務(wù)在另一地區(qū)將會怎么樣,這時(shí)數(shù)據(jù)挖掘工具可以作出回答。簡單的
14、說,數(shù)據(jù)挖掘使用統(tǒng)計(jì)、分析等數(shù)學(xué)方法、以及電腦學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等人工智能方式,從大量的數(shù)據(jù)中,找尋數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系。這種關(guān)系,一般顯示數(shù)據(jù)組之間相似或相反的行為或變化。一個(gè)細(xì)心的分析者,往往能從這些發(fā)掘出來的關(guān)系得到啟示。而這種啟示又很可能使得到它的業(yè)者,獲得其他競爭者所沒有的先機(jī)。數(shù)據(jù)挖掘要求有數(shù)據(jù)倉庫作基礎(chǔ),并要求數(shù)據(jù)倉庫里已經(jīng)存有豐富的數(shù)據(jù)。因此,在實(shí)施商業(yè)智能方案時(shí),一般分兩步走:第一步實(shí)現(xiàn)數(shù)據(jù)倉庫和多維分析,構(gòu)造商業(yè)智能的基礎(chǔ),實(shí)現(xiàn)分析應(yīng)用;第二步實(shí)現(xiàn)數(shù)據(jù)挖掘,發(fā)揮商業(yè)智能的特色。2.2 商業(yè)智能方案實(shí)施原則實(shí)施商業(yè)智能方案項(xiàng)目工程,與實(shí)施傳統(tǒng)的應(yīng)用系統(tǒng)有很大的不同。其中最重要的是
15、,商業(yè)智能的實(shí)施是不斷的交流過程,只有雙方緊密的合作才能取得實(shí)施的成功。我們建議,工程實(shí)施上采取以下原則:2.2.1 分階段、循序漸進(jìn)的原則任何一個(gè)項(xiàng)目的實(shí)施都是一個(gè)發(fā)現(xiàn)問題,解決問題,積累經(jīng)驗(yàn),又遇到新問題,再解決,再積累的循序漸進(jìn)的過程。我們建議XXX公司應(yīng)根據(jù)現(xiàn)有的資源以及今后發(fā)展的方向,分階段、循序漸進(jìn)的實(shí)施商業(yè)智能方案。2.2.2 實(shí)用原則在第一步實(shí)現(xiàn)數(shù)據(jù)倉庫時(shí),盡量針對當(dāng)前電信最關(guān)心的主題,并將該主題進(jìn)行細(xì)致分析,盡可能用簡單、統(tǒng)一、易于使用的方式來實(shí)現(xiàn),避免追求片面的復(fù)雜和完美。2.2.3 知識原則普遍說來,由于商業(yè)智能技術(shù)相對而言比較新,企業(yè)的信息技術(shù)人員對數(shù)據(jù)倉庫、多維分析、
16、數(shù)據(jù)挖掘等系統(tǒng)涉及的知識往往存在著不足或偏差,實(shí)際應(yīng)用經(jīng)驗(yàn)也很欠缺。因此,我們建議在實(shí)施過程中結(jié)合專家培訓(xùn)和服務(wù),在商業(yè)智能系統(tǒng)的設(shè)計(jì)、開發(fā)、實(shí)施當(dāng)中,逐步培養(yǎng)出企業(yè)自己的系統(tǒng)管理、維護(hù)和開發(fā)人員。當(dāng)系統(tǒng)投入使用時(shí),這些人員可以對系統(tǒng)進(jìn)行維護(hù)和管理,并負(fù)責(zé)對最終用戶進(jìn)行培訓(xùn)。第三章XXX公司I系統(tǒng)方案3.1 XXX公司BI系統(tǒng)的需求分析在XXX公司的BI系統(tǒng)中,可以實(shí)現(xiàn)如下一系列經(jīng)營過程中的分析和決策支持:除了以上列出的一系列分析和預(yù)測外,利用BI系統(tǒng),還應(yīng)該能夠根據(jù)XXX公司的需求很方便地?cái)U(kuò)展其功能。3.2 XXX的解決方案基于XXX公司BI系統(tǒng)的需求,以及XXX公司在數(shù)據(jù)倉庫領(lǐng)域的經(jīng)驗(yàn),我
17、們提出以下解決方案:采用一個(gè)企業(yè)級的數(shù)據(jù)倉庫,實(shí)現(xiàn)各分行業(yè)務(wù)數(shù)據(jù)的自動采集、清洗、匯總,并且通過多維分析工具,讓用戶能夠有效的將數(shù)據(jù)轉(zhuǎn)化為靈活的報(bào)表和決策支持信息,最終滿足用戶的信息需求。該方案的實(shí)現(xiàn)方式如下:首先,在數(shù)據(jù)主要來源于兩個(gè)方面:綜合業(yè)務(wù)系統(tǒng)和新錄入的數(shù)據(jù)。綜合業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)通過數(shù)據(jù)倉庫工具進(jìn)行自動采集、清洗、整理,而需要新錄入的數(shù)據(jù)則通過瀏覽器方式錄入。在構(gòu)造數(shù)據(jù)倉庫的過程中,我們采取以點(diǎn)帶面的做法,采用小步長、逐步地建立數(shù)據(jù)倉庫的策略。以XXX公司報(bào)表系統(tǒng)為開端,分階段地實(shí)現(xiàn)商業(yè)智能應(yīng)用。小的項(xiàng)目可以立即顯示數(shù)據(jù)倉庫的價(jià)值,同時(shí)也提供了更快的投資回報(bào)。而且,先在只有少量的數(shù)據(jù)
18、和用戶的小系統(tǒng)上進(jìn)行學(xué)習(xí)和實(shí)踐,對技術(shù)人員來說會學(xué)得更快。我們希望首先在需求較為迫切的領(lǐng)域,選擇一些比較有意義的主題;基于這些主題,我們將建立一個(gè)數(shù)據(jù)集市,待用戶能夠?qū)?shù)據(jù)倉庫的概念和一些技術(shù)有了比較深刻的認(rèn)識之后,冉綜觀全局,構(gòu)建起企業(yè)級的數(shù)據(jù)倉庫。數(shù)據(jù)錄入可以采用數(shù)據(jù)文件快速裝入的方式,也可以采用專門應(yīng)用的方式。如果采用后者,我們可以考慮使用XXX的WebSphere和VisualAgeforJava進(jìn)行開發(fā),它們產(chǎn)品是XXX電子商務(wù)應(yīng)用的重要部件。利用這兩個(gè)工具,我們可以方便地建立Web頁面,生成Java程序,包括Applet、Servlet和Application等等。并且系統(tǒng)的維護(hù)工
19、作也比較方便,當(dāng)需要修改應(yīng)用時(shí),只需要修改服務(wù)器上的程序就可以了,不需要在客戶端做工作。另外,這種結(jié)構(gòu)對客戶機(jī)的配置要求也不太高。在建造數(shù)據(jù)倉庫的過程中,我們推薦使用XXX的WarehouseManager,該產(chǎn)品是XXX用來建立數(shù)據(jù)倉庫的工具,利用該工具,我們可以方便、快捷地構(gòu)造起數(shù)據(jù)倉庫來,因?yàn)槲覀儜?yīng)該認(rèn)識到數(shù)據(jù)倉庫必須建立在一個(gè)開放的、可更改的結(jié)構(gòu)上,以便能夠處理數(shù)據(jù)和需求的不斷膨脹。WarehouseManagers是這樣的一個(gè)工具。提供一個(gè)開放的,從數(shù)據(jù)源到數(shù)據(jù)倉庫的一致的解決方案。在XXX公司的BI系統(tǒng)中,通過WarehouseManager管理器可以方便地建立數(shù)據(jù)加工的流程(pr
20、ocess和步驟(step),這些步當(dāng)!反映了XXX公司具體業(yè)務(wù)數(shù)據(jù)的流程、規(guī)則。在各步驟中可以定義代理(agent)來自動運(yùn)行數(shù)據(jù)傳遞、清洗和匯總功能,這些步驟可以按時(shí)間、事件運(yùn)行,或由其它步驟觸發(fā)。代理可以運(yùn)行在WarehouseManager服務(wù)器上,也可以運(yùn)行在遠(yuǎn)程的業(yè)務(wù)主機(jī)上,并且可以有多個(gè)代理運(yùn)行以提高效率??梢砸苑浅V庇^的圖形化方式管理數(shù)據(jù)倉庫,當(dāng)報(bào)表系統(tǒng)的業(yè)務(wù)需求發(fā)生變化時(shí),可以非常方便地修改步驟,滿足變化多端的商業(yè)競爭環(huán)境。WarehouseManage是專門為商業(yè)應(yīng)用設(shè)計(jì)的,它可以自動在網(wǎng)絡(luò)上進(jìn)行數(shù)據(jù)的傳送,不需要人為干預(yù),并且利用它的日志功能可以對系統(tǒng)運(yùn)行很好地監(jiān)控。在D
21、B2WarehouseManager(DWM)中含有WarehouseAgen詹B件,它可以用來在位于數(shù)據(jù)倉庫的目標(biāo)數(shù)據(jù)庫DB2UDB中執(zhí)行直接執(zhí)行數(shù)據(jù)倉庫的數(shù)據(jù)加工。另外,在數(shù)據(jù)倉庫服務(wù)器于業(yè)務(wù)系統(tǒng)之間的文件數(shù)據(jù)FTP傳輸以及從表中抽取少量數(shù)據(jù)也可以通過Agent直接執(zhí)行。建立數(shù)據(jù)倉庫之后,選擇一些有意義的主題,抽取相關(guān)的數(shù)據(jù)到DB2OLAPServer中,利用DB2OLAPServer的強(qiáng)大分析功能,給最終用戶提供在線多維分析的功能,能夠讓最終用戶充分挖掘出數(shù)據(jù)中包含的信息。DWM在執(zhí)行完數(shù)據(jù)的提取任務(wù)后,自動觸發(fā)預(yù)先定義好的OLAP操作,將數(shù)據(jù)經(jīng)過匯總計(jì)算后加載至DB2OLAPServe
22、r中。最終用戶工具我們選用DB2OLAPAnalyzer,這個(gè)產(chǎn)品是一個(gè)數(shù)據(jù)倉庫的前端分析工具,利用這個(gè)工具用戶可以很容易地訪問OLAPServer中經(jīng)過處理的數(shù)據(jù),制作各種形式、風(fēng)格的報(bào)表,報(bào)表內(nèi)容可以包括數(shù)字、圖像、曲線等,使得管理層可以直接、直觀地查看企業(yè)的經(jīng)營情況。3.3建議架構(gòu)DB2 UDB EEDB2 OLAP ServerDB2 Warehouse ManagerDB2 Intelligent Miner for DataDB2 Intelligent Miner ScoringMeta Data管理/數(shù)據(jù)倉庫控制DB2/Warehouse Control CenterDB2 W
23、arehouse ServerDB2 OLAP Server Application ManagerDB2 Intelligent Miner ClientWindows 2000查詢/分析WEB用服務(wù)器DB2 OLAP Analysis Server HTTP Server圖3XXX公司BI系統(tǒng)軟硬件配置示意圖在此方案中,采用RS/6000服務(wù)器作為運(yùn)行數(shù)據(jù)倉庫目標(biāo)數(shù)據(jù)庫的服務(wù)器,其上安裝DB2UDBEE、DB2WarehouseManager用來從生產(chǎn)系統(tǒng)抽取對決策有用的業(yè)務(wù)數(shù)據(jù),經(jīng)過加工后存放在數(shù)據(jù)倉庫中。在海量數(shù)據(jù)倉庫基礎(chǔ)上針對每一類具體業(yè)務(wù)問題建立數(shù)據(jù)集市。由于XXX公司BI系統(tǒng)中的
24、業(yè)務(wù)問題大多是多維分析問題,故利用另外一臺RS/6000服務(wù)器運(yùn)行XXX公司專門的多維分析服務(wù)器產(chǎn)品DB2OLAPServer,以極大地加快多維分析的速度。在數(shù)據(jù)倉庫服務(wù)器上同時(shí)安裝DB2IntelligentMinerforData,從數(shù)據(jù)倉庫服務(wù)器中抽取數(shù)據(jù)進(jìn)行智能挖掘;止匕外,在數(shù)據(jù)倉庫上安裝DB2IntelligentMinerScoring,用來將數(shù)據(jù)挖掘的結(jié)果作用到數(shù)據(jù)倉庫中,實(shí)現(xiàn)打分功能。所有客戶端以瀏覽器方式,通過查詢和多維分析的WEB應(yīng)用服務(wù)器訪問數(shù)據(jù)倉庫和多維分析服務(wù)器中的數(shù)據(jù)。整個(gè)系統(tǒng)需要在一臺運(yùn)行Windows2000的PC服務(wù)器上安裝DB2OLAPAnalyzerAn
25、alysisServer以及HTTPServer,作為為前端瀏覽器客戶提供統(tǒng)一入口的應(yīng)用服務(wù)器。為提高系統(tǒng)響應(yīng)時(shí)間及提供負(fù)載均衡能力,可以配合WebSphereApplicationServer同使用。另外,需要配置一臺PC服務(wù)器運(yùn)行Windows2000作為整個(gè)系統(tǒng)的控制服務(wù)器,安裝DB2WarehouseControlServerDB2ControlCenter、OLAPServer控制臺OLAPServerApplicationManager以及挖掘服務(wù)器前端DB2IntelligentMinerforDataCliento此方案的優(yōu)點(diǎn):基于公司的業(yè)務(wù)需求。各業(yè)務(wù)部門可以根據(jù)自己的需要定
26、義數(shù)據(jù)集市的內(nèi)容,并進(jìn)行各種指標(biāo)的多維分析,在實(shí)際應(yīng)用中不斷擴(kuò)展系統(tǒng),為決策者提供必要的信息。高性能、高效率。數(shù)據(jù)都在本地運(yùn)行,數(shù)據(jù)量相對較小,因此對服務(wù)器計(jì)算能力的要求相對較低。同時(shí)由于在局域網(wǎng)上運(yùn)行,對網(wǎng)絡(luò)帶寬基本不會有壓力,并且用戶響應(yīng)時(shí)間可以得到保障。最大限度地減少網(wǎng)絡(luò)負(fù)荷。各客戶端通過瀏覽器方式從中心數(shù)據(jù)倉庫中獲取數(shù)據(jù),只有需要的數(shù)據(jù)被傳輸。滿足XXX公司未來發(fā)展的需要。此方案具有很好的可擴(kuò)展性,隨著XXX公司業(yè)務(wù)量的增加,業(yè)務(wù)數(shù)據(jù)的增多,各種業(yè)務(wù)系統(tǒng)的建立,此方案可以容易的適應(yīng)這些變化,滿足業(yè)務(wù)的需求。一次性投資,長期受益。此方案不僅可以滿足XXX公司目前BI系統(tǒng)的需要,更為重要的
27、是為XXX公司商業(yè)智能應(yīng)用打下了一個(gè)堅(jiān)實(shí)的基礎(chǔ)。XXX公司可以在此基礎(chǔ)上開發(fā)各種商業(yè)智能應(yīng)用,輔助決策者制定業(yè)務(wù)計(jì)劃和措施,在激烈的競爭中保持良好的勢頭。第四章所選XXX產(chǎn)品簡介在這次的商業(yè)智能解決方案中,采用的產(chǎn)品包括數(shù)據(jù)庫DB2UDB、數(shù)據(jù)倉庫(DB2WarehouseManager)多維數(shù)據(jù)庫(OLAPServer)、前臺分析工具(DB2OLAPAnalyzer)及智能數(shù)據(jù)挖掘服務(wù)器(DB2IntelligentMinerforData)。以下是各個(gè)產(chǎn)品的描述說明。4.1 DB2UDB4.1.1 概述:DB2家族(Family)與DB2通用數(shù)據(jù)庫(UDB)V7.2XXXDB2家族的各種關(guān)
28、系數(shù)據(jù)庫管理系統(tǒng)適用于各種硬件平臺,其中包括基于Intel的微機(jī)、XXX的或非XXX的各種RISC服務(wù)器和工作站、大型并行處理機(jī)、AS/400中型計(jì)算機(jī)系統(tǒng)以及運(yùn)行VM、VSE和MVS、OS/390操作系統(tǒng)的主機(jī)系統(tǒng)。各種平臺上的DB2有共同的應(yīng)用程序接口,因此運(yùn)行在一種平臺上的程序可以很容易地移植到其他的平臺。DB2家族產(chǎn)品能夠滿足不同用戶的需求,它包含了從單用戶的微機(jī)系統(tǒng)到支持80萬用戶的主機(jī)系統(tǒng)。DB2家族除了包含在各種平臺上運(yùn)行的數(shù)據(jù)庫管理系統(tǒng)內(nèi)核之外,產(chǎn)品包中還包括了數(shù)據(jù)復(fù)制、數(shù)據(jù)庫系統(tǒng)管理、環(huán)球網(wǎng)(Internet)網(wǎng)關(guān)支持、在線分析處理、多媒體支持和各種并行處理能力,免費(fèi)提供DB
29、2UDBV7.2在PC和UNIX平臺上的客戶機(jī)端產(chǎn)品(DB2CAE),并為所有平臺上的異構(gòu)數(shù)據(jù)庫訪問提供中介件”(Middleware驊決方案??蛇\(yùn)行在基于Intel的微機(jī)及各種RISC服務(wù)器(UNIX平臺)上的DB2UDBV7.2包括:DB2forAIX,DB2forHP-UX,DB2forSUNSolaris,DB2forOS/2,DB2forWindowsNT,DB2forWin95,DB2forWin98,DB2forLinux,DB2forSCO,DB2forSinix,DB2forNUMA-Q等等。這些產(chǎn)品是全功能、具有工業(yè)強(qiáng)度的關(guān)系數(shù)據(jù)庫管理系統(tǒng),分別用于服務(wù)器和工作站平臺??梢?/p>
30、把它們配置到單個(gè)的系統(tǒng)上,或者配置到支持客戶機(jī)工作站的LAN服務(wù)器上,還可以把它們配置為環(huán)球網(wǎng)(Internet)上的數(shù)據(jù)庫服務(wù)器。如果使用服務(wù)器配置,那就允許DOS、Windows、OS/2、Win95、Win98、Macintosh或UNIX客戶機(jī)去訪問DB2服務(wù)器,可以使用TCP/IP、IPX/SPX、NetBIOS或APPC等網(wǎng)絡(luò)協(xié)議;如果作為環(huán)球網(wǎng)上的數(shù)據(jù)庫服務(wù)器,則可由一臺瀏覽器(WebBrowser)作為客戶機(jī)訪問。DB2通用數(shù)據(jù)庫(UDB)V7.2產(chǎn)品建立在一個(gè)共同代碼的基礎(chǔ)之上,依據(jù)多進(jìn)程/多線索結(jié)構(gòu)進(jìn)行設(shè)計(jì),具數(shù)據(jù)庫引擎的核心技術(shù)來自Starburst研究項(xiàng)目以及DB2fo
31、rOS/390等主機(jī)產(chǎn)品,而且它們在數(shù)據(jù)和應(yīng)用的可移植性兩個(gè)方面與DB2家族中的其他成員完全兼容。因而任何受過一種平臺上的DB2培訓(xùn)的人員能夠很容易地使用其他平臺的DB2產(chǎn)品。在保持這種外在的兼容性以及具備DB2家族成員所必需具備的可靠性和可管理性的同時(shí),實(shí)際上它們每個(gè)產(chǎn)品還針對各自的平臺環(huán)境作了調(diào)整和優(yōu)化以達(dá)到業(yè)界領(lǐng)先的性能/價(jià)格比。Global SolutionsSaiirce-Orficie* 34曾, inTDrmlx« 目QL Barwr-IMS*DB2ftrOM9O DB2 lorVMindVSE 上 DBZ-TdfOSjIQQraiConnwl DWhu0ner F4I
32、DalaWANClients «DOS widows求f第 0S.2 aAJX -*HP-LK *5C0TCPflPfWSPXNETS 10$RHPfnr AIK DBSforKS' Dm dm Hn3 LTX DH7 fM SIJNScHwix DQ2fw NUMA.Q UHNlDf SIMM SUN Solent SNi Sim?:, SGI Inn h4AC Wnh ArrnM$ei jo 口日NTurgf:-DBZibrvmNT. DB2 (nrnSSSatallite> Win NTPersonalDBSfOffSC-O口必Off LiiwkManagemen
33、t OB? Erteipri? GqmHNTDB2 everyplaceTCP/IP 呂NA IRyiSPXHostsParallel Complexes*DB2UDBEEE 日2 for 口5詢*02 for 05/400CompleteSolutionsDB2產(chǎn)品家族提供了完整的中文支持,對中文的支持貫穿于從微機(jī)到主機(jī)的所有平臺,這是任何其他數(shù)據(jù)庫廠家做不到的。圖4DB2家族產(chǎn)品4.1.2 DB2通用數(shù)據(jù)庫(UDB)V7.2的特色DB2通用數(shù)據(jù)庫(UDB)V7.2無論在網(wǎng)絡(luò)計(jì)算方面還是在線分析、多媒體處理,都能給你全面、滿意的支持,而且集成了豐富的數(shù)據(jù)庫管理工具,把原來復(fù)雜的管理工作變得非
34、常簡單。DB2V7.2致力于商業(yè)智能和數(shù)據(jù)倉庫方面的改進(jìn),包括自動觸發(fā)器,多分區(qū)和多表的自動總計(jì)表格,優(yōu)化星式結(jié)構(gòu)的連接方法,使查詢和整個(gè)系統(tǒng)的反應(yīng)速度大大提高。同時(shí)也增加了在裝載和在線重組時(shí)對索引的維護(hù)。在DB2中還新增了統(tǒng)計(jì)、線性回歸等功能,直接支持進(jìn)一步深入分析,以便利用DB2的查詢處理實(shí)用程序,而以往只能在應(yīng)用程序級上做到這一點(diǎn)。另外,在支持16和32KBPages多個(gè)緩沖池(multiplebufferpool)的優(yōu)化、更快的完整性約束處理、處理更多查詢的星式連接等方面,做了一系列的改進(jìn)。應(yīng)一些XXX合作伙伴軟件提供商的要求,DB2UDBV7.2包含以下擴(kuò)充性能:表/視圖/別名的命名
35、長度限制由原來的18個(gè)字符擴(kuò)充為128個(gè)字符。列命名長度限制由原來的18個(gè)字符擴(kuò)充為30個(gè)字符。SQL語句的最大長度由原來的32KB增大到64KB。頁大小從16KB增大至I32KB。最大變量字符為32KB,取決于頁大小。最大表/表空間的大小從128GB擴(kuò)大到512GB,取決于頁大小。索引關(guān)鍵字長度從255字符擴(kuò)大到1,024個(gè)字符。嵌入式SQL編程支持宏。DB2V7.2對統(tǒng)一代碼(Unicode)的支持:16-Bit固定長度的Unicode包含所有通用文本字符,容許定長字符序列(以便分析)和設(shè)定含義的字符。對UCS-2和UTF-8格式的支持,允許用戶用各種主要語言創(chuàng)建數(shù)據(jù)庫和存取數(shù)據(jù)。DB2支
36、持wchar_t數(shù)據(jù)類型,使得用戶在單字節(jié)環(huán)境(如英語環(huán)境)下開發(fā)的應(yīng)用在其他環(huán)境(日語)下也可照常運(yùn)行。DB2UDBV7.2增強(qiáng)面向?qū)ο蟮腟QL和SQL擴(kuò)展,集成Windows平臺,打包新增免費(fèi)軟件。產(chǎn)品集成改變主要包括通用數(shù)據(jù)支持,免費(fèi)新增數(shù)據(jù)倉庫中心和DB2OLAPstarterkit。用戶可以使用DB2的數(shù)據(jù)連接器(DataJoiner),象訪問DB2數(shù)據(jù)資源一樣,訪問Oracle,Sybase,Informix,SQLServer等數(shù)據(jù)庫。用戶只需熟悉DB2語法即可在跨平臺的復(fù)雜環(huán)境中輕松獲取非DB2數(shù)據(jù)。DB2UDBV7.2選件中針對Oracle的關(guān)系連接部件可以使用戶通過標(biāo)準(zhǔn)SQ
37、L查詢同時(shí)訪問DB2和Oracle的數(shù)據(jù)資源。DB2UDBV7.2的用戶現(xiàn)在可以跨越DB2數(shù)據(jù)庫、Oracle數(shù)據(jù)庫或者一個(gè)OLEDB資源進(jìn)行分布式的查詢,也就是可以通過使用DB2通用數(shù)據(jù)庫的SQL句法和API在一個(gè)工作單元的查詢內(nèi)實(shí)現(xiàn)訪問和操作保存在異構(gòu)數(shù)據(jù)資源中的數(shù)據(jù)。DB2RelationalConnect加強(qiáng)了分散查詢功能,使DB2用戶可以通過一個(gè)簡單的查詢來訪問DB2數(shù)據(jù)和存儲在Oracle數(shù)據(jù)庫中的數(shù)據(jù)。DB2UDBV7.2免費(fèi)包含的數(shù)據(jù)倉庫中心把可視化倉庫的強(qiáng)大功能和DB2控制中心的便捷特點(diǎn)結(jié)合起來,為需要商業(yè)智能的用戶提供友好的用戶界面。用戶可以使用數(shù)據(jù)倉庫中心對數(shù)據(jù)進(jìn)行定義、
38、自動取樣、轉(zhuǎn)換、發(fā)布、以及為數(shù)據(jù)倉庫加載數(shù)據(jù)。這種新功能可以為一個(gè)部門或單位配置一個(gè)獨(dú)立的簡單數(shù)據(jù)中心。除數(shù)據(jù)倉庫中心之外,DB2還在Wizards,模式名模型(SchemaModeler卜元數(shù)據(jù)交換(MetadataInterchange容方面做了改進(jìn)。DB2UDBV7.2數(shù)據(jù)倉庫中心使用了更便捷的新界面,用于創(chuàng)建、設(shè)計(jì)、儲存以及維護(hù)數(shù)據(jù)倉庫以及OLAP表。DB2數(shù)據(jù)倉庫管理器產(chǎn)品在大量數(shù)據(jù)傳遞、元數(shù)據(jù)管理以及查詢管理方面做了改進(jìn)。DB2UDBV7中包含了一些先進(jìn)的高級面向?qū)ο骃QL功能,對開發(fā)人員和分析員都非常有用。這些聚合功能用于OLAP應(yīng)用計(jì)算,這是在SQL-99中很難或根本無法實(shí)現(xiàn)的
39、,具符合SQL-99OLAP附錄中建議的標(biāo)準(zhǔn)。DB2現(xiàn)在可以提供臨時(shí)表格支持,應(yīng)用存儲點(diǎn)(savingpoint),標(biāo)識欄(IDColumn),嵌套存儲過程。SQL過程語言(SQLProcedureLanguage)持創(chuàng)建DB2存儲過程,符合ANSISQL99中的存儲過程模型標(biāo)準(zhǔn)。DB2UDB存儲過程創(chuàng)建工具(SPB)是一個(gè)圖形應(yīng)用工具,支持DB2存儲過程的快速開發(fā)。通過使用SPB,用戶可以在本地和遠(yuǎn)程DB2服務(wù)器上創(chuàng)建、修改、運(yùn)行、測試和調(diào)試存儲過程。SPB提供Windows、AIX和Solaris下的開發(fā)環(huán)境,支持DB2系列產(chǎn)品,用戶可以從DB2UDB程序組啟動SPB,也可以從MSVC+,
40、MSVB,XXXVisualAgeforJava,DB2控制中心啟動SPB。DB2UDBV7.2創(chuàng)建用戶定義功能,表功能和行功能時(shí)允許包含一條SQL語句,這就減少了使用外部高級語言書寫這些功能的需要。DB2UDBV7.2推出了結(jié)構(gòu)數(shù)據(jù)類型(或者叫做抽象數(shù)據(jù)類型),這可以讓用戶和開發(fā)商們創(chuàng)建帶有結(jié)構(gòu)的表格。DB2UDBV7.2版本中包括了許多可以提高系統(tǒng)性能和改善系統(tǒng)管理的功能:能夠把ODBC/CLI應(yīng)用程序包含的動態(tài)SQL語句轉(zhuǎn)換為靜態(tài)SQL并執(zhí)行;活動日志最大可為32GB;支持多個(gè)TCP/IP收聽者(listener)。DB2UDB7提供三個(gè)新的擴(kuò)展器:(1)空間擴(kuò)展器(SpatialExt
41、ender):DB2提出了空間SQL查詢概念(SpatiallyEnabledSQLQueries)使用戶可以在關(guān)系型數(shù)據(jù)庫中集成空間數(shù)據(jù)(通過坐標(biāo)確定位置)和普通的SQL數(shù)據(jù)。這兩種技術(shù)的結(jié)合使用戶可以進(jìn)行新型查詢。新的空間擴(kuò)展器將能夠存儲和索引空間數(shù)據(jù)(坐標(biāo)信息),并使用戶通過特定的空間數(shù)據(jù)查詢對其進(jìn)行訪問。(2)DB2XML擴(kuò)展器:XXXDB2XMLExtender體現(xiàn)了XXX全面的XML技術(shù)策略,在電子商務(wù)領(lǐng)域居業(yè)界領(lǐng)導(dǎo)地位。XML擴(kuò)展器是XXXB2B服務(wù)器的組成部分,使DB2服務(wù)器可以支持XMLoXXX曾為早期XML技術(shù)被采用和發(fā)展起到了關(guān)鍵作用,此次該擴(kuò)展器又提供了XML存儲和數(shù)據(jù)
42、交換的新技術(shù)。通過存儲,XML擴(kuò)展器提供了XML文檔在DB2中的存儲和恢復(fù)機(jī)制,并可高效地查詢XML內(nèi)容。通過數(shù)據(jù)交換,XML擴(kuò)展器提供新的和已存在的DB2相關(guān)表格和XML格式文檔之間的映射。DB2用戶可以在任何地方通過XML擴(kuò)展器進(jìn)行電子商務(wù),實(shí)現(xiàn)企業(yè)之問(B2B)和企業(yè)與消費(fèi)者之間(B2C)的應(yīng)用。本產(chǎn)品是免費(fèi)的。A支持先進(jìn)的面向?qū)ο蠛投嗝襟w應(yīng)用自從70年代XXX發(fā)明關(guān)系數(shù)據(jù)庫以來,在數(shù)據(jù)庫市場上,關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)得到極其廣泛的運(yùn)用。關(guān)鍵任務(wù)的應(yīng)用在很大程度上依賴于RDBMS的使用。然而,目前很多RDBMS用戶正轉(zhuǎn)向非傳統(tǒng)的、面向?qū)ο蟮膽?yīng)用,需要對更廣泛的形形色色的現(xiàn)實(shí)世
43、界數(shù)據(jù)予以支持。比如,需要更有效地處理在RDBMS中的文本、聲音、視頻、映象等數(shù)據(jù)。DB2通用數(shù)據(jù)庫(UDB)能夠支持這些先進(jìn)的應(yīng)用。DB2把對傳統(tǒng)應(yīng)用與非傳統(tǒng)應(yīng)用的支持與數(shù)據(jù)庫體系結(jié)構(gòu)集成在一起,對關(guān)系型數(shù)據(jù)庫進(jìn)行面向?qū)ο髷U(kuò)展,形成新一代對象關(guān)系型數(shù)據(jù)庫系統(tǒng)(ObjectRelationalDBMS)°DB2UDBV7.2提供了許多對面向?qū)ο蠹岸嗝襟w應(yīng)用的支持。用戶定義類型(UDT)DB2允許用戶定義新的數(shù)據(jù)類型,稱為用戶自定義類型(UserDennedType)。例如,一個(gè)用戶可以定義兩種幣值類型:用CDOLLAR表示加拿大元,用USDOLLAR表示美元。這兩種類型在內(nèi)部可以用d
44、ecimal(十進(jìn)制)類型來表示,但在意義上是有顯著差別的。它們彼此間不應(yīng)也不能直接進(jìn)行比較,也不可直接與decimal類型進(jìn)行比較。這是通過DB2的面向?qū)ο髲?qiáng)類型(strongtyping)機(jī)制來保證的。象內(nèi)設(shè)(built-in)類型一樣,UDT可以用來定義表列的數(shù)據(jù)類型和用戶定義函數(shù)(UDF)的參數(shù)。例如,用戶可以定義一個(gè)類型:多邊形Polygons,這個(gè)用戶自定義類型可有構(gòu)造函數(shù),還可有一組用戶定義的函數(shù)作用于它,如求面積,求角度,以及旋轉(zhuǎn)多邊形等等。用戶定義函數(shù)(UDF)DB2允許用戶用C,C+等編譯語言定義新的函數(shù),稱為用戶自定義函數(shù)(UserDefinedFunction)0UDF
45、允許在查詢中包含強(qiáng)有力的計(jì)算過程和檢索判定,以便濾除在數(shù)據(jù)源附近無關(guān)的數(shù)據(jù)。UDF使用戶有能力提供一組函數(shù),它們作用于用戶定義的類型,形成面向?qū)ο蟮姆庋b,從而定義該UDT的行為語義。SQL優(yōu)化器考慮到UDF的語義和執(zhí)行成本,這使得對待用戶定義的函數(shù)就完全象對待內(nèi)設(shè)函數(shù)(如SUBSTR和LENGTH)一樣。開發(fā)應(yīng)用程序所用的語言環(huán)境可以不同,如C、C+、COBOL、FORTRAN和PL/I等,借助于SQL,應(yīng)用程序共享一組UDT和UDF。把用戶定義的類型和函數(shù)組合在一起使用,就能把數(shù)據(jù)的表示和解釋該數(shù)據(jù)的一組函數(shù)定義都隱藏起來。利用它們能創(chuàng)建函數(shù)庫,這些函數(shù)庫可以是XXX開發(fā)的,也可以是第三方經(jīng)
46、銷商或客戶自行開發(fā)的,然后直接把它們集成在數(shù)據(jù)庫中。大對象(LOB)LOB允許用戶在一個(gè)數(shù)據(jù)庫中存儲特大(若干個(gè)GB)對象。在DB2中有二進(jìn)制LOB(BLOB),字符LOB(CLOB),雙字節(jié)字符LOB(DBCLOB)等幾種類型。用LOB可以存儲多媒體對象,如文檔資料、視頻信號、映象和聲音等。它也可存儲由UDT和UDF定義其語義的小型結(jié)構(gòu)。DB2支持一組用于LOB的功能強(qiáng)大的內(nèi)設(shè)函數(shù),如查找、子用和連接等。利用UDF方式用戶可隨時(shí)定義附加函數(shù)。另外,在一個(gè)表中可以定義多個(gè)LOB歹I。對LOB實(shí)現(xiàn)支持時(shí)要考慮到客戶對性能的需求,為此允許數(shù)據(jù)庫用戶或管理員執(zhí)行如下操作:僅訪問應(yīng)用程序需要的那部分L
47、OB,不必訪問整個(gè)LOB。延遲或取消LOB的求值過程。在定義一個(gè)LOB歹時(shí),能做出選擇-對該LOB列是否作日志。把LOB數(shù)據(jù)存儲在不連續(xù)的數(shù)據(jù)庫分區(qū)中,這些分區(qū)是專為LOB管理而構(gòu)造的。關(guān)系數(shù)據(jù)庫擴(kuò)展器(RelationalExtenders)關(guān)系數(shù)據(jù)庫擴(kuò)展器是一個(gè)預(yù)先包裝的用戶定義類型、用戶定義函數(shù)、觸發(fā)器、約束以及存貯過程的集合。利用DB2提供的對象關(guān)系型特征,把DB2的基于內(nèi)容的搜索能力擴(kuò)展到諸如文本、圖像、視頻、音頻之類的新的數(shù)據(jù)類型。使用關(guān)系擴(kuò)展程序,只需簡單地添加由關(guān)系擴(kuò)展程序提供的相應(yīng)數(shù)據(jù)類型的列(如文本或圖像列),用戶就可以把文本文檔、圖像、視頻、音頻等連同常規(guī)企業(yè)數(shù)據(jù)一起存貯
48、在DB2的表中,對這些表的結(jié)構(gòu)或主關(guān)鍵列并沒有任何特殊要求。關(guān)系擴(kuò)展程序還提供了一組用戶定義函數(shù),用于對新數(shù)據(jù)類型的管理、索引和搜索。集成內(nèi)容搜索集成內(nèi)容搜索由RelationalExtenders通過用戶定義函數(shù)來支持。例如:DB2ImageExtender提供了一組函數(shù)來支持關(guān)于圖像的、基于內(nèi)容的搜索。一個(gè)用戶可以在一個(gè)SQL查詢中使用一個(gè)ImageExtender函數(shù)來請求那些與一個(gè)現(xiàn)有圖像相似的圖像。并且,其實(shí)現(xiàn)對用戶是透明的,用戶只需簡單地把他的搜索請求表示為SQL查詢即可,該SQL查詢將自動地調(diào)用由擴(kuò)展程序提供的函數(shù)。DB2的基于SQL的、支持集成內(nèi)容搜索的方法的另一個(gè)重要的優(yōu)點(diǎn)是
49、既可以在多種非常規(guī)的數(shù)據(jù)類型上搜索給定的查詢,又可以在常規(guī)的數(shù)據(jù)上搜索給定的查詢。B強(qiáng)勁的在線分析處理(OLAP)支持DB2優(yōu)化器能夠使用動態(tài)位圖索引(DynamicBit-MapIndexAnding)即根據(jù)需要在相應(yīng)字段上自動地動態(tài)生成位圖索引,從維數(shù)表格(Dimensiontable)中調(diào)選出符合條件的記錄,再和事實(shí)表格(Facttable)連接,提高了訪問多維數(shù)據(jù)的性能;而不是執(zhí)行Cartesian的維數(shù)表格連接,避免了大量中間數(shù)據(jù)的生成,中間數(shù)據(jù)已實(shí)現(xiàn)了理論上的最小值。當(dāng)連接所涉及的表達(dá)到三個(gè)或三個(gè)以上,DB2可自動判斷是否使用星型連接技術(shù)(StarJoin河口動態(tài)位圖索引進(jìn)行優(yōu)化。
50、DB2在SQL中新增加了ROLLUP和CUBE功能,ROLLUP功能通過在常規(guī)組的行中增加小計(jì)”和總計(jì)”行來提供擴(kuò)展的組(GROUP),CUBE功能增加了“crossabulation行:它們通過星型連接(Starjoin)方式在關(guān)系型數(shù)據(jù)庫中支持在線分析處理(OLAP),使用立體的結(jié)構(gòu)查看和歸納數(shù)據(jù)而不是傳統(tǒng)的平面結(jié)構(gòu)。DB2的優(yōu)化器一向是值得XXX驕傲的,它提供了領(lǐng)先于其它數(shù)據(jù)庫廠商的基于成本優(yōu)化技術(shù),它在優(yōu)化時(shí)考慮了CPU速度、磁盤I/O率、表格尺寸、有效訪問路徑,并且如果可能的話可以重寫查詢,以得到更高的性能。這更使得DB2的在線分析處理(OLAP)功能如虎添翼。C卓越的弁行處理能力弁
51、行優(yōu)化技術(shù)DB2UDBV7.2無論在SMP還是在MPP環(huán)境下,甚至在SMP節(jié)點(diǎn)組成的MPP環(huán)境下,都可充分發(fā)揮其并行處理能力。查詢執(zhí)行時(shí)被透明地分開后并行執(zhí)行(稱作內(nèi)部查詢并行性:Intra-queryparallelism),過去需要數(shù)小時(shí)的查詢現(xiàn)在只需幾分鐘就可以完成。過去不能執(zhí)行的查詢現(xiàn)在不僅可行,而且還能從中獲益。在SMP環(huán)境下處理并行,DB2UDB采用的是吸管模型(Strawmodel)。此時(shí)被執(zhí)行的SQL相當(dāng)于杯子中的水,而每個(gè)CPU相當(dāng)于一根吸水的吸管,這樣被執(zhí)行的SQL很快就被CPU“吸干”了。在MPP環(huán)境下處理并行,則相當(dāng)于把杯子中的水先智能地分配給多個(gè)小水杯(參與SQL執(zhí)行
52、的節(jié)點(diǎn)機(jī)),這樣小水杯中的水就分別被每個(gè)節(jié)點(diǎn)機(jī)吸干”了。有了好的模型僅僅是開了個(gè)好頭,DB2UDBV7.2中融入的最先進(jìn)的技術(shù)才是成功的關(guān)鍵。(1)并行優(yōu)化:從很多系統(tǒng)中抽取非常多的數(shù)據(jù),這會耗費(fèi)大量的時(shí)間,如果效率不高,還會浪費(fèi)大量寶貴的處理能力。從串行數(shù)據(jù)庫中抽取數(shù)據(jù)有很多方法,它們沒有必要象并行數(shù)據(jù)庫那樣運(yùn)作。DB2UDBV7.2有一個(gè)查詢優(yōu)化器,是由XXX研究機(jī)構(gòu)開發(fā)的,它是專為提高并行抽取數(shù)據(jù)的效率而設(shè)計(jì)的。這樣就可獲得高品質(zhì)的查詢性能,特別是對特大型數(shù)據(jù)庫。(2)全面并行(ParallelEverything):DB2首先把數(shù)據(jù)分配到數(shù)據(jù)庫中的多個(gè)分區(qū)或子集中,這些數(shù)據(jù)庫位于多個(gè)S
53、P站點(diǎn)或SMP服務(wù)器內(nèi)。接著,DB2自動創(chuàng)建一個(gè)并行處理訪問計(jì)劃。數(shù)據(jù)掃描、合并、分類、負(fù)載平衡、表格重組、數(shù)據(jù)調(diào)用、創(chuàng)建索引、索引訪問、備份與恢復(fù)等一系列工作都是在所有不同的節(jié)點(diǎn)里同時(shí)完成的。DB2UDBV7.2以并行方式執(zhí)行全部數(shù)據(jù)庫功能,這包括全部SQL語句(Select、Insert、Update和Delete)、實(shí)用程序(backup,restore,reorg,load)和數(shù)據(jù)存取方法(連接、表掃描和索引掃描)等,而且無需任何額外的編程。這不僅提供了更好的性能和可伸縮性,而且也提供了更佳的管理性一一有能力利用全部處理機(jī)去執(zhí)行數(shù)據(jù)庫管理任務(wù)。進(jìn)一步說,DB2UDBV7.2既可用于聯(lián)機(jī)
54、事務(wù)處理(OLTP),又可用于決策支持查詢工作。(3)管理工具在并行環(huán)境同樣適用:Governor幫助您控制每個(gè)用戶及應(yīng)用程序的資源利用率,可自動調(diào)整查詢的優(yōu)先級。從而,在線平衡負(fù)載,簡化系統(tǒng)管理,減少關(guān)機(jī)時(shí)間。通過并行在線備份功能可顯著減少備份及恢復(fù)所需的時(shí)間。(4)并行環(huán)境下功能不受任何限制:DB2UDBV7.2對多媒體數(shù)據(jù)的支持、支持的客戶端平臺、支持的應(yīng)用開發(fā)接口和開發(fā)工具以及動態(tài)位圖索引等多維分析功能、對WEB和Java的支持均不受限制。對MPP結(jié)構(gòu)計(jì)算機(jī)的獨(dú)特支持當(dāng)企業(yè)的業(yè)務(wù)系統(tǒng)或數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)量不斷增大、并發(fā)用戶量不斷增大時(shí),依靠單一的數(shù)據(jù)庫服務(wù)器往往難以獲得比較好的性能和處
55、理能力。此時(shí),由多臺服務(wù)器協(xié)同工作成為解決這一問題的有效手段。多臺服務(wù)器協(xié)同工作的手段主要有共享硬盤的集群式計(jì)算機(jī),以及不共享任何資源而自以高速網(wǎng)絡(luò)相連的海量并行處理計(jì)算機(jī)兩種方式。隨著計(jì)算機(jī)科學(xué)的不斷發(fā)展,無論是科學(xué)計(jì)算領(lǐng)域還是在數(shù)據(jù)庫領(lǐng)域都已經(jīng)備計(jì)算機(jī)科學(xué)家證明,海量并行處理是目前解決大數(shù)據(jù)量、最大限度里并行處理能力的最佳手段。運(yùn)行在MPP體系結(jié)構(gòu)計(jì)算機(jī)上的DB2UDBV7.2企業(yè)擴(kuò)展版(EnterpriseExtendedEdition),作為并行關(guān)系數(shù)據(jù)庫它允許把單個(gè)數(shù)據(jù)庫映象散布到多個(gè)系統(tǒng)上,從而能利用所有系統(tǒng)的處理能力以滿足用戶對數(shù)據(jù)的需求。DB2可以在并行處理的多個(gè)節(jié)點(diǎn)上同時(shí)運(yùn)行
56、某一查詢,從而提高查詢性能,必要時(shí)它可以重新編寫查詢以優(yōu)化性能。然后,它自動生成用于并行處理的訪問方案。它包括以下針對MPP體系結(jié)構(gòu)的特性:(1)無共享(Shared-Nothing飾才DB2UDBV7.2企業(yè)擴(kuò)展版的體系結(jié)構(gòu)設(shè)計(jì)為每個(gè)系統(tǒng)(節(jié)點(diǎn))只處理它那一部分?jǐn)?shù)據(jù)庫,彼此間盡可能獨(dú)立。這就減少了節(jié)點(diǎn)間共享資源時(shí)的競爭,并允許數(shù)據(jù)庫有效地伸縮以支持更大的數(shù)據(jù)庫,或者通過附加更多節(jié)點(diǎn)以支持更多用戶。在客戶進(jìn)行benchmark測試時(shí)多達(dá)512個(gè)節(jié)點(diǎn),都表明DB2UDBV7.2企業(yè)擴(kuò)展版的性能可隨系統(tǒng)規(guī)模線性增長。它的體系結(jié)構(gòu)的規(guī)??啥噙_(dá)上千個(gè)節(jié)點(diǎn)。(2)智能數(shù)據(jù)分發(fā):可在數(shù)據(jù)庫的多個(gè)分區(qū)或子集
57、中分布數(shù)據(jù),其分區(qū)圖允許DB2管理分發(fā)過程并在必要時(shí)重新分發(fā)。DB2基于成本的SQL優(yōu)化器利用分區(qū)信息估計(jì)SQL查詢不同執(zhí)行方案的成本,在需要分布數(shù)據(jù)和重新分布數(shù)據(jù)時(shí)進(jìn)行有效的管理,從中選擇成本最低的方案。(3)應(yīng)用透明性:對在DB2客戶機(jī)工作站上工作的程序員或業(yè)務(wù)用戶來說,DB2UDBV7.2企業(yè)擴(kuò)展版看起來與其它的DB2數(shù)據(jù)庫一樣。使用DB2UDBV7.2企業(yè)擴(kuò)展版時(shí)不需要修改應(yīng)用程序,這就保護(hù)了當(dāng)前用在DB2家族產(chǎn)品上在數(shù)據(jù)、應(yīng)用和技能方面的投資,同時(shí)也提供了新的強(qiáng)有力的數(shù)據(jù)處理手段和發(fā)揮成本效果的手段。(4)對RS/6000SP的支持:DB2UDBV7.2企業(yè)擴(kuò)展版的體系結(jié)構(gòu)完全可與XXX的大型并行處理器(MPP)RS/6000SP相媲美。RS/6000SP由上千個(gè)RS/6000節(jié)點(diǎn)組成,相互由高速開關(guān)連接。DB2UDBV7.2企業(yè)擴(kuò)展版和RS/6000SP的結(jié)合構(gòu)成當(dāng)今產(chǎn)業(yè)界中最有伸縮性和功能最強(qiáng)的并行數(shù)據(jù)庫方案。(5)可伸縮的性能和容量:DB2UDBV7.2企業(yè)擴(kuò)展版提供了非并行增量增長的途徑,從容量為1-2GB的單處理器數(shù)據(jù)庫到具有兆兆(TB)字節(jié)甚至更多數(shù)據(jù)的有512個(gè)節(jié)點(diǎn)的MPP計(jì)算機(jī),這一切都不需重寫應(yīng)用程序(串行和并行環(huán)境使用相同的SQL語句)即可移到新的操作環(huán)境中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版智慧城市建設(shè)項(xiàng)目委托投標(biāo)協(xié)議書范本3篇
- 2025版新企業(yè)股東協(xié)議書范本:企業(yè)創(chuàng)新發(fā)展計(jì)劃3篇
- 2025版新車銷售與二手車置換優(yōu)惠套餐合同范本2篇
- 2025版學(xué)校食堂勞務(wù)承包與營養(yǎng)膳食研究開發(fā)協(xié)議3篇
- 2025年度個(gè)人房產(chǎn)買賣合同違約責(zé)任約定書
- 2025個(gè)人合伙企業(yè)股份清算轉(zhuǎn)讓協(xié)議3篇
- 2025版?zhèn)€人借款擔(dān)保合同標(biāo)準(zhǔn)化模板4篇
- 2025年全球及中國水平運(yùn)動輸送機(jī)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報(bào)告
- 2025-2030全球高牌號取向硅鋼行業(yè)調(diào)研及趨勢分析報(bào)告
- 2025-2030全球牽引型AGV行業(yè)調(diào)研及趨勢分析報(bào)告
- 《徐霞客傳正版》課件
- 江西硅博化工有限公司年產(chǎn)5000噸硅樹脂項(xiàng)目環(huán)境影響評價(jià)
- 高端民用航空復(fù)材智能制造交付中心項(xiàng)目環(huán)評資料環(huán)境影響
- 貴州省黔東南州2024年七年級上學(xué)期數(shù)學(xué)期末考試試卷【附答案】
- 量子醫(yī)學(xué)成像學(xué)行業(yè)研究報(bào)告
- DB22T 3268-2021 糧食收儲企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化評定規(guī)范
- 辦事居間協(xié)議合同范例
- 正念減壓療法詳解課件
- 學(xué)校校本課程《英文電影鑒賞》文本
- 華為HCSA-Presales-IT售前認(rèn)證備考試題及答案
- GB 30254-2024高壓三相籠型異步電動機(jī)能效限定值及能效等級
評論
0/150
提交評論