資料倉(cāng)儲(chǔ)與資料探勘_第1頁(yè)
資料倉(cāng)儲(chǔ)與資料探勘_第2頁(yè)
資料倉(cāng)儲(chǔ)與資料探勘_第3頁(yè)
資料倉(cāng)儲(chǔ)與資料探勘_第4頁(yè)
資料倉(cāng)儲(chǔ)與資料探勘_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、資料倉(cāng)儲(chǔ)與資料探勘資料倉(cāng)儲(chǔ)之介紹3 資料倉(cāng)儲(chǔ)的目的是希望藉由整合公司內(nèi)部的資料並綜資料倉(cāng)儲(chǔ)的目的是希望藉由整合公司內(nèi)部的資料並綜合各種外部資料,進(jìn)而對(duì)公司重要決策者提供一個(gè)整合各種外部資料,進(jìn)而對(duì)公司重要決策者提供一個(gè)整體的、廣泛的訊息認(rèn)知、以供完成一策略性的決策體的、廣泛的訊息認(rèn)知、以供完成一策略性的決策3 根據(jù)根據(jù)Meta GroupMeta Group在在19931993年的調(diào)查,僅有年的調(diào)查,僅有5%5%的公司對(duì)資料的公司對(duì)資料倉(cāng)儲(chǔ)有興趣。到了倉(cāng)儲(chǔ)有興趣。到了19941994年已上升至年已上升至90%90%,可見(jiàn)未來(lái)幾年,可見(jiàn)未來(lái)幾年資料倉(cāng)儲(chǔ)是一極為重要的成長(zhǎng)領(lǐng)域資料倉(cāng)儲(chǔ)是一極為重要的

2、成長(zhǎng)領(lǐng)域資料倉(cāng)儲(chǔ)之介紹(續(xù))3 根據(jù)根據(jù)Meta GroupMeta Group的調(diào)查,資料倉(cāng)儲(chǔ)的軟體硬體服務(wù)與市的調(diào)查,資料倉(cāng)儲(chǔ)的軟體硬體服務(wù)與市場(chǎng)規(guī)模將由場(chǎng)規(guī)模將由19961996年的年的2020億美金成長(zhǎng)到億美金成長(zhǎng)到20002000年的年的120120億美億美金,使得如金,使得如IBMIBM、OracleOracle等知名大廠紛紛投入此一領(lǐng)域等知名大廠紛紛投入此一領(lǐng)域3 根據(jù)根據(jù)IDCIDC在在19961996年對(duì)年對(duì)6262家公司所作的研究顯示,資料倉(cāng)家公司所作的研究顯示,資料倉(cāng)儲(chǔ)的儲(chǔ)的投資報(bào)酬率最高可達(dá)到投資報(bào)酬率最高可達(dá)到600%600%,且有一半財(cái)務(wù)利益,且有一半財(cái)務(wù)利益來(lái)自於

3、來(lái)自於決策的制定決策的制定,顯示資料倉(cāng)儲(chǔ)確實(shí)可以支援組織,顯示資料倉(cāng)儲(chǔ)確實(shí)可以支援組織的決策之制定的決策之制定資料倉(cāng)儲(chǔ)之定義3資料倉(cāng)儲(chǔ)之父資料倉(cāng)儲(chǔ)之父Bill InmonBill Inmon認(rèn)為資料倉(cāng)儲(chǔ)為認(rèn)為資料倉(cāng)儲(chǔ)為決策支援系統(tǒng)的核心決策支援系統(tǒng)的核心3Bill InmonBill Inmon和和Chuck KelleyChuck Kelley認(rèn)為資料倉(cāng)儲(chǔ)不僅為資料庫(kù)、且具有下列特認(rèn)為資料倉(cāng)儲(chǔ)不僅為資料庫(kù)、且具有下列特性:性:整合性:包含應(yīng)用程式、資料庫(kù)、電腦系統(tǒng)整合性:包含應(yīng)用程式、資料庫(kù)、電腦系統(tǒng)主題導(dǎo)向:回答組織特定問(wèn)題主題導(dǎo)向:回答組織特定問(wèn)題時(shí)間變數(shù):隨時(shí)間變化的動(dòng)態(tài)資料時(shí)間變數(shù):

4、隨時(shí)間變化的動(dòng)態(tài)資料非變動(dòng)性:非變動(dòng)性:資料倉(cāng)儲(chǔ)之定義(續(xù))3 John van den HovenJohn van den Hoven認(rèn)為資料倉(cāng)儲(chǔ)是經(jīng)改良過(guò)的決策支援認(rèn)為資料倉(cāng)儲(chǔ)是經(jīng)改良過(guò)的決策支援系統(tǒng),可產(chǎn)生高階的系統(tǒng),可產(chǎn)生高階的(high-level)(high-level)、整合的、整合的(Integrated)(Integrated)、系統(tǒng)化的系統(tǒng)化的(organized)(organized)、結(jié)構(gòu)化的、結(jié)構(gòu)化的(structured)(structured)資料以應(yīng)用於資料以應(yīng)用於協(xié)助商業(yè)決策協(xié)助商業(yè)決策3 綜上所述,資料倉(cāng)儲(chǔ)是經(jīng)由建立集合式的資料倉(cāng)庫(kù),綜上所述,資料倉(cāng)儲(chǔ)是經(jīng)由

5、建立集合式的資料倉(cāng)庫(kù),從多個(gè)分散的資料來(lái)源中蒐集資料,配合分析工具,從多個(gè)分散的資料來(lái)源中蒐集資料,配合分析工具,支援決策者的決策制定支援決策者的決策制定資料倉(cāng)儲(chǔ)之特性3 傳統(tǒng)資料庫(kù)著重於單一時(shí)間之單一資料處理傳統(tǒng)資料庫(kù)著重於單一時(shí)間之單一資料處理(one record (one record at a time)at a time)、偏重於擷取詳細(xì)之資料以供參考、注意資料、偏重於擷取詳細(xì)之資料以供參考、注意資料檔的構(gòu)成及資料正規(guī)化檔的構(gòu)成及資料正規(guī)化(normalization)(normalization),且使用者多為中,且使用者多為中階經(jīng)理人員階經(jīng)理人員3 資料倉(cāng)儲(chǔ)注重某一段時(shí)間內(nèi)之資

6、料倉(cāng)儲(chǔ)注重某一段時(shí)間內(nèi)之綜合資料綜合資料(summary data on (summary data on a given time period)a given time period)、注重、注重大批資料提供之走向趨勢(shì)大批資料提供之走向趨勢(shì)、注、注重重資料本身所內(nèi)涵之意義及訊息資料本身所內(nèi)涵之意義及訊息,且使用者為決策支,且使用者為決策支援系統(tǒng)和高階主管資訊系統(tǒng)的使用者援系統(tǒng)和高階主管資訊系統(tǒng)的使用者資料倉(cāng)儲(chǔ)之技術(shù)3資料儲(chǔ)存資料儲(chǔ)存(Data Store)(Data Store)現(xiàn)在資料倉(cāng)儲(chǔ)中之資料儲(chǔ)存可稱(chēng)為作業(yè)型資料儲(chǔ)存現(xiàn)在資料倉(cāng)儲(chǔ)中之資料儲(chǔ)存可稱(chēng)為作業(yè)型資料儲(chǔ)存(Operational

7、 (Operational Data Store) Data Store) ,一種一種儲(chǔ)存儲(chǔ)存機(jī)制機(jī)制依資料時(shí)效性區(qū)分,可將資料區(qū)分為即時(shí)的依資料時(shí)效性區(qū)分,可將資料區(qū)分為即時(shí)的(Real-time)(Real-time)、接近、接近即時(shí)的即時(shí)的(Near Real-time)(Near Real-time)、與某時(shí)點(diǎn)、與某時(shí)點(diǎn)(Point-in-time)(Point-in-time)的資料的資料一般一般資料倉(cāng)儲(chǔ)儲(chǔ)存都是歷史資料資料倉(cāng)儲(chǔ)儲(chǔ)存都是歷史資料,可稱(chēng)為時(shí)點(diǎn)性的資料,可稱(chēng)為時(shí)點(diǎn)性的資料(Point-(Point-in-time data)in-time data),其應(yīng)用範(fàn)圍包括簡(jiǎn)單的

8、查詢(xún)到複雜的資料提煉,其應(yīng)用範(fàn)圍包括簡(jiǎn)單的查詢(xún)到複雜的資料提煉等等資料倉(cāng)儲(chǔ)之技術(shù)(續(xù))3 資料提煉資料提煉(Data Mining)(Data Mining)資料提煉是屬於發(fā)現(xiàn)導(dǎo)向資料提煉是屬於發(fā)現(xiàn)導(dǎo)向(discovery-based approach)(discovery-based approach)方式,方式,從不從不同資料來(lái)源同資料來(lái)源蒐集大量資料,經(jīng)過(guò)詳確的分析後,提供有價(jià)值蒐集大量資料,經(jīng)過(guò)詳確的分析後,提供有價(jià)值的資訊的資訊給使用者給使用者,一般用於行銷(xiāo)決策上。,一般用於行銷(xiāo)決策上。資料提煉常可發(fā)掘出超越歸納範(fàn)圍的關(guān)係,與傳統(tǒng)資料提煉??砂l(fā)掘出超越歸納範(fàn)圍的關(guān)係,與傳統(tǒng)OLAP(

9、On-OLAP(On-Line Analytical Processing)Line Analytical Processing)大不相同,可用於個(gè)人化行銷(xiāo)大不相同,可用於個(gè)人化行銷(xiāo)。資料倉(cāng)儲(chǔ)之優(yōu)缺點(diǎn)3優(yōu)點(diǎn)優(yōu)點(diǎn)有形的優(yōu)點(diǎn)有形的優(yōu)點(diǎn)可整合企業(yè)各部門(mén)的資料及減少作業(yè)成本可整合企業(yè)各部門(mén)的資料及減少作業(yè)成本企業(yè)內(nèi)部文件趨向單一規(guī)格化,便於儲(chǔ)存與查閱。此一企企業(yè)內(nèi)部文件趨向單一規(guī)格化,便於儲(chǔ)存與查閱。此一企業(yè)內(nèi)文件規(guī)格之整合乃是一極大優(yōu)勢(shì)業(yè)內(nèi)文件規(guī)格之整合乃是一極大優(yōu)勢(shì)資料倉(cāng)儲(chǔ)之優(yōu)缺點(diǎn)(續(xù)) 無(wú)形的優(yōu)點(diǎn)無(wú)形的優(yōu)點(diǎn) 資料來(lái)源可由各部門(mén)取得,充分運(yùn)用組織資源資料來(lái)源可由各部門(mén)取得,充分運(yùn)用組織資源 確保日

10、常作業(yè)不受干擾確保日常作業(yè)不受干擾 提升企業(yè)的效率與生產(chǎn)力提升企業(yè)的效率與生產(chǎn)力 可充分運(yùn)用組織所掌控的資訊來(lái)獲競(jìng)爭(zhēng)優(yōu)勢(shì)可充分運(yùn)用組織所掌控的資訊來(lái)獲競(jìng)爭(zhēng)優(yōu)勢(shì)資料倉(cāng)儲(chǔ)之優(yōu)缺點(diǎn)(續(xù)) 提供更快的資訊以增強(qiáng)加速?zèng)Q策的品質(zhì)提供更快的資訊以增強(qiáng)加速?zèng)Q策的品質(zhì) 提供即時(shí)有效的資訊提供即時(shí)有效的資訊 資料可信賴(lài)度高資料可信賴(lài)度高 使用者可經(jīng)由單一查詢(xún)介面獲得所需資訊使用者可經(jīng)由單一查詢(xún)介面獲得所需資訊 可從倉(cāng)儲(chǔ)的歷史資料中預(yù)測(cè)未來(lái)趨勢(shì)與結(jié)果可從倉(cāng)儲(chǔ)的歷史資料中預(yù)測(cè)未來(lái)趨勢(shì)與結(jié)果資料倉(cāng)儲(chǔ)之優(yōu)缺點(diǎn)(續(xù))3 缺點(diǎn)缺點(diǎn)資料倉(cāng)儲(chǔ)的開(kāi)發(fā)往往為一資料倉(cāng)儲(chǔ)的開(kāi)發(fā)往往為一極大的投資,風(fēng)險(xiǎn)性高極大的投資,風(fēng)險(xiǎn)性高資料倉(cāng)儲(chǔ)的開(kāi)

11、發(fā)資料倉(cāng)儲(chǔ)的開(kāi)發(fā)相當(dāng)費(fèi)時(shí)相當(dāng)費(fèi)時(shí)若是軟硬體規(guī)格不一,將會(huì)有無(wú)法若是軟硬體規(guī)格不一,將會(huì)有無(wú)法跨平臺(tái)存取資料的問(wèn)題跨平臺(tái)存取資料的問(wèn)題倉(cāng)儲(chǔ)中龐大的歷史資料的管理問(wèn)題倉(cāng)儲(chǔ)中龐大的歷史資料的管理問(wèn)題- - 需用彙總資料需用彙總資料(metadata)(metadata)技技術(shù)加以管理術(shù)加以管理資料更新的問(wèn)題資料更新的問(wèn)題- - 可採(cǎi)非同步方式更新可採(cǎi)非同步方式更新資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)3由於資料倉(cāng)儲(chǔ)為一高投資、高風(fēng)險(xiǎn)、需求不定且開(kāi)發(fā)費(fèi)時(shí)的一項(xiàng)工程,由於資料倉(cāng)儲(chǔ)為一高投資、高風(fēng)險(xiǎn)、需求不定且開(kāi)發(fā)費(fèi)時(shí)的一項(xiàng)工程,所以需要做長(zhǎng)期的規(guī)劃,應(yīng)採(cǎi)雛型法所以需要做長(zhǎng)期的規(guī)劃,應(yīng)採(cǎi)雛型法(Prototyping) (P

12、rototyping) 開(kāi)發(fā)。開(kāi)發(fā)。3開(kāi)發(fā)過(guò)程主要分為四個(gè)階段,分別是:開(kāi)發(fā)過(guò)程主要分為四個(gè)階段,分別是:資料收集資料收集系統(tǒng)分析系統(tǒng)分析系統(tǒng)設(shè)計(jì)系統(tǒng)設(shè)計(jì)系統(tǒng)維護(hù)系統(tǒng)維護(hù)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-資料收集3 資料收集資料收集資料收集的主要目的在於資料收集的主要目的在於定義企業(yè)需求定義企業(yè)需求。必須先成立工作小。必須先成立工作小組或指導(dǎo)委員會(huì)組或指導(dǎo)委員會(huì)(steering committee)(steering committee),系統(tǒng)開(kāi)發(fā)的工作交由工,系統(tǒng)開(kāi)發(fā)的工作交由工作小組負(fù)責(zé),而指導(dǎo)委員會(huì)扮演監(jiān)督、控制與管理的角色。作小組負(fù)責(zé),而指導(dǎo)委員會(huì)扮演監(jiān)督、控制與管理的角色。企業(yè)目標(biāo)訂定,並研擬達(dá)

13、成這些目標(biāo)所需的決策過(guò)程及所需企業(yè)目標(biāo)訂定,並研擬達(dá)成這些目標(biāo)所需的決策過(guò)程及所需資料。資料。此階段另一重要的工作為了解此階段另一重要的工作為了解使用者的需求使用者的需求,需產(chǎn)出需求定,需產(chǎn)出需求定義規(guī)格書(shū),內(nèi)容詳細(xì)記錄使用者的需求。義規(guī)格書(shū),內(nèi)容詳細(xì)記錄使用者的需求。資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析3 系統(tǒng)分析系統(tǒng)分析此階段的參與者以負(fù)責(zé)開(kāi)發(fā)系統(tǒng)的工作小組為主,此階段的參與者以負(fù)責(zé)開(kāi)發(fā)系統(tǒng)的工作小組為主,根據(jù)前一階段所產(chǎn)生的根據(jù)前一階段所產(chǎn)生的需求定義規(guī)格書(shū)需求定義規(guī)格書(shū),並進(jìn)一步,並進(jìn)一步分析規(guī)格書(shū)內(nèi)所紀(jì)錄的使用者需求。分析規(guī)格書(shū)內(nèi)所紀(jì)錄的使用者需求。資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析 在此階段中,

14、可評(píng)估系統(tǒng)的五個(gè)可行性:在此階段中,可評(píng)估系統(tǒng)的五個(gè)可行性: 技術(shù)可行性技術(shù)可行性(technical feasibility)(technical feasibility) 經(jīng)濟(jì)可行性經(jīng)濟(jì)可行性(economic feasibility)(economic feasibility) 法律可行性法律可行性(legal feasibility)(legal feasibility) 操作可行性操作可行性(operational feasibility)(operational feasibility) 時(shí)程可行性時(shí)程可行性(scheduling feasibility)(scheduling f

15、easibility)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析技術(shù)可行性分析技術(shù)可行性分析系統(tǒng)軟硬體可行性評(píng)估系統(tǒng)軟硬體可行性評(píng)估資料庫(kù)架構(gòu)的可行性,包括使用關(guān)聯(lián)式或非關(guān)資料庫(kù)架構(gòu)的可行性,包括使用關(guān)聯(lián)式或非關(guān)聯(lián)式資料庫(kù)聯(lián)式資料庫(kù)系統(tǒng)存取時(shí)間及回應(yīng)時(shí)間的評(píng)估系統(tǒng)存取時(shí)間及回應(yīng)時(shí)間的評(píng)估資料來(lái)源整合的可行性資料來(lái)源整合的可行性資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析經(jīng)濟(jì)可行性分析經(jīng)濟(jì)可行性分析分析資料倉(cāng)儲(chǔ)明確的分析資料倉(cāng)儲(chǔ)明確的效益效益分析開(kāi)發(fā)資料倉(cāng)儲(chǔ)的分析開(kāi)發(fā)資料倉(cāng)儲(chǔ)的投資報(bào)酬率投資報(bào)酬率分析開(kāi)發(fā)資料倉(cāng)儲(chǔ)的分析開(kāi)發(fā)資料倉(cāng)儲(chǔ)的風(fēng)險(xiǎn)風(fēng)險(xiǎn)評(píng)估有形、無(wú)形成本與利益評(píng)估有形、無(wú)形成本與利益系統(tǒng)效益的評(píng)估系統(tǒng)效益的評(píng)估 ( (作

16、業(yè)成本作業(yè)成本、服務(wù)品質(zhì)服務(wù)品質(zhì)) )資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析法律可行性分析法律可行性分析資料所有權(quán)與資料所有權(quán)與資料隱私資料隱私的問(wèn)題的問(wèn)題企業(yè)外部資料來(lái)源的合法性企業(yè)外部資料來(lái)源的合法性系統(tǒng)軟硬體的合法性系統(tǒng)軟硬體的合法性操作可行性分析操作可行性分析分析使用者是否熟悉資料倉(cāng)儲(chǔ)的作業(yè)分析使用者是否熟悉資料倉(cāng)儲(chǔ)的作業(yè)是否對(duì)使用者或資料庫(kù)管理者進(jìn)行是否對(duì)使用者或資料庫(kù)管理者進(jìn)行教育訓(xùn)練教育訓(xùn)練資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)分析時(shí)間可行性分析時(shí)間可行性分析系統(tǒng)開(kāi)發(fā)的系統(tǒng)開(kāi)發(fā)的時(shí)間時(shí)間需要多久需要多久分析系統(tǒng)開(kāi)發(fā)的分析系統(tǒng)開(kāi)發(fā)的進(jìn)度進(jìn)度分析不同時(shí)間點(diǎn)的分析不同時(shí)間點(diǎn)的資源需求資源需求未來(lái)資料成長(zhǎng)率的預(yù)

17、期與評(píng)估未來(lái)資料成長(zhǎng)率的預(yù)期與評(píng)估進(jìn)行可行性分析之後,可產(chǎn)生可行性分析規(guī)格書(shū)。進(jìn)行可行性分析之後,可產(chǎn)生可行性分析規(guī)格書(shū)。資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì)3 系統(tǒng)設(shè)計(jì)系統(tǒng)設(shè)計(jì)企業(yè)層面企業(yè)層面企業(yè)政策企業(yè)政策企業(yè)需求與目標(biāo)的確定企業(yè)需求與目標(biāo)的確定評(píng)估資料倉(cāng)儲(chǔ)對(duì)企業(yè)的衝擊評(píng)估資料倉(cāng)儲(chǔ)對(duì)企業(yè)的衝擊分析是否引進(jìn)資料倉(cāng)儲(chǔ)分析是否引進(jìn)資料倉(cāng)儲(chǔ)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 企業(yè)政策企業(yè)政策 選擇系統(tǒng)開(kāi)發(fā)方式選擇系統(tǒng)開(kāi)發(fā)方式 是否與倉(cāng)儲(chǔ)供應(yīng)商策略性合作是否與倉(cāng)儲(chǔ)供應(yīng)商策略性合作 妥善評(píng)估需要建制資料倉(cāng)儲(chǔ)或是資料超市妥善評(píng)估需要建制資料倉(cāng)儲(chǔ)或是資料超市資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì)人員人員清楚明確的權(quán)責(zé)劃分清楚明確

18、的權(quán)責(zé)劃分開(kāi)發(fā)小組組成開(kāi)發(fā)小組組成 ( (包含熟悉各部門(mén)事務(wù)專(zhuān)業(yè)人包含熟悉各部門(mén)事務(wù)專(zhuān)業(yè)人士士) )考慮是否聘請(qǐng)專(zhuān)業(yè)顧問(wèn)考慮是否聘請(qǐng)專(zhuān)業(yè)顧問(wèn)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 召開(kāi)經(jīng)常性會(huì)議以掌握進(jìn)度召開(kāi)經(jīng)常性會(huì)議以掌握進(jìn)度 倉(cāng)儲(chǔ)開(kāi)發(fā)成功的關(guān)鍵在於倉(cāng)儲(chǔ)開(kāi)發(fā)成功的關(guān)鍵在於參與計(jì)畫(huà)的人員皆能持參與計(jì)畫(huà)的人員皆能持 續(xù)專(zhuān)注的涉入續(xù)專(zhuān)注的涉入 對(duì)於開(kāi)發(fā)人員進(jìn)行教育訓(xùn)練對(duì)於開(kāi)發(fā)人員進(jìn)行教育訓(xùn)練 企業(yè)應(yīng)有緊急應(yīng)邊措施計(jì)畫(huà)企業(yè)應(yīng)有緊急應(yīng)邊措施計(jì)畫(huà)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 使用者使用者 使用者須與系統(tǒng)開(kāi)發(fā)者保持良好的互動(dòng)及合作關(guān)使用者須與系統(tǒng)開(kāi)發(fā)者保持良好的互動(dòng)及合作關(guān)係係 使用者的訓(xùn)練不容忽視,特別是查詢(xún)工具

19、使用的使用者的訓(xùn)練不容忽視,特別是查詢(xún)工具使用的訓(xùn)練訓(xùn)練 評(píng)估設(shè)計(jì)出的系統(tǒng)是否會(huì)引起使用者的抗拒,而評(píng)估設(shè)計(jì)出的系統(tǒng)是否會(huì)引起使用者的抗拒,而拒絕使用拒絕使用資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 技術(shù)層面技術(shù)層面 硬體硬體 考慮使用平行處理技術(shù)考慮使用平行處理技術(shù) 因?yàn)橘Y料因?yàn)橘Y料成長(zhǎng)速度極快成長(zhǎng)速度極快,因此對(duì)資料的,因此對(duì)資料的儲(chǔ)存空間儲(chǔ)存空間 不可輕忽不可輕忽 設(shè)計(jì)硬體規(guī)格時(shí),需注意未來(lái)的設(shè)計(jì)硬體規(guī)格時(shí),需注意未來(lái)的擴(kuò)充性及整合擴(kuò)充性及整合 性性。資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 軟體軟體 在資料庫(kù)管理系統(tǒng)方面,資料倉(cāng)儲(chǔ)的資料庫(kù)系統(tǒng)通在資料庫(kù)管理系統(tǒng)方面,資料倉(cāng)儲(chǔ)的資料庫(kù)系統(tǒng)通常是關(guān)連式資料庫(kù),包括

20、常是關(guān)連式資料庫(kù),包括DB2DB2、OracleOracle、SybaseSybase等。等。而用戶(hù)端的查詢(xún)工具軟體通常為微軟的而用戶(hù)端的查詢(xún)工具軟體通常為微軟的AccessAccess、或、或是多維度資料庫(kù)的是多維度資料庫(kù)的RedBrickRedBrick。 在作業(yè)系統(tǒng)方面,大型主機(jī)使用在作業(yè)系統(tǒng)方面,大型主機(jī)使用MVSMVS,伺服器使用,伺服器使用UNIXUNIX、OS/2OS/2或或NTNT,而客戶(hù)端工作站使用,而客戶(hù)端工作站使用NTNT、Win95Win95、或或OS/2OS/2資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 軟體軟體 評(píng)估資料庫(kù)管理系統(tǒng)應(yīng)採(cǎi)關(guān)聯(lián)式資料庫(kù)評(píng)估資料庫(kù)管理系統(tǒng)應(yīng)採(cǎi)關(guān)聯(lián)式資料庫(kù)

21、(Relational (Relational DBMS) DBMS)、物件導(dǎo)向資料庫(kù)、或是多維度資料庫(kù)系、物件導(dǎo)向資料庫(kù)、或是多維度資料庫(kù)系 統(tǒng)統(tǒng)(Multidimensional DBMS)(Multidimensional DBMS) 注意軟硬體的整合注意軟硬體的整合資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 標(biāo)準(zhǔn)標(biāo)準(zhǔn) 需建構(gòu)統(tǒng)一的標(biāo)準(zhǔn)及規(guī)格需建構(gòu)統(tǒng)一的標(biāo)準(zhǔn)及規(guī)格 應(yīng)選擇應(yīng)選擇SNASNA或或TCP/IPTCP/IP的網(wǎng)路通訊協(xié)定,以利整合速度的網(wǎng)路通訊協(xié)定,以利整合速度 資料通訊資料通訊 以何種方式達(dá)成資料通訊的目的以何種方式達(dá)成資料通訊的目的 (Internet, WAN, LAN)(Intern

22、et, WAN, LAN) 網(wǎng)路的架構(gòu)應(yīng)使用主從式、分散式、或集中式網(wǎng)路的架構(gòu)應(yīng)使用主從式、分散式、或集中式 是否須將企業(yè)內(nèi)部資料公開(kāi)是否須將企業(yè)內(nèi)部資料公開(kāi)資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 相容性相容性 需注意各工具的整合性及不同平臺(tái)上異質(zhì)資料庫(kù)需注意各工具的整合性及不同平臺(tái)上異質(zhì)資料庫(kù)之存檔功能之存檔功能 應(yīng)做到應(yīng)做到跨平臺(tái)存取跨平臺(tái)存取與多個(gè)資料庫(kù)系統(tǒng)之整合與多個(gè)資料庫(kù)系統(tǒng)之整合資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 安全性安全性 評(píng)估並做好重要資料的存取控制評(píng)估並做好重要資料的存取控制 做好存取資料做好存取資料權(quán)限權(quán)限的控制管理的控制管理資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 資料層面資料層面 資料品質(zhì)資料品

23、質(zhì) 掌握資料的一致性及普遍性掌握資料的一致性及普遍性 ( (資料來(lái)源整合資料來(lái)源整合) ) 資料萃取資料萃取(extraction)(extraction)、傳播、傳播(propagation)(propagation)、和轉(zhuǎn)換、和轉(zhuǎn)換 (transformation)(transformation)的品質(zhì)的品質(zhì) 評(píng)估資料的正確性評(píng)估資料的正確性 更新時(shí)保持資料的更新時(shí)保持資料的同步性及一致性同步性及一致性、更新頻率更新頻率 歷史資料的時(shí)間性歷史資料的時(shí)間性資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 彙總資料管理彙總資料管理 彙總資料之分析處理該如何建構(gòu)彙總資料之分析處理該如何建構(gòu) 彙總資料的元素彙總資料的

24、元素(data element)(data element)應(yīng)該包括哪些內(nèi)容應(yīng)該包括哪些內(nèi)容 資料庫(kù)管理資料庫(kù)管理 目前系統(tǒng)能否因應(yīng)未來(lái)成長(zhǎng)需求目前系統(tǒng)能否因應(yīng)未來(lái)成長(zhǎng)需求 資料權(quán)限控制資料權(quán)限控制資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)設(shè)計(jì) 資料查詢(xún)資料查詢(xún) 需提供一友善的前端查詢(xún)介面需提供一友善的前端查詢(xún)介面 應(yīng)完善評(píng)估查詢(xún)工具應(yīng)完善評(píng)估查詢(xún)工具 ( (工具與軟硬體相容性工具與軟硬體相容性、直直接接 存取或存取或ODBC)ODBC) 查詢(xún)工具挖掘查詢(xún)工具挖掘(drill-down)(drill-down)能力的評(píng)估能力的評(píng)估 評(píng)估資料查詢(xún)的評(píng)估資料查詢(xún)的反應(yīng)時(shí)間、即時(shí)性與穩(wěn)定性反應(yīng)時(shí)間、即時(shí)性與穩(wěn)定性資料

25、倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)維護(hù) 系統(tǒng)維護(hù)系統(tǒng)維護(hù)此階段須工作小組與使用者相互配合。以下從系統(tǒng)、資料、使用此階段須工作小組與使用者相互配合。以下從系統(tǒng)、資料、使用者三方面討論此階段的工作項(xiàng)目者三方面討論此階段的工作項(xiàng)目系統(tǒng)方面系統(tǒng)方面系統(tǒng)的資料存系統(tǒng)的資料存儲(chǔ)量必須容納未來(lái)的成長(zhǎng)儲(chǔ)量必須容納未來(lái)的成長(zhǎng)安全性是維護(hù)的重點(diǎn)安全性是維護(hù)的重點(diǎn)再新增設(shè)備時(shí)須考慮系統(tǒng)整合性再新增設(shè)備時(shí)須考慮系統(tǒng)整合性系統(tǒng)效能的管理系統(tǒng)效能的管理 ( (反應(yīng)時(shí)間反應(yīng)時(shí)間、搜尋速度搜尋速度) )資料倉(cāng)儲(chǔ)之發(fā)展架構(gòu)-系統(tǒng)維護(hù)資料方面資料方面需按時(shí)程更新,並將更新情形告知使用者需按時(shí)程更新,並將更新情形告知使用者彙總資料的管理是一項(xiàng)重點(diǎn)彙總資料的管理是一項(xiàng)重點(diǎn)管理資料量的成長(zhǎng)是重要工作之一管理資料量的成長(zhǎng)是重要工作之一使用者方面使用者方面使用者的教育訓(xùn)練是此階段重要的工作使用者的教育訓(xùn)練是此階段重要的工作系統(tǒng)正式上線後,需讓使用者有緩衝時(shí)間適應(yīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論