數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建.doc_第1頁
數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建.doc_第2頁
數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建.doc_第3頁
數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建.doc_第4頁
數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建.doc_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量的治理及體系構(gòu)建中國建設(shè)銀行股份有限公司信息技術(shù)管理部廈門開發(fā)中心程大慶鄭承滿在信息化應(yīng)用不斷深入的背景下,數(shù)據(jù)資源優(yōu)勢挖掘,基于數(shù)據(jù)治理提升業(yè)務(wù)響應(yīng)能力等問題已經(jīng)成為金 融行業(yè)關(guān)注的焦點。本文主要討論在大型銀行數(shù)據(jù)倉庫 中構(gòu)建數(shù)據(jù)質(zhì)量治理體系的方法。如圖1所示,以數(shù)據(jù)質(zhì)量6標準的6個特性為基礎(chǔ),根據(jù)數(shù)據(jù)倉庫中的信息特征,劃分為多個指標集如“完整 性_主鍵重復(fù)”、“完整性_拉鏈錯誤”等;在這些指標集 下,針對不同的實體和屬性,形成不同的可實施的數(shù)據(jù)質(zhì) 量檢核規(guī)則如“完整性_主鍵重復(fù)_客戶信息表”。通常情況下,數(shù)據(jù)質(zhì)量檢核規(guī)則是以制定好的數(shù)據(jù) 質(zhì)量指標集為基礎(chǔ),逐層逐塊的進行質(zhì)量檢核;但是在 實施中,經(jīng)常會根據(jù)數(shù)據(jù)使用中發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量關(guān)鍵點 或者某些業(yè)務(wù)需求,進行數(shù)據(jù)質(zhì)量專項治理。(1) 數(shù)據(jù)質(zhì)量指標集的制定 數(shù)據(jù)質(zhì)量指標集的制定,需要考慮數(shù)據(jù)質(zhì)量6標準在不同數(shù)據(jù)集中的信息特征,以及數(shù)據(jù)倉庫的數(shù)據(jù)架 構(gòu)和數(shù)據(jù)流向。在不同的數(shù)據(jù)架構(gòu)和數(shù)據(jù)流向下,數(shù)據(jù) 集中的數(shù)據(jù)質(zhì)量信息特征不盡相 同,數(shù)據(jù)質(zhì)量檢核重點不同,由此 制定的數(shù)據(jù)質(zhì)量指標集也不相同。由 于 數(shù) 據(jù) 量 、 數(shù) 據(jù) 加 載 工 具 的 處 理 能 力 和 數(shù) 據(jù) 庫 引 擎 的 處 理 能 力 不 同 , 不 同 數(shù) 據(jù) 倉 庫 的 數(shù) 據(jù) 處 理 順 序 是 不 同 的 , 主 要 分 為 E T L 和 E L T 兩 種 模 式 。 一 般 來 說 , 數(shù) 據(jù) 庫 引 擎 廠 商 主 推 的 是 E L T 模 式 , 在 數(shù) 據(jù) 加 載 入 數(shù) 據(jù) 倉 庫 后 進 行 數(shù) 據(jù) 轉(zhuǎn) 換 , 如 T e r a d a t a 、 O r a c l e ; 專 業(yè) 的 ETL工具廠商主推ELT模式,如Informatica。兩種模式下的數(shù)據(jù)一、數(shù)據(jù)質(zhì)量治理的基本內(nèi)容1.數(shù)據(jù)質(zhì)量檢核數(shù)據(jù)質(zhì)量檢核是指通過技術(shù)手段,以數(shù)據(jù)質(zhì)量指標(包含技術(shù)指標和業(yè)務(wù)指標)為標準進行檢核、監(jiān)控, 以發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題。以數(shù)據(jù)質(zhì)量6標準為基礎(chǔ)制定 數(shù)據(jù)質(zhì)量指標集,再針對具體的數(shù)據(jù)集編寫數(shù)據(jù)質(zhì)量檢 核規(guī)則,即可進行數(shù)據(jù)質(zhì)量檢核。對于每一個數(shù)據(jù)質(zhì)量 指標,均可衍生多個數(shù)據(jù)質(zhì)量檢核規(guī)則。圖1 基于數(shù)據(jù)集的數(shù)據(jù)質(zhì)量核查規(guī)則架構(gòu)最大的不同點,在于ELT模式存在數(shù)據(jù)緩沖層,而ETL模式無數(shù)據(jù)緩沖層。數(shù)據(jù)緩沖層一般與數(shù)據(jù)源同構(gòu), 用于緩沖放置數(shù)據(jù)倉庫從異構(gòu)數(shù)據(jù)源中獲取的數(shù)據(jù)。下面以ELT模式下的數(shù)據(jù)倉庫為例討論數(shù)據(jù)指標集 的制定,該模式下數(shù)據(jù)倉庫的ETL過程分為3個環(huán)節(jié): 從數(shù)據(jù)源到倉庫的ETL過程,倉庫內(nèi)部的ETL過程,倉庫 到目標的ETL過程。在整個ETL過程中,數(shù)據(jù)倉庫的數(shù)據(jù)架構(gòu)共分為四層:緩沖層、基礎(chǔ)層、匯總層和應(yīng)用集市層。以數(shù)據(jù)質(zhì)量6標準為基礎(chǔ),結(jié)合數(shù)據(jù)倉庫的 數(shù)據(jù)模型,遵循ETL過程和數(shù)據(jù)流向,分層級制定 質(zhì)量指標集即可進行立體的、全方位的數(shù)據(jù)質(zhì)量(如圖2所示)。 數(shù)據(jù)質(zhì)量指標集的制定,可采用三層級制定方以數(shù)據(jù)質(zhì)量6標準的6個特性為基礎(chǔ),作為第一層將數(shù)據(jù)質(zhì)量6標準按數(shù)據(jù)倉庫的數(shù)據(jù)層級劃分,數(shù)據(jù)倉庫數(shù)據(jù)流入SDATAPDATEMart數(shù)據(jù)流出MID數(shù)據(jù)質(zhì)量檢核規(guī)則集完整性有效性準確性唯一性一致性時間性數(shù)據(jù)集數(shù)據(jù)集完整性_代碼錯誤_賬戶狀態(tài)代碼完整性_拉鏈錯誤_客戶金額歷史表完整性_代碼錯誤完整性_拉鏈錯誤完整性_主鍵重復(fù)完整性_主鍵重 復(fù)_客戶信息表完整性_非法值完整性_非法值_客戶開戶日期第二層級;在數(shù)據(jù)層級上,再根據(jù)每個特性的分割,制定各層級的數(shù)據(jù)質(zhì)量指標集,即第三層級。以下為某大 型銀行的數(shù)據(jù)質(zhì)量指標集實施實例。首先對各數(shù)據(jù)集縮寫定義見表1。根據(jù)每個數(shù)據(jù)層 集的數(shù)據(jù)特征,再對每個數(shù)據(jù)特性分子類,制定可實施 的指標集。指標名稱定義如下:數(shù)據(jù)特性_數(shù)據(jù)集縮寫_ 特性子名稱。表2為一個較為完整的、可實施的數(shù)據(jù)質(zhì)量指標集。表1 各數(shù)據(jù)集縮寫定義表2 數(shù)據(jù)質(zhì)量指標集指標名稱指標說明完整性_SD_非空加載入倉庫緩沖層的源表非空完整性_SD_數(shù)量加載入倉庫緩沖層的源表的數(shù)量正確、穩(wěn)定完整性_SD_主鍵加載入倉庫緩沖層的源表與上游源表的同時點主鍵值相同準確性_SD_屬性加載入倉庫緩沖層的源表與上游源表的同時點屬性信息值相同一致性_SD_關(guān)聯(lián)加載入倉庫緩沖層的各張源表滿足主外鍵、包含關(guān)系有效性_SD_代碼加載入倉庫緩沖層的源表的代碼值符合范圍有效性_SD_屬性加載入倉庫緩沖層的源表的屬性值符合范圍,如日期字段符合日期范圍,金額字段符合金額范圍唯一性_SD_主鍵加載入倉庫緩沖層的源表是否主鍵重復(fù)時間性_SD_時長加載入倉庫緩沖層的源表數(shù)據(jù)保留時長是否正確時間性_SD_時點加載入倉庫緩沖層的源表數(shù)據(jù)時間戳是否與業(yè)務(wù)時點符合完整性_PD_數(shù)量基礎(chǔ)層實體當日發(fā)生變化記錄數(shù)量,是否與相應(yīng)的源表中數(shù)量相同準確性_PD_屬性基礎(chǔ)層實體的關(guān)鍵屬性值,是否與相應(yīng)的源表中該屬性值相同一致性_PD_關(guān)聯(lián)基礎(chǔ)層各實體間是否滿足系統(tǒng)內(nèi)和系統(tǒng)間的關(guān)聯(lián)關(guān)系有效性_PD_代碼基礎(chǔ)層實體的代碼值,是否符合定義范圍有效性_PD_屬性基礎(chǔ)層實體的屬性值,是否符合定義范圍有效性_PD_拉鏈基礎(chǔ)層采用拉鏈存儲策略的實體,拉鏈是否正確有效性_PD_離線基礎(chǔ)層實體離線數(shù)據(jù)的正確性唯一性_PD_主鍵基礎(chǔ)層實體的主鍵是否重復(fù)一致性_MI_關(guān)聯(lián)匯總層各實體間是否滿足系統(tǒng)內(nèi)和系統(tǒng)間的關(guān)聯(lián)關(guān)系唯一性_MI_主鍵匯總層實體的主鍵是否重復(fù)準確性_MA_業(yè)務(wù)集市層數(shù)據(jù)口徑是否準確反應(yīng)該時點業(yè)務(wù)狀況數(shù)據(jù)集中文名數(shù)據(jù)集英文名數(shù)據(jù)集縮寫緩沖層SDATASD基礎(chǔ)層PDATAPD匯總層MIDMI集市層MARTMA數(shù)據(jù)質(zhì)量專項治理的針對性較強,在實施中均能帶來很好的效果。下面介紹四種在數(shù)據(jù)倉庫實施中常用的 數(shù)據(jù)質(zhì)量專項檢核。代碼檢核 代碼檢查,即數(shù)據(jù)中的代碼值是否符合代碼定義的標準范圍。根據(jù)制定標準的不同,代碼分為兩大類:全 行標準代碼,由信息管理部門主導(dǎo)、各信息系統(tǒng)共同參 與制定的代碼定義。如幣種、全行機構(gòu)編碼等。此類代 碼一般都是由各源系統(tǒng)轉(zhuǎn)換,或者由操作型數(shù)據(jù)存儲 系統(tǒng)進行標準化后下發(fā)到各個系統(tǒng)。對于此類代碼的檢 查,一般是在緩沖層進行。部門標準代碼,由數(shù)據(jù)倉庫 定義,對某類業(yè)務(wù)含義代碼進行定義。此類代碼的檢 查,一般是在基礎(chǔ)層進行。由于代碼字段具有重要的業(yè)務(wù)含義,且在各系統(tǒng)的 數(shù)據(jù)庫表設(shè)計中均大量使用,因此是數(shù)據(jù)質(zhì)量檢核工作 中非常重要的一環(huán)??偡謾z查 由于數(shù)據(jù)大集中的規(guī)劃,同時基于集中核算、集中稽核、集中結(jié)算、集約經(jīng)營的目的,目前的各業(yè)務(wù)系統(tǒng), 均是以核心業(yè)務(wù)系統(tǒng)為中心,外圍的交易系統(tǒng)和管理系統(tǒng) 圍繞核心業(yè)務(wù)系統(tǒng)實現(xiàn)連動的業(yè)務(wù)流程和業(yè)務(wù)操作。在此模式下,作為賬務(wù)數(shù)據(jù)中心和交易處理中心的 核心業(yè)務(wù)系統(tǒng),外圍交易系統(tǒng)中的分戶賬與核心業(yè)務(wù)系 統(tǒng)則中的內(nèi)部賬、總賬,核心業(yè)務(wù)系統(tǒng)中的分戶賬和總 賬,都是賬務(wù)平衡的關(guān)系?;谠撛恚蓪⒏飨到y(tǒng)的分戶數(shù)據(jù),按入賬網(wǎng)點 機構(gòu)、科目、幣種的粒度進行匯總后與核心業(yè)務(wù)系統(tǒng)中的總賬進行總分平衡核對。型的物理化往往并不嚴格遵循三范式,而是做適度余,以減少復(fù)雜的關(guān)聯(lián)。 我們在數(shù)據(jù)質(zhì)量檢查中發(fā)現(xiàn),很多表的數(shù)據(jù)錯其根源在于該表的進數(shù)腳本中多表關(guān)聯(lián)部分的編寫 導(dǎo)致。通過對結(jié)果表的純數(shù)據(jù)檢查,或許可以發(fā)現(xiàn) 錯誤,但是往往由于沒有較為完善準確的檢核規(guī)則 得錯誤難以迅速發(fā)現(xiàn)。JOIN檢查是以類似于腳本測試的方式,對腳本 批量的排查,以發(fā)現(xiàn)多表關(guān)聯(lián)部分的編寫錯誤。系統(tǒng)間信息核對 系統(tǒng)間信息核對的目的是驗證數(shù)據(jù)倉庫從源系取到的數(shù)據(jù)的過程質(zhì)量。核對要點時要根據(jù)數(shù)據(jù)線 程,以上游系統(tǒng)的信息為參照系,檢核直接下游系 信息是否與參照系一致,順著數(shù)據(jù)流向,依次做系 的檢核;對于數(shù)據(jù)庫操作而言,檢核上游系統(tǒng)的各 檔的新增、修改、刪除三個操作,是否有實時準確 輸?shù)较掠蜗到y(tǒng);對于實時性,則通過提取數(shù)據(jù)時點 制;對于具體數(shù)據(jù)核對,主要圍繞完整性和準確性 面進行檢核。2.數(shù)據(jù)質(zhì)量問題處理數(shù)據(jù)質(zhì)量問題處理是對數(shù)據(jù)質(zhì)量問題進行分析 過相關(guān)的程序和數(shù)據(jù)修改,使得已發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量 得到改正,并且在管理、設(shè)計、開發(fā)、維護等流程 范上進行改進,以使同類型數(shù)據(jù)質(zhì)量問題在后續(xù)得 絕,或者針對同類型問題形成有效的預(yù)防和監(jiān)控措 通常情況下,數(shù)據(jù)質(zhì)量問題的處理被更狹義的認為 質(zhì)量問題的技術(shù)處理和數(shù)據(jù)處理。實際上,在數(shù)據(jù) 實施過程中,針對數(shù)據(jù)質(zhì)量問題產(chǎn)生根源所做的在質(zhì)量問題具有決定性作用。由于數(shù)據(jù)的絕對數(shù)據(jù)質(zhì)量往往是由業(yè)務(wù)系統(tǒng)和管理 系統(tǒng)產(chǎn)生,對于這類問題,數(shù)據(jù)倉庫并不需要關(guān)心問題 處理的技術(shù)細節(jié),只需關(guān)注數(shù)據(jù)表現(xiàn)和處理結(jié)果。因 此,在數(shù)據(jù)質(zhì)量問題的處理流程中,對于非數(shù)據(jù)倉庫錯 誤問題的處理方法,不必過多關(guān)注細節(jié),數(shù)據(jù)倉庫項目 以管理、協(xié)作的角色出現(xiàn)。數(shù)據(jù)質(zhì)量問題的處理過程中一般包含以下三個內(nèi)容。(1)問題發(fā)起和分析,檢核人員把數(shù)據(jù)質(zhì)量問題 報送數(shù)據(jù)質(zhì)量管理人員,之后由專業(yè)的數(shù)據(jù)質(zhì)量分析人 員根據(jù)數(shù)據(jù)特征、數(shù)據(jù)模型、ETL日志、運維日志、相 關(guān)的業(yè)務(wù)和技術(shù)資料,綜合分析以確定問題的來源;若 問題涉及外部項目組,則還需通過商定的工作模式,請 外項目組協(xié)作分析。(2)問題處理,根據(jù)問題的處理可行性及處理必 要性,有以下三種處理模式:對于可解決的問題,則由 責任方進行程序修改、數(shù)據(jù)修復(fù)、相應(yīng)的工作流程和工 作規(guī)范調(diào)整、數(shù)據(jù)修正,同時整條數(shù)據(jù)流線上的系統(tǒng), 均應(yīng)進行數(shù)據(jù)修復(fù);對于不需解決或是無法解決的數(shù)據(jù) 質(zhì)量問題記錄在案,根據(jù)需要在數(shù)據(jù)上打標記;對于需 要解決但是暫時無法查找出原因的數(shù)據(jù)質(zhì)量問題進行監(jiān)控,待情況重現(xiàn)后進一步分析處理。(3)問題驗證總結(jié),每個問題處理完成后,應(yīng)進行結(jié)果的正確性檢驗。并提取出重要的檢核規(guī)則,進行 日常監(jiān)控。一個典型的數(shù)據(jù)倉庫數(shù)據(jù)質(zhì)量處理流程,由以下四 個環(huán)節(jié)組成:問題發(fā)起、問題分析、問題處理、問題驗 證。由數(shù)據(jù)質(zhì)量管理人員總體控制、流轉(zhuǎn),協(xié)調(diào)各方進 行相關(guān)工作,參與每一個環(huán)節(jié)(如圖3所示)。在處理過程中,為了便于數(shù)據(jù)質(zhì)量問題的處理、流轉(zhuǎn) 和記錄,一般需要建立以下文檔:數(shù)據(jù)質(zhì)量檢核結(jié)果登記 簿,用于數(shù)據(jù)質(zhì)量檢核人員登記檢核結(jié)果;工作聯(lián)系單, 用于項目組內(nèi)或項目組間關(guān)于數(shù)據(jù)質(zhì)量問題進行溝通、問 題流轉(zhuǎn);數(shù)據(jù)質(zhì)量問題跟蹤單,用于記錄數(shù)據(jù)質(zhì)量問題的 整個發(fā)起、分析、處理、驗證的完整過程信息;數(shù)據(jù)質(zhì)量 問題的處理計劃和處理的方案,當責任方為外項目組時, 一般不關(guān)注處理方案的細節(jié)。3.數(shù)據(jù)質(zhì)量知識庫數(shù)據(jù)質(zhì)量知識庫是指通過在數(shù)據(jù)質(zhì)量檢核工作、數(shù) 據(jù)質(zhì)量問題處理工作中的知識提取和規(guī)則發(fā)現(xiàn),形成數(shù) 據(jù)質(zhì)量知識庫,再以數(shù)據(jù)質(zhì)量知識庫來指導(dǎo)數(shù)據(jù)質(zhì)量治 理工作的調(diào)整和延拓。數(shù)據(jù)質(zhì)量知識庫以規(guī)范化的自然 語言或形式化語言編寫,也可以包含可執(zhí)行的程序語 言。主要包含業(yè)務(wù)規(guī)則、技術(shù)規(guī)則、典型的分析方法、圖3 數(shù)據(jù)質(zhì)量處理流程問題發(fā)起發(fā)送數(shù)據(jù)質(zhì)量分析人員 提取重要規(guī)則問題分析提煉、歸納,知識入庫轉(zhuǎn)責任方進行處理 驗證不通過,重新處理問題驗證問題處理 責任方處理完成,有問題發(fā)起方驗證處理 結(jié)束數(shù)據(jù)質(zhì)量知識庫數(shù)據(jù)質(zhì)量檢核數(shù)據(jù)質(zhì)量檢核發(fā)現(xiàn)問題結(jié)以發(fā)現(xiàn)知識和規(guī)則,擴充知識庫。4.數(shù)據(jù)質(zhì)量評估數(shù)據(jù)質(zhì)量評估是對數(shù)據(jù)質(zhì)量進行系統(tǒng)的量化評估, 以評估某類數(shù)據(jù)集的數(shù)據(jù)質(zhì)量整體情況?;跀?shù)據(jù)質(zhì)量 指標集,可以對數(shù)據(jù)質(zhì)量進行定量的分析,進行系統(tǒng) 級、主題級的評估,以對于數(shù)據(jù)質(zhì)量治理工作做定量的 事前評估和事后驗收。數(shù)據(jù)質(zhì)量評估基于以下的五元評 估模型和評估公式。(1)數(shù)據(jù)質(zhì)量評估模型 該模型是一個五元組,即M。D表示需要進行評估的數(shù)據(jù)集。對于關(guān)系數(shù)據(jù)庫來講,一個 數(shù)據(jù)集相當于一類表或視圖。I表示數(shù)據(jù)集D上需要進行 評估的數(shù)據(jù)質(zhì)量指標集。R表示與評估指標相對應(yīng)的數(shù) 據(jù)質(zhì)量檢核規(guī)則。W表示賦予規(guī)則R的權(quán)值(大于0的整 數(shù)),描述了該規(guī)則在所有規(guī)則中所占的比重,一般實 施中同一質(zhì)量指標下的規(guī)則都賦與同一權(quán)值;S表示規(guī)則 R對應(yīng)的最終結(jié)果,一般取值為(正常數(shù)/總數(shù))*100。(2) 評估公式 在確定出指標集和權(quán)系數(shù)之后,評估公式為nWi S i編寫針對全數(shù)據(jù)集的檢核規(guī)則并進行日常監(jiān)控,以能的發(fā)現(xiàn)和預(yù)防數(shù)據(jù)質(zhì)量問題。但是這種方法,將 大的損耗系統(tǒng)資源和人力資源,在數(shù)據(jù)倉庫的實際 中并不可取。正如數(shù)據(jù)倉庫本質(zhì)上是一個動態(tài)的建設(shè)過程, 倉庫的數(shù)據(jù)質(zhì)量治理工作也是一個動態(tài)的工作過程 然始終是以6標準為數(shù)據(jù)質(zhì)量的檢核基礎(chǔ),但是 質(zhì)量工作的實施人員、對象、方式、目標,都會隨 據(jù)倉庫的建設(shè)發(fā)展而變化。1.數(shù)據(jù)質(zhì)量治理基本方法一個常用的數(shù)據(jù)質(zhì)量治理的基本方法為PDCA 共分為四個步驟:P計劃 D執(zhí)行 C檢查 A行 這四個步驟構(gòu)成一個閉環(huán),是一個逐步擴充、循 展的治理方法。P表示在數(shù)據(jù)質(zhì)量指標集中選擇某 指標準備改進。D表示在部分數(shù)據(jù)集上執(zhí)行數(shù)據(jù)質(zhì) 核、數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)質(zhì)量問題處理,以改進數(shù) 量。C表示通過數(shù)據(jù)使用反饋和數(shù)據(jù)質(zhì)量評估來驗 量改進效果。A表示制定數(shù)據(jù)質(zhì)量改進指引,對所 關(guān)數(shù)據(jù)集進行質(zhì)量改進,并驗證改進情況。2.數(shù)據(jù)質(zhì)量治理的三個發(fā)展階段在數(shù)據(jù)倉庫的建設(shè)中,數(shù)據(jù)質(zhì)量工作往往需經(jīng) 下三個階段。(1)被動處理問題階段 該階段往往處于數(shù)據(jù)倉庫建設(shè)的初期,在數(shù)據(jù)各數(shù)據(jù)集中各系統(tǒng)數(shù)據(jù)集成度不高,模型設(shè)計尚 善,與各OLTP系統(tǒng)、ODS系統(tǒng)、DSS系統(tǒng)尚處于 期,基于本行IT系統(tǒng)群特征的工作規(guī)范和工作模式完全成熟。由于在項目早期,各方面資源和人力主SA = i =1 nWii =1(3) 評估步驟數(shù)據(jù)質(zhì)量評估中,一共以下4個步驟:確定評估數(shù)據(jù) 集;選擇評估數(shù)據(jù)質(zhì)量指標集;制定規(guī)則集,并給出各規(guī)則 的權(quán)值;根據(jù)評估模型和評估公式,計算規(guī)則結(jié)果得分。二、數(shù)據(jù)質(zhì)量治理體系的構(gòu)建從上文可以看出,數(shù)據(jù)質(zhì)量檢核是數(shù)據(jù)質(zhì)量治理工夠的資源投入。對數(shù)據(jù)質(zhì)量的檢核,主要由應(yīng)用集市人員在數(shù)據(jù)使用中實施。本階段的數(shù)據(jù)質(zhì)量工作 以解決影響各應(yīng)用集市數(shù)據(jù)使用的問題為主,其工 作目標是盡快解決已發(fā)生的影響應(yīng)用集市區(qū)數(shù)據(jù)使 用的問題。(2)主動治理問題階段數(shù)據(jù)倉庫建設(shè)的成熟期,模型設(shè)計成型,重要數(shù) 據(jù)持續(xù)整合、集成入倉,各系統(tǒng)內(nèi)和系統(tǒng)間的工作規(guī) 范和工作模式已經(jīng)成熟。后續(xù)應(yīng)用集市對數(shù)據(jù)質(zhì)量要 求進一步提高,對數(shù)據(jù)質(zhì)量的檢核,主要由數(shù)據(jù)質(zhì)量 人員和應(yīng)用集市人員實施,少部分由設(shè)計、分析、測 試、維護人員實施發(fā)現(xiàn)。本階段的數(shù)據(jù)質(zhì)量工作,逐 步由主要處理應(yīng)用集市區(qū)的數(shù)據(jù)質(zhì)量問題處理,調(diào)整加擴張的。對于數(shù)據(jù)集市區(qū)的日常檢核監(jiān)控,在第三階段仍會實施。對于基礎(chǔ)區(qū)、緩沖區(qū)的數(shù)據(jù)檢核,若有 足夠資源,也可在第一階段同步實施。在進入新的階段 后,上一階段的工作內(nèi)容并不會完全取消,而是選擇出 重要部分,仍作為日常工作。但數(shù)據(jù)質(zhì)量工作中的被動 處理問題、主動發(fā)現(xiàn)問題、預(yù)防出現(xiàn)問題的發(fā)展過程, 是符合數(shù)據(jù)倉庫實施的建設(shè)趨勢的。以6標準為基礎(chǔ),制定數(shù)據(jù)倉庫的數(shù)據(jù)質(zhì)量指標 集,以PDCA法為數(shù)據(jù)質(zhì)量治理基本思路,根據(jù)數(shù)據(jù)倉 庫的不同發(fā)展階段,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論