為什么要在大數(shù)據(jù)中心實施元數(shù)據(jù)管理_第1頁
為什么要在大數(shù)據(jù)中心實施元數(shù)據(jù)管理_第2頁
為什么要在大數(shù)據(jù)中心實施元數(shù)據(jù)管理_第3頁
為什么要在大數(shù)據(jù)中心實施元數(shù)據(jù)管理_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

-4-為什么要在大數(shù)據(jù)中心實施元數(shù)據(jù)管理當我們費盡艱辛搭建好數(shù)據(jù)倉庫并勝利用于線上運行時,發(fā)覺我們將花費更多時間為數(shù)據(jù)科學家、分析師做數(shù)據(jù)預備。分析他們的數(shù)據(jù)需求,供應閃閃發(fā)光的數(shù)據(jù)報表。在數(shù)據(jù)管理領域,我們始終致力于讓數(shù)據(jù)為我們供應價值,為此我們付出大量的努力和投入。

在過去二十年,各大企業(yè)都在著手搭建數(shù)據(jù)倉庫。當我們費盡艱辛搭建好數(shù)據(jù)倉庫并勝利用于線上運行時,發(fā)覺我們將花費更多時間為數(shù)據(jù)科學家、分析師做數(shù)據(jù)預備。分析他們的數(shù)據(jù)需求,供應閃閃發(fā)光的數(shù)據(jù)報表。這將占用數(shù)據(jù)維護人員80%的時間投入,這個投入是偏高的,包含如溝通、反查、校正等大量重復和不必要投入。

如何提升數(shù)據(jù)管理力量?

我們需要回到這80%的投入,想盡一切方法壓縮它們,這樣才能更快的供應數(shù)據(jù)服務。這時有種工具呈現(xiàn)出了優(yōu)勢,那就是"元數(shù)據(jù)'。

元數(shù)據(jù),通常的定義為"描述數(shù)據(jù)的數(shù)據(jù)'。更精確?????一點說:元數(shù)據(jù)是描述流程、信息和對象的數(shù)據(jù)。這些描述涉及技術屬性特征(例如,結構和行為)、業(yè)務定義(包括字典和分類法)以及操作特征(如活動指標和使用歷史)。

我們用"元數(shù)據(jù)'去攻擊這"80%'。將元數(shù)據(jù)做集中式管理,梳理元數(shù)據(jù)樹,翻譯、標注、補充元數(shù)據(jù)內(nèi)容。便利使用者查找數(shù)據(jù)、理解數(shù)據(jù)、追蹤溯源以及規(guī)范專業(yè)學問。降低數(shù)據(jù)預備期間溝通、反查、校正等大量重復和不必要投入,這樣我們就可以留下更多的時間進行數(shù)據(jù)分析,不僅節(jié)約大量資金投入,還賺取更多的利潤。

以電信運營商為例,通過各個時期的IT建設,公司有計費系統(tǒng)、網(wǎng)絡系統(tǒng)、OA系統(tǒng)、財會系統(tǒng)和客服系統(tǒng)等等。隨著公司數(shù)據(jù)倉庫項目建設完成,各系統(tǒng)核心業(yè)務數(shù)據(jù)都匯總到了大數(shù)據(jù)中心。本以為會大幅提升IT系統(tǒng)的"智能性',沒想到基層的反應是根本用不起來。許多問題都來源于:缺乏針對數(shù)據(jù)的指導,業(yè)務規(guī)律把控不精確?????,各部門指標不統(tǒng)一,導致數(shù)據(jù)預備的成本較高。

連續(xù)以電信運營商為例,對于運營商的"當日用戶數(shù)'這個指標,各個部門給出的定義并不一樣:

在營業(yè)部每周例會上,各個部門對"當日用戶數(shù)'爭吵的面紅耳赤,擔負著業(yè)務壓力的業(yè)務人員很可能誰也勸說不了對方來接受自己的數(shù)字,不得不要求數(shù)據(jù)維護人員額外投入工作量去解析差異根源,校準報表數(shù)據(jù)。

這個問題根據(jù)元數(shù)據(jù)技術的術語來講,就是在業(yè)務元數(shù)據(jù)上,大家對于業(yè)務的熟悉并不統(tǒng)一。這種問題會造成大量的時間成本鋪張:

元數(shù)據(jù)管理平臺的建設就是為了避開消失這樣的問題。建設元數(shù)據(jù)管理平臺可以:

實現(xiàn)對技術元數(shù)據(jù)抽取、匯合、梳理,解釋相關庫表、列信息。支持查看完整數(shù)據(jù)鏈路和關聯(lián)圖譜。

梳理業(yè)務元數(shù)據(jù),將相關的指標、流程在平臺中建立起來,固化并傳播企業(yè)專業(yè)學問。

將業(yè)務元數(shù)據(jù)同技術元數(shù)據(jù)聯(lián)系起來,聯(lián)通業(yè)務與技術,給業(yè)務管理人員和技術維護人員供應更詳盡的指導。

就上文的舉例來看,就可以在元數(shù)據(jù)管理平臺上維護"當日用戶數(shù)'等易混淆指標,規(guī)范其數(shù)據(jù)來源,將其同技術庫表元數(shù)據(jù)關聯(lián)起來并作詳盡的解釋。報表建設以元數(shù)據(jù)管理平臺維護的業(yè)務學問為基準,這樣報表數(shù)據(jù)有章可循、有理有據(jù),消弭不必要的爭吵,各部門用心分析報表數(shù)據(jù),充分利用數(shù)據(jù)價值。

顯而易見,元數(shù)據(jù)管理平臺梳理企業(yè)資產(chǎn)、規(guī)范專業(yè)學問。推動元數(shù)據(jù)管理可以顯著降低數(shù)據(jù)預備成本:

元數(shù)據(jù)管理是基礎

元數(shù)據(jù)管理可以梳理企業(yè)資產(chǎn),規(guī)范專業(yè)學問,降低數(shù)據(jù)預備期間溝通、反查、校正等大量重復和不必要投入,幫助提升數(shù)據(jù)分析效率,是數(shù)據(jù)管理的基礎。

假如你進行的數(shù)據(jù)處理越簡單,作為支撐的數(shù)據(jù)就需要更好。假如你同時兼顧了這兩件事,才能讓更多的人直接使用數(shù)據(jù)并為自己服務。許多時候我們往往"本末倒置',遇到問題僅僅關注要如何解決,而忽視基礎的預備,不僅增加簡單度和重復工作量,還會花費大量的溝通、理解的成本。

元數(shù)據(jù)管理是基礎

額外的,元數(shù)據(jù)管理作為底層基礎,能使我們在后續(xù)進行集成操作,如處理云;在混合環(huán)境中做數(shù)據(jù)集成;在重復環(huán)境中做大數(shù)據(jù)時,獵取巨大的優(yōu)勢。事實上,將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論