電子政務(wù)基礎(chǔ)教程 第九章 數(shù)據(jù)質(zhì)量管理_第1頁
電子政務(wù)基礎(chǔ)教程 第九章 數(shù)據(jù)質(zhì)量管理_第2頁
電子政務(wù)基礎(chǔ)教程 第九章 數(shù)據(jù)質(zhì)量管理_第3頁
電子政務(wù)基礎(chǔ)教程 第九章 數(shù)據(jù)質(zhì)量管理_第4頁
電子政務(wù)基礎(chǔ)教程 第九章 數(shù)據(jù)質(zhì)量管理_第5頁
已閱讀5頁,還剩47頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第九章數(shù)據(jù)質(zhì)量管理9.1政務(wù)數(shù)據(jù)質(zhì)量管理概述數(shù)據(jù)質(zhì)量對于政務(wù)服務(wù)至關(guān)重要,在跨系統(tǒng)整合共享需求下,它是不同機(jī)構(gòu)能否成功構(gòu)建應(yīng)用的前提。它由政府系統(tǒng)內(nèi)部與外部數(shù)據(jù)質(zhì)量需求、質(zhì)量控制、質(zhì)量驗(yàn)證與質(zhì)量改進(jìn)等內(nèi)容組成,涵蓋政務(wù)數(shù)據(jù)的創(chuàng)建、采集、加工、轉(zhuǎn)換、傳輸與發(fā)布等整個(gè)生命周期。劣質(zhì)數(shù)據(jù)會(huì)給電子政務(wù)造成諸多不良影響,如:①系統(tǒng)資源無法共享交換;(二)系統(tǒng)數(shù)據(jù)維護(hù)、特別是跨系統(tǒng)數(shù)據(jù)追溯與維護(hù)困難;(三)政務(wù)服務(wù)差錯(cuò);(四)公眾服務(wù)體驗(yàn)不佳,滿意度下降;(五)用戶投訴增加,出現(xiàn)較多負(fù)面評論;(六)政務(wù)業(yè)務(wù)與管理數(shù)據(jù)失真;(七)機(jī)構(gòu)間資源共享與交互出現(xiàn)問題;(八)高層決策依據(jù)的數(shù)據(jù)錯(cuò)誤或缺失;(九)政務(wù)系統(tǒng)運(yùn)行效率下降,等等。政務(wù)數(shù)據(jù)質(zhì)量管理是系統(tǒng)性問題,它在“人類-網(wǎng)絡(luò)-社會(huì)”環(huán)境中,包括:確立與各項(xiàng)政務(wù)活動(dòng)的數(shù)據(jù)質(zhì)量需求、構(gòu)建數(shù)據(jù)監(jiān)測流程、定義數(shù)據(jù)質(zhì)量指標(biāo)及反映其變化與波動(dòng)的監(jiān)控措施。可再將其轉(zhuǎn)換5種控制需求:①針對政務(wù)業(yè)務(wù)構(gòu)建數(shù)據(jù)質(zhì)量指標(biāo)體系;(二)依據(jù)指標(biāo)體系建立相應(yīng)的單項(xiàng)與關(guān)聯(lián)控制規(guī)則;(三)確立各指標(biāo)可接受的閾值;(四)動(dòng)態(tài)記錄業(yè)務(wù)運(yùn)行中的數(shù)據(jù)質(zhì)量情況;(五)針對記錄中檢測到的各種沖突、不一致與錯(cuò)誤等報(bào)警,供管理人員處理,并將其加入控制規(guī)則等。9.2政務(wù)數(shù)據(jù)質(zhì)量管理概念9.2.1政務(wù)數(shù)據(jù)質(zhì)量管理定義與內(nèi)涵1)政務(wù)數(shù)據(jù)質(zhì)量管理的定義政務(wù)數(shù)據(jù)質(zhì)量管理的定義是:通過計(jì)劃、實(shí)施、控制與改進(jìn)活動(dòng),運(yùn)用系統(tǒng)化、網(wǎng)絡(luò)化質(zhì)量管理技術(shù)來測量、評估、改進(jìn)以保證政務(wù)系統(tǒng)中各類數(shù)據(jù)的正確使用。2)定義的內(nèi)涵---政務(wù)數(shù)據(jù)質(zhì)量管理的內(nèi)涵是,根據(jù)政務(wù)業(yè)務(wù)需求定義合適的數(shù)據(jù)質(zhì)量水平與管理體系,包括:(1)制定數(shù)據(jù)質(zhì)量現(xiàn)狀的評估計(jì)劃與衡量指標(biāo)。(2)實(shí)施數(shù)據(jù)質(zhì)量測量與改進(jìn)的流程。(3)動(dòng)態(tài)測量與監(jiān)控按業(yè)務(wù)需求規(guī)定的數(shù)據(jù)質(zhì)量水平。(4)執(zhí)行解決數(shù)據(jù)質(zhì)量問題的方案,達(dá)到改進(jìn)與提升質(zhì)量的效果等。9.2.2政務(wù)數(shù)據(jù)質(zhì)量管理方法傳統(tǒng)產(chǎn)業(yè)的質(zhì)量管理有許多成功經(jīng)驗(yàn)與方法,可用于電子政務(wù)領(lǐng)域,其中最具代表性的是數(shù)據(jù)質(zhì)量管理PDMA循環(huán)。數(shù)據(jù)質(zhì)量管理PDMA循環(huán)源于傳統(tǒng)產(chǎn)業(yè)質(zhì)量管理的PDCA(計(jì)劃-Plan,執(zhí)行-Do,檢驗(yàn)-Check,調(diào)整-Action)循環(huán),如圖9-1左側(cè);改進(jìn)后為數(shù)據(jù)領(lǐng)域的PDMA(計(jì)劃-Plan,實(shí)施-Deploy,監(jiān)控-Monitor,行動(dòng)-Act)循環(huán),如圖9-1右側(cè)。兩者皆通過循環(huán)比對質(zhì)量目標(biāo)與現(xiàn)況來改進(jìn)質(zhì)量,差異是數(shù)據(jù)質(zhì)量強(qiáng)調(diào)在計(jì)算機(jī)與網(wǎng)絡(luò)環(huán)境下開展實(shí)時(shí)性系統(tǒng)監(jiān)控。圖9-1傳統(tǒng)質(zhì)量管理的PDCA循環(huán)(左)與數(shù)據(jù)質(zhì)量管理的PDMA循環(huán)(右)示意9.2.3政務(wù)數(shù)據(jù)質(zhì)量意識(shí)與質(zhì)量管理目標(biāo)1)建立政務(wù)數(shù)據(jù)質(zhì)量意識(shí)數(shù)據(jù)質(zhì)量不僅涉及技術(shù)、體制與管理,更多的是質(zhì)量意識(shí)問題。政務(wù)數(shù)據(jù)質(zhì)量意識(shí)包括能將數(shù)據(jù)質(zhì)量問題與其實(shí)質(zhì)影響聯(lián)系起來,向監(jiān)管者保證系統(tǒng)化的數(shù)據(jù)質(zhì)量管理方法對機(jī)構(gòu)內(nèi)外的數(shù)據(jù)質(zhì)量進(jìn)行全面考察,還應(yīng)向所有人員傳遞“政務(wù)數(shù)據(jù)質(zhì)量問題不能僅靠技術(shù)手段解決”、“政務(wù)數(shù)據(jù)質(zhì)量貫穿政務(wù)系統(tǒng)生命周期全過程,直接影響社會(huì)服務(wù)、公眾體驗(yàn)”等理念。電子政務(wù)是人-機(jī)系統(tǒng),數(shù)據(jù)質(zhì)量的主導(dǎo)因素在人,關(guān)鍵是建立人的數(shù)據(jù)質(zhì)量意識(shí),核心是建立相應(yīng)的考核與獎(jiǎng)懲機(jī)制。2)政務(wù)數(shù)據(jù)質(zhì)量管理的一般目標(biāo)

數(shù)據(jù)質(zhì)量針對系統(tǒng)各級管理階層有不同的要求,一般目標(biāo)如下:在機(jī)構(gòu)內(nèi)與參與機(jī)構(gòu)間建立質(zhì)量意識(shí),讓業(yè)務(wù)合作者、用戶與上下游關(guān)聯(lián)機(jī)構(gòu)參與,同時(shí),系統(tǒng)開發(fā)與運(yùn)行者等都應(yīng)強(qiáng)化數(shù)據(jù)質(zhì)量意識(shí)。針對業(yè)務(wù)需求,建立具體的、針對各作業(yè)環(huán)節(jié)的數(shù)據(jù)質(zhì)量評估標(biāo)準(zhǔn)與保證措施。根據(jù)業(yè)務(wù)流程,建立跨系統(tǒng)的數(shù)據(jù)質(zhì)量意識(shí)與管理體系傳導(dǎo)模式,構(gòu)成政務(wù)數(shù)據(jù)質(zhì)量保證鏈。改進(jìn)政務(wù)數(shù)據(jù)質(zhì)量,在滿足政務(wù)系統(tǒng)內(nèi)外業(yè)務(wù)的質(zhì)量水平上,隨用戶檢驗(yàn)的提升要求改進(jìn)數(shù)據(jù)質(zhì)量與管理模式。為動(dòng)態(tài)測量、監(jiān)控和交流政務(wù)數(shù)據(jù)質(zhì)量水平,提供一致性的監(jiān)測衡量與管理程序。3)政務(wù)數(shù)據(jù)質(zhì)量管理的具體目標(biāo)

政務(wù)應(yīng)用中,數(shù)據(jù)質(zhì)量有一些技術(shù)性目標(biāo),具體如下:數(shù)據(jù)丟失:應(yīng)包含數(shù)據(jù)卻未填寫,或填寫字段不完整。數(shù)據(jù)錯(cuò)誤或不準(zhǔn)確:信息未被正確輸入或未得到正常維護(hù)。數(shù)據(jù)不對應(yīng):數(shù)據(jù)被錯(cuò)誤地輸入到了其他欄目。格式不符:數(shù)據(jù)未依照記錄系統(tǒng)需要進(jìn)行標(biāo)準(zhǔn)化處理。數(shù)據(jù)重復(fù):同一賬戶、聯(lián)系人、業(yè)務(wù)線索等在數(shù)據(jù)庫中記錄了不止一次,但可能其形式與稱謂不同。數(shù)據(jù)輸入失誤:字詞、名稱或格式方面的錯(cuò)誤、打字錯(cuò)誤、順序錯(cuò)誤和歧義。9.3政務(wù)數(shù)據(jù)質(zhì)量管理內(nèi)容9.3.1數(shù)據(jù)質(zhì)量管理活動(dòng)框架政務(wù)數(shù)據(jù)質(zhì)量管理一般涉及4類活動(dòng):計(jì)劃(P),控制(C),開發(fā)(D)和操作(O),對應(yīng)的管理活動(dòng)與內(nèi)容如下。建立和提升機(jī)構(gòu)內(nèi)部與機(jī)構(gòu)間相關(guān)人員的數(shù)據(jù)質(zhì)量意識(shí)(O)。圍繞政務(wù)業(yè)務(wù)定義數(shù)據(jù)質(zhì)量需求(D)。跟蹤分析和評估各項(xiàng)業(yè)務(wù)進(jìn)程中的數(shù)據(jù)質(zhì)量(D)。定義政務(wù)數(shù)據(jù)質(zhì)量的測評指標(biāo)(P)。依據(jù)政務(wù)業(yè)務(wù)項(xiàng)與流程定義數(shù)據(jù)質(zhì)量管理的業(yè)務(wù)規(guī)則(P)。在關(guān)鍵業(yè)務(wù)節(jié)點(diǎn)測試和驗(yàn)證數(shù)據(jù)質(zhì)量需求滿足程度(D)。確定與評估總體數(shù)據(jù)質(zhì)量服務(wù)水平(P)??鐧C(jī)構(gòu)持續(xù)測量并監(jiān)控?cái)?shù)據(jù)質(zhì)量(C)。管理數(shù)據(jù)質(zhì)量、特別是跨機(jī)構(gòu)、跨系統(tǒng)間的數(shù)據(jù)質(zhì)量與接口(C)。清洗并糾正數(shù)據(jù)質(zhì)量缺陷(O)。設(shè)計(jì)并實(shí)施數(shù)據(jù)質(zhì)量管理作業(yè)程序(D)。監(jiān)測政務(wù)數(shù)據(jù)質(zhì)量管理的操作程序與績效(C)。這些內(nèi)容構(gòu)成了政務(wù)數(shù)據(jù)質(zhì)量管理的一般活動(dòng)框架。9.3.2政務(wù)數(shù)據(jù)質(zhì)量管理的對象、參與者、工具與測量體系1)管理對象

數(shù)據(jù)質(zhì)量管理的對象包括數(shù)據(jù)元素、元數(shù)據(jù)、主數(shù)據(jù)、參考數(shù)據(jù)、各類業(yè)務(wù)與管理數(shù)據(jù)等,以及與數(shù)據(jù)相關(guān)的各級工作者。2)參與者

數(shù)據(jù)質(zhì)量管理涉及所有業(yè)務(wù)干系機(jī)構(gòu)的以下人員:(1)數(shù)據(jù)質(zhì)量分析師。(2)數(shù)據(jù)分析師。(3)數(shù)據(jù)與數(shù)據(jù)庫管理員。(4)數(shù)據(jù)資源管理員。(5)數(shù)據(jù)管理體系委員會(huì)成員。3)管理工具

數(shù)據(jù)質(zhì)量管理主要采用以下工具:(1)數(shù)據(jù)分析工具。(2)統(tǒng)計(jì)分析工具。(3)數(shù)據(jù)清洗工具。(4)數(shù)據(jù)整合工具。(5)事件和問題管理工具。(6)大數(shù)分析工具與知識(shí)圖譜等。4)測量體系

數(shù)據(jù)質(zhì)量測量體系包括以下內(nèi)容:(1)數(shù)據(jù)內(nèi)容比對。(2)數(shù)據(jù)值分析。(3)錯(cuò)誤/不合規(guī)對象的檢出。(4)質(zhì)量查驗(yàn)與校正。(5)質(zhì)量水平的達(dá)成。(6)跨機(jī)構(gòu)間數(shù)據(jù)質(zhì)量管理的接口契合度。9.3.3數(shù)據(jù)質(zhì)量的供給、輸入與成果數(shù)據(jù)質(zhì)量管理的主要目標(biāo),是保證各項(xiàng)服務(wù)業(yè)務(wù)的正確運(yùn)行,不斷提升數(shù)據(jù)質(zhì)量以支持新服務(wù)項(xiàng)。故數(shù)據(jù)質(zhì)量的供給包括質(zhì)量標(biāo)準(zhǔn)、管理技術(shù)、測評方法、控制機(jī)制、體制銜接等方面的輸入,其成果也包括了能在機(jī)構(gòu)內(nèi)部與機(jī)構(gòu)間切實(shí)實(shí)施的多種規(guī)章制度、關(guān)鍵點(diǎn)檢測、系統(tǒng)日志、作業(yè)臺(tái)賬、異常報(bào)告、處理紀(jì)錄等。9.4政務(wù)數(shù)據(jù)質(zhì)量體系9.4.1質(zhì)量體系概述質(zhì)量體系的定義是指為保證產(chǎn)品、過程或服務(wù)滿足規(guī)定(或潛在)的質(zhì)量要求,由機(jī)構(gòu)、職責(zé)、程序、活動(dòng)、能力和資源等構(gòu)成的有機(jī)整體,即為實(shí)現(xiàn)質(zhì)量目標(biāo)而建立的綜合體。傳統(tǒng)企業(yè)為實(shí)施質(zhì)量管理,生產(chǎn)出滿足規(guī)定和潛在要求的產(chǎn)品和提供滿意的服務(wù),達(dá)到既定的質(zhì)量目標(biāo),必須通過建立和健全質(zhì)量體系來實(shí)現(xiàn)。質(zhì)量體系分為質(zhì)量管理體系和質(zhì)量保證體系,在非合同環(huán)境下,企業(yè)只建立內(nèi)部質(zhì)量管理體系;在合同環(huán)境下,企業(yè)還須建立質(zhì)量保證體系,以保證上下游質(zhì)量控制鏈的完善。顯然,這些針對傳統(tǒng)產(chǎn)業(yè)的質(zhì)量體系概念,對于電子政務(wù)數(shù)據(jù)質(zhì)量領(lǐng)域,其基本理念與方法也適用。但電子政務(wù)屬虛擬產(chǎn)業(yè),數(shù)字領(lǐng)域中的質(zhì)量體系、質(zhì)量管理與控制理論等仍在完善中,各領(lǐng)域的實(shí)踐也在數(shù)據(jù)治理的框架下進(jìn)行中。9.4.2政務(wù)數(shù)據(jù)質(zhì)量指標(biāo)9.4.2.1政務(wù)數(shù)據(jù)質(zhì)量指標(biāo)體系要求

政務(wù)數(shù)據(jù)質(zhì)量具有系統(tǒng)化特征,涉及多維度的綜合數(shù)據(jù)質(zhì)量指標(biāo),具體要求如下。1)規(guī)范性2)完整性3)準(zhǔn)確性4)一致性5)及時(shí)性與可用性6)有效性7)易用性和可維護(hù)性8)全面性9)表達(dá)性10)可理解性11)效用性12)唯一性13)參照完整性14)合理性15)時(shí)效性

以上指標(biāo)構(gòu)成了數(shù)據(jù)質(zhì)量管理維度,可據(jù)此對質(zhì)量規(guī)則分類。根據(jù)實(shí)施之需,對度量的顆粒度進(jìn)行細(xì)化,如數(shù)據(jù)值、數(shù)據(jù)元、數(shù)據(jù)記錄和數(shù)據(jù)表等。9.4.2.2數(shù)據(jù)質(zhì)量指標(biāo)的選擇與定義9.4.2.1給出了常規(guī)數(shù)據(jù)質(zhì)量要求,具體政務(wù)系統(tǒng)中,指標(biāo)選擇有兩個(gè)要點(diǎn)。一是指標(biāo)定義的過程不能在數(shù)據(jù)質(zhì)量管理的最后階段才進(jìn)行,而要在數(shù)據(jù)質(zhì)量戰(zhàn)略制定、設(shè)計(jì)和規(guī)劃階段開始,其后在實(shí)施中不斷增減與改進(jìn)指標(biāo);二是指標(biāo)選擇、構(gòu)建數(shù)據(jù)質(zhì)量管理維度時(shí),要考慮以下一些指標(biāo)特性。

1)可度量性2)業(yè)務(wù)相關(guān)性3)可接受度4)可控性5)可跟蹤性9.4.2.3定義數(shù)據(jù)質(zhì)量業(yè)務(wù)規(guī)則應(yīng)動(dòng)態(tài)檢查政務(wù)數(shù)據(jù)質(zhì)量是否滿足業(yè)務(wù)規(guī)則,并監(jiān)控質(zhì)量對業(yè)務(wù)規(guī)則的符合度,為此需要以下措施。(1)將不滿足業(yè)務(wù)需求的數(shù)據(jù)值、記錄和記錄集與有效的數(shù)據(jù)值、記錄與記錄集作比對。(2)生成通知事件,向數(shù)據(jù)管理員提示出現(xiàn)的質(zhì)量問題。(3)建立自動(dòng)或事件驅(qū)動(dòng)的缺陷數(shù)據(jù)糾正機(jī)制,使其能滿足業(yè)務(wù)要求。

流程(1)使用數(shù)據(jù)期望值,判斷運(yùn)行中的數(shù)據(jù)集是否在允許特性與值域范圍內(nèi)。復(fù)雜規(guī)則可將其與(2)及(3)流程結(jié)合運(yùn)用,包括當(dāng)實(shí)際數(shù)值不符合質(zhì)量時(shí)的報(bào)警與對數(shù)值的糾正提示。

這些業(yè)務(wù)規(guī)則可用模板定義,具體如:1)值域模板說明數(shù)據(jù)項(xiàng)的指定值是從某個(gè)定義域中選用的數(shù)據(jù)值,如我國行政區(qū)劃代碼中的前2位代表省(直轄市、自治區(qū));2)一致性模板以跨機(jī)構(gòu)間一致理解與認(rèn)可的數(shù)據(jù)內(nèi)容與表示為前提,建立質(zhì)量控制模板,控制以下4種一致性:(1)內(nèi)容一致性

包括概念定義、要計(jì)算字段的算法、相應(yīng)時(shí)間或本地的限制條件,精度規(guī)則等。(2)值域一致性

數(shù)據(jù)項(xiàng)的取值必須滿足事先約定的數(shù)值、字典或時(shí)域范圍,例如:大于0且小于100的數(shù)值范圍等。(3)格式一致性

特定數(shù)據(jù)項(xiàng)的一種或多種格式數(shù)據(jù)項(xiàng),如用4數(shù)字段+間隔格式來顯示銀行賬號(hào)、電話號(hào)碼等。(4)映射一致性

將一數(shù)據(jù)項(xiàng)的值映射到相應(yīng)的其他等值域的不同表達(dá),如IP地址通過DNS映射為相應(yīng)域名。3)記錄完整性模板通常在系統(tǒng)界面上,依據(jù)相應(yīng)規(guī)則給出哪些輸入數(shù)據(jù)項(xiàng)可省略、哪些不可缺失,以保證關(guān)鍵字段的完整性。4)正確性模板

模板將數(shù)據(jù)值與系統(tǒng)后臺(tái)的相應(yīng)標(biāo)準(zhǔn)值進(jìn)行比對,以驗(yàn)證其正確性。5)唯一性模板此規(guī)則要求實(shí)體具有唯一性,要求僅有一條記錄與對象相對應(yīng)。6)關(guān)聯(lián)性模板當(dāng)輸入某項(xiàng)數(shù)據(jù)時(shí),與其關(guān)聯(lián)的一條或多條數(shù)據(jù)項(xiàng)也顯示并參與檢驗(yàn)。

還有其他類型的規(guī)則模板等。規(guī)則模板的優(yōu)點(diǎn)是將質(zhì)量控制規(guī)則設(shè)計(jì)到業(yè)務(wù)進(jìn)程中,通過內(nèi)嵌規(guī)則引擎、數(shù)據(jù)分析組件、數(shù)據(jù)描述工具、標(biāo)識(shí)代碼比對庫等來輔助數(shù)據(jù)質(zhì)量管理。9.4.2.4數(shù)據(jù)質(zhì)量監(jiān)控模式對于政務(wù)數(shù)據(jù)質(zhì)量是否符合業(yè)務(wù)規(guī)則,有針對數(shù)據(jù)流與數(shù)據(jù)批的2種測量監(jiān)控模式;相應(yīng)對象也有3種顆粒度:數(shù)據(jù)值、數(shù)據(jù)實(shí)例或記錄及數(shù)據(jù)集;這就組成了6種可能的質(zhì)量監(jiān)測方案。如對數(shù)據(jù)創(chuàng)建時(shí)進(jìn)行數(shù)據(jù)流測量,對長期存儲(chǔ)的數(shù)據(jù)記錄集進(jìn)行數(shù)據(jù)批測量。將數(shù)據(jù)質(zhì)量控制和測量流程嵌入政務(wù)業(yè)務(wù)處理流中,可實(shí)現(xiàn)持續(xù)性監(jiān)控。但因此要測量整個(gè)數(shù)據(jù)集,故在數(shù)據(jù)量較大的情況下,測量不太可能以數(shù)據(jù)流方式實(shí)現(xiàn),較為可行的是在不同處理階段間隙進(jìn)行數(shù)據(jù)集交互測量。表9-1給出了適合的監(jiān)測技術(shù)用于相應(yīng)的數(shù)據(jù)質(zhì)量業(yè)務(wù)規(guī)則。9.4.2.5確定政務(wù)數(shù)據(jù)質(zhì)量控制水平數(shù)據(jù)質(zhì)量控制水平用于定義政務(wù)系統(tǒng)、特別是跨機(jī)構(gòu)業(yè)務(wù)整合系統(tǒng)中,數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)符合程度。由于數(shù)據(jù)質(zhì)量控制的水平、規(guī)模、范圍與業(yè)務(wù)性質(zhì)等均與成本相關(guān),故確定合適的控制水平對系統(tǒng)的建設(shè)與運(yùn)行頗為重要。雖然數(shù)據(jù)質(zhì)量檢查有助于隔離缺陷數(shù)據(jù)、分析其根源,提供在預(yù)定時(shí)間與范圍內(nèi)糾正錯(cuò)誤根源的機(jī)制,但從表9-1也能看出,過深的控制水平需要系統(tǒng)在檢索、運(yùn)算、檢測、比對、統(tǒng)計(jì)與校驗(yàn)等方面較大的開銷與負(fù)擔(dān),導(dǎo)致成本增加和服務(wù)效能下降。因此,系統(tǒng)的數(shù)據(jù)質(zhì)量控制水平應(yīng)與相應(yīng)的業(yè)務(wù)相適合即可。確定的常規(guī)數(shù)據(jù)質(zhì)量控制包括以下內(nèi)容:(1)控制涉及的政務(wù)數(shù)據(jù)項(xiàng)的范圍。(2)數(shù)據(jù)缺陷形態(tài)及其對業(yè)務(wù)的影響。(3)與各數(shù)據(jù)項(xiàng)對應(yīng)的適用數(shù)據(jù)質(zhì)量維度,即指標(biāo)體系的選擇。(4)業(yè)務(wù)進(jìn)程中各應(yīng)用、源系統(tǒng)對數(shù)據(jù)項(xiàng)的質(zhì)量需求,整合與共享時(shí)的需求。(5)針對數(shù)據(jù)質(zhì)量需求采用的相應(yīng)度量方法。(6)各項(xiàng)測量的可接受閾值范圍。(7)當(dāng)檢測值超出可接受閾值時(shí)應(yīng)通知的相關(guān)人員,期望解決問題的時(shí)間與限制。(8)建立質(zhì)量問題的發(fā)現(xiàn)、報(bào)告、解決與學(xué)習(xí)機(jī)制等。9.4.2.6處理數(shù)據(jù)質(zhì)量問題數(shù)據(jù)質(zhì)量控制的設(shè)定與實(shí)施,需要建立質(zhì)量事件/問題的發(fā)現(xiàn)、報(bào)告、解決與跟蹤機(jī)制。數(shù)據(jù)質(zhì)量事件報(bào)告是政務(wù)系統(tǒng)應(yīng)當(dāng)具備的能力,它能記錄數(shù)據(jù)質(zhì)量事件的評估、初步診斷和后續(xù)行動(dòng)等信息,對問題糾正的跟蹤還可提供結(jié)果報(bào)告,包括問題解決的平均時(shí)間、問題發(fā)生頻率、問題類型、問題來源、糾正與消除問題的措施等。跟蹤系統(tǒng)應(yīng)支持查看當(dāng)前與歷史數(shù)據(jù)質(zhì)量問題、問題狀態(tài)和相關(guān)人員參與解決問題的條件等。許多政務(wù)系統(tǒng)已建立了跟蹤軟件、硬件及網(wǎng)絡(luò)等問題的事件報(bào)告,應(yīng)擴(kuò)展到數(shù)據(jù)質(zhì)量事件報(bào)告領(lǐng)域。為此,要將數(shù)據(jù)質(zhì)量問題歸類、納入到事件目錄中。還應(yīng)能培訓(xùn)相關(guān)人員識(shí)別出現(xiàn)的問題,如何分類、記錄并依據(jù)數(shù)據(jù)質(zhì)量控制水平進(jìn)行跟蹤。這些步驟涉及以下環(huán)節(jié):1)將質(zhì)量事件標(biāo)準(zhǔn)化

各政務(wù)系統(tǒng)中描述數(shù)據(jù)問題的術(shù)語可能隨本地業(yè)務(wù)、跨機(jī)構(gòu)業(yè)務(wù)與整合業(yè)務(wù)的不同而有差異,將相關(guān)概念標(biāo)準(zhǔn)化,可使各機(jī)構(gòu)對數(shù)據(jù)質(zhì)量問題與現(xiàn)象取得一致的理解,簡化對質(zhì)量問題的認(rèn)知、事件模式的統(tǒng)計(jì)、參與方之間的識(shí)別、質(zhì)量改進(jìn)措施的效果報(bào)告等。對問題的分類會(huì)隨著事件跟蹤和溯源而深入。2)指定質(zhì)量問題的處理過程

操作程序應(yīng)引導(dǎo)分析人員進(jìn)行數(shù)據(jù)質(zhì)量事件的診斷,制定解決方案等。該流程應(yīng)在質(zhì)量事件跟蹤系統(tǒng)中驅(qū)動(dòng),并能向分析人員進(jìn)行提示與建議等。3)管理問題報(bào)告程序數(shù)據(jù)質(zhì)量問題處理取決于事件的影響、持續(xù)時(shí)間、問題緊迫性,以及問題上報(bào)體制。上報(bào)順序應(yīng)在數(shù)據(jù)質(zhì)量控制水平中定義,由事件跟蹤系統(tǒng)執(zhí)行,以助于數(shù)據(jù)問題的判定與處理。4)管理數(shù)據(jù)質(zhì)量解決流程

數(shù)據(jù)質(zhì)量控制水平確定了監(jiān)測、控制和解決問題的目標(biāo),定義了業(yè)務(wù)流程。事件跟蹤系統(tǒng)支持工作流管理,跟蹤質(zhì)量問題的診斷和解決的進(jìn)展情況。

質(zhì)量問題跟蹤管理系統(tǒng),可訓(xùn)練作業(yè)與管理人員及早在業(yè)務(wù)流中發(fā)現(xiàn)問題,原始數(shù)據(jù)有助于生成質(zhì)量控制水平與問題指標(biāo),可供數(shù)據(jù)治理進(jìn)行統(tǒng)計(jì)分析與構(gòu)建事件發(fā)現(xiàn)與解決模型。對一些普遍性問題,可通過跨機(jī)構(gòu)的人員建立共識(shí),開發(fā)出針對性程序與解決方案。9.4.2.7清洗與糾正數(shù)據(jù)質(zhì)量缺陷數(shù)據(jù)質(zhì)量控制有2項(xiàng)活動(dòng):一是確定并消除質(zhì)量問題發(fā)生的原因,二是分離不正確的數(shù)據(jù),采用適當(dāng)糾正措施。錯(cuò)誤發(fā)現(xiàn)后通常采用3種方法進(jìn)行數(shù)據(jù)校正。自動(dòng)校正參照數(shù)據(jù)質(zhì)量要求,運(yùn)用基于規(guī)則的標(biāo)準(zhǔn)化、范式化的糾正措施,對數(shù)據(jù)進(jìn)行處理??蔁o須人工干預(yù)進(jìn)行修正,如地址數(shù)據(jù)的自動(dòng)補(bǔ)全與校正,這要事先將標(biāo)準(zhǔn)地址與代碼放入庫中,使用規(guī)則、解析、參照表、范式化等處理方式對輸入的地址進(jìn)行比對與補(bǔ)全。在良好定義的標(biāo)準(zhǔn)資源庫、普遍接受的規(guī)則和已知的錯(cuò)誤模式環(huán)境中,最適于進(jìn)行自動(dòng)清洗與校正。人工指導(dǎo)校正在1)的基礎(chǔ)上,在將校正結(jié)果提交前先經(jīng)人工審核。這需要設(shè)置一定的置信水平來判定。對超過特定置信度的自動(dòng)校正結(jié)果可不作評審,但對低于置信度水平的校正,就需提交數(shù)據(jù)管理員審核和批準(zhǔn)。結(jié)果可能是認(rèn)可校正,或?qū)ξ凑J(rèn)可的校正進(jìn)行調(diào)整,再?zèng)Q定是否將其納入糾正規(guī)則中。敏感數(shù)據(jù)則需人工指導(dǎo)校正。人工校正數(shù)據(jù)管理員檢查各種的無效記錄,確定正確取值,校正后更新記錄。9.4.2.8數(shù)據(jù)質(zhì)量的持續(xù)性要求

數(shù)據(jù)質(zhì)量管理是持續(xù)過程,為滿足政務(wù)業(yè)務(wù)需求,應(yīng)采用相關(guān)標(biāo)準(zhǔn),制訂內(nèi)部規(guī)范,以保證數(shù)據(jù)質(zhì)量能滿足業(yè)務(wù)之需。它包括數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)異常識(shí)別、合規(guī)的業(yè)務(wù)需求與質(zhì)量規(guī)則定義,根據(jù)已定義的數(shù)據(jù)質(zhì)量規(guī)則進(jìn)行檢查和監(jiān)控,相關(guān)的作業(yè)流程,以及數(shù)據(jù)解析、查驗(yàn)、清洗和整合等。數(shù)據(jù)質(zhì)量管理還包括對問題的持續(xù)跟蹤,對已定義的數(shù)據(jù)質(zhì)量服務(wù)水平協(xié)議的合規(guī)性持續(xù)監(jiān)控。

政務(wù)數(shù)據(jù)質(zhì)量管理的持續(xù)性還體現(xiàn)在PDMA質(zhì)量環(huán)上,凡控制規(guī)則、質(zhì)量缺陷糾正等后均進(jìn)入下一階段循環(huán)中,周而復(fù)始運(yùn)行。9.4.3元數(shù)據(jù)質(zhì)量管理元數(shù)據(jù)是構(gòu)建、定義與描述其他數(shù)據(jù)的數(shù)據(jù),同時(shí)也是數(shù)據(jù);故它們除應(yīng)遵守9.3.1節(jié)的數(shù)據(jù)質(zhì)量指標(biāo)體系要求外,還因低質(zhì)量元數(shù)據(jù)會(huì)影響其描述數(shù)據(jù)的質(zhì)量與功能,故應(yīng)對其質(zhì)量要求予以特別關(guān)注。

9.4.3.1元數(shù)據(jù)的完整性與一致性

元數(shù)據(jù)也是數(shù)據(jù),故上述數(shù)據(jù)質(zhì)量控制要求與管理原則對元數(shù)據(jù)也基本適用。在電子政務(wù)大數(shù)據(jù)與云計(jì)算環(huán)境中,采用集中式或混合式元數(shù)據(jù)系統(tǒng)架構(gòu)可建立覆蓋全局、符合一致性、完整性與參照約束性等的元數(shù)據(jù)資源系統(tǒng)。在單一系統(tǒng)或多系統(tǒng)整合環(huán)境中,查詢各元數(shù)據(jù)的來源,對其所含數(shù)據(jù)元的內(nèi)容與格式的完整性與一致性進(jìn)行比對,對梳理出的不合規(guī)對象進(jìn)行處理。所以,對于元數(shù)據(jù),完整性與一致性是其核心質(zhì)量指標(biāo),能通過管理軟件進(jìn)行質(zhì)量檢驗(yàn)與控制。9.4.3.2元數(shù)據(jù)質(zhì)量管理內(nèi)容

在政務(wù)系統(tǒng)整合共享環(huán)境中,元數(shù)據(jù)作業(yè)涉及抽取、遷移、暫存、清洗、更新、發(fā)布、使用與維護(hù)等,故其質(zhì)量管理就有多種內(nèi)容與細(xì)致的過程。除應(yīng)遵守?cái)?shù)據(jù)質(zhì)量管理的PDMA環(huán)外,還涉及以下技術(shù)、工具、制度與人員等:(1)元數(shù)據(jù)和存儲(chǔ)庫與備份、恢復(fù)、歸檔與清洗。(2)業(yè)務(wù)調(diào)試、監(jiān)視、變更數(shù)據(jù)配置等。(3)元數(shù)據(jù)的抽取與裝載統(tǒng)計(jì)分析。(4)元數(shù)據(jù)源的映射與遷移。(5)元數(shù)據(jù)變換與跟蹤,其中又涉及:1、元數(shù)據(jù)管理指標(biāo)的生成與分析,相關(guān)性能的調(diào)優(yōu)。2、元數(shù)據(jù)查詢結(jié)果的生成與呈現(xiàn)。3、用戶界面管理。4、響應(yīng)報(bào)告、沖突告警。5、版本記錄與任務(wù)日志。6、對用戶和數(shù)據(jù)管理員的培訓(xùn)等。9.4.3.3元數(shù)據(jù)質(zhì)量管理體系

與傳統(tǒng)的全面質(zhì)量管理(TQC)體系類似,元數(shù)據(jù)質(zhì)量也需要一套管理體系來維護(hù),通過人工與系統(tǒng)比對方法來維護(hù)與控制。元數(shù)據(jù)質(zhì)量管理體系可參照GB/T18391(ISO11179)系列,結(jié)合具體業(yè)務(wù)數(shù)據(jù)需求,對元數(shù)據(jù)在語義、語境、語用、語域等方面的描述,分類與標(biāo)識(shí)代碼,元數(shù)據(jù)注冊的完整性,格式符合性和可靠性,及時(shí)性等方面建立完整的質(zhì)量管理體系,并覆蓋元數(shù)據(jù)的生成、結(jié)構(gòu)、注冊、存儲(chǔ)、發(fā)布、使用與完善等環(huán)節(jié)。質(zhì)量體系始終應(yīng)關(guān)注人的因素。在政務(wù)系統(tǒng)、尤其是面向整合與共享的跨機(jī)構(gòu)政務(wù)應(yīng)用中,就應(yīng)通過任命數(shù)據(jù)管理負(fù)責(zé)人,同時(shí)負(fù)責(zé)元數(shù)據(jù)管理,通過他們建立跨機(jī)構(gòu)管理協(xié)調(diào)機(jī)制,針對業(yè)務(wù)需求設(shè)立元數(shù)據(jù)管理崗位、賦予相應(yīng)職責(zé)等。還應(yīng)注意,在多機(jī)構(gòu)信息資源整合的環(huán)境中,因不同機(jī)構(gòu)分屬不同領(lǐng)域,各自的行政文化與管理理念等都存在差異,皆可能影響元數(shù)據(jù)管理。9.5政務(wù)數(shù)據(jù)質(zhì)量治理9.5.1數(shù)據(jù)質(zhì)量治理概述質(zhì)量管理源于傳統(tǒng)產(chǎn)業(yè),主要針對擁有實(shí)體邊界的實(shí)體對象、實(shí)體流程與服務(wù)等。盡管其主要理念、方法和工具等也適用于數(shù)字領(lǐng)域,但畢竟數(shù)字領(lǐng)域具有對象的虛擬性、邊界的無形性、業(yè)務(wù)的流變性和環(huán)境的智能性等特點(diǎn),導(dǎo)致傳統(tǒng)質(zhì)量管理理論與方法在一些方面力有不及,因此數(shù)字領(lǐng)域更提出數(shù)據(jù)治理的概念,將其應(yīng)用于數(shù)據(jù)質(zhì)量,就成為數(shù)據(jù)質(zhì)量治理理念。數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動(dòng)集合(規(guī)劃、監(jiān)控、執(zhí)行和提升),重點(diǎn)是指導(dǎo)機(jī)構(gòu)從使用局部數(shù)據(jù)變?yōu)榭缦到y(tǒng)使用統(tǒng)一的數(shù)據(jù)資源,從具有較少或沒有組織的流程治理到全局范圍的綜合數(shù)據(jù)治理,從處理分散數(shù)據(jù)資源到將其打造成一個(gè)全局整合的數(shù)據(jù)資產(chǎn)的過程。數(shù)據(jù)質(zhì)量治理就是將上述理念具體應(yīng)用于數(shù)據(jù)質(zhì)量管理的過程,由國際數(shù)據(jù)管理協(xié)會(huì)(DAMAInternational)編寫權(quán)威著作的《DAMA數(shù)據(jù)管理知識(shí)體系指南》中,就將數(shù)據(jù)質(zhì)量管理視為與數(shù)據(jù)治理職能交互并受其影響的數(shù)據(jù)管理職能。因此,政務(wù)數(shù)據(jù)質(zhì)量治理就是從政務(wù)系統(tǒng)應(yīng)用全局的數(shù)據(jù)質(zhì)量需求出發(fā),在前述各節(jié)的內(nèi)容基礎(chǔ)上,開展跨機(jī)構(gòu)、跨領(lǐng)域和跨邊界的治理活動(dòng)。DAMAInternational著《DAMA數(shù)據(jù)管理知識(shí)體系指南》馬歡劉晨等譯清華大學(xué)出版社2017年7月第1版P2139.5.2政務(wù)數(shù)據(jù)質(zhì)量治理的流程

政務(wù)數(shù)據(jù)質(zhì)量治理流程框架如圖9-2所示,它需要針對具體政務(wù)應(yīng)用,構(gòu)建跨機(jī)構(gòu)的治理流程。

圖9-2流程框架有10個(gè)步驟,是圍繞政務(wù)數(shù)據(jù)質(zhì)量改進(jìn)與提升的5個(gè)階段,具體如下:(1)從全局定義電子政務(wù)業(yè)務(wù)數(shù)據(jù)的質(zhì)量需求,分析與描述其運(yùn)行環(huán)境與作業(yè)模式,將質(zhì)量需求具體分解到不同機(jī)構(gòu)的不同作業(yè)崗位,提出明確的要求。(2)評估各階段的數(shù)據(jù)質(zhì)量,特別是當(dāng)有外部源數(shù)據(jù)進(jìn)入、參與整合共享時(shí)的質(zhì)量,質(zhì)量波動(dòng)對政務(wù)業(yè)務(wù)的影響,及其穿過邊界對各機(jī)構(gòu)作業(yè)與資源的影響等。(3)確定不合格數(shù)據(jù)的狀態(tài),特別是那些局部作業(yè)合格但不滿足總體業(yè)務(wù)質(zhì)量的狀態(tài),了解具體數(shù)據(jù)缺陷的起源及其對全局業(yè)務(wù)的影響。(4)從數(shù)據(jù)管理規(guī)程、整合共享、監(jiān)測控制等方面提出數(shù)據(jù)質(zhì)量比對、缺陷發(fā)現(xiàn)、問題判定、提示、多源協(xié)商、處理與糾正機(jī)制、機(jī)構(gòu)邊界內(nèi)外轉(zhuǎn)換等一系列的質(zhì)量改進(jìn)流程。(5)通過對政務(wù)流程、跨機(jī)構(gòu)人員和整合預(yù)處等的前置控制,以及程序的必要的修正,將糾正質(zhì)量問題的措施規(guī)程化,使系統(tǒng)能自動(dòng)識(shí)別同類數(shù)據(jù)缺陷,開展預(yù)防性處理。而這些行之有效的前置處理、事中處理與事后糾正措施等將分發(fā)到各數(shù)據(jù)源機(jī)構(gòu),植入其數(shù)據(jù)質(zhì)量體系中。在數(shù)據(jù)整合共享中各相關(guān)機(jī)構(gòu)共同對數(shù)據(jù)質(zhì)量的改進(jìn)效果進(jìn)行交流溝通與驗(yàn)核。9.5.3政務(wù)系統(tǒng)內(nèi)外部的數(shù)據(jù)質(zhì)量治理9.5.3.1系統(tǒng)內(nèi)部數(shù)據(jù)質(zhì)量治理數(shù)據(jù)質(zhì)量管理向來是一項(xiàng)艱苦細(xì)致的工作。無論單一機(jī)構(gòu)的政務(wù)系統(tǒng),還是跨機(jī)構(gòu)整合的政務(wù)系統(tǒng),都應(yīng)開展內(nèi)部數(shù)據(jù)質(zhì)量管理與體系驗(yàn)證。既保證合規(guī)數(shù)據(jù)在內(nèi)部運(yùn)行,又能將其貢獻(xiàn)給關(guān)聯(lián)業(yè)務(wù)機(jī)構(gòu)。而低質(zhì)數(shù)據(jù)將在系統(tǒng)整合時(shí)傳輸?shù)疥P(guān)聯(lián)系統(tǒng)中,會(huì)引起更大范圍的低質(zhì)數(shù)據(jù)。同時(shí),即便適于單一機(jī)構(gòu)質(zhì)量標(biāo)準(zhǔn)的數(shù)據(jù)與管理體系,對于多機(jī)構(gòu)整合系統(tǒng)未必是充分與完善的,于是,就有了跨系統(tǒng)的政務(wù)數(shù)據(jù)治理要求。各機(jī)構(gòu)內(nèi)的數(shù)據(jù)質(zhì)量保證體系與全局性數(shù)據(jù)治理結(jié)合,是多機(jī)構(gòu)業(yè)務(wù)整合的基礎(chǔ)。單一機(jī)構(gòu)內(nèi)部的數(shù)據(jù)質(zhì)量治理與前述質(zhì)量管理的內(nèi)容基本相同,主要為:①定義機(jī)構(gòu)內(nèi)部數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),(二)開展內(nèi)部數(shù)據(jù)質(zhì)量管理,(三)定義不合格數(shù)據(jù),(四)數(shù)據(jù)質(zhì)量分析,(五)數(shù)據(jù)質(zhì)量測試,(六)缺陷數(shù)據(jù)根源分析,(七)制定數(shù)據(jù)質(zhì)量檢測方案,(八)開展內(nèi)部數(shù)據(jù)質(zhì)量管控,(九)機(jī)構(gòu)內(nèi)部質(zhì)量意識(shí)的建立與強(qiáng)化,(十)機(jī)構(gòu)內(nèi)部的數(shù)據(jù)質(zhì)量風(fēng)險(xiǎn)評估,(十一)機(jī)構(gòu)內(nèi)部數(shù)據(jù)質(zhì)量提升方案,(十二)改進(jìn)數(shù)據(jù)質(zhì)量測試方案,(十三)實(shí)施數(shù)據(jù)質(zhì)量改進(jìn)方案,等等。9.5.3.2機(jī)構(gòu)內(nèi)部數(shù)據(jù)質(zhì)量體系驗(yàn)證同樣,為確保各機(jī)構(gòu)向全局提供的數(shù)據(jù)是優(yōu)質(zhì)合格的,還需要一套質(zhì)量體系來保證上述管理項(xiàng)的落實(shí),并能向伙伴機(jī)構(gòu)提供驗(yàn)證。相關(guān)工作具體如下:①建立數(shù)據(jù)質(zhì)量驗(yàn)證目標(biāo);(二)提升本機(jī)構(gòu)對參與共享/交換的數(shù)據(jù)規(guī)范化水平、質(zhì)量可測性與可控性的貢獻(xiàn);(三)建立糾正機(jī)制,改進(jìn)共享數(shù)據(jù)的質(zhì)量測評能力,促進(jìn)機(jī)構(gòu)間數(shù)據(jù)質(zhì)量管理方法和體系化的提升;(四)增進(jìn)共享與交換型業(yè)務(wù)對數(shù)據(jù)質(zhì)量需求、質(zhì)量模型的理解,認(rèn)識(shí)到本系統(tǒng)、本資源在共享前的局限性、質(zhì)量完善與提升的必要性;(五)確定質(zhì)量驗(yàn)證范圍和方法,相關(guān)階段與驗(yàn)證體統(tǒng)與支持體系;(六)明確本機(jī)構(gòu)的數(shù)據(jù)主管部門中,數(shù)據(jù)管理人員、系統(tǒng)運(yùn)管團(tuán)隊(duì)、數(shù)據(jù)主管、高層管理等對數(shù)據(jù)質(zhì)量的職責(zé);(七)明確數(shù)據(jù)審計(jì)部門、各驗(yàn)證職能部門與人員等在數(shù)據(jù)標(biāo)準(zhǔn)化與質(zhì)量管理工作的職責(zé);(八)明確數(shù)據(jù)標(biāo)準(zhǔn)化與質(zhì)量管理的方法與驗(yàn)證范圍、方法和階段;(九)明確數(shù)據(jù)標(biāo)準(zhǔn)化與質(zhì)量驗(yàn)證的結(jié)果與動(dòng)態(tài)報(bào)告模式。9.5.3.3跨機(jī)構(gòu)數(shù)據(jù)質(zhì)量控制跨系統(tǒng)數(shù)據(jù)質(zhì)量主要是其整合、共享與交換中的數(shù)據(jù)質(zhì)量,它不是各來源機(jī)構(gòu)的資源簡單匯集,而往往是在第三方跨系統(tǒng)數(shù)據(jù)整合平臺(tái)中再度加工處理,產(chǎn)生資源價(jià)值轉(zhuǎn)移與提升中的質(zhì)量。故其數(shù)據(jù)質(zhì)量也不是各來源機(jī)構(gòu)數(shù)據(jù)質(zhì)量要求的重疊累加,還要針對資源再加工與裝配后的質(zhì)量。這些新增的數(shù)據(jù)質(zhì)量要求主要如下。1)不合格數(shù)據(jù)定義

(1)確定資源加工與再加工中不合格數(shù)據(jù)的標(biāo)準(zhǔn)。(2)確定整合共享/交換前的數(shù)據(jù)抽樣檢測方案。

2)定義數(shù)據(jù)采集模型(1)定義待整合的數(shù)據(jù)模型。(2)定義跨系統(tǒng)元數(shù)據(jù)采集與比對模型。(3)定義跨系統(tǒng)數(shù)據(jù)元的收集與比對模板。3)數(shù)據(jù)標(biāo)準(zhǔn)化處理(1)分析共享系統(tǒng)中的元數(shù)據(jù)采集程序。(2)梳理待整合系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn),考察各機(jī)構(gòu)的內(nèi)部標(biāo)準(zhǔn)是否滿足全局整合的需求。(3)對非標(biāo)準(zhǔn)元數(shù)據(jù)、數(shù)據(jù)進(jìn)行比對、補(bǔ)充、轉(zhuǎn)換等。

4)數(shù)據(jù)清洗(1)定義面向整合共享與交換的全局?jǐn)?shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。(2)對非標(biāo)準(zhǔn)數(shù)據(jù)實(shí)施結(jié)構(gòu)與格式轉(zhuǎn)換。(3)按質(zhì)量標(biāo)準(zhǔn)、各機(jī)構(gòu)業(yè)務(wù)需求整合而成的新業(yè)務(wù)標(biāo)準(zhǔn)進(jìn)行清洗、重構(gòu)、增補(bǔ),糾正可能的數(shù)據(jù)表達(dá),內(nèi)容、格式與編碼錯(cuò)誤等。5)數(shù)據(jù)質(zhì)量分析

(1)查詢并解決數(shù)據(jù)重復(fù)、不一致、元數(shù)據(jù)項(xiàng)缺失、不符合業(yè)務(wù)邏輯、異常數(shù)據(jù)、極端數(shù)據(jù)、孤立數(shù)據(jù)等問題。

(2)對參與整合共享的數(shù)據(jù)多機(jī)構(gòu)分布情況、各家的數(shù)據(jù)貢獻(xiàn)度、共享度、集成度、加工度、標(biāo)準(zhǔn)化程度、質(zhì)量控制水平等進(jìn)行定量與定性分析。

6)建立針對數(shù)據(jù)共享與交換的質(zhì)量驗(yàn)證

(1)將整合共享數(shù)據(jù)(包含元數(shù)據(jù)、數(shù)據(jù)元素、代碼、標(biāo)識(shí)等等)劃分為子樣本集,建立提取、測試、驗(yàn)證的三套機(jī)制。

(2)檢查抽取數(shù)據(jù)樣本質(zhì)量的代表性、充分性等。

(3)針對數(shù)據(jù)準(zhǔn)確性、完整性、規(guī)范性等質(zhì)量指標(biāo)進(jìn)行單因子或多因子分析評估,決定數(shù)據(jù)是否達(dá)到整合共享、交換與互操作的水平。9.5.3.4.6跨機(jī)構(gòu)共享交換的數(shù)據(jù)質(zhì)量驗(yàn)證

如前所述,參與跨機(jī)構(gòu)數(shù)據(jù)整合各機(jī)構(gòu)中任何一方的數(shù)據(jù)如有質(zhì)量缺陷的話,這些缺陷不可能隨共享與交換而消失,反而會(huì)隨共享將缺陷傳導(dǎo)到整合后的系統(tǒng)以及關(guān)聯(lián)業(yè)務(wù)中。因此,建立數(shù)據(jù)共享與交換后的跨系統(tǒng)質(zhì)量驗(yàn)證就顯十分必要,它們涉及如下內(nèi)容。

(1)跨系統(tǒng)間數(shù)據(jù)質(zhì)量需求確認(rèn)與管理體制與過程驗(yàn)證。(2)共享/交換中質(zhì)量模型驗(yàn)證。

(3)參與各方的數(shù)據(jù)質(zhì)量特性、測量參數(shù)與管理架構(gòu)驗(yàn)證。

(4)交換建模中質(zhì)量水平驗(yàn)證。

(5)跨機(jī)構(gòu)數(shù)據(jù)質(zhì)量交互驗(yàn)證,核心內(nèi)容為:數(shù)據(jù)準(zhǔn)確性驗(yàn)證;數(shù)據(jù)一致性驗(yàn)證;數(shù)據(jù)完整性驗(yàn)證;數(shù)據(jù)格式驗(yàn)證;數(shù)據(jù)缺陷處理驗(yàn)證等。

(6)驗(yàn)證與交叉驗(yàn)證間的相互確認(rèn)與處理。9.6政務(wù)大數(shù)據(jù)質(zhì)量管理簡述人類已進(jìn)入大數(shù)據(jù)時(shí)代,率先涉及該領(lǐng)域是電子政務(wù)。眾所周知,政府均擁有全社會(huì)數(shù)量最大、門類最多且權(quán)威可信的信息資源,這也使政務(wù)數(shù)據(jù)質(zhì)量管理面臨大數(shù)據(jù)的挑戰(zhàn)。它將對數(shù)據(jù)質(zhì)量管理理念、方法和手段等都產(chǎn)生一系列影響。9.6.1傳統(tǒng)環(huán)境與大數(shù)據(jù)環(huán)境的需求差異傳統(tǒng)環(huán)境中,數(shù)據(jù)質(zhì)量管理的模式與環(huán)境特點(diǎn)主要為:(1)絕大多數(shù)數(shù)據(jù)資源均來自各機(jī)構(gòu)內(nèi)部。(2)管理者重點(diǎn)關(guān)注結(jié)構(gòu)化數(shù)據(jù)。(3)用戶訪問與處理的數(shù)據(jù)多形成于過去。(4)數(shù)據(jù)質(zhì)量管理的目標(biāo)是尋求每條數(shù)據(jù)記錄的正確無誤。(5)良好的數(shù)據(jù)資源需要長年積累建設(shè)。(6)各機(jī)構(gòu)主要關(guān)注其現(xiàn)存數(shù)據(jù)資源。(7)業(yè)務(wù)用戶需要借助信息技術(shù)來分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論