大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究_第1頁(yè)
大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究_第2頁(yè)
大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究_第3頁(yè)
大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究_第4頁(yè)
大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究姓 名:張威威單位:江蘇東??h審計(jì)局副局長(zhǎng)電 話(huà)郵 編:222000大數(shù)據(jù)環(huán)境下的審計(jì)關(guān)聯(lián)數(shù)據(jù)研究基于數(shù)據(jù)挖掘的視角【摘要】大數(shù)據(jù)關(guān)聯(lián)審計(jì)是新型信息化時(shí)代的產(chǎn)物,也是數(shù)據(jù)創(chuàng)新驅(qū)動(dòng)的 必然要求。解決大數(shù)據(jù)環(huán)境下的數(shù)據(jù)關(guān)聯(lián)問(wèn)題是適應(yīng)審計(jì)全覆蓋、促進(jìn)審計(jì)方式 轉(zhuǎn)變、提高關(guān)系性證據(jù)證明的有效前提。 為此,本文從數(shù)據(jù)挖掘的視角提出了審 計(jì)數(shù)據(jù)關(guān)聯(lián)規(guī)則的思路,數(shù)據(jù)的關(guān)聯(lián)模式以及審計(jì)關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用的五個(gè)挑 戰(zhàn)。【關(guān)鍵詞】大數(shù)據(jù);關(guān)聯(lián)數(shù)據(jù);數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則繼物流網(wǎng)、數(shù)字城市、智慧城市之后,代表信息化的另一個(gè)熱詞“大數(shù)據(jù)” 已悄然登上歷史舞臺(tái)。作為一項(xiàng)

2、顛覆性的技術(shù)革命,大數(shù)據(jù)正在重新定義社會(huì)管 理與國(guó)家戰(zhàn)略決策:聯(lián)合國(guó)于 2009年制定了“數(shù)據(jù)脈動(dòng)”計(jì)劃,英國(guó)于2010年發(fā)起了“數(shù)據(jù)權(quán)”運(yùn)動(dòng),美國(guó)奧巴馬政府于 2012年提出了國(guó)家層面的“大數(shù) 據(jù)戰(zhàn)略”等,我國(guó)政府則在2014年9月由國(guó)務(wù)院發(fā)布了促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng) 綱要,在頂層設(shè)計(jì)層面系統(tǒng)部署了大數(shù)據(jù)發(fā)展以及大數(shù)據(jù)在各行業(yè)以及國(guó)家層 面上的創(chuàng)新應(yīng)用。由大數(shù)據(jù)驅(qū)動(dòng)的管理創(chuàng)新和技術(shù)變革,不僅在中微觀上蘊(yùn)藏巨大的商業(yè)價(jià) 值、科學(xué)研究?jī)r(jià)值和行業(yè)分析價(jià)值,也在宏觀上具有社會(huì)管理與公共服務(wù)價(jià)值。 國(guó)家審計(jì)作為國(guó)家治理體系的重要組成部分, 在經(jīng)濟(jì)運(yùn)行中充當(dāng)“保護(hù)神”角色, 理應(yīng)在互聯(lián)網(wǎng)的信息化時(shí)代探索出一

3、條“數(shù)據(jù)審計(jì)”之路。目前計(jì)算機(jī)技術(shù)在審 計(jì)軟件系統(tǒng)中僅僅作為數(shù)據(jù)處理功能的輔助性后臺(tái)支持,缺乏數(shù)據(jù)整體技術(shù)的系 統(tǒng)性轉(zhuǎn)化和應(yīng)用支撐,這主要由于審計(jì)處理過(guò)程中產(chǎn)生的數(shù)據(jù)與源數(shù)據(jù)庫(kù)之間缺 乏有效的關(guān)聯(lián),導(dǎo)致審計(jì)數(shù)據(jù)交互性較弱且數(shù)據(jù)的可重復(fù)利用程度較低,這是國(guó)家審計(jì)在大數(shù)據(jù)時(shí)代需要面對(duì)和解決的重要問(wèn)題。一、大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)的基本涵義(一)大數(shù)據(jù)1. 概念和特征大數(shù)據(jù)是一個(gè)開(kāi)放性概念,它蘊(yùn)含信息但不解釋信息,但大數(shù)據(jù)會(huì)使人們從 機(jī)械的計(jì)算機(jī)和運(yùn)算規(guī)則中解放出來(lái),從而認(rèn)識(shí)更多的事物,發(fā)現(xiàn)更多的規(guī)律, 獲得更多的知識(shí)和洞察力。目前很多專(zhuān)家學(xué)者、咨詢(xún)機(jī)構(gòu)根據(jù)自身學(xué)科特點(diǎn)、分 析角度和學(xué)識(shí)態(tài)度給予了相關(guān)定義,

4、綜合起來(lái)主要有兩種觀點(diǎn):一是數(shù)據(jù)庫(kù)觀點(diǎn)(資源角度)。如美國(guó)咨詢(xún)機(jī)構(gòu)麥肯錫公司在大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域報(bào)告中指出,大數(shù)據(jù)是無(wú)法在一定時(shí)間內(nèi) 使用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行獲取、管理和處理的數(shù)據(jù)集合。Small等人認(rèn)為,“大數(shù)據(jù)”是指?jìng)鹘y(tǒng)的數(shù)據(jù)庫(kù)技術(shù)(關(guān)系數(shù)據(jù)庫(kù)系統(tǒng))無(wú)法很好地提 供管理工具的海量、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)集2 o二是技術(shù)性觀點(diǎn)(工具角度)。如互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)指出,“大數(shù)據(jù)” 是為了更經(jīng)濟(jì)、更有效地從高頻率、大容量、不同結(jié)構(gòu)和類(lèi)型的數(shù)據(jù)中獲取價(jià)值 而設(shè)計(jì)的新一代架構(gòu)和技術(shù),用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù), 并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。

5、維基百科則指出,大數(shù)據(jù)是所涉及的資料規(guī) 模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并 整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊 。無(wú)論是名詞性質(zhì)的數(shù)據(jù)庫(kù)觀點(diǎn),還是形容詞性質(zhì)的技術(shù)性觀點(diǎn),事實(shí)上大數(shù) 據(jù)的價(jià)值就在于數(shù)據(jù)本身的有用性。相較于傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)一般被人們概況為 這樣五種特征,即大量性(volume)、高速性(velocity )、多樣性(variety )、 不確定性(veracity )和價(jià)值性(value )。其中,前兩種特征隨著計(jì)算機(jī)硬件 技術(shù)的不斷擴(kuò)展會(huì)變得相對(duì)容易處理;后三種特征則因?yàn)榉墙Y(jié)構(gòu)化數(shù)據(jù)的多樣 性、不確定性以及數(shù)據(jù)質(zhì)量追求等原因, 給現(xiàn)代審

6、計(jì)帶來(lái)的挑戰(zhàn)愈來(lái)愈大。 特別 在審計(jì)全覆蓋要求下,結(jié)合云計(jì)算技術(shù),大數(shù)據(jù)在審計(jì)方式、審計(jì)抽樣、審計(jì)證 據(jù)搜集、審計(jì)數(shù)據(jù)分析、總體審計(jì)模式的應(yīng)用、審計(jì)報(bào)告模式及審計(jì)成果應(yīng)用等 方面,將不斷影響審計(jì)技術(shù)和方法的發(fā)展 (秦榮生,2014)。2. 大數(shù)據(jù)審計(jì)分析理念的轉(zhuǎn)變大數(shù)據(jù)改變了傳統(tǒng)的數(shù)據(jù)采集、存儲(chǔ)和應(yīng)用技術(shù),其精髓在于促使人們?cè)诓?集、處理和使用數(shù)據(jù)時(shí)思維的轉(zhuǎn)變,這些轉(zhuǎn)變將改變我們理解和研究社會(huì)經(jīng)濟(jì)現(xiàn) 象的技術(shù)和方法。牛津大學(xué)教授維克托(2012)在其合著的大數(shù)據(jù)時(shí)代一書(shū) 中指出,大數(shù)據(jù)的發(fā)展核心動(dòng)力來(lái)自于人類(lèi)測(cè)量、記錄和分析世界的渴望,信息技術(shù)變革的重點(diǎn)在于“ T” (技術(shù))而不是“ 1”(信

7、息),人們應(yīng)該更多的關(guān)注 于某項(xiàng)技術(shù)的思維轉(zhuǎn)變。傳統(tǒng)的審計(jì)分析思想應(yīng)做三大轉(zhuǎn)變: 一是轉(zhuǎn)變抽樣審計(jì) 思想,要全體不要抽樣,即要采集、分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠 少量樣本來(lái)分析總體;二是轉(zhuǎn)變審計(jì)數(shù)據(jù)利用的思想,即要效率不要精確度,審 計(jì)師要欣于接受數(shù)據(jù)的蕪雜多樣,而不過(guò)分追求數(shù)據(jù)的精確度,只要在總體上把 握事物的發(fā)展趨勢(shì)即可;三是不再深入探求事物的直接因果關(guān)系,轉(zhuǎn)而關(guān)注和利用事物的相關(guān)關(guān)系,通過(guò)分析和厘清事物之間的相關(guān)關(guān)系, 審計(jì)師可以找到事物 的現(xiàn)狀和未來(lái)發(fā)展趨勢(shì)。(二)關(guān)聯(lián)數(shù)據(jù)的特點(diǎn)和分類(lèi)1. 關(guān)聯(lián)數(shù)據(jù)的特點(diǎn)關(guān)聯(lián)數(shù)據(jù)是一種推薦的最佳實(shí)踐,用來(lái)在語(yǔ)義網(wǎng)1中使用URI和RDF發(fā)布、

8、分享、連接各類(lèi)數(shù)據(jù)、信息和知識(shí),亦即互聯(lián)網(wǎng)上發(fā)布和互聯(lián)結(jié)構(gòu)化數(shù)據(jù)。萬(wàn)維 網(wǎng)之父、美國(guó)麻省理工學(xué)院教授伯納斯.李于2006年提出“數(shù)據(jù)網(wǎng)絡(luò)”思想,他 認(rèn)為數(shù)據(jù)網(wǎng)絡(luò)的核心和關(guān)鍵就是關(guān)聯(lián)數(shù)據(jù),且數(shù)據(jù)內(nèi)在的價(jià)值和效用將隨著其鏈 接到其他數(shù)據(jù)的增多而大大增加。簡(jiǎn)而言之,數(shù)據(jù)之間的關(guān)聯(lián)越是豐富,數(shù)據(jù) 的價(jià)值越大。由于互聯(lián)網(wǎng)上充斥著大量不同標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),因此如何將這些數(shù)據(jù)轉(zhuǎn)為己用變得尤為重要。一般而言,處于大數(shù)據(jù)、互聯(lián)網(wǎng)體系下的關(guān) 聯(lián)數(shù)據(jù)具有一致性、相關(guān)性、可靠性的特點(diǎn),通過(guò)語(yǔ)義技術(shù)和關(guān)聯(lián)技術(shù)將不同類(lèi) 型的數(shù)據(jù)轉(zhuǎn)化為使用者需求的數(shù)據(jù), 如國(guó)內(nèi)電商淘寶公司、金融業(yè)的四大國(guó)有銀 行、騰訊公司、

9、各類(lèi)搜索引擎,以及國(guó)外的零售業(yè)巨頭沃爾瑪、百思買(mǎi)、BBC新聞機(jī)構(gòu)等,都試圖在大數(shù)據(jù)中將客戶(hù)分為不同類(lèi)型, 并通過(guò)客戶(hù)端方式獲取客戶(hù) 的基本資料和搜索習(xí)慣。一致性是關(guān)聯(lián)數(shù)據(jù)的首要要求,也是關(guān)聯(lián)的重要保證; 相關(guān)性和可靠性則決定了獲取數(shù)據(jù)的使用目的,只有質(zhì)量可靠、性質(zhì)相關(guān)的數(shù)據(jù)才能通過(guò)特殊的關(guān)聯(lián)技術(shù)取得數(shù)據(jù)關(guān)聯(lián)。2. 關(guān)聯(lián)數(shù)據(jù)的分類(lèi)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用領(lǐng)域較為廣泛。就政府審計(jì)而言,關(guān)聯(lián)數(shù)據(jù)的應(yīng)用目前僅限語(yǔ)義網(wǎng):因特網(wǎng)同義概念,由伯納斯.李(Tim Bemers-Lee)1998年首先提出,是現(xiàn)有 Web體系的一個(gè)延伸 RDF: 種資源描述框架,使用 URI標(biāo)識(shí)符來(lái)標(biāo)識(shí)任何事物,并通過(guò)屬性和屬性值來(lái)描述W

10、eb資源。于系統(tǒng)內(nèi)部,而對(duì)系統(tǒng)外部的數(shù)據(jù)關(guān)聯(lián)則較為薄弱。從數(shù)據(jù)庫(kù)觀點(diǎn)來(lái)看,由于數(shù)據(jù)口徑、數(shù)據(jù)類(lèi)型、數(shù)據(jù)狀態(tài)等差異,審計(jì)師采集的數(shù)據(jù)并沒(méi)有實(shí)現(xiàn)數(shù)據(jù)完全關(guān) 聯(lián),這就導(dǎo)致數(shù)據(jù)的價(jià)值無(wú)法充分顯現(xiàn),甚至數(shù)據(jù)所反映的“事實(shí)”是錯(cuò)誤的。 這主要由于審計(jì)師對(duì)于數(shù)據(jù)關(guān)聯(lián)的分類(lèi)還不夠清晰, 從而導(dǎo)致數(shù)據(jù)分析和處理缺 乏一致性,很顯然這與大數(shù)據(jù)環(huán)境下對(duì)數(shù)據(jù)的關(guān)聯(lián)性要求不甚相符。對(duì)于當(dāng)前政府審計(jì)數(shù)據(jù)集中和分析工作,從數(shù)據(jù)來(lái)源來(lái)分,可以將審計(jì)關(guān)聯(lián) 數(shù)據(jù)分為系統(tǒng)內(nèi)和系統(tǒng)外,其中系統(tǒng)外數(shù)據(jù)指的是處于被審計(jì)單位信息系統(tǒng)外, 但又與審計(jì)目標(biāo)相關(guān)的、具有內(nèi)在聯(lián)系的外部數(shù)據(jù)。從財(cái)政資金的內(nèi)容來(lái)看,劉 家義(2014)將關(guān)聯(lián)數(shù)據(jù)分為

11、五個(gè)方面3: 是縱向關(guān)聯(lián),即從中央財(cái)政到省市 縣乃至每個(gè)鄉(xiāng)鎮(zhèn)的資金關(guān)聯(lián),以及從部門(mén)到項(xiàng)目具體執(zhí)行單位的資金關(guān)聯(lián); 二是 橫向關(guān)聯(lián),即從市財(cái)政、市發(fā)改委到一級(jí)、二級(jí)預(yù)算單位的各種專(zhuān)項(xiàng)資金關(guān)聯(lián); 三是實(shí)體關(guān)聯(lián),即財(cái)政、金融和企業(yè)三方面的數(shù)據(jù)關(guān)聯(lián);四是行業(yè)關(guān)聯(lián),即財(cái)政 與其他多部門(mén)、多行業(yè)的數(shù)據(jù)關(guān)聯(lián);五是綜合關(guān)聯(lián),即財(cái)政數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)、宏 觀經(jīng)濟(jì)數(shù)據(jù)的關(guān)聯(lián)。無(wú)論從哪種角度來(lái)分,審計(jì)師都應(yīng)該具備足夠的能力解決好 不同來(lái)源、不同類(lèi)型、不同形式的數(shù)據(jù)之間的關(guān)聯(lián)。二、基于數(shù)據(jù)挖掘技術(shù)的大數(shù)據(jù)審計(jì)關(guān)聯(lián)思路在大數(shù)據(jù)環(huán)境中,由于審計(jì)數(shù)據(jù)牽涉到的部門(mén)多、數(shù)量大且不確定性較高, 數(shù)據(jù)之間的關(guān)聯(lián)性顯得尤為重要,審計(jì)師必

12、須采取某種技術(shù)手段、有效利用采集 的數(shù)據(jù)才能達(dá)到最初的審計(jì)目標(biāo)。 本文認(rèn)為,數(shù)據(jù)挖掘技術(shù)提供了建立數(shù)據(jù)關(guān)聯(lián) 的思路,該技術(shù)也被稱(chēng)為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Kn owledge Discovery inDatabase,簡(jiǎn)稱(chēng)KDD,就其本質(zhì)而言,數(shù)據(jù)挖掘僅僅是數(shù)據(jù)處理的中間過(guò)程, 它能從大型的數(shù)據(jù)庫(kù)和數(shù)據(jù)集合中發(fā)現(xiàn)比較有價(jià)值和有意義的數(shù)據(jù),并通過(guò)既定定義或特定規(guī)則,將數(shù)據(jù)按照審計(jì)師的要求生成關(guān)聯(lián)數(shù)據(jù), 從而達(dá)到最終審計(jì)目 的。(一)大數(shù)據(jù)關(guān)聯(lián)規(guī)則的挖掘數(shù)據(jù)的關(guān)聯(lián)規(guī)則是指數(shù)據(jù)之間普遍存在的空間位置和時(shí)間序列的關(guān)聯(lián)抽象, 而關(guān)聯(lián)規(guī)則的挖掘就是指從海量數(shù)據(jù)中項(xiàng)集之間發(fā)現(xiàn)有趣的關(guān)聯(lián)或相關(guān),從而達(dá)到認(rèn)識(shí)事物客

13、觀規(guī)律的技術(shù)方法。審計(jì)師必須在無(wú)序、無(wú)對(duì)應(yīng)或無(wú)邏輯的數(shù)據(jù) 中挖掘出數(shù)據(jù)的關(guān)聯(lián)規(guī)則,且規(guī)則必須與審計(jì)目標(biāo)呈現(xiàn)一定的關(guān)聯(lián)性, 才能更好 為后續(xù)審計(jì)分析提供幫助。審計(jì)實(shí)踐中發(fā)現(xiàn),關(guān)聯(lián)性更強(qiáng)的關(guān)聯(lián)數(shù)據(jù),其證明力 更強(qiáng),得出的審計(jì)結(jié)論更為精確,反之亦然。因此,審計(jì)師的目標(biāo)就是能夠?qū)で?數(shù)據(jù)之間更為針對(duì)性的關(guān)聯(lián)關(guān)系,從關(guān)聯(lián)數(shù)據(jù)中挖掘出符合審計(jì)目標(biāo)要求的屬 性,進(jìn)一步為審計(jì)取證提供強(qiáng)有力的支持。 一般而言,數(shù)據(jù)關(guān)聯(lián)規(guī)則的挖掘分為 四個(gè)步驟,即確定業(yè)務(wù)目標(biāo)(對(duì)象)、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá),如下圖所示。確定業(yè)務(wù)目標(biāo)數(shù)據(jù)準(zhǔn)備數(shù)據(jù)挖掘結(jié)果表達(dá)明確目標(biāo) 規(guī)則清晰->數(shù)據(jù)搜集數(shù)據(jù)整理多維數(shù)據(jù) 既定模型可視化

14、關(guān)聯(lián)規(guī)則 結(jié)論圖1數(shù)據(jù)關(guān)聯(lián)規(guī)則的挖掘過(guò)程中央政府門(mén)戶(hù)網(wǎng)站:51. 確定業(yè)務(wù)目標(biāo)。審計(jì)對(duì)象的性質(zhì)是審計(jì)師界定數(shù)據(jù)挖掘規(guī)則的重要著手點(diǎn),因此審計(jì)師在執(zhí)行具體審計(jì)方案的時(shí)候就必須理解審計(jì)對(duì)象的性質(zhì),這是大數(shù)據(jù)審計(jì)必須關(guān)注的重點(diǎn)。清晰地定義挖掘目標(biāo),對(duì)于挖掘規(guī)則目的的明確具有 良好的指導(dǎo)意義,這是由數(shù)據(jù)挖掘技術(shù)的本質(zhì)所決定的。 同時(shí),業(yè)務(wù)目標(biāo)的確立 也為數(shù)據(jù)規(guī)則算法的明確以及規(guī)則的生成給予結(jié)果上的保障。2. 數(shù)據(jù)準(zhǔn)備。大數(shù)據(jù)審計(jì)的難點(diǎn)就在于數(shù)據(jù)的搜集和整理。就該步驟而言, 數(shù)據(jù)準(zhǔn)備工作是做好數(shù)據(jù)挖掘的基礎(chǔ), 通常包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇 和數(shù)據(jù)變換四個(gè)方面。一是數(shù)據(jù)清理,面對(duì)內(nèi)部和外部不同信息

15、源中數(shù)據(jù)呈現(xiàn)不 同規(guī)范、不相一致甚至冗余的特點(diǎn),必須要消除噪音數(shù)據(jù),確保基礎(chǔ)分析數(shù)據(jù)的 統(tǒng)一規(guī)范;二是數(shù)據(jù)集成,將剔除冗余、消除噪音后的數(shù)據(jù)按照挖掘規(guī)則的要求 加以集成,形成結(jié)構(gòu)統(tǒng)一、相對(duì)完備的數(shù)據(jù)集;三是數(shù)據(jù)選擇,根據(jù)審計(jì)目標(biāo)要求,選擇與業(yè)務(wù)對(duì)象相關(guān)的數(shù)據(jù)集,這在內(nèi)容上決定了后續(xù)的數(shù)據(jù)挖掘質(zhì)量;四是數(shù)據(jù)變換,在確保不損失完整信息表示的前提下, 將數(shù)據(jù)轉(zhuǎn)化成基于挖掘算法 的審計(jì)分析模型。3. 數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘。審計(jì)師將轉(zhuǎn)換的數(shù)據(jù)按照既定規(guī)則和算法進(jìn)行挖掘,得出目標(biāo)分析結(jié)論,該過(guò)程是數(shù)據(jù)挖掘算法執(zhí)行的核心步驟。 為確保各個(gè)信息源 的數(shù)據(jù)得到關(guān)聯(lián),首先要確保數(shù)據(jù)庫(kù)后臺(tái)的數(shù)據(jù)是有關(guān)同一審計(jì)目標(biāo)的信息

16、,只有相關(guān)的數(shù)據(jù)融合才能確保數(shù)據(jù)被審計(jì)師整體利用。審計(jì)目標(biāo)信息的融合是將多數(shù)據(jù)庫(kù)信息進(jìn)行的有效處理,從而得到比單一信息源更準(zhǔn)確的審計(jì)結(jié)論, 為此受 數(shù)據(jù)規(guī)則的影響,規(guī)則算法影響的適用性和準(zhǔn)確性將得到更充分的體現(xiàn)。4. 結(jié)果表達(dá)。通過(guò)關(guān)聯(lián)算法規(guī)則執(zhí)行后的結(jié)果即為審計(jì)師所要實(shí)現(xiàn)的結(jié)果表 達(dá),若數(shù)據(jù)關(guān)聯(lián)規(guī)則不易表達(dá),則可以通過(guò)可視化的技術(shù)方法, 將結(jié)果轉(zhuǎn)化為審 計(jì)師的意思表示。這樣得出的數(shù)據(jù)挖掘結(jié)果,基本上將隱藏在無(wú)規(guī)則數(shù)據(jù)中的信 息以有價(jià)值的、新穎的且有潛在效用的模型及結(jié)構(gòu)呈現(xiàn)出來(lái)。(二)大數(shù)據(jù)審計(jì)關(guān)聯(lián)規(guī)則挖掘的代表類(lèi)型數(shù)據(jù)關(guān)聯(lián)規(guī)則的挖掘是關(guān)聯(lián)數(shù)據(jù)建立的基礎(chǔ), 因此必須主觀上認(rèn)識(shí)到數(shù)據(jù)之 間存在的

17、客觀規(guī)則,利用合理有效的算法計(jì)算規(guī)則,才能更準(zhǔn)確把握關(guān)聯(lián)數(shù)據(jù)在 審計(jì)中發(fā)揮的作用。審計(jì)實(shí)踐中,為實(shí)現(xiàn)審計(jì)目標(biāo),審計(jì)師一般先通過(guò)采集的數(shù) 據(jù)提取與審計(jì)目標(biāo)相關(guān)聯(lián)的關(guān)聯(lián)因子,如數(shù)據(jù)特征、身份特征、地理位置、目標(biāo) 群特征等,再利用合理的測(cè)度來(lái)實(shí)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)確認(rèn)。事實(shí)上,這些關(guān)聯(lián)因子取決于審計(jì)師主觀上對(duì)于審計(jì)結(jié)論的預(yù)期,審計(jì)師往往通過(guò)關(guān)聯(lián)數(shù)據(jù)得出預(yù)期結(jié) 論,從而證實(shí)自己最初的審計(jì)判斷。 在大數(shù)據(jù)時(shí)代,海量的數(shù)據(jù)為關(guān)聯(lián)因子的應(yīng) 用提供了豐厚的土壤,而審計(jì)師通過(guò)數(shù)據(jù)挖掘技術(shù)也拓展了更多的關(guān)聯(lián)規(guī)則,進(jìn)一步將數(shù)據(jù)和審計(jì)目標(biāo)緊密結(jié)合起來(lái)。這種通過(guò)關(guān)聯(lián)因子挖掘的關(guān)聯(lián)規(guī)則在審計(jì) 應(yīng)用上得到了眾多的學(xué)者關(guān)注,也產(chǎn)生

18、了很多具有代表性的關(guān)聯(lián)規(guī)則類(lèi)型。1. 量化屬性關(guān)聯(lián)規(guī)則。按照關(guān)聯(lián)規(guī)則中關(guān)聯(lián)因子的類(lèi)別不同, 關(guān)聯(lián)規(guī)則一般 分為布爾型和數(shù)量型。前者是離散的、種類(lèi)化的,顯示關(guān)聯(lián)因子之間的關(guān)系,常 用于事務(wù)性數(shù)據(jù)庫(kù),如購(gòu)物籃分析技術(shù)4;后者則對(duì)數(shù)值型字段進(jìn)行處理,是數(shù) 量關(guān)聯(lián)規(guī)則的應(yīng)用形態(tài),研究的是“屬性-值”的關(guān)系。數(shù)量關(guān)聯(lián)規(guī)則通過(guò)動(dòng)態(tài) 分割,將審計(jì)關(guān)聯(lián)因子量化值劃分為若干區(qū)間, 再者或直接通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行 相關(guān)處理,從而得出“屬性-值”的關(guān)系。對(duì)于此類(lèi)關(guān)聯(lián)規(guī)則,如何有效的處理 屬性及其值是解決該類(lèi)問(wèn)題的重點(diǎn)和關(guān)鍵,如審計(jì)中經(jīng)常用到的數(shù)值屬性“收 入”、“年齡”、“固定資產(chǎn)”等。購(gòu)物籃分析:通過(guò)發(fā)現(xiàn)顧客放入其

19、購(gòu)物籃中不同商品之間的聯(lián)系,分析顧客的購(gòu)買(mǎi)習(xí)慣2. 限制關(guān)聯(lián)規(guī)則。限制型關(guān)聯(lián)規(guī)則指的是審計(jì)師通過(guò)賦予關(guān)聯(lián)因子一定的約束條件來(lái)實(shí)現(xiàn)審計(jì)需求,如審計(jì)師指定的數(shù)據(jù)類(lèi)型,數(shù)量上限或下限條件,自定 義的SQL語(yǔ)句等。此類(lèi)限制關(guān)聯(lián)規(guī)則某種意義上是審計(jì)師根據(jù)自身需要和興趣而 量身定做的規(guī)則,不僅可以通過(guò)對(duì)數(shù)據(jù)庫(kù)的預(yù)加工而提高審計(jì)效率,也可以通過(guò)完善軟件集成模塊提高算法精確性。3. 因果關(guān)聯(lián)規(guī)則。因果關(guān)聯(lián)是KDD較為重要的一種知識(shí)類(lèi)型,幾乎在任何有 邏輯性的領(lǐng)域都會(huì)有應(yīng)用關(guān)系。審計(jì)師往往會(huì)假設(shè)事件A和事件B之間存在一定 的因果關(guān)系,然后通過(guò)推理機(jī)制、運(yùn)用數(shù)據(jù)分析技術(shù)將二者進(jìn)行關(guān)聯(lián)。 在應(yīng)用因 果關(guān)聯(lián)規(guī)則的前提

20、也是最需要把握的是: 審計(jì)師需要對(duì)事件A和事件B之間的邏 輯關(guān)系進(jìn)行初步評(píng)估,然后在利用認(rèn)證邏輯的分析辦法將相應(yīng)數(shù)據(jù)進(jìn)行“對(duì)號(hào)入 座”。4. 多層關(guān)聯(lián)規(guī)則。由事件A和事件B產(chǎn)生的關(guān)聯(lián)規(guī)則一般為初級(jí)關(guān)聯(lián)規(guī)則, 這在數(shù)據(jù)較少的情況下容易實(shí)現(xiàn)。 在大數(shù)據(jù)環(huán)境下,由于數(shù)據(jù)較多,審計(jì)師可合 成的規(guī)則較為寬泛,一些事件不僅僅與另外單項(xiàng)事件產(chǎn)生關(guān)聯(lián), 還會(huì)與其他事件 產(chǎn)生關(guān)聯(lián),這樣呈現(xiàn)多層的規(guī)則體系為審計(jì)師提供了層層遞進(jìn)的多層分析維度。 如分析購(gòu)買(mǎi)家用轎車(chē)時(shí),審計(jì)師不僅要考慮收入層次因子的影響,還要考慮年齡、 油價(jià)、家庭人數(shù)、通脹等因子。(三)大數(shù)據(jù)審計(jì)關(guān)聯(lián)規(guī)則應(yīng)用模式近年來(lái),審計(jì)署在全國(guó)范圍內(nèi)相繼統(tǒng)一組織

21、和開(kāi)展了債務(wù)審計(jì)和土地出讓金 審計(jì)工作,在社會(huì)引起強(qiáng)烈反響,這是大數(shù)據(jù)時(shí)代離我們最近的兩次全國(guó)性審計(jì), 也給國(guó)家審計(jì)人員帶來(lái)了新的思考: 一是數(shù)據(jù)獲取技術(shù),如何在海量的數(shù)據(jù)中提 取我們需要的數(shù)據(jù);二是數(shù)據(jù)分析技術(shù),如何在無(wú)關(guān)聯(lián)的數(shù)據(jù)庫(kù)中挖掘出有用的 信息從而服務(wù)于我們的審計(jì)目標(biāo)? 一般意義上, 前者可以通過(guò)建立以審計(jì)署為中 心的統(tǒng)一數(shù)據(jù)指揮運(yùn)作平臺(tái)、審計(jì)分析中心等機(jī)制實(shí)現(xiàn),后者則需要數(shù)據(jù)關(guān)聯(lián)方 法和技術(shù)的支撐。結(jié)合前文所述,基于“數(shù)值 -屬性”量化關(guān)聯(lián)規(guī)則,本文提出 了如下圖所示的審計(jì)數(shù)據(jù)關(guān)聯(lián)規(guī)則的應(yīng)用模式。審計(jì)業(yè)務(wù)目標(biāo) 引導(dǎo)數(shù)據(jù)準(zhǔn)備、搜集初步整理結(jié)果集、/ 整理A-T-對(duì)應(yīng)Apriori_P

22、N審計(jì)師的分W審計(jì)分析強(qiáng)關(guān)聯(lián)規(guī)則的挖算法優(yōu)化正負(fù)頻繁項(xiàng)集 丿析結(jié)論掘結(jié)果集L,<圖2審計(jì)數(shù)據(jù)關(guān)聯(lián)規(guī)則應(yīng)用模式1. 審計(jì)業(yè)務(wù)目標(biāo)。無(wú)論何種審計(jì)主體,在審計(jì)實(shí)踐中首先必須制定審計(jì)業(yè)務(wù) 目標(biāo),這是審計(jì)成果獲得保障的有效前提。大數(shù)據(jù)審計(jì)中,受大數(shù)據(jù)五種特征的 影響,審計(jì)師必須能夠?qū)で笈c審計(jì)目標(biāo)相一致的數(shù)據(jù)信息,否則審計(jì)的效率和效果會(huì)大打折扣。同時(shí),審計(jì)目標(biāo)也是檢驗(yàn)審計(jì)師的審計(jì)分析結(jié)論是否值得信賴(lài)的 重要標(biāo)準(zhǔn)。2. 數(shù)據(jù)準(zhǔn)備。通過(guò)統(tǒng)一的審計(jì)數(shù)字化指揮平臺(tái)、 各級(jí)審計(jì)數(shù)據(jù)中心及審計(jì)綜 合作業(yè)平臺(tái),將各級(jí)數(shù)據(jù)進(jìn)行綜合搜集和整理,初步形成整理后的有效數(shù)據(jù)集。 由于審計(jì)數(shù)據(jù)的質(zhì)量與關(guān)聯(lián)規(guī)則的挖掘結(jié)果正相關(guān)

23、,那么如何保證有效地進(jìn)行數(shù) 據(jù)搜集和整理是該模式取得效果的重要基礎(chǔ)。3. 正負(fù)頻繁集合強(qiáng)關(guān)聯(lián)規(guī)則集。頻繁項(xiàng)集的產(chǎn)生通常是由 Apriori算法得 出,在執(zhí)行該算法時(shí),設(shè)定不同最小支持度的閥值,得出正負(fù)項(xiàng)集出現(xiàn)和未出現(xiàn) 的次數(shù),并在引入數(shù)值屬性規(guī)則的關(guān)聯(lián)條件中, 輔以關(guān)聯(lián)因子的優(yōu)化,獲取強(qiáng)關(guān) 聯(lián)規(guī)則的挖掘數(shù)集。該兩項(xiàng)步驟是技術(shù)推導(dǎo)過(guò)程,需要審計(jì)師設(shè)定不同值域得出 多項(xiàng)數(shù)據(jù)集合,才能更好利用關(guān)聯(lián)因子得出挖掘規(guī)則。4. 審計(jì)師的分析結(jié)論。審計(jì)師利用挖掘的關(guān)聯(lián)規(guī)則結(jié)果,得出分析結(jié)論,從而證實(shí)最初審計(jì)設(shè)想并通過(guò)審計(jì)目標(biāo)加以驗(yàn)證。 審計(jì)分析結(jié)論的有效性取決于前 步驟中的數(shù)據(jù)準(zhǔn)備工作以及審計(jì)師自定義的規(guī)則性

24、質(zhì),只有將兩方面的工作相統(tǒng)一,才可以在程序上表明審計(jì)師已經(jīng)合理利用了關(guān)聯(lián)數(shù)據(jù)挖掘規(guī)則。三、審計(jì)關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用的挑戰(zhàn)目前,數(shù)據(jù)挖掘技術(shù)在審計(jì)領(lǐng)域的應(yīng)用和研究還不夠成熟,審計(jì)師對(duì)于關(guān)聯(lián)數(shù)據(jù)的認(rèn)識(shí)和關(guān)注尚需進(jìn)一步提高。隨著大數(shù)據(jù)、云計(jì)算等新技術(shù)的不斷發(fā)展和 完善,關(guān)聯(lián)數(shù)據(jù)挖掘技術(shù)在審計(jì)實(shí)務(wù)中將扮演越來(lái)越重要的角色。如何更有成效地將數(shù)據(jù)挖掘技術(shù)運(yùn)用到審計(jì)領(lǐng)域,是審計(jì)治理機(jī)構(gòu)以及每個(gè)審計(jì)師都必然會(huì)遇 到的新挑戰(zhàn)。(一)挑戰(zhàn)一:數(shù)據(jù)產(chǎn)生和審計(jì)實(shí)踐范式的拓展大數(shù)據(jù)環(huán)境下的數(shù)據(jù)通常是海量的, 且存儲(chǔ)的形式和結(jié)構(gòu)差異顯著,特別在 對(duì)文本、圖像和互聯(lián)網(wǎng)資源等一些異構(gòu)數(shù)據(jù)進(jìn)行挖掘時(shí)將面臨很大挑戰(zhàn),這意味著審計(jì)師在

25、執(zhí)行數(shù)據(jù)選擇和準(zhǔn)備程序中,將會(huì)遇到更高維的搜索空間和數(shù)據(jù)層 次。就目前審計(jì)師通常使用的數(shù)據(jù)并行處理和模擬數(shù)據(jù)等技術(shù)手段而言,在處理關(guān)系復(fù)雜、結(jié)構(gòu)多變的大數(shù)據(jù)時(shí),將難以獲得良好的計(jì)算效率以及較低的審計(jì)成 本。因而在實(shí)踐中,審計(jì)師需要以問(wèn)題為導(dǎo)向,將審計(jì)目標(biāo)分解細(xì)化為風(fēng)險(xiǎn)因子 屬性從而降低數(shù)據(jù)維數(shù),同時(shí)盡可能將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)利用語(yǔ)義技術(shù)轉(zhuǎn)化為 審計(jì)師所需要的數(shù)據(jù),從而進(jìn)一步提高數(shù)據(jù)關(guān)聯(lián)規(guī)則的挖掘效率和效果。(二)挑戰(zhàn)二:領(lǐng)域知識(shí)和數(shù)據(jù)挖掘系統(tǒng)的復(fù)雜性關(guān)聯(lián)數(shù)據(jù)規(guī)則的產(chǎn)生過(guò)程往往需要進(jìn)行多次的交互和反復(fù)。目前數(shù)據(jù)挖掘技術(shù)對(duì)審計(jì)關(guān)聯(lián)數(shù)據(jù)的支持性運(yùn)用程度尚不能滿(mǎn)足大數(shù)據(jù)的廣泛性要求,這主要是由于審計(jì)師

26、的知識(shí)領(lǐng)域和工作背景并不能有效理解和運(yùn)用關(guān)聯(lián)數(shù)據(jù)挖掘的基本 技術(shù)。由于數(shù)據(jù)挖掘的本身是基于對(duì)無(wú)序、無(wú)規(guī)則、復(fù)雜信息的再表達(dá),只有當(dāng) 審計(jì)數(shù)據(jù)挖掘系統(tǒng)能提供合理的解釋性功能,才能將數(shù)據(jù)規(guī)則、關(guān)系和邏輯以新 的知識(shí)表示出來(lái),審計(jì)師才能更有效利用算法生成感興趣的關(guān)聯(lián)規(guī)則。(三)挑戰(zhàn)三:數(shù)據(jù)評(píng)估和數(shù)據(jù)生命周期管理的必要性數(shù)據(jù)關(guān)聯(lián)規(guī)則的運(yùn)用基礎(chǔ)就是對(duì)現(xiàn)有數(shù)據(jù)的存儲(chǔ)和管理。隨著時(shí)間的推移, 審計(jì)師需要根據(jù)訪問(wèn)頻率對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行價(jià)值評(píng)估,一般新數(shù)據(jù)的產(chǎn)生往往也表明以前發(fā)現(xiàn)的知識(shí)信息已經(jīng)失效,這時(shí)需要對(duì)這些數(shù)據(jù)進(jìn)行動(dòng)態(tài)維護(hù)和及時(shí)更 新。數(shù)據(jù)生命周期管理是審計(jì)師依據(jù)數(shù)據(jù)在不同階段的價(jià)值實(shí)施不同的管理行 為,主要目的是以可靠、經(jīng)濟(jì)、有效的方式來(lái)實(shí)現(xiàn)數(shù)據(jù)價(jià)值最大化,從而降低審 計(jì)機(jī)構(gòu)持有信息的總體成本。從大數(shù)據(jù)的產(chǎn)生速度來(lái)看,數(shù)據(jù)生命周期管理應(yīng)提 升到數(shù)據(jù)管理的戰(zhàn)略層面,這不僅是對(duì)數(shù)據(jù)本身進(jìn)行主動(dòng)管理的過(guò)程策略, 也是 數(shù)據(jù)系統(tǒng)化管理的必然要求。(四) 挑戰(zhàn)四:數(shù)據(jù)同步和技術(shù)支持體系的匹配數(shù)據(jù)關(guān)聯(lián)規(guī)則運(yùn)用的有效性,取決于大數(shù)據(jù)生態(tài)系統(tǒng)同步性和技術(shù)體系支持 性的匹配程度。這需要審計(jì)治理機(jī)構(gòu)依據(jù)大數(shù)據(jù)的流動(dòng)特點(diǎn), 有針對(duì)性地拓展大 數(shù)據(jù)技術(shù)運(yùn)用領(lǐng)域和資源共享機(jī)制,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論