![數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用_第1頁(yè)](http://file4.renrendoc.com/view/b17ca20fd9f89014875246f085c806c5/b17ca20fd9f89014875246f085c806c51.gif)
![數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用_第2頁(yè)](http://file4.renrendoc.com/view/b17ca20fd9f89014875246f085c806c5/b17ca20fd9f89014875246f085c806c52.gif)
![數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用_第3頁(yè)](http://file4.renrendoc.com/view/b17ca20fd9f89014875246f085c806c5/b17ca20fd9f89014875246f085c806c53.gif)
![數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用_第4頁(yè)](http://file4.renrendoc.com/view/b17ca20fd9f89014875246f085c806c5/b17ca20fd9f89014875246f085c806c54.gif)
![數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用_第5頁(yè)](http://file4.renrendoc.com/view/b17ca20fd9f89014875246f085c806c5/b17ca20fd9f89014875246f085c806c55.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘在計(jì)算機(jī)輔助審計(jì)中的應(yīng)用
(一)數(shù)據(jù)挖掘數(shù)據(jù)挖掘是從大量數(shù)據(jù)中發(fā)現(xiàn)正確的、新穎的、潛在有用并能夠被理解的知識(shí)的過(guò)程。數(shù)據(jù)挖掘綜合了各個(gè)學(xué)科技術(shù),有很多的功能,主要功能如下:1.關(guān)聯(lián)分析關(guān)聯(lián)分析就是從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的模式知識(shí),即關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則反映一個(gè)事件和其他事件之間依賴或關(guān)聯(lián)的知識(shí),它的一般形式如下:其中,并且,I為項(xiàng)目集,事務(wù)集D中的每個(gè)事務(wù)都是項(xiàng)目集I的子集。如果包含X的事務(wù)中c%同時(shí)包含Y,我們說(shuō)規(guī)則的可信度為c%。如果D中s%的事務(wù)包含X∪Y,我們說(shuō)規(guī)則的支持度為s%。一個(gè)典型的關(guān)聯(lián)規(guī)則實(shí)例是“80%購(gòu)買面包的顧客同時(shí)也會(huì)購(gòu)買牛奶”,最為著名的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)方法是R.Agrawal提出的Apriori算法。關(guān)聯(lián)分析廣泛應(yīng)用于市場(chǎng)營(yíng)銷、事務(wù)分析等應(yīng)用領(lǐng)域。2.分類和預(yù)測(cè)分類的目的就是找出一個(gè)分類函數(shù)或分類模型(分類器),該模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。分類和回歸都可用于預(yù)測(cè),不同的是,分類的輸出是離散的類別值,而回歸的輸出則是連續(xù)數(shù)值。要構(gòu)造分類器,需要有一個(gè)訓(xùn)練樣本數(shù)據(jù)集作為輸入,訓(xùn)練集中每個(gè)元組的類別已知。分類挖掘算法可以對(duì)已有的分類進(jìn)行歸納,即從訓(xùn)練樣本數(shù)據(jù)中學(xué)習(xí),從而建立分類模型。再根據(jù)已知的分類規(guī)則,預(yù)測(cè)未知數(shù)據(jù)實(shí)例的類別。3.聚類聚類分析是將數(shù)據(jù)對(duì)象分成幾類,使得各類內(nèi)部數(shù)據(jù)對(duì)象間的相似度最大,而各類間對(duì)象的相似度最小。聚類分析與分類預(yù)測(cè)方法的明顯不同之處在于,分類預(yù)測(cè)獲取模型所使用的訓(xùn)練數(shù)據(jù)其類別是已知的,屬于有指導(dǎo)的學(xué)習(xí)方法;而聚類分析所分析和處理的數(shù)據(jù)均是無(wú)類別標(biāo)簽的,屬于無(wú)指導(dǎo)的學(xué)習(xí)方法。通過(guò)聚類,可以發(fā)現(xiàn)數(shù)據(jù)的整個(gè)分布情況,以及數(shù)據(jù)屬性之間所存在的有趣的、有價(jià)值的相關(guān)聯(lián)系。4.孤立點(diǎn)挖掘數(shù)據(jù)庫(kù)中可能包含一些數(shù)據(jù)對(duì)象,它們與數(shù)據(jù)的一般行為或模型不一致。這些數(shù)據(jù)對(duì)象是孤立點(diǎn)(又叫離群)。大部分?jǐn)?shù)據(jù)挖掘方法將孤立點(diǎn)視為噪聲或異常而丟棄。然而,在一些應(yīng)用中(如欺騙檢測(cè)、審計(jì)),異常的事件可能比正常出現(xiàn)的那些更令人關(guān)注。(二)數(shù)據(jù)挖掘在審計(jì)中的應(yīng)用1.關(guān)聯(lián)分析在財(cái)務(wù)數(shù)據(jù)或經(jīng)濟(jì)數(shù)據(jù)中,同類或不同類會(huì)計(jì)科目及數(shù)據(jù)項(xiàng)之間可能存在某種對(duì)應(yīng)關(guān)系,通過(guò)挖掘算法(如Apriori算法),按照非財(cái)務(wù)邏輯關(guān)系的規(guī)律來(lái)挖掘,可發(fā)現(xiàn)一些隱藏的經(jīng)濟(jì)活動(dòng)規(guī)律,這些被挖掘出來(lái)的關(guān)聯(lián)規(guī)則,可以用來(lái)豐富審計(jì)知識(shí)庫(kù),為審計(jì)人員的進(jìn)一步工作提供參考。通過(guò)對(duì)以往審計(jì)過(guò)的企業(yè)大量歷史數(shù)據(jù)進(jìn)行挖掘,以建立審計(jì)特征行為模板。當(dāng)發(fā)現(xiàn)同類企業(yè)(含該企業(yè))近期數(shù)據(jù)挖掘結(jié)果與該模板偏離較大時(shí),可以根據(jù)挖掘結(jié)果重點(diǎn)審計(jì)。如通過(guò)數(shù)據(jù)挖掘技術(shù),可以發(fā)現(xiàn)一個(gè)單位的車輛數(shù)和養(yǎng)路費(fèi)、汽車保險(xiǎn)費(fèi)等日常維護(hù)支出存在一定的關(guān)聯(lián),當(dāng)這個(gè)關(guān)系異于常值時(shí),也許能據(jù)此發(fā)現(xiàn)是否存在用賬外資產(chǎn)買車的行為,進(jìn)而查出“小金庫(kù)”問(wèn)題。另一方面,通過(guò)對(duì)審計(jì)出重大問(wèn)題的企業(yè)財(cái)務(wù)數(shù)據(jù)進(jìn)行挖掘,得到可以引導(dǎo)發(fā)現(xiàn)問(wèn)題的關(guān)聯(lián)規(guī)則,同樣可以用來(lái)豐富審計(jì)知識(shí)庫(kù)。比如,有學(xué)者曾對(duì)2003年至2006年受到證監(jiān)會(huì)處罰的66家上市公司的財(cái)務(wù)數(shù)據(jù)進(jìn)行挖掘,得到不少“有趣”的關(guān)聯(lián)規(guī)則,如“連續(xù)兩年虧損,第三年經(jīng)營(yíng)業(yè)績(jī)又沒(méi)有得到根本改善的上市公司,有80%的可能存在財(cái)務(wù)舞弊”。2.分類某種意義上講,審計(jì)的部分工作就是對(duì)被審計(jì)單位進(jìn)行分類,只不過(guò)通常只需要簡(jiǎn)單的分成兩個(gè)類:有財(cái)務(wù)舞弊和無(wú)財(cái)務(wù)舞弊。因此可以應(yīng)用現(xiàn)已開(kāi)發(fā)出來(lái)的分類算法進(jìn)行輔助審計(jì)。分類挖掘的重點(diǎn)是特征選取、選擇訓(xùn)練樣本和分類器。特征選擇是模型進(jìn)行計(jì)算的基礎(chǔ),指標(biāo)變量選擇的好壞直接影響到挖掘結(jié)果的質(zhì)量。國(guó)內(nèi)外已有很多關(guān)于這方面的文獻(xiàn)可供參考,一般可選擇下列指標(biāo):(1)盈利能力指標(biāo)包括總資產(chǎn)凈利潤(rùn)率、資產(chǎn)報(bào)酬率、凈資產(chǎn)收益率、營(yíng)業(yè)收入凈利潤(rùn)率、每股收益、營(yíng)業(yè)毛利率、股東權(quán)益凈利潤(rùn)率等。(2)結(jié)構(gòu)性指標(biāo)包括資產(chǎn)負(fù)債率、固定資產(chǎn)比率、營(yíng)運(yùn)資金對(duì)資產(chǎn)總額比率、應(yīng)收賬款占主營(yíng)業(yè)務(wù)收入比重、營(yíng)業(yè)利潤(rùn)比重、產(chǎn)權(quán)比率等。例如簽訂銷售合同物權(quán)尚未轉(zhuǎn)移時(shí)確認(rèn)收入或者將庫(kù)存商品確認(rèn)為主營(yíng)業(yè)務(wù)收入,同時(shí)增加應(yīng)收賬款,使主營(yíng)業(yè)務(wù)收入虛增,形成白條利潤(rùn),同時(shí)又通過(guò)應(yīng)收賬款虛增了資產(chǎn),這樣會(huì)造成應(yīng)收賬款占主營(yíng)業(yè)務(wù)收入的比重發(fā)生異常。(3)效率指標(biāo)包括總資產(chǎn)周轉(zhuǎn)率、存貨周轉(zhuǎn)率、應(yīng)收賬款周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率、股東權(quán)益周轉(zhuǎn)率。(4)現(xiàn)金流量指標(biāo)包括主營(yíng)業(yè)務(wù)收入現(xiàn)金比率、現(xiàn)金流量對(duì)流動(dòng)負(fù)債比率等。(5)流動(dòng)性指標(biāo)包括流動(dòng)比率、速動(dòng)比率、利息保障倍數(shù)等。(6)成長(zhǎng)性指標(biāo)包括主營(yíng)業(yè)務(wù)收入增長(zhǎng)率、每股凈資產(chǎn)、資本保值增值率、資本積累率、資本積累率、凈利潤(rùn)增長(zhǎng)率等。訓(xùn)練樣本的選擇就是合理挑選舞弊樣本和非舞弊樣本,供計(jì)算機(jī)學(xué)習(xí)和訓(xùn)練。訓(xùn)練樣本的選擇應(yīng)具有代表性,盡量覆蓋所有特征值,并具備一定規(guī)模。分類器的選擇,可直接參考數(shù)據(jù)挖掘領(lǐng)域現(xiàn)有的研究成果,有條件的審計(jì)機(jī)構(gòu)也可以有針對(duì)性的自主開(kāi)發(fā)分類器。3.聚類聚類在審計(jì)中的應(yīng)用,就是利用聚類算法,將被審計(jì)單位自動(dòng)分成兩個(gè)類,他們分別代表舞弊類和非舞弊類,或者分成三個(gè)類(增加一個(gè)“不確定”類)。聚類算法大都需要設(shè)置各種參數(shù),參數(shù)不同,得到的聚類結(jié)果也不同。如何設(shè)置參數(shù),使得結(jié)果有效的聚成兩類,且正好分別代表舞弊和非舞弊類,是一個(gè)難題,目前尚無(wú)解決方案。這無(wú)疑限制了該方法在審計(jì)中的應(yīng)用。4.孤立點(diǎn)挖掘在審計(jì)工作中,可以通過(guò)數(shù)據(jù)挖掘,找出那些與一般行為有顯著不同的孤立點(diǎn),從而確認(rèn)為審計(jì)重點(diǎn),實(shí)施審計(jì)程序后獲取審計(jì)證據(jù)。孤立點(diǎn)的甄別是一個(gè)復(fù)雜的過(guò)程,不能簡(jiǎn)單以偏離平均數(shù)為標(biāo)準(zhǔn)。偏離正常的數(shù)據(jù)可能來(lái)源于兩類:第一類是錯(cuò)誤的數(shù)據(jù),這種錯(cuò)誤可能是由于會(huì)計(jì)記錄或相關(guān)記錄的偽造、篡改或無(wú)視會(huì)計(jì)準(zhǔn)則故意為之等舞弊行為導(dǎo)致的錯(cuò)誤,也可能是由于員工的非故意行為引起的,如輸入數(shù)據(jù)的錯(cuò)誤。第二類是交易或事項(xiàng)正常性質(zhì)的反映,如某一公司總經(jīng)理的工資,自然遠(yuǎn)遠(yuǎn)高于公司其他雇員的工資。又如,很多企業(yè)的財(cái)務(wù)數(shù)據(jù)呈季節(jié)波動(dòng)特性,某個(gè)時(shí)段的數(shù)據(jù)偏高,另一個(gè)時(shí)段的數(shù)據(jù)偏低,這可能與其行業(yè)特點(diǎn)有關(guān),應(yīng)視為正常。好的孤立點(diǎn)挖掘算法應(yīng)考慮此類情況。數(shù)據(jù)挖掘可以為我們找到疑點(diǎn)和重點(diǎn),要形成審計(jì)證據(jù),還需要審計(jì)人員進(jìn)行專業(yè)性的分析判斷,采取重新計(jì)算、審閱、盤(pán)存和函證等進(jìn)一步的審計(jì)程序,獲取充分、適當(dāng)?shù)膶徲?jì)證據(jù),進(jìn)而提出審計(jì)結(jié)論、出具審計(jì)報(bào)告。(三)數(shù)據(jù)挖掘的工具與挖掘步驟1.數(shù)據(jù)挖掘工具由于數(shù)據(jù)挖掘技術(shù)有良好的應(yīng)用前景,各大軟件公司如IBM、SPSS、SAS以及大學(xué)等研究機(jī)構(gòu)對(duì)此開(kāi)展了研究,一批數(shù)據(jù)挖掘系統(tǒng)軟件紛紛出臺(tái),并被應(yīng)用到各個(gè)領(lǐng)域。其中比較有代表性的商業(yè)軟件有:(1)SPSS公司的C1ementine;(2)SAS公司的EnterpriseMiner;(3)Salford公司的系列產(chǎn)品,包括CART,MARS,TreeNet,LOGIT等;(4)IBM公司的IntelligentMiner;由于上述商用數(shù)據(jù)挖掘工具價(jià)格較高,兩種免費(fèi)的挖掘工具受到關(guān)注:加拿大SimonFraser大學(xué)開(kāi)發(fā)的DBMiner和新西蘭Waikato大學(xué)研發(fā)的Weka。WEKA是一個(gè)開(kāi)放源碼的數(shù)據(jù)挖掘平臺(tái),其中集成了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī)器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、關(guān)聯(lián)規(guī)則挖掘、分類、聚類等,并提供了豐富的可視化功能。同時(shí),由于其源碼的開(kāi)放性,WEKA不僅可以用于完成常規(guī)的數(shù)據(jù)挖掘任務(wù),也可以用于二次開(kāi)發(fā),并掛接自主開(kāi)發(fā)的數(shù)據(jù)挖掘程序。2.數(shù)據(jù)挖掘的方法與步驟上述數(shù)據(jù)挖掘工具在計(jì)算機(jī)輔助審計(jì)中一般操作步驟分為5步:(1)確定業(yè)務(wù)對(duì)象與審計(jì)目標(biāo)首先要了解被審計(jì)的業(yè)務(wù)及其數(shù)據(jù)特性,并確定審計(jì)目標(biāo)。不了解業(yè)務(wù)和數(shù)據(jù),就無(wú)法準(zhǔn)備數(shù)據(jù),也無(wú)法解釋挖掘的結(jié)果。(2)數(shù)據(jù)采集建立模型前,要導(dǎo)出被審計(jì)單位的財(cái)務(wù)數(shù)據(jù)。結(jié)合數(shù)據(jù)字典和數(shù)據(jù)庫(kù)說(shuō)明文檔,了解被導(dǎo)出數(shù)據(jù)的含義。(3)數(shù)據(jù)整理和準(zhǔn)備根據(jù)需要去掉不感興趣的數(shù)據(jù)或數(shù)據(jù)項(xiàng),轉(zhuǎn)換數(shù)據(jù)格式(挖掘工具對(duì)輸入的數(shù)據(jù)格式常有特別的要求)。對(duì)于分類挖掘,還需要準(zhǔn)備訓(xùn)練樣本,包括正常數(shù)據(jù)樣本和問(wèn)題數(shù)據(jù)樣本。(4)選擇挖掘算法,實(shí)施數(shù)據(jù)挖掘數(shù)據(jù)挖掘工具一般
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 粵人版地理八年級(jí)下冊(cè)《第二節(jié) 重要的地理分界線》聽(tīng)課評(píng)課記錄1
- 新人教版七年級(jí)數(shù)學(xué)上冊(cè) 3.1.2 《等式的性質(zhì)》聽(tīng)評(píng)課記錄
- 七年級(jí)(人教版)集體備課聽(tīng)評(píng)課記錄:3.2《解一元一次方程(一)-合并同類項(xiàng)與移項(xiàng)1》
- 新蘇教版六年級(jí)數(shù)學(xué)下冊(cè)聽(tīng)評(píng)課記錄
- 三年級(jí)語(yǔ)文上聽(tīng)評(píng)課記錄
- 蘇科版數(shù)學(xué)七年級(jí)下冊(cè)10.2《二元一次方程組》聽(tīng)評(píng)課記錄
- 人教版地理七年級(jí)下冊(cè)第十章《極地地區(qū)》聽(tīng)課評(píng)課記錄1
- 人教版數(shù)學(xué)八年級(jí)下冊(cè)《19.3 課題學(xué)習(xí) 選擇方案》聽(tīng)評(píng)課記錄
- 新人教版七年級(jí)數(shù)學(xué)上冊(cè)1.3.2《有理數(shù)的減法》聽(tīng)評(píng)課記錄2
- 八年級(jí)道德與法治上冊(cè)聽(tīng)課評(píng)課記錄第一單元走進(jìn)社會(huì)生活
- 課件:《教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要(2024-2035年)》學(xué)習(xí)宣講
- 梁湘潤(rùn)《子平基礎(chǔ)概要》簡(jiǎn)體版
- 高一化學(xué)教學(xué)進(jìn)度計(jì)劃表
- 新員工入職培訓(xùn)考試附答案
- 高校畢業(yè)生就業(yè)見(jiàn)習(xí)登記表
- 植物有效成分的提取
- 財(cái)務(wù)收支月報(bào)表excel模板
- 江蘇省社會(huì)穩(wěn)定風(fēng)險(xiǎn)評(píng)估辦法(試行)
- 國(guó)標(biāo)充電協(xié)議報(bào)文整理
- 水餃類產(chǎn)品質(zhì)量檢驗(yàn)作業(yè)指導(dǎo)書(shū)
- 電力變壓器計(jì)算單
評(píng)論
0/150
提交評(píng)論