




已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2017年河南科技大學(xué)數(shù)學(xué)建模競賽承 諾 書我們仔細(xì)閱讀了2017年河南科技大學(xué)數(shù)學(xué)建模競賽的競賽規(guī)則.我們完全明白,在競賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們授權(quán)河南科技大學(xué)數(shù)學(xué)建模競賽組委會(huì),可將我們的論文以任何形式進(jìn)行公開展示(包括進(jìn)行網(wǎng)上公示,在書籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等)。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫): B 所屬學(xué)院(請?zhí)顚懲暾娜?車輛與交通工程學(xué)院 參賽隊(duì)員 (打印并簽名) :1. 2. 3. 日期: 2017 年 05 月 14 日評(píng)閱編號(hào)(由組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2017年河南科技大學(xué)數(shù)學(xué)建模競賽編 號(hào) 專 用 頁評(píng)閱編號(hào)(由組委會(huì)評(píng)閱前進(jìn)行編號(hào)):評(píng)閱記錄(可組委會(huì)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注6 / 27ATM交易狀態(tài)特征及異常分析摘要隨著銀行業(yè)務(wù)的快速發(fā)展,自助業(yè)務(wù)在銀行對外服務(wù)中的作用日益突出。作為自助銀行服務(wù)的主要渠道,自動(dòng)柜員機(jī)(簡稱ATM)設(shè)備能夠?yàn)榭蛻籼峁?4小時(shí)不間斷的便利服務(wù),其承擔(dān)的業(yè)務(wù)是銀行服務(wù)的延伸。在承擔(dān)高強(qiáng)度的客戶服務(wù)和社會(huì)責(zé)任的同時(shí),也會(huì)出現(xiàn)一定概率的異常和故障1,本文針對某商業(yè)銀行ATM應(yīng)用系統(tǒng)某分行的交易統(tǒng)計(jì)數(shù)據(jù),提取出交易狀態(tài)的特征參數(shù),并設(shè)計(jì)一套交易狀態(tài)異常檢測方案。針對問題一,通過SPSS的相關(guān)性分析和圖像可以發(fā)現(xiàn)業(yè)務(wù)量,交易成功率,交易響應(yīng)時(shí)間三項(xiàng)指標(biāo)之間不存在明顯的相關(guān)性,只有交易量與時(shí)間、日期存在明顯的相關(guān)性。因此對于這三個(gè)指標(biāo),我們將其分別與時(shí)間日期進(jìn)行處理分析,得出它們都屬于正態(tài)分布,依此提取其特征參數(shù)。針對問題二,經(jīng)過分析,三個(gè)指標(biāo)之間不存在明顯相關(guān)性,且每個(gè)指標(biāo)都至少對應(yīng)一個(gè)故障源,因此可以對三個(gè)參數(shù)異常數(shù)據(jù)進(jìn)行獨(dú)立檢測。首先使用三個(gè)指標(biāo)提取的特征參數(shù),通過大量數(shù)據(jù)的分析,發(fā)現(xiàn)成功率和響應(yīng)時(shí)間數(shù)據(jù)十分集中,我們采用方差分析法判斷異常數(shù)據(jù)。針對問題三,我們考慮增加交易金額,網(wǎng)絡(luò)隨機(jī)信號(hào)傳輸時(shí)間和網(wǎng)絡(luò)負(fù)載率作為擴(kuò)展數(shù)據(jù),這樣我們可以將各個(gè)參數(shù)的正常區(qū)間劃分更為可靠,提升故障異常發(fā)現(xiàn)的概率同時(shí)減少誤報(bào)率。關(guān)鍵詞:方差分析法、散點(diǎn)圖、相關(guān)性分析、正態(tài)分布一問題重述某商業(yè)銀行的ATM應(yīng)用系統(tǒng)包括前端和后端兩個(gè)部分。前端是部署在銀行營業(yè)部和各自助服務(wù)點(diǎn)的ATM機(jī)(系統(tǒng)),后端是總行數(shù)據(jù)中心的處理系統(tǒng)。前端的主要功能是和客戶直接交互,采集客戶請求信息,然后通過網(wǎng)絡(luò)傳輸?shù)胶蠖?,再進(jìn)行數(shù)據(jù)和賬務(wù)處理。持卡人 從前端設(shè)備提交查詢或轉(zhuǎn)賬或取現(xiàn)等業(yè)務(wù)請求,到后臺(tái)處理完畢,并將處理結(jié)果返回到前端,通知持卡人業(yè)務(wù)處理最終狀態(tài),我們稱這樣完整的一個(gè)流程為一筆交易。商業(yè)銀行總行數(shù)據(jù)中心監(jiān)控系統(tǒng)為了實(shí)時(shí)掌握全行的業(yè)務(wù)狀態(tài),每分鐘對各分行的交易信息進(jìn)行匯總統(tǒng)計(jì)。匯總信息包括業(yè)務(wù)量、交易成功率、交易響應(yīng)時(shí)間三個(gè)指標(biāo),各指標(biāo)解釋如下:1、業(yè)務(wù)量:每分鐘總共發(fā)生的交易總筆數(shù);2、交易成功率:每分鐘交易成功筆數(shù)和業(yè)務(wù)量的比率;3、交易響應(yīng)時(shí)間:一分鐘內(nèi)每筆交易在后端處理的平均耗時(shí)(單位:毫秒)。 交易數(shù)據(jù)分布存在以下特征:工作日和非工作日的交易量存在差別;一天內(nèi),交易量也存在業(yè)務(wù)低谷時(shí)間段和正常業(yè)務(wù)時(shí)間段。當(dāng)無交易發(fā)生時(shí),交易成功率和交易響應(yīng)時(shí)間指標(biāo)為空。商業(yè)銀行總行數(shù)據(jù)中心監(jiān)控系統(tǒng)通過對每家分行的匯總統(tǒng)計(jì)信息做數(shù)據(jù)分析,來捕捉整個(gè)前端和后端整體應(yīng)用系統(tǒng)運(yùn)行情況以及時(shí)發(fā)現(xiàn)異常或故障。常見的故障場景包括但不限于如下情形:1、分行側(cè)網(wǎng)絡(luò)傳輸節(jié)點(diǎn)故障,前端交易無法上送請求,導(dǎo)致業(yè)務(wù)量陡降;2、分行側(cè)參數(shù)數(shù)據(jù)變更或者配置錯(cuò)誤,數(shù)據(jù)中心后端處理失敗率增加,影響交易成功率指標(biāo);3、數(shù)據(jù)中心后端處理系統(tǒng)異常(如操作系統(tǒng)CPU負(fù)荷過大)引起交易處理緩慢,影響交易響應(yīng)時(shí)間指標(biāo);4、數(shù)據(jù)中心后端處理系統(tǒng)應(yīng)用進(jìn)程異常,導(dǎo)致交易失敗或響應(yīng)緩慢。附件是某商業(yè)銀行ATM應(yīng)用系統(tǒng)某分行的交易統(tǒng)計(jì)數(shù)據(jù)。假設(shè)附件的數(shù)據(jù)對應(yīng)的交易狀態(tài)無異常。你的任務(wù)是:(1)選擇、提取和分析ATM交易狀態(tài)的特征參數(shù);(2)設(shè)計(jì)一套交易狀態(tài)異常檢測方案,在對該交易系統(tǒng)的應(yīng)用可用性異常情況下能做到及時(shí)報(bào)警,同時(shí)盡量減少虛警誤報(bào);(3)設(shè)想可增加采集的數(shù)據(jù)?;跀U(kuò)展數(shù)據(jù),你能如何提升任務(wù)(1)(2)中你達(dá)到的目標(biāo)?二問題分析商業(yè)銀行總行數(shù)據(jù)中心監(jiān)控系統(tǒng)為了實(shí)時(shí)掌握全行的業(yè)務(wù)狀態(tài),每分鐘對各分行的交易信息進(jìn)行匯總統(tǒng)計(jì)。匯總信息包括業(yè)務(wù)量、交易成功率、交易響應(yīng)時(shí)間三個(gè)指標(biāo)。根據(jù)題意以及相關(guān)資料的查閱,有幾個(gè)方面對這三項(xiàng)指標(biāo)影響較大。1、分行側(cè)網(wǎng)絡(luò)傳輸節(jié)點(diǎn)故障,前端交易無法上送請求,導(dǎo)致業(yè)務(wù)量陡降;2、分行側(cè)參數(shù)數(shù)據(jù)變更或者配置錯(cuò)誤,數(shù)據(jù)中心后端處理失敗率增加,影響交易成功率指標(biāo);3、數(shù)據(jù)中心后端處理系統(tǒng)異常(如操作系統(tǒng)CPU負(fù)荷過大)引起交易處理緩慢,影響交易響應(yīng)時(shí)間指標(biāo);4、數(shù)據(jù)中心后端處理系統(tǒng)應(yīng)用進(jìn)程異常,導(dǎo)致交易失敗或響應(yīng)緩慢。 針對問題一,利用SPSS通過相關(guān)性分析和圖像可以直觀發(fā)現(xiàn)業(yè)務(wù)量,交易成功率,交易響應(yīng)時(shí)間三項(xiàng)指標(biāo)之間不存在明顯的相關(guān)性,只有交易量與時(shí)間、日期存在明顯的相關(guān)性。因此我們將交易量時(shí)間日期分別進(jìn)行處理,并提取特征參數(shù)。我們對日總交易量圖分析,發(fā)現(xiàn)交易量在1-2月之間相較其他時(shí)間有顯著的波動(dòng),推測是春節(jié)因素的影響,故分析時(shí)將其分開單獨(dú)處理。通過分析每日交易量圖,我們發(fā)現(xiàn)工作日和非工作日的日總交易量和每日交易量散點(diǎn)圖并沒有明顯區(qū)別。排除春節(jié)影響的日總交易量平穩(wěn)時(shí)間段,我們將每分鐘交易量作為個(gè)體,發(fā)現(xiàn)其符合正態(tài)分布特征,取其平均值和方差作為特征參數(shù)。對于成功率指標(biāo),我們通過散點(diǎn)圖發(fā)現(xiàn)其在交易量少的時(shí)間段波動(dòng)范圍較大,因此使用一個(gè)模型將交易量累加到一定值的平均成功率來替代,處理后提取其標(biāo)準(zhǔn)差和平均值作為特征參數(shù)。對于響應(yīng)時(shí)間,通過對其圖像的觀察,得到數(shù)據(jù)點(diǎn)分布的特征,同樣提取其標(biāo)準(zhǔn)差和平均值作為其特征參數(shù)。針對問題二,經(jīng)過分析,三個(gè)指標(biāo)不存在明顯相關(guān)性,且每個(gè)指標(biāo)都至少對應(yīng)一個(gè)故障源,因此可以對三個(gè)參數(shù)異常數(shù)據(jù)進(jìn)行獨(dú)立檢測。首先使用三個(gè)指標(biāo)提取的特征參數(shù),通過大量數(shù)據(jù)的分析,發(fā)現(xiàn)成功率和響應(yīng)時(shí)間數(shù)據(jù)十分集中,我們可以采用方差分析法判斷異常數(shù)據(jù)。交易量與時(shí)間及日期存在相關(guān)性,所以數(shù)據(jù)處理較為復(fù)雜,因此我們建立了多個(gè)模型來判斷異常數(shù)據(jù)。 經(jīng)過圖像分析發(fā)現(xiàn),不同日期對應(yīng)的相同時(shí)間(每分鐘)交易量散點(diǎn)分布基本符合正態(tài)分布,因此我們對每一分鐘根據(jù)其正態(tài)分布特性分別求出置信區(qū)間作為正常數(shù)據(jù)區(qū)間,由于這個(gè)模型在交易量極小時(shí)無法區(qū)分異常數(shù)據(jù),因此我們使用編程建立了對交易量進(jìn)行連續(xù)極小值進(jìn)行檢測的模型來處理。在對1-2月異常數(shù)據(jù)處理時(shí),建立了一個(gè)模型,采用平穩(wěn)時(shí)間段的平均數(shù)據(jù)與計(jì)算出的權(quán)值相乘的方式來近似處理,取得了較高的準(zhǔn)確度。在建立異常和故障報(bào)警模型時(shí),考慮到現(xiàn)實(shí)中故障有一定的持續(xù)時(shí)間,因此在模型中只有當(dāng)一個(gè)指標(biāo)出現(xiàn)異常持續(xù)一定時(shí)間,才會(huì)發(fā)出異?;蚬收蠄?bào)警。針對問題三,我們考慮每種故障對應(yīng)的修復(fù)時(shí)間和增加交易金額,網(wǎng)絡(luò)隨機(jī)信號(hào)傳輸時(shí)間和網(wǎng)絡(luò)負(fù)載率作為擴(kuò)展數(shù)據(jù),這樣我們可以將各個(gè)參數(shù)的正常區(qū)間劃分更為可靠,提升故障異常發(fā)現(xiàn)的概率同時(shí)減少誤報(bào)率。三模型假設(shè)1.不考慮網(wǎng)絡(luò)故障對數(shù)據(jù)造成的影響。2.銀行的經(jīng)營狀況不會(huì)對交易量產(chǎn)生影響。3.不考慮洗錢犯罪對交易數(shù)據(jù)造成的影響。4.不考慮ATM機(jī)現(xiàn)金儲(chǔ)存量對交易成功率的影響。四.符號(hào)說明:1:交易量平均值1:交易量標(biāo)準(zhǔn)差2:成功率平均值2:成功率標(biāo)準(zhǔn)差3:響應(yīng)時(shí)間平均值3:響應(yīng)時(shí)間標(biāo)準(zhǔn)差五.模型的建立與求解5.1問題一的模型建立與求解5.1.1 業(yè)務(wù)量、交易成功率、交易響應(yīng)時(shí)間、與時(shí)間日期的關(guān)系我們使用 SPSS分別建立了三個(gè)特征參數(shù)與時(shí)間日期的相關(guān)性分析。 時(shí)間交易量時(shí)間成功率時(shí)間pearson相關(guān)性顯著性(雙側(cè))N 1 30212 3.33* 000 30212時(shí)間pearson相關(guān)性顯著性(雙側(cè))N 1 30212-0.50* 000 30212交易量pearson相關(guān)性顯著性(雙側(cè))N 3.33* 000 30212 1 30212成功率pearson相關(guān)性顯著性(雙側(cè))N -0.50*000 30212 1 30212 成功率交易量 成功率響應(yīng)時(shí)間成功率pearson相關(guān)性顯著性(雙側(cè))N 1 30212 -0.48* 000 30212成功率pearson相關(guān)性顯著性(雙側(cè))N 1 30212 002 000 30212交易量pearson相關(guān)性顯著性(雙側(cè))N -048.* 000 30212 1 30212響應(yīng)時(shí)間pearson相關(guān)性顯著性(雙側(cè))N 022 000 30212 1 30212 由上圖的相關(guān)性分析可知,時(shí)間與交易量顯著相關(guān)性;成功率與交易量存在負(fù)相關(guān),時(shí)間與成功率是負(fù)相關(guān)。通過SPSS做出三個(gè)指標(biāo)相應(yīng)的散點(diǎn)圖,進(jìn)行對比處理,由相應(yīng)時(shí)間與成功率的散點(diǎn)圖可知,成功率與響應(yīng)時(shí)間無關(guān)。5.1.2 對交易量進(jìn)行分析提取:為了便于觀察大量數(shù)據(jù)的特征,我們使用spss分類匯總并用Excel繪制出了日總交易量與日期的折線圖由日期的日總交易量,可以看到有一段較大的波動(dòng),即一月下旬至二月初時(shí)間段內(nèi)日總交易量,我們猜測是中國的的傳統(tǒng)節(jié)日春節(jié)導(dǎo)致的較大波動(dòng),所以需要把這段分開處理數(shù)據(jù)。 一周內(nèi)的時(shí)間和日總交易量因?yàn)榇汗?jié)的影響,我們把春節(jié)的這兩個(gè)周去掉,然后把剩余日期按周分類,研究一周內(nèi)的工作日與非工作日對日總交易量的影響,有上圖可以證明其影響不明顯。我們用spss做出了一天內(nèi)的交易量的散點(diǎn)圖,整個(gè)圖像顯示為M型。由上圖可知,凌晨1.點(diǎn)至6點(diǎn)的交易較低,考慮到是改時(shí)間段,大部分人休息,人流量較少;而9點(diǎn)到12點(diǎn),13點(diǎn)到17點(diǎn)為每天都峰值,也是因?yàn)槿肆髁康挠绊憽S纱丝梢钥闯鰰r(shí)間對交易量有顯著的相關(guān)性。交易量與日期、時(shí)間的散點(diǎn)圖之后我們又使用MATLAB繪出了交易量,時(shí)間,日期的散點(diǎn)圖,由圖可以驗(yàn)證以上的亮點(diǎn)驗(yàn)證,交易量與時(shí)間顯著相關(guān),且在春節(jié)期間,交易量有較大的波動(dòng)。根據(jù)以上結(jié)果我們進(jìn)一步分析,不同日期的相同時(shí)間內(nèi)交易量服從正態(tài)分布,下列三個(gè)圖印證了這一觀點(diǎn)。通過對交易量的正態(tài)分析,可以提取其平均值和方差作為特征參數(shù)。使用VS C+編寫程序來計(jì)算平均值和方差。5.1.3 對成功率進(jìn)行分析提?。菏紫任覀兪褂胹pss做出成功率與時(shí)間的散點(diǎn)圖,如下圖所示。成功率-時(shí)間 散點(diǎn)圖1由上圖可知,成功率的分布與時(shí)間變化無關(guān),驗(yàn)證了上面相關(guān)分析,且在凌晨1點(diǎn)到七點(diǎn)這個(gè)時(shí)間段內(nèi),成功率比較分散,由上面的交易量與時(shí)間的散點(diǎn)圖可知,此個(gè)時(shí)間段的交易量較少,交易量低正是造成成功率離散程度高的原因,與異常和故障并無直接關(guān)系,因此使用編程設(shè)計(jì)了一個(gè)模型,來消除這個(gè)無關(guān)因素的影響。模型處理過程如下:對交易量不足設(shè)定值K的時(shí)間進(jìn)行連續(xù)累加當(dāng)累加值超過K時(shí)計(jì)算一次成功率以這個(gè)成功率來代表這段時(shí)間的成功率 模型流程圖如下:考慮到后續(xù)及時(shí)報(bào)警因素的考慮,經(jīng)過多次嘗試,K值定為50時(shí)效果明顯,且最長累加時(shí)間為10分鐘,符合及時(shí)報(bào)警的考慮因素。下圖為處理后 成功率-時(shí)間 的散點(diǎn)圖成功率-時(shí)間 散點(diǎn)圖2從處理后的散點(diǎn)圖可以看出該模型符合預(yù)期設(shè)定的目標(biāo)。根據(jù)處理后的圖像,發(fā)現(xiàn)成功率值都集中在較高的區(qū)域,因此我們決定使用方差分析法來尋找其置信區(qū)間。方差分析法作為一種數(shù)理統(tǒng)計(jì)方法廣泛應(yīng)用于氣象、水文、地震等行業(yè)數(shù)據(jù)的科學(xué)統(tǒng)計(jì)與分析。可應(yīng)用方差分析法計(jì)算最新采集數(shù)據(jù)與其均值的離散程度,從而對異常數(shù)據(jù)進(jìn)行篩選。以下為利用方差分析法對異常數(shù)據(jù)進(jìn)行篩選的方法:如果實(shí)驗(yàn)數(shù)據(jù)的總體x是服從正態(tài)分布的,則式中,與分別表示正態(tài)總體的數(shù)學(xué)期望和標(biāo)準(zhǔn)差。此時(shí),在實(shí)驗(yàn)數(shù)據(jù)中出現(xiàn)大于3或小于3數(shù)據(jù)的概率是很小的。因此,根據(jù)上式對于大于3或小于3的實(shí)驗(yàn)數(shù)據(jù)作為異常數(shù)據(jù),予以剔除。 具體計(jì)算方法如下: 對于實(shí)驗(yàn)數(shù)據(jù)x1, x2, x3,,xn,先計(jì)算其均值 (i=1,2,3,n)再計(jì)算殘差則標(biāo)準(zhǔn)差如果某個(gè)測量值 的殘差滿足則認(rèn)為xd為異常數(shù)據(jù),予以剔除。成功率的數(shù)據(jù)分布集中在一定范圍內(nèi),當(dāng)數(shù)據(jù)變化的絕對值超過N倍標(biāo)準(zhǔn)均方差變化閥值的數(shù)據(jù)個(gè)數(shù)達(dá)到一定標(biāo)準(zhǔn)時(shí)通常說明數(shù)據(jù)存在異常。利用方差分析數(shù)據(jù)異常,N的取值采用兩種方法來實(shí)現(xiàn):單次N值比較法,通常情況下N值默認(rèn)為3,即數(shù)據(jù)變化超過3倍標(biāo)準(zhǔn)方差即認(rèn)為該點(diǎn)數(shù)據(jù)不正常,當(dāng)這種不正常的數(shù)據(jù)點(diǎn)個(gè)數(shù)超過用戶設(shè)定的某個(gè)數(shù)值時(shí)即認(rèn)為數(shù)據(jù)存在異常,N的取值和不正常數(shù)據(jù)點(diǎn)個(gè)數(shù)可由用戶根據(jù)測項(xiàng)類型與長期統(tǒng)計(jì)結(jié)果具體設(shè)定,通過該方法可檢測出數(shù)據(jù)超出3倍均方差的數(shù)據(jù)異常;雙次N值比較法,利用第1次N值比較去除干擾,即認(rèn)為數(shù)據(jù)變化超過N次標(biāo)準(zhǔn)方差的數(shù)據(jù)點(diǎn)為干擾點(diǎn),去掉干擾點(diǎn)后進(jìn)行第2次N值比較,通常取N為2,即去掉干擾后,數(shù)據(jù)變化超過2倍方差的數(shù)據(jù)個(gè)數(shù)超過用戶設(shè)定的某個(gè)數(shù)值時(shí)即認(rèn)為數(shù)據(jù)存在異常。2分析成功率的數(shù)據(jù),發(fā)現(xiàn)成功率存在極大偏離值,因此使用雙次N值比較法更為合理。根據(jù)雙次N值比較法的需要,我們先進(jìn)行第一次N值比較處理,去除極端異常值之后求出成功率的平均值和方差作為其特征參數(shù)。5.1.4 對響應(yīng)時(shí)間進(jìn)行分析提?。喉憫?yīng)時(shí)間-交易量 散點(diǎn)圖響應(yīng)時(shí)間-時(shí)間 散點(diǎn)圖根據(jù)上圖我們可以得出以下結(jié)論:1.,由交易量與響應(yīng)時(shí)間的散點(diǎn)圖可以看出,隨著交易量增大,響應(yīng)時(shí)間的分散逐步集中,且在時(shí)間與響應(yīng)時(shí)間的散點(diǎn)圖中,凌晨一點(diǎn)到七點(diǎn),響應(yīng)時(shí)間較集中的數(shù)據(jù)中有小段波動(dòng),因此我們推測是由于白天交易量大,銀行的服務(wù)器及處理器較多,因此降低了響應(yīng)時(shí)間2.響應(yīng)時(shí)間數(shù)據(jù)集中在一個(gè)較窄的區(qū)間,數(shù)據(jù)點(diǎn)的離散程度較低同樣的,分析響應(yīng)時(shí)間的數(shù)據(jù),由于響應(yīng)時(shí)間存在極大偏離值,因此使用雙次N值比較法更為合理.根據(jù)方差分析法的需要,我們先進(jìn)行第一次處理,去除極端異常值之后求出響應(yīng)時(shí)間的平均值和方差作為其特征參數(shù).5.2 問題二的模型建立與求解:5.2.1 交易量的異常檢測模型:春節(jié)期間的交易量異常情況在之后進(jìn)行討論,首先對春節(jié)之外的正常情況進(jìn)行處理.a.交易量異常檢測模型1a.1模型的建立根據(jù)第一問求出的特征參數(shù)和時(shí)間和交易量的正態(tài)分布特性,對每一分鐘分別求出置信區(qū)間.根據(jù)其正態(tài)分布的特性,試選取2或3作為其置信區(qū)間,在其置信區(qū)間外即判定該交易量數(shù)據(jù)出現(xiàn)異常,通過下面的圖像對比,我們可以得出3的區(qū)間選取更為合理. 通過對該模型的進(jìn)一步分析可以得出在交易量低于一定值的一段時(shí)間區(qū)間內(nèi),置信區(qū)間下界小于0,因而該模型在這種情形下不能達(dá)到其預(yù)期效果,所以我們設(shè)計(jì)了另一模型來處理這種情況.b.交易量異常檢測模型2b.1模型的建立該模型的設(shè)計(jì)方案采用如下流程圖:我們使用VS-C+編寫程序來實(shí)現(xiàn)這一模型.該模型檢測連續(xù)K分鐘內(nèi)交易量低于A的個(gè)數(shù)超過一個(gè)閾值,就判定交易量數(shù)據(jù)出現(xiàn)異常。c.春節(jié)期間交易量數(shù)據(jù)異常檢測模型c.1 模型的建立之前已分析得出春節(jié)期間每日的 交易量-時(shí)間(分鐘)點(diǎn)圖與正常期間每日的交易量-時(shí)間(每分鐘)點(diǎn)圖相似度較高.因此嘗試用春節(jié)期間單天的總交易量與單天基準(zhǔn)總交易量的比值作為權(quán)值,與單日基準(zhǔn) 交易量-時(shí)間(分鐘)點(diǎn)值 相乘來近似估計(jì)春節(jié)期間的某日交易量-時(shí)間(每分鐘)點(diǎn)值.對正常期間日總交易量的方差和圖像進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)較為穩(wěn)定.因此可以將正常期間日總交易量的平均值作為基準(zhǔn)A, 單日基準(zhǔn) 交易量-時(shí)間(分鐘)點(diǎn)值取模型1.1中求出的c.2模型合理性分析通過spss繪制出春節(jié)期間每一天該模型預(yù)測出的交易量-時(shí)間(分鐘)點(diǎn)圖 與對應(yīng)春節(jié)某日實(shí)際交易量-時(shí)間(分鐘)點(diǎn)圖, 發(fā)現(xiàn)預(yù)測準(zhǔn)確度較高,模型建立合理.5.2.2 成功率的異常檢測模型:成功率異常數(shù)據(jù)檢測方法成功率數(shù)據(jù)分布十分集中,與響應(yīng)時(shí)間較為相似,因此使用相同的模型,得出下表第一次N值比較第二次N值比較0.9567990.9568090.02015160.0164322異常點(diǎn)數(shù)量11378535.2.3 響應(yīng)時(shí)間的異常檢測模型:使用方差分析法來進(jìn)行響應(yīng)時(shí)間異常數(shù)據(jù)檢測。響應(yīng)時(shí)間得出的特征參數(shù)為: 利用第1次N值比較去除干擾點(diǎn)后得到的方差及平均值。根據(jù)方差和平均值進(jìn)行第2次N值比較,一般取N為2,即去掉干擾后,數(shù)據(jù)變化超過2倍方差的數(shù)據(jù)即認(rèn)為數(shù)據(jù)存在異常. 這里我們通過VS-C+實(shí)現(xiàn)該模型。第一次N值比較第二次N值比較100.76592.5106601.40525.61545.2.4 交易狀態(tài)異常檢測方案模型:通過三個(gè)重要指標(biāo)的異常數(shù)據(jù)檢測模型的建立,當(dāng)任一指標(biāo)出現(xiàn)異常數(shù)據(jù)即可及時(shí)發(fā)現(xiàn).根據(jù)題目中描述常見的故障場景包括但不限于如下情形:1) 分行側(cè)網(wǎng)絡(luò)傳輸節(jié)點(diǎn)故障,前端交易無法上送請求,導(dǎo)致業(yè)務(wù)量陡降;2) 分行側(cè)參數(shù)數(shù)據(jù)變更或者配置錯(cuò)誤,數(shù)據(jù)中心后端處理失敗率增加,影響交易成功率指標(biāo);3) 數(shù)據(jù)中心后端處理系統(tǒng)異常(如操作系統(tǒng) CPU 負(fù)荷過大)引起交易處理緩慢,影響交易響應(yīng)時(shí)間指標(biāo);4) 數(shù)據(jù)中心后端處理系統(tǒng)應(yīng)用進(jìn)程異常,導(dǎo)致交易失敗或響應(yīng)緩慢。故障場景1對應(yīng)交易量出現(xiàn)異常降低的數(shù)據(jù)。故障場景2對應(yīng)交易成功率出現(xiàn)異常降低的數(shù)據(jù)。故障場景3對應(yīng)響應(yīng)時(shí)間出現(xiàn)異常上升的數(shù)據(jù)。故障場景4對應(yīng)響應(yīng)時(shí)間出現(xiàn)異常上升的數(shù)據(jù)和交易成功率出現(xiàn)異常降低的數(shù)據(jù)。交易量狀態(tài)成功率狀態(tài)響應(yīng)時(shí)間狀態(tài)故障場景1100故障場景2010故障場景3001故障場景4011正常情況000以上分析得出每一個(gè)指標(biāo)數(shù)據(jù)出現(xiàn)異常至少對應(yīng)一個(gè)故障場景(而且故障場景不限于以上4種)。結(jié)合現(xiàn)實(shí)中故障有一定的持續(xù)時(shí)間,因此只有當(dāng)一個(gè)指標(biāo)出現(xiàn)異常一定時(shí)間,才應(yīng)發(fā)出故障報(bào)警。因?yàn)槿鄙倜糠N故障場景所需的修復(fù)時(shí)間,我們將其暫定8分鐘。a.模型的建立該模型的設(shè)計(jì)方案采用如下流程圖:因?yàn)轭}目所給數(shù)據(jù)中沒有故障標(biāo)記,8分鐘內(nèi)異常數(shù)據(jù)次數(shù)累計(jì)的閾值難以確定,所以在這里我們假定該閾值為N。我們使用VS-C+編寫程序來實(shí)現(xiàn)這一模型,當(dāng)某一參數(shù)8分鐘內(nèi)異常數(shù)據(jù)超過閾值N,就判定交易狀態(tài)異常并及時(shí)報(bào)警??紤]到數(shù)據(jù)中心后端處理系統(tǒng)異常(如CPU負(fù)荷過大)引起交易處理緩慢,這樣的故障在一定時(shí)間內(nèi)可以自我恢復(fù),所以我們設(shè)置了另閾值M,我們在此設(shè)定M為2,若2次之后仍檢測為故障,判定為沒能自我修復(fù),則輸出故障信號(hào)。三種特征參數(shù)的數(shù)據(jù)檢測,都為間斷性重復(fù)檢測,時(shí)間間隔為0.1S,排除意外因素導(dǎo)致誤報(bào)率提高。并且對三種數(shù)據(jù)的異常數(shù)據(jù)次數(shù)在相應(yīng)時(shí)間內(nèi)累加,并與相應(yīng)的閾值比較,并判定故障原因,減小誤報(bào)率。5.3 問題三的分析:需要獲得的數(shù)據(jù)有:1. 每分鐘交易金額若每分鐘交易金額增大,每筆交易的平均時(shí)間會(huì)有一定的增加,間接的導(dǎo)致交易量的下降。若但是值得注意的是,交易金額在交易量絕對數(shù)量較大時(shí)對交易量影響較大,在ATM閑時(shí)影響會(huì)比較小。發(fā)現(xiàn)交易量的突降,如果同時(shí)交易金額的突增,可以不進(jìn)行故障場景1預(yù)警,降低故障場景1的誤報(bào)率。2. 網(wǎng)絡(luò)隨機(jī)信號(hào)傳輸時(shí)間一般通信系統(tǒng)中傳輸?shù)男盘?hào)都具有一定的不確定性,因此都屬于隨機(jī)信號(hào)。在信號(hào)傳輸過程中,不可避免地會(huì)受到各種干擾和噪聲的影響。假如交易時(shí)隨機(jī)信號(hào)傳輸時(shí)間過長,這也將導(dǎo)致交易反應(yīng)時(shí)間過長,交易量也會(huì)明顯下降。所以,應(yīng)排除網(wǎng)絡(luò)隨機(jī)信號(hào)傳輸時(shí)間的影響,這樣可以減少誤報(bào)率。3. 網(wǎng)絡(luò)負(fù)載率若檢測到網(wǎng)絡(luò)負(fù)載率達(dá)到較大值或者滿載值,響應(yīng)時(shí)間較大,成功率較低或交易量驟減就很可能不是前端或后端的故障問題導(dǎo)致,而是數(shù)據(jù)傳輸過程出現(xiàn)阻塞導(dǎo)致,此數(shù)據(jù)的采集也能一定程度上減少誤報(bào)率。3六.模型的評(píng)價(jià)6.1 模型的優(yōu)點(diǎn):1) 在問題一中我們首先進(jìn)行了相關(guān)性分析,從而直接排除了成功率與響應(yīng)時(shí)間的特征參數(shù)的分析,使問題得到了簡化。2) 在問題二中我們對三個(gè)指標(biāo)的異常數(shù)據(jù)判斷分別建立了模型,減少了誤報(bào)率。3) 在問題三中我們考慮增加每分鐘交易金額、網(wǎng)絡(luò)隨機(jī)信號(hào)傳輸時(shí)間、網(wǎng)絡(luò)負(fù)載率,從而使各個(gè)參數(shù)的正常區(qū)域劃分更為可靠,大大地減少了誤報(bào)率。6.2 模型的缺點(diǎn):1) 對于異常數(shù)據(jù)沒有進(jìn)一步分析,可能導(dǎo)致系統(tǒng)誤差比較大,影響報(bào)警精確性。2) 特征參數(shù)不夠全面,分析結(jié)果可能與實(shí)際情況有差距。七.參考文獻(xiàn)1: 蔡寧偉,ATM現(xiàn)金存取款異常行為的實(shí)證研究,中國電子銀行網(wǎng)2: 楊小勇,方差分析法淺析單因素的方差分析,實(shí)驗(yàn)科學(xué)與技術(shù),2013, 11(1)3: 張旭,跨銀行自動(dòng)柜員機(jī)(ATM)網(wǎng)絡(luò),廣州:廣東機(jī)械學(xué)院學(xué)報(bào),第14卷第2期 . 八.附錄Spss代碼:1.GET DATA /TYPE=XLSX /FILE=C:UsersASUSDesktop工作簿1.xlsx /SHEET=name Sheet1 /CELLRANGE=full /READNAMES=on /ASSUMEDSTRWIDTH=32767.2.CORRELATIONS /VARIABLES=時(shí)間 響應(yīng)時(shí)間 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.3.CORRELATIONS /VARIABLES=時(shí)間 交易量 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.4.CORRELATIONS /VARIABLES=時(shí)間 成功率 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.5.CORRELATIONS /VARIABLES=成功率 響應(yīng)時(shí)間 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.6.CORRELATIONS /VARIABLES=交易量 成功率 /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.7.GRAPH /SCATTERPLOT(XYZ)=日期 WITH 交易量 WITH 時(shí)間 /MISSING=LISTWISE.8.GRAPH /SCATTERPLOT(BIVAR)=時(shí)間 WITH 交易量 /MISSING=LISTWISE.9.C+交易量累加達(dá)到閾值統(tǒng)計(jì)成功率函數(shù)int main()fstream in;in.open(all.txt, ios:in);if (!in.is_open()cout 文件無法打開 a&fabs(a + 1) 1e-6)/0:序號(hào) 1:日期 2:時(shí)間 3:交易量 4:成功率 5:響應(yīng)時(shí)間datnum + 10 = a;in datnum + 11 datnum + 12 datnum + 13 datnum + 14;in datnum + 15;num+;in.close();fstream out;int date;out.open(all_r.txt, ios:out);if (!out.is_open()cout 文件無法創(chuàng)建 endl;return -1;int ii = 0;for (int i = 1; i = num; i+)float sum = dati3, suc = dati3 * dati4;for (int j = i + 1; sum threshold&j i + 5; j+, dati4 = suc / sum)/交易量大于閾值和累計(jì)天數(shù)雙重限制sum += datj3, suc += datj3 * datj4;if (dati4 Low)out i t dati4 endl;ii+;out ii endl;in.close();out.close();10.C+方差分析法函數(shù)int main()fstream in;in.open(all.txt, ios:in);if (!in.is_open()cout 文件無法打開 a&fabs(a + 1) 1e-6)/0:序號(hào) 1:日期 2:時(shí)間 3:交易量 4:成功率 5:響應(yīng)時(shí)間datnum + 10 = a;in datnum + 11 datnum + 12 datnum + 13 datnum + 14;in datnum + 15;num+;in.close();fstream out;int date;out.open(all_r.txt, ios:out);if (!out.is_open()cout 文件無法創(chuàng)建 endl;return -1;float sum0 = 0, suc0 = 0, avg;for (int i = 1; i = num; i+)sum0 += dati3;suc0 += dati3 * dati4;avg = suc0 / sum0;int ii = 0, n = 0;for (int i = 1; i = num; i+)float sum = dati3, suc = dati3 * dati4;for (int j = i + 1; sum threshold&j i + 5; j+, dati4 = suc / sum)/交易量大于閾值和累計(jì)天數(shù)雙重限制sum += datj3, suc += datj3 * datj4;float sigma, s = 0;for (int i = 1; i = num; i+)s += pow(dati4 - avg, 2);sigma = sqrt(s / num);out avg endl sigma endl;for (int i = 1; i = num; i+)if (dati4 avg - 3 * sigma)dati4 = 0;ii+;for (int i = 1; i = num; i+)if (dati4)sum0 += dati3;suc0 += dati3 * dati4;avg = suc0 / sum0;out ii endl;s = 0;for (int i = 1; i = num; i+)if (dati4)s += pow(dati4 - avg, 2);n+;sigma = s
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江汽車職業(yè)技術(shù)學(xué)院《深度報(bào)道研究》2023-2024學(xué)年第二學(xué)期期末試卷
- 黑龍江林業(yè)職業(yè)技術(shù)學(xué)院《信息系統(tǒng)開發(fā)與應(yīng)用綜合專題》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北醫(yī)科大學(xué)臨床學(xué)院《土地規(guī)劃設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶信息技術(shù)職業(yè)學(xué)院《環(huán)境與健康》2023-2024學(xué)年第二學(xué)期期末試卷
- 新疆維吾爾醫(yī)學(xué)??茖W(xué)?!缎l(wèi)生監(jiān)督學(xué)A》2023-2024學(xué)年第二學(xué)期期末試卷
- 晉中師范高等專科學(xué)?!稒C(jī)械基礎(chǔ)與液壓傳動(dòng)》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海中僑職業(yè)技術(shù)大學(xué)《中醫(yī)診斷學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南司法警官職業(yè)學(xué)院《機(jī)器視覺系統(tǒng)設(shè)計(jì)與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 2024年醫(yī)學(xué)研究與試驗(yàn)發(fā)展服務(wù)項(xiàng)目資金申請報(bào)告代可行性研究報(bào)告
- 連續(xù)剛構(gòu)橋畢業(yè)設(shè)計(jì)答辯
- 天然氣管道工程段線路安裝工程魚塘(水塘)穿越施工方案
- 教練技術(shù)三階段講義
- 證券公司營業(yè)部網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱D
- 2001船舶修理價(jià)格本中文
- 某污水處理廠自控系統(tǒng)調(diào)試方案(常用)
- 藍(lán)色背景-PPT模板
- 設(shè)備檢維修作業(yè)票填寫模板
- 危大工程動(dòng)態(tài)管控表
- 商場重大危險(xiǎn)源評(píng)估標(biāo)準(zhǔn)
- 新生兒和兒童吞咽障礙的臨床評(píng)估
- DB62∕T 25-3111-2016 建筑基坑工程技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論