ATM交易状态特征分析与异常检测

2018-09-20 10:47常惠华
价值工程 2018年28期
关键词:异常检测方差分析

常惠华

摘要:针对ATM交易系统产生的交易数据,对交易量、交易成功率和响应时间进行特征分析进而建立异常检测模型。利用方差分析法以及3σ思想,均值设为u,标准差设为σ,将每天交易量与均值的差值在u±3σ之外的值标记为异常点。对于成功率和响应时间,首先利用k-means聚类分析将数据进行划分,然后利用决策树思想确定类之间的阈值,根据阈值可区分出数据异常点。由此可找出交易量、交易成功率和响应时间的异常值,进而建立ATM异常检测系统。

Abstract: Based on the transaction data generated by ATM transaction system, the characteristics of trading volume, transaction success rate and response time are analyzed and the anomaly detection model is established. By using the variance analysis method and 3σ ideas, set for the mean u, standard deviation σ, mark the difference between the daily trading volume and the mean value over u±3σ as an abnormal point.In terms of success rate and response time, firstly, k-means cluster analysis is used to divide the data and then use the decision tree to determine the threshold value between classes, and the abnormal data points can be distinguished according to the threshold value.According to the above method, the abnormal value of trading volume, transaction success rate and response time can be found, and the ATM anomaly detection system can be established.

關键词:ATM交易;异常检测;方差分析;k-means聚类分析

Key words: ATM transactions;abnormal detection;variance analysis;K-means cluster analysis

中图分类号:TP391.9 文献标识码:A 文章编号:1006-4311(2018)28-0216-04

0 引言

随着商业银行ATM业务的快速发展,银行承担的确保ATM交易系统稳定运行的压力越来越大,交易系统的性能管理问题也尤为重要。因此,银行对ATM交易状态的准确的异常检测与及时报警成为解决问题的关键一步[1-2]。

本文的主要研究内容是根据汇总信息包含的三个指标(交易量,交易成功率,交易响应时间),选择、提取、分析ATM交易状态的特征参数[3],并设计一套交易状态异常监测方案,达到故障场景的正确判断与及时报警的要求。

1 ATM交易系统的数据预处理与分析

1.1 交易数据的相关性分析

利用商业银行1月23日至4月23日的数据,对交易量X、交易成功率Y、交易响应时间Z进行相关性分析,并得出三个指标ρ(X,Y),ρ(X,Z),ρ(X,Z)的大小。

通过表1,可得出:

①交易量与成功率、响应时间不存在明显的相关性。

②成功率与响应时间存在负相关,即数据中心后端系统处理异常,导致交易失败则响应时间加长。

1.2 交易数据的特征分析

1.2.1 交易业务量的特征分析

每日总业务量与日期的折线图如图1-图2。

由图1得知:

①前12天每天的总交易量波动较大,没有一定的规律,无周期性。

②12天之后每天的总交易量变化波动较小,具有一定的周期性。

前12天是我国著名的节日-春节,春节期间日总交易量受节日气氛的影响较大,变化波动性大,因此将春节期间的交易量单独作为一部分分析,另外春节后的日总交易量变化不大。

由图2可知:

①交易量与时刻的图像近似于M型,呈“双峰型”分布。

②交易量在0:00-7:00时刻处于较低水平,因为人们处于睡眠状态,活动量不大故交易量较低;7:00-21:00处于较高水平,因为该时间段为工作阶段,人们活动量大导致交易量较高。

1.2.2 交易成功率和交易响应时间的特征分析

首先作出交易成功率、交易响应时间与时刻的散点图如图3、图4所示。

成功率、响应时间与时刻散点图大体上呈直线状分布,基本上稳定在一个区间上,当成功率较高或响应时间较低时属正常情况,当成功率长时间低于稳定区间时,可能出现了异常情况。当响应时间过长时,可能是ATM机出现故障导致响应时间偏离正常区间。

2 基于方差分析的交易量异常检测[4-6]

首先考虑春节期间的每天各时刻的交易量,然后求出春节期间每天各时刻的交易量平均值,如图5所示。

图5红色曲线表示的是春节期间各时刻的交易量均值,可见春节期间每天各时刻的交易量与平均值有较大的差异,因此做出各时刻交易量与均值的差值。

图6所示,每天各时刻的交易量与均值的差异近似服从正态分布,因此利用方差分析,将差值较大的交易量定义为异常值。

对于春节后期,首先作出每天各时刻的交易量,然后求出春节后每天各时刻的交易量平均值。

图7中,红色曲线表示的是春节后各时刻的交易量均值,春节后期每天各时刻的交易量与平均值有较大的差异,因此做出各时刻交易量与均值的差值。

图8所示,春节后每天各时刻的交易量与均值的差异近似服从正态分布,可利用方差分析,将差值较大的交易量定义为异常值。经分析,我们将u+3σ作为其置信区间[7]更具合理性。

为了防止偶然性系统失误造成的影响,对偶然产生的一次较大偏差不进行预警,当某段时间内出现至少k次较大偏差时才做出预警,通知维修人员对ATM进行维护。经过测试,我们认为k=3时较为准确,因此对10min内异常值次数k?叟3时实施报警。

3 基于聚类分析的成功率和响应时间异常检测

由成功率-响应时间散点图可看出位于左上角区域的部分,成功率低且响应时间较长,因此可将这部分的点定为异常值区域。右下角区域的数据点较为集中,成功率较高且响应时间[8]低,因此为正常点区域,但是蓝色圆圈中的数据点远离正常点区域,可将其视为可疑点,再进一步对其进行分析。

3.1 春节期间成功率与响应时间的异常分析

对春节期间(1月23号-2月3号)阶段,先随机选取八天进行聚类。经过k-means聚类之后,可得三类的聚类中心分别为(0.9565,73.2518)、(0.9585,100.3413)、(0.8930,845.8833)。交易的成功率较高且响应时间偏低,利用决策树思想可以确定响应时间正常值与异常值间阈值为466.339925。如图10所示,蓝色直线为阈值,阈值上方的區域表示交易响应时间过长则为异常点区域,反之阈值下方的区域则为正常点区域。

利用春节期间的任一天(选取1月31号)的交易数据作为测试数据来验证阈值的合理性。通过图10可以看出1月31号这天的数据都分布在阈值以下属于正常值,通过测试数据的验证表明该阈值的选取非常合理,划分效果很好。

3.2 春节后成功率与响应时间的异常分析

对于春节后(2月4号-4月23号)阶段,同样随机选取八天进行聚类。经过k-means聚类之后,如图11,可得三类的聚类中心分别为(0.9581,107.7184)、(0.7566,15627)、(0.1181,49856)。

蓝色直线分别代表成功率与响应时间的阈值,利用决策树思想可以确定成功率阈值为0.43735,响应时间的阈值为7867.3592。位于右下角区域的数据点较为集中,成功率较高且响应时间低为正常点区域。反之其他三个区域超出了成功率与响应时间的阈值范围属于异常值区域。

利用春节后的任一天(选取2月22号)的交易数据作为测试数据来验证阈值的合理性。通过图11可以看出2月22号的数据都分布在阈值以下属于正常值,通过测试数据的验证表明该阈值的选取非常合理,划分效果很好。

通过以上的分析可得,令W表示判定结果(1为正常值,0为异常值),T为响应时间,S为成功率。

由以上检测方案可得表3报警点。

4 结论

本文通过对ATM交易系统产生的交易数据进行特征分析进而建立了异常检测模型。利用方差分析法以及3 思想,能够有效的找出交易量异常点。利用k-means聚类分析和决策树思想可区分出数据交易成功率和响应时间异常点。本文设计的一套交易状态异常监测方案,达到故障场景的正确判断与及时报警的要求,ATM交易系统的性能管理问题有了一定的突破。

参考文献:

[1]Zimmermann C M,Bridger R S.Effects of dialogue design on automatic teller machine(ATM) usability:Transation times and card loss[J].Bchaviour & Information Technology,2000,19(6):441-449.

[2]Yu H K,LeeK W.A study on the efficient operation of automated teller Machine(ATM)maintenance using simulation[C]//IEEE International Conference on Emergency Management Sciences,2011:520-524.

[3]孙博,康锐,张叔农.基于特征参数趋势进化的故障诊断和预测方法[J].航空动力学报,2008(02):393-398.

[4]Roll R.A mean/variance analysis of tracking error[J].Journal of Portfolio Management,2009,18(4):13-22.

[5]Kruskal W H, Wallis W A.Errata:use of ranks in one-criterion variance analysis[J]. Journal of the American Statistical Association, 1952, 47(260):583-621.

[6]吕栋雷,曹志耀,邓宝,汪亚夫.利用方差分析法进行模型验证[M].计算机仿真期刊,2006(08):34-35.

[7]盛骤,谢式千,潘承毅.概率论与数理统计[M].高等教育出版社,2008(06):121-123.

[8]过莉.ATM网络实时通信系统的响应时间分析[J].电机电器技术,2003(06):33-37.

猜你喜欢
异常检测方差分析
Excel在《生物统计学》双因素有重复方差分析中的应用与探讨
高校二手书市场细分研究
应用统计学课堂教学组织实践与探索