ATM机交易状态预警模型的建立

2018-01-17 00:38张静廖逸文
电子技术与软件工程 2017年24期
关键词:预警模型聚类算法

张静+廖逸文

摘 要

随着经济的不断发展,人们与银行打交道越来越频繁,ATM机在其中起着重要的作用,但时常有故障的产生,给人们生活带来不便。针对此问题,设计一套交易状态异常检验方案,从而实现对ATM机系统的监测和异常检测。针对任务和客户位置比较密集的区域,建立基于定位系统ATM机的预警通用程序,使得出现故障的ATM机能够及时的维修,同时使维修费用价格尽可能地合理化。

【关键词】ATM机 多元回归模型 聚类算法 打包 预警模型

1 引言

随着金融电子化的发展,ATM机数量在生活中不断增多且得到广泛使用。但同时也出现了许多利用ATM机盗取合法持卡人钱款的犯罪活动等其他交易异常的恶性事件。而通过对ATM 机的特征分析和异常检测成为增强ATM机在生活中安全使用的可靠性和保护合法持卡人利益与银行利益的重要依据。因此,如何在监测中及时发现异常并准确报警而避免犯罪发生,保护合法持卡人利益与银行利益防范各种针对ATM机异常行为是一个急需解决的问题。

经查找文献资料,李战明等人[1]提出一种基于隐马尔可夫模型(hidden markov model,HMM)的ATM机异常行为识别方法。采用Baum-Welch算法对正常行为训练并建立隐马尔可夫模型,通过模型输出测试样本序列的概率来识别异常行为。陈敏智等人[2]提出一种基于支持向量机(Supportvector machine,SVM)的针对ATM机的异常行为检测方法,用SVM算法对有效跟踪轨迹信息进行异常行为识别。在异常检测在报警关联分析部分,王娟等人[3]利用经典统计模型即均值方差模型检测报警流量强度的异常,进而把异常的时间段提供给报警关联,仅对异常时间段内的报警进行关联分析。

经过资料分析,之前的研究主要放在了对ATM机使用者的异常行为信息的识别及报警方面。但对交易数据的信息异常此处做的研究少之甚少,太过片面,存在着漏洞。而本文利用Excel和SPSS辅助通过对某商业银行 ATM 应用系统某分行的交易统计数据分析,基于对数据的统计信息构建ATM机系统的行为特征,实现对ATM机系统的监测和发现异常,对基于异常情况和特征值等因素做了研究, 把ATM机系统的异常特征与异常检测技术结合, 以提高ATM机交易系统的应用可用性,达到及时报警并减少虚警误报的目的。

2 建立交易状态异常检验线性回归模型

2.1 模型的建立

首先,我们对某商业银行在长春市六大城区和四个开发区的ATM机交易反馈情况作为实践对象,展开调查采集数据。ATM机失败率指单位时间内,交易失败量占总交易量的比重,即机器处理故障发生的概率。为设计一套交易状态异常检验方案,以平均失败率为因变量,以传输信号强度,中心后台处理异常率,ATM机交易时间,平均交易量和平均响应时间作为自变量,建立交易状态异常检验线性回归模型。

因为数据较为庞大,为此我们把每天的时刻分为三个组成部分,step1:时间为8:00---20:00,通过EXCEL均值处理,得到高峰時期交易状态数据;step2:时间为0:00--8:00和20:00---24:00,通过EXCEL均值处理,得到低谷时期交易状态数据;step3:抽样交易状态数据。在这三个阶段中,以半个小时为单位,对抽样数据中平均失败率进行预测,影响因素有传输信号强度,中心后台处理异常率,平均陡峭率(即这一时间点与上一时间点的差值),平均交易量,平均响应时间和响应时间方差。

应用多元线性回归模型,利用软件SPSS 22.0,对ATM机失败率及其上述六个影响因子进行回归分析,建立多元线性回归方程:

Y=k1x1+k2x2+k3x3+k4x4+k5x5+k6x6+C

其中,Y表示平均时刻失败率,x1表示平均时刻交易量,x2表示平均时刻响应时间,x3表示平均陡峭率,x4表示高峰响应时间方差,x5表示传输信号强度,x6表示中心后台处理异常率。

2.2 模型求解与结果分析

建立警示器雏形:判断当Y值>0.05即失败率>0.05进行警报。为了完善此警报器,我们对整个数据进行了筛选,筛选出失败率>0.2的数据进行线性回归。利用SPSS软件对高峰时期ATM机失败率及其上述六个影响因子进行回归分析,得到回归方程:

Y=0.355x1-0.065x2-0.326x3-0.031x4-0.43x5-0.516x6+0.046

利用SPSS软件对低谷时期ATM机失败率及其上述六个影响因子进行回归分析,得到回归方程:

Y=0.141x1+0.481x2-0.001x3+0.220x4-0.37x5-0.433x6+0.037

给出五组交易状态模拟值,将五组数据代入上述方程获得如表1。通过表可以看出,该模型的模拟值与实际值的相对误差在5%以内,通过图表分析,基本符合实际数值,残差较小,说明该模型可靠性好。

3 建立基于定位ATM机系统的预警通用程序

为使警报器能切身实际的便利人们的生活,提高ATM机的业务效率,我们拟做一个通用程序。该通用程序的功能如下:定位附近1KM内所有ATM机位置,业务成功率较好的以红色显示,业务成功率较差的进行隐藏,并把相关数据发送给该银行,银行接收到数据进行检查处理。若是银行内部通信问题,便等待通信恢复;若是ATM机的故障时,便派去维修人员进行维修处理,恢复后依然显示在通用程序的定位上。

抽样获取每个ATM机数据:交易成功率,经度坐标,纬度坐标,响应时间,与之相对应的维修人员经度,纬度,维修人员的业务能力,信用度。当ATM机出现故障时,及时维修的效率也影响着银行业的业务质量,所以维修人员相关问题也起着至关重要的。但维修人员维修ATM机产生的费用,也可能存在问题。对此我们对该问题研究。为使维修费用价格尽可能的合理,提出了如下几个问题:endprint

(1)在已结束项目任务数据基础上,建立合理的指标,并分析ATM机和维修员定价“供求匹配”程度。

(2)针对多任务多维修员争相选择的问题,单独选取任务和用户位置比较密集的区域,修订问题一的定价模型,并评价该方案的实施效果。

Step 1:通过智能交互地图和聚类算法,得到绿园区、朝阳区、宽城区、二道区、南关区和开发区六个区域的ATM机中心位置。

Step 2:在某个区域内,进行合理的打包过程,使得出现故障的ATM机能够及时的维修,同时使维修费用价格尽可能的合理,找到距离故障的ATM机最近的且报价合理的维修人员。此模型的算法思想如下:

(1)输入:A数组存放的故障ATM机位置坐标(Aio,Ai1);

(2)对A数组存放的位置坐标进行遍历,for循环如下:

{int i=0;i

{int j=i+1;j

(3)为避免数据重复性,用数组B对A数组同步。若B(i)=i,代表该数据使用过,break;

(4)循环条件:(Ai0-Aj0)2+(Ai1-Aj1)2≤阈值,阈值设定为0.003;

(5)每个任务包中的任务量决定维修定价的权重,权重值=(11-n)/10;

(6)输出:数组接受打包的三个任务编号,并将编号存到数组中;

实验部分JAVA代码及结果(如图1所示)。

Step 3:通过MATLAB编程得到距离与任务定价的规律,其中,x表示需要维修的ATM机任务位置与维修员的距离,Y表示维修定价。我们对所有任务数据进行3次拟合,得到六个区域的拟合方程为:

绿园区:Y=0.0044x^3-0.0209x^2-0.6148x -0.0335

朝阳区:Y=0.0513x^3-0.3520x^2+0.3991x +0.2474

宽城区:Y=0.1250x^3-0.0364x^2-0.1397x -0.0967

二道区:Y=-0.0652x^3-0.2281x^2+0.2991x +0.1598

南关区:Y=0.2412x^3-0.0506x^2-0.7349x +0.3015

开发区:Y=0.0428x^3-0.0674 x^2+0.5 953x -0.0841

4 预警通用模型检验

我们应用JAVA软件,分别计算六区域定价与所求得的定价容错阈值内的正确率,当每个区域的阈值正确率高于70%后,则认为任务定价方案较合理,算法思想:

(1)输入:期望值、最小距离、维修定价、拟合维修定价;

(2)循环条件:abs(拟合维修定价-维修定价)≤ 3;

(3)输出:若满足循环条件,输出结果为1;若不满足循环条件,输出结果为0;

本文设置维修定价的容错率(阈值)为3。检验容错率的部分Java代码如图2所示。

统计结果为:绿园区、朝阳区、宽城区、二道区、南关区和开发区六个区域的维修定价容错率的结果比对模型正确的概率值分别为79.31%、85.67%、90.03%、86.45%、75.48%和89.27%。

5 总结和评价

本文首先建立了交易状态异常检验线性回归模型,设计一套交易状态异常检验方案,通过SPSS编程研究ATM机失败率和ATM机交易时间,平均交易量,响应时间等因素的规律。针对任务和客户位置比较密集的区域,建立基于定位系统ATM机的预警通用程序,使得出现故障的ATM机能够及时的维修,同时使维修费用价格尽可能地合理化。对区域进行合理的打包过程,找到距离故障的ATM机最近的且报价合理的维修人员,通过MATLAB编程分析发布位置与维修定价的关系。

参考文献

[1]李战明,宋丙菊.基于隐马尔可夫模型的ATM机用户异常行为识别[J].兰州理工大学学报,2012(05):76-81.

[2]陈敏智,汤一平.基于支持向量机的针对ATM机的异常行为识别[J].浙江工业大学学报,2010(05):546-551.

[3]王娟,秦志光,叶李,靳京.异常检测在报警关联分析中的应用[J].解放军理工大学学报(自然科學版),2009(03):278-280.

[4]张超群,孟海东.数据挖掘中聚类分析算法及应用研究[J].山东工业技术,2017(11):159.

作者简介

张静(1990-),女,山东省滨州市人。硕士学位。吉林建筑大学城建学院助教。主要研究方向为计算数学。

廖逸文(1997-),男,浙江省南京市人。吉林建筑大学城建学院2015级本科学生。主要研究方向为应用软件开发。

作者单位

吉林建筑大学城建学院 吉林省长春市 130111

猜你喜欢
预警模型聚类算法
基于RS—ANN的大学生心理危机预警模型构建与应用
基于K?均值与AGNES聚类算法的校园网行为分析系统研究