曹雨濛
基于某商业银行ATM应用系统某分行的交易统计数据,对ATM交易状态的特征参根据图像进行相关性分析数并利用因子分析对特征参数进行降维提取和分析出.再利用对所求的特征参数通过 K-Means 聚类分析的方法对异常值进行分析并确定异常值的判定标准。
1 引言
中国已成为全球第二大ATM市场,目前ATM还在快速建设发展中,各家商业银行纷纷利用ATM来抢占自助渠道、扩大与延伸服务范围。ATM机作为银行业务电子化和自动化的一部分,它借助现代化的自助服务设备,为客户提供方便、高效的金融服务。
2 模型的建立与求解
2.1特征参数的提取与分析
2.1.1 模型的分析
首先对数据预处理,选取数据中变量交易量,响应时间,工作日或非工作日,一天中的不同时间作为要分析的特征参数,通过因子分析降维后观察哪个参数占所比重最大。再由Matlab生成响应时间-成功率,日期-成功率,时间-成功率,交易量-成功率的图像进行函数分析,找出对成功率影响最大的参数后,将其设为特征参数,并对其与成功率的函数拟合近似图像,另对数据进行筛选[1]后做出时间-日期-成功率的三维图像,进一步进行观察。
2.1.2模型的求解
通過spss进行分析后的数据如图所示;
相关矩阵
其中V1表示日期,V2表示时间,V3表示交易量,V4表示成功率,V5表示响应时间;成分1,2,3分别代表V5,V3,V2;
从数据中可以观察得交易量和时间对成功率的影响相同,远大于其他因素(响应时间等),故交易量是一个特征参数;
通过Matlab对每个月各个参数与成功率的关系绘制图像,其中时间-成功率的函数起伏最明显且1-4月每天的起伏程度类似,可以近似成周期函数。
通过函数图像的拟合函数曲线可知特征参数取时间,交易量和响应时间。
2.2 异常值的分析
2.2.1模型的求解
初始设置为三个类,然后利用K-MEANS算法进行迭代生成每个类的中心坐标,再根据图中每个类的位置来取对应的范围。
最终聚类中心
x轴表示响应时间,y轴表示交易量,z轴表示时间。
读出坐标
这三个即为所求的类,
若数据中出现异常情况,则会超出此范围,异常数据得到检验。
(作者单位:吉林大学数学学院)