杨静雅
(中建丝路建设投资有限公司,陕西,西安 710000)
目前大多数企业仍然利用人工的方式录入电子财务报销入账凭证,这种工作方式的效率主要是由工作人员的业务熟练程度决定的,人力成本较大[1-2]。为了提高企业的工作效率,需要对电子财务报销入账凭证录入方法进行分析和研究。
王凯丽等[3]提出基于二维局部二值模式的电子财务报销入账凭证录入方法,该方法基于LBP特征图,引入LBP模式和滑动窗口统计会计财务报销入账凭证中的上下文信息,获得2DLBP特征,将其输入支持向量机中,完成电子财务报销入账凭证的分类录入,该方法在特征提取过程中没有消除信息中存在的噪声,受噪声干扰凭证录入所用时间较长,存在录入效率低的问题。谭洁帆等[4]提出基于卷积神经网络的电子财务报销入账凭证录入方法,该方法将电子财务报销入账凭证通过卷积神经网络映射到欧几里得空间中进行编码,利用采样方法构建数据集,并对其进行平衡化处理,通过CSSVM分类算法对凭证赋予对应的代价因子,实现电子财务报销入账凭证的分类录入,该方法没有消除信息之间存在冗余,降低了电子财务报销凭证录入的精准度。孙劲光等[5]提出基于概率图模型的电子财务报销入账凭证录入方法,该方法将电子财务报销入账凭证划分为5个区域,在概率图模型分类方法理论的基础上通过Softmax分类层和5个分类子网络构建凭证分类模型,完成电子财务报销入账凭证的分类录入,该方法获取的特征信息不准确,降低了电子财务报销入账凭证录入的完整度。
为了解决上述方法中存在的问题,提出电子财务报销入账凭证自动录入方法,在电子化智能填单系统中,提取录入电子财务报销入账凭证中的文字信息,在财务管控系统中录入提取的文字信息,获得管控单据。通过Gabor滤波器对录入数据进行降噪和去冗处理,提高了财务报销入账凭证录入的效率、录入精准度和录入完整度。
电子财务报销入账凭证自动录入方法设计一个Gabor滤波器组,对电子财务报销入账凭证图像进行滤波,二维Gabor函数在时域中属于高斯函数调制的复数正弦函数[6-7],在时域中通过式(1)描述二维Gabor函数的一般形式,
(1)
式中,(x′,y′)代表时域坐标旋转结果,σx、σy代表尺度参数,γ代表高斯函数对应的横纵比,φ代表尺度参数,f代表Gabor函数余弦部分中的频率。
二维Gabor函数根据坐标轴旋转的傅里叶变换法在电子财务报销入账凭证图像频域中通过式(2)进行描述,
(2)
式中,(u′,v′)代表频域坐标旋转结果,e代表滤波系数。
应对不同的空间方向和频率,将录入的电子财务报销入账凭证图像分解为若干个滤波图像,采用Gabor变换对电子财务报销入账凭证图像ζ(x,y)进行变化[8],获得式(3),
r(x,y)=g(x,y)*ζ(x,y)
(3)
式中,*描述的是卷积运算。
分析式(3)可知,通过计算f、γ、σ、θ可以确定Gabor滤波器对电子财务报销入账凭证图像进行滤波的计算式。并通过式(4)确定参数f、σ,
(4)
式中,f代表滤波器对应的中心频率。
滤波器通常情况下存在几个滤波,在本文中,区分电子财务报销入账凭证图像的基础是滤波之间存在的信号响应关系[9],通过式(5)选择凭证图像的离散旋转角度,
(5)
式中,n代表旋转角度,θl代表第l个角度。
电子财务报销入账凭证自动录入方法采用Gabor能量描述电子财务报销入账凭证图像的纹理特征,如式(6),
(6)
式中,rζ,f,θ,0、rζ,f,θ-(1/2)π为相互对称的滤波。
将滤波后的电子财务报销入账凭证图像的S型调制转变为正方形调整[10],如式(7),
(7)
在实际中,Gabor滤波效果会受到纹理特征起伏变化的影响,包括玫瑰斑、伪纹理等噪声的引入,为了解决上述问题,对Gabor滤波输出的电子财务报销入账凭证图像进行Gauss低通滤波处理,如式(8),
(8)
式中,σs代表高斯窗口函数对应的标准差。
为了改善电子财务报销入账凭证分类的效果,提高运算效率,降低特征维数,需要对凭证数据进行特征提取。采用顺序向前搜索算法将平均入账凭证J-M距离作为指标实现特征提取,平均J-M距离如式(9),
(9)
式中,JM代表平均距离,pi、pj代表类别i和类别j对应的先验概率,JMij代表类别i和类别j之间存在的J-M距离,Bij代表B氏距离,Mi、Mj分别代表i和类别j对应的样本均值向量,Vi、Vj代表类别i和类别j对应的矩阵样本别方差,n代表类别总数。根据上述计算,提取电子财务报销入账凭证特征,为实现凭证自动录入做基础。
为实现凭证自动录入,通过支持向量机在高维解空间中构造一个可以划分两类,并使间隔最大的最优线性分类面,构建凭证自动录入决策函数。
通过式(10)描述凭证自动录入线性判别函数,
g(x)=w·x+b
(10)
分类面为g(x)=0,设xi代表输入向量,yi代表分类标记值,当分类标记值为1时表示属于,当分类标记值为-1时表示不属于。
通过带约束条件的极值问题代替线性分类问题,解决原有凭证自动录入无法实现最优线性路径的问题,如式(11),
(11)
在上述过程的基础上建立Lagrange方程,如式(12)。
(12)
利用式(13)对参数b和参数w求偏导,
(13)
支持向量即为取值不为零的ai,建立凭证自动录入决策函数,如式(14),
(14)
式中,(x·xi)代表核函数,描述的是x和xi之间的相似度,针对非线性变换φ(x),重新构建凭证自动录入决策函数,如式(15)。
(15)
将提取的特征输入上述凭证自动录入决策函数中,完成电子财务报销入账凭证分类和自动录入。
为了验证电子财务报销入账凭证自动录入方法的整体有效性,需要对电子财务报销入账凭证自动录入方法进行测试,本次测试采用Matlab R2013a软件,在联想ThinkStation P310 64位Windows旗舰版操作系统上实现,选用某公司的电子财务报销费用作为实验数据。分别采用电子财务报销入账凭证自动录入方法(方法1)、基于二维局部二值模式的电子财务报销入账凭证录入方法(方法2)和基于卷积神经网络的电子财务报销入账凭证录入方法(方法3)进行测试,将录入效率、录入精准度、录入完整度作为测试指标。
(1)录入效率
录入效率测试结果如图1所示。
图1 录入效率测试结果
分析图1可知,在多次迭代中方法1录入电子财务报销入账凭证所用的时间均在10 s以下,采用方法2和方法3在多次迭代中录入电子财务报销入账凭证所用的时间均高于15 s。通过上述对比分析可知,方法1录入电子财务报销入账凭证所用的时间最少,这是因为方法1在特征提取过程中采用Gauss低通滤波器消除噪声等干扰信息,缩短了特征提取所用的时间,进而缩短了电子财务报销入账凭证所用的时间,提高了方法1的录入效率。
(2)录入精准度
录入精准度测试结果如图2所示。
图2 录入精准度测试结果
通过图2可知,方法1的录入精度在多次迭代中均在80%以上,远远高于方法2和方法3的录入精准度,因为方法1通过Gabor滤波器对待录入的凭证数据进行降噪和去冗处理,消除了特征之间存在的冗余和干扰,提高了电子财务报销入账凭证录入的精准度。
(3)录入完整度
录入完整度测试结果如图3所示。
对图3中的数据进行统计分析可知,方法1在多次迭代中录入的电子凭证报销入账凭证的完整度均在90%以上,方法2和方法3在多次迭代中录入的电子凭证报销入账凭证的完整度在70%附近波动,根据测试结果可知,方法1的电子账务报销入账凭证录入完整度较高,因为方法1采用顺序向前搜索方法在多通道的滤波特征图像中提取凭证数据特征,将J-M距离作为评价指标,实现特征空间的优化,提高了电子账务报销入账凭证的完整度。
图3 录入完整度测试结果
记账凭证的源头经济业务随着信息化水平的提高逐渐向电子化流转,人工记账逐渐被计算机记账代替。使用计算机记账方式可以从日常繁杂的会计核算中解放财务人员,同时解决了业务流程和会计流程的分离问题,实现会计的管理、监督职责。目前电子财务报销入账凭证录入方法存在录入效率低、录入精准度低和录入完整度低的问题。提出电子财务报销入账凭证自动录入方法,提取电子财务报销入账凭证的特征,根据特征对其进行分类,完成电子财务报销入账凭证的自动录入,解决了目前方法中存在的问题。