基于票据自动识别的财务管理系统

2019-09-04 09:02李春亭连志刚李国明
上海电机学院学报 2019年4期
关键词:图像识别票据发票

李春亭, 连志刚, 李国明

(上海电机学院 电子信息学院, 上海 201306)

随着互联网技术深入人们生活,越来越多的事务应用了互联网和大数据技术[1-2],然而财务报销与财务审计还处于手工阶段[3]。文献[4]以“互联网+”时代企业财务管理工作面临的新挑战为入手点,对“互联网+”时代企业财务管理的创新措施进行了简单的分析。 文献[5]对国内财务报销的基本流程进行了分析。文献[6]设计了基于微信平台的财务代理系统,实现传统财务代理系统与“互联网+”的融合。目前网上报销系统的系统开发还处于分散阶段, 各个系统独立进行, 网上报销系统仅仅是传统报销流程再造[7]。

本文规划了基于扩展矩阵法进行票据识别的财务管理系统,实现了财务的自动化管理。通过研究图像识别技术、移动端APP与PC端交互技术来解决财务报销过程繁琐难题,即设计软件来对电子票据进行图像识别,读取票据信息并存入财务系统,实现自动财务报销与审计。

1 票据识别的财务管理系统规划

1.1 票据识别的财务管理流程

本文提出一种基于扩展矩阵法进行票据识别的财务管理系统,用户在消费单位取得有消费金额及防伪标志等信息的电子票据,通过手机或者其他移动设备将电子票据上传报销单位,报销单位可通过基于扩展矩阵法进行票据识别的财务管理系统,自动扫描读取票据信息,简便快速地完成票据报销,并将报销信息回传到移动端的APP,供用户查询,电子票据报销流程如图1所示。

基于扩展矩阵法进行票据识别的财务管理系统采用C/S架构,强调基于扩展矩阵法进行票据识别与APP交互两大技术特征。本系统用户主要针对各公司、单位财务人员及普通员工,财务人员可通过本系统进行发票的开具及管理。普通员工可通过移动终端上传电子票据进行报销,查询报销信息等。

1.2 系统总功能架构

该系统采用了面向对象分析中的UML方式建模,主要包括6个模块:预算管理、开具发票、发票管理、报销管理、系统管理、公告发布。用户可以通过用户名及密码进行该系统的登录。在预算管理模块中,用户可进行项目预算的申请、预算的审核、预算的修订以及预算的查询;在开具发票模块中输入各项发票信息后,即可对预开发票进行生成;在发票管理模块对已开具的发票进行管理以及对发票进行分类审核;系统管理模块主要包括:报销信息查询、报销核算、发票版额设定、用户管理等功能;在公告发布模块可以看到实时报销信息、报销截止时间、可报销项目、可报销类型等信息。其基本功能如图2 所示。

图2 系统总框架图

1.3 用户APP前台管理模块

APP前台管理模块主要包括4个模块:报销、查询、报销复审、用户信息管理,如图3所示。用户首先使用账号和密码进行该系统的登录,对于没有用户名的新用户,需要进行注册。登录成功后,用户可在报销模块上传待报销的电子发票,本系统可实现发票信息的自动录入和报销。在查询模块,可通过项目的编号进行发票信息的查询。对于已经报销过的发票,可以在报销复审模块中进行发票报销信息的审核。用户可以在用户信息管理模块中进行用户名和密码的修改。

图3 用户APP前台管理模块图

2 票据识别的图像搜索算法

2.1 票据信息图像搜索原理

关于图像识别技术研究已取得了丰硕成果[8-10],文献[11]研究了目标分割的图像识别,文献[12]提出了一种以人工蜂群算法为基础的神经网络分类器设计方法。图像识别技术在工业、农业、国防等领域应用非常广泛[13-14]。文献[15]分析了计算机图像识别的智能化处理技术瓶颈。本文提出的智能财务系统所使用的图像识别技术,其核心是通过将普通图片放大,当放大到一定限度时,图片上信息都是由许多像素单位组成,将白色设置为0,非白色设置为1,则将整张图片上信息由许多0和1有规则排序成二维数组或像素矩阵显示。建立由0~1组成二维数组对应的汉字、字母和数字字库,通过识别图片上的信息,与字库中汉字、字母和数字比对,然后识别出相应的信息[16]。

2.2 票据信息图像搜索算法

不妨设某字符的原像素矩阵为

(1)

式中:aij=1或者0。

构造其扩展矩阵为

(2)

构建q个候选汉字、数字、字母、字符等图像信息的原像素矩阵{P1,P2,…,Pq},依据式(2)分别构造其对应的扩展矩阵{E1,E2,…,Eq}。将原像素矩阵、扩展矩阵及对应的字符按照扩展矩阵n+1行n+1列的A值从小到大的顺序依次存放在候选数据库中。

在进行比较时,首先将待识别对象的扩展矩阵扩展部分与所有候选数据库中像素矩阵的扩展部分相比较,即式(2)中的A,相同则继续比较扩展矩阵每一行的像素值之和,即式(2)中的xi,若相同则继续比较扩展矩阵每一行的像素值之和,即式(2)中的yi,直到n×n个元素全部相同,识别成功;反之,则退出,继续进行下一矩阵的比较。当比较次数为k时,基于扩展矩阵的图像识别算法伪代码如下:

Foru=1∶k

依据式(2)构造pu对应的扩展矩阵eu。

Forv=1∶q

计数器N=0;

Ifeu(a(n+1)(n+1))==Ev(a(n+1)(n+1))

Fori=1∶n

Forj=1∶n

Ifeu(a(n+1)(n+1))==Ev(a(n+1)(n+1))

计数器N加1;

Else

i=n+1;

break;

End

End

End

Else

Continue;

End

IfN==n2

记录与识别对象扩展矩阵扩展部分相同对应的所有库扩展矩阵,不妨设为e1`,e2`,…eo`;

End

End

比较pu与e1`,e2`,…eo`对应的原像素矩阵p1`,p2`,…po`。找出与识别对象完全相同的原像素矩阵,即识别出pu对应的汉字/数字/字母/字符;

End

输出所有识别对象的识别结果。

该搜索方法可缩小发票图像信息库的范围,直到最终找到目标票据信息,识别准确率100%,提高了票据信息的识别效率。

2.3 图像搜索仿真实验

为了测试扩展矩阵搜索算法识别性能,本文用顺序搜索识别法、随机搜索识别法与扩展矩阵搜索识别法3种算法来比较,分析各识别算法的性能。

(1) 顺序搜索识别法:将识别对象的原像素矩阵,与候选数据库中的像素矩阵逐一对比,当完全相同时,即成功识别对象,否则依次对比下一个候选像素矩阵。

(2) 随机搜索识别法:将识别对象的原像素矩阵,与随机选择的库候选像素矩阵对比。在比较该像素矩阵时,随机选择该像素矩阵的一行与识别对象的相应行进行对比,若有不同则跳转比较下一个随机候选矩阵,当所有像素值完全相同时,即成功识别对象。

(3) 在扩展矩阵搜索识别算法效率测试实验过程中,为了实验结果的有效性,更具说服力,将其与顺序搜寻识别法、随机搜寻识别法的搜寻步骤(像素判断次数)与搜索成功的程序运行时间两个指标进行测试比较。本文分别随机产生10个100×100像素的识别对象,在含有5 000候选对象的库中搜寻识别;10个36×36像素的识别对象在含有8 000候选对象的库中搜寻识别,仿真对比结果见表1。

表1 扩展矩阵搜索识别法与顺序搜索识别法、随机搜索识别法测试比较

在表1中,Obj1~Obj10为100×100像素矩阵,在5 000候选库中搜索识别的仿真结果;Obj11~Obj20为36×36像素矩阵,在8 000候选库中搜索识别的仿真结果;Obj下面的数字为该识别对象在库中的顺序位置。

由表1的搜索比较结果明显可知,扩展矩阵搜索识别法在所有识别目标的搜索过程中,其搜索步骤最少,耗费时间最少。仿真发现当库矩阵数量小时,顺序搜索识别法比随机搜索识别法效率高,但当库矩阵数量大时,随机搜索识别法比顺序搜索识别法效率高。

在含有5 000个100×100像素的候选对象的数据库中,分别使用扩展矩阵搜索识别法与顺序搜索识别法、随机搜索识别法搜索10次的搜索步数如图4所示,搜索时间如图5所示。

在含有8 000个36×36像素的候选对象的数据库中,分别使用扩展矩阵搜索识别法与顺序搜索识别法、随机搜索识别法搜索10次的搜索步数如图6所示,搜索时间如图7所示。

由图4~图7的仿真结果来看,扩展矩阵搜索识别法相对于顺序搜索识别法与随机搜索识别法搜索步骤更少,速度更快,具有较大的优越性,故本文提出的基于扩展矩阵法进行票据识别的财务管理系统的票据识别性能更高。

图4 搜索目标1~10的步数比较图

图5 搜索目标1~10的耗时比较图

图6 搜索目标11~20的步数比较图

图7 搜索目标11~20的耗时比较图

3 结 论

本文以票据信息图像识别为核心,提出基于扩展矩阵法进行票据识别的财务管理系统,包括系统架构、功能模块,票据图像识别算法等。通过扫描识别电子票据信息,实现自动财务报销等业务。该算法提高了票据信息图像识别的效率,使财务管理变得更加安全、方便、快捷,大大减少了人力、物力、时间等资源,提高了报销效率与准确度。未来可进一步深入研究图像识别算法,优化识别时间,以及识别的准确性,实现智能化财务管控。

猜你喜欢
图像识别票据发票
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
关于发票显示额外费用的分歧
图像识别在物联网上的应用
图像识别在水质检测中的应用
采购发票系统:全流程电子化实现
全国增值税发票查验平台启用
2016年11月底中短期票据与央票收益率点差图
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图