基于OCR 技术的财务审计质效提升探析

2022-11-13 16:10李凤至
中国管理信息化 2022年7期
关键词:凭证核查发票

李 硕,李凤至,雷 鹏,李 扬

(中国邮政储蓄银行股份有限公司山东省分行,济南 250101)

1 研究背景

(1)OCR 技术成功应用于诸多领域。光学字符识别(Optical Character Recognition,简称OCR),是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字。OCR 技术已应用于很多领域,如证件识别、银行卡识别、车牌识别、名片识别、汽车VIN 码识别、票据识别、图片文件识别等,其应用场景还在逐步扩展。营改增后增值税发票样式的统一和财务报账影像系统的应用,为OCR 技术在财务审计领域的应用创造了客观条件。

(2)财务审计现状分析。一是财务审计工作量大。传统的银行财务审计工作中,一个财务审计或经济责任审计项目中,涉及财务会计凭证抽样的科目多达几十个,财务审计人员需要针对每个科目抽查一定笔数的会计凭证,并对这些会计凭证及其附件逐笔逐张查看比对,审查其合规性、真实性、完备性,但无法快速高效地将同类费用或同一时段报销凭证进行批量比对核查。目前财务审计领域的非现场分析技术有限,针对报账凭证图片等非结构化数据,审计人员无法快速定位相关信息位置和快速提取报账影像的关键要素,耗费大量时间,抽样量较为有限,审计效率亟待提升。二是审计人员有限。审计队伍面临的最大困难是人员不足、人才短缺。财务类高水平复合型审计人才较少,人员知识结构单一、精力有限,针对繁杂的财务凭证,在有限的现场审计时间内完成规定审计任务存在一定的困难,审计的深度和精准度也受到制约。

(3)OCR 技术的逐渐成熟为提升财务审计价值提供了可行方案。一是通过OCR 技术实现发票信息自动提取,审计人员可以在非现场分析阶段对财务报账影像系统中的非结构化发票影像进行识别,并将发票中的有用信息归集输出,形成非常有价值的结构化数据表,通过对此数据表进行充分的数据挖掘,可以在非现场阶段锁定问题线索,节约大量的现场审计时间,更快速、高效地完成审计要点,靶向施力、精准审计。二是借助OCR 通用文本识别技术定位关键字,在海量凭证影像中快速搜索出有用信息,实现批量财务凭证分析,进一步拓展审计广度和深度,有效降低审计风险。如果在非现场审计分析平台嵌入相关审计模型,还能够敏锐识别风险、发挥预警作用,及早揭示问题,促进内控机制及时完善,提升审计时效性和审计成果价值,维护企业资金安全。

2 OCR 发票信息提取技术在财务审计中的应用流程及场景

由于报账系统中同一单位的凭证按时间顺序排列,财务审计人员往往需要对抽样凭证逐个查看,对同类报账事项的综合性分析不足。以银行财务报账影像系统为切入点,利用OCR 技术提取增值税发票关键信息形成数据表进行穿透式分析,可尝试实现如下应用流程及场景。

(1)自动下载财务凭证影像并命名。审计人员结合审计重点,按照相关科目在报账系统中下载由逐个报销单汇总的统计表(简称《报销查询表》),利用RPA(机器人流程自动化)工具根据《报销查询表》中的“报销单号”字段从报账系统逐笔下载报账凭证影像,将报账凭证影像保存至《20××年×月—20××年×月报账凭证影像查询》总文件夹内,每笔报账凭证影像以“报销单号”字段为文件夹名保存至文件夹内。

(2)自动识别增值税发票影像并生成相关审计数据表。从增值税发票影像中提取“购买方名称”“销售方名称”“销售方地址”“销售方电话”“货物或应税劳务、服务名称”“规格型号”“单位”“数量”“单价”“金额”“税率”“价税合计”“开票日期”“发票代码”“发票号码”信息。将提取的信息按发票代码和号码,自动回填到《报销查询表》对应的行,若一张发票中含多行货物,则在对应的发票代码和号码行下方插入新的行填入。

(3)OCR 发票信息提取应用场景。结合审计要点可针对回填之后生成的《报销查询表》,进行数据挖掘和汇总分析。

①费用入账的及时性。如:从《报销查询表》中2020年计列费用科目的事项中,筛选发票“开票日期”非2020 年度的事项,可以发现跨年度计列费用、调节损益的项目。

②单价的合规合理性。如:从《报销查询表》中筛选“货物或应税劳务、服务名称”为住宿费的事项,通过“单价”批量筛查差旅费中是否存在超标准住宿的情况。再如:按“货物或应税劳务、服务名称”“规格型号”两个字段进行分类汇总,对报销的同类物品单价进行分析,筛选相同货物名称和规格型号但单价相差较大报销事项,可结合现场审计对采购价格差异较大的原因进一步核实。又如:对单价超过一定标准的物品,按照固定资产管理办法应建立固定资产卡片予以资本化核算,通过单价筛选可以有效发现资本性支出费用化的情况。

③资金流向的合规性。如:从《报销查询表》中筛选发票“销售方名称”与报销资金实际收款方不一致的报销事项,核查是否存在资金流向不合规的情形。再如:筛选“购买方名称”与报账单位不匹配的事项,核查是否存在单位报销个人应承担的费用等情况。

④采购数量的合理性。如:对一段时间内,同一单位报销的修理费等按“货物或应税劳务、服务名称”“数量”分类汇总,分析是否存在数量不合理的情况。对数量异常偏高的情况,结合现场审计访谈、盘点等方法进一步核查。

⑤集中采购制度执行情况。如:对“货物或应税劳务、服务名称”中属于上级集中采购范围内的事项,核查其供应商是否在集中采购准入的供应商范围内,精准发现违反集中采购制度的情况。

3 OCR 关键字识别技术在财务审计中的应用流程及场景

由于银行报账影像系统中,费用类报账凭证居多,一笔报账凭证往往有十几张甚至几十张凭证附件的影像,且系统中影像多为单张独立的影像,要对一笔凭证进行审查,需要逐张影像查看,耗时费力。为了帮助审计人员从大量的凭证影像中快速搜索定位所需查找的关键信息,OCR 关键字识别技术可尝试应用如下流程及场景。

(1)凭证影像搜索关键字。在导出的报账影像中,搜索有某一特定字样的影像,比如“预算”。对有此字样的影像,将此字样按报账单号标注在《报销查询表》中,若可行提取字段后对应的信息,将有此字样的图片的路径(含所在文件夹名和图片名)按报销单号列入《报销查询表》对应行中,作为重点抽样关注对象。

(2)OCR 关键字识别技术应用场景。对于不同会计科目的入账事项,财务审计时往往有不同的关注点。采用关键字识别技术,有利于针对特定类别的审计事项,按照审计人员指定的关键字搜索信息,进行精准抽样。

①对公务接待等事项是否严格落实中央“八项规定”精神的核查。如:在公务招待费报账影像中搜索含有“特产”“烟”“酒”的报销事项,结合招待清单等其他报销单据进行重点核查。再如:在差旅费报账影像中搜索含有火车票一等座的报销事项,结合差旅费报销审批单等信息进行比对,核查是否存在超标准乘坐交通工具的行为。

②对费用预算执行情况的核查。如:对于会议费报销影像,通过OCR 技术搜索含有“预算”金额的会议审批单或签报所在的影像,辅助审计人员快速查找出关键信息,与实际报销金额进行比对,判断有无超预算支出的情形。

③对审批手续完备性的核查。如:对应有上级行批复文件的重要事项,在其报账影像中搜索“批复”字样,如果OCR 反馈未查找到含此字样的影像,则须作为重点进行进一步核查,关注是否存在超越权限实施的财务事项。

④对合同执行情况的核查。如:对于附有合同的大额报账事项,通过OCR 技术在其报账影像中搜索含有“标的额”“履行期”等字样的影像,与实际报销金额、费用期间进行比对,判断是否存在超出合同金额采购、逆流程实施等情况。

4 银行报账系统OCR 技术应用难点分析

(1)要识别的影像清晰度不统一影响OCR 技术识别结果。就增值税专用发票而言,虽然发票格式及关键信息统一,但每张发票打印的字迹深浅不统一、发票专用章加盖的位置及深浅不统一,可能造成发票关键信息识别统计有误或缺漏,这就要求提高发票打印或扫描留存影像的质量,便于后续识别提取关键信息。

(2)银行财务报账系统中各类凭证影像机打、手写不统一,影响关键字提取效果。由于财务凭证附件有机打、有手写,特别是手写字迹不统一、难以辨认等因素将影响关键字提取结果,从而造成影像信息提取不完整、不准确,进而影响审计效果。

(3)系统安全及影像下载存储合规性问题。为了扩大审计面、使审计结果更具全面性,往往会审查更多的抽样凭证,或针对同类事项进行专项抽样审查,就会造成更多的影像凭证被下载留存,且以财务报账系统为切入点融入OCR 技术应用,也同时存在着系统安全、影像安全及信息泄露的风险,这就要求OCR 技术的应用要以合规安全为前提。

(4)研发投入和实践经验尚需不断积累。由于OCR技术在财务审计中的应用处于探索阶段,成熟系统的应用解决方案尚未形成,相关领域的研究开发仍需要加大投入。同时,现有内审人员接触OCR 新技术、新工具的时间不长,实践经验仍需不断积累和丰富。

5 对策与措施

(1)提高发票打印或扫描留存影像的质量,制定影像留存设备标准和人员操作规范,从源头上提高影像质量,为后续识别工作奠定基础。在实现OCR 技术过程中,添加判断影像质量的功能,对质量较低的影像,采用相应的影像增强技术提高影像清晰度。在数据识别后,从技术上给出数据的识别可信度,对识别可信度较低的关键数据,在数据后面添加相应的备注提示,以便审计人员重点关注。

(2)加入各类凭证影像的机打、手写分类功能。由于机打字体较规范,只要清晰度满足要求,相对较容易识别,而手写字体形式多样,可采用机器学习的方式,采集大量训练样本,训练出识别率较高的识别器。因此,需要对不同种类的影像凭证(机打或手写)采取不同的识别处理技术和流程。在识别结果中,对识别可行度较低的信息,可给出备注提示,以便审计人员重点关注。

(3)制定相应的OCR 技术在财务审计方面的应用规范,对相关从业人员进行应用前的上岗培训,从制度上保障数据的安全性。可将影像资料按照重要性程度分为多种保密等级,数据使用者也分为多种等级,不同等级的用户对数据有不同的下载应用权限,即对于保密等级高的数据,只有高级别的用户才有下载使用权限。系统中应留存关键影像的下载记录,保存下载人的信息,为资料泄露追责保存证据。

(4)加大基于OCR 技术的财务审计研发投入,从财政上提供足够的支持。抽调专门的审计人员作为OCR系统的用户,与研发人员对接,通过双方充分沟通交流,进一步明确需求和技术细节,提高OCR 系统操作的便捷性和识别的准确性。系统研发成型后,开展多种影像的应用试点工作,测试系统的性能及操作的便捷性,及时发现并反馈使用过程中遇到的问题,不断积累经验,完善升级系统。

6 结语

在人工智能、大数据等技术迅速发展的时代,加强审计技术创新研究、运用科技手段推进审计深度转型和价值提升,是内部审计机构和人员顺应审计工作发展新形势、新要求,履行好审计监督评价咨询职责,促进企业高质量可持续发展的必然要求。相信OCR 技术在审计领域的应用探索,定能推动审计信息化智能化水平再上新台阶。在商业银行审计工作中,OCR 技术不仅可应用于财务报账凭证审计,也会对信贷业务审计、合规操作性审计等涉及影像资料的其他专项审计提供便捷。除了在现场审计项目中发挥作用外,在非现场审计工作中开发OCR 相关模型或工具,能够优化监控预警模型,结合风险监测实现对数据的自动分析、违规行为的自动监测及审计逻辑的自动提炼,为发现审计疑点、评估风险等也会提供有力支撑。

展望未来,OCR 技术、大数据分析技术、文本挖掘、商业智能等先进技术的应用,将进一步提高审计作业和审计管理的智能化、自动化程度,实现审计工作模式转型和审计流程升级改造,降低审计人员工作强度,不断拓展审计广度和深度,促进审计质效和价值持续提升。

猜你喜欢
凭证核查发票
带您了解医保电子凭证
对某企业重大危险源核查引发的思考
基于改进LeNet-5卷积神经网络的发票识别研究
已完成汇交并出具汇交凭证的项目统计
关于设计保证系统适航独立核查的思考
基于无人机影像的营造林核查应用研究
关于发票显示额外费用的分歧
(2018年)《中国司法》
(2018年)《司法所工作》
全国增值税发票查验平台启用