董屹岭
(上海市教育委员会财务与资产管理中心,上海 200003)
近年来,随着国家对信息新技术的大力扶持,人工智能、大数据、物联网技术蓬勃发展,我国高度重视人工智能产业的发展,习近平总书记在十九大报告中指出,要“推动互联网、大数据、人工智能和实体经济深度融合”。本次应用通过人工智能、物联网、大数据分析技术,将冗余性大、能够统一标准的财务和业务进行BPR后建立标准化作业,实现业务审核、报账、核算、资金收付等财务业务一体化的标准数智化管理,整体架构上多系统融合集成,包括影像管理系统、网上报销系统、财务管理系统、ERP业务管理系统、OA系统以及外部银行系统等(架构如图1所示)。这里将主要针对人工智能在财务共享管理中的3种技术应用进行介绍。
图1 应用系统架构
财务共享服务平台实现所属单位全业务、全流程的网报稽核管理。集成发票影像OCR识别技术,获取发票结构化电子数据,根据业务规则,自动生成相关预制凭证,并采用自然语言解析的算法模型与管理规则,提供智能识别票据数据,实现智能稽核发票,自动对接支付系统的智慧政务财务处理流程。将财务报销规定、标准和审核流程内置,可对用户业务申请、报销等实现智能审核,实现单位内部线上审批流程管理,可满足各用户单位全部业务的线上报销管理。关联项目预算进行预算额度与科目控制,可对报销进度查询和通知,真正实现财政经费动态实时监控。支持移动审批管理等功能,并可与电子影像档案对接,实现影像调阅,是网报稽核应用的重点。
财务报销的全过程管理将包括以下几点:1)费用申请。2)借/还款。3)费用报销。
费用报销是系统智能化重点环节。财务共享服务平台通过集成OCR影像识别技术、自然语言理解技术、机器深度学习等行业领先的技术,基于财务共享服务平台实现24h报账、无面对面报账。建立数智化的、操作简易,配合电子签章的线上审批系统、影像识别系统、表单溯源管理系统等,对于人员少,岗位边界不清的机关事业单位提升财务管理水平,具有显著的管理效益,能够在进一步加大内部控制力度的同时,直观地改善用户对财务服务报销的体验感,提升财务服务的满意度。实现基于现有手工报销流程、财务核算的电子化,规范费用报销,实现精细化管理,大幅提高管理效率。
在日常财务共享中心业务中,会存在大量外勤会计,需要外派至多个单位进行工作,每天的出勤地点可能都不一样,而外勤会计是否每天按时按点抵达,如何关联考核,长期以来都是一个管理难点。财务共享服务平台通过结合开发手机App,应用人脸识别技术结合LBS定位技术的智能考勤管理方案,有效解决这个难题。首先预设会计人员个人信息以及工作地点经纬度、工作排班计划,在开展外勤工作时,使用App进行打卡,可以自动识别外勤会计是否是本人,且是否在指定时间抵达指定工作地点,统计外勤会计的出勤工作量,精准管理,大大降低了相关管理成本。
财务共享中心的日常工作业务中,存在大量具有3个特点的业务、大量的重复性的业务、能够被标准化的业务、具有流程性的作业,例如银行对账业务。数量巨大的日常银行对账业务,往往要有数十个银行账号进行对账作业,需要重复性的人工成本投入才能完成,机关事业单位经常会出现短时间内集中支付的情况,金额不大但支付笔数相当惊人。使用财政资金必须从公务卡支出,报销审批环节多,大量的人工输入又经常造成频繁的银行退票,公务卡无法及时还款。工作效率低下,服务对象满意度低,同时也带来了管理成本。采用PRA自动化流程管理方式,可以使用软件机器人代替人工在电脑前进行信息录入及信息核对工作,起到了自动对账的作用,节省了大量人力,且大幅降低了退票率,其带来的经济效益和管理效益是非常显著的。
OCR(Optical Character Recognition,光学字符识别),是属于图型识别(Pattern Recogni-tion,PR)的一门学问。其目的就是要让计算机知道它到底看到了什么,尤其是文字资料。书写文字识别是人工智能理论在该领域应用的一个分支,它研究的对象是如何利用电子计算机自动辨认人书写在纸张上的文字[1]。其具体工作过程:扫描仪将文字稿件通过电荷耦合器件将文字稿件的光信号转换为电信号,经过模拟/数字转换器转化为数字信号传输给计算机,然后由计算机取出每个文字的图像,并将其转换成汉字的编码。OCR技术可以分成2个主题,第一种是手写体识别,高准确率识别非常困难,因为每个人写字都不标准,具有个性,这里不做介绍。在该应用中使用到的是第二种主题,印刷体识别。印刷体基本都是比较标准、规范的字体,除了一些油墨影响干扰,整体识别准确度已经很高。
通过OCR印刷体识别,笔者将财务共享服务中网上报销时必须用到的发票类(包括增值税发票、火车票、出租车发票、定额发票、车辆通行费发票、飞机行程单等常见发票)拍照或扫描后得到一张或多张图片。首先要进行的是票据图像预处理,主要过程是做图像纠偏、角度矫正和去噪、去干扰,其次进行版面识别分析实现自动理票,下一步获取字段位置信息,自动定位至需要获取文字的关键位置,再次,对字段进行自动切割,最后将切割后的字段进行识别整理,这就是整个OCR识别的基本过程(OCR识别过程的几个步骤如图2所示)。不仅如此,还可将证件类(包括身份证、护照、驾驶证、营销执照、银行卡、名片等)加以识别,大大减少在网上报销时重复性的填写工作以及正确性的核对工作。
图2 OCR识别流程
笔者在实际应用中发现,并不是简单地通过上述的方式就可以得到一个高质量的识别结果。笔者以OCR识别增值税发票为例,通过拍照或扫描系统得到的图片是一页或多页印刷文字,首先要自动判断的是该图片上文本内容的朝向是否朝上。因为经过拍照或扫描后,往往得到的并不是1张清晰水平的图片,而是倾斜的甚至存在油墨干扰影响模糊不清的图片,所以笔者接下来要做的事就是进行图像预处理,去做角度矫正和去噪,在做预处理时,往往需要根据不同的场景做不同调整。第二步要对文档版面每行进行分割处理,把文字都完全分离出来,然后再将每行执行列分割处理,切割出每个文字或字符,将该文字或字符进行字符识别,最终可以得到一个结果。但是模型识别结果往往是不太准确的,所以笔者要矫正和优化初步识别后的结果,通过设计1个词组检测算法,去检测词语的组合逻辑是否合理。例如考虑词语“工具”,笔者用到的模型它识别为“土具”或“干具”,例如油墨影响;又或者由于打印重叠识别成了“王具”;或者由于油墨不足识别成“十具”,各种情况都会发生。面对这种情况如何优化呢?笔者在这里可以设计1个词组检测算法去纠正这种明显的词语错误,词组检测算法中包括大量词组库,检测词组异常后,再由相似率最高的“工”代替“土”“干”“王”,完成整个识别优化的过程。只有增加了识别优化,OCR识别才具有一定的容错性,可用性也随之大大提升。字符识别并不是通过单纯1个OCR模块就能实现的,否则识别率相当低,需要各个模块的组合来保证较高的识别准确率。
通过这个过程,笔者将各种票据采用OCR识别后,可以得到票据上的文字,获取后自动输入结构化系统中,大幅减少在网上报销时重复性的填写工作以及正确性的核对工作。
利用OCR技术自动识别获取了票据上需要的相关信息后,笔者再结合利用大数据以及RPA技术。通过累积实现的可灵活配置的票据智能审核引擎(包括通用规则引擎和定制化规则引擎),根据票据识别后的结构化信息、其他报销辅助信息,对报销流程中票据的真实性,票据的合规性,票据和报销单的填写正确性,报销单填写的规范有效性,报账票据的完备性,预算和额度标准控制的有效性等需要财务审核的绝大部分量化审核点,根据审核规则由机器人自动审核完成。机器审核完成后,将审核结果输出并通过接口传到审批系统中,供审核人员查看或参考。同时在整个审批流程结束后,接入财务核算自动化系统,自动生成多种核算体系的会计凭证,从而实现从报销申请到记账,再到支付管理等全程自动化处理。
通过OCR再结合大数据、RPA自动化技术,笔者可以将申请报销的工作量减少90%左右,审核及支付的工作量减少80%左右。
人脸识别技术作为生物特征识别领域中的一种,是基于生物特征识别的,通过计算机提取人脸特征,并根据这些特征进行身份验证,与其他生物识别技术相比,人脸识别技术具有无须人工操作、非接触识别、快速简便、直观准确、性价比高、扩展性好、可跟踪性好、有自学能力等优点[2]。人脸识别是一种比对技术,并不能直接识别出一个人的身份是否为本人。首先,使用人需要进行个人脸部信息的预采集,在预采集的过程中,须尽可能使用与使用人当前脸部特征最为贴切的照片,例如使用当前拍摄清晰的照片,若使用以往的照片,会增加当前脸部特征的差异性。在获取预采集照片后,会捕捉脸部特征部位,并将特征部分计算加密后形成一个特征码,以代表其人脸的唯一性,并将特征码进行入库。然后,在进行使用时,通过现场拍照或视频拍摄采集到人脸图片,将人脸图片通过捕捉其脸部特征后,人脸库中已存在的唯一特征码进行逐一比对,若相似程度达到预设标准,则获取到对应的人脸信息,在实际应用中笔者优先取相似值最高的。通常在进行人脸识别时,为了避免使用人使用一种图片“欺诈”人脸识别,会增加活体识别技术。活体识别技术的目的是为了判断当前人是一个活人,而不是静态照片或假人模型,其方法是通过由系统发起指令,要求使用人配合完成“眨眼”、“张嘴”、“左右转头”等指令要求方式进行动态识别判断为活人。
LBS(Location Based Service)旨在利用手机定位技术向广大移动通信用户提供与坐标位置相关的多样化服务,包括车载导航服务、个人问询服务、紧急求救服务、物流管理、商业求助服务等,为人们的工作和生活提供了巨大的便利[3]。目前智能手机都已具备LBS技术功能,通过手机App启用手机自带LBS功能实现定位,在定位精度方面,目前智能手机上的LBS已达到米级别的精确性,可以满足考勤打卡这一定位需求。
笔者将人脸识别和LBS定位技术结合,可以对财务共享服务的外勤人员进行自动考勤。人脸识别技术可以识别外勤人员在考勤时是真人还是图像,LBS定位技术能够分辨人员是否到达指定地点,通过2种结合的方式,基本可以自动解决考勤管理问题。
RPA技术是一种基于软件机器人及人工智能的新型业务流程自动化技术,被称之为Robotic Process Automation,是一种借助数字化劳动力完成各类集成项目的技术,这种被称之为流程自动化的技术,能够有效解决人工重复劳动的一系列问题。
在财务共享中心中存在大量的银行对账业务,数量巨大的日常银行对账业务,往往要有数十个银行账号进行对账作业,需要重复性的人工成本投入才能完成,同时也带来了大量的管理成本。在运用PRA技术后,以下几个工作都可以进行自动化操作。1)RPA流程机器人自动登录银行官网,自动下载对账单并完成财务系统格式转换;2)RPA流程机器人自动搜寻银行账户的收支及余额,并将其导入财务管理系统;3)RPA流程机器人自动对账,发现不平账单时,自动以邮件、短信等方式发送给工作人员预警或提醒;4)RPA流程机器人自动下载并打印对账单以及对账结果作审核留档记录。
通过RPA技术使财务共享服务中心每月节约80%的人工时间,并使整个过程准确率大幅提升,有效减少人工错误带来的退票,给管理上带来了人工成本与管理成本的双降,使管理效果得到提升。
目前,人工智能技术的应用已经给很多领域带来了颠覆性的变革,但在政务管理领域,人工智能的应用还处于起步摸索阶段,旨在通过引入相关应用替代大部分人工重复性工作,降低人工成本,提高政务管理效益。人工智能是一门综合性的学科,它是在控制论、信息论和系统论的基础上诞生的,涉及哲学、心理学、认知科学、计算机科学、数学及各种工程学方法[4]。人工智能的推广与应用对公职人员的综合应用能力和学习能力也将带来前所未有的挑战。对更为广泛的人工智能技术,除了在算法、技术上的精进和升级突破,更需要不断挖掘应用场景,同时,也必须高度重视专业技术人员的跨行业技能培训,以确保应用落地。