国网安徽省电力有限公司 李传昌
机器人流程自动化(RPA),是一套通过模拟人工操作进行自动流程执行处理的软件。RPA可以代替办公人员操作电脑和软件,自动完成各类软件系统的工作和业务处理,准确高效地实现业务流程自动化,将办公人员从每日的重复工作中解放出来,提高生产效率,切实减少基层负担,从而让管理更有体系,进一步提升管理效率,激发员工创新活力。
近年来,安徽公司积极探索“大云物移智”等信息技术,结合实际业务,创新开发了一批行之有效的信息化应用成果,有效助力现场精准管控,服务电网工程建设管理。随着“三集五大”体系建设的不断深化,公司基层员工的负担不断加大,亟需建设一个机器人流程自动化系统以将办公人员从每日的重复工作中解放出来,提高生产效率。
一套完整的RPA主要包括四大功能模块,分别为管理控制台(WEB管理端)、应用编辑器(面向应用开发者的客户端)、人工智能(AI服务端)和机器人(面向用户的客户端)模块。各模块之间的功能逻辑为:应用开发者通过应用编辑器开发、发布应用到WEB管理端;用户先在自己个人PC上安装机器人模块并运行软件,再从WEB管理端以新建定时任务的方式实现定时调度机器人来运行指定的应用,从而实现流程自动化;若需要人工智能(AI)进行识别处理,由应用开发者在必要处调用AI服务端接口,实现结合AI识别的流程自动化。
应用中心:管理通过编辑器发布的应用;
任务管理:通过新建任务实现定时调度机器人来执行发布的应用;
机器人监控:管理机器人客户端信息,包括机器人客户端标识、在线状态等
日志管理:管理操作审计日志及定时任务调度机器人执行结果日志。
资产管理:对企业账号密码等敏感数据进行变量化的设置。通过在控制台设置为变量,方便流程开发时调用,同时满足安保对于账号等敏感信息的要求。变量的存储都是采用密文,只有具备权限的账号才能查看。
系统管理:提供组织机构、成员、角色权限等管理功能。
通过应用编辑器可快速开发自动化应用,以拖拽可视化组件的方式实现流程的自动化办理功能,整个过程零编码。
组件包括:
网页:包括打开、跳转、滚动页面、关闭网页、获取文本、获取网页元素的HTML代码、上传文件、下载文件和OCR方式点击等功能;
窗口:包括获取窗口、激活窗口、关闭窗口、隐藏窗口、最大化窗口、最小化窗口、OCR方式点击等功能;
鼠标键盘:支持输入热键功能;
EXCEL组件:包括启动保存、关闭、创建、重命名Sheet、获取单元格值、获取区域值、获取行值、获取列值和查找单元格等功能;
循环和判断组件:包括按照次数循环、条件循环、循环相似控件、循环列表内容、继续循环、退出循环、条件分支、捕获异常和重试等功能;
流程组件:支持获取工程参数信息;
编程组件:包括设置变量值、读取资产变量值、延迟执行、调用自定义脚本、记录日志等功能;
数据处理组件:包括字符串操作、数学运算、列表操作、字典操作等功能;
系统组件:包括运行程序、关闭进程、设置剪贴板内容、获取剪贴板内容、获取当前时间和日期等功能。
通过在编辑器中拖拽组件,以可视化的方式编辑组件实现自动化功能,应用开发即为可视化的自动化流程开发,整个过程零编码。
对开发的应用进行调试,可快速观看应用执行全过程是否存在异常,如存在则抛出异常,便于开发者针对异常进行修改。
应用开发调试通过后,发布应用到管理控制台,供用户机器人客户端调用来完成用户的自动化流程工作。
(1)OCR能力模块
OCR能力模块提供方便结合具体业务调用的卡证识别功能,包括:
文字识别;
文字发票识别;
机动车统一发票识别;
火车票识别;
身份证识别;
营业执照识别;
房产证识别;
银行卡识别;
驾驶证识别;
行驶证识别;
护照识别;
不动产证识别;
食品经营许可证识别;
银行开户许可证识别;
表格识别。
(2)人工智能(AI)自学习模块
当需要对OCR能力模块中没有提供的场景进行图片文字识别时,可通过简单的页面操作,快速训练专用的图片文字识别(OCR)功能。
(3)模板配置
通过对一张具有代表性的图片进行key/value的规则属性配置,形成初始化的模板;作为配置的图片最好选择清晰、无遮挡、无
反光的图片更有利于模板的配置。(4)数据集管理
上传至少30张同类图片作为训练集,至少10张图片进行测试集。上传图片后,分别对上传的图片进行标注,通过标注训练图集上的value值,形成一批可用的训练数据。这些已标注好的数据会按比例分成训练数据和评测数据。
(5)模板训练
基于深度学习算法进行的机器自学习过程,系统会根据标注数据自动强化模板的识别率,提高模板的容错性。训练集的数据越多对模板训练的效果就越佳。训练是个反复的过程,可以分多个批次进行训练,每个批次建议上传更多的图片进行标注以达到自学习的目的。
(6)模板评测与发布
模板评测是用于对经过训练的模板进行效果评测打分。在每个训练批次中可实时查看效果评估对比。评测指标分为OCR识别率和KV字段识别率,OCR识别率是文字本身的识别效果,KV字段识别率是指模板在评测过程中所有字段的平均识别结果。通常情况下,KV字段识别率/OCR字段识别率>90%,是较为可用的状态,用户也可根据自己的标准进行效果评估。根据评测结果,用户可以选择最为理想的训练版本作为发布版本,并发布上线。发布成功后即可获得模板ID,在RPA的编辑器中,可通过模板ID进行图片信息的结构化识别。
(7)NLP
自然语言处理包括分词、词性标注、命名实体、情感分析、中心词提取、智能文本分类、文本信息抽取等。
(8)其它识别
提供将语音识别为文字及提取文字功能。
识别视频流文件,如施工时现场视频中的安全帽识别。提供识别结果提取功能。
机器人的主要功能是执行任务,机器人可以执行手动触发、定时触发的任务:
人工手动触发:手动执行开发好的应用程序。在一个企业里,开发人员开发好的应用可以发布到应用中心里,其他人就可以通过机器人去获取这个应用,通过审批之后就可以运行这个应用,并且支持多人在自己电脑上同时使用,互不影响。
定时自动触发:定时执行开发好的应用程序。在一个企业里,开发人员开发好的应用可以发布到应用中心里,其他人在控制台就可以获取这个应用,通过审批之后设置定时任务去执行这个应用。
图1 系统总体架构图
在J2EE技术体系,可采用MVC应用框架,由界面控制器组件、界面操作组件、JSP网页组件和服务代理单元组成。其中界面的显示由JSP网页组件完成,网页上的具体操作由界面操作组件通过服务代理单元调用业务逻辑层的具体服务来完成,由界面控制器组件负责统一调用不同的界面操作组件、JSP网页组件,从而完成RPA流程在IDE中的设计工作。
中控层构建于JAVA企业版平台之上,借助于SG-UAP平台将表现逻辑、业务逻辑与数据逻辑分离,进行基于构件的开发。SG-UAP工作流平台,通过流程驱动技术实现了业务流程过程的标准化管理,包括图形化工具建模、快捷的流程定义、动态的流程重组、灵活流程控制、完善的流程审核以及统一的任务管理等功能。
中控层把流程任务数据下发给执行层,执行层安装在用户个人办公PC上,利用其计算及存储资源实现指定流程的定时自动化办理。
总结:通过开展基于RPA的电力业务系统自动化处理系统建设,实现了联动多个业务系统,自动执行完成工作,自动化地串起一系列操作流程,让流程再造,并且不会影响现有IT系统的功能与稳定性,相较于传统的增效方式,RPA能最大程度地平衡效率与成本,且投资回报周期较短。它既不像增加人工那样效率不高且易出错,也不像传统模式开发软件那样需要投入较大成本,能够最大程度地平衡效率与成本。