国网安徽省电力有限公司蚌埠供电公司 钱雅云 张 浩 邢 开 姚钊齐 王针针
在系统整体方案设计环节,主要研究的内容涉及分析系统总体架构、操作票识别的具体工作流程、目标相似性算法,以及基于AI 技术的操作票识别系统的优点分析等。系统设计的过程中,主要涉及五个层级,分别为页面表现层、业务层、服务层、数据层,以及基础层。在操作票识别的具体工作流程方面,需要基于目标相似性算法来实现,并借助高清拍摄仪将纸质单据转化为Excel 文档,进而满足关键字对比和替换需求,最终形成操作票。目标相似性算法是AI 技术的应用核心,在应用目标相似性算法时,需要构建目标相似性算法模型。此外,在传统变电站运维的过程中,主要采用人工填写的方式来完成操作票,无法达到智能化、自动化效果,不能自动生成操作,很难精准获取所需信息。为达到自动处理繁冗的数据的效果,降低因人工操作而产生的错误率,提升工作精准度,在系统整体方案设计时,需要验证该系统的有效性,同时还需开展多次重复实验,通过这种方法来提高操作票的准确率。
该系统是采用目标相似相算法对所开出的任务单进行扫描,后台则基于Java 技术对扫描的信息进行关键字符串提取,并将操作票中对应位置的内容进行替换。前台还需要为工作人员提供可视化的管理视窗,具体包括向用户展示指定的图片内容,同时为工作人员提供操作票的选择功能[1]。此外,该系统还应具备登录页面与功能,能够对比输入系统的用户信息,符合数据库条件的用户才允许登录,从而有效保障系统的安全性,该系统的具体架构如图1所示。
图1 基于AI 技术的变电运维操作票系统架构
在该系统中操作票识别的具体工作流程主要是基于目标相似性算法来实现的,将用户提交的纸质单据通过高清拍摄仪拍摄图片并将其转化为Excel 文档以便进行关键字的对比与替换,从而形成操作票,具体流程如下。
将纸质单据放在高清拍摄仪的指定位置,通过仪器拍摄纸质单据的电子图片并保存到设备中的指定位置,用户登录系统后,可以在系统中上传图片,系统后台获得图片后则将图片转化为数据流。通过对数据流的处理分析得到总行数、总列数、单元格内容和Sheet 的总数量。若识别验证是精准的,则Sheet 赋值为1,再比对关键字,找到地点关键字的名称。获得项目数据之后再进行关键字的匹配,获得关键字与分类信息后则进行数据库比对,使用poitl 技术来替换数据库中对应目录下的文件,并使用{{title}}进行编码,编码采用6位数,前面两位数代表月份,后四位则采用自然数序列编号,从0001依次递增。若出现多业务情况,则每页增加变电站名称。
通过客户端导入任务单,并将信息导入OCR 软件之中,生成Excel 表格,再利用poi-tl 技术进行数据处理,生成的Word 表格,就是对应的操作票。
在本文所设计的系统之中目标相似性算法是AI技术的应用核心,也是该系统区别于传统系统的关键所在,目标相似性算法的实现具有至关重要的意义。首先,通过对指令票上所提取的数据进行数字流算法向量处理,作为输入目标相似性算法中的基础数据[2]。对所提取数据的关键字字符串展开向量化处理。为增强算法的分词泛化处理能力,还应对语句进行预处理,挖掘出更多的共现字符。在完成以上操作后,还应经过DNN 神经网络将字符串转化为有效的语义向量,再输入目标相似性算法模型之中展开分析。
在该系统中的目标相似性算法模型为:
在上式当中A 为指令票上的关键字向量值,B为库中的标准向量值,当A、B 的level 值居中时,则说明所对比的两个字段是完全相同的。
在传统的变电站运维中,操作票的填写是人工实现的,在本文当中所设计的操作票系统能够实现操作票的自动生成。变电运维人员只需要将指令票放在高清拍摄仪下,并登录到系统之中,单击开始,系统就能自动对指令票的内容进行识别,生成操作票记录。
为了进一步验证该系统的有效性,技术人员进行了多次重复实验,结果发现该系统的指令票识别率高达90%以上;而针对不同电指令票系统“地点”的识别有效率则高达95%以上,而目标相似性算法中的操作票记录与实际操作项目额数据进行对比,相似性系数位于0.5左右的有效率则高达98%。通过上述实验可以发现,该系统所生成的操作票正确率在90%以上。
本文所设计的系统实际上是基于对传统人工书写操作票的模式进行自动化、智能化处理,这能够将工作人员从复杂的文字书写中解放处理,提升工作效率。而且相较于传统人工书写,本文所设计的系统通过数字化、智能化处理能够精准地获得所需要的信息,并自动完成繁冗的数据处理和书写过程,有效降低因为工作人员疏忽或者书写错误而造成的错误,大幅度提升了工作的精准性。
在该系统之中,最关键的硬件为高清拍摄仪,为了满足系统拍摄、OCR 识别,以及文字识别等多重复杂功能,应尽量选择市场上较为先进的高清拍摄仪。在本次设计之中所选择的高清拍摄仪采用了维山S1,此高拍仪所使用的CPU 为MIPS,具备三束激光,屏幕尺寸为2.7英寸,分辨率为320×240,配备通用电源适配器。该设备的照片如图2所示。在使用时只需要将文件放置在摄像头的指定位置就可以识别出照片并将照片中的信息自动转化。
图2 高清拍摄仪
在软件系统设计模块,主要设计的内容包含用户操作软件系统设计、用户软件操作,以及数据库设计等。其中,用户操作软件系统设计内容主要涉及Java 语言开发和Vue 技术开发;在用户软件操作方面,主要研究的是登录页面、项目首页,以及数据列表展示页面,而数据库设计主要分析数据库的具体数据结构。
从上文中对该系统的功能描述中可以发现,软件系统大致可以分为两个不同的模块,用户登录模块与图像识别模块。在该系统中,用户登录模块为自行设计,具体包含了登录与监控两个不同的模块。图像识别模块则直接调用OCR 图像识别软件。
基于AI 技术的变电运维操作票系统要将识别的信息转化为软件代码才能满足系统深化应用的现实需求,并满足系统的初步使用需求。结合该系统的技术条件,选择采用Java 语言进行开发,软件配置环境选择jdk1.8,MySQL5.6版本。
在软件开发的初始阶段,需要先对接口进行测试,具体而言,需要导入依赖spring-boot-starter-test,以便实现对数据流、常见错误,以及不正确的逻辑进行测试分析,以确保用户系统操作的流畅性。系统后端使用springboot 的主要原因是该工具在拓展性方面具有明显的优势,能够更有效地进行照片的读取,并允许OCR 软件在后端生成数据表格。为了提升系统整体的稳定性,所有接口均选择restfull风格的接口,在前端所获得的信息并不需要进行任何处理,只需要渲染即可,后端的数据处理也是基于JSON 格式进行的。在这种前后分离的数据处理结构中,结构变得更为简单,数据维护与更新也变得更为清晰[3]。系统数据库还采用了MySQL,这种开放型的数据库允许多任务协同工作,从而使系统能够同时满足多个不同变电站同时使用的需求。
根据该系统的功能需求,前台与后台开发采用了不同的工具,后台采用Java 技术。主要是由于Java 属于面向对象的技术,由于其具有较高的可移植性,从而能够适用于多种不同的平台,在灵活性方面具有更大的优势。此外Java 属于解释型语言,程序翻译与执行相互堵路,对程序的运行没有直接影响。前台则采用Vue 框架开发,这是由于Vue 框架具有双向性,同时数据更新不需要对整个页面进行刷新处理,设计人员也并不需要频繁获取DOM 节点,数据结构相对简单。
3.3.1 登录页面
用户进入网页之后,单击登录界面进行登录操作,系统会提示输入用户名与密码。用户必须输入正确的用户名与密码才能登录系统,否则会给出与之对应的错误提示,根据错误提示修正登录信息即可完成登录。
3.3.2 项目首页
项目首页主要体现的是高清拍摄仪摄像头实时拍摄的内容,用户可以通过项目首页观察任务单是否正确摆放在规定的位置,用户单击开始之后即可识别相关信息,之后“开始”按钮将会变为“loading”。
3.3.3 数据列表展示页面
当完成数据识别,后端数据尚未完成处理时,页面上就会自动生成一个操作票文件列表,并按照顺序排列好。
数据库表必须实现项目与Word 模板之间的相互对应,poi 技术允许用户输入信息与数据库中的信息进行匹配,如果数据库中存在匹配一致的项目,则调用数据库中的字符串替代文档中的关键字,并将信息采用数据流的方式写入文件夹中[4]。用户也可以在操作票生成页面单击生成后的操作票文档,数据库的具体数据结构见表1。
表1 操作项目
在变电站操作票管理方面,数字化水平逐渐提高,且系统数据实时更新,为操作票管理的图模自动同步提供了有力的支持,AI 技术的变电运维操作票系统中的应用在很大程度上能为智能开票和系统免维护打下基础。因此,在变电运维操作票系统的设计中融入AI 技术,可提高操作票调度工作的可靠性、精准性和效率,助力变电运维操作票系统向智能化方向转型。