图像识别技术在云南电网数据认责中的研究与应用

2019-11-02 06:17杨东宁邹璞玉
通信电源技术 2019年10期
关键词:图像识别核查电网

杨东宁,徐 敏,李 沙,邹璞玉

(1.云南电网有限责任公司信息中心,云南 昆明 650217;2.云南云电同方科技有限公司,云南 昆明 650217)

1 数据认责的现状及问题

2017年,云南电网公司开展数据认责体系建设,依据云南电网公司管理体系,通过业务部门专责或班组人员按数据主题、责任人建立责任关系,明确各方的职责,以落实最小管理单元的数据责任。构建各业务域内核心数据的数据标准、录入规范,促进数据操作规范、准确、完整,确保数据质量问题责任明确清晰,使数据质量问题能够找到具体的责任人,各类数据质量问题冲突能够得到解决。

同时,云南电网公司将数据认责工作纳入了组织绩效考核,从2017年起,每年组织开展现场检查整改工作,完成18家供电局生产域、营销域、物资域及人资域的数据完整性、准确性检查整改。现场检查过程中发现,工作效率和效果都亟待提高。

2 人工检查费时费力

检查人员需要提前在系统中查看数据、打印资料,到工作现场与设备铭牌等资料核对数据是否正确,并提示整改,整改后需要再次进行现场核对,整个检查整改过程费时费力。以2017年为例,共组织近百名专家,耗时两周,完成全省18家供电局生产、营销业务域数据的核查,但是由于业务数据量庞大,检查人员只能完成抽查工作,检查整改工作仅覆盖极小部分的问题数据。其中,生产业务域共抽查145 604个字段,发现待整改问题数22 733个;营销业务域共抽查3 379个字段,发现待整改问题数109个。

3 人工录入数据准确性较低

检查过程中发现一些数据源头的质量问题,如由于人员录入错误造成的设备技术参数缺失、数据填写标准不统一及数据不准确等。检查发现的问题数据需再次由人工补录、修改,依然存在人工失误造成的问题数据。

针对这些现状和问题,为了提高数据核查工作效率,保证数据认责工作质量,迫切需要借助图像识别技术等人工智能手段作为工具支撑,保障公司数据认责工作规范有序地开展。

4 图像识别技术及应用情况

图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。使用图像识别技术,通过图像读取、边缘检测、抽象、分割及分类等过程,可将图像中的文本信息转化为计算机可存储的数据。其中,图像读取是把图像电子化以图片的方式进行传播;边缘检测在于确认图片中图像的边缘,确定图像的范围;抽像就是把复杂的图像简化,得到骨架,以准确表示图像;分割就是对骨架进行切割,便于以更简单的图形反映图像。分割也叫不变几何特征提取,通过分割可以以环、交差点、端点等图形表示图像。分类是通过神经网络对图形进行识别归类的过程。在图像识别的过程中,对于同一物体的图像很容易受到各种噪声的干扰,如图像位置、大小、角度、颜色、光影及背景等,都会对识别造成影响。例如,同一个物体,位置旋转了一定角度,从图片中看是明显的不同,此时网络是否又能正确识别。对于同一物体的图像,不管位置、大小、角度、颜色、光影及背景如何变化,都必须能够识别出来,这是技术实现的一个难点。对于轻微畸变或是轻微残缺的物体的图像,是否能正确分类到正常物体的一类,这也是一个难点。

图像识别是人工智能的一个重要领域,目前在金融、政府、工业、教育及医疗等行业都有常见的应用场景。例如,人脸识别、监控视频快速检索及防控预警在公安系统中的应用;在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域;医疗影像数据的识别和诊断辅助,提升了医生的诊断效率;通过图片文字识别,实现了文字高速录入。

对于电网企业数据,可用在电网设备台账建立、物资仓储信息管理及实物数据与系统数据之间的核查对比等与数据质量管理密切相关的业务领域。但是,目前常见的图像识别技术解析效果有限,对识别对象的格式标准、参数规范及清晰度等均有较高要求,而根据电网数据的特性,并不能直接使用现有图像识别技术。以电力设备为例,电力设备存在种类多、型号多及参数规则众多等特性,不同类型的设备参数描述可能完全不同,现有图像识别技术未能一一识别电力设备参数名和参数值。因此,鉴于准确性、电力设备的独特性要求和电网设备、客户信息及物资等数据来源的广泛性、特殊性,需要在图像识别技术的基础上进行个性化开发,针对不同业务域建立模型,实现参数解析、参数结构化修正,提高参数名和参数值的识别准确率,实现图像识别技术和电力数据质量治理的有机结合。

5 基于图像识别技术的数据核查系统实现

5.1 系统架构

基于图像识别技术的数据核查系统架构从下到上分为数据层、核心业务层及应用层,如图1所示。

5.1.1 数据层

数据层是系统的信息数据物理存储,包括设备数据、认责权限数据及核查结果数据。

(1)设备数据。系统定时从CSGⅡ系统源数据库中同步地生产、营销管理系统相关数据。

(2)认责权限数据。云南电网公司数据认责体系中按数据主题、责任人建立的责任关系,即最小管理单元的数据责任,实现数据责任到岗的管理目标。

(3)核查结果数据为系统核查后保存的核查整改清单,以供用户对比整改。

5.1.2 核心业务层

核心业务层是系统进行图像识别、核查对比的核心模块。

图1 基于图像识别技术的数据核查系统架构设计

(1)图像预处理。使用图像识别技术,对采集的图片进行图像倾斜矫正、切割、局部二值化及去边框等处理。

(2)图像解析。使用图像识别技术,根据空白区域、冒号及横线进行内容定位和切割,标记内容区域的4个定位坐标值,获取图像中的参数信息。

(3)参数结构化。根据图像解析获取的参数,与数据层中的设备数据验证,匹配现有系统设备台账参数、电力相关数据单位,对解析出的参数名和参数进行修正,包括合并、拆分、整合,获得准确的设备参数和参数值组合。

(4)核查验证。根据图像识别技术和参数结构化获取的数据,与同步的设备数据进行对比。

(5)核查结果整合。以列表形式整合实物数据与系统数据对比结果,对差异数据进行标识。

5.1.3 应用层

应用层分为PC端应用和移动应用,可为工作人员提供现场核查和后台批量核查两种处理方式。

(1)PC端应用提供任务分配、批量上传、整改提交及统计分析等功能应用。

(2)移动应用提供任务查询、图像采集、结果查询及统计分析等功能应用。

5.2 数据核查处理过程

数据核查的核心处理过程是使用图像识别技术,对各业务域现场实物与数据库中的现有数据对比核查、整改。

5.2.1 同步业务系统数据

数据核查系统定时从各系统将生产设备台账、营销档案等信息同步存储到本地数据库。

5.2.2 现场实物数据获取

工作人员通过图像识别技术对现场实物进行图像采集、识别解析,系统对解析后的结果完成参数结构化处理。由于电网设备种类、型号众多,不同型号的设备,参数标准千差万别,图像识别的目标参数是未知和繁琐的,需要对识别解析的内容进行定制化地参数格式化处理。此过程也是系统的核心业务功能。

5.2.3 核查对比

根据解析并结构化后的实物数据,与系统数据的对比检查,展示核查结果,对需要整改的信息进行提示。

5.2.4 一致率统计分析

根据核查对比的情况,对各项数据指标的核查一致率进行统计分析。

5.3 多种数据核查方式

根据实际业务需求,基于图像识别技术的数据核查系统提供两种数据核查方式,分别是使用移动应用进行的现场核查方式和使用PC端应用进行的后台批量核查方式。

5.3.1 移动应用现场核查方式

系统提供移动应用,可直接连通系统数据库及后台业务处理,对现场采集到的图片信息完成图像识别后进行参数获取和核查对比操作,适用于生产一线员工日常巡检、现场检查等应用场景。

现场核查处理流程如图2所示[1],不同于过去“检查人员提前准备资料→现场对比→手工标注错误→手工整改数据→返回现场核对”的核查过程,通过移动应用,实现一拍即核查,解决了核查工作繁琐、消耗人力时间的问题,更有效地提升了整改数据的准确性。

图2 现场核查处理流程

5.3.2 后台批量核查方式

系统还提供PC端应用,支持批量上传图片,对收集的图片信息完成图像识别后进行参数获取和核查对比操作,适用于已有设备图片、工作现场无法使用移动设备及不能及时上传采集图片等情况,实现后台批量处理[2]。

通过PC端系统的应用,对于已有完善资料的设备,工作人员就无需再抵达现场采集信息,可更加便捷地完成数据核查,并在此基础上实现自动生成新设备台账数据。新设备投产时,减少了人工录入的工作量,在数据源头就避免了因人员录入错误而造成的数据质量问题。后台批量核查处理流程如图3所示。

6 系统应用效果及扩展性

基于图像识别技术的数据核查系统已完成在云南电网公司的部署,目前已在试点供电局应用。通过系统的应用,基层一线员工在现场操作、日常巡检工作中,实现一拍即核查、一查即整改的效果,改善了过去检查专家多、耗时久及检查范围受限的情况,节省了人力物力,实现了系统建设预期目标。有效提升试点供电局数据整改工作效率,提高数据质量水平,下一步将按计划推广到全省应用。

基于图像识别技术的数据核查系统目前实现了与生产管理系统、营销管理系统的基础数据实时核查、整改,避免了人工核查的时间、费用成本,提高了数据的完整性、准确性、规范性。后续系统扩展中将进一步扩展核查范围,如人资业务域、物资业务域等,增加员工信息、物资合同及仓储资产等基础数据的图像识别、参数结构化处理功能,进一步支撑云南电网公司数据认责工作,促进公司数据质量提升。

图3 后台批量核查处理流程

7 结 论

本文主要介绍了图像识别技术在云南电网数据认责中的研究与应用,以供参考。

猜你喜欢
图像识别核查电网
使用数字多用表对接地电阻表检定装置进行期间核查
计及SOC恢复的互联电网火储联合AGC控制策略研究
穿越电网
关于设计保证系统适航独立核查的思考
基于无人机影像的营造林核查应用研究
基于Resnet-50的猫狗图像识别
电网调控技术在电力系统中的应用
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用