张艳丽,牛任恺,张鑫磊,孙志杰,王利赛
(国网冀北电力有限公司营销服务中心(资金集约中心、计量中心),北京 100032)
营销稽查中心对供电局的深入开发与创新,已从传统的智能化稽查、预检预防、过程控制等工作,向市场稽查提出了更高的工作要求[1]。营销系统联机审计主要依靠省级企业的审计系统,对整个销售领域的数据进行核实,由于稽查规则更新滞后,导致稽查结果不够准确,并且对异常工单中存在的问题难易进行有效查找,影响被稽查单位异常问题的纠正效率,造成异常数据积压过多[2]。以往,在市场推广工作开展前,由计量专员下达纸质工作单,现场人员将纸质工单送到现场实施,仪器设备的资产号码和逻辑地址被复制回现场,然后返回给仪器设备组的内部人员,由工作人员输入并调试终端信息[3]。这一营销模式耗费大量人力物力,且效率极低。针对这一问题,提出基于序列标注的业务异常工单判别方法。
使用注意力机制作为业务管控规则,其核心目标是从大量的信息中选择对于当前任务目标来说更重要的信息。注意力机制可应用于数据(图像、文本)处理,并对特定任务进行处理[4]。远程监测方法引入了噪声数据,在实体关系提取任务中,越来越多的实体关系提取模型中加入了注意力机制,以表征营销业务情况[5]。在营销业务实体关系抽取中使用的注意力机制层结构如图1 所示。
图1 注意力机制层结构图
如图1 所示,句子层次注意机制对句子集中的每一句都设定不同的权重,根据权重顺序生成句子特征向量。在注意力层次上,句子被组织成为一组句子特征,由此完成注意力机制业务管控规则的设定[6]。
在业务管控规则注意力机制下,存在营销业务工单存储十分混乱、存储规模庞大的问题,为了避免该问题产生,使用语义消歧中的柱状搜索方法进行解码[7-9]。观察工单数据ot所对应的状态集合,在柱状搜索解码过程中,每一步都需要搜索状态集合,该过程可描述为:
式(1)中,aij表示状态转移概率矩阵;bj表示状态观察概率矩阵。
该方法不仅有效解决了营销业务工单存储混乱问题,而且降低了解码的复杂程度,有效地完成了知识融合[10-12]。
三元组是知识图解的普遍表示,其基本形式主要是<实体1、关系、实体2>,可以使用这些属性值描述实体内部属性[13]。知识图谱中的实体称为节点,节点之间的边代表实体之间的关系,图2 中描述了实体之间的联系。
图2 知识图谱
由图2 可知,在知识图谱数据库中输入“Match(n:Marketing operations)where n.name=′Abnormal work order′ return n”这条语句,数据库中收集了所有相关业务异常工单的信息[14]。返回结果中包含A1~An正常业务和B1~Bn异常业务相关的信息,实体圆之间通过实线连接,说明不同信息之间具有一定关联关系[15]。
结合异常营销业务中的每一信息属性,通过注意力机制设定的业务管控规则,确定不同信息之间的原始关系,再借助融合后的知识,在营销业务管控规则知识图谱支持下,解析新增的稽查目标,快速输出与稽查目标相匹配的稽查主体和业务管控规则,提升稽查主体的创建维护管理效率[16]。稽查主体确定过程如图3 所示。
图3 稽查主体确定过程
在图3 所示的稽查主体确定后,智能推荐稽查规则,如下所示:
根据不同的专业和业务类型,在建立问题库关联规则之前,应该编写审计规则。举例来说,定义“业务扩展与报装”专业为A,定义“业务扩展与报装”下的“业务接受”专业为A1,定义“复制、检查和抄核”专业为B,依此类推。在大数据审计中,关联规则审计是主要形式之一,也是无监督学习系统中最常见的知识发现方式之一。通过对审计中发现的问题进行收集、整理,利用关联规则挖掘算法进行挖掘,找到问题之间隐藏的相关性。关联规则挖掘相应结果如下:
上述稽查规则关联含义:在第1 条规则中,如果A11-01 出现异常问题,那么A13-01 也可能出现问题,该规则下的置信度为0.8;在第2 条规则中,如果A12-02 出现异常问题,那么A12-03、A21-01 都有可能出现问题,该规则下的置信度为0.6;在第3 条规则中,如果A12-02 出现异常问题,那么A21-01、A12-03 都有可能出现问题,该规则下的置信度为0.88。
在稽查次数多且发现问题较多的情况下,关联挖掘规则的准确性和判别结果的准确性较高。因此,在一般情况下,选择信任度和兴趣度较高的规则作为异常工单判别方案的参考,以提高下一步的准确性。
针对不同的稽查工单,提出稽查核实步骤和整改措施指引,辅助业务人员开展工作,从而实现业务管控支撑的智能化。
用电企业在新开电表时,应对用户电源线的接线情况进行详细检查,确保接线正确,还要注意仪表上是否有显示数据,数据是否合理,以消除卡滞和无显示故障,确保新用户安装电表的合理性,进而保证用电的安全性与可控性。
对低电量用户而言,企业应着重审核、比较和测试实际用电量与低电量用户的用电数据,核对用户用电量记录,与此同时,也要检查是否有作弊、改装等偷电行为。对违反规定的现象,将责令其改正,并对其进行监督。所以使用者一定要仔细检查低功耗情况,以免违规。
契约审查是电力市场审计的重要内容,在稽查监督过程中,一定要仔细审查合同,核对合同资料,注意合同期限,为了有效地检查用电时间,还要做好各部门的任务分配,做好电力销售方式和销售时间的检查,因此,可确保电力市场监测与监管的有效开展。
基于深度学习技术,智能解析稽查工单的原始信息和核实后的原因说明以及整改措施等反馈信息,判断导致异常的原因类型,并标记工单的问题原因标签,实现稽查工单智能研判。
构建如图4 所示的深度学习层次。
图4 深度学习层次
从图4 可以看出,利用5×5 卷积核生成断层特征图,计算了断层特征图的邻域平均像素值,从而减小了特征图的尺寸。下层采样层的图像特征由函数激活,神经网络的阈值函数为单递增函数。采样层中的一个图作为一维向量输入到连接层的神经元中,利用软件Softmax 函数对矢量进行标准化处理,突出最大值,抑制远小于最大值的分量,从而完成正常和异常分类输出。图5 为稽工单智能研判过程。
图5 稽查工单智能研判过程
由图5 可知,异常工单判别结果比发现的问题更隐蔽,以往由于工作人员缺乏相关性分析、难以发现和验证稽查过程存在的问题,常常成为稽查盲点。因此,需优化稽查过程,对系统中的变更进行分析、审核,选择关键变更并分发到业务部门。该工作指令将在部门的工作指令回应后得到反馈和评估。基于上述假设,在变更分析和筛选过程中,添加了关联视图环节,有效提高了判别工作的效率和质量。
为了验证基于序列标注的业务异常工单判别方法的合理性,进行实验验证分析。
实际用户用电数据如图6 所示。
图6 实际用户用电数据
由图6 可知,在不同业务序列下,用电数据幅值呈3 个小周期波动,第一个周期的波动范围是-0.2~2.0 Vpp,第二个周期的波动范围是-0.2~0.5 Vpp,第三个周期的波动范围是-0.2~0.25 Vpp。
根据实际数据集统计结果,利用人工稽查方法与基于序列标注稽查方法对用户用电数据稽查结果进行判别,并与实际数据对比,结果如图7 所示。
图7 不同方法用户用电数据对比分析
由图7 可知,使用基于序列标注稽查方法在不同业务序列下,用电数据幅值呈3 个小周期波动,8个序列业务下的幅值波动范围都为-0.2~2.0 Vpp。
为了进一步验证基于序列标注稽查方法判别业务异常工单更加精准,需对比不同方法异常工单判别结果,如表1 所示。
表1 不同方法异常工单判别准确度对比分析
由表1 可知,使用人工稽查方法异常工单判别结果最高为0.65,基于序列标注稽查方法判别结果最高为0.99,具有更高的判别准确度。
使用基于序列标注的业务异常工单判别方法规范现场作业流程,完善内部服务信息管理,全面提升业务异常工单识别水平。使用该方法不仅提高了测量队伍的工作效率和整体素质,而且工单作业误差率明显降低,工单作业处理时间缩短。该方法对于快速、准确地定位故障用户,缩短维修时间,避免经济损失具有重要意义。