基于LSTM和CNN文本分类模型实现配网作业智能风险评估

2020-02-22 01:28许杰朱超越毕成吴琴陈潘霞
现代信息科技 2020年18期
关键词:风险评估

许杰 朱超越 毕成 吴琴 陈潘霞

摘  要:文章介绍了配网工程及安全管理现状,分析了开展科学、准确的配网作业智能风险评估的迫切需求,通过明确各类作业风险评估的风险要素,确定了配网作业智能风险评估模型和算法要解决“作业内容”文本分析的难题,并提出了基于LSTM和CNN文本分类模型的解决方案。通过搭建配网作业全过程管控平台,实现了配网作业风险自动评级,有效指导各项安全控制措施的编制、现场监护及到岗到位的排定,提高了配网作业全过程管控的智能化水平。

关键词:配网作业;风险评估;LSTM;CNN

中图分类号:TP182;TP311      文献标识码:A 文章编号:2096-4706(2020)18-0153-05

Abstract:The article introduces the status of safety management of distribution networks operations and analyzes the urgent need for scientific and precise distribution network operation intelligent risk assessment. By clarifying the risk factors of various operations risk assessment,it is determined that the intelligent risk assessment model and algorithm of distribution network operations should solve the problem of text analysis of“job content”and proposed a solution based on LSTM and CNN text classification model. Through the establishment of a management and control platform for the entire process of distribution network operation,automatic risk assessment of distribution network operation has been realized,which effectively guides the preparation of various safety control measures,on-site monitoring and on-the-job scheduling,and improves the intelligence of the entire process of distribution network operation level.

Keywords:distribution network operation;risk assessment;LSTM;CNN

0  引  言

近年来,电力配网建设得到长足发展,国家能源局2015年发布的《配网建设改造行动计划(2015—2020年)》、国家发展改革委2016年发布的《关于加快配电网建设改造的指导意见》等文件中,均明确提出加快现代配网建设。与此同时,电力工程安全监管逐渐得到人们的重视。目前,我国配网工程管理中存在着一定的安全隐患,加之现阶段缺乏有效、准确的作业风险评估方式,难以辨识配网作业的重点风险、重点管控内容,加剧了配网施工管理难度。因此,在电力配网施工中,公司迫切需要利用移动互联网、人工智能等技术,开展对配网作业智能风险评估模型算法的研究和应用,为现场作业管理提供技术支撑,实现科学、准确的作业风险评估,并为作业现场提供安全指导。

1  模型算法实现

1.1  明确风险要素

实现模型算法的第一步是明确风险要素。首先对配网作业开展分类风险识别,实现针对不同类型作业的风险要素分析,并在此基础上对有影响的风险要素进行归类分级。本文根据大量历史数据积累、各专业专家经验、基层单位调查分析等,从作业性质、装备配置、作业环境、人员情况、重点“作业内容”5方面来表述风险要素类别,并结合电力作业的专业不同风险要素也不同的特性,将重点“作业内容”项分类型提炼表述。配网作业重要的风险要素如图1所示。

1.2  建立智能风险评估模型

配网作业智能风险评估模型,从人员情况、装备配置、作业性质、作业环境、重点“作业内容”共5类风险要素开展配网作业风险分析。以周工作计划为主线,基于人员信息库和大型安全工器具库自动拆分匹配风险要素项,并抽取“作业内容”,利用LSTM和CNN混合模型文本分类算法对“作业内容”项进行计算,结合各专业风险评定标准库对各项“作业内容”进行风险赋值得出總分,并自动输出各项目作业计划的风险等级。根据风险等级的不同,可指导各项控制措施的编制、现场监护及到岗到位的排定。智能风险评估模型如图2所示。

1.3  实现智能风险评估算法

上一节建立的评估模型可明确算法的核心是要解决各专业“作业内容”的自动识别,即实现对“作业内容”的语义识别。语义识别主要基于文本分类算法实现对“作业内容”的分类识别,本节采用了一种基于LSTM和CNN混合模型文本分类算法来实现“作业内容”的自动识别,从而实现配网作业智能风险评估,其简要介绍如下。

1.3.1  CNN

CNN(卷积神经网络)是一种深度学习网络,通常由输入层、卷积层、池化层、全连接层、输出层构成。

(1)输入层:可以表达为整个神经网络的开始,在文本处理领域,卷积神经网络的输入可以认为是一张文本矩阵。

(2)卷积层:作为CNN最重要的一部分,卷积层中每一个节点的输入为上一层神经网络的一小块,卷积层将每一小块进行更加深入的分析从而得到更加抽象的特征。以Hi表示卷积神经网络第i层的文本特征(H0=X),W表示权值向量,b表示偏移量,假设Hi是卷积层,Hi的具体产生过程如下:

(3)池化层:可以非常有效地缩小文本矩阵尺寸,经常被使用的两种操作为最大值池化和平均值池化,可以进一步减少全连接层中的节点个数,最终达到减少整个神经网络中参数的目的。

(4)全连接层:提取文本特征,通过全连接层完成“作业内容”的分类,此时分类可以明确配网作业的专业类型。

(5)输出层:输出层完成基于专业类型的细化危险因素分类问题,得到当前“作业内容”属于不同种类的概率分布情况。

1.3.2  LSTM

LSTM(长短期记忆网络)是一种特殊的RNN(循环神经网络),RNN是一种广泛用于处理可变长序列的神经网络,但由于典型的RNN相当于多层前反馈神经网络,长序列带来的大量历史信息会导致传输中的梯度消失和梯度爆炸问题。LSTM的提出是为了克服RNN网络不能处理远距离依赖的问题,是一种改进的基于RNN的网络结构,其通过增加存储单元、输入门、遗忘门和输出门来有效地保存长序列的历史信息,改善由于RNN训练层数较多而导致的信息丟失问题。LSTM单元结构如图3所示。

(1)存储单元:存储单元设置C用来存储当前时刻历史信息。

(2)输入门:输入门设ut决定当前时刻输入向量对存储单元中信息的改变量。

(3)遗忘门:遗忘门设rt是历史信息对当前信息的影响程度。假设我们正在阅读文本中的单词,并希望使用LSTM来跟踪语法结构,如果主语从单数变成复数,需要找到一种方法来摆脱我们先前存储的单复数状态的记忆值。通过遗忘门和输入门,LSTM结构可以更加有效地决定哪些信息应该被遗忘,哪些信息应该得到保留。

(4)输出门:输出门Ot用于控制当前存储单元中信息的输出量,xt为输入的词向量矩阵,ht为LSTM的最终输出。

可以理解为LSTM根据输入门、遗忘门、输出门3个门控单元对信息进行过滤,并通过线性自连接的存储单元累积信息,将其作为中间产物以求出当前时刻隐藏层的输出。

1.3.3  LSTM和CNN混合模型

随着多种神经网络的混合使用在语音识别和计算机视觉等领域的盛行,对将CNN和LSTM等模型结合运用在自然语言处理领域的研究也逐渐增多,结合CNN及LSTM这两种不同深度学习模型优点的混合模型也开始被提出和应用。前文通过分析明确了要解决各专业“作业内容”的自动识别,配网作业智能风险评估模型和算法核心需采用LSTM和CNN混合模型来进行文本分类。LSTM和CNN混合模型结构如图4所示。

CNN-LSTM利用CNN提取较高层次的单词表示序列,并将其输入LSTM中得到句子表示。它既能够捕获文本的局部特征,又能获取句子的时态语义,在情感分类任务中表现良好。基于LSTM和CNN的混合模型将词嵌入后的文本融合到各个卷积层的输出中,加强了原始特征的传递,解决了由于神经网络深度增加所带来的模型训练困难、时间复杂度高、学习周期长、收敛速度慢、梯度消失等问题,提高了文本分类的准确率和性能。同理,将其应用至配网作业“作业内容”文本分析中也能提高其分类的准确率和性能;应用至配网作业智能风险评估模型算法中,也使得风险评估结果更为科学、准确。

1.4  结果验证

为了证明本文评估模型算法的有效性、准确性,本文通过搭建模型训练环境,使用公司近2年配网工程施工的作业计划作为训练集拟合模型。大批量的训练集数据中,每项作业计划数据都包含了前文已明确的风险要素类别,并且每项作业计划均已包含了风险定级,此风险定级结果是已经过公司各生产单位实际工作经验积累,在事后敲定的风险等级,可作为参照值来指导模型训练。经训练,进一步明确不同作业类型的每一小项风险要素类别取舍,并敲定其权重分值,便于事前开展科学、准确的风险定级。例如,经训练明确的配电运检作业风险定级标准规范如表1所示。

使用公司近6个月配网工程施工的作业计划作为测试集对模型算法的结果进行测试,同样测试集数据中每项作业计划数据也都包含了风险要素类别和风险定级,最终分工程类型将测试结果与测试数据值进行对比分析,得出总体准确率保持在95%以上,测试结果如图5所示。

2  平台建设

基于配网作业智能风险评估模型的算法研究和模型测试结果,公司使用TensorFlow开发和应用了配网作业全过程管控平台,通过平台功能实现了各专业风险赋值表的建立、人员信息库的建立、大型工器具库的建立,为智能风险评估和定级提供了数据支撑;并融入了基于LSTM和CNN的文本分类模型,实现了智能风险评估模型和算法,为现场作业管理提供技术支撑,实现对现场作业的全过程实时管控,实现科学、准确的配网作业风险评估。

通常情况下,配网风险管理由作业管理人员以周作业计划为单位批量导入,导入后根据后台设定的自动评测时间,定时触发开启对所有作业的风险自动评估定级。平台同时支持对单条计划手动触发风险自动评估定级,定级后可查看各作业计划的每项风险要素类别判断结果。自动风险评估结果展示如图6所示。

3  结  论

综上所述,基于LSTM和CNN文本分类模型实现的配网作业智能风险评估模型和算法,为作业风险评估的科学性、准确性奠定了基础。公司通过应用模型算法搭建配网作业全过程管控平台,实现了各类配网作业的智能化风险评估,实现了对配网作业全过程的标准化、全景化、电子化、实时化管控,进一步提高了配网作业管理的针对性和工作效率,实现了管理水平和工作效率的双提升。

参考文献:

[1] 国家电网公司.供电企业安全风险评估规范 [M].北京:中国电力出版社,2008.

[2] 林奕欧,雷航,李晓瑜,等.自然语言处理中的深度学习:方法及应用 [J].电子科技大学学报,2017,46(6):913-919.

[3] 邱宁佳,丛琳,周思丞,等.结合改进主动学习的SVD-CNN弹幕文本分类算法 [J].计算机应用.

[4] 陈磊,李俊.基于词向量的文本特征选择方法研究 [J].小型微型计算机系统,2018,39(5):991-994.

作者简介:许杰(1984.04—),男,汉族,浙江杭州人,高级工程师,本科,主要研究方向:电力工程项目的信息化管理、电气试验、电动汽车充换电与配电网融合互动。

猜你喜欢
风险评估
铅锑冶炼污染场地周边土壤铅污染特征及潜在生态危害评价
我国养老保险基金投资运营的风险评估
现代风险导向审计局限性及其对策研究
中小企业财务管理问题研究