毛 华,房向阳,王 斌,孙 岳
(国网天津市电力公司,天津 300010)
随着我国新型电力系统建设的推进,众多电力建设工程正在广泛地开展,而电网企业对工程建设投资及精益化运营管理的要求也越来越高。
数据挖掘(Data Mining,DM)是利用大数据、人工智能等先进技术实现海量数据分析及潜在价值提取的过程[1-2]。目前电网企业通过不同的信息化系统,实现了电力工程数据的采集与共享,且积累了海量的数据。然而其却并未将这类数据转化为有效信息,因此无法为企业的运营决策提供辅助指导[3-4]。
与电力工程建设相关的技术经济工作贯穿于工程建设的各个环节,对于保障工程的质量、进度和安全均具有重要意义。目前技经工作仍依赖于人工作业,费时且耗力[5-6]。现阶段已有研究利用回归分析(Regression Analysis)、支持向量机(Support Vector Machine,SVM)与极限 学习机(Extreme Learning Machine,ELM)等[7-9]机 器学习(Machine Learning,ML)算法来实现对电力工程费用的预测。但受算法模型限制,其特征提取较为复杂,故预测精度有限。
针对此,文中结合双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)和Attention 机制等先进算法,实现电力工程费用的智能计算,从而解决技经算量工作灵活性差、效率偏低及强度较大等问题。
电力工程数据智能分析系统总体结构如图1所示。
图1 系统总体结构
其包括表现层、业务层、数据层与物理层共四层结构,各层具体功能描述如下:
1)表现层:获取用户输入的相关信息,同时将其所需的信息通过友好型界面进行展示,从而实现人机互动。该层的载体通常包括可视化大屏、浏览器和客户端等。
2)业务层:利用表现层用户提交的信息及数据层采集的不同电力工程项目信息,实现内部业务逻辑的处理。
3)数据层:实现对用户数据、工程数据和造价数据等的存储与检索。该层的各类数据通常包括数据库及数据对象两个模块,前者实现了对数据的分类以及分布式储存;后者则通过面向对象技术(Object-Oriented Technology),建立与数据库之间的映射关系,进而便于操作使用。
4)物理层:完成发、输、配、变等电力工程数据的采集和获取,且数据采集可通过智能传感器自动采集上传或从业务系统进行调取。
为了对电力工程多源数据进行智能融合分析,实现项目工程量及造价的精准预测。文中从相关数据中筛选出主要影响因素,并构建了电力工程智能数据处理分析体系。如图2 所示,该体系共包括技术指标、工程量指标及费用指标三类共19 个指标。
图2 电力工程数据分析指标体系
在上述电力工程智能数据分析指标体系的基础上,文中提出了基于Attention 机制与BiLSTM 的电力工程造价预测算法,结构如图3 所示。其将电力工程技术指标、工程量指标和费用指标等数据输入由Attention 机制优化后的BiLSTM 模型,最终实现电力工程造价的精准预测。
图3 该文所提算法结构
循环神经网络(Recurrent Neural Network,RNN)是研究者们在处理长时间序列数据时提出的一种改进神经网络[10-12]。该网络通过循环体n实现模型参数的共享以及时序特征的关联,其结构如图4 所示。
图4 RNN网络结构
RNN 网络的输出为:
输出值与真实值之间的误差为:
因此RNN 网络训练的损失函数为:
该网络采用梯度下降法进行模型训练,则损失函数对于模型参数的偏导数为:
由式(4)可知,随着RNN 网络层次的增加或者当损失函数选取不恰当时,容易出现偏导数接近零或无穷大的问题,即梯度消失或爆炸。
而LSTM 是一种具有特殊结构的RNN,由于其能较好地解决梯度消失、爆炸的问题,得到了广泛的应用。
LSTM[13-14]循环单位的结构,如图5 所示。其最为关键的结构为三个“门”,且不同“门”实现的功能描述如下:
图5 LSTM单元结构
1)遗忘门:控制t时刻LSTM 单元需过滤掉的、从t-1 时刻传递过来的部分状态信息。
2)输入门:控制t时刻LSTM 单元从t时刻输入数据xt中新添加的信息内容。
3)输出门:控制t时刻LSTM 单元输出数据。
将三个关键“门”实现的功能用表达式进行描述,则有:
式中,σ(·)为激活函数;xt为t时刻的输入数据;yt-1为t-1 时刻的输出数据;ft、it和ot分别是三个“门”的输出,其取值在区间(0,1)范围内;而Wf、Wi与Wo分别为三个“门”的权重矩阵;bf、bi和bo则分别是三个“门”的偏置向量。
由图5 可知,t时刻LSTM 单元的状态为:
式中,WC和bC为输入门的权重矩阵和偏置向量。
由于LSTM 模型仅适用于过去输入数据对未来输出存在影响的场景,而无法描述未来时刻输入数据对当前时刻输出的影响。所以在此背景下,BiLSTM 模型便应运而生。该模型通过在正向LSTM网络基础上叠加一层反向LSTM 网络,从而增强模型的泛化能力。
此外,考虑到不同数据对电力工程造价预测的重要程度也有所不同。故在BiLSTM 层之后,引入了模拟人类大脑信息处理模式的Attention 机制。进而实现有选择性的信息处理,并进一步提高电力工程造价预测的准确度。由此得到基于BiLSTM与Attention 机制的联合模型[15-16],其具体结构如图6所示。
图6 BiLSTM与Attention联合模型
BiLSTM 模型的计算过程如下:
Attention 机制的计算过程如下:
式中,Z为BiLSTM 层输出向量;D为中间向量;a为注意力权重向量;Y为BiLSTM 与Attention 联合模型的最终输出向量。
为验证文中所提BiLSTM 与Attention 联合模型的准确性,从某省电网公司2016—2021 年中选取了120 条架空线路工程相关数据作为数据集。其中训练数据有100 条,测试数据则为20 条。
利用测试数据集分析对比所提联合模型与LSTM、BiLSTM 算法在电力工程费用预测方面的准确性。以杆塔工程费用预测为例,拟合曲线如图7所示。从图中可以看出,与LSTM、BiLSTM 模型相比,文中所提联合模型的杆塔工程费用预测准确性较高,且平均预测误差仅为3.6%。而BiLSTM 模型为6.3%,LSTM 模型则超过了10%。由此表明,该方法的拟合效果良好,能够满足精度要求。
图7 杆塔工程单位造价预测结果对比
对架空线路的架线、基础等其他五部分工程费用的预测结果进行对比,如表1 所示。可以看到,对于架空线路的不同工程,所提算法的平均预测误差更低,且均小于5%。
表1 不同算法费用预测误差结果对比
进一步将该文算法应用于三个实际电力工程费用的预测分析中,不同工程的费用预测结果及占比如表2 与图8 所示。
表2 不同工程单位费用预测
图8 3个不同架空线路工程费用占比
可以看到,杆塔、架线和基础这三个部分的工程费用占比较高,均大于10%。尤其是杆塔工程,占总费用的30%~40%,且三个部分的工程累计占比约为85%。而附件、接地和辅助这三部分的工程费用所占比例较低,均小于10%。由此说明,杆塔、架线和基础这些部分工程对总体项目费用影响较大,故在架空线路工程建设过程中要加强对其的监管。
针对电力工程费用计算的难点和重点,并结合深度学习技术,该文设计了电力工程费用的精准预测算法。仿真算例结果表明,所提算法的平均预测误差小于5%,而LSTM 算法接近10%,BiLSTM 则约为6.5%。在实际电力工程中,杆塔、架线和基础工程费用的占比较高,因此需加强对这类分项工程的管控。然而该算法仅实现了静态工程费用的预测,无法结合工程实际推进情况进行动态费用评估,这将在后续工作中开展。