基于卷积神经网络的电力工程造价数据异常识别方法

2022-09-14 09:45戴小凤朱卫东
兰州工业学院学报 2022年4期
关键词:冗余度卷积代表

戴小凤,朱卫东

(1.安徽审计职业学院 工程管理系,安徽 合肥 230601;2.合肥工业大学 管理学院, 安徽 合肥 230009)

随着社会经济的快速发展,我国的电网体系日渐完善,电力企业已经得到了跨越式的发展[1]。与此同时,若想保证电网体系愈加成熟,应该加强对工程造价的管理工作,合理的工程造价数据有利于提高电力工程的整体质量和水平,使工程建设可以事半功倍[2]。只有对工程造价数据异常进行准确地识别,才能有效地节约电网建设的投资成本,提高整体的经济效益。

胡姣姣等人[3]提出了一种基于深度学习算法的异常序列数据的检测方法,用来解决部分不平衡数据不易检测出异常数据的现状。该检测方法可以有效解决传统的异常序列数据检测方法检测不准确的问题,并通过深度学习算法,提高了该检测方法的检测效率和准确性,但是质量较差。李新鹏等人4]为了提高电力调度数据在检测过程中的准确率,提出一种基于随机森林算法的电力调度异常数据检测方法,实验结果表明,该方法在应用中具有一定的可实用性,但是识别精度较低。针对上述问题,提出一种基于卷积神经网络的工程造价数据异常识别方法,从而保证数据识别的精度和质量。

1 工程造价数据异常识别及算法

1.1 工程造价异常数据权重计算

(1)

式中:γ、ξ代表工程造价异常数据的估计参数。利用卷积神经网络模型对工程造价异常数据进行估计[6],并计算出工程造价异常数据的波动系数,计算方法如式(2)所示,即

(2)

式中:β代表工程造价异常数据的置信度。当工程造价异常数据系数变化波动大时,工程造价异常数据的数值越不稳定,会出现较多的异常数据。

根据线性处理法,对工程造价异常数据进行优化[7],结合数据补偿算法将独立的工程造价数据链接到一起,通过式(3)计算出工程造价异常数据的包络特征。

(3)

式中:k(t)表示工程造价异常数据识别过程中的局部数据特征;ϑ(t)表示工程造价异常数据的局部特征分量;a(t)、b(t)分别代表通信系统中工程造价异常数据的幅值和相位。

根据工程造价异常数据的包络特征,计算工程造价异常数据的空间距离,考虑到工程造价异常数据的性质,对异常数据进行分类[8],以确定工程造价异常数据的隶属度,计算方法如式(4)所示。

D(i,j)=d1|yi1-yj1|2+…+dm|yim-yjm|2,

(4)

式中:yim代表工程造价异常数据监测数据值;yjm代表第m维的权重信息值。

利用工程造价异常数据的波动系数,确定工程造价异常数据的权重,计算方法如式(5)所示。

(5)

通过搭建密度分布函数,利用卷积神经网络模型,确定工程造价异常数据的波动系数,根据线性处理法,对工程造价异常数据进行优化,根据工程造价异常数据的包络特征,计算工程造价异常数据权重。

1.2 工程造价异常数据预处理

在进行工程造价异常数据预处理的过程中,首先采用函数极值法,得到工程造价异常数据的权重信息值,从而获取工程造价异常数据的权重特征;再利用离散小波变换算法,对工程造价数据中的异常数据进行预处理,具体过程如下:

假设,C={C1,C2,…,Cn}代表工程造价异常数据中有待于识别的异常数据的数目,根据各个识别数据的特征,获取工程造价异常数据的数据矩阵,如式(6)所示。

(6)

式中:cnm代表识别第n个工程造价异常数据中第m个指标的初始数据。利用函数的极值法,确定工程造价异常数据的隶属度[9],获取工程造价异常数据的特征,对n个异常数据的数据向量ci进行划分,分成κ个模糊组合,并求解聚类中心的最小目标函数,计算方法如式(7)。

(7)

式中:γ代表工程造价异常数据的目标函数值;(φpq)γ代表Cq的隶属度函数;χζψ代表第ζ个造价异常数据与第ψ个造价异常数据之间的距离。计算获得工程造价异常数据的特征如式(8)所示。

(8)

式中:λ代表工程造价异常数据的权值;N代表工程造价异常数据与聚类中心的距离。

采用数据转化法对工程造价异常数据进行预处理[10],利用式(9)给出处理后的m类工程造价异常数据的区间集,即

rm=([rmj-,rmj+],[rmk-,rmk+]).

(9)

以上述公式为基础,通过式(10)求得有待于识别的工程造价异常数据的参数和数据库中工程造价异常数据特征参数之间的关联度。

(10)

式中:l为工程造价异常数据之间的关联系数。

在获取工程造价异常数据的特征后,采用小波离散变换原理[11],对工程造价异常数据进行预处理,通过式(11)计算出工程造价异常数据变量y的信息熵。

S(y)=-∑p(yi)log2p(yi)T(X,Y),

(11)

式中:p(yi)代表工程造价异常数据变量Y的各个组成样本yi的先验概率。

(12)

利用工程造价异常数据矩阵,求解工程造价异常数据的聚类中心,根据工程造价异常数据特征的向量区间集,得到工程造价数据特征参数之间的关联度,通过计算工程造价异常数据的信息熵,完成工程造价异常数据的预处理。

1.3 工程造价数据异常识别算法

在利用卷积神经网络设计工程造价数据异常识别算法的过程中,根据采集的工程造价异常数据样本,对差异特征进行分类,识别出工程造价异常数据的特征,并对各个类型的工程造价异常数据特征进行聚类分析,设定工程造价异常数据的识别阈值,采集不同的工程造价异常数据的特征样本,如式(13)所示。

(13)

式中:mg代表工程造价异常数据的状态空间;As代表mg的k组测量值;v(xk|Ak|)代表工程造价异常数据的分布函数。

根据采集的不同的工程造价异常数据样本的类型,利用卷积神经网络划分工程造价异常数据的分布区域[13],计算方法如式(14)所示。

(14)

式中:fd代表工程造价异常数据的初始值;gf代表分布区域中工程造价异常数据的样本数量;εg代表工程造价异常数据类型;df代表异常数据的训练样本特征;λm代表时间序列集合;uk代表识别到的工程造价异常数据差异特征;sr代表工程造价异常数据在识别中的特征矢量。

在工程造价异常数据的差异分布区域中,将每一个数据节点的概率密度向量定义为dζ,利用式(15)确定工程造价异常数据的识别阈值。

(15)

式中:dj代表工程造价异常数据的二维信息权值向量;gh为工程造价异常数据的约束条件;hk代表工程造价异常数据的差异特征。

在此基础上,采用卷积神经网络中的二维信息权值向量,确定工程造价异常数据的平均长度,通过识别不同类型的异常数据,划分相似度比较高的差异特征[14],得到工程造价异常数据的最大识别结构,如式(16)所示,即

(16)

式中:kg表示工程造价异常数据的字符串结构;de表示工程造价异常数据的差异特征;sa表示工程造价异常数据的平均长度;kh表示相似度比较高的差异特征划分结果。

利用卷积神经网络,通过以上计算识别到工程造价异常数据,具体如式(17)所示。

(17)

式中:δu代表每个差异特征分布区域中工程造价异常数据的分布比例;sg代表不同划分区域中工程造价异常数据的相似程度。

在此基础上设计了工程造价数据异常识别算法,实现了工程造价数据的异常识别。

2 实验分析

2.1 实验环境

为了验证基于卷积神经网络的工程造价数据异常识别方法在实际应用中的性能,在Windows 7操作系统下,搭建了工程造价数据异常识别的仿真平台,工程造价异常数据库为MySQL 2019,数据库编程语言为Java语言,仿真平台中硬件配置为8GB内存、主频为200GHz的CPU Intel CORE i5处理器、IE浏览器。

2.2 实验数据集

实验过程中,采用某一公司的工程造价数据,构建实验数据集,命名为KB93LD数据集。在该数据集中,包含工程造价正常数据、DoS攻击数据和Probe攻击数据,将DoS攻击数据和Probe攻击数据作为异常数据,在KB93LD数据集中选择20%的异常数据作为测试集,其余80%的异常数据作为训练集,利用卷积神经网络对其进行训练,测试文中数据识别方法的性能。

2.3 设置实验指标

为了保证工程造价数据异常识别的精度和质量,先利用召回率指标衡量工程造价数据异常识别的精度,召回率越低说明工程造价数据异常识别的精度越高,计算方法如式(18)所示。

(18)

式中:kb表示工程造价异常数据的属性特征;dp为工程造价数据异常识别的准确率;Sr为工程造价异常数据采集周期;lp为数据特征之间的关联度。

利用冗余度指标衡量工程造价数据异常识别的质量,冗余度值越低,说明工程造价数据异常识别的质量就越高,计算方法如式(19)所示。

(19)

式中:ϑs表示工程造价异常数据的观测向量;μj表示工程造价数据异常识别的均衡性。

2.4 结果分析

为了突出文中方法在识别工程造价异常数据时的性能,引入基于深度学习的数据识别方法和基于孤立森林算法的数据识别方法作对比,在本仿真实验平台中,测试3种方法在识别工程造价异常数据时的召回率和冗余度,工程造价数据异常识别的召回率测试结果如图1所示。

由图1可知,在工程造价数据异常识别的召回率测试中,随着工程造价异常数据量的增加,3种方法在识别工程造价异常数据时的召回率也在增加。其中基于深度学习的数据识别方法得到的召回率最高。当工程造价异常数据量达到200个时,召回率达到了58.9%。基于孤立森林算法的数据识别方法的召回率达到了41%,而采用卷积神经网络识别方法识别工程造价异常数据召回率最低,只有14.2%。说明该方法在识别工程造价异常数据时具有更高的精度。由此可知,利用本文方法进行数据异常识别的效果更准确。工程造价数据异常识别的冗余度测试结果如图2所示。

图1 工程造价数据异常识别的召回率测试结果

图2 工程造价数据异常识别的冗余度测试结果

由图2可知,随着工程造价异常数据量的增加,3种方法在识别工程造价异常数据时的冗余度都在35%以内,采用基于深度学习的数据识别方法的冗余度为33%,基于孤立森林算法的数据识别方法的冗余度为28%,而采用卷积神经网络识别方法识别工程造价异常数据的冗余度也在10%以内,说明文中方法在识别工程造价异常数据时可以提高数据识别的质量。

3 结语

由于传统方法在工程造价数据异常识别中存在识别精度低、质量差等问题。对此,本文提出一种基于卷积神经网络工程造价数据异常识别方法。通过特征提取,确定工程造价异常数据序列。采用卷积神经网络模型来计算工程造价异常数据的波动系数,再根据计算工程造价异常数据的信息熵,完成工程造价异常数据的预处理。实验测试表明:该方法在识别工程造价异常数据时的召回率和冗余度都有所提高,使用本文方法可提高数据识别的准确性和质量。

猜你喜欢
冗余度卷积代表
高速公路桥梁设计冗余度应用
诠释代表初心 践行人大使命
四季的代表
基于3D-Winograd的快速卷积算法设计及FPGA实现
“代表通道”新观察
这个代表咋这么拗
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
桥梁设计的冗余度分析