基于大数据的计量资产管理状态预警分析

2024-12-16 00:00:00吴瀚文
中国新技术新产品 2024年22期
关键词:资产管理大数据

摘 要:本文旨在针对智慧电网资产管理状态评估,利用误差反向传播神经网络构建状态预警分析机制,并通过性能测试探讨神经元数量与网络结构对预警准确率的影响,以期为数字化资产管理提供有效支持。通过试验结果发现,在不同隐藏层数和样本规模下神经网络模型存在相应变化,在较小样本规模和较少隐藏层数条件下,增加神经元数量可以降低误差率;而在较大样本规模和隐藏层数条件下,可能导致过拟合效应。这一结果说明在智慧电网资产管理状态评估中需要谨慎考虑选择合适大小及结构深度,以获取最佳预测精度。

关键词:大数据;资产管理;状态预警;多层前馈算法

中图分类号:F 407 文献标志码:A

对企业和组织来说,如何有效地评估资产状态并提供及时、准确的预警信息至关重要,本文面向大数据的计量资产管理分析,运用误差反向传播神经网络构建状态预警分析机制,此方面已有一定规模先行研究提供参考与支持。黄璐等[1]探索与实践基于数智技术的新商科试验数据资产管理体系,推动数字教育生态发展。徐京平等[2]构建国家审计与公共数据资产管理逻辑体系,提出驱动路径,以促进我国数字治理现代化。孙圣雄等[3]研究了技术与信任融合的数字艺术产业数据资产管理体系,促进数字艺术健康发展并保护主体权利。侯修群等[4]通过DPMM方法解决核主泵状态预警问题,并开发振动异常数据定位方法提高预警准确率。王晓蓉[5]提出基于大数据挖掘的电力变压器健康状态差异预警规则策略,并成功应用于现场运行中,准确率为98.21%。徐尧宇等[6]引入信息决策理论和属性依赖度理论解决信息缺失下变压器状态预警问题,验证其有效性,为变压器智能化运维和风险管控提供了指导。马新娜等[7]提出了高速列车监测大数据可视化分析模型。

1 模型构建

1.1 数据获取

在针对智慧电网资产管理状态评估的研究中,数据的准备阶段至关重要。智慧电网涉及大量复杂的资产,例如变压器、电表、传感器等,这些资产产生的数据对分析和预测电网运行状态至关重要。面向预警需要,收集与智慧电网相关的大规模结构化和非结构化数据,包括实时负荷情况、设备运行状态、天气条件等信息。在数据准备阶段,需要收集各种相关的数据源,例如电压 V(t)、电流I(t) 、温度 T(t)等各种传感器测量的实时数据。这些数据在时间上可能是连续的或者不连续的。为了进行模型处理和分析,需要为所有的连续或不连续时间流中的数据分配时间戳t ,以确保数据的时序性和连续性。

设ti为第i个时间点,构成事件流 t1,t2,…,tn,其中n为数据点的总数,也即采样的总体时间跨度。每个时间点ti对应1组测量数据,例如电压V(ti) 、电流I(ti) 、温度 T(ti)以及与之相关的其他信息。

立足这一时间流,模型还需要基于时间戳增加设备的维修历史、维护时间、更换部件等信息,以捕捉系统环境的故障和异常。为了考虑长期稳定的外部环境变化,模型也需要收集例如天气条件、季节变化等可能影响电网运行的外部因素,为时间戳增加其周期性波动材料,从而更好地处理电网资产管理的各类环境时间因素,丰富其时间戳信息,为后续分析奠定良好基础。

为了兼顾多样化的数据支持,其数据收集与整合工作复杂,这些数据来源于不同的系统和平台,需要通过API、数据库查询或直接采集来获取,通过电网内部信息渠道进行采集,包括设备中的环境监测传感器与业务活动通信流进行数据捕捉、分类,并存储在数据库中。确保数据的完整性、实时性和准确性是数据准备阶段的首要任务,因为后续的分析和预测结果直接依赖这些数据。

1.2 数据整理

基于复杂的数据来源整理、归集,其还需要进行下一步数据清洗和特征工程的处理以及数据的有效划分,确保在建模和评估过程中能够充分利用数据的潜力。一旦数据收集完成,接下来是数据清洗和特征工程的处理。数据清洗旨在处理数据中的错误值、缺失值和异常值,以确保数据质量和一致性。其需要将不同尺度和单位的数据转换为统一的标准,以便模型在训练过程中能够更好地收敛和表现。基于此,需要利用特征工程技术从原始数据中提取关键特征,例如负荷曲线形状、设备温度变化趋势等。同时,也需要识别并处理与正常数据分布不一致的异常值,可以通过统计方法或机器学习算法来实现。这些特征将成为神经网络训练和预测过程中使用的输入,其输入样本如公式(1)所示。

X={p1,p2,…,pn} (1)

式中:X为输入样本;p1,p2,…,pn为传感器或其他来源数据的时间序列。

确定适当类型和层数的模型与算法,并设置每个隐藏层节点数以及输出层节点数来适应所需任务。具体来说,本文相应选择泛化性能良好的多层前馈算法,其在图像处理、语音识别、自然语言处理、金融风控、医疗影像辅助等许多领域都有成功案例,相关系统均运作良好。在智能电网资产管理中,可以使用神经网络等机器学习模型来构建状态评估模型,假设的神经网络包括L层,l包括权重矩阵W(l)、偏置向量b(l)以及激活函数σ()。在前向传播过程中,输入样本X在权重矩阵W(l)和偏置项b(l)的作用下,通过激活函数σ(),逐层计算得到输出结果Y,其过程如公式(2)所示。

z(l)=W(l)a(l-1)+b(l) (2)

式中:l为神经网络中的每一层,从输入层开始递增直到输出层,其中输入层为1,输出层为L;W(l)为第l层与第l+1层之间连接权重矩阵,它用来调整不同层之间节点(或者称为神经元)之间传递信息时所使用的权重;b(l)为偏置向量,在计算每个节点激活函数前都会加上一个偏置项;a(l+1)为对上一层的继承,又涉及激活函数的参与。

1.3 参数调整

由此,这个输出也会成为下一层节点的输入信号,其逐层递进中的a(l)如公式(3)所示。

a(l)=σ(z(l)) (3)

式中:σ()为激活函数,在每个节点上引入非线性特性并捕获更复杂的模式和关系,通常包括Sigmoid、ReLU、tanh等函数。

因此,针对输入层有公式(4)。

z(1)=σ(W(1)X(1)+b(1)) (4)

针对输出层有公式(5)。

Y=σ(W(L)a(L)+b(L)) (5)

神经网络训练中,损失函数的计算和反向传播算法的应用都是为了优化模型的性能,以更好地预测电网资产的状态和性能。通过训练神经网络,可以建立一个复杂的数学模型,用于状态评估系统的开发。这个模型可以利用历史数据和实时数据来预测电网资产的状态和性能,并提供预警机制,以便及时采取措施来维护电网的运行和稳定性。

当训练神经网络时,需要计算损失函数来衡量模型预测值与真实标签之间的差异,损失函数的计算和反向传播算法的应用都是为了优化模型的性能,以更好地预测电网资产的状态和性能。通过训练神经网络和比较差异,可以评估模型在当前参数下的表现,利用历史数据和实时数据来预测电网资产的状态和性能,并提供预警机制,以便及时采取措施来保证电网的运行和稳定性,并利用这一信息来调整参数,以减少损失函数,使模型更好地拟合训练数据。

其损失计算如公式(6)所示。

(6)

式中:L为损失函数(Loss);Y为神经网络输出的预测值;Yture为真实标签。

反向传播算法用于计算损失函数对网络参数的梯度,进而更新网络参数,以最小化损失函数。反向传播主要分为2个部分,包括求解各参数对应导数和利用这些导数来更新相应参数(使整体损失减小)。基于此,汇聚从最后一层开始逐渐往回更新,需要根据当前预测与真实目标之间误差量L,计算最后一次迭代产生错误所影响到每个节点上面需要调整多少才能减小总体误差。接着根据链式法则、矩阵转置等原理依次推断其他隐藏、隐含结点所需调整量,利用这些参数来更新相应参数,使整体损失减小,最终使用如下方式来完成模型内部变量修正。

其中,更新连接权重矩阵如公式(7)所示。

(7)

式中:α为学习率,这一超参数用于控制步长大小,从而影响单次迭代的波动水平。

更新偏置项如公式(8)所示。

(8)

以上两者构成一个不断交替迭代优化的过程,直至达到许可精度或者尽可能接近全局最佳状态,包括对各种资产状态和性能的实时监测和预测以及对潜在问题的及时发现和解决。

2 性能测试

本研究中,利用智慧电网数据库获取了大规模数据集。这些数据包括了各种计量资产的运行状态、能源消耗情况以及设备健康状况等信息。在获得原始数据后,去除重复记录、缺失值以及异常值,并对噪声进行平滑处理,提取与资产管理状态评估相关的特征变量,并对其进行归一化处理。基于不同隐藏层数和样本规模要求,在经过清洗和提取后,按照设定条件随机抽取相应数量的样本作为训练集和测试集。基于此数据集展开多轮测试试验,以评估不同隐藏层数下神经网络模型在计算耗时及预警准确率水平上的表现。

2.1 计算耗时分析

针对不同隐藏层数和样本规模,随着神经元数量增加,计算耗时也随之上升。针对不同水平隐藏层数,不同样本规模条件下其计算耗时随神经元数量增长而迅速增长,在100神经元水平下略高于300s。当隐藏层数增多时,这一消耗时间会出现波动幅度逐渐扩大的趋势。尽管如此,在神经元数量较少且合理控制范围内仍能有效地控制计算时间。这一结果表明了隐藏层数量对计算效率具有重要影响,增加隐藏层可以提高预测准确度,但可能导致更长的训练时间;同时,需要注意在选择合适范围内调节神经元数量,以平衡预测准确度和运行效率之间的关系。在相同隐藏层数和样本规模条件下,在神经元数量变化下获得计算时间曲线如图1所示。

2.2 预警准确率分析

当对不同隐藏层和样本规模的数据集进行分析时,着重关注了预警准确率。根据研究结果显示,误差率与神经元数量呈负相关:随着神经元数量增加,误差率呈下降的趋势。特别是在较小样本规模和较少隐藏层数条件下,表现出相对较低的误差率水平(随着神经元数量上升从13%降至4%)。总体来说,在整个试验范围内,总体误差率从15%逐步降至略高于3%的水平。在较大样本规模和隐藏层数条件下,观察到一个截然相反的情况:随着神经元数量上升,这些情况存在更低的错误估计水平(误差率由14%降至2%)。这一结果显示,当复杂度稍微简单一些、训练数据量不太大时,增加网络容量可以显著地改善预测准确性。然而当处理更复杂、更庞大的数据集时,增加网络容量会产生类似“过拟合”效应,并导致训练集上表现良好但测试集上泛化能力欠缺。因此,在智慧电网资产管理状态评估中需要谨慎考虑选择合适大小及结构深度,以获取最佳预测精度。

3 结语

在面向预警需求的基础上收集与智慧电网相关的大规模结构化和非结构化数据,并利用特征工程技术从原始数据中提取关键特征。选择泛化性能良好的多层前馈算法作为主要算法架构,并详细介绍了其涉及的计算过程、激活函数以及损失函数选择。针对性能测试方面,获取并处理了来自智慧电网数据库中包括各种计量资产运行状态、能源消耗情况以及设备健康状况等信息的大规模数据集。通过试验结果发现,在不同隐藏层数和样本规模下神经网络模型表现出相应变化:随着神经元数量增加而导致错误率呈下降的趋势;同时,也观察到较小样本规模和较少隐藏层数条件下显示出较低误差率水平,在较大样本规模和隐藏层数条件下则会呈现更低的错误估计水平。这一发现提示需要选择适当大小及结构深度,以获得最佳预测精度。因此,当进行智慧电网资产管理状态评估时,需要谨慎考虑这些因素之间的关系。

参考文献

[1]黄璐,周勇义,邢姝,等.基于数智技术的新商科实验数据资产管理体系探索与实践[J].实验室研究与探索,2024,43(4):184-189.

[2]徐京平,张可雨.国家审计与公共数据资产管理:逻辑体系、作用机制和驱动路径[J].财会通讯,2024(5):14-21,26.

[3]孙圣雄,殷俊.技术与信任融合的数字艺术产业数据资产管理体系研究[J].情报科学,2023,41(4):99-104,116.

[4]侯修群,蒋庆磊,李振,等.基于DPMM的核主泵振动状态预警方法研究[J].原子能科学技术,2021,55(增刊2):342-349.

[5]王晓蓉.基于大数据挖掘的电力变压器健康状态差异预警规则策略[J].电测与仪表,2024,61(2):216-224.

[6]徐尧宇,李元,王怡静,等.信息缺失下变压器状态预警方法[J].高电压技术,2020,46(9):3062-3069.

[7]马新娜,施文锐.高速列车状态监测大数据的预警可视化分析研究[J].电子测量与仪器学报,2019,33(7):21-27.

猜你喜欢
资产管理大数据
论基于内部控制的事业单位资产管理模式
时代金融(2016年23期)2016-10-31 13:02:15
浅析国有企业资产管理存在的问题及对策
经营者(2016年12期)2016-10-21 07:59:31
绩效角度下的高校固定资产管理模式研究
中国市场(2016年36期)2016-10-19 04:33:51
事业单位会计核算及资产管理存在的问题与应对方法探讨
大数据环境下基于移动客户端的传统媒体转型思路
新闻世界(2016年10期)2016-10-11 20:13:53
基于大数据背景下的智慧城市建设研究
科技视界(2016年20期)2016-09-29 10:53:22
数据+舆情:南方报业创新转型提高服务能力的探索
中国记者(2016年6期)2016-08-26 12:36:20
论事业单位资产管理与预算管理的结合
企业导报(2016年12期)2016-06-17 16:13:27
浅谈行政事业单位资产管理内部控制建设
企业导报(2016年10期)2016-06-04 11:32:55