吴建军++崔慧明++吴正功++段尧
摘 要:近年来,随着智能电网建设的不断发展,各类电力故障发生的频率不断增加,给电力行业安全生产带来巨大隐患,大数据技术近年来在电力状态检修领域也得到广泛应用。本文基于目前电力状态检修现状,介绍了用于电力状态评估领域的大数据理论,阐述了电力大数据信息聚合模型。
关键词:大数据;状态评估;技改大修
中图分类号:TM73 文献标识码:A 文章编号:1671-2064(2017)07-0126-02
1 研究背景和意義
随着智能电网建设的快速发展,电网规模逐渐扩大,同时电力设备的故障发生频率和次数也不断增加,导致出现大停电事故。
为了能够及时预防电力设备故障,需要对电力设备做状态在线监测,保证在设备发生故障前及时预测并对设备开展维修,确保电网安全经济运行。电网可靠性取决于电网设备的运行可靠性,而对电网设备的可靠性的监测及评估是状态维修重要内容。在电力企业中实施状态检修的目的是应用现代管理理念和管理技术,采用有效的监测手段和分析诊断技术,准确掌握设备状态,保证设备的安全、可靠和经济运行;科学地进行检修需求决策,合理安排检修项目、检修间隔和检修工期,有效降低检修成本,提高设备可用性;形成符合状态检修要求的管理体制,提高电力企业检修、运行的基础管理水平。
如何利用电力公司现存各系统如PMS等提供的信息对电网设备进行监测,并及时预测故障,已成为当前智能电网发展重点,面对电力系统的海量信息,需要采用全新的大数据技术,对电网设备状态做准确评价,从而为技改大修项目的精准投资和精益化管理提供有力技术手段。
2 目前研究现状
2.1 当前状态检修存在问题
当前电力状态检测发展迅速,多种监测设备和状态评估方法投入应用,但是从实际使用情况来看,还是存在如下问题:
(1)效率和及时性不佳。由于对电力设备监测的频率很高,因而产生海量监测数据,在恶劣天气或故障情况下,监测数据会剧增,现有监测手段往往难以及时处理,信息利用率低下,因而导致状态评估出现滞后。
(2)数据冗余大,准确性不够。极端情况下产生的大量数据具有冗余性,这种数据对于现有状态评估方法干扰大,数据处理时间过长,并且传统阈值判定具有局限性,难以结合设备运行工况的差异,因而严重影响评价结果准确率。
(3)信息孤岛问题。目前电力设备在线监测系统都是针对特定设备开发的,如输电线路在线监测系统,油色谱在线监测系统,局放监测系统,变压器在线监测系统等,这些系统之间缺乏信息共享,形成信息孤岛,各种设备重复配置,资源浪费严重。
(4)扩展性和适应性差。状态在线监测系统所处环境变化大,原有监测方法多为在实验室理想状态下使用,对新环境适应性差,不能准确反映出设备实际状况,现有的技术手段对海量数据难以利用,因而导致数据浪费。
2.2 设备状态检修的技术难点
(1)状态监测数据中异常数据占比很小,按照规范中设定阈值难以划分正常与异常数据边界。(2)设备状态量之间的相互关系非常复杂,难以建立精确数据模型来描述。(3)设备在线监测系统采集频率快,信息量大,通常以数据流形式传输到后台并要求能快速检测出异常数据。
2.3 当前电力大数据研究面临的挑战
国网公司开展大数据的研究应用已有2年多时间,数据来源已经日益成为当前研究遇到的突出问题,在产生维度,统计口径,存储方式,异常辨识,采集密度等都存在障碍,当前的数据源难以支持全行业的大数据研究,成为数据融合的挑战。当前设备状态在线监测面对海量在线监测数据时,遇到“数据海量,信息不足”这一问题,因而使得状态在线监测系统的使用效果受到严重制约。主要原因:(1)状态在线监测系统采集数据海量,价值密度偏低;(2)对设备故障精确判断关注多,对设备状态趋势关注少;(3)数据融合差,无法提供监测设备全景信息。
3 用于电力设备状态在线监测的大数据理论
3.1 以状态预测为首要目标
当前电力设备在线状态监测取得长足发展,从国家电网各使用单位现场反馈情况来看,收效不够理想,造成这一问题的原因有数据采集精度问题,数据传输的抗干扰问题,数据分析不到位问题,另外运维人员对设备状态的判断还是依靠个人经验和国网设备评价导则进行,对设备状态预警重视不够。目前一线电力运检人员对电力设备故障信息和规程阀值极为关注,对设备状态在线监测还停留在比较测量数据和设备阀值差距的大小,对监测数据潜藏的趋势或变化信息未做挖掘分析,因而难以实现状态估计和寿命预测。通过对设备监测海量数据做分析,有助于减少设备故障率,节约维修成本。
3.2 重速度轻精度
当前电力设备状态在线监测数据以年增长60%速度增长,原有的数据统计分析方法显得过时,大数据分析技术基于数据驱动,更容易发现新的信息;大数据分析技术更注重快速获得整体轮廓和脉络,传统数据分析过于重视数据精度,只见树木,不见森林。
3.3 以整体数据分析为依托,弱化随机采样
传统随机采样做法会丢失许多个性化和差异化的样本,因而遗漏许多重要潜在信息,大数据分析方法是在全部整体数据基础上做分析的,因而可以发现微观层面细节数据。
3.4 重视对数据相关关系的分析,弱化因果关系分析
大数据分析技术建立在相关关系分析基础上,相比因果关系更容易建模和实现。
4 电力大数据信息聚合模型
电力设备种类多,结构复杂,无法通过一个可直接观测的量来衡量设备健康程度,需要对多个特征参量综合分析才能得出正确结论,通过信息聚合技术,可以对不同来源,不同设备,不同时间,不同形式的数据进行分析处理,针对电力设备状态在线监测数据快速增长的局面,必须采用信息聚合技术,在架构、思路、算法等方面做出改进,才能满足大数据分析的要求。根据电力设备在线监测的特点,提出分层聚合的架构,如图1所示。
从单一数据源得到的数据关联性是单一的,而从多个数据源获得的数据关联性是模糊的,为了能挖掘出丰富清晰的关联关系,就必须要采用多维信息聚合模式,其过程:(1)对数据做清洗,去除无关噪声,并做初步归一化处理;(2)数据级聚合,反映的感知层采集的数据较为直观,属于二维的低级聚合。(3)将多组二维关联信息,根据决策级对象分析需求进一步聚合,形成信息多维聚合,(4)决策级聚合,即根据上传多维信息,做出相应评估判断。
(1)数据预处理。电力设备在线监测系统通过各类传感器采集的信息种类多,信息海量,含义不够清晰,同时海量数据中还包含一定数量的空数据,坏数据,噪声数据等,因而有必要对其作初步的信号处理及数据分类,以便后续的信息聚合。主要步骤如下:
数据清洗:通过算法将采集来的监测数据中空数据和坏数据处理掉,将脏数据清洗干净,以便转换成可以进一步聚合的数据。
数据变换:将来自不同数据源的数据在规格定义上作统一,在数据表现形式上实现一致;
数据压缩:由于海量数据占据大量存储空间,为了解决存储空间以及提高聚合时效率,因而不损失信息前提下,对数据作适当压缩。
(2)数据聚合。为了方便数据聚合时分层次、分类别,电力设备状态在线监测采集来的数据大致分为电气量、过程量、状态量,这样可以提高聚合效率。在数据预处理过程中,把同类型的数据做二维关联分析,再根据物理模型、人工经验等进行跨类别的二维关联,这种同类别的关联目标明确、定义清晰,结果准确率高。
电力设备状态在线监测的数据级处理,是以现有电力设备状态在线监测采集到的数据为数据源,目标定位于满足下一级聚合,其特征如下:
以物理模型和实验经验为基础数据级聚合的目标定位清晰明确,采用的模型和人工經验都经过验证;
信息级聚合以数据级聚合为基础数据级聚合按照信息级聚合要求,做如下工作:1)数据存储备份。即按照同一数据格式把数据存储到某一位置,同时做备份处理;2)数据的二次处理(重新排序、筛选、特征提取)。针对不同数据源,聚合技术采用不同特征提取方法,再根据不同应用对象做针对处理,同时依据数据属性和可靠性做筛选,最后按照聚合需要的特征量做特征提取;3)数据关联与融合。为实现发现数据间潜藏关联及其规律,需要采用数据挖掘技术,以多个数据量的相互关系为基础,更加全面的表示被监测设备的状态以及未来情况的估计,数据融合技术可以通过对数据的识别、分类、聚类、融合得到数据中包含新的信息。
(3)信息聚合。经过数据级二维关联后的监测数据,无法全面体现,被测对象的全部面貌,所以还不能被特征聚合直接采用。信息聚合主要任务就是完成监测信息从二维关联到多维关联的过程,对电力设备状态评估,需要关注多种信息:如出厂时电气参数额定值,投运前测试状态,各参量的属性,定期巡检后记录,同类设备的告警信息,故障信息,检修信息,投运处的环境信息。设备各监测量相互关联及属性在信息层做评价后,可以进一步挖掘出数据相关性,形成面向设备的特征信息,为决策层聚合提供基础信息。
(4)决策层聚合。决策层聚合就是针对分析需求制定相应决策分区,根据所得信息做出决策和指示,决策层聚合使用多维建模算法,集合各类信息如设备出厂数据、巡检信息、故障数据、状态评价信息、历史数据等,形成多维数据下的状态表达形式,把当前设备状态数据和特征与特征状态作关联分析,相关性最大数据为当前设备运行状态。决策层聚合结论提供给电力设备全寿命周期管理,用于设备状态评估及健康状态预测。
在一个电气设备如变压器评估基础上,可以扩展到同类设备、不同间隔甚至不同变电站之间。
5 结语
本文介绍了大数据理论的主流技术,描述数据处理的具体算法,通过这些算法,可将多种数据类型整理成可用于状态检修的数据类型。本文探讨了大数据技术在电力状态检修领域中的应用,并以变压器故障诊断为例,研究大数据挖掘分析技术在故障诊断中的具体应用。最后结合项目管理知识和状态检修流程,给出基于大数据技术的状态检修流程。通过对电力设备的精准检修,实现了电力行业状态检修的精准立项和精益化管理。