工业互联网方向赛题一赛题名称:海上风场SCADA数据缺失智能修复

2019-07-31 02:12
软件和集成电路 2019年5期
关键词:赛题风速风电场

赛题背景

由于风电场(尤其海上风电场)地处偏远,人工维护困难,远程数据监控系统(SCADA)能够远程获取风机运行状态数据,是风电场健康运行的保障。但是SCADA系统往往受到传感器失效、网络阻塞等各种因素的影响,导致数据的缺失。我们希望通过大数据分析,利用已知数据对缺失的部分数据进行估计,尽量挽回由于数据缺失带来的损失。

任务描述

我们抽取某一海上风电场实际SCADA数据,并人为地去除其中的部分数据,包括但不限于删去某个时间段的全部数据、某台机组在某段时间的数据、某台机组在某段时间的部分字段信息等,参赛者需要利用剩余数据对删去的数据进行恢复,最终以恢复的准确度为评价基准。

赛题内容和方向

数独游戏很多人都喜欢,尤其是小朋友。在一个9×9的矩阵里填入缺失的数字,使得每行每列以及每个粗线格(3×3)内的数字均含1到9,且不重复。在填满数字的那一刻,就能立刻判断是否正确。如果全部正确,将获得极大的满足感。那么SCADA数据又是什么呢?SCADA数据是用来记录传感器状态的时间序列,包含多种数据类型。每行代表一个记录时间点,每列代表一个传感器测点。从形式上来看,SCADA数据也是一个矩阵,只不过规模上比9×9的数独游戏大得多。那么SCADA数据能不能也用来玩数独游戏呢?答案是显然的。《海上风场SCADA数据缺失智能修复》赛题正是模仿数独游戏的做法,巧妙地删除SCADA数据中的部分信息,希望比赛选手利用SCADA数据的相关性和冗余性,恢复删除的SCADA数据,二者的区别在于恢复的正确与否,不能通过简单的规则进行判断。

赛题价值

在目前工业互联网时代,数据在工业领域起着非常重要的作用,数据不仅仅给产品的设计改良带来指导,同时通过数据分析,可以进行智能运维,提高发电量,可以为业主带来更大的经济价值,对于海上风机的智能运维更加重要。

赛题难点

对于风电行业SCADA数据而言,“风”是最关键的环境变量。由于风是瞬息万变的,所以为了更好地记录风的轨迹,SCADA数据的采样频率在逐渐增大。然而其他的一些变量(比如温度)则是缓慢变化的,过高的采样频率将会带来很大的冗余性,给网络吞吐和存储带来很大的压力。如果针对不同变量采用不同采样频率,又会增大SCADA系统的复杂性。如果确定一个合理的采样频率不是重点,这里只是说明数据冗余性的来源。SCADA数據中不同传感器还存在很大的相关性,风电机组是根据风速的大小调节叶轮转速和扭矩,以期最大程度地捕获风能,将风能转化为机械能,并进一步转化为电能的设备。

一方面,风速的变化将会引起风电机组内部状态变量(比如叶轮转速、扭矩、发电功率等)一系列的连锁反应,这些状态变量跟风速是强相关的。另一方面,在实际中SCADA数据真的会丢失,有时丢失比例还很惊人。原因有很多,有的是传感器错误导致的,有的是人为断网导致的,有的是极端天气造成的,还有程序出问题导致记录不完整的。比起这种完全不可控的数据丢失,赛题相对容易处理。相比当今数据竞赛场上千篇一律的分类和回归的预测类问题,本赛题独树一帜的视角,从实际应用出发,巧妙地利用数独游戏的思想,相信能给每个参赛选手不一样的感觉。

猜你喜欢
赛题风速风电场
风电场集电线路单相接地故障特性分析与保护
基于自升式平台的某海上风电场风机安装施工方案
一道竞赛试题的多角度探索
记一种美丽
2006—2016年平凉市风速变化特征分析
原州区近30年风的气候变化特征分析
风速概率分布对风电齿轮
谈谈备赛“湖南省高职高专实用英语口语大赛”
《函数》测试题
风电场低电压穿越能力对电网稳定性的影响分析