华电电力科学研究院 李雪玉
风电场运行状态参数特性取决于其运行工况,受气候、湍流、风机尾流、叶片污染的气动损失、风电场内线损失、气候等多方面的影响。因此,风电场采集的大数据之间的关系复杂,大量的干扰信息难于直接将采集的数据用于后期对于风电场的分析。因此对于风电场大数据的有效预处理是非常重要的,这就需要深入研究风电场中各种数据的相关性并剔除无效数据的干扰,为后期风电场的分析奠定基础。
风电场状态参数主要包括各风机的机舱、齿轮箱、主轴、发电机、变流器、电网环境、自然环境等的监测数据。表1例举了风电场中监测的风电机组的主要状态参数。其中,发电机绕组温度包括定子绕组的三相温度、转子绕组的三相温度共6个绕组温度。
表1 风电机组状态参数
风电场SCADA数据主要分布在0~13.5m/s的风速区间。考虑到风电机组的切入风速为3m/s,本文初步选取风速区间为3~13.5m/s的SCADA数据。大多数风电机组数据采集与监控 (SCADA) 系统可以对机组各子系统的运行状态参数进行监测和存储,一般为每10min存储1次,本文从机组运行状态参数时间序列中每10min随机抽取一个运行参数,得到一组非等间隔时间序列。
风电场SCADA系统的状态参数具有不同的测量单位,原始数据的量纲也各不相同,因此需对SCADA数据标准化处理再进行相关性分析。
设原始数据矩阵为X=(xij)n×p,按 (3.1)对原始数据进行标准化变换。
式中:zij为标准化变换后的数据矩阵Z=(zij)n×p的元素;D(xj)为变换前的方差;为平均值,按(3.2)计算。
设 (Xi,Yi) (i=1.2…,n)为取自总体 (X,Y) 的样本,则样本的Preason相关性系数为:
式中:rs为Pearson相关性系数;X为X的平均值;为Y的平均值;n为样本数。
Pearson相关性系数r反映了两个参数X、Y之间的线性相关性,|r|的值越接近于1,说明参数X、Y之间的线性相关性越强。当r=0时,说明参数X、Y不相关。
设两个样本X和Y为数据对 (x1,y1),(x2,y2),…,(xn,yn)。用Ri表示xi在 (x1,x2,…,xn) 中的秩;Qi表示 yi在(y1,y2,…,yn)中的秩;为Ri的平均值;为Qi的平均值;n为样本数。
将水热预处理后的微藻生物质离心15 min,离心机转速为 5 000 r·min-1(RCF=5 000×g),取离心后的固体物质用于DSC的实验分析。
将 (4.2) 和 (4.3) 代入(4.1),rs简化为:
表2 风速与风电机组状态参数的相关性分析
rs取值区间为 [-1,1],rs>0为正相关,rs<0为负相关,rs=0为完全不相关。通常认为当|rs|>0.8时相关程度较高。
当两个样本存在线性相关性时,Pearson相关性系数比较适合;当样本存在严重非线性畸变或者样本中存在脉冲干扰时,Spearman秩相关系数较为合适。由于风电场风速的波动性 、环境温度的季节性、运行控制方式的动态性、电网负荷的随机性等多种因素使风电场SCADA数据包含各种干扰数据,同时风电机组的多种状态参数之间的相关关系十分复杂。因此,结合两种相关系数建立风电机组状态参数的综合相关性指标CCI(Comprehensive Correlation Index),从理论上是更好的一种方法。即:
式中,r、rs分别为Pearson、 Spearman相关系数。
表2表明,风速参数与齿轮箱输出轴温度、绕组温度、相电流、有功功率的参数相关性较大。风速与齿轮箱油温的CCI值大于风速与入口油温的CCI值,说明风速与齿轮箱油温的参数相关性大于风速与入口油温的参数相关性。与实际经验符合,可见CCI值能正确反映风电机组状态参数与风速的相关性。
相电流与风速具有较大的参数相关性,是由于机组采用稳压控制,使得风电机组的相电压基本恒定,相电流直接影响机组功率。
风速对机舱振动影响小的原因是振动信号的的低采样频率导致某一风速的振动幅值分散性较大,对风速与振动信号的相关性指标的计算结果产生了较大干扰,掩盖了风速与振动幅值的相关性。
表3说明塔顶柜、塔底柜与环境温度的参数之间具有较大的相关性,其原因是在风电机组中,塔顶柜、塔底柜的安装位置与发电机、齿轮箱、主轴等发热量大的部件距离较远,易受环境温度影响。叶轮侧轴承、齿轮箱侧轴承、轴承A的温度与环境温度的参数之间相关性较高,这与实际经验相符。
表3 环境温度与风电机组状态参数的相关性分析
由表4可知,绕组温度之间的参数相关性较大;绕组温度与轴承B温度的参数相关性比绕组与其它参数的相关性大;与冷却风温度参数相关性较大的是轴承A温度参数。
表4 发电机温度参数的综合相关性分析
从表5可以看出,齿轮箱输入轴温度参数与输出轴温度参数的相关性高;同时,齿轮箱油温受入口油温的影响较其它参数大。
由表6可知,机舱的振动参数与温度参数具有较小的相关性;机舱的塔底柜温度参数与塔顶柜温度参数具有较大的相关性。
表7表明,主轴的叶轮侧轴承温度参数和齿轮箱侧轴承温度参数具有较大的相关性。
从表2到表7可以看出,同一部件的状态参数中存在CCI值较大的参数对,说明参数具有较大的相关性,参数之间相互影响大,从某种程度上也反映了同一部件的状态参数所包含的状态信息具有一致性。同时,状态参数中存在CCI值比较小的参数对,一方面说明参数的相关性较小,另一方面说明参数不仅受到同一部件状态参数的影响,某一部件的状态参数还会受到其它部件的影响。
表5 齿轮箱温度参数的综合相关性指标
表6 机舱状态参数的综合相关性指标
表7 主轴状态参数的综合相关性指标
从表8可知:机舱的塔底柜温度与塔顶柜温度;齿轮箱油温与输入轴、输出轴、入口油温之间;主轴叶轮侧轴承温度、齿轮箱侧轴承温度与机舱塔底柜温度、塔顶柜温度之间的相关性均较高。这说明风电机组的状态参数不仅与同一部件状态参数有较大的相关性,也与其它部件的状态参数有不可忽略的相关性。其原因是,风电机组由多个复杂部件或子系统构成,机组正常工作依赖于各部件紧密联系协调运行,在运行过程中各部件的状态参数同时受多种因素的影响。
根据Pearson、Spearman相关系数的特点提出了风电机组状态参数的综合相关性指标,并采用综合相关性指标量化风电机组状态参数之间的相关性,通过分析风速、环境温度、状态参数的综合相关性指标CCI,研究了风电机组状态参数之间的关联规律,为建立风电机组状态参数异常辨识模型奠定基础。
表8 不同部件部分状态参数的综合相关性指标