基于大数据挖掘的电力变压器差异预警规则

2021-08-11 06:46:40崔金豹徐永海
科学技术与工程 2021年20期
关键词:增长率预警聚类

崔金豹, 徐永海

(1.鄂尔多斯市和效电力设计有限责任公司, 鄂尔多斯 017000; 2.华北电力大学电气与电子工程学院, 保定 071003)

变压器是电力系统中必不可少的电气设备,其可靠性直接影响到电力系统的安全[1],溶解气体分析(dissolved gas analysis,DGA)技术是判断变压器状态的主要方法。与局部放电监测方法相比,它具有更强的抗干扰能力,在世界范围内得到广泛应用[2-3]。DGA在线监测系统可在一个监测周期内获得8种气体浓度,根据这些实时监测值,报警系统将实时瓦斯浓度及其上升率与设定的报警阈值进行比较,来判断变压器的运行状态。因此,合理设置预警阈值是保证预警准确率的关键[4]。

对于预警阈值的设置,已经存在多种方法。文献[5]提出了一种新的图解法基于所有7种气体,一氧化碳(CO)和二氧化碳(CO2)作为重要指标;文献[6]也提出了一些新的指标,为克服传统图论方法的矛盾,采用基于特征气体的图形化技术对变压器故障进行了诊断。以上基于图论和新准则的方法可以克服一些局限性,但解决模糊边界问题仍然是一个挑战。

除了传统方法,随着人工智能技术的兴起,人工神经网络和支持向量机等也得到了广泛应用。文献[7]提出了一个基于模糊逻辑的强大专家系统;文献[8]将基于模糊逻辑的自适应神经模糊推理系统应用于DGA;文献[9]使用深部信念网络(deep belief network, DBN)反映溶解气体比率与转换断层之间的数学相关性。人工神经网络、DBN、支持向量机(support vector machine,SVM)和模糊逻辑等智能算法虽然可以取得较好的精度,但它们需要大量的样本数据和专家经验,并且耗费了大量的计算时间[10]。除此之外,这些方法忽略了变压器个体之间的差异特征。

为解决上述问题,提出了一种基于大数据挖掘的电力变压器健康状态差异预警规则策略。考虑了变压器个体之间差异设置预警阈值。实验结果验证了提出方法的有效性。

1 变压器分类

1.1 变压器属性分类

由于属性和运行环境的差异,任何变压器都与其他变压器不同。这些属性包括电压等级、油型、结构、材料、容量、连接方式、制造等。运行环境包括区域、安装位置、使用年限、海拔、气候、负载等。但是,变压器在每个属性或运行环境中并未显示出明显的差异。因此,选择最佳分类属性作为差异分析的基础。选择最佳分类属性的原则是,这些最佳分类属性应能够最大程度反映变压器之间的差异。根据文献[11]可知在对现场溶解气体大数据进行分析的基础上,区域、使用年限、电压等级、安装位置和油型是变压器分类的影响较大的候选属性。

1.2 候选分类属性聚类中心的计算

根据5个候选分类属性划分了总共82 948 872条记录,每个属性下的详细分类如表1所示。对于每个候选属性,可以应用聚类方法来获取它们的聚类中心。基于聚类中心之间的欧氏距离,可以实现最佳的分类属性。考虑了4种聚类方法,包括K均值,自组织映射(self organizing maps, SOM)和模糊C均值(fuzzyC-means, FCM)[12-14]。但是,当考虑聚类效果和计算效率时,FCM是最合适的聚类方法。复杂的现场操作环境会导致由变压器DGA在线监测系统获得的数据波动很大,而FCM中的模糊方法刚好可以处理这些波动。因此选择FCM作为聚类方法最为合适。

表1 根据候选属性对收集的溶解气体数据进行分类

(1)

(2)

式中:λj为拉格朗日乘数,j=1,2,…,n。

最小化新目标函数的必要条件为

(3)

(4)

y=f(t)=at+b

以H2、CO、CO2、CH4、C2H6、C2H4、C2H2和TH为数据集X。根据变压器的性质,将X分为c类。然后采用FCM来计算每个类别的聚类中心,结果如表2所示。为了更直观地说明,在三维(3D)空间中绘制了不同电压等级分类下的3种典型溶解气体(H2、C2H2和TH)的聚类中心。

1.3 最佳分类属性

根据上述关联规则,当累积概率等于1-故障率时,可以获取报警值。当累积概率等于1-故障率-缺陷率时,可以获得注意值。

表2 8种气体的聚类中心作为预候选属性

现场使用了一个变压器来验证提出的差异预警规则。根据离线实验,该变压器在2014年3月16日—2014年5月25日被诊断为高温故障。该变压器在220 kV电压下工作,充满25#变压器油,使用寿命为10~20年。根据该变压器的属性,可以获得一系列预警值,如表5所示。选择这些预警值的交点作为最终预警值,如表7所示。提取该变压器的在线监测数据以计算气体增长率。图7、图8绘制了2014年2月22日—6月12日气体浓度和增长率的趋势图。在图7中,“严重”信号将在2014年3月16日和2014年5月25日发出,因为C2H4的浓度超过注意值,并且其增长率超过2014年3月16日的报警值,并且C2H4的浓度和增长率都超过了5月25日的报警值。从图8可以看出,在2014年3月16日和2014年5月25日也会发出“严重”信号,这是因为2014年3月16日前后总碳氢化合物的浓度超过了注意值,并且其增长率超过了报警值,并且浓度和增长率都超过了2014年5月25日的报警值。但是,如果使用150 μL/L作为《国际电力协会》(IEC 60599)标准中提出的注意值,则这些预警信号很容易被忽略。总之,与现有标准相比,差异化预警规则可以更准确地检测故障。

(5)

如果一个分类属性的平均欧氏距离较大,则该分类下的数据更加分散,这表明该分类属性对溶解气体数据的影响更大。如果距离较近,则认为不能根据此分类属性对溶解气体数据进行有效分类,并且不能很好地反映变压器之间的差异。经过最小-最大标准化后,表3中显示了聚类中心之间的距离及其平均欧氏距离。

根据表3可知,变压器的电压等级、使用年限和油型对设备的影响远大于区域和安装位置,电压等级、使用年限和油型可以更有效地反映变压器之间的差异。因此,选择这3个属性作为最佳分类属性。

表3 分类属性的欧氏距离

2 计算差异预警阈值

2.1 验证和建立分布模型

在每个分类属性下的溶解气体记录的数量较大。将每种分类属性下的每种气体浓度数据放入计算集中。计算集包含从变压器投入运行的第1天到变压器状态改变的所有数据。选择所有时间的数据,而不是仅选择一段时间的数据,后者无法反映故障的动态和累积特征,因为缺陷和故障发展过程是动态的、累积的并且经常受多个因素影响[15]。

以3 459 nm波长的中红外激光作为探针光辐照薄膜,得到了在不同探针光功率下,40 nm薄膜对探针光的透过率、反射率随泵浦光辐照薄膜时间的变化情况,如图6.

对于每个选定的计算集,根据适当的类宽度将计算集的范围划分为几个间隔,并对每个间隔内的气体浓度数据的频率进行计数。以气体浓度为X轴,频率/类宽度为Y轴,绘制频率分布直方图。以220 kV变压器的H2和500 kV变压器的TH的频率分布直方图为例,如图1、图2的橙色区域所示。结果表明,从定性的角度看,气体浓度数据的分布符合Weibull分布。然后,如图1、图2中的蓝点和红线所示,使用Weibull概率图来验证该结果。X轴表示对数形式的气体浓度,Y轴表示Weibull百分位数。蓝点是实际气体浓度,红线代表标准的Weibull分布,其形状和比例如图1、图2所示。从蓝点和红线之间的关系可以看出,实际气体浓度符合Weibull分布,置信度为99.9%。图1、图2中带有明显形状和比例参数的Weibull概率密度曲线的黑线进一步证明了这一结论。

图2 500 kV变压器TH的频率分布直方图和Weibull概率图

仅根据溶解气体的浓度,仍然很难对故障的严重性做出正确的判断,因为故障通常始于低能量和潜伏放电。还必须考虑故障点的气体增长率。《国际电气协会》(IEC 60599)标准以一年中气体浓度的绝对增加作为增长率。《变压器试验方法》(GB/T 7252)考虑了变压器的体积、油密度、气体浓度,以得出绝对的气体增长率。《国际电气协会》(IEC 60599)中定义的时间跨度太长,这使得实时分析变得困难。很难从DGA在线监测系统获得变压器体积和油密度。根据电力负荷的波动特征和现场经验,采用当前浓度和附近的6个历史值来计算气体增长率。根据最小二乘法,线性拟合7个样本数据以获得趋势曲线,并将曲线的斜率作为气体增长率。

对选定的3个最佳分类属性的缺陷率和故障率进行计算并显示在表4中。根据挖掘的计算规则来计算这3个最佳分类属性的注意值和报警值,如表5所示。

式中:m表示模糊度,控制聚类中心的模糊重叠,并且满足1.5≤m≤2.5。

(6)

式(6)中:a和b为未知参数;y为理想值;f(t)为理想函数值;t为时间戳。

Y中每个样本点的残差为

Cite this article as: YANG Guo-Xun, MA Guang-Lei, LI Hao, HUANG Ting, XIONG Juan, and HU Jin-Feng. Advanced natural products chemistry research in China between 2015 and 2017 [J]. Chin J Nat Med, 2018, 16(12): 881-906.

Ei=yi-(ati+b),i=1,2,…,7

(7)

目标函数定义为

(8)

式中:Ei为样本点的残差;yi为浓度样本数据,ti为时间戳;F为目标函数。

根据波峰定理,当a和b满足式(9)时,目标函数F(a,b)达到最小值,可表示为

1) Resistance type: used to simulate lighting equipment etc;

(9)

式(9)中:n为采样点数,将该曲线的斜率[式(9)中的a]设定为第7次时间戳的气体增长率。当斜率为负时,气体增长率等于零。如图3所示,获取了一个变压器的所有H2数据以计算气体增长率,其中放大的图片显示了拟合过程。

图3 变压器中H2的气体浓度和增长率曲线

使用上述方法,采用220 kV和500 kV变压器中C2H2和C2H6的气体增长率来绘制频率分布直方图和Weibull概率图,如图4、图5所示,气体增长率数据也符合Weibull分布,置信度为99.9%。

图4 220 kV变压器C2H2增长率的频率分布直方图和Weibull概率图

图5 500 kV变压器C2H6增长率的频率分布直方图和Weibull概率图

2.2 溶解气体分布特征与缺陷/故障率的关联分析

对于变压器,其与溶解气体有关的异常状况可分为两种不同的类型,一种是“缺陷”,另一种是“故障”。“缺陷”表示变压器有故障,但仍可以正常运行。“故障”表示变压器处于非常严重的异常状态,需要进行离线实验和中断维护。缺陷率和故障率是电网中整个变压器稳定性的关键指标。因此,在提出的差异预警系统中,分别为“缺陷”和“故障”定义了溶解气体的“注意值”和“报警值”。“注意值”和“报警值”是两个不同的预警阈值,后者大于前者。变压器状态(State)与气体浓度和增长率之间的关系为

(10)

式(10)中:C和R分别为气体浓度和气体增长率;CAttn和RAttn分别为气体浓度和气体增长率的注意阈值;CAlm和RAlm分别是气体浓度和气体增长率的报警阈值。

绘制图6中的式(10)表示的关系,可清楚地看到溶解气体分布特征与缺陷/故障率之间的关联关系。透明的蓝色表示实际数据的直方图,黑线为实际数据的拟合曲线,绿色、黄色和红色区域分别表示来自正常、缺陷和故障变压器的数据,绿色、黄色和红色区域的比例分别表示正常率、缺陷率和故障率。

图6 溶解气体分布特征与缺陷/故障率之间的关联

2.3 预警阈值的计算

同位素示踪法则是一种以同位素作为示踪物质,对研究对象的特征和行为进行示踪观察的信息获取方法,分为两类: 放射性同位素示踪法和稳定同位素示踪法。

Weibull分布是可靠性分析和寿命测试的基本理论,广泛应用于可靠性工程中,特别适用于金属材料、电子元器件和其他工程领域的疲劳寿命问题。Weibull分布的概率密度函数及累积概率分布函数分别定义为

f(x)=(β/η)(x/η)β-1e-(x/η)β

(11)

F(x)=1-e-(x/η)β

(12)

式中:β为形状参数;η为缩放参数。这两个参数可以唯一确定Weibull分布模型。最大似然法通常用于估计这些参数。

对于气体浓度数据集或气体增长率数据集X={x1,x2,…,xn},n为X的数量,θ为参数列(β,η)。对数似然函数为

本文提出了一种自适应阈值法,该方法通过采集峰值检测回波信号产生的台阶信号,以较低的采样频率反映出当前工况下回波信号的各个波峰峰值电压,然后计算下次测量的第一阈值。实验结果表明,该方法在变化的工况下具有更强的适应能力,能够有效的提高测量准确性。

根据以上分析,气体浓度和增长率数据符合Weibull分布,其特征与缺陷/故障率有关。 因此,可以根据Weibull分布获得预警阈值。

(13)

式(13)中:β为形状参数;η为缩放参数。

似然方程为

(14)

当组合式(13)、式(14)时,可以获得参数β和η。对于任何分布,如果给出了累积概率,则可以通过使用逆累积分布来获得与此累积概率关联的响应值。Weibull分布的逆累积分布为

x=F-1(p|η,β)=-η[ln(1-p)]1/β,p∈[0,1]

(15)

式(15)中:p为累积概率;x为估计值。

推进七大流域综合规划实施 开启江河开发治理新纪元……………………………………………………… 矫 勇(13.1)

如表2所示,由于每个候选属性下的子组件数不同,因此在不同候选属性下的聚类中心数目也不同。因此,使用平均欧氏距离来识别一种分类属性下聚类中心之间的离散度C={c1,c2,…,ct}(t>1)包括数据集X={x1,x2,…,xn}(n>t)的t个聚类中心。C的平均欧氏距离定义为

2.4 预警阈值结果

对于气体浓度样本数据Y={y1,y2,…,y7},附加了时间戳T={1,2,…,7},气体浓度的趋势符合方程式(6):

表4 最佳分类属性的缺陷率和故障率

表5 在使用年限、电压等级和油型分类下的注意值和报警值

3 差异预警规则的挖掘

对于每个变压器,可以获得总共24组气体浓度和增长率的预警值,涵盖了八种溶解气体和3种选定的最佳变压器属性。每种气体在不同属性下的预警值的交点被当作最终的差异化预警值。气体数据与注意/报警值之间的关系可分为:注意值以下、注意值与报警值之间以及超过报警值。根据差异预警值和预警关系来挖掘差异预警规则。将实时气体浓度和气体增长率值与不同的预警阈值进行比较,可以分别获得变压器的状态。将气体浓度和气体增长率作为二维相关规则,如式(16)所示,可以最终确定变压器的运行状态。

①一段弱磁给矿细度变粗,-0.074 mm粒级含量从50%降低到25%以下,矿物单体解离度变低,一段强磁抛尾品位升高。随着采场开采深度增加,矿石性质也随之变化,赤铁矿比例升高,矿石变得难磨,仅通过半自磨,难以将矿石磨细至合适的粒度,一段弱磁给矿细度变粗,矿物单体解离度变低,进而使得一段强磁抛尾品位从6%左右升高到8%~10%,最高达到13%以上;

变压器状态=

(16)

根据此规则,变压器的运行状态可以分为4个阶段:正常、注意、异常、严重,如表6所示。实际上,一旦检测到实时溶解气体数据,便可以启动预警过程。利用所选变压器属性的差异化的预警阈值,可以实现差异预警过程。

表6 差异预警规则

4 验证实例

爷爷和父母亲的以身作则,以及言传身教,让我更加深刻地认识到“家训、家规、家风”在教育家庭成员中的重大意义和作用。□

图7 C2H4浓度和增长率趋势

图8 TH浓度和增长率趋势

表7 验证变压器的最终预警值

为了进行更广泛的验证,选择了诸如人工神经网络(artificial neural network,ANN)、DBN、SVM和模糊逻辑方法之类的智能算法,以与所提出的差异预警规则进行比较。在验证之前,将变压器分为训练集和测试集。训练集中有815个案例,其中800个正常案例和15个异常案例。测试集有528例,包括514例正常和14例异常。验证结果如表8所示。

表8 使用ANN、DBN、SVM和模糊逻辑智能算法进行验证

选择准确率、误报率和漏检率来定量验证该预警规则。准确率是反映正确识别正常和异常案例的比例的指标,其计算公式为

5月上中旬,当年生实生核桃新梢长至5-10 cm时,留取基部3-4 cm剪断做为嫁接砧木,保留基部2片叶,用嫁接刀剔除叶腋间的生长点。

(17)

式(17)中:μaccuracy为准确率;Nn-n为被判为正常的正常例数;Na-a为被判为异常的异常例数;Ntotal为总例数。

误报率是表示正常案例被判定为异常的比例的指标,其计算公式为

(18)

式(18)中:μfp为误报率;Nn-a为判断为异常的正常例数;Nnormal为正常案例总数。

综上所述,供应链管理体系是新兴的管理模式,对我国中药材种植企业的发展意义重大。我国中药材种植企业在国内外市场中都面临着巨大的竞争压力,又因为属于农业产业范围内,对气候、土壤条件依赖性较大,通过供应链管理体系可以有效提高集约化,降低生产成本,提高企业抗市场冲击能力,为企业发展壮大提供助力。

漏检率是代表被判断为正常的异常案例比例的指标,其计算公式为

试剂:Ni2+贮备液1000mg/L、氢氧化钠溶液,C(NaOH)=2mol/L、氢氧化钠溶液,C(NaOH)=0.1moL/L、硝酸溶液(1:1)、硝酸溶液(1:99)、蒸馏水

按比例将亚硝酸钠、磷酸盐、抗坏血酸加入绞制好的猪肉中进行搅拌,搅拌均匀后置于腌料室进行低温腌制,腌制温度2~4℃,腌制时间为24h。

(19)

式(19)中:μfn为漏检率;Na-n为被判断为正常的异常例数;Nabnormal为异常案例总数。

除了上述准确性指标外,计算时间对于变压器预警方法也很重要。计算时间过长,无法满足预警的及时性要求。由IBM公司生产的、配置为Intel©Xeon(R)CPU E5-2630 v3 @ 2.40 GHz×32 RAM 128 GB的计算服务器和CentOS 7操作系统被用作验证的计算平台。构建了MATLAB 2017b软件作为分析平台。

分别对差异预警规则、常规预警规则、ANN、DBN、SVM和模糊逻辑的准确率、误报率、漏检率和计算时间进行比较,结果如表9所示。

从表9可以看出,尽管差异预警规则与常规预警方法相比花费更多时间,但是准确率显著提高,并且漏检率和误报率显著降低。每台变压器的差异预警规则的平均预警时间为2.78 s,可以满足及时性要求。

表9 不同方法在准确率、误报率、漏检率和计算时间上的比较

与智能算法相比,尽管ANN、DBN和模糊逻辑方法可以产生与差异预警规则相似的准确性,但漏检率和误报率较高,计算时间明显更长。特别是,需要大量训练的ANN和DBN会浪费大量时间,无法满足及时性要求。综上所述,差异预警规则在各个方面都是极好的,并且更适合于变压器的预警。

5 结论

探讨了差异化的预警规则,以获得具有不同属性和工作条件的电力变压器的细致和个性化的预警结果。提出了最优分类属性的选择方法和差异预警阈值的计算规则,在此基础上,挖掘了差异预警规则。实践证明,挖掘预警规则能够较好地实现对电力变压器运行状态的预警。得出如下结论。

(1)将FCM和欧氏距离方法应用于溶解气体大数据中,挖掘出对溶解气体数据影响最大的最佳变压器属性,从而更好地表征变压器之间的差异。确定了3种最佳变压器属性包括电压等级、使用年限和油型。

部分食品包装不规范性。这一类型的问题主要有未标明生产日期或者只标注在外包装箱上,没有做好单包装产品的标注。该问题的存在会对销售者以及消费者造成误导,当他们购买到过期的食品时,容易发生安全事件,更为严重的是造成食物中毒,严重损害他们的身体健康。

(2)经验证,根据分布直方图和概率图,气体浓度和气体增长率均符合Weibull分布。通过分布特征与缺陷/故障率之间的关联分析,可以计算出3种选择的最佳分类属性下的气体浓度和气体增长率的预警阈值。

(3)结合气体浓度预警阈值和气体增长率预警阈值,可以得到差异预警规则。与传统的阈值诊断方法和智能诊断方法相比,可以得出差异预警规则不仅在较短的计算时间内准确率高达98.21%,而且需要较少的故障案例。此外,差异化预警规则可以有效降低误报率和漏检率,具有较强的鲁棒性。

猜你喜欢
增长率预警聚类
2020年河北省固定资产投资增长率
2019年河北省固定资产投资增长率
法国发布高温预警 严阵以待备战“史上最热周”
今日农业(2019年12期)2019-08-13 00:50:02
园林有害生物预警与可持续控制
现代园艺(2017年22期)2018-01-19 05:07:01
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
国内生产总值及其增长率
货币供应量同比增长率
机载预警雷达对IFF 的干扰分析
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究