王洪授,黄同愿,陈红光,杨弦,王炼红
(1.重庆潼南区供电有限责任公司,重庆402660;2.重庆理工大学计算机科学与工程学院,重庆400054)
基于聚类主成分分析法的变压器参数关联度评估*
王洪授1,黄同愿2,陈红光1,杨弦1,王炼红1
(1.重庆潼南区供电有限责任公司,重庆402660;2.重庆理工大学计算机科学与工程学院,重庆400054)
为了有效管理和监测电力变压器的健康状态,在对变压器正常运行的海量数据进行分析的基础上,构建变压器参数关联度评估方法。首先,为了对变压器运行参数进行参数分类定性,基于系统聚类的方法构建变压器参数样本分类流程算法,并设计了相应的流程图;然后,通过引入聚类以及主成分分析方法,建立基于聚类的主成分分析的变压器主要影响参数关联度评估模型;最后通过潼南电力局实际运行数据验证模型的可靠性和有效性,准确分析了变压器运行参数之间的定量关系,可以为变压器故障预测研究提供重要依据。
变压器,参数关联度,聚类分析,主成分分析法
变压器是电力系统中最重要的电气设备之一,其运行状态直接影响系统的安全运行水平。变压器一旦发生故障,将对电力设备整体系统造成巨大损失,同时给人们正常生活带来极大不便。而且,随着输电距离、输送容量的增长,其运行状态趋势受环境、使用时间等因素的影响,其性能复杂度也越来越高,变压器运行异常状态监测也变得越来越困难。在实际电力系统运行过程中,管理部门总是希望能及时检测并维护相关设备运行的异常状态,保证其正常运行。因此,在变压器故障监测分析中,基于海量监测数据对其参数的相关性进行分析,对变压器故障分析研究而言具有重要的意义。
目前,在变压器参数相关性分析领域,已经获得一些较好的研究结论[1-8]。然而,随着自动化智能技术的发展,变压器运行故障或者异常状态的出现,都离不开数据的驱动[9-10]。为了让运行数据能更好的反映变压器本身的状态,其监测数据包应该满足以下两个要求[11-14]:①数据量足够大;②数据统计次数尽可能多。可在实际工程中,海量观测数据往往存在拟合过程中的多重共线性以及数据关联程度不明确的问题,这对变压器的故障性能分析而言,具有很大的困境。为了解决这个问题,课题组和国网重庆潼南区供电有限责任公司合作,将聚类数据挖掘技术和主成分分析方法相结合,构建了基于聚类的主成分分析模型,得到变压器运行参数关联度表达模式,并利用变压器正常运行海量数据进行验证,较好避免大数据环境下的电力设备系统安全评估和监控的多重线性问题。
系统聚类法是一种将物理或抽象对象的集合分组为有类似的对象组成一个类的分析过程,是聚类分析方法中最常用的一种方法。其中,相似度描述分为:样本间和类间的相似性度量。
1.1 样本间相似性度量
在工程实际应用领域,设备运行时除了有自身的机械损耗,还有来自外部因素的多重影响。在系统聚类分析过程中,为了避免因遗漏部分因素而导致分类错误的情况,需要尽可能地考虑所有相关因素。然而,相关因素多,变量间相关度高,导致系统聚类分析和建模十分困难。为了解决上述问题,在聚类分析过程,通过研究变量间的相似关系,按照变量间相似关系将变量聚合成若干类,进而将影响系统运行状态的主要类找出来。相关系数法如下:
记变量xj的取值为则可用两变量xj与xk的样本相关系数作为它们的相似性度量:
1.2 类间的相似性度量
对于不同样本类而言,类间的相似性如何度量也是经常要考虑的问题。假设有两个样本类G1和G2,基于样本间的相似性度量模式,考虑到每个样本类包含多个样本点,采用类平均法来定义类间的相似性度量模型。
式中n1,n2分别为G1,G2中的样本点个数,表示G1,G2中两两样本点距离的平均值。
1.3 聚类流程算法设计
基于样本间和类间相似性度量模型,则可对样本空间Ω={w1,w2,…,wn}设计聚类图形成算法如下:①根据式(1)计算n个样本点两两之间的相关系数{rij},记为矩阵;②首先构造n个类,每一个类中只包含一个样本点,并令每一类平台高度为零;③将rij最大的两类合并为一个新类,并将两类间的距离作为聚类图的平台高度;④根据式(5)计算新类与当前各类的距离,如果类的个数等于1,转步骤⑤;反之,回到③;⑤画聚类图;⑥决定类的个数和类。
其基本流程图如图1所示。
图1 系统聚类生成算法流程图
显然,算法设计流程构成了闭环系统,可以根据实际运行状态运行修正系统分类的结果。
从变压器实际运行参数数据实际情况来看,基于系统聚类流程算法的分析结果,往往会使得某一类中相关性变量过多,这在变压器参数的定量识别过程中,会使得工程技术人员因为参数的过度复杂而对运行状态趋势评估做出误判,因此,需要对参数关联度进行进一步研究。在电力设备系统变压器运行的实际环境中,工程技术人员希望用较少的变量去解释原来数据库中的大部分变异。如果将许多相关性很高的变量转化成彼此相互独立或者不相关的变量,将极大地简化工程技术人员的操作流程。
基于上述理由,课题组采用主成分分析方法来对变压器实际运行过程产生的海量数据包进行分析,选择出比原始变量个数少的参数,解释大部分信息资源的新变量,综合评估变压器的参数关联度。主要设计步骤如下:
①对分类数据进行标准化处理
如果影响变压器运行参数的指标变量有m个: x1,x2,…,xm,评价对象有n个,且第i个评价对象的第j个指标的取值为xij,则可用式(3)将各指标xij转换成标准化指标:
④计算特征值和特征向量,构造主成分回归方程计算相关系数矩阵R的特征值及对应的特征向量u1,u2,…,um其中uj=(u1j,由特征向量组成m个新的指标变量:
式(6)中y1是第1主成分方程,y2是第2主成分,…,ym是第m个主成分。设定一个累计贡献率的上限值Bdesign,由实际变压器型号决定。一旦Bj≥Bdesign,则表明则选择前p个指标变量当Bj接近于1(=0.90)时,则选择前j个指标变量y1,y2,…,yj作为j个主成分,代替原来n个指标变量,成为充分描述系统的新指标。
为了对实际变压器的参数关联评估进行验证,采用了国网重庆潼南区供电有限责任公司所提供的正常运行数据进行算例仿真,数据集合为变压器运行一天收集到的24 h内记录数值,此次数据记录连续24 h内29个参数每隔5 min的289个时刻的数值。由于实际情况不允许变压器轻易发生故障,该数据集合存在无历史故障数据的局限,这需要对其正常运行数据进行聚类挖掘,找出影响变压器状态运行的主要参数,并模拟出主要参数间存在的相似关系;同时,为了将参数间相似关系式具体量化,即对参数进行多元线性回归分析,消除参数多重共线性对回归模型的影响,保证回归方程的稳定性。
结合实际电力变压器物理性能特点及参数类型,有如下定义:A,B,C三相电流Ia,Ib,Ic;有功功率:P;无功功率:Q;功率因素:Φ。特别地,为了区分101、301、901开关的上述物理量,三相电流前加开关编号,有功功率、无功功率、功率因素则在它们对应的物理符号加以开关编号为下标来区别。如:101开关a,b,c三相电流、电压、有功功率、无功功率、功率因素分别表示为101Ia,101Ib,101Ic,101Ua,101Ub,101Uc,P101,Q101,Φ101。运行仿真得到如图2所示。
图2 系统聚类结果图
图2表明,此组数据分为参数相关性较强的聚成6类和较弱的8类,前面6类依次分别为:第1类(1,2,3,7)101开关的三相电流和有功功率、第2类(4,5,6)101开关的三相电压、第3类(12,13,14,18)301开关的三相电流和有功功率、第4类(15,16,17,24,25,26)301开关的三相电压和901开关的三相电压、第5类(22,23,21)901开关的三相电流、第6类(27,29)901开关有功功率和功率因素;后8类分别为:(8)101开关无功功率、(9)101开关功率因素、(10)温度一类、(11)档位一类、(19)301开关无功功率、(20)301开关功率因素、(28)901开关无功功率;可以看出:变压器的三相电流、电压与有功功率有较强相关性;有功功率、无功功率及功率因素相关性其次;档位、温度独立成一类,与其他参数相关性最低。
基于上述分类结果,继续通过主成分分析,将相关性较强的6类的参数进行定量化分析,结果如表1所示。
表1 主成分分析结果
根据实际运行电力变压器的,变压器的累计贡献率上限设定为Bdesign=90%,而表1每个开关前面3个三相电流累计贡献率就达到90%以上,这表明,前3个主成分能充分反映变压器运行状态。为更好地避免多重线性问题,反映参数之间的数量关系,运用主成分分析方法得到其主成分回归方程。
在此基础上,根据国网潼南电力局所提供的数据拟合,得到功率因素与有功功率、无功功率的拟合方程如下:
进一步,对变压器的功率因素、有功功率、无功功率利用主成分分析进行仿真运算,对应的特征值、贡献率以及累计贡献率分析结果如表2所示。
显然,功率因素主要取决于有功功率的大小。
表2 功率因素与有功无功功率的主成分结果
基于上述分析,可以得出有功功率是完全可以反应变压器运行情况的功率类指标。为了减少冗余参数的干扰,因此,进行主成分分析时不需要考虑无功功率与功率因素;另外为更有效地研究分析电力变压器系统运行参数的关系,在主成分分析中变量选取分别为:A,B,C三相电流Ia,Ib,Ic;有功功率:P;其对应的前3个特征根对应的特征向量如表3所示。
表3 标准化变量的前3个主成分对应的特征向量
由此可得3个主成分方程分别为:
综上,变压器正常运行时主要参数之间有较强相关性,并且满足上述参数回归方程,分析结果如表4所示。
表4 主成分分析结论图
其中,I101,I301,I901,U101,U301,U901,P101,P301,P901,Φ901分别表示101开关三相电流,301开关三相电流,901开关三相电流,101开关三相电压,301开关三相电压,901开关三相电压,101开关有功功率,301开关有功功率,901开关有功功率,901开关功率因素;可以看出,第1主成分主要由101开关三相电流和有功功率、901开关三相电流决定,分别与系统聚类第1类、第5类结果一致;第2主成分则主要由101开关电压、901开关有功功率和功率因素、301开关电压及901开关电压决定,分别与系统聚类第2类、第6类、第4类结果一致;第3主成分主要由101开关三相电压、901开关三相电流决定、301开关的三相电流和有功功率决定,分别与系统聚类第2类、第5类、第3类结果一致,即前3个主成分是由聚类分析的较强的6类参数所决定的;综上,可以得出,运用主成分分析法与变压器正常运行时的参数聚类结果一致,故能预测变压器运行情况正常。
可见,基于系统聚类的主成分分析法将描述变压器状态的指标由29个变为3个,极大简化了变压器状态分析的复杂度。同时,通过聚类分析法对变压器正常运行时参数进行定性分类。
电力变压器正常运行状态参数间相似性关系是反映变压器工作状态的重要依据,挖掘参数之间存在的关系对有效避免过度维修及电力变压器故障预测研究有重要意义。为解决实际运行变压器数据缺乏故障性及数据之间的多重线性问题,采用聚类分析结合主成分分析的方法,建立了用于变压器参数关系分析的数学模型,提高了变压器运行参数的诊断效率和准确率。其中系统聚类方法较好地将主要参数进行聚类,得到聚类图分类效果良好。进一步在分类的基础上,运用主成分分析法对参数相关性进行分析,得出变压器正常运行时主要参数之间的回归方程,验证了变压器正常运行时参数的聚类关系,是一种能进行变压器故障预测研究的有效方法。
[1]熊印国.用KPCA-LSSVM预测变压器油击穿电压[J].计算机与应用化学,2014,31(10):1162-1164.
[2]苑津莎,尚海昆,王瑜,等.基于相关系数矩阵和概率神经网络的局部放电模式识别[J].电力系统保护与控制,2013,13(14):111-115.
[3]任双赞,钟力生,于钦学,等.变压器油加速热老化过程中的多参量相关-回归分析[J].西安交通大学学报,2010,10(44):88-92.
[4]韩慧慧,杨道武,王溯,等.用多参数回归关联方法分析变压器油纸绝缘老化特性[J].高电压技术,2010,36(12): 2937-2941.
[5]HONG K,HUANG H,ZHOU J.Winding condition assessment of power transformers based vibration correlation[J]. IEEETransactionsonPowerDelivery,2015,30(4): 1735-1742.
[6]冯伟,王延安,肖登明.电力电子电路中变压器的等效模型分析[J].上海电机学院学报,2009,12(2):169-172.
[7]JIANG C,ZHENG J,NI B Y,et al.A Probabilistic and Interval Hybrid Reliability Analysis Method for Structures with Correlated Uncertain Parameters[J].International Journal of Computationa Methods,2015,12(4):2154-2158.
[8]WANG Y,PAN J.Applications of operational modal analysis to a single phase distribution transformer[J].IEEE Transactions on Power Delivery,2015,30(4):2061-2063.
[9]陈清玉,罗隆福,许加柱,等.滤波器对新型换流变压器运行参数的影响分析[J].中国电机工程学报,2012,32(10):126-133.
[10]李黎,张登,谢龙君,等.采用关联规则综合分析和变权重系数的电力变压器状态评估方法[J].中国电机工程学报,2013,33(24):152-160.
[11]邓祥力,熊小伏,高亮,等.基于参数辨识的变压器绕组变形在线监测方法[J].中国电机工程学报,2014,34(28):4950-4958.
[12]吴奕,朱海兵,周志成,等.基于熵权模糊物元和主元分析的变压器状态评价[J].电力系统保护与控制,2015,43(17):1-7.
[13]HUANG D R,TANG J P,ZHAO L.A fault diagnosis method of power systems based on gray system theory[J]. Mathematic Problems in Engineering,2015(10):1-11.
Correlation Degree Evaluation of Transformer Parameters Based on Clustering and Principal Component Analysis
WANG Hong-shou1,HUANG Tong-yuan2,CHEN Hong-guang1,YANG Xian1,WANG Lian-hong1
(1.Chongqing Tongnan Power Supply Co.,LTD,Chongqing 402660,China;2.Institute of Computer Science and Engineering,Chongqing Technology University,Chongqing 400054,China)
To manage and monitor effectively the health status of power transformer,an evaluation method of correlation degree between transformer parameters is constructed by in-depth analysis of massive amounts of data in power transformer.Firstly,a clustering algorithm is constructed based on system cluster method to finish the qualitative class of running parameters in power transformer,and then the flow chart is designed correspondingly.Then,an evaluation model of correlation degree among primary transformer parameters is established by combining with the clustering and principal component.Finally,using the real running data provided by Chongqing Tongnan Power Supply co.,LTD verifies the reliability and effectiveness of the model and algorithm.The result shows that the quantitative relation among running parameters of power transformer may be recognized exactly,so it can provides important support for the fault diagnosis and predict of power transformer.
transformer,parameters’correlation degree,clustering analysis,principal component analysis
TM71
A
1002-0640(2017)04-0133-05
2016-03-05
2016-04-17
国家自然科学基金(61304104);国网重庆潼南区供电有限责任公司科技项目(2015Q147);重庆市高等学校优秀人才支持计划(2014-18);重庆市研究生教改重点项目(yjg152011);重庆市高等教育学会2015-2016高等教育科学研究基金资助项目(CQGJ15010C)
王洪授(1964-),男,重庆江津人,高工/副总经理。研究方向:电气工程及应用。