吴海列,盛豪杰, 邬惠峰
(1.浙江运达风电股份有限公司 风力发电系统国家重点实验室,杭州 310013; 2.杭州电子科技大学,杭州 310018)
风力发电作为新时代的一种新能源技术,具有重要的战略性地位。自20世纪90年代以来,迫于能源危机,许多国家将新能源和可再生能源的研究、开发和利用工作摆在了很重要的位置。地大物博的中国,风能资源更为丰富,据估计,平均海拔10 m范围内理论风能储量为3 226 GW,而陆上和海上的可开发储量就有1 000 GW。目前,风电行业在全国迅速发展,各种风力发电技术应运而生[1]:陈雷、邢作霞等人阐述了大型并网型风力发电机组的功率调节方式[2];王志新、张华强等人综述了风力发电技术态势,列举了机组状态监测系统、测量参数、系统构成、实施功能等技术,还介绍了风电机组功率控制策略,创新性地提出了风电机组低电压穿越技术[3];张新房、徐大平等人就风力发电技术在提高机组容量、改进功率调节、匀速运行、发电机和电力电子技术等方面的发展展开了论述[4];周双喜、王海超等人对风力发电的实际效益进行了分析,并给出了风电运行价值的详细计算表达式[5]。
高数量的风场,需要耗费大量的人力、物力、财力进行维护,但是风场所在位置大多偏僻,不方便维护人员频繁到现场对风机进行故障排查和解决,这其中有些故障只是小问题,开发人员看下数据就能查明。然而,不同类型控制器的数据显示不尽相同,维护人员分析起来要针对不同的数据格式采用不同的解析方法,操作起来效率低,复杂度高。本文采取了数据映射技术,能够将同种类型数据或者不同类型数据转换到同一种数据结构中,很好地解决了此类问题。前者在映射模型中直接转换,后者基于设定的映射规则,如基于映射表,进行间接转换。
国内外对数据映射技术有广泛地研究,比如:文献[6]提出根据一个高效和可扩展的运行库,集成对自动数据分区的映射技术;文献[7]描述了概率模块化网络和信息理论的标准数据映射,通过3个独特的学习任务将有限集合的数据点定量映射;另研究了将网络信息(拓扑,设备和状态等)映射到符合Alloy合金规范的原理和算法,以关系形式对网络信息建模,然后根据新颖的数据映射原理和算法将关系数据映射到符合Alloy合金规范的格式中[8];Guo D.和Zhu X.等人提出了一种基于流映射的方法,从大量的移动数据中提取固有模式,并构建数据的有效视觉表示,以便了解复杂的流动趋势、消除杂散数据方差,以控制群体规范化流量,检测现有方法不能识别的高级模式[9];此外文献[10]中,还对数据映射和常见原因故障概率进行了预测,通过不同大小的其他系统的多个故障事件数据来估计依赖系统的故障概率。
数据映射技术应用于各个领域,然而专门针对风机控制器所产生的异构数据的映射技术却少有涉及。本文提出了一种异构数据解析方法,创新性地将不同风机控制器融入其中,使其能够对获取到的不同类型数据,通过映射模型,解析成同一种数据结构,并产生直观的数据折线图,以方便维护人员查看,降低排查难度,提高排查的速度和效率。
异构数据的总处理框架如图1所示,将解析引擎(映射模型)嵌入到软件平台中,以供内部处理数据所用,不对外开放接口;而软件平台所提供的几个主要接口是:①获取风机数据接口(单向);②与本地存储进行交互通信接口(双向);③为图像处理工具teechart输送数据的传送接口(单向)。
图1 异构数据处理系统框架
本节形式化描述了映射模型的几个主要数据维度和定义方法。
定义1:每一条获取到的监控数据F={A,T,TP,DT,LT},分别表示为通道、值、控制器类型、时间、日志类型。
①A={Name 1,Name 2,…,Namek},表示一系列通道名称的集合;令dom(Namei)(i∈[1,k])表示通道域A。则总通道集合dom(Name)= dom(Name 1)×dom(Name 2)×…×dom(Namek)。对于通道A,dom(Name)是A的域。我们考虑的域是在大多数关系数据库中能找到的典型域,例如整数、字符串、实数、布尔等。除了典型域以外,我们开扩展了如下域:时间,空域等。
②T={valuename 1,valuename 2,…,valuenamek},表示为所有通道名称的值的集合。
③我们使用t[Z],Z为F中的任意有限数量子集,表示对应属性的值。例如,对于A的通道中的通道namei对应的值valuenamei可以用t[valuenamei]表示,即T[valuenamei]。
④我们使用标准关系代数算子,如映射用πX表示;选择用σX表示。
⑤TP={Beckhoff,Mita…},表示所有风机主控制器类型集合;
⑥DT={datetimename 1,datetimename 2,…,datetimenamek},我们使用dt[namei]表示集合A中通道namei被触发时对应的日期和时间,即datetimenamei=dt[namei]。
⑦LT={5MinLog,TripLog,StatusLog},表示为所有要解析的日志类型集合。
要实现从F→F′的解析过程,需要将F中每个元素(A,T,TP,DT,LT)以某种规则映射到F′中对应的元素(A′,T′,TP′,DT′,LT′),给出以下形式化定义。
定义2:给定一个通道U,对于每个U∈A,t代表U在域A上的映射结果。t[A[u]]可以是dom(A)里的一个常数,也可以是一个属于V的变量或者表达式v-S,其中S是dom(A)的有限子集,v∈V,V是一系列变量的集合,V∩S=Ø。
映射的唯一性:为了描述一系列映射,我们使用了映射模型代替了简单的映射关系集合。此外,我们规定了每个变量出现在一个映射限制里,即映射结果表中的两个不同的映射是完全独立的。
定义3:假设X,Y是不相交的非空通道集,从X到Y的映射是X∪Y上的有限映射,使得每个变量在映射模型中最多出现一次映射。
定义4:映射模型中的映射结果表用m表示,P表示映射表中的某个映射关系。
并不是每个控制器里的任意一条数据都可以映射到同一个数据结构中显示,所进行映射的数据必须满足以下条件和约束。
映射约束:我们分别考虑基于映射结果表m的映射表达式X→Y的一组映射关系p和p′,其中X∈A,Y∈A。p″是映射关系p和p′的笛卡尔乘积,其中p的每个元组t与p′的每个元组t′相关联。给定从X到Y的映射结果表m,我们使用m作为过滤上述笛卡儿乘积条件,即筛选所有可能映射关系。只有满足条件t″[X]∈πX(p(m))和t″[Y]∈πY(σX=t″[X](p(m)))的映射p″才是符合映射表达式X→Y的映射关系。
定义Ym(x)表示通道X到Y 映射得到的所有结果集,其中x∈dom(X),Ym(x)={y|∃t∈m&∃p∈m,p(t[x])=t[y]&p(t[y])=t[x])}。我们规定:假设U=X∪Y,即任何一个基于映射结果表m的映射表达式X→Y的映射关系都属于U,如果t[Y]∈Ym(t[X]),则称Ym(x)为属性X基于映射表M到Y的结果集。
映射条件1:假设∃DTx∈Ax,DTy∈Ay,要产生基于映射结果表m的映射表达式X→Y,必须满足t[DTx]=t[DTx]。
映射条件2:假设∃LTx∈Ax,LTy∈Ay,要产生表m的映射表达式X→Y,必须满足t[LTx]=t[LTy]。
映射条件3:只有同时满足映射条件1和映射条件2,才能产生基于映射结果表m的映射表达式X→Y。
表1 Fx包含的监控数据表项
表2 Fy包含的监控数据表项
表3 Fx×Fy所得所有的监控数据表项
表4 筛选过的监控数据表项
异构数据映射代码见图2所示。
图2 异构数据映射代码示意
在下面一个实例中,表1包含两个表项F1,F2,表2也包含两个表项F3,F4;两表做笛卡尔积,产生临时映射表3,包含4个表项;经过映射约束和映射条件1,2,3的筛选,最终映射结果表4中只剩下一个正确的表项F′,完成从F→F′解析过程。
本文的软件平台架构利用C# winform实现,其调用了各个控制器的dll连接库,能够远程连接风机控制器,从而获取监控数据,获取到的数据文件是csv格式的;在平台架构里嵌入了解析引擎,能够对异构数据进行分析、处理;最后利用teechart工具将解析出来的数据进行做图处理并显示。
如图3所示,在图左侧里各个模块的分区显示的含义如下:
①需要解析的日志类型显示;
②日志产生的时间段筛选;
③需要异构同步的控制器类型选择;
④显示所有当前筛选条件下的csv文件。
图3右侧显示的是需要进行作图处理的数据通道,这些数据通道里的数据是已经经过映射模型处理过的,即已将所有能够映射到同一个数据结构下的异构数据类型全部整合到了一起。
图4是经过Teechart作图处理后的折线图,图中主要显示了两种控制器下解析的5个通道(液压压力、齿轮箱低速轴轴温、振动原始值1、振动原始值2、振动原始值3)的数据结果,可以直观地进行查看和对比。
图4 映射处理后的数据显示
本文提出的映射模型能够有效处理不同风机控制器产生的数据。这些数据被映射到同一种数据结构下,然后利用软件平台的Teechart工具处理得到解析数据,产生方便开发维护人员查看的直观图。此外,还对映射模型的形式化定义进行了详细地描述,同时提出了需要的映射约束和映射条件,基于这些约束和映射条件,阐述了映射算法的主要思想。
在未来的工作中,主要针对数据处理的时间和效率提升进行研究。由于风机的数量庞大,产生的数据参差不齐,种类繁多,当前的数据映射模型只考虑了映射结构统一的问题,处理速度和效率上并没有深入研究。下一步的任务是在原有映射模型基础上,进一步改进映射结构,提高数据映射速度和准确性。
参考文献:
[1]WANG Xiaorong,WANG Weisheng, DAI Hui. Wind power industry in China[J].Electricity,2004(1):41-43.
[2]陈雷,邢作霞,潘建,等.大型风力发电机组技术发展趋势[J].可再生能源, 2003(1): 27-30.
[3]王志新,张华强.风力发电及其控制技术新进展[J].通用低压电器, 2009(19).
[4]张新房,徐大平,吕跃刚,等.风力发电技术的发展及若干问题[J].现代电力,2003,20(5):29-34.
[5]周双喜,王海超,陈寿孙.风力发电运行价值分析[J].电网技术,2006,30(14):8-102.
[6]GONZAIEZ-Escribano A, TORRES Y, FRESNO J, et al.An extensible system for multilevel automatic data partition and mapping[J].IEEE Transactions on parallel and distributed systems,2014,25(5):1145-1154.
[7]WANG Y,LIN S, LI H,et al.Data mapping by probabilistic modular networks and information theoretic criteria[J].IEEE Transactions on signal processing,1998,46(12):3378-3397.
[8]LI F,AN C,YANG J,et al.Data mapping principles and algorithm for self-configurable systems[J].China communication,2015,12(10):169-181.
[9]GUO D, ZHU X.Origin-destination flow data smoothing and mapping[J].IEEE Transactions on visualization and computer graphics,2014,20(12):2043-2052.
[10]XIE L, ZHOU J, WANG X.Data mapping and the prediction of common cause failure probability[J].IEEE Transactions on reliability,2005,54(2):291-296.