大数据技术在主动配电网中的应用综述

2015-03-26 05:02张沛吴潇雨和敬涵北京南瑞埃森哲信息技术中心有限公司北京市00094北京交通大学国家能源主动配电网技术研发中心北京市00044
电力建设 2015年1期
关键词:分布式配电网信息

张沛,吴潇雨,和敬涵(.北京南瑞埃森哲信息技术中心有限公司,北京市00094;.北京交通大学国家能源主动配电网技术研发中心,北京市00044)

大数据技术在主动配电网中的应用综述

张沛1,吴潇雨2,和敬涵2
(1.北京南瑞埃森哲信息技术中心有限公司,北京市100094;
2.北京交通大学国家能源主动配电网技术研发中心,北京市100044)

主动配电网实现主动运行和主动管理需要全景的配网状态数据。随着智能电网的建设,特别是用电采集系统、在线监控系统的实施和应用使电网公司的数据量达到PB级,进入大数据时代。如何高效利用这些数据实现与用户的互动,解决分布式能源消纳是当前的研究焦点。文章首先概述了当前主动配电网中的大数据类型及特点;然后列举了当前在工业产业界广泛应用的大数据技术,分析了这些技术在主动配电网中可能的应用及挑战;最后结合主动配电网在能量优化调度、状态分析评估、保护控制及需求侧管理方面的应用需求,对大数据技术可能的应用场景做了展望。

主动配电网;大数据技术;分布式计算技术;非关系型数据库

0 引言

主动配电网(active distribution network,ADN)的概念和内容于2008年自国际大电网会议(CIGRE)配电与分布式发电的报告C6.11提出,旨在解决电网兼容及应用大规模间歇式可再生能源,提升绿色能源利用率,优化一次能源结构等问题[1]。近年来主动配电网已经越来越受到IEEE、CIGRE等国际学术组织的关注与重视。

主动配电网中含有大量分布式电源与柔性负荷,网络规模大并且结构复杂,系统实际运行过程中通常表现出强互动、多耦合、高随机的典型特征,运行过程中产生的数据结构多样、来源复杂,时间尺度不统一、空间尺度各异,具有典型的“4V”特征,即规模大(volume)、类型多(variety)、价值密度低(value)和变化快(velocity)[2-6]。其中,主要数据类型包含配电网运行拓扑结构信息,分布式电源状态监测信息、相关区域气象信息、电动汽车运行信息、设备状态监测信息、配电自动化信息以及用户营销信息等,保守估计一个中等规模配电网每年将产生上百TB的数据。然而配电网目前缺乏大数据分析与处理相关技术,未能充分利用所获取的海量数据提升系统运行水平与效率[7-9]。因此,对主动配电网中海量数据提供有效的存储和索引机制,建立高效且符合配电网主动管理运行需求的数据处理平台,从而准确预测和评估配电网运行状态,进而构建高效的主动配电网能量调度体系,可靠的主动控制与保护策略以及相关优化对策措施。

大数据技术在主动配电网中的应用,将为系统运行状态的实时检测与准确预测、系统运行状态的安全评估、系统运行优化控制提供有力的技术支持。大数据核心技术涉及数据的存储、整合、计算、应用4个层次。存储层涉及分布式文件存储、内存数据库、键值数据库、列数据库等技术[10-12]。整合层涉及大数据连接器、流数据总线、PIG和HIVE等技术。计算层涉及并行数据处理、流式计算等技术。应用层涉及数据挖掘、自然语言处理和图像识别等技术[13-17]。其中,大数据挖掘技术是用于海量异构主动配电网数据处理分析的关键手段,包括聚类、估计、预测、相关性分组或关联规则、聚类、描述和可视化、复杂数据类型(文本、图形图像、视频、音频等)挖掘等方法[18]。

鉴于大数据在主动配电网中出现和应用的场景越来越多,有必要对目前的应用现状和面临挑战做出总结。为未来大数据技术在主动配电网中的应用提供有益的参考。本文从主动配电网中大数据的特征出发,依次综述了主动配电网中应用的大数据技术,并给出了主动配电网中大数据处理技术的应用方向。

1 主动配电网中的大数据及其特点

1.1 主动配电网中的大数据

主动配电网中的数据大致可以分为3类:主动配电网运行状态及相关监测信息,如网络运行拓扑、分布式电源及设备状态信息;影响分布式电源出力的配电网相关区域天气信息,如光照、气温、风速等信息;网内用户的状态及营销信息,如电动汽车的运行信息、用户的用电量信息等。

依照数据结构的划分形式,这些数据可以分为结构化数据和非结构化数据。结构化数据存储在数据库里,可以用二维表结构来逻辑表达实现的数据,配电网中的大部分数据都是该种形式,且随着分布式能源、电动汽车以及其配套设施在主动配电网中的大量出现,该类型数据还将呈井喷式增长。相对于结构化数据,无法用二维逻辑表表达的数据即称为非结构化数据。这部分数据主要包括线路、设备的监测图片和视频,设备检修管理等的日志信息等。这部分数据同样增加迅速,有报道[19]指出在信息化建设的过程中,能够采用关系型数据库处理的结构化数据约占企业数据总量的20%,而其他80%的非结构化数据则无法完全采用关系型数据库表达。国家电网公司在2011年建成了企业级非结构化数据管理平台并制定了配套的管理和规范[20],足见非结构化数据价值在电网内日益凸显。

从数据实时性上来分,主动配电网中的数据又可以分为实时数据、准实时数据以及非实时数据。例如配电网调度、控制、保护等需要的数据大部分为实时数据,以保证配电网的正常运行;分布式电源等设备的状态监测信息、气象信息等并非实时调用的信息归为准实时信息,供后期对设备状态分析及预测使用;设备运行日志、监测视频、用户营销信息等信息因其应用实时性要求更低,列为非实时数据。

数据结构和时间特性如此繁杂的主动配电网信息在数据量上,也体现了显著的大数据特点,其产生的主要原因如下。

(1)为了实现配电网的主动运行,有必要对供电区域内设备实现全区域覆盖的监测。同时随着分布式电源、电动汽车充电设施、储能设备等主动配电网中的特有设备增多,数据采集点也将越来越多,常规的调度自动化系统含数十万个采集点,配用电、数据中心将达到百万甚至千万级别[21]。监测设备将主动配电网中的各种设备信息上传到数据中心,与大电网进行数据交换。

(2)主动配电网中某些特殊设备对采样频率的高要求也间接提升了数据量。例如:主动配电网中配备的超级电容、储能设备等,为了对其充放电状态等进行诊断,信号的采样频率必须在200 kHz以上。这样高频的采样信息,再结合主动配电网中大量分布的高采样率设备,数据量将会相当可观。

(3)主动配电网中分布式电源的数据产生和数据需求十分巨大。光伏、风能等分布式电源在运行过程中产生的数据蕴藏着丰富的信息,对于分析其生产运行状态、提供控制和优化策略具有重要意义[22]。风机、光伏的出力与天气等气象因素间具有极强的耦合性,对他们的出力预测等需要大量的相关历史数据,并进行相关的数据挖掘和规律学习[23-24]。同时,分布式能源以及储能设备的选址定容建立在海量地理天气信息的分析基础上,例如为支持风机选址的优化,所采集用于建模的天气数据每天以80%的速度增长[25]。

(4)主动配电网中的用户与电网互动将产生海量数据。为准确获取用户的用电数据,电力公司部署了大量具有双向通信能力的智能电表,这些电表可以每隔5 min的频率采集实时用电信息。美国太平洋天然气电力公司每个月从900万个智能电表中收集了3 TB的数据[26],且这个数字将随着主动配电网的进一步建设而增加。电动汽车的有序充电涉及到用户行为分析,而这依赖于对基数非常大的电动汽车的充放电状态进行监测,这个过程也将产生大量的数据。

1.2 主动配电网中大数据的特点

主动配电网中的大数据具有典型的“4V”特征,即规模大、类型多、价值密度低和变化快。

(1)数据规模巨大。国家电网信通公司在北京5个小区,部署了353个智能电表信息采集点,采集1.2万个参数,包括频率、电压、电流等,15 min采集一次,一天就能产生34 GB的信息[27]。

(2)数据类型繁多。数据从结构上来说,含有大量的结构化数据(状态运行信息等)和非结构化数据(视频监控、照片、检修记录文档信息等);从数据应用种类上来说,涵盖电流、电压、电量等电气量信息,用于分布式电源出力预测的天气信息,用于分析电动汽车用户行为的用户行为记录信息等。

(3)价值密度低。以状态监测量为例,对变压器、分布式电源等的连续不间断的监测信息中,只有极少片段能反映设备不正常运行状态的信息为可用信息[28];电动汽车的用户数据中,一类用户若干年的充放电时间、电量、行驶区域等的大量数据中,仅能挖掘出一两条其使用行为特征。

(4)变化速度快。主动配电网的运行状态并非恒定,由于分布式电源的出力不稳定以及负荷波动性较强,导致主动配电网的运行电气量信息、拓扑数据等都在时刻变化。有效存储并利用变化如此快的数据,需要研究相关的策略。

(5)除了以上与其他行业内大数据共同拥有的典型“4V”特征外,电力大数据还具有准确性高的特点。高质量的数据对于数据结果分析的准确性具有重要的影响,在主动配电网中,对此方面的要求进一步提高,例如光伏和风机的功率预测问题需要依赖历史数据的积累,尤其是功率数据,一个采样点坏值就会对预测模型的构建产生负面效果,影响预测结果。因此,需要结合数据清洗等方法对海量数据中的坏值进行剔除,以保证电网数据的高精确性[29]。

主动配电网由于其中涵盖分布式能源、电动汽车等各种新元素,具有很强的数据多元性。如果将其割裂来看,则主动配电网中电力大数据的大价值将无从体现。传统的商业智能(business intelligence,BI)分析关注于单个领域或主题的数据,造成了各类数据之间的强烈断层。而大数据分析则是一种总体视角的改变,是一种综合关联分析,发现具有潜在联系之间的相关性[34]。这一点与主动配电网注重网内多种资源信息交互实现优化调度的需求不谋而合。

对主动配电网的研究在国内才刚刚起步,深入研究主动配电网中的数据特点和数据需求,结合大数据技术开发配合主动配电网实现主动管理和主动运行的相关应用,必将有力推动主动配电网的建设。

2 大数据处理技术及在主动配电网中的应用挑战

2.1 大数据处理的价值和复杂性

2011年,麦肯锡向全球发布研究报告《大数据:创新、竞争和生产力的下一个前沿领域》使得大数据在科技企业界迅速火热。2012年1月,瑞士达沃斯论坛上《大数据,大影响》报告称,数据如同货币或黄金一样,已成为一种新经济资产类别。中国国家统计局在2013年11月19日与阿里、百度等11家企业签署了大数据战略合作框架协议,共同在分享、开发、利用大数据方面进行合作,以推动大数据在政府统计中的应用,促进大数据实现大价值,展现了中国政府对大数据技术发展的重视。

与大数据在商业及互联网领域的广泛研究和应用相比,大数据在智能电网中的应用尚处在起步阶段。中国电机工程学会2013年发表的中国电力大数据发展白皮书[30]指出:“中国的电力工业经过几十年的高速发展,随着下一代智能化电力系统建设的全面展开,电力大数据将贯穿未来电力工业生产管理等各个环节,起到独特巨大的作用,是中国电力工业在打造下一代电力工业系统过程中有效应对资源有限、环境压力等问题,实现厚积薄发、绿色可持续发展的关键。”目前,大数据在整个电力行业尚属起步阶段,对于刚刚提出的主动配电网概念,电力大数据仍未聚焦在这个层面。主动配电网中大数据技术应用的场景很多,例如云计算技术,它具有存储量巨大、廉价、可靠性高、扩展性强的优势,非常适合对主动配电网中海量数据的分析处理,但是由于其在实时性方面难以保证,故不适合作为配电网调度自动化系统的主系统,但可以用作调度自动化系统的后台,也可以用作建立配电网数据中心(营销、管理和设备状态监测)[31]。例如,由于主动配电网中每个用户都需要安装智能电表(实现与电网的能量双向交互),因此上送的大量负荷数据均可以存储在配电网数据中心云平台里,用于后期的负荷预测、用户行为分析等。而数据挖掘技术也是建立在应用需求上的,例如主动配电网中电动汽车充电站选址优化问题中,对历史数据的聚类分析预处理的应用,随着电动汽车用户的逐步增多,海量使用数据将使得聚类算法在普通的计算系统上无法完成。在数据的多样性上,主动配电网中数据类型涉及实时/非实时,结构化/非结构化等多种形式,相应的处理方法和平台也需要随之转换。下面将对主动配电网中迫切需要的大数据技术做出综述,并总结其应用优势和缺陷。

2.2 数据管理技术

目前,智能电网中的数据主要采用关系型数据库,如Oracle、达梦、金仓。在数据处理量上不能满足主动配电网中大量传感器上送数据、相关用户行为分析数据的处理要求。从数据结构来看,主动配电网中除传统的结构化数据外,还有系统日志、表计等半结构化数据和视频监控、检修图片等非结构化数据。目前这些数据主要保存在本地系统中,且不能被检索分析,缺乏对其有效的管理手段[32]。同时,传统数据库还有一个致命缺点即是可扩展性差。

目前最典型的大数据存储管理技术有2种:第1种是采用大规模并行处理(massively parallel processing,MPP)关系型数据库,其采用MPP架构的新型数据库集群,重点面向行业大数据,采用shared nothing架构,通过列存储、粗粒度索引等多项大数据处理技术,再结合MPP架构高效的分布式计算模式,完成对分析类应用的支撑,运行环境多为低成本PC server,具有高性能和高扩展性的特点,在企业分析类应用领域获得极其广泛的应用。另一种是Hadoop的非关系型数据库,其基于Hadoop的技术扩展和封装,围绕Hadoop衍生出相关的大数据技术,应对传统关系型数据库较难处理的数据和场景,例如针对非结构化数据的存储和计算等,充分利用Hadoop开源的优势,伴随相关技术的不断进步,其应用场景也将逐步扩大,目前最为典型的应用场景就是通过扩展和封装Hadoop来实现对互联网大数据存储、分析的支撑。这里面有几十种NoSQL技术,也在进一步的细分。对于非结构、半结构化数据处理、复杂的萃取、转置和加载(extract-transform-load,ETL)流程、复杂的数据挖掘和计算模型,Hadoop平台更擅长。

2.3 数据分析技术

数据分析技术包括数据挖掘、机器学习等人工智能技术,典型的如聚类、人工神经网络、支持向量机、粗糙集理论、决策树等技术。这些技术在电网安全分析、能源预测、设施线路运行状态分析等都有较系统的研究和应用[33]。如电力系统负荷预测问题,通常需要对规模很大的历史数据集进行聚类,以筛选相似日训练模型。还有在变压器故障诊断方面,也有学者利用支持向量机模型结合状态监测数据,得出可靠的故障诊断结果[34]。

随着分布式电源、电动汽车等新型负荷及用户的出现,这些数据分析方法又再焕发新生。因为分布式出力的间歇性、不确定性,以及与周围环境的强耦合性,使得数据分析的难度大大增强。而电动汽车这种新型负荷,负荷特点具有很强的随机性,同时还可以利用V2G技术与电网进行双向互动,更增强了负荷的多变特性。这些主动配电网中存在的特殊问题,都需要进一步利用数据分析技术进行研究。

2.4 数据处理技术

数据处理技术包括分布式计算技术、内存计算技术、流计算技术。具体是指电力云、电力数据中心软硬件资源虚拟化等技术。近几年电力数据的海量增长使得电力企业需要通过新型数据处理技术来更有效地利用软硬件资源,在降低IT投入、维护成本和物理能耗的同时,为电力大数据的发展提供更为稳定、强大的数据处理能力。

这些数据处理技术中最典型的当属云计算技术,由于大数据的数据量和分布式的特点,使得传统的数据管理技术难以胜任这种海量数据。云计算的核心是海量数据存储和数据并行处理技术。其核心思想包括分布式文件系统(distributed file system,DFS)和MapReduce技术,主要思路由谷歌公司提出。

分布式文件系统为部署在廉价PC上所设计,具有容错性高、可扩展性强的特点,可以为应用程序提供高吞吐量的数据访问,适合具有超大数据集的程序访问。Hadoop提供了分布式文件系统HDFS(hadoop distributed file system,HDFS)的一种开源实现并开发了相应的数据管理工具HBASE。HDFS具有很强的容错性,对硬件中的故障监测和自动快速恢复是其核心目标。在数据读取上,放宽了一部分可移植操作系统接口(portable operating system interface,POSIX)约束,来实现流式读取文件系统数据的目的。

MapReduce[35]是2004年谷歌公司提出的一种用来进行并行处理和生成大数据集的并行编程模型。Hadoop同样提供MapReduce的开源实现[40],MapReduce是一种编程模型,用于大规模数据集(大于1 TB)的并行运算。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。MapReduce通过把对数据集的大规模操作分发给网络上的每个节点实现可靠性;每个节点会周期性地返回它所完成的工作和最新的状态。为使MapReduce并行编程模型更易使用,出现了多种大数据处理高级查询语言,如Facebook的Hive、雅虎的Pig、谷歌的Sawzall等。这些高层查询语言通过解析器将查询语句解析为一系列MapReduce作业,在分布式文件系统上并行执行。与基本MapReduce系统相比,高层查询语言更适于用户进行大规模数据的并行处理[36]。

2.5 数据展现技术

数据展现技术具体体现为可视化技术、历史流展示技术、空间信息流展示技术等。具体是指电网状态实时监视、互动屏幕与互动地图、变电站三维展示与虚拟现实等技术。数据可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式[37]。

可视化技术已被证实是一种解决大规模数据分析的有效方法,并在实践中得到广泛应用[38]。在电力调度方面,可视化结合地理信息的接线图、动态潮流图、电压等高线、动态网络拓扑等帮助电力调度人员及时了解系统运行状态,准确处理各类告警和操作;在企业管理方面,信息系统普遍采用通过可视化人机界面和各类图表等手段分析企业经营资料,辅助决策;在用电方面,企业能效和家庭用电分析与可视化结合给出能源优化利用建议,促进节能减排[39]。

主动配电网中数据可视化具有特殊的实现难度,其中数据类型种类繁杂,需要大力发展数据展现技术,提高电力数据的直观性和可视性,从而提升数据的可利用价值。

3 主动配电网中大数据处理技术的应用方向

未来智能电网的要求贯穿发电、输电、变电、配电、用电、调度等多个环节,实现信息的全面采集、流畅传输和高效处理,支撑电力流、信息流、业务流的高度一体化[40]。针对海量异构数据的处理和应用,大数据技术将大有可为。本文就主动配电网中大数据的应用方向进行了综述。

3.1 主动配电网能量优化调度方面的应用

主动配电网的优化调度模型与传统电网的优化调度相比不论从控制变量、约束条件以及目标函数等方面都发生了深刻变化[41]。主动配电网优化调度的控制变量不仅包括可控分布式发电单元,例如燃料电池以及柴油发电机等,还有兼具充放电特性的储能系统以及配电网中的联络开关,有时还需要考虑电动汽车参与能量优化调度。这些都将为主动配电网能量调度策略的制定增加难度。

从数据分析层面上,由于能量优化调度模型中需要整合多源数据信息(例如分布式电源启停信息、电价信息、联络开关状态信息等)。然而目前电网中各信息系统大多是基于本业务、本部门的需求,存在不同的平台、应用系统和数据格式,导致信息与资源分散,异构性严重,横向不能共享,上下级间纵向贯通困难[42]。而大数据处理平台能够实现多源异构数据的存储和提取,并能大大提高数据存储容量,这将有效提高主动配电网能量调度系统的数据存储效率。

从数据分析层面上来看,能量调度问题是一个多约束条件下的优化问题。其可行解的求取需要相关的数据挖掘算法配合支持,例如粒子群算法的应用[43]。在主动配电网应用场景下的能量调度模型随着参与优化变量的增多,约束条件的增加以及网内能量双向流动的特性都将导致优化问题求解的难度加大。因此,机器学习等数据挖掘算法将为该优化问题的求解提供可行的思路。

3.2 主动配电网运行状态分析评估方面的应用

主动配电网区别于传统配电网的一大显著特征即表现在接入的分布式发电单元、储能单元以及微电网单元等对于配电网运行人员来说都是可控的,分布式能源包括电动汽车将参与到系统的运行中来。主动配电网的主动运行与主动控制,都是在对其各项状态信息进行合理分析的基础上实现的。

分布式电源出力预测、短期负荷预测、设备状态监测以及作为特殊负荷的电动汽车的时空分布特性都是配电网状态评估的关键支撑信息[44]。针对分布式电源的出力预测,可以利用关联规则聚类系统(association rule clustering system,ARCS)、基于关联规则的分类(classification based on association rules,CBA)、关联决策树(association decision tree,ADT)等数据关联规则挖掘方法,根据分布式电源出力与不同类型气象数据及周边区域不同气象站的关联特性[45]。由于分布式电源出力的不确定性,主动配电网中的海量运行信息也将成为挖掘分布式电源出力概率描述的基础。

由于主动配电网中用户能量双向流动的特点,绝大部分用户安装了智能电表,积累了海量的用采信息。基于现有海量用采数据,采用大数据聚类分析方法对用户负荷按照稳定模式、波动模式、随机变化模式等进行分类,其次运用关联分析技术构建天气、日期等影响因素与负荷的关联关系,最后利用回归决策树分析方法,建立基于知识学习和规则挖掘的智能预测系统,用以提升短期负荷预测精度。

针对设备状态监测信息,现有的设备状态图片、监控等大量非结构化数据已在配电网中大量积累。非结构化数据的存储、处理和分析方法可以在Hadoop大数据处理平台上实现,利用现有辅助系统的视频监控信息(图像、视频流),采用数据图像处理与识别技术,进行一次设备外部特征评估项的状态识别,丰富设备状态评估预测系统的基本数据来源。

对于电动汽车,车辆行驶路线(GPS)信息、充电功率信息、充电时间信息以及对应的气象信息与路况信息等电动汽车运行历史数据的整合方法将至关重要。规模化电动汽车的应用与交通情况、气象信息、工作日类别等多类影响因素的响应模型均有耦合关系,以及不同电能补给模式下电动汽车用户的个体特性与集群效应的研究都依赖对相关数据的分析,最终的目标是提出时间与空间双尺度下各类电动汽车的行为特点及其概率描述。

3.3 主动配电网保护控制方面的应用

分布式可再生能源大规模接入使得配网出现随机不确定双向潮流,同时主动运行与主动管理的要求也使得配网拓扑结构与运行方式更为灵活多变,两者都对安全可靠配网保护的实现提出了严峻的挑战。规模化接入的分布式电源与更为灵活多变的用电负荷产生了大量的量测信息,同时先进的量测技术与通信技术也使得配网能够实现更为全面、实时的状态监测。因而,应有效利用日益增长的海量配网信息以应对主动配电网运行控制对保护所提出的新要求与新挑战。

分析配网保护多设备间信息共享策略,以多节点及其相关区域冗余信息为基础的多信息保护与控制方法将是未来的重要研究方向[46]。主动配电网中保护测量信息具有多源、多时间尺度的特点,因此,配网保护量测数据的自动关联与统一描述方法将是一个重要的研究方向。同时,多源多时间尺度数据的有效利用需要结合不同任务需求(如保护定值调整、快速故障诊断),兼顾多种数据分析任务的准确性与时效性。在故障特征分析方面,需要对海量、多源的历史故障录波数据进行深入挖掘,分析不同场景下主动配电网的关键故障特征,进而研究基于故障信息反馈的配网保护控制方案。

3.4 主动配电网需求侧管理方面的应用

需求侧管理能够维持配电网中供用电平衡,从而提高DG的渗透率,而DG渗透率的提高又能够降低负荷的峰值,从而延缓配电网的升级[47]。另外,主动配电网中的电动汽车以及拥有分布式发电单元的用户都是调度中心可以调控的对象,是主动配电网需求侧管理的重要研究对象。在主动配电网运行的过程中,这些研究对象都积累了大量的运行信息,例如用户智能表计信息,电动汽车充放电规律信息等。对这些信息的有效数据挖掘,将促进需求侧管理策略的制定更为合理有效。同时,电动汽车放电电价补偿,分布式能源用户电价补偿等政策的制定也依赖于对用户行为心理分析的结果[48],这些信息的利用也是大数据在需求侧管理方面应用的重要方向。

4 结论

未来的主动配电网将是依托大数据处理分析技术的全景实时智能配电网。分布式存储计算技术为主动配电网中异构多源的数据提供了存储和分析的平台。随着时间的推移,平台运行必然产生大数据,结合大数据存储、分析、计算技术的主动配电网高级应用将会为电力设备的主动控制、主动管理、主动运行提供支持。大数据处理平台具有低成本、扩展性强(存储容量无限)、高可靠性、并行分析等优势,但在实时性、数据一致性、隐私性和安全性方面仍有不少的挑战,需要找出相应的解决方法。大数据在电力领域的应用才刚刚开始,还需要电力企业和科研机构共同努力,相信主动配电网和电力大数据这2个电力领域的新兴概念将会在不久的将来焕发活力。

[1]徐丙垠,薛永端,李天友,等.智能配电网广域测控系统及其保护控制应用技术[J].电力系统自动化,2012,36(18):2-9.Xu Bingyin,Xue Yongduan,Li Tianyou,et al.A wide area measurement and control system for smart distribution grids and its protection and control applications[J].Automation of Electric Power Systems,2012,36(18):2-9.

[2]赵江河,陈新,林涛,等.基于智能电网的配电自动化建设[J].电力系统自动化,2012,36(18):33-36.Zhao Jianghe,Chen Xin,Lin Tao,et al.Distribution automation construction in smart grid[J].Automation of Electric Power Systems,2012,36(18):33-36.

[3]杨华,陈涛,郜士琪,等.天津城市核心区配电自动化技术实施与进展[J].电力系统自动化,2012,36(18):42-48.Yang Hu,Chen Tao,Gao Siqi,et al.Implementation and development of distribution automation in urban core area of Tianjin[J].Automation of Electric Power Systems,2012,36(18):42-48.

[4]郑毅,刘天琪,洪行旅,等.中心城市大型配电自动化设计方案与应用[J].电力系统自动化,2012,36(18):49-55.Zheng Yi,Liu Tianqi,Hong Xinglv,et al.Design scheme and application of large-scale distribution automation project for central cities[J].Automation of Electric Power Systems,2012,36(18): 49-55.

[5]范明天,张祖平,苏傲雪,等.主动配电系统可行技术的研究[J].中国电机工程学报,2013,33(22):12-18.Fan Mingtian,Zhang Zuping,Su Aoxue,et al.Enabling Technologies for Active Distribution Systems[J].Proceedings of the CSEE,2013,33(22):12-18.

[6]凌万水,刘东,洪俊,等.形式化校验技术在智能配电网自愈中的应用[J].电力系统自动化,2012,36(18):62-66.Ling Wanshui,Liu Dong,Hong Jun,et al.Formal verification technology application in self-healing of smart distribution grid[J].Automation of Electric Power Systems,2012,36(18):62-66.

[7]王金丽,盛万兴,王金宇,等.中低压配电网统一数据采集与监控系统设计和实现[J].电力系统自动化,2012,36(18):72-76.Wang Jinli,Sheng Wanxing,Wang Jinyu,et al.Design and implementation ofa centralized data acquisition and supervisory system for medium-low voltage distribution network[J].Automation ofElectric Power Systems,2012,36(18):72-76.

[8]姚成,黄国方,仲雅霓,等.基于站控层GOOSE的站域控制实现方案[J].电力系统自动化,2012,36(18):159-160.Yao Cheng,Huang Guofang,Zhong Yani,etal.A realization scheme of substation area control system based on GOOSE message in station level[J].Automation of Electric Power Systems,2012,36(18): 159-160.

[9]Sudipta G,Ghoshal S.P.,Saradindu G.Optimal sizing and placement of distributed generation in a network system.Electrical Power and Energy Systems[J].2010,32(18):849-856.

[10]Jupe S C E,Taylor P C.Distributed generation output control for network power flow management.Renewable Power Generation[J].2009,3(4):371-386.

[11]Fabio B,Roberto C,Valter P.Radial MV networks voltage regulation with distribution management system coordinated controller.Electric Power Systems Research[J].2008,78(4):634-645.

[12]HUGO A G,GEZA J.Models for quantifying the economic benefits of distributed generation.IEEE Transactions on Power Systems[J].2008,23(2):327-335.

[13]Djapic P,Ramsay C,Pudjianto D,et al.Taking an active approach.IEEE Power&Energy Magzine[J].2007,5(4):68-77.

[14]Walling R A,Saint R,Dugan R C,et al.Summary of distributed resources impact on power delivery systems.IEEE Transactions on Power Delivery[J].2008,23(3):1636-1644.

[15]Bommareddy C,Makram E.Power Quality Studies in the Presence of DG[C]//Power Systems Conference:Advanced Metering,Protection,Control,Communication,and Distributed Resources,2006 PS‘06.2006.

[16]D’Adamo C,Jupe S,Abbey C.Global survey on planning and operation of active distribution networks-update of CIGRE C6.11 working group activities[C]//20th International Conference on Electricity Distribution,2009.

[17]衡星辰,周力.分布式技术在电力大数据高性能处理中的应用[J].电力信息与通信技术,2013,11(9):40-43.Heng Xingchen,Zhou Li.Application of distributed technologies in the power big data high-performance processing[J].Electric Power Information Technology,2013,11(9):40-43.

[18]罗学礼,徐树振,王森,等.电力企业的非结构化数据检索研究[J].计算机与数学工程,2014,42(4):729-733.Luo Xueli,Xu Shuzhen,Wang Sen,etal.Research on unstructured data retrieval of electric enterprise[J].Computer&Digital Engineering,2014,42(4):729-733.

[19]程志华,倪时龙,黄文思,等.企业级非结构化数据管理平台研究及实践[J].电力信息化,2012,3:12-20.Cheng Zhihua,Ni Shilong,Huang Wensi,et al.Research and practice of enterprise unstructured data management platform[J].Electric Power Information Technology,2012(3):12-20.

[20]李锋,谢俊,兰金波,等.智能变电站继电保护配置的展望和探讨[J].电力自动化设备,2012,32(2):122-126.Li Feng,Xie Jun,Lan Jinbo,etal.Prospect and discussion of relay system configuration for intelligent substation[J].Electric Power Automation Equipment,2012,32(2):122-126.

[21]PregeljA,Begovic M,Rohatgi A.Quantitative techniques for analysis of large data set in renewable distributed generation[J].IEEE Trans on Power Systems,2004,19(3):1277-1285.

[22]杨茂,熊昊,严干贵,等.基于数据挖掘和模糊聚类的风电功率实时预测研究[J].电力系统保护与控制,2013,1(1):1-6.Yang Mao,Xiong Hao,Yan Gangui,et al.Real-time prediction of wind power based on data mining and fuzzy clustering[J].Power System Protection&Control,2013,1(1):1-6.

[23]陈昌松,段善旭,殷进军.基于神经网络的光伏阵列发电预测模型设计[J].电工技术学报,2009,24(9):153-158.Chen Changsong,Duan Shanxu,Yin Jinjun.Design of photovoltaic array power forecasting model based on neutral network[J].Transactions of China Electrotechnical Society,2009,24(9): 153-158.

[24]IBM Corporation Software Group.IBM big data overview for energy and utilities[EB/OL].2011-06[2012]http://www-01.ibm.com/ software/tivoli/solutions/industry/energy-utilities/.

[25]David K.PG&E`s Austin kicks off conference on dealing with smart grid data[EB/OL]2012-08[2013-02]http://www.pgecurrents.Com/2012/08/14/pg-topic-is-dealing-with-data-that-comeswithsmart-grid/.

[26]陈军良.电力企业大数据时代.[EB/OL],2014.http://news.bjx.com.cn/html/20140410/502859.shtml.

[27]石峰.基于数据挖掘技术的变压器状态监测数据处理系统[D].保定:华北电力大学,2013.Shi Feng.Development and application fo synchronous phasor monitoring system for power supply network[D].Baoding:North China Electric Power University,2013.

[28]杨红英,冯双磊,王勃,等.基于线性回归的风电功率预测误差修正方法[J].电力系统及其自动化学报,2013,25(4):14-17.Yang Hongying,Feng Shuanglei,Wang Bo,etal.Study ofthe MOS method based on linear regression for wind power prediction[J].Proceedings of the CSU-EPSA,2013,25(4):14-17.

[29]中国电机工程学会信息化专委会.中国电力大数据发展白皮书[R].北京:中国电机工程学会,2013.

[30]宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935.Song Yaqi,Zhou Guoliang,Zhu Yongli.Present status and challenges of big data processing in smart grid[J].Power System Technology,2013,37(4):927-935.

[31]孙柏林.“大数据”技术及其在电力行业中的应用[J].电气时代,2013,(8):18-23.

[32]廖志伟,孙雅明.数据挖掘技术及其在电力系统中的应用[J].电力系统自动化,2001,(25)11:866-883.Liao Zhiwei,Sun Yaming.Data mining technology and its application on power system[J].Automation of Electric Power Systems,2001,25 (11):62-66.

[33]董明,孟源源,徐长响,等.基于支持向量机及油中溶解气体分析的大型电力变压器故障诊断模型研究[J].中国电机工程学报,2003,(23)7:88-92.Dong Ming,Meng Yuanyuan,Xu Changxiang,etal.Fault diagnosis model for power transformer based on support vector machine and dissolved gas analysis[J].Proceedings of the CSEE,2003,23(7): 88-92.

[34]Jeffrey D,Sanjay G.MapReduce:simplified data processing on largeclusters[C]//OSDI’04:Sixth Symposium on Operating System Design and Implementation.San Fancisco,California:USENIX Association Berkeley,2004:137-150.

[35]Apach.Apache Hadoop core[EB/OL].2012-08[2013-02].http://hadoop.apache.org/core/.

[36]王鹏,孟丹,詹剑锋,等.数据密集型计算编程模型研究进展[J].计算机研究与发展,2010,47(11):1993-2002.Wang Peng,Meng Dan,Zhan Jianfeng,et al.Review of Programming Models for Data-Intensive Computing[J].Journal of Computer Research and Development,2010,47(11):1993-2002.

[37]杨彦波,刘滨,祁明月,等.信息可视化研究综述[J].河北科技大学学报,2014,(35)1:91-102.Yang Yanbo,Liu Bin,Qi Mingyue,et al.Review of information visualization[J].Journal of Hebei University of Science and Technology,2014(1):91-102.

[38]袁晓如,张昕,肖何,等.可视化研究前沿及展望[J].科研信息化技术与应用,2011,2(4):3-13.Yuan Xiaoru,Zhang Xin,Xiao He,et al.Visualization research frontier and prospect[J].e-Science Technology&Application,2011,2(4):3-13.

[39]闫龙川.可视化—大数据价值的有效传递方式[J].电力信息化,2013,11(2):10.

[40]尤毅,刘东,钟清,等.主动配电网优化调度策略研究[J].电力系统自动化,2014,38(9):177-183.You Yi,Liu Dong,Zhong Qing,etal.Research on pptimalschedule strategy for active distribution network[J].Automation of Electric Power Systems,2014,38(9):177-183.

[41]张文亮,刘壮志,王明俊.智能电网的研究进展及发展趋势[J].电网技术,2009,33(13):1-11.Zhang Wenliang,Liu Zhuangzhi,Wang Mingjun,et al.Research status and development trend of smart grid[J].Power System Technology,2009,33(13):1-11.

[42]王健,谢桦,孙健.基于机会约束规划的主动配电网能量优化调度研究[J].电力系统保护与控制,2014,42(13):45-52.Wang Jian,Xie Hua,SUN Jian.Study on energy dispatch strategy of active distribution network using chance-constrained programming[J].Relay,2014,42(13):45-52.

[43]钟清,孙闻,余南华.主动配电网规划中的负荷预测与发电预测[J].中国电机工程学报,2014,34(19):3050-3056.Zhong Qing,Sun Wen,Yu Nanhua,et al.Load and power forecasting in active distribution network planning[J].Proceedings of the CSEE,2014,34(19):3050-3056.

[44]颜宏文,李欣然.基于差分进化的含分布式电源母线净负荷预测[J].电网技术,2013,37(6):1602-1606.Yan Hongwen,Li Xinran.Uncertainty analysis on netload forecasting for busbar containing distributed energy sources based on differential evolution and rough sets reduction[J].Power System Technology,2013,37(6):1602-1606.

[45]陈朝晖,赵曼勇,周红阳等.基于广域一体化理念的网络保护系统研究与实施[J].电力系统保护与控制,2009,37(24): 106-113.Chen Zhaohui,Zhao Manyong,Zhou Hongyang,etal.Research and implementation of network protection system based on integrated and wide area information[J].Power System Protection and Control,2009,37(24):106-113.

[46]STRBAC G.Demand side management:benefits and Challenges[J].Energy Policy,2008,36(12):4419-4426.

[47]刘健,牛东晓,邢棉,等.基于动态电价的新能源实时调度定价与策略研究[J].电网技术,2014,38(5):1346-1351.Liu Jian,Niu Dongxiao,Xing Mian,et al.Research and strategy of dynamic electricity price based real-time dispatching pricing of new energy[J].Power System Technology,2014,38(5):1346-1351.

(编辑:刘文莹)

Review on Big Data Technology Applied in Active Distribution Network

ZHANG Pei1,WU Xiaoyu2,HE Jinghan2
(1.NARI Accenture Information Technology Center,Beijing 100094,China; 2.Beijing Jiaotong University,National Active Distribution Network Technology Research Center,Beijing 100044,China)

Active operation and management of power distribution network requires panoramic data.Through the development of smart grid including deployment of smart meters and online equipment monitoring system,the power industry is entering the Big Data era.How to effectively use these data to achieve interactions with consumers and integration of distributed renewable resources has become main research focuses.This paper firstly describes the characteristics of big data in active distribution network.Then,big data technologies are introduced and the possible application and challenges of active distribution network are analyzed.Finally,potential application scenarios are presented combining the requirements of energy optimized dispatch,state analysis and evaluation,protection and control and demand-side management.

active power distribution network;big data technology;distributed computing technology;nonrelational databases

TM 72;TP 311

A

1000-7229(2015)01-0052-08

10.3969/j.issn.1000-7229.2015.01.008

2014-11-05

2014-12-11

张沛(1972),男,博士,教授级高级工程师,主要从事电力大数据应用开发研究工作;

吴潇雨(1991),男,博士研究生,主要从事电力系统保护与控制,电力系统负荷预测,电力大数据应用开发研究工作;

和敬涵(1964),女,教授,博士生导师,主要从事电力系统保护与控制,主动配电网能量管理及优化控制研究工作。

猜你喜欢
分布式配电网信息
关于城市10kV配电网自动化实施的探讨
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
订阅信息
基于IEC61850的配电网数据传输保护机制
配电网不止一步的跨越
基于DDS的分布式三维协同仿真研究
展会信息
基于CIM的配电网线损计算
西门子 分布式I/O Simatic ET 200AL