李亚婷
(国网襄阳供电公司营销运营中心,湖北 襄阳 441000)
早期的电网以发电、输电、配电以及售电功能为主[1]。但随着全球人口数量急剧增长,随之而来的是电力需求的不断攀升,这不仅导致了电力供应的需求问题,也使得电力供应的可靠性和供应质量的下降。由此,智能电网(Smart Grid,SG)的概念出现在人们的视野里。智能电网的概念可以最早追溯到2000年左右,美国电科院提出Intelli-Grid概念[2]。智能电网被认为是各种新能源、新技术应用到传统电网中的结果,其具有可靠性、高效性、安全性和可交互性等特点。而随着各类智能设备、分布式能源(Distributed Energy Resources,DER)、电动汽车、计算机技术和通信技术在智能电网中的应用和快速发展,产生了结构多样、来源复杂的数据[3],使得智能电网中的数据处理问题成了研究的热点问题,而大数据技术则恰好是一种能够对海量数据高效收集、管理和应用的技术[4]。本文首先介绍了智能电网的基本架构,然后对于大数据处理技术在智能电网中的应用进行了详细的介绍,最后对大数据技术应用的问题和发展方向进行了阐述和探讨。
智能电网是利用信息通信技术(Information and Comunication Technology,ICT)、计算机技术(Computer Technology,CT)等技术来监视、控制从发电、输电、配电以及用电的全过程,从而实现坚强、智能、可靠的电力网络。这一过程涉及海量电力信息的采集、存储和发送。智能电网主要由3个部分构成:电力系统、通信系统和信息系统。合适的智能电网架构能使得智能电网的各项功能高效运转。
传统的电力系统架构是基于单向的电流流动来完成发电、输电、配电到用电的整个过程,而在智能电网中的电力系统则是考虑到电流的双向流动,更确切地说,在智能电网中能够实现电流和信息在用户侧和发电侧双向的、高效、安全传递。在智能电网中,电力系统网络特指的是电力系统中的物理层面上系统或是设备,包括但不限于:发电厂(包括新能源发电)、变电站、电力传输线、断路器、各类电机等。该电力系统应具有灵活、可靠、高效等特点。
智能电网需要建立范围广且反应灵敏的通信网络以传递基础电力设备上的传感信息,从而完成对整个电网的精确调控。鉴于电能具有“即发即用”和不方便存储的特点,电力系统中的各类仪器仪表所产生的数据,需要迅速且可靠地传递,这样才能够实时监测和控制电力设备。
在传统的电力通信网中,各类信息由分散在四处的不同来源汇聚到控制中心。智能电网的通信网络可以采用分布式架构,也可采用集中式架构。智能测量设备产生的数据将传输到数据收集器或者是通信网络中的某个节点上,通过网络接口数据采集器可将采集到的电力数据传输到集中式或分布式的控制中心。
有线网和无线网在电力通信系统中的应用,可以很好地提高电力供应的可靠性和供电质量,智能电网中并入了多种不同的通信网络,例如:家庭区域网、建筑区域网以及工业区域网。这些网络不仅承担着收集区域内部各个智能用电设施信息的职责,还承担着向设备发送精准的调控命令的职责,从而完成降低用户能耗的工作。智能电网中运用了多种通信技术,其通信模型如图1所示,包含ZigBee、光纤以及电力线通信(Power Line Communication,PLC)等。
图1 智能电网通信模型
通信系统存在各类通信标准,以规范不同设备或是不同站点之间的通信。例如:变电站与主站之间的通信采用的是IEC61850-90-2协议。此外,TCP/IP、数字用户线路(Digital Subscriber Line,DSL)也是智能电网通信系统中采用的最广泛的协议之一。
鉴于电能的特性,对于智能电网而言,在其内部保持各个系统和设备之间的信息同步通信是十分重要的,例如:主站发送的控制合闸命令到断路器有严格的时延控制,否则影响设备的正常工作。智能电网中主要的信息来源有:数据采集与监视控制系统(Supervisory Control And Data Acquisition,SCADA)、客户信息系统(Customer Information System,CIS)、高级量测体系(Advanced Metering Infrastructure,AMI)。其中,SCADA系统用于采集公共电力设施(发电厂、变电站等)内部设备的相关数据,而AMI多用于采集用户侧信息。
任何在智能电网中存在体量大、半结构化、结构化和非结构化的信息[5]都能被看作是大数据。大数据在智能电网中的来源主要有两个部分,电力公司数据源和补充数据源。其又可以分为四大类,分别是:负载数据、设备及电量数据、安全数据和其他数据,如表1所示。
表1 智能电网信息类型
电力公司的数据源通常是结构化的数据,该类数据通常来自各种测量设备,例如:SCADA、AMI数据。补充数据成分较复杂,有结构数据、半结构化数据和非结构化数据。补充数据通常来自地理信息系统(Geographic Information System,GIS)、全球定位系统(Global Positioning System,GPS),甚至还有水文数据和气象数据等。这些数据来自不同的信息源,有着不同的类型和格式,既有传统的数据库信息,也有文档信息、视频信息甚至是网页文件。
通过数据分析技术可以将这些具有特定格式的数据转化成智能电网中的可视化的数据。数据分析技术可分为先进分析法和预测分析法。先进分析法用以提升用户服务体验,而预测分析法是基于当前的数据对未来的用电量、损耗等数据做出预测。将大数据中的数据预测技术应用到智能电网中可以有效提升发电环节(尤其是分布式发电环节)的稳定性;降低电网的停电概率。将大数据技术应用在智能电网中的优势,主要体现在以下4个方面:(1)实现电网的经济调度;(2)提升电网的稳定性;(3)提升设备的运行效率;(4)提升用电侧的客户满意度。
大数据的数据分析过程通常分为数据收集、数据清洗、数据存储、数据挖掘和结果展示。
数据处理是大数据技术在智能电网应用中的核心技术,通过数据处理的过程,能够有效地将结构化数据、半结构化数据和非结构化数据转化成供调度、运行人员以及消费者可用的信息。大数据处理在智能电网中的应用主要有3种应用方式:批处理、流处理和迭代处理。
批处理是通过完成批处理所需的特定程序将数据收集并分成小的集合的过程。目前,应用最广泛的方式就是Hadoop mapreduce。该数据处理模型能够将非常庞大的数据集处理成许多小的数据集,并在所有这些小数据单元上并行计算。Map-Reduce可以用于分析计算用户的使用情况,因此Map-Reduce是专门为周期性批处理而设计的,但它不适用于频繁的大型活动数据集重新处理。它不能应用于实时传感器数据和流数据处理,因此该模型不适合应用于智能电网中需要进行实时分析的场景中,例如需求响应、短期负荷预测等。
流处理是一种允许用户在接收到的数据后的短时间内快速查询连续数据流和检测条件的技术。流处理方式通常采用Apache Spark引擎。考虑到流处理方式处理的是各类实时数据,这就对其数据处理的时间提出了很高的要求。采用流处理方式能够有效地避免了对无用数据进行重新处理的过程,且相较于批处理,流处理方式能够提供更及时和准确的结果。流处理方式采用Apache Spark引擎,可利用该引擎的动态性能对数据进行分析。
迭代处理法可以对电网中所有不同类型的数据集进行分析和处理,然后重复该处理过程,并通过使用特定算法来获得最合适的值。多次、反复的数据处理是迭代处理法的最大特征,而在这种高频的读写(迭代操作)下会极大地增加运算时间,这也是迭代处理方式的最大缺陷。目前,在迭代处理技术中,应用最多的是Apache Spark引擎。
考虑到智能电网中的数据有用户侧数据、公共电力设施的各类数据。在数据的传递和存储过程中,用户数据一旦发生数据泄露,会严重影响到用户的个人隐私。而公共电力设施的相关用电数据泄露更为严重,会对国家安全造成损害。在智能电网的通信网络中,无线通信网由于其接入灵活带来的信息泄漏风险最高,对于其泄漏风险的控制是日后研究的重点。
随着智能电网的快速发展和大数据技术的应用,电网中的需要存储的数据和需要传输的数据呈指数级增长。而在我国部分地区,受制于通信网络资源不足、通信设备老化等客观因素,无法形成高效、稳定的通信网,这也极大地制约了智能电网在我国部分地区的应用。可以说网络资源问题亟待解决。
由于在智能电网中存在着数量众多的、类型不尽相同的各类数据,不同数据间的相互转换、不同软件和硬件设备之间的标准差异也是当前存在的问题之一。考虑到当前我国各个电网发展的不均衡、不同步,这就导致了不同区域的电网可能采用不同的通信设备,这也为智能电网的统一发展带来了不便。
智能电网的发展离不开大数据、云计算等先进技术的辅助,本文介绍了智能电网的架构,通过对其通信系统、信息系统的介绍,表明大数据技术对于智能电网运行的重要性,并着重介绍了数据处理技术在智能电网中的应用,对大数据应用的热点问题进行了总结。大数据技术的发展和智能电网的发展息息相关。智能电网为大数据的应用提供了广阔的空间,而大数据技术为电网的稳定高效运行保驾护航。如何进一步完善相关的标准体系、提升数据的可靠性和准确性是日后研究的重点。