, (国网四川电力公司宜宾供电公司,四川 宜宾 644000)
大数据的概念:对海量种类、来源复杂的数据进行快速采集、发现与分析,用经济的方法发掘数据的价值体系、技术架构[1]。大数据不仅指海量数据,而且还囊括了研究这些数据的方法、理论及技术。电力系统是大数据应用的重要范畴[2]。由于智能电网的飞速发展,电力系统产生了大量结构多元化、来源复杂的电力数据,这些数据具有巨大的潜在利用价值,可提升电网管理、运行水平,甚至产生历史性变革。
近几年,国内外逐步兴起大数据技术在配电网中的应用研究。2013年美国EPRI启动了两项大数据项目,其一就是配电网现代化示范(distribution,modernization,demonstration,DMD)[3];美国加州大学等机构对洛杉矶电力数据进行研究,将街占地面积、区建设时间以及平均收入等数据全部整合在一起,以地图的形式展现了2011年1月至2012年6月各街区各月平均耗电量[4];法国电力公司(EDF)研发了以大数据为基础的用电采集系统,该系统主要是以电表数据为主,再结合气象数据、用电合同信息、电网数据等构成大数据的数据来源[5]。
中国也对智能配电网大数据技术与应用进行了研究,华北电力大学对用户侧大数据分析与并行负荷预测进行了研究[6];江苏省电力公司从2013年开始建立营销大数据智能分析系统,该系统目前已囊括了电压等级、气象、行业等9个维度的数据分析模型和多项关联性分析模型,多视角解析整个省的电力用户数据[7]。
下面首先给出了电力大数据基本概念,然后对大数据技术在电力系统中的运用进行分析,并设计了一种中压供电可靠性管理系统。该系统对导入的OMS大数据进行清洗、筛选、分类后,可以分别得到该地区城网、农网的供电可靠率;可给出该地区的重复停电情况(包括线路重复停电、台区重复停电);对计划停电进行分析;提供抢配效率、故障停电与计划停电损失预估等优质服务。本系统的分析结果可给运行人员提供一定的参考,实地核实停电多发台区的情况,以减少停电次数,提高中压供电可靠性。
随着电力信息化的发展,电力数据规模迅速扩大,种类也快速增加,这些各种各样的数据组成了智能电网大数据库。
根据数据来源,电网大数据可以分为两大类[8-9]:电网内部数据、外部数据。内部数据来自用电信息采集系统(collection system information,CIS)、营销系统、广域监测系统(wide area measurement system, WAMS)、配电管理系统、生产管理系统(production management system,PMS)、能量管理系统(energy management system,EMS)。外部数据主要来自地理信息系统(geographic information system,GIS)、电动汽车充换电系统、公共办事部门、网络等。
这些数据相互影响、关联,关系复杂。例如社会经济发展状况影响着用户用电情况,用户用电状况又影响着电力交易情况。总结各界对数据特征的定义,再结合智能电网电力数据的特征,将智能电网电力大数据特点总结成以下几点:1)数据的来源是各个分散安置、分布管理的系统;2)数据数量多、维度高、类型繁多;3)对电力公司、电力用户以及社会经济发展有重要的作用;4)数据间潜在的关系错综复杂,可对其进行挖掘,大部分情况下有实时性要求。
数据挖掘(data mining)指从海量的数据资料中获取潜在有用的并且最终可理解的信息与知识的过程[10,13]。从数据挖掘的功能出发可分为如下几类:
1)关联分析:关联分析是为了找出数据中潜在的关系网,通过关联分析可得到较多的关联规则,通过设置合适的“可信度”、“支持度”阈值删除一些多余的关联规则来获取有用的规则。
2)数据分类:根据特征性描述、区别性描述对数据进行分类,特征性描述是针对同类数据的共性进行描绘;区别性描述是对两个及以上类别之间区别的描述。
3)聚类分析:将定量数据按照相似程度划分为不同类的过程,划分为同一类的样本数据具有较大的相似性,不同类的样本之间则表现出较明显的差异性。
4)趋势分析:即时间序列分析,从数据随时间变化过程中发现规律、趋势。趋势分析与关联性分析相同,都是为了发掘数据内潜在的联系,但趋势分析主要是研究数据的前因后果关系。
5)偏差检测:从海量数据库中检测出明显异常的偏差数据有重要意义。通过检查发现这些异常,并从数据库中将其剔除,可提高数据库使用价值。
6)数据预测:通过对历史数据的建模分析,结合当前的数据,运用所建数学模型实现对数据的未来变化趋势的预测。
数据挖掘的过程涉及到数据统计、数据库存储、人工智能和机器学习等领域,通常情况下,数据挖掘的过程包括如下几个步骤[11-12]:
1)异常数据清除:剔除噪声数据和不一致的数据。
2)数据集成:将不同类型的数据组合在一起。
3)数据选择:从大数据中筛选与任务相关的数据。
4)数据变换:将数据变换为适合发掘分析的数据模式。
5)数据挖掘:从统一后的数据结构中发掘出相应的数学模型。
6)信息表示:用简洁的方式显示发掘出的信息。
7)规则验证:用其他数据验证数据挖掘结果的精确度。
该流程中前4步是对数据进行预处理,是信息挖掘的关键阶段,直接影响数据挖掘的效果。在这个阶段中可采用多种方法处理,剔除错误、虚假的数据,得到有用信息;然后运用数据挖掘技术从中发掘出潜在的关联规则,并用简单、可视化的方式对知识进行表达。
基于前述技术开发了一种基于大数据的中压供电可靠性分析管理系统。
该系统分为4层:数据资源层、处理层、公共服务层、业务应用层。系统组成结构如图1所示。
图1 中压供电可靠性管理系统结构
1)数据资源层:通过在PMS系统、OMS系统、Open3000、用电采集系统等系统中,导出其源数据,将源数据载入到系统中,在载入时,系统会根据数据清洗算法,对数据进行清洗,排除异常数据,提高准确性。
2)数据处理层:数据处理层集成了数据挖掘算法,有分布式内计算、流计算、交互式计算、图计算、高性能计算。通过处理后将结果反馈给下一层。
3)公共服务层:公共服务层是从技术方面为业务层的功能提供服务,包括可视化管理、事件管理和、报表分析等。
4)业务应用层:主要包括数据的不同功能展示,如节电、用电预测、网架优化、错峰调度结果等功能均通过该层输出所需结果。
所设计系统经用采系统获取数据,由于国家电网公司的用采数据中存在很多问题,比如采集器故障、周期性故障、网络传输故障等,所以在进行分析之前需要对数据进行清洗。根据大数据算法对台区停电情况进行分析、研判,确保停电数据的真实性与可靠性。再根据不同维度(如地区、线路、台区、时段等)对数据进行分表展示,使用户能够自定义分析维度,进行自主分析。
随着市场经济的迅速发展,用户对供电质量的要求越来越高,供电可靠性已成为电力企业衡量的因素之一。供电可靠率是指统计周期内配电网络对用户有效供电总小时数与统计周期内总小时数之比。
(1)
式中:σ为用户平均停电时间;τ为统计时间。
从式(1)可知要提高供电可靠率,实质上就是要降低统计周期内用户的总停电时间。这可以从降低故障停电次数、降低停电重复率以及降低停电户数来帮助解决该问题。
当前的停电管理系统中,所有的停电都是一线班组收稿操作,这加大了工作人员压力,数据准确性也有待进一步提高,所以需要一种可以自动记录和分析停送电研判的算法对停送电进行管理;在精确记录台区内停电情况的同时,尽可能减少一线工作人员的工作量,提高自动化业务管理水平。
所设计系统的停电研判方案是根据电力用户采集系统、OMS系统、PMS系统、变电站10 kV线路总表等数据对停电的可信度进行分析研判,以提高停电研判的正确度。
对系统中输入的某地区数据进行处理,选择展示日期,通过分析筛选,对该地区停电的可信度进行分析研判,输出的结果如图2所示。从该地区2017年前7个月供电可靠率的变化趋势可见6月份该地区供电可靠率稍有降低。从停电平均时户数也可知6月份停电户数最多;该地区总停电548次,平均供电可靠率高达99.91%。
如今在电网运行分析中还没有开展有效的重复停电管理分析,本系统主要帮助企业实现:
1)量化统计分析台区、线路重复停电问题;
2)提升企业全面掌控台区重复停电的能力。
本系统利用大数据监测方案。以电力系统的大量运行数据为基础,总过程可分为大数据采集、清洗、监测分析、闭环跟踪等环节。对台区重复停电情况进行量化、归集分析。实现框图如图3所示。
图2 某市城网供电可靠性分析
图3 停电管理系统
在处理数据时,对每条停电数据设置可信度百分比,从而能灵活识别台区停电情况。模型主要考虑如下几个因素:
1)自动计算监测周期内电压和电流曲线子表中相应记载的数据,如果所记载点数百分比大于等于90%,则认为此台区的总表运行正常;
2)停电时间高于1 h的台区在该停电时间内是否有数据记载,如果有,则说明地区停电的可靠性较低;
3)停电之前以及恢复供电后2 h内是否有电压、电流记录,如果有则认为台区停电比较可信。
基于以上3个因素的数据计算模型可以提升台区供电可靠率的可靠性。
3.3.1 线路重复停电分析
对某市的重复停电情况进行分析,设置展示时间段为2016年1月至2017年11月,对某地区各个城市的线路重复率进行展示,结果如图4所示。据图4(a)可知在数据统计期间该地区总停电590次,停电总时长为1 690.17 h。据图4(b)可知重复停电2次的有16条线路、3次的有20条线路、4次的有23条线路、5次的有13条、6次的有9条、7次及以上的有23条线路。发生重复停电的系数高达104条,可见该地区线路重复停电现象比较严重。可进一步核实,调查原因,加大治理力度,减少线路重复停电次数。
图4 某市线路重复停电次数分布
3.3.2 台区重复停电分析
对该地区各个区域台区的重复停电情况进行分析。定义展示时间范围同上,统计区域在定义时间范围内停电、重复停电的次数和时长。统计各个区域在定义时间内台区重复停电的次数分布情况如图5所示。
据图5(a)可知,该地区各市各台区总停电次数为7 728次,停电时长为42 700 h。其中B县台区停电次数最多。据图5(b)可知,停电2次的台区有961个、3次的有252个、4次的有8个、4次的有3个、大于5次的基本没有。台区重复停电情况比线路重复停电稍好。出现2至3次重复停电的台区居多。
停电类型分为:计划停电、故障停电、临时停电。其中故障停电、临时停电均属于非计划停电。
根据大数据处理,对该市计划停电数据进行分析,对该市2016年5月的计划停电情况进行展示,结果如图6。据图6(a)可知,C、D县供电公司的计划停电次数较多。对该地区全年计划停电中重复停电线路进行分析,如图6(b)共有67条线路发生重复停电,其中7次及以上的线路占比最高,与前面分析的总线路重复停电次数相比,计划停电中的线路重复停电次数大大减小,可见重复停电次数大部分由非计划停电引起。
另外所设计系统还对该市计划停电的时段进行了统计,结果如图6(c)所示,该图表明计划停电时间段大部分集中在7:00至18:00,这应该是从人民的安全、方便性上考虑到晚上的用电需求比白天更大。
3.5.1 配抢效率分析
所设计系统可对配电抢修效率进行详细分析和展示,如图7所示。数据统计起始时间为2017年1月1日至2017年10月24日,总体上停电延时比供电延时次数多,并且停电延时的时长大于6 h的次数最多。
从检修类型统计圆饼图可知,计划检修占比最高,故障检修占比相对较小,但是仍然说明有一定数目的故障发生。该图在帮助运行人员了解检修情况的同时,提醒检修方关注故障检修、非计划检修等情况,对故障线路进行考察,减少故障发生概率。
3.5.2 停电经济损失预估
供电可靠性降低不仅对用户造成极大损失,也会对电力公司造成损失,所以系统针对于台区重复停电的情况,对每个时间段内重复停电对电力公司造成的损失进行了预测、计算。通过台区停电事件对台区96个点进行数据拟合,计算出台区每个时间点的负载预测,对台区反复停电损失进行合理估算。结果如图8所示(图中是某公司某周的停电损失金额,损失金额为90.56万元)。
图6 某市各县计划停电分布情况
图7 配抢效率分析情况
图8 损失金额估算
在安排停电时,电力公司需要对停电的损失进行评估,所以系统提供给了电力企业一个科学、量化的评估依据。如图9所示,通过用户选择线路、停电时间段,通过后台大数据分析预测,得出停电损失额度。
图9 计划停电损失金额
研究开发了一套基于大数据的中压供电可靠性管理系统,系统分析结果表明:
1)该系统通过后台大数据分析预测,有效提高了台区停电事件可信度,并可得出停电损失额度。
2)该系统的停电研判方案是根据电力用户采集系统、OMS系统、PMS系统、变电站10 kV线路总表等数据对停电的可信度进行分析研判,提高了停电研判的正确度。
3)该系统处理可得到既定地区内的城网供电可靠性高达99.91%;可得到该地区线路重复停电情况、台区重复停电情况;可实现对计划停电分布情况的分析;可提供配抢效率分析、停电损失估计等优质服务。
系统分析结果可以为运行人员提供参考,对故障停电多发地区进行核实,采取相应措施以提高供电可靠率。
[1] 于海平. 基于数据挖掘技术的运营监控系统[J].电气技术, 2016, 17(9):147-149.
[2] 张沛, 吴潇雨, 和敬涵. 大数据技术在主动配电网中的应用综述[J].电力建设, 2015, 36(1):52-59.
[3] 刘峰. 大数据分析在配电网统计数据中的应用探索[D].广州:华南理工大学, 2016.
[4] 徐祥征, 王师奇, 吴百洪. 基于大数据分析的配电网主动检修业务应用研究与实现[J].科技通报, 2017, 33(6):105-108.
[5] 杜明建. 大数据技术在负荷预测与负荷特性分析中的应用[D].南京:东南大学, 2015.
[6] 孙立华, 胡牧, 孟庆强,等. 配网线损大数据高性能计算解决方案[J].计算机与现代化, 2016(12):42-46.
[7] Qiu R,Antonik P.Big Data and Smart Grid:A Random Matrix[M].John Wiley and Sons,2014:33-60.
[8] 夏友斌, 俞鹏, 苏志朋. 基于数据中心的配网故障研判方案[J].科技经济导刊, 2016(7):39.
[9] Oracle Utilities.Utilities and Big Data:A Seismic Shift is Beginning[R].An Oracle Utilities White Paper.
[10] 张东霞, 苗新, 刘丽平,等. 智能电网大数据技术发展研究[J].中国电机工程学报, 2015(1):2-12.
[11] 康春红, 谢育新. 供电可靠性实时计算及预控管理系统的开发与应用[J].广西电力, 2011, 34(5):57-59.
[12] Wu Xindong,Zhu Xingquan,Wu Gongqing,et al.Datamining with Big Data[J].IEEE Transactions on Knowledg eand Data Engineering,2014,26(1):97-107.