孙 芊,马建伟,李 强,杨 磊
(1.国网河南省电力公司电力科学研究院,郑州 450052;2.河南恩湃高科集团有限公司,郑州 450000)
目前,我国处于城镇化和城市快速发展时期,城市作为区域经济社会中心,正面临诸如能源紧张、环境污染等问题,建设智慧城市并提高信息化水平,成为解决以上问题的重要手段之一[1]。
电力作为城市的重要基础,随着智能电网建设全面开展,大量智能电网技术应用于城市各个领域,智能电网成为智慧城市建设不可或缺的部分[2]。随着电力信息化的推进,覆盖了从发电到用电的量测与分析系统规模化应用,积累了多源、海量、异构的数据,可广泛应用于电网运行、客户服务、设备管理等多个领域。文献[3-5]在大数据理念框架下,阐述了智能电网数据的特征,以及在电网安全评估、负荷预测等领域的应用技术和前景。在电网运行安全可靠方面,文献[6]阐述了基于多信息源的电压安全过程预警及防控系统功能框架结构。文献[7]设计了基于MapReduce并行编程模型的改进模糊K-means聚类方法,以此为基础提出了一种中长期负荷预测新方法。文献[8]采用聚类分析的方法对重要客户供电安全潜在风险进行分析。文献[9]基于高级量测体系提供的精准用电侧数据,提出一种精确计算与分析低压配电网线损的方法。在营销优质服务和客户管理方面,文献[10-11]通过分析各类智能表记数据,开展电力用户分类,评估用电行为特点及敏感因素(如价格、可靠性等),有助于开展差异化服务。在电网与设备状态检测与评估管理方面,文献[12-14]利用设备状态监测数据(在线监测、带电检测等),分别基于时间序列分析、遗传规划算法和分类算法提出输变电设备状态异常检测方法,解决传统阈值判定难以准确检测状态异常的问题。
综合国内外的研究文献可知,通过挖掘电力数据的潜在价值,能够提升电网运行和管理的精益化水平,有效保障智慧城市电力安全供给。但电力数据挖掘对智慧城市的支撑作用不局限保障电能的供应,已延伸至环境(如电能替代、新能源发电等)[15]、交通(如电动汽车运营等)[16]、居民生活(如电力光纤到户、智能小区等)等各领域,为服务智慧城市多领域建设主体(政府、用户等)提供了可能,但目前支撑度相对较弱。考虑智慧城市更加强调城市整体的精细管理、绿色环保、协同高效和服务便捷,智能电网发展由服务电力系统向系统外多行业、多主体延伸,电力数据结合气象、地理等电力系统外部数据的融合分析,成为智能电网乃至智慧城市发展的主要方向之一。
本文从智慧城市理念出发,在充分分析智慧城市建设主体需求和电力数据现状的基础上,明确智慧城市对电力数据挖掘的整体需求,强调挖掘面向智慧城市的电力数据潜在价值,阐述电力数据挖掘支撑智慧城市的多个应用场景,并对用电行为分析、负荷需求流向分析、区域成熟度评估3个应用案例进行深入分析,探索和推动电力数据挖掘在智慧城市中的应用。
智慧城市是城市可持续发展需求与新一代信息技术应用相结合的产物,由于视角不同,国内外各研究机构对智慧城市概念的诠释尚未统一[17-19],但仍有如下相同之处。
(1)智慧城市是一项系统工程,包括交通、能源、环保、应急、金融等多个行业领域,但智慧城市并非简单的堆砌,而是系统性的融合,强调跨业务、跨平台的协同。
(2)智慧城市强调将城市中基础设施与信息化相结合,全面感知城市运行情况,实现基础设施智能化、城市管理精细化、公共服务便捷化和生活环境宜居化。
智慧城市的高效运转,电力是基础。以智能电网为基础构建智慧城市是智慧城市发展的一个重要方向,智能电网在保障城市用电安全的基础上,能够促进城市绿色发展、丰富城市服务内涵等。依托智能电网构建的通信信息平台,积累并挖掘高附加值的电力数据,成为实现电力基础设施与信息化结合、跨业务协同的有效手段。
随智能电网发展,电力公司建立多个业务信息化系统,形成了大量良好的数据资源,大致可分为生产、营销、管理3大类,包括直接采集监测的原生数据和经处理的衍生数据,同时也积累了电力系统外部数据,如区域经济发展状况、气象预报、空间地理信息等。省级电网部分数据资源如表1所示。
表1 省级电网部分数据资源Tab.1 Part of provincial grid data resource
电力数据呈现多源、异构、海量、高附加值的特点,具体如下:
(1)数据来源方面,电力数据来自多个业务系统,采用分散放置、分布式管理模式,分析挖掘前需进行业务贯通及数据融合;
(2)数据结构方面,除传统的运行数据、设备及客户台账等结构化数据外,还包括输变电状态监测中的视频图像、状态检修的红外成像、电力气象云图、客服语音等非结构化数据;
(3)数据规模方面,省级电网运维近3 000座变电站、2万余条10 kV配电线路,50万余台配电变压器以及近4 000万低压用户,其产生数据量巨大,并且数据增量较大,以省级电网数据采集与监视控制系统、用电信息采集系统为例,数据日增量分别可达到10 GB/d和3 GB/d;
(4)数据价值方面,电力数据蕴含高附加值,除为电网自身提供支撑外,可面向居民、企业用户等多方主体提供增值服务,增强智能电网建设的体验感,全方位支撑智慧城市建设。
数据挖掘是从海量数据中发现潜在价值信息的过程,其方法主要有分类分析、关联分析、聚类分析等。面对高附加值的电力数据,通过多源数据挖掘将电力领域与城市其他领域信息相结合,利用数据的冗余性和互补性,可揭示综合性、跨行业的未知知识,对智慧城市多个领域进行感知与辅助决策[20-21]。例如:利用气象信息与输变电状态检测信息融合挖掘,建立输电线路舞动预警模型,支撑城市防灾减灾与应急管理;利用电动汽车充换电信息,优化城市电动汽车充电站(桩)规划布点;通过企业、居民精细化用电分析,评估能耗水平及高耗能环节,降低城市碳排放水平。
面向智慧城市的电力数据挖掘应用包括城市绿色发展、能源安全供给、公共服务便捷等方面,结合智慧城市建设参与主体不同,服务对象除电网公司外,更强调服务政府与用户。各服务对象对电力数据挖掘的需求如表2所示,满足以上需求需要综合电力系统内外的多源数据。
表2 面向智慧城市的电力数据挖掘应用需求Tab.2 Requirements of power data mining application for smart city
2.2.1 服务电网公司
(1)基于电力负荷密度与地理空间信息,优化城市电网规划,使变电站、配电变压器等基础设施深入负荷中心。结合电动汽车充换电时间、时长及充电量等信息,合理规划充换电设施,匹配城市功能区与交通布局。
(2)基于配电网运行信息,开展线路重过载分析,短期结合负荷预测开展运行方式优化,长期结合配电网建设改造工程,开展网架优化,降低运行风险。融合电力气象信息,建立强对流天气与线路舞动预警分析,提高电网防灾减灾能力。
(3)基于配电自动化故障信息,融合客户报修、用电信息采集,开展非健全信息的故障精确定位,研判主干线、分支线、配变、用户内部等多类型故障,并结合故障抢修人员、车辆等基础信息,开展配电抢修指挥管理。
(4)结合气象信息,开展风光等分布式能源发电预测,通过分析新能源发电特性,合理配置储能、可调负荷等,开展多源协调优化,最大化消纳绿色能源。
2.2.2 服务政府
(1)依托电力需求侧管理平台,通过对行业或地域电力消费数据分析,全面掌握各行业、区域的电能消耗水平。
(2)根据社会全口径用电量与客户台账信息关联分析,评估城市总体功能布局。依据电力消费与居民生活紧密耦合的特点,通过电量不同时段分布、电量增速以及“零”电量比例等要素,评估城市区域的成熟度水平,优化城市基础设施布局。通过电量异常突变,开展城市人口、房屋群租等精细化管理。
(3)充分发挥电力作为宏观经济的重要“晴雨表”这一特点,结合行业、区域电量数据、GDP等,分析区域经济发展趋势、行业景气情况、区域产业布局优化等。
(4)依据工商业、居民电量及时间分布特点,为制定分时电价、阶梯电价、电动汽车充电电价等提供辅助决策。分析新能源发电数据,为新能源发电补贴、光伏扶贫等新能源相关扶持政策制定提供依据。
2.2.3 服务用户
(1)依托智能园区的设备级能效监测终端,辅以用电信息采集数据、客户台账信息等,开展精细化能效分析,辨识高耗能环节,为节能改造提供数据支撑,为节能量核定提供依据。针对居民用户,分析用户用电行为,结合电价信息,为用户提供合理的用电建议。
(2)结合用户负荷曲线,利用聚类分析,评估用户负荷可调空间,使用户在生产影响最小的前提下,积极参与电网“网-荷”互动。
(3)基于电能质量数据,开展电能质量治理提升,提供优质电力定制服务。分析用户缴费习惯,构建多渠道便捷缴费。
传统有序用电方法未充分考虑用户的用电行为,可能对电力用户造成一定的经济损失。开展工业用户用电行为分析,能够辨识典型用电行为模式,评估负荷可调整空间,服务需求响应方案制定,实现电网、用户多方共赢。通过聚类分析方法形成用户典型负荷曲线,每条负荷曲线都能代表用户某种用电模式,充分体现用户在不同时间节点中用电行为的差异性。
用电行为分析以日负荷时间分布为特征向量。考虑到需求响应往往在负荷高峰时段,为了将高峰时段具有最接近用电特性的模式划分到一类,对负荷数据进行加权处理,设定负荷曲线高峰时段各点的权重为3(08:00—12:00、17:00—21:00),其他时段的权重仍为1。
选取二次聚类法对用户用电特性进行分类,即一次聚类采用系统聚类法对用电特性进行分类;二次聚类采用模糊C均值法,聚类中心由一次系统聚类结果提供,既可避免模糊C均值聚类法对初始参数的敏感性,又能取得分类准确客观的聚类效果。
以某食品加工企业2014年11月―2015年2月每日48点负荷数据为例,负荷聚类结果和企业负荷分类对比如图1和图2所示,其中横坐标为时间节点(时间间隔为30 min),纵坐标为负荷量(kW)。
从图2可以看出,该企业平时用电模式较为规律,负荷整体波动不大,属于连续生产企业。从分类情况可以看出,前3类负荷曲线的形态类似,且用电负荷均衡稳定,第4类较特殊,负荷整体较小,属于减产的情况。考虑食品加工行业一般为生产设备多,单机容量小,基本生产用电比例大,生产工艺连续性不强的行业。对比模式1和模式2可得电网负荷高峰时,可以通过部分生产设备关停等措施降下1 000 kW的负荷量,对比模式1和模式4,进一步关停设备可以有4 000 kW的负荷余量,该企业的最大柔性负荷在约4 000 kW。综上所述,基于激励的需求响应措施适合此企业用户。
图1 负荷聚类结果F i g.1 Results of load clustering
图2 企业负荷分类对比Fig.2 Comparison of enterprise’s loads
负荷与城市区域经济社会活跃度高度匹配,通过分析一定时间段各区域用电情况,动态可视化用电负荷,结合地理信息系统GIS(geographic informa⁃tion system)信息,可分析负荷峰谷空间分布及峰值迁移趋势,客观反映人口、经济等社会活跃度,服务城市功能区布局、交通等基础设施规划。
考虑配电变压器一般供电半径为150~250 m,信息采集时间间隔为15 min,选取配电变压器运行数据进行负荷需求分析具有较高的时空分辨率。具体分析流程如下。
1)克里格插值计算
考虑配电变压器空间上离散分布,采用克里格插值计算,将离散分布的配电变压器数据空间连续化,并根据负荷大小进行拓扑着色,以某城区配电变压器为例,如图3所示,随负荷增长颜色由浅至深变化。
图3 某城区18:00、20:00、22:00负荷分布Fig.3 Urban load distribution at 18,20,and 22 o'clock
2)峰谷计算
由负荷值及地理位置形成三维数据矩阵,可视化为三维曲面,三维曲面z=F(x,y)峰谷点的充分必要条件为
此时z的峰谷对应点分别为三维数据中行、列曲线对应波峰、波谷的叠加。因此将行、列矩阵看作二维曲线按二维波峰谷算法得出行矩阵和列矩阵。对行列矩阵进行叠加,其中最大值对应坐标为曲峰位置,最小值对应坐标对应曲谷位置。
3)筛选流向
在平滑曲面中一个点最大梯度是其对应的最大方向偏导,将其简化为8个方向的偏导,按照上述梯度简化原则计算出整体的流向矩阵。
对区域负荷曲面中峰、谷点两两组成若干条有向线段,需对每个由峰、谷点组成的有向线段上的所有经过点做一致性匹配,其匹配原则可表示为
式中:α为有向线段的角度;β为有向线段上各点的最大梯度流向角度。
当有向线段上的所有点均满足以上原则,则该有向线段为需求流向。GIS背景下某城区18:00—20:00的需求流向如图4所示。
图4 某城区18:00—20:00时负荷需求流向Fig.4 Urban load demand flow during 18:00—20:00
由图4可知,18:00较大的负荷峰值中心主要有3个区域,对比城市功能区分布,这3个负荷中心区域均属于商业区,包含诸多餐馆、商场、超市等。18:00—20:00的负荷需求流向指向区域均为居民小区聚集区域,20:00为该区域一天中的用电高峰时段。由此可为该城区商业、居住功能区布局及电力设施深入负荷中心提供直观依据,同时对负荷需求流向路径周边的交通疏导、公共交通基础设施布局优化及运营能力临时调整提供辅助决策依据。
城市基础设施布局以需求为导向,但统计方式进行城市成熟分析具有一定的滞后性,从而导致城市基础设施布局与需求不匹配,而电力数据与居民生活息息相关且具有高时效性。以居民小区为对象,分析小区用电量水平,结合周边商业、医疗卫生、教育等设施信息,可建立区域成熟度评价体系,区域可为居民小区,也可为城市居住片区。
以某市2 000户居民周用电量为对象,以时间分布为特征向量,聚类分析形成5个用户用电类型,如图5所示。
图5 用户典型周用电量分类Fig.5 Classification of user’s typical weekly electricity consumption
由图5可知,不同用电类型可代表不同用户群体,例如类型1整体用电水平较低且整周无太大波动,此类用户应属于空置房屋;类型2、3、4的周末用电量明显,应属于上班族群体,属于人均用电水平的代表;类型5用户群体,电量较大,可视为高收入人群。以上结果辅以人口等信息可更深入地对用户群体分类。
成熟度评估以5类用户群体占比、区域电量、区域2公里辐射范围内超市、公交、医院数量为指标,建立9个维度的成熟度评估体系,并采用层次分析法确定指标权重,如表3所示。
表3 成熟度评价指标权重Tab.3 Weights of maturity evaluation indexes
考虑城市发展差异化,成熟度评估需以城市整体为对象评估标准,以某市为例,根据位置、年限等要素,选取20个典型居民小区,分别评价求均值形成评价参考值。同时以小区A、小区B为例对比分析,如表4所示。
表4 小区成熟度评价参考值及典型小区评价结果Tab.4 Community maturity reference values and typical community evaluation results
由图6可知,相对于样本区域平均值,小区A电量大,类型1的用户少,入住水平高,基础设施完善,在多个维度高于全市平均水平,属于较完善的成熟小区;小区B电量小,类型1的用户较多,空置比例高,商业及医疗配套基础设施欠缺,有针对性地优化基础设施布点。
图6 典型小区评价雷达图Fig.6 Typical community evaluation radar chart
电力是智慧城市建设的基础和保障,挖掘电力数据的潜在价值可为智慧城市在诸如规划管理、应急管理等多个领域提供决策依据,应用前景广阔。本文归纳了电力数据挖掘的应用需求与典型场景,从城市需求侧管理、城市规划角度,进行用电行为分析、负荷需求流向分析、区域成熟度评估3个应用案例的论述,阐明利用多源、海量、异构、高附加值的电力数据,能够有效支撑智慧城市的城市运行、宏观经济预测、公共服务等方面建设。同时,为最大化发挥面向智慧城市的数据挖掘效益,仍面临数据孤岛与藩篱、缺乏应用等问题,有待进一步深入探索。