王喜宾,文俊浩,廖 臣,赵瑞锋
(1. 贵州理工学院 大数据学院, 贵阳 550003;2. 重庆大学 大数据与软件学院, 重庆 401331;3. 贵州电网公司 信息中心, 贵阳 550005;4. 广东电网公司 电力调度控制中心, 广州 510600)
传统电力系统采用垂直一体化结构,严重依赖化石燃料。随着全球能源短缺、气候变化等问题日益严重,21世纪初提出“智能电网”的概念[1],并在全球范围得到快速发展。根据美国国家能源技术实验室定义[2],智能电网具备一系列关键特征:健壮性与自愈性、低排放、新能源的广泛接入、需求侧的主动响应、运行方式市场化等。中国于2009年制定“坚强智能电网”战略计划[3],发展智能电网技术。近年来,随着通信与计算技术在电网中不断深入,电网中的物理设施与信息设施不断耦合,“能源互联网”的概念被提出[4-5]。能源互联网具有不同能源网络的互联、“即插即用”式能源资源的普及等特性,是对智能电网发展方向的深化与延伸。
当前,随着电网中信息技术的不断渗透,面向终端用户的电力服务已开始向电子商务模式转变。例如:美国德克萨斯州建立了“Power Choose”电力零售套餐销售平台[9],用户可以通过平台浏览、订购由不同电力零售公司提供的上千种电力零售套餐。中国的各级电力公司也开发了许多应用程序,使终端用户可以实时跟踪用电情况。在技术发展趋势下,如何协助用户过滤信息,向用户有效推荐面向能源的产品/服务/建议方案,对提高需求侧的能源效率和优化配网系统运行具有重要作用。在计算机科学与电子商务领域,个性化推荐技术为帮助用户进行商品/服务/信息过滤提供一种有力工具。过去,个性化推荐系统(PRS, personalized recommendation system)已被广泛研究和应用,并向用户推荐不同的产品/服务,例如:网页、好友、商品等[10-12]。
随着电力服务信息化加速以及计算与通信技术在电网中不断渗透,个性化推荐技术在智能电网领域有着巨大的应用前景。电网用户可通过个性化推荐技术进行信息过滤,选择与能源相关的产品、服务等。如图1所示描述了个性化推荐技术在未来电网需求侧中的应用前景。
图1 智能电网需求侧中应用个性化推荐技术的前景展望Fig. 1 Prospect of applying personalized recommendation technology in demand side of smart grid
电力需求侧管理是现代电力系统在电力市场条件下产生的用电管理模式,通过提高终端用电效率和优化用电方式,在完成相同用电功能同时减少电力功率和电量消耗,实现低成本电力服务,达到节约能源和保护环境目的。突破了传统的电力管理模式,改变依靠单纯扩大供应能力满足日益增长的电力需要方式,在更高层次上处理供应侧和需求侧关系[13]。此外,先进的计量、通信和控制手段对智能电网中需求侧项目管理起到关键的作用[14]。
一般地,需求侧技术(DSM, demand side management)可分为两类:直接负荷控制(DLC, direct load control)与间接负荷控制(IDLC, indirect load control)。在传统的直接负荷技术中,电网通过远程控制器直接控制终端用户的电力资源(如电器设备和电动汽车充电桩等)来调整负荷曲线,以支持不同电网级应用,例如:削峰填谷、频率/电压调节等。作为负荷控制补偿,电网通常会对用户提供一定的补贴和奖励。因此,这一类型的直接负荷控制技术被称为基于激励的需求侧管理技术。近年来,作为一种新型的直接负荷控制技术,家庭能量管理系统(HEMS, home energy management system)[15-17]也受到许多关注。家庭能量管理系统作为一种用户侧决策支持系统,通过自动控制设备控制居民建筑内用电设备的开停与设置,以优化用户住宅的能耗和降低用户用电成本为主要考量,兼顾电网的运行指标。
间接负荷控制主要基于电价信号,由电力公司设置可变电价信号,激励终端用户积极调整家电使用方式,调整负荷曲线,优化电网运行。例如:在价格差异的驱动下,用户可以选择在低负荷期使用更多的电器,从而降低电网高峰负荷。常见的可变电价方案包括:实时电价和峰谷分时电价等。
个性化推荐技术[16-17]可以分为基于内容的推荐和基于协同过滤的推荐两类。基于内容的推荐根据项目内容与用户偏好间的相关性,向用户生成推荐。该方法通常需要建立用户特征,包括:用户的偏好和需求等;同时,生成项目配置文件来表示项目特征。用户特征可以显式生成或隐式从用户的历史行为模式中获取。项目配置文件通常用关键词向量表示,通过计算用户特征和项目配置文件的相似度,向用户推荐项目。
与基于内容的推荐不同,基于协同过滤的推荐是根据用户间兴趣相似度,运用一定的算法寻找与目标用户最为相似的N个“同伴”,然后根据这N个“同伴”对其他项目的评价来预测目标用户对该项目的喜好程度。一般协同过滤推荐又可以分为基于内存(memory based)的协同过滤和基于模型(model based)的协同过滤两类[18]。前者主要采用启发式算法直接从用户的历史数据中寻找相似推荐项目;后者则利用其他用户的历史数据训练一个推荐模型,然后利用该模型预测目标用户关于项目喜好程度的评分。近年来,为了克服这两种算法各自缺点,学界结合两者优点提出了混合推荐方法[19]。
先进量测技术和双向通信基础设施是个性化推荐在电网中成功实施的基础。通过先进量测基础设施和负荷监测技术,电网可以获取用户的能耗信息;双向通信基础设施可以实现用户与电力公司间信息共享。同时,由于电网终端用户数量庞大,高性能计算技术则为需求侧大数据的高效、安全和快速处理提供支持。
先进量测设施(AMI, advanced metering infrastructure)在智能电网中至关重要。它是智能电表、通信网络和数据管理系统的集成,可实现电网和用户间双向通信。用户端通信设备包括:家庭显示器、家庭区域网络、能源管理系统和其他支持智能电网功能的客户端设备。
先进量测设施可以向电网提供精确的住宅能耗数据。根据量测数据,电网运行人员可分析住宅能耗特征(如日能耗、季节能耗特征和峰值负荷等),并设计合理运营策略。例如:根据AMI采集的数据,电力公司可以进行负荷预测,制定零售电价定价策略、电网规划、开发新型能量管理系统等。
智能电表采集的能耗数据通常是住宅级的聚合能耗数据。负荷监测技术旨在监测和识别住户中各个家用电器的使用情况(如开/关状态和功率波形等),它使电网能更精确分析用户的用电行为模式。在实现手段上,负荷监测技术可以分为侵入式和非侵入式监测技术两类。
侵入式负荷监测技术通过在住宅用电器上安装传感器来记录其使用情况。这种直接测量方法与物联网技术相关,可以准确监测电器的状态和能耗,但安装过程较繁琐,且传感器的购置成本也不容忽视。1992年,Hart[20]提出非侵入式电器负荷监测技术(NILM, non-intrusive appliance load monitoring),其思想为负荷分解,即将电表采集的用户总负荷数据分解为各电器的用电数据[21-22]。自NILM技术被提出以来,先后开发出多种不同的NILM方法,如:稀疏编码方法[23]、隐马尔可夫模型[24]、深度学习方法[25]等。
智能电网的终端用户数量非常庞大,因此电网中的推荐系统需要高效处理相关大数据,而计算技术的发展为此提供了强有力的工具。云计算作为一种新的计算范式,被认为是下一代能源系统的信息基础设施[26-27]。云计算以数据中心为支撑,可以为电网的分析与计算提供多层次、弹性的服务。许多公有云平台(如Amazon EC2,Microsoft Azure等)可用于承载各种计算密集型和数据密集型的智能电网应用。此外,不同的电网参与者(如电力公司、零售商等)也可以建立自己的私有云平台,为智能电网应用提供数据中心级的网络服务。
在应用开发层,已经有许多可用的工具和框架促进高性能的数据处理。如:Apache Storm[28]提供强大的计算框架捕获和处理智能电网的实时数据流;Apache Spark[29]提供高性能的编程框架,有效处理基于底层计算机集群的大数据。这些开发工具可以高效采集需求侧的实时用电数据,集成到系统工作流加以分析和处理(如用户相似度分析、推荐生成等),从而为智能电网推荐系统的开发提供支持。
作为一种数据驱动的专家系统,需求侧推荐系统的核心在于收集需求侧的各类数据,并在此基础上进行分析。物联网技术为实现这一目标提供了基础服务。物联网(IoT, internet of things)[30]是指借助传感设施,包括:在各类物体上的电子标签(RFID, radio frequency identification)、红外感应器、全球定位系统(GPS, global positioning system)和二维码等设备,通过接口与无线网络相连,实现人与物体,物体与物体的沟通和对话,进行数据与信息的交换和通信,实现对物品的识别、定位、跟踪、监控、管理等一系列智能化活动[31]。目前,物联网技术已成功应用于工业、农业、教育、医疗和交通等诸多领域。其中,智能电网也是物联网的一个典型应用领域。基于传感器的负荷监测技术,以及智能电表、PMU等,都属于物联网在电网中的应用。通过应用物联网技术,推荐系统可以精确收集需求侧的各类数据,包括:用户用电数据、电网实时数据和环境气象数据等,为用户提供面向能源的个性化推荐服务。
伴随物联网而兴起的边缘计算技术(EC, edge computing)[32],作为一种分散式运算架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘计算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。在电网需求侧中,将海量的需求侧数据存放在集中式存储设备或是云端,并不现实。因此,可利用边缘计算技术,对数据首先进行分布式处理,然后再由推荐系统进行集中分析。
智能电网涉及海量终端用户,在设计智能电网推荐系统时,系统需要通过双向通信基础设施实现对用户信息的访问,其中最基本的要求就是确保用户数据的私密性、安全性和完整性。
智能电网采用的通信基础设施也被其他工业系统所采用,为电网应用提供安全的通信环境[33]。智能电网的无线通信可以采用802.11i和802.16e等标准实现;有线通信可以采用防火墙、VPN、IPSec等技术实现。一些密钥和可信通信方案,如:公密钥基础设施(PKI, public-key infrastructure),可以为智能电网推荐系统中涉及到的通信提供加密保护。还有一些新兴的安全协同计算技术,可以为不同智能电网参与者之间的安全信息共享提供支持。例如:同态加密技术[34]允许加密数据由某些特定运算符(加法、乘法等)处理,使其结果与处理普通数据的结果相同。基于同态加密技术的安全多方计算技术(SMC, secure multi-party computation)[35]解决一组互不信任的参与方之间保护隐私的协同计算问题,为数据所有方及数据需求方提供不泄露原始数据前提下的多方协同计算能力。采用SMC技术[36],可以使智能电网推荐系统在不暴露用户隐私数据的情况下,对用户数据进行聚合分析(如用户用电相似度分析、用户用电行为聚类等),从而安全有效地生成推荐方案。
通过从需求侧数据中提取知识,个性化推荐技术在智能电网中具有巨大应用前景。
3.1.1 基于负荷监测和内容推荐技术的节能家电推荐系统
家用电器的能耗等级对终端用户的用电成本和配网系统的负荷有直接影响。对于给定类型的电器,不同型号有不同能耗。鼓励用户使用节能电器,一方面可降低用户用电成本,提高家庭用电效率;也可以降低配网负荷,减少电网扩建成本。文献[37]提出一种基于非侵入式负荷监测技术和内容匹配推荐技术的居民用户节能家电推荐系统。该系统首先利用电表监测家庭的总能耗数据,然后用非侵入式负荷监测技术将电表数据进行分解,并识别用户的单个家电使用轨迹。利用非侵入式负荷监测技术得到的结果,推荐系统提取出电器使用特征(如最常使用的电器、日耗电量最多的电器、累积使用时间最长的电器等),然后将这些特征与用户关于节能型电器的兴趣数据存储到一个知识库中。对于每个目标用户,推荐系统使用一个基于规则的选择器,根据用户对典型电器的使用特征来决定向用户推荐的家电类别。随后,推荐系统采用基于内容的推荐算法和用户关于节能电器的兴趣数据,与节能电器广告数据库中的数据进行匹配,筛选出用户可能最感兴趣的节能电器型号,并向目标用户推荐相关电器设备。
3.1.2 基于协同过滤技术的电力零售套餐推荐系统
在如美国德州电力零售市场这样成熟的零售市场体制中,电力用户需要从多个零售商发布的大量电力零售套餐中选购合适的套餐。文献[38]提出一个基于协同过滤推荐技术的电力零售套餐推荐系统,用在一个成熟的零售市场体系中向用户推荐个性化电力零售套餐。该系统通过电表收集大量用户的住宅用电数据以及用户订购零售套餐的历史纪录,并存入到一个用户知识库中。对于每个用户,推荐系统提取用户的家庭用电特征,包括:月平均电费、工作日日均用电量和非工作日日均用电量等。同时设计了零售套餐评分策略来隐式推测和评价用户对每个零售套餐的偏好程度。在此基础上,对于每个目标用户,系统根据提取的用户用电特征,计算与其他每个用户的用电相似度,对相似用户的零售套餐偏好数据进行加权聚合,估计目标用户对每个零售套餐的偏好程度,最终将偏好分值最高的前n个零售套餐推荐给目标用户。
3.2.1 家庭用电行为推荐系统
需求侧响应已成为当代电力系统运行中一个重要方面。通过可变电价激励,使用户主动调整其用电行为,在降低用户电费开销同时配合电网完成电网负荷的削峰填谷。目前,世界上大多数国家实现了分时电价,部分国家开始实施实时电价和尖峰电价。用户对可变电价的响应率在很大程度上依赖于其主观意愿。目前仍有大量用户缺乏需求侧响应意识,对可变电价响应迟缓,在发展中国家尤为明显。笔者提出一种家庭用电行为推荐系统的概念原型(如图2所示),旨在从大量用户中学习用电行为经验,推荐给目标用户,对用户的用电行为提供建议,引导和提高用户的需求侧响应意识。
图2 家庭用电行为推荐系统的概念模型Fig. 2 Conceptual model of household electricity behavior recommendation system
通过量测设备和负荷监测技术,收集用户的家用电器能耗数据。推荐系统将家用电器分为两类:不可转移与可转移电器。不可转移电器是指与用户的日常生活方式紧密相关,用户不会根据电价信号来调整其使用的电器,例如:电脑、电视、抽油烟机、音响等。可转移电器是指用户通常有意愿根据电价信号来调整其运行时间的电器,例如:洗衣机、洗碗机、干衣机等。同时,推荐系统采用机器学习方法,将用户分为“高响应度用户”与“低响应度用户”两类。对于每个低响应度用户,即目标用户,推荐系统首先分析其不可转移家电的使用轨迹,来学习其生活方式。推荐系统进行生活方式相似度计算;在高响应度用户群体中筛选出与目标用户具有相似生活方式的用户。基于此,推荐系统对相似度高的响应用户的可转移家电使用经验进行加权聚合,过滤出最适合目标用户生活方式的可转移家电节能使用方案,并推荐给目标用户。
3.2.2 分时电价计划推荐系统
中国正处于电力系统市场化的改革期,电力零售市场对促进配电侧的电能经济具有重要作用。如文献[36]所述,在足够成熟的电力零售市场中,将出现大量的独立电力零售商,各自发布不同的电力零售套餐。当前最广泛采用的零售定价为分时电价(time-of-use pricing),其定价结构通常分为2段式或3段式。随着电力市场改革的深入,未来将出现更复杂、多段式的分时电价结构。在此背景下,用户如何选择合适的分时电价计划,将是典型的信息过滤问题。因此,设计合适的个性化推荐系统,为用户推荐适合其用电行为的分时电价计划,具有现实意义。
在进行分时电价计划推荐时,最基本的问题是:如何评估用户在选用了某个分时电价后,用电行为的转移方式。即对于分时电价a,用户在选用了它之后有多大程度会按照a的电价结构调整其用电方式。协同过滤技术为这一问题提供了可行途径。提出分时电价计划个性化推荐系统,该系统通过对与目标用户具有相似生活习惯的同类用户分时电价计划选择经验进行学习,向目标用户推荐合适的分时电价计划。推荐系统的概念模型如图3所示。系统通过量测基础设施采集多个用户的电器级用电数据,并存放在云端的用户知识库中。对于每个用户,系统通过机器学习算法从用户的用电数据中学习其生活方式,并生成相应的生活方式配置文件(profile)。对于特定目标用户,系统通过生活方式相似度计算,得到数据库中每个用户与目标用户的生活方式相似度。
图3 分时电价计划个性化推荐系统的概念模型Fig. 3 Conceptual model of the personalized recommendation system for time-of-use electricity price plan
然后,对于数据库中的每个用户,系统评估对市场中每个分时电价套餐的偏好程度。用户对某个给定分时电价计划的偏好评分由2部分构成:选择倾向与成本效益。选择倾向因素是指仅有目前被该用户使用的分时电价计划被赋值分值,其他的电价计划均被赋值为0分;成本效益是指将该分时电价计划应用到该用户的用电行为后,所产生的电费开支。综合2个因素,对于数据库中的用户u,关于分时电价计划i的偏好程度可根据式(1)计算得到。
(1)
式中:ru,i为所估计的用户u关于分时电价计划i的偏好程度值;Su,i为用户u关于分时电价计划i的选择倾向值;Cu,i为分时电价计划i对用户u的成本效益值;k为权重因子。根据式(1)计算出的结果,再结合计算出的每个用户与目标用户的生活方式相似度,则可根据式(2)进行加权聚合,预测出目标用户(记为v)对每个分时电价计划的偏好程度。最后,根据预测的偏好程度从高到低排序,将最有最高偏好评分值的前n个分时电价计划推荐给目标用户。
(2)
式中:rv,i为所预测的目标用户v对于分时电价计划i的兴趣度值;U为用户集合;sim(u,v)为目标用户v与用户n的相似度;η为正则化因子。
3.2.3 居民侧新能源电源购置推荐系统
随着分布式发电的日益普及,在居民侧安装新能源电源(如楼宇屋顶太阳能板、小容量风机等)已成为大势所趋。从用户侧来说,居民侧新能源电源可以提高终端用户侧的能源效率,节省用户购电成本,并在停电时为用户提供电源支持;从电网角度来说,分布式新能源的广泛部署能有效减少网损,节省电网建设成本。而新能源电源的购置成本及其带来的长期回报,是许多用户首要考虑的因素。笔者提出一种面向终端用户的新能源购置系统,概念模型如图4所示。
图4 居民侧新能源电源个性化推荐系统的概念模型Fig. 4 Conceptual model of the personalized recommendation system for new energy sources on the residential side
该推荐系统收集的数据有:
1)用户数据,主要包括:用户的基本信息(如家庭构成、职业、年龄等)、日用电曲线以及地理位置;
2)市场上不同新能源的电源信息,主要包括:品牌、容量、价格和效率等。推荐系统同时可访问第三方气象数据库,对用户所在位置的新能源资源进行评估。
对于每个未安装新能源电源的目标用户,系统评估其对市面上每款新能源电源产品的潜在兴趣度,然后向其推荐最感兴趣的产品。兴趣度计算由2个评价指标构成:1)长期收益;2)同类用户选择倾向。对于长期收益指标,推荐系统首先根据用户的地理位置,对其所在位置的新能源资源(如风速、风向、太阳能辐射强度、日照时间等)进行评估,然后对于每一个新能源电源产品,推荐系统根据其容量和发电效率,结合目标用户的日常用电曲线和电网零售电价,计算该产品给目标用户带来的年电费节省量。对于同类用户选择倾向指标,推荐系统计算目标用户与每个已选购该产品的用户的相似度。该相似度值包括3方面考量:1)用户基本信息相似性;2)用户新能源资源相似性;以及3)用户用电曲线相似性。最后,将这3个指标加权求和,得出目标用户对该产品的潜在兴趣度值。最后,推荐系统根据所计算得出的预测兴趣度值对所有产品进行排序,并将排在前n个的新能源产品推荐给目标用户。
3.2.4 更多智能电网推荐系统
在智能电网领域还可以开发更多的推荐系统。考虑电动汽车用户的需求以及配电网的条件和运行指标,为电动汽车用户推荐行驶路线。此外,智能电网中个性化推荐系统也不仅限于需求侧。结合预算、网络中已有的其他相关设备型号和容量、网络拓扑等因素,开发推荐系统,向电力公司推荐合适的电力电子设备和产品;或者开发推荐系统学习电网在极端天气下的早期预警经验,在相似的极端天气下,推荐适用于该目标电网的预警方案。
尽管在智能电网中运用个性化推荐技术具有巨大的潜力,但智能电网推荐系统的实际开发和部署中也面临着一些挑战。
个性化推荐系统本质上是一种数据驱动的决策支持系统,因此智能电网范畴下的推荐系统广泛依赖于传感基础设施采集的数据。目前,尽管AMI已广泛应用于许多发达国家,但在发展中国家AMI的普及依然十分有限。此外,对于某些传感设备,例如:相量测量单元(PMU, phasor measurement unit)等,由于投资成本高,部署也受到了一定的限制。因此,传感基础设施的有效部署直接决定着智能电网中个性化推荐系统的实际实现。
在现阶段,除了传感基础设施的普及,终端用户与电网之间实现细粒度的双向信息共享和协作还存在一些技术障碍。例如:随着电器数量的增加,NILM方法的计算成本通常会迅速增加,识别精度降低;对于SMC技术,虽然它被认为是在智能电网中建立安全协同环境的一个较好的解决方案,但也存在一些技术挑战。SMC目前只支持一部分的代数运算,对于复杂的代数运算不能实现同态加密;当协作者数量增加时,SMC将会导致巨大的计算开销。因此,关键技术改进有助于推荐技术应用到实际的电网中。
个性化推荐技术虽然得到了广泛应用,但也存在一些不可忽视的挑战,包括:
1)冷启动问题。这是一个普遍问题,当某些项目没有得到任何用户评价或者某些用户没有对任何项目做出评价时,系统无法推荐该项目或者预测该用户的偏好。
2)推荐的多样性和准确性困境。通常情况下,鼓励推荐项目的多样性,但是推荐一个用户不熟悉的项目可能会引起该用户的反感。
3)数据稀疏性问题。当系统的项目和用户数量特别庞大时,用户对项目的评价一般都非常稀少,难以找到相似用户集,大大影响了推荐系统的效率。
4)在使用集成/混合方法时,如何解决冲突问题。推荐涉及到丰富的元数据和用户数据,如何将这些数据组合起来是一个不小的挑战。
5)大数据环境。随着数据的爆炸性增长,时间和空间复杂度是推荐算法适应大数据环境的关键因素。
首先对个性化推荐技术在智能电网需求侧中的应用进行展望,介绍了支撑需求侧个性化推荐系统实际部署的一些关键技术,讨论需求侧推荐系统的概念模型,分析潜在的挑战。