卢 娜,王 辉,刘 浏
(1.上海电力大学经济与管理学院,上海 201600; 2.国网上海市电力公司市区供电公司,上海 200080)
我国对窃电行为的打击力度不断加强,主要体现在对窃电行为的惩处及对反窃电侦查技术的研发应用中。大数据分析技术的研发与应用可使窃电行为数据收集与整理更加便利、高效,降低了电力损耗,维护用电秩序,为用电安全提供有力支持。用电监察工作的开展强调及时发现、及时采取制止措施、及时予以严厉惩处,通过制定针对性较强的反窃电方案,实现维护用电秩序的目标。需以此为指导,有效开展技术研发,保证电力供应的质量及安全。
反窃电数据来源主要有高压线损数据、用户负荷数据及用电数据线路供电数据,公共配变影响可忽略不计。可将输电线路视作电力供应主动脉,将线路上分布的高压用户视作毛细血管,用户电流、电压及功率等数据的收集整理都可通过主动脉完成,达到数据跟踪、侦查的目的。如高压线损情况,可通过平台系统采集、整理主动脉高压线路线损数据并进行分析,效率高,可达到实时监测的目标。
基于大数据分析的精准反窃电实践可从以下几方面进行:
该模型与机器学习反窃电预警模型作用原理类似,但具体内容上有一定区别。机器学习模型中多变量预警模型如图1所示,重点在于变量条件设置。依据历史窃电用户所在区域、负荷容量大小及具体行业信息等构建数据模型、特征数据库等。基于大数据分析条件及人工智能算法,由营销、用电系统等提供数据支持,进行用电异常监测及线损相关性及异常事件关联等模块分析,将疑似窃电行为数据导出,传至相应数据库或反窃电监控系统中,进行比对,结合历史窃电用户相关数据确定疑似窃电行为的嫌疑等级及负荷数据,判断是否存在窃电行为。
图1 多变量预警模型Fig.1 Multivariate early warning model
低压预警模型如图2、图3所示,利用随机森林算法进行模型训练[1]。该算法的决策树自动生成,其决策树投票结果是判定是否为窃电行为的决定性条件。当发现判定结果有误时,需要调整决策树分支,在持续优化的情况下实现有效的反窃电侦查。运用交叉验证法检验模型是否有效,将模型查准率及查全率等作为具体的检验指标[2]。以随机森林模型参数为依据,调整、优化预警机制。如随机森林深度、决策树数量、单叶下最小样例数、叶子节点数量等参数条件。
图2 低压预警模型Fig.2 Low pressure warning model
图3 基于随机森林的特征提取流程Fig.3 Feature extraction process based on random forest
依据历史数据建立特征向量,实现窃电行为、正常用电行为差异化表征目标,以此为基础训练二分类机器学习模型,输出窃电嫌疑程度数据,判断某阶段、某用户用电行为是否为窃电行为等。
反窃电概率预警分析模型同样基于大数据分析技术,但更多利用建立的用户数据库分析各类用电数据之间的关系,利用逻辑回归算法、层次聚类分析算法等将目前用电数据曲线与用户历史用电轨迹进行对比,确定嫌疑目标。如在电力营销业务中,对各类用户用电数据进行多重分析、比对,将历史数据、窃电行为数据与常规用电数据等进行关联性及逻辑回归概率分析,由系统进行计量装置、各级线损在线监测等,自动筛选、定位窃电嫌疑行为,确定电力供应故障位置,智能诊断并分析异常情况,利用智能比对方法代替传统人工排查,可有效提升窃电概率预警效果及效率。主要流程为在线实时监测、筛选、分析、受理、反馈、改进等。
以上述模型建立为基础进一步构建反窃电智能监测平台,借助大数据分析技术与人工智能及万物互联等技术,实现人机交互,达到反窃电智能侦查目标。借助模型收集并整理相应的侦查数据,对窃电行为予以深入分析,当发现异常情况或疑似窃电行为时,利用监测系统智能预警功能发出预警信息[3]。依据反向分析原理,针对模型锁定的典型窃电案例进行特征数据收集及整理,形成典型案例特征数据库作用于整个监测系统,可有效提升窃电行为预测效果及智能监测平台的实用性。
全方位、全过程的营配稽查是在上述稽查管控体系基础上进行窃电行为侦查,需要大数据分析技术的支持,可实现全国范围内电力用户数据共享、用电行为智能分析等,更加全面地分析、比对用电行为,确定窃电行为嫌疑程度,保障用电行为的辨别效果[4]。在大数据分析技术、信息共享技术的支持下,结合专家经验自适应学习,从事前预防、事中管控、事后严惩等角度落实窃电侦查、预测、预警、约束、管控、惩处等工作,落实预防规则制定、业务执行流程制定与完善、约束性填报、用电监管规则库建立、电力营销实时在线监督、异常情况实时反馈、在线干预等工作,确保反窃电效果[5]。
构建科学评价、决策分析体系可对反窃电稽查工作的开展情况进行判断及效果评价。为进一步保证分析、评价体系的应用效果,应以稽查结果数据汇总、整理及分析结果为依据,开展日常评价、阶段性评价测试等工作[6]。将业务开展结果数据与业务执行标准、预期目标及工作计划等相结合,设置评价标准、评分规则,建立相应算法库,设置算法选择参数,依据系统需求自动、合理选择算法,分析、评价反窃电大数据服务平台系统功能与模块建立及实施情况。
建立稽查成效分析中心,依据稽查内容进行处理情况、历史稽查记录核查及场景信息比对,对稽查标签命中率、处理评价信息及嫌疑数等做比对,按照人员、嫌疑问题、行业单位、稽查场景等维度进行稽查结果分析,形成成效分析管理模式,为有效、合理展开稽查工作提供支持。
建立决策中心辅助模式,依据评价、成效分析结果建立电力营销业务规则分析评估机制及辅助决策机制,对评价普遍偏低的规则进行执行度偏低原因分析,对执行情况参差业务统一执行标准,结合营销数据、稽查需求对新型业务(无适应规则)制定规则[7],实现规则迭代、业务宣贯及执行管控等目标。
针对反窃电作业流程建立、装备信息采集、营销业务应用系统运行及移动作业终端等作业活动建立闭环式管理体系[8],根据窃电行为特征制定反窃电作业流程,将流程数据嵌入管理体系中,以指导展开反窃电作业活动。结合系统录入的电力供应设备型号标准及电流、电压使用数据等进一步排查电力异常情况,锁定嫌疑用户,将其纳入监控系统,对嫌疑用户进行实时、长效监测,判断其异常情况为偶然还是经常性,若为偶然,则可将其释放至常规监测中心,予以常态化监督管理;若为经常性,则应升级嫌疑等级,进一步进行数据分析,确定是否为窃电用户。将窃电数据移交至反窃电管理中心,作为反窃电执法的依据[9]。
结合预警分析模型、侦查体系及智能监测平台的建立,将各类稽查模式应用于窃电用户标签活动中,辅助建立用户行为属性系统,利用信息技术、互联网技术,与95598渠道及营业大厅联网,有效获取相应的服务数据、营销业务数据,对客户信息进行整理、分析,辅助判断用户用电行为的可靠性[10]。可与地方政府信用平台联网,将分析获得的用户数据同步于信用平台,督促用户改正错误行为,营造诚信用电环境。
以某市电力营销智慧数字稽查系统中2021年6月1日—2022年5月31日的窃电与非窃电用户数据为研究对象,选取600名用户,以用户电量应用数据为机器学习、随机森林模型的基础,按照2:1的比例设置训练集、测试集,将0值占总天数比例及空值占总天数比例、0值与空值占天比例对比数据、日用标准差、月用最小值、用电类别、电压等级等作为特征,构建特征数据库。运用逻辑回归计算模型,将最大迭代次数设置为200,正则化参数设置为0.01,计算窃电用户疑似程度,如表1所示。结果表明,最高疑似程度达到了75%。利用此方法对某地区973 749户电量数据进行测算,按照由高到低顺序排列,将概率超过65%的用户视为疑似,疑似用户数量达750户,占测算总用户数的0.077%,效率较高,现场排查范围缩小。对疑似用户下发稽查工单的同时做现场核查,确定其中有501户具有窃电行为,准确率达66.8%。
表1 疑似窃电用户清单Tab.1 List of suspected power thieves
将大数据分析技术应用于反窃电稽查行为中可提升稽查效率及精准度。在建立反窃电预警分析模型后,应针对具体反窃电侦查工作建立管控体系,有效落实各类工作。利用大数据分析结果进一步开展现场检查论证工作,综合评估各类因素的影响因子(如影响技术稽查结果的系统故障因素—联网设备性能、稳定性、参数设置等),确定结果的可靠程度。
在大数据分析技术的支持下,精准反窃电实践目标基本达成,但还需进一步提升技术的先进性(如用户信息数据库的建立、甄别嫌疑用户、常规用户特定数据库的建立等)。应在深入研发技术的基础上令目标群体数据收集更准确,反窃电行为稽查结果更精准。