文/袁丹 黄继明
随着社会经济发展对电力需求的日益增大,社会各界对供电可靠性的要求越来越高,用户对故障停电的容忍程度不断降低,配网抢修管理现状与用户日益增长的服务需求之间的矛盾日益突出。
传统配电网抢修模式主要依赖于用户电话报修,故障描述不清晰,故障报修不及时,同一故障点多个工单难以合并,影响抢修效率。随着经济社会发展,“被动式抢修”越来越难以适应技术进步和服务提升的需要,配电网抢修系统信息集成不足、模块化技术支撑不足、统调能力不足等问题日益凸显。
为此,从配电网专用和公用线路停电信号数量出发,运用大数据在线挖掘技术,能有效识别配电网线路的真实故障,建立一个能快速识别有效故障的研判模型,提升配电线路故障识别的及时性和准确性,为配网抢修指挥和故障报备提供实时数据支持,提高故障报备和用户通知工作的效率。
以2016年1月1日至2017年12月31日用电信息采集系统中配电变压器的停电信号数据为基础,登录用电信息采集系统,分别查询并且导出2016年1月1日至2017年12月31日的专用和公用配电变压器有效停电数据,所提取的字段信息包括:线路、户号、户名、终端停电时间、终端复电时间等。
表1:决策树训练结果表
表2:决策树模型测试结果表
从电网用电信息采集系统中导出2016年以来的专用和公用配电变压器有效停电数据,所提取的字段信息包括:线路、户号、户名、终端停电时间、终端复电时间等,对其中停电时长小于15分钟的信号进行剔除,并以5分钟为时间间隔分别整理出专、公配电停电信号数量作为自变量数据;
从PMS系统查中导出2016以来的配网检修计划信息,所提取的字段信息包括:工作日期、主线路名称、实际工作开始时间、实际工作结束时间、执行情况描述、电压等级等,根据PMS系统中相同时段的停电检修计划对自变量数据进行匹配和剔除;再次对95598工单中的故障和供电企业平时运行记录中的故障进行信息整理和合并作为故障因变量数据。
以2016年的公、专变停电信号数及故障记录作为训练数据,以2017年数据作为测试数据。数据处理后,2016年共有26898条数据,其中关联为故障的为1155条,而未关联为故障记录为25743条,从数据上看,样本的两类数据分布极为不平衡,这会导致类型分布的不平衡会严重影响模型的训练效果,本文采用上采样方法,复制稀有类的样本,将故障记录复制20次作为训练数据,最终训练数据中共有49998条记录,其中故障记录为24255,非故障记录为25743。
我们借助SPSS Modeler数据挖掘软件,运用决策树与BP神经网络分别对数据进行训练及测试,以公变和专变的停电信号数量为输入变量,是否故障为输出变量。
表3:神经网络模型训练结果表
表4:神经网络模型测试结果表
在SPSS Modeler软件中选用C4.5算法建模,使用误分类损失矩阵,其中把非故障识别成故障的惩罚系数为3,把故障识别成非故障惩罚系数为1,这是由于系统对识别为故障的事件会委派维修员去现场,如果判断错误,成本较高。接着再对模型进行剪枝,剪掉小于170的节点,最后得到模型含有11个节点,21个枝。该模型的训练和测试结果如表1所示。
Total表示总共识别出的总数据量,1表示故障,0表示非故障,i-j表示把i识别成j的数量(i=0,1,j=0,1),Correct rate 表示识别准确率,Hit Rate表示故障命中率。由于在主动抢修中,把非故障识别成故障成本较高,因此故障命中率是一个比较重要的指标,它指的是识别为故障的事件中,真实故障所占的比例。
从2017年数据中,随机筛选10%数据,进行模型测试。如表2所示。
该模型的训练故障命中率为90.99%,测试命中率为72.94%。
在SPSS Modeler软件中选用神经网络算法建模,设置最多训练500次,选用三层网络进行建模。该模型的训练和测试结果如表3、4所示。
该模型的训练故障命中率为76.66%,测试的故障命中率为72.94%。
比较两个模型所得到的结果,决策树得到的结果更精确,总共有498个真实故障,模型识别出321个故障,其中正确的有254个故障,准确率达到72.94%。 故障识别准确率得到了极大提升,为主动抢修的实施提供了数据支持。
本文通过数据挖掘中的决策树与神经网络模型,建立一种基于配电器停电信号的线路故障识别模型,准确度较高,使得在不增加硬件投入的前提下,利用已有的设备和数据资源大幅提高对配电线路的可靠感知能力。加快了局部性配电线路的停电故障的识别能力,使配网抢修指挥人员在收到故障、投诉工单或调控部门发出预警前感知配网的疑似故障信息,并开展主动抢修。