褚兴旺
(国网江苏省电力有限公司营销服务中心,江苏 南京 212425)
用电信息采集系统从物理上可根据部署位置分为主站、通信信道、采集设备3 部分,其中系统主站部分单独组网,与其他应用系统以及公网信道采用防火墙进行安全隔离,保证系统的信息安全[1]。
主站网络的物理结构主要由营销系统服务器(包括数据库服务器、磁盘阵列、应用服务器)、前置采集服务器(包括前置服务器、工作站、GPS 时钟、防火墙设备)以及网络设备组成,如图1所示。
图1 用电信息采集系统物理架构
通信信道是系统主站与终端之间的远程通信信道,主要包括光纤信道、GPRS/CDMA 无线公网信道、230 MHz无线电力专用信道、1.8 GHz电力专网等。
采集设备安装在现场终端及计量设备上,主要包括专变终端、可远传的多功能电能表(G表)、集中器、采集器以及电能表计等。
通过用电信息采集系统指标监控,发现采集终端出现大范围掉线,经排查,掉线终端均属于同一厂家同一批次,现场查看集中器为死机状态,且部分集中器断电硬重启后总表数据异常[2]。
经查看集中器掉线记录,发现异常集中器基本都在同一时刻掉线,进一步查看该时间点的主站任务和通信报文,发现用采主站新增了“集中器中电能表掉电事件记录批量召测”任务,继续查看和分析异常集中器通信报文和程序源代码,初步确定导致集中器死机和主站“集中器中电能表掉电事件记录批量召测”任务有关。
根据上述分析,为了更好地模拟现场环境,实验室搭建了故障集中器与载波表试验环境,由1 只集中器和16只单相载波表组成,如图2所示[3]。
图2 故障复现模拟环境
具体试验过程分为6步,分别为:
(1)首先对Ⅰ型集中器参数初始化,然后对集中器施加参比电压和最大电流一段时间,使集中器的交流采样产生电量数据。
(2)将16只电能表档案配置给集中器,等待一段时间组网完成,抄读所有测量点的实时数据,全部抄到说明组网完成。
(3)将集中器时间改到当日的23:58,等待10 min,使集中器产生日冻结数据,抄读所有测量点的日冻结数据,留存备用。
(4)将集中器的时间改回正常时间,开始停电试验,每次停电5 min,再上电5 min,每次复电后,使用主站软件批量召测“电能表掉电事件记录”,观察集中器是否死机;结果发现在第4 次停电后集中器界面显示缓存不够,然后自动重启,重启后召测所有测量点的日冻结数据,数据正常。
(5)继续停上电试验,从第5次到第7次,每次的现象与第4 次的一致,集中器都会重启,然后召测所有测量点的日冻结数据,数据仍然正常。
(6)第8 次停上电后,使用主站软件批量召测“电能表掉电事件记录”,集中器发生死机,且伴随有尖锐的蜂鸣声。此时集中器无法自动重启恢复,需要人工断电且拔出电池再上电后,集中器才能恢复过来。然后召测所有测量点的日冻结数据,数据仍然正常。
故障集中器的数据缓存区为8 KiB,当主站进行“批量召测电能表掉电事件记录”,集中器正确的做法是按电能表地址分别读取每只表的掉电记录放入缓存区进行数据处理,但是故障集中器却错误地读取了整个掉电事件记录文件,将其放入8 KiB的数据缓存区进行处理,当整个掉电记录文件大于8 KiB时,产生了溢出,导致集中器死机。
根据计算,一个停电事件记录大概占用69 字节,8 KiB 的数据区可以存储8×1024÷69 ≈ 118.7次停电事件,如果16只表同时停电,那么超过8次,停电事件记录就会超过8 KiB,此时进行“批量召测电能表掉电事件记录”就会导致集中器死机,这与上面的试验结果吻合。
同时,故障集中器内总表采取环形覆盖的方式存储数据,FLASH 保存62 天每15 min 的冻结数据(集中器发生掉电时在100 ms 内完成最近一次数据存储),正常情况下,断电重启后集中器从FLASH恢复读取指针指向的最近一次保存的数据。当内存溢出时,内存中的数据及数据指针被打乱,当指针异常且在有效范围内时(62 天内的冻结点),会取出历史存储的指针指向的数据,导致总表日冻结示数变小;当指针异常且在非有效范围内时,指针无法获取有效数据,因上电时RAM 区全部清零,导致总表日冻结示数为零。
综上所述,故障集中器批量掉线问题,是由于用采主站启动“集中器电能表掉电事件记录批量召测”任务,浙江正泰集中器收到召测命令后,读取了整个掉电事件记录文件进行数据处理,当在运集中器中的掉电事件记录较多,整个文件的大小大于8 KiB 时内存溢出,导致集中器死机。同时,因内存溢出,内存中的数据及数据指针被打乱,断电重启后集中器从FLASH 恢复读取指针指向的历史数据,导致总表日冻结示数突降。
根据上述故障情况,利用用电信息采集系统,实现了离线厂家集中器的统计、计算运行采集终端分批故障率,对问题批次故障集中器采取了以下两点整改措施:一是对于合格在库的集中器,全部退回厂家进行更换处理,要求问题厂家对出厂的集中器各个环节严格把关,并加强出厂检测,满足质量要求后再行供货;二是对于在运的集中器,要求问题厂家限期优化集中器程序,程序经营质检部门检测合格后,开展现场试点升级、批量升级工作。通过处理,及时恢复了用电量等信息的采集,保证了广大电力用户利益及供电企业的经济效益。