钱立军,李新家
(江苏省电力公司,南京 210002)
用电信息采集系统中数据审查策略与异常原因分析
钱立军,李新家
(江苏省电力公司,南京 210002)
作为国家电网公司智能电网第一个全面普及的工程,用电信息采集系统要求实现“全覆盖、全采集”,每日采集的数据量巨大,采集系统需要有数据自动分析能力以确保数据的正确性。根据用电信息采集系统开发及运行过程中的试验研究,提出数据审查策略,并对审查出来的异常数据分析了产生异常的原因,对用电信息采集系统建设过程的质量管理和运行过程有参考意义。
用电信息采集;数据审查;数据分析
自2010年以来,作为国家电网公司智能电网第一个全面普及的工程,电力用户用电信息采集系统在国家电网公司范围内大规模展开。
用电信息采集系统要求实现“全覆盖、全采集”的基本建设目标,系统建设要求实现覆盖全部电力用户,用户用电过程的各类信息全面采集,采集电力用户各时段电能示值、电压、电流、功率、功率因数、剩余电量电费等数据项值,系统对大用户的数据采集要求是15 min间隔,居民用户至少采集每日日末冻结数据,每日采集的数据数量巨大。
以江苏省电力公司为例,用电信息采集系统已有18万户专变大用户在运行,2010年上线运行500万户低压用户,2011年上线运行800万户。
笔者根据用电信息采集系统开发及运行过程中的试验研究,将系统的自动数据分析分为分为2个层次:第一层是数据审核,对数据本身是否正确进行判定,包括奇异数据的剔除和缺失数据的替补;第二层是利用数据对供电、用电过程情况分析,及时发现供电异常、用电异常、计量异常等问题,为系统的业务运行提供服务。本文讨论第一层的数据审核。
数据审核是利用数据间的横向和纵向关联度进行比对,对数据本身是否可信进行审查,利用数据时间戳、分时计量示值间、前后日期间的逻辑关系进行审查,甄别出错误数据和无效数据,对数据作出标识,标识数据可信度,为后续的数据应用做好准备。
数据的审核是在数据采集入库时进行的,数据采集时需要同时处理大量的与终端的通信报文,要求及时解析报文,获取数据,对通信和数据处理有明确的时限要求,所以要求判别逻辑简单高效,不能有大量的查询关联计算。
用电信息采集系统常规的采集数据主要分为电能计量类数据和实时测量类数据。电能计量类数据存储在电能数据表中,分为:日冻结、月冻结、抄表日冻结、结算日冻结4个表,按照采集对象、采集日生成记录,具体字段包括正向有功,反向有功,正向无功,反向无功,Ⅰ、Ⅱ、Ⅲ、Ⅳ象限无功的14个费率共计112个字段。
用电信息采集系统中最常用的用户日冻结电能示值数据表中,以正向有功电能示值为例。正向有功总电能示值下文简称为“正向有功总”,常用的4个分时费率称为“尖”、“峰”、“平”、“谷”。
从用电信息采集系统现场采集终端中获取数据时,终端已对数据进行了数据发生时刻的标识,在G/DW376.1通信协议中称为“终端抄表时刻”,更为准确的名称应为数据发生时刻。
检验数据时刻原本是为了检查终端对抄表失败的处理逻辑,当终端与电能表通信失败时,终端内存中的实时数据区会保留上次成功时刻的数据,但在形成日冻结数据时,常有终端厂商有意或无意地用此数据作为日末冻结值,导致日冻结数据很可能是多天以前的数据。
电能表对有功电能示值的计量,至少必须有正向有功总电能示值,对于两费率电能表还有峰、谷示值,对于四费率电能表还有尖、峰、平、谷示值。但在数据采集过程中,常会发生数据缺项,例如:有峰谷示值,但缺少总示值等异常情况。
检查逻辑分为3个部分:数据记录中“正向有功总”不能为空值(NULL);有功电能示值中,尖峰有值(不为零或者空)时,峰、平、谷任一无值(空或者零),但允许峰平谷同时无值;有功电能示值峰、平同时有值,而谷为NULL或者平、谷同时有值而峰为NULL。
电能表通信规约中,对于多费率表定义了费率1、费率2、费率3……费率14,可以设置多个时段,设置时段与费率的关系。由于参数可设置,不同类型、不同厂商、不同时期、不同供电单位对此均有不同的设置,结果同样的四费率电表,费率1代表的可能是尖,也可能是峰;也可能用费率4来代表尖,这就是费率顺序不同。
为了对这种情况进行统一,在用电信息采集系统中则需要根据电能表费率的费率顺序来分类电能表类型,在数据采集入库时,根据类型进行转换,以得到相同的费率顺序,以便数据后续的业务应用。
如果对电能表的费率顺序参数设置错误,就会导致尖上出现峰或谷的数值,此时在后续的规则“分时量相加≠总”不能检查出来而会导致数据错误。
多费率电能表具备分时计量功能,正常清零后开始计量,各个时段电能示值总和应等于总电能示值,所以此项规则检查很简单:当“尖+峰+平+谷”≠0时,ABS(尖+峰+平+谷-总)>0.5。这里给总及分时相加预留了0.5度的允许偏差,以消除一些特殊情况。
在通过前面几项检查后,同一个记录内的数据间逻辑已检查通过,下面考虑同一只电能表连续几日之间的数据关系。
电能示值应该是一直累计增长的一个数值,当日的数值一定不会小于昨日的数值,所以检查逻辑也很简单,仅针对“总电能示值”检查:当D1<D2且D1<D3时,D1无效。D1为当日总电能示值,D2为昨日总电能示值,D3为前日总电能示值。
这里增加了一个D1<D3的判定,是为了防止D2突然增长本身无效而导致误判。
电能表突然异常计量(飞走)或者抄表时突然出现一个奇异的大数值,也是自动化抄表中经常碰到的问题,突然增长量一般不易界定,笔者建议的判定规则是:当D1-D2>1 500时,D1无效;当D1-D2>300且D2-D3<10时,D1无效;当D1<D2且D1>D3时,D2无效。D1为当日总电能示值,D2为昨日总电能示值,D3为前日总电能示值。
根据前面的数据审核规则,在江苏省电力公司的用电信息采集系统中实际运行结果是相当有效的,系统在数据采集时,自动对数据进行审核,每天对审核的异常结果进行统计,出现的异常数据仅占全部采集数据的2/10 000。
实验开始阶段,在500万只电能表的时间戳检查中,就发现每天有近3 000只电能表数据日期不正确,主要集中在个别厂商的终端上。通知终端厂商更正,在进行远程软件升级后,此现象得到解决,但系统每天还是会检查到近百个此类现象,数据时间戳差异很大,如表1所示。
分析产生此问题的原因,发现大部分情况是偶尔出现的,估计是终端特殊工况下的偶发错误所致,例如:突然停电,死机重启等,而也有个别终端下的电能表大部分出现此类情况,且多日重复出现,现场检查发现终端内部出现了硬件故障。
根据现场检查,空值的出现主要是3个方面的原因:一是终端内的电能表规约类型设置不正确,电能表在通信过程中的费率顺序因各个厂商并不统一,在现场调试时需要根据实际情况核对正确设置;二是RS485通信线路受到外界信号干扰或者是电能表RS485端口的驱动能力不足,导致终端接收电能表的数据时出现通信错误,受到的数据报文错乱,导致数据丢失或奇异;三是电能表内部的存储数据出现错乱,直接从表内读数的数据不正确。
对分时电量相加不等于总电量此类异常数据的历史数据查看和现场检查发现,产生原因分为2类:差值很大,约占60%,原因和上面产生空值数据的原因相同,数据明显具有缺项或者偶发数据奇异,主要是终端采集电能表数据存在通信问题造成的无效数据;差值不大,约占40%,电能表内存储数据和液晶显示数据比较,电能表的总数和分时数据不相等。
对有功示值下降类异常数据的历史数据查看和现场检查发现,产生原因分为2类:一是示值突然下降或大数值来回波动,约占80%,主要是终端与电能表间通信的RS485受干扰导致接收到异常数据,此外,个别厂商的某种型号电能表在特定条件下RS485通信逻辑出错,接收非本电能表地址的错误通信;二是示值下降很小的数值,约占20%,这是个别厂商的某种型号电能表在用户不用电的情况下,出现微量的倒走现象。
电能示值突增的主要原因还是此前该电能表未能正常抄表,一直抄收了虚假数据,调试后数据的突然变化导致。造成虚假数据的原因:个别厂商的某种型号电能表在特定条件下RS485通信逻辑出错,接收非本电能表地址的错误通信。
对于异常数据的分析处理,采集系统需要提供相应的支持功能,在采集系统内应进行下列过程的处理:
(1)将异常数据前、后日进行比较,对连续多日出现异常的数据形成异常提示事件,忽略偶尔出现的异常。
(2)对异常事件按照采集对象为单位进行事件出现次数的统计,可以减少事件对象;对同一对象重复出现的事件一并进行处理,减少事件处理次数。
(3)对事件对象按照采集终端进行汇总统计,可分析出是终端的故障还是电能表自身的问题,对同一个终端下的异常事件可以同时处理。
(4)以终端或采集对象为依据,在采集系统形成事件处理工作传票,启动故障检修流程,闭环跟踪事件的处理。
用电信息采集系统每日采集海量的数据,数据自动审查、异常分析、故障处理需要用电信息采集系统提供大量智能化、人性化的预处理机制,只有形成这一机制,才能保证系统的有效运行、高效运行。
Strategy of the data checking and the exception reason analysis in the information collection system
QIAN Li⁃jun,LI Xin⁃jia
(Jiangsu Electric Power Company,Nanjing 210002,China)
As No.1 full coverage universal engineering of state grid corporation smart grid,information collection system achieves comprehensive requirements,“full acquisition".A huge amount of data is collected daily.Acquisition system requires data analysis capabilities to ensure the accuracy of the data.According to the test data in the development and operation of the process of infor⁃mation collection system,the data review strategies,and review ex⁃ception data analysis of the causes of the abnormal,quality manage⁃ment and running of the construction process of the information col⁃lection system reference significance.
power information collecting;data check;data analysis
F407.61
B
1009-1831(2013)01-0045-03
2012-10-12