基于Linux系统的集中器故障分析及处理

2016-12-16 06:40徐建云王鸿玺马红明
河北电力技术 2016年5期
关键词:集中器死机存储空间

徐建云,李 飞,张 琳,王鸿玺,马红明

(国网河北省电力公司电力科学研究院,石家庄 050021)

Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming

(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)



基于Linux系统的集中器故障分析及处理

徐建云,李 飞,张 琳,王鸿玺,马红明

(国网河北省电力公司电力科学研究院,石家庄 050021)

针对现场运行低压电力集中器死机,无法正常启动的问题,通过对故障集中器进行检查,确定集中器Linux系统数据区溢出,程序运行空间不足导致死机,提出程序优化方案及处理措施,并试验验证了其可行性。

用电信息采集系统;集中器;Linux;故障

Xu Jianyun,Li Fei,Zhang Lin,Wang Hongxi,Ma Hongming

(State Grid Hebei Electric Power Research Institute, Shijiazhuang 050021,China)

用电信息采集系统集电能表数据采集、数据传输、数据存储、数据处理及供电控制等功能于一体,可以使供电部门及时掌握用户用电情况,监测有无窃电行为;根据需要进行供电控制;通过远程抄表,节省抄表的人力物力。低压电力集中器作为低压电力用户电能数据采集、存储、管理、上传的重要设备,对用电信息采集起着至关重要的作用[1]。

1 故障介绍

随着智能电表的推广应用和用电信息采集系统的完善,低压电力集中器在河北南网广泛应用。近期河北南网应用用电信息采集系统主站时发现,某厂家生产的11台集中器陆续无法通信,召测无应答,主站状态变为不在线,检查发现11台集中器运行时发生死机现象,集中器无法下行与电能表通信,按键可以唤醒显示屏,集中器断电后重新上电也无法正常启动,现场连接RS485也无法正常抄读信息。且随着运行时间的延长,同类故障的集中器数量大幅增长,严重影响用电信息采集和台区线损统计。

2 故障原因分析

对故障集中器进行检查,发现现场环境正常,电压电流符合技术规范要求,无硬件损坏。进一步对集中器软件运行检测,通过测试工具软件检查集中器Linux系统内部存储区,为了模拟现场环境,保证使集中器满足实际运行情况,在实验室搭建试验装置,检测集中器存储区运行状况,确立了以下检测试验方案:

a. 搭建1个采集环境,1台集中器下挂10台电能表通过RS485接口进行抄表,通过RS485接口可保证通讯的速率和可靠性。

b. 修改集中器程序,改为每30 s对交采数据及下挂电能表数据进行抄读,集中器30 s内抄完所有数据,模拟出现场真实情况,缩短正常存储数据时间,使集中器存储快速达到饱和状态。

c. 延长运行时间,并使用Liunx系统存储查询软件,查看集中器存储区使用情况。

在实验室对现场故障集中器相同批次的新集中器进行试验,试验测试情况如下所示:

运行1 h存储情况见表1。

表1 试验1 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M6.4M13.0M33%程序存储区20.0M5.4M14.6M27%数据存储区92.0M24.5M67.5M27%

运行3 h存储情况见表2。

表2 试验3 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M6.4M12.9M33%程序存储区20.0M5.4M14.6M27%数据存储区92.0M91.1M932.0K99%

运行4.5 h存储情况见表3。

表3 试验4.5 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M6.4M12.9M33%程序存储区20.0M5.4M14.6M27%数据存储区92.0M92.0M36.0K100%

运行4.5 h后集中器出现死机现象,现象同现场故障集中器情况相同。用测试工具软件查看数据存储区使用率为100%。由该试验可见,随着时间的延长和存储数据量增加,系统数据存储区占用比逐渐增高,当已使用空间占比达到100%写满后,终端无法完成数据存储,造成终端死机。

针对现场集中器运行情况,分析故障原因为:基于Linux系统的集中器数据存储区,随着运行时间和存储数据的增加,可用有效存储空间越来越小,不能进行存储数据的自动删除,最终导致存储区数据溢出,没有有效的数据存储空间可供程序运行,导致现场集中器程序无法正常运行,进而导致发生死机,失去上行下行通信功能,重新上电也无法正常启动。

3 处理措施及建议

针对集中器故障原因,对软件程序进行修改,优化数据存储策略,增加数据存储空间回收机制,当数据存储区剩余空间小于20%时,及时清除最早的数据文件,保证剩余数据空间充裕,避免由于没有数据存储空间而导致写数据失败以致死机;使用升级程序对现场取回的故障终端和故障分析试验时发生死机的终端分别进行升级;重复上述故障发生时使用的试验方案进行试验,运行时间增加到24 h。试验测试情况如下:

运行1 h存储情况见表4。

表4 试验1 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M11.4M7.9M59%程序存储区20.0M8.9M11.1M45%数据存储区92.0M30.0M62.0M33%

运行4 h存储情况见表5。

表5 试验4 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M11.8M7.6M61%程序存储区20.0M8.9M11.1M44%数据存储区92.0M74.7M17.3M81%

运行24 h存储情况见表6。

表6 试验24 h集中器Linux系统存储情况

文件系统存储空间已使用空间剩余空间已使用空间占比系统存储区19.4M11.8M7.5M61%程序存储区20.0M8.9M11.1M44%数据存储区92.0M74.8M17.2M81%

可以看出,运行4 h数据区存储占比达到81%,运行24 h后数据区存储占比仍然为81%,说明通过程序的优化升级,当可用空间小于20%时,清除了部分数据文件,腾出存储空间,试验用集中器程序运行正常,未发生死机现象。

针对出现故障的同一厂家集中器提出对集中器程序进行升级,增加集中器数据区存储空间回收机制,当数据存储区剩余空间小于20%时,及时清除最早的数据文件,保证剩余数据空间充裕,消除故障隐患。现场运行集中器通过数据区空间回收机制升级,长时间运行不再发生故障,现场集中器运行状况说明了故障原因和处理措施的有效性。

4 结束语

随着用电信息采集技术的深入发展,集中器应用程序的科学设计和持续改进具有重要意义。根据实际现场运行中出现的集中器故障,分析了故障原因为基于Linux系统的数据区溢出,没有回收机制,导致存储空间不足,提出了程序优化方案,并用试验验证了故障原因和优化方案的可行性。通过集中器运行中发现的问题,用电信息采集技术的可靠性将进一步提高。

[1] 李 飞.低压电力集中器故障原因分析及处理[J].河北电力技术,2014,33(4):49-50.

本文责任编辑:罗晓晓

Analysis and Treatment of Concentrator Fault Based on Linux System

Low voltage power concentrator crashes, can not start properly, through the experimental analysis of the failure causes, concentrator Linux system data overflow, lack of space to run the program lead to crashes, puts forward the treatment measures, effective measures is proved by experiment.

concentrator; Linux; fault; electric power

2016-06-27

徐建云(1987-),男,工程师,主要从事电能计量及采集方面工作。

TM769

B

1001-9898(2016)05-0061-02

猜你喜欢
集中器死机存储空间
提醒
基于多种群协同进化算法的数据并行聚类算法
苹果订阅捆绑服务Apple One正式上线
用好Windows 10保留的存储空间
低压集中器采集调试和维护问题分析
谈低压集中器及表计在线故障快速排查方法
集中器常见死机原因分析及解决方法探究
脸死机了
计算机“死机”故障原因与排除
计算机“死机”故障原因与排除