一种电网调度自动化主站系统急救箱功能研发分析

2022-06-06 09:16:10胡圣青
科技尚品 2022年3期

胡圣青

摘 要:在传统的电网调度自动化主站系统运行中,通常需要人工操作系统以完成指令,进而增加了人工操作的时间,并且存在系统宕机的风险。一旦出现这种情况,由于人工操作导致失误会对电网调度造成巨大影响。对此,通过研究一种电网调度自动化主站系统急救箱,则可以很好地解决这一问题。文章主要分析了此系统的构成与应用,以期实现对电网调度自动化主站的良好控制和及时反馈,进一步提高电网调度自动化水平。

关键词:电网调度自动化;主站系统;急救箱

中图分类号:TM7 文献标识码:A 文章编号:1674-1064(2022)03--03

DOI:10.12310/j.issn.1674-1064.2022.03.038

通过自主编程研发一种基于D5000主站系统平台的“急救箱”概念的桌面应用软件,具备人机交互界面,在人机交互界面上用户可以通过故障表现选取对应的一键排查、恢复选项自动诊断及恢复故障。

可恢复的故障包括但不限于系统人机卡死、遥控监护无法发起、AVC进程异常、网络异常、辅助最小黑启动等。通过应用此系统软件,不需要在终端上敲出复杂的命令,便可以快速、便捷地排查常见的系统使用故障并一键恢复,当系统宕机后,能够快速进行辅助和启动,提高了系统运行效率,实现为基层班组减负,保证系统稳定运行[1]。

1 项目背景

运维人员的传统运维方式主要是通过操作大量系统运维指令实现。操作系统、数据库、应用系统的运维指令数量庞大且其参数组合多变,造成了难于全面记忆所需运维指令、难于保证操作标准及操作质量、难于提高运维效率等客观存在的问题。系统节点数增加,遍历所有硬件、软件节点,导致重复工作量大,容易出現工作对象遗漏或同类工作对象上工作内容差异等问题[2]。

大量重复工作下,通过指令获得的正常与异常信息交叉出现,容易导致运维人员对结果信息辨识不到位而忽略关键信息问题。云计算、大数据、物联网、移动互联网技术迅猛发展,设备监控专业可借助新技术提升运行能力,实现新的突破,增加监控智能化水平[3]。这样势必影响电网调度的自动化水平,进而制约电网调度效率,影响用户的用电需求。

针对此问题,要想保证电网调度自动化运行,就必须采取有效的改善措施,研究一种先进的自动化技术,并且与信息技术、大数据技术相结合,从而解决此问题。本研究研发了一种急救箱功能,通过应用此功能,可以针对出现的问题采取自动化处理措施,避免了烦琐的人工操作步骤,既不会出现操作失误,又能够大大提高操作效率,从而保障电网调度工作的顺利开展,并实现电网调度自动化水平的提升[4]。

急救箱应用的关键技术在于java面向对象编程,shell编程技术及调用技术,基于D5000平台的进程操作指令。通过应用急救箱功能,实现调度人员、自动化运维人员通过使用本软件而不用在终端上敲复杂的命令,而快速、便捷地自动排查常见的系统使用故障及一键恢复,这样便能够在电网调度出现问题的地方实现及时的故障分析,并采取对应的故障处理措施,从而确保主站系统的正常运行不受影响[5]。

当系统宕机后,通过急救箱功能,也可以为工作人员提供检测依据,帮助其能够快速地辅助启动,这样便解决了调度人员遇到系统故障后不能自主恢复,需要自动化人员到场排查的耗时耗人问题、系统常规故障运维工作重复、操作烦琐及系统失灵后恢复超时的问题[6]。

上述问题解决之后,便能够进一步提高电网调度主站系统的自动化水平,并减去繁杂的人工操作步骤,由此大大提高系统自动化操作效率,为基层班组减负,保证系统稳定运行。

2 系统急救箱架构说明

系统急救箱程序界面如图1所示,主要分为客户端程序和服务端程序,以及一个配置文件,客户端程序即sys_operate_manage,是一个界面程序,主要用于查看巡视结果,服务端程序sys_operate_monitor是采集程序,作用是采集各节点上的信息。

客户端程序拷贝到工作站上,便于查看系统巡视结果,服务端程序则分发到需要体检的服务器或者工作站上。配置文件需要拷贝到有客户端程序的工作站上,里面定义了需要体检的节点信息,以及体检项目的阈值,只有超过阈值的体检项会被标为异常项目在报告上体现出来[7]。

此软件主要是使用java的swing框架开发,故障的排查及处理通过调用shell脚本执行,采用面向对象技术开发,并通过配置文件,动态增加可处理故障。通过发挥急救箱的相关功能,便可以充分分析系统故障,并做好故障的排查工作,基于急救箱功能进行故障处理,以快速地恢复主站系统运行,提高主站系统的运行水平[8]。

图1中工作站的客户端程序通过remote_exed命令到服务器执行sys_operate_monitor程序采集数据,然后再汇总到工作站,以便查看巡视结果。由此,便能够充分采集相关数据,并综合整理分析这些数据,整体汇总到工作站后便能查看最终的巡视结果,完成相应的功能发挥[9]。

3 部署说明

系统环境:D5000系统。

软件环境:系统版本3.02/3.03、qt453及以上。

需要在数据库创建3张表,现场环境基于国产达梦数据库。3张表的具体信息如表1所示。

新增的3张表不需要在表、域信息表中增加记录,仅需要在ALARM模式下新增表实体即可,其中sys_operate_info表记录会随着多次体检而增加。

建表脚本在sys_operate_monitor/doc目录下,包括create_sys_operate_info.sql、create_sys_operate_item_info.sql、create_sys_operate_examine_report.sql。

使用isql ALARM/ALARM@mdb xxxxx.sql将sys_operate_manage目录下sys_operate_manage.sys配置文件拷贝到$HOME_D5000/conf目录下,填入需要体检的节点名称。

[NodeName]//配置需要体检的节点名称,右侧的值都为1;

kf1-sca01=1;

kf1-sca02=1;

[CONFIG];

disk_threshold=60.0//磁盘使用率阈值;

inode_threshold=60.0//磁盘INODE使用率阈值;

cpu_threshold=80.0//机器CPU使用率阈值;

mem_threshold=80.0//内存使用阈值;

swap_threshold=80.0//SWAP使用率阈值;

util_threshold=70.0//磁盘IO使用率阈值;

net_status=1//正常的网卡状态值;

time_threshold=5//对时差的阈值,单位秒;

max_connect=20//进程连接数阈值;

proc_cpu_usage=50.0//进程CPU使用率阈值。

4 源码编译

程序需要使用json接口,有些现场的src/include目录已经有json相关的文件,但是由于版本的关系可能编译会报错,建议在编译体检程序时先将~/src/include/json目录改名,等编译完成后再修改回来。

将sys_operate_monitor和sys_operate_manager程序拷贝到源码机的src/interface或者其他src目录。

在sys_operate_monitor目录进行make编译,会在~/bin目录生成sys_operate_monitor程序(如果编译报json的错,一般是因为src/include目录下的json版本不一致,可以先移走再编译)。

在sys_operate_manage目錄进行make编译,会在~/bin目录生成sys_operate_manage程序(如果编译报json的错,一般是因为src/include目录下的json版本不一致,可以先移走再编译)。

5 系统急救箱工具界面

功能界面启动:sys_operate_manage,启动后的功能界面如图2所示,分别显示“系统巡视”“数据监视”“点表维护”“模型修改”“自动修复”“自定义”六个功能模块。

针对主站系统所需要操作的内容,可以根据工具界面的显示选择,然后实施下一步操作。如果系统出现问题,则可以点击“自动修复”以实现系统修复,确保其功能正常投入使用。

急救箱的功能界面简单明了,操作非常方便,在出现问题后,操作人员可以在短时间内进行对应的功能操作,确保系统快速恢复正常,进而确保主站系统的稳定运行[10]。

6 系统巡视

点击“系统巡视”—“立即巡视”,系统会自动扫描读取每个节点的信息,检测每个硬盘、CPU、内存、IO、网卡状态、对时状态等信息,并显示异常项。

例如,图3所示,系统巡视界面中就有“节点数据采集”“硬盘检测”“内存检测”“网卡状态”“句柄检测”几个异常巡视项,点击“硬盘检测”就可以弹出具体节点分区磁盘异常信息。

通过“系统巡视”功能,可以充分了解主站系统的日常运行情况,积极查找其中存在的隐患,并采取对应的处理措施,确保主站系统的正常稳定运行[11]。

点击“系统巡视”—“脚本巡视”,系统会根据指定脚本内容进行巡视。

7 数据监视

数据监视下,分为点击不刷新、数据跳动、SOE示标异常、通道投退检测。点击“数据监视”—“通道投退检测”,选择“起始时间”和“结束时间”,点击“数据查询”,即可查询这一段时间内发生投退的通道以及投退次数。

数据监视界面如图4所示。

8 点表维护

点击“点表维护”即可调用如下点表导入工具,完成点表导入。

9 模型修改

点击“模型修改”弹出一键修改间隔设备名称工具,选择厂站,选择间隔后,读出新的间隔名称和设备名称;然后再点击“新间隔名”,直接修改具体的设备名称;点击“修改预览”,一键修改完成设备更名操作。

模型修改界面如图5所示。

10 自定义

点击“自定义”,可以通过自定义脚本,展示结果后再一键点击运维窗口。

11 结语

通过应用本研究的“急救箱”,能够快速、精确地排查常见故障和及时恢复故障,不需自动化运维人员到场,节约了时间及人力,并且能够运用自动程序替代日常的人工故障处理,以提高工作效率,降低人力成本。

通过自主编程研发,可以掌握核心技术及软件著作权,可以节约通过第三方公司特别系统原厂的开发成本。此外,大大减轻了自动化班组运维工作量,响应为基层“减负”号召。同时,还可以提高主网调度工作效率,降低自动化运维班组人力成本,减少因发生调度自动化主站系统失灵而带来的间接经济损失[12]。因此,此种系统可以推广使用,推动提高经济效益与社会效益。

参考文献

[1] 王权刚.电力调度自动化系统在大庆油田电网的应用与发展[J].化工管理,2021(19):73-74.

[2] 张宇,朱江,严威,等.AI语言功能在配电自动化主站中的应用[J].电力设备管理,2021(5):23-24,44.

[3] 郑炜楠,苟吉伟,许伯阳,等.电网调度自动化主站系统故障处理与对策[J].集成电路应用,2020,37(6):92-93.

[4] 陈剑,张洁华,赵悦莹.创新智能电网调度自动化技能培训模式[J].中国电力教育,2020(5):32-33.

[5] 李昱潼,李昊禹.电网调度自动化主站系统功能扩展设计[J].电工技术,2019(24):87-88.

[6] 张智渊.电网调度自动化管理系统的设计与实现[J].中国新通信,2019,21(21):75.

[7] 舒适.电网调度自动化远程浏览技术的设计和应用[J].智库时代,2019(39):226-227.

[8] 李俊.浅析调度自动化系统在石河子电网中的应用[J].石河子科技,2018(3):40-41.

[9] 刘彬.电网调度自动化主站不间断供电电源的运行与维护[J].通信电源技术,2018,35(5):255-256.

[10] 胡扬.调度自动化系统状态评估与预测[J].机电工程技术,2018,47(4):142-145.

[11] 王晓蔚,郭捷,刘翔宇,等.移动式主站模拟测试装置关键技术研究[J].河北电力技术,2017,36(5):4-7,14.

[12] 朱向立,孙长春,王文林,等.提升电力调度系统状态估计遥测合格率的措施[J].电力安全技术,2017,19(10):13-15.