沙一川 季惠英
摘要 采用归纳总结调度自动化系统及设备的软硬件特征,抽象公共特征形成层次结构,建立自动化系统及设备的健康模型,通过构建自动化系统及设备运行数据采集和汇集机制,实现对自动化系统及设备的实时监视与告警,形成自动化系统画像和设备画像,并自动生成系统及设备健康报告。
【关键词】自动化系统及设备 健康模型 设备画像 自动化系统画像
近年来,国家电网公司各级调度中心已逐步完成智能电网调度自动化系统建设,其中硬件包括服务器、交换机、存储、网络设备等,软件包括调度自动化系统、中间件、数据库等。目前自动化运维人员需时刻监视各软硬件的运行情况,对异常问题进行处理。本文分析调度自动化系统值班、运维现状,提出了一种调度自动化系统及设备统一运维技术。
1 自动化系统及设备自动建模
1.1 建模方法与范围
采用层次结构方式,依据“模型自动生成,免维护”原则,归纳总结硬件和软件的特征,从分类方法、资源监视和故障分析三个维度构建自动化系统及设备运行状态的健康模型。建模范围包括设备信息和系统软件信息。
1.2 自动化系统及设备健康模型
从系统、设备、软件维度抽象出资源信息模型,从原始信息和统计信息维度抽象出运行信息模型,从性能分析、业务行为、故障分析维度抽象出规则模型,从公共基础服务和应用服务维度抽象出功能/业务/服务模型,综合资源信息模型、运行信息模型、规则模型和功能/业务/服务模型,构建出系统及设备健康模型,如图1所示。
2 实时监视与告警
2.1 实时监视
以图形化方式实时监视自动化系统及设备运行的运行状态,通过图元状态、颜色等方式描述系统及设备运行状态,拓扑形式描述网络状态,tips形式描述重要信息。
2.2 智能告警
智能告警包括告警汇集,规则定义,告警配置,告警推送、告警分析、智能告警库。采用闭环告警管理策略,对问题和故障的闭环处理,逐步形成相应的知识库,形成知识利用良性循环。
3 系统及设备画像和健康报告
3.1 系统及设备健康画像
综合设备类型、投运时间、操作系统、CPU、内存、磁盘、网络、响应时间等信息,抽象出设备运行标签,形成设备健康画像;综合接入厂站、在线通道、应用、进程运行、数据同步、数据操作、消息传输、服务调用、图形、告警、考核指标等信息,抽象出系统运行标签,形成系统健康画像。如图2所示。
3.2 健康报告自动发布
根据自动化一体化运行管理规范要求,从系统资源消耗、核心服务响应时间、Web请求堆积、数据库响应等多个维度详细描述自动化系统及设备的运行状况,实现自动化系统及设备运行健康报告自动发布功能;可自定义健康报告模板,根据个性化需求快速生成健康报告。
4 应用验证
系统已经在西北电网公司和山东省电力公司试点应用,自动发现并采集调度自动化系统及设备的运行信息,并在三区进行汇集、统计分析并定期发布系统及设备运行健康报告。
5 结束语
本文提出一种自动化系统及设备统一运维技术,以值班需求为导向,通过整合软硬件信息资源,实现自动化系统及设备统一运维,保障系统可靠运行。
参考文献
[1]童辰,陈慧,季海.基于SNMP协议的通用数据采集系统[J].电子技术与软件工程,2017(18):19-19.
[2]隋國政.浅谈用户画像构建及应用[J].电子世界,2017(15):144-146.