姚志平 王洋 陈曦 张健
摘 要:吉林省预警信息发布系统承担省内自然灾害、事故灾害、公共卫生事件和社会安全事件突发事件预警信息的统一采集、分类管理和安全对接工作,充分发挥公益气象预警服务对现代气象预警业务和气象预警事业的引领作用。要保障系统稳定运行,及时发布预警信息,需要建立安全、稳定、可靠的运维保障措施,确保吉林省预警信息发布系统稳定运行。
关键词:预警信息;系统运维;保障措施
中图分类号:TP311.5 文献标识码:A 文章编号:1671-2064(2020)08-0052-02
1 保障目标
吉林省预警信息发布系统包括预警发布管理子系统,应用服务子系统,综合研判与精准发布子系统,监控与反馈评估子系统等四个子系统(以下简称“预警发布系统”)运行情况的监控和管理,及时发现系统运行中的问题并对系统进行调优,提高预警信息发布系统运行效率,及时清理一些垃圾日志文件,释放系统运行存储空间和内存资源,确保足够的内存和CPU资源去承载各类预警信息发布任务,及时将预警信息传达到应急责任人和社会公众,提高人民防灾避险意识,真正实现预警信息让人民生命更安全。
2 任务范围
省预警信息发布系统维护任务主要包括硬件及系统平台维护、应用软件维护、数据维护等三方面。其中:硬件及系统平台的维护主要包括终端故障和网络故障维护,以及相应的硬件配置和系统配置等内容;应用系统的维护主要包括系统执行预警信息发布任务时,所执行的任务指令和业务流程,保障应用系统各功能模块运行正常;数据的维护主要包括信息目录的维护,增量数据的采集、更新、修正、备份及恢复等内容。预警发布系统服务范围包括:系统运行相关操作系统、数据库、业务应用系统。
2.1 操作系统运维
针对预警发布系统运行的服务器主机Windows操作系统进行定期的漏洞识别和漏洞修复;查看系统进程状态,CPU利用率、内存利用率等方面指标是否满足运行要求。
2.2 数据库运维
预警发布系统的数据库运维服务内容主要包括对数据库进行监控、优化、数据备份和故障处理。监控的内容包含对时长、表空间可用率、缓冲区命中率、数据字典命中率、库存命中率、可用内存和统计时长进行监控。数据备份通过脚本或设定任务计划进行定期备份。保证业务系统的数据安全和出现故障时能够及时准确的进行数据恢复。
2.3 预警发布软件升级
针对预警发布系统的业务应用系统运维服务包括:对用户在应用系统使用过程中遇到的操作问题进行7×24h的答疑;应用系统的源代码和中间件的部署、调试和备份工作;业务应用系统功能的完善、版本的升级和补丁升级等;对业务应用系统程序和数据进行定时备份,确保预警信息发布软件升级过程中,导致软件运行故障,以便及时恢复到软件升级前状态,保障软件系统运行的连贯性。同时,通过对预警信息发布软件功能进行扩展,性能进行升级,适应新媒体预警信息产品的需求,提高预警信息的覆盖面。
3 运维方式
对预警发布系统相关的操作系统、数据库、中间件等提供有效巡检服务,保障预警发布系统运行的安全性和稳定性,及时发现和处理故障隐患。
4 保障措施
在运维服务保障过程中,意外情况很难完全避免,针对预警发布系统使用的实际情况,制定了详细、严谨、高效的应急处理预案。运维保障人员能够按照事先制定的预案流程进行操作,解决突发故障问题,积累系统运行维护经验,提高运维人员解决问题的效率。
4.1 基本流程
基本流程图1所示。
4.2 应急处理流程
在采用应急故障抢修预案时,运维工程师会以电话及邮件的形式通知其他技术工程师,设备厂家技术工程师进行技术支持工作,在最短时间内解决该故障,同时用备件替换故障设备,保障系统稳定运行。
4.3 预防措施
预防措施主要是防范故障风险,提前对系统运行情况进行评估,并对评估报告进行分析,提前对系统进行优化。通过分类整理常见的故障类型,制定行之有效的预防措施和处理方法。具体如表1所示。
5 运行维护
吉林省预警信息发布系统技术支持工程师经验丰富,熟悉掌握各级发布功能模块间信息交互机制,制定详细的工作流程和保障措施,确保预警信息发布系统业务功能运行稳定,具备故障监控报警功能。
平台维护主要包括预警信息系统专用网络、DMZ安全网络区域和Internet网络发布区。设计不同网络之间的接口协议,自动监测网络心跳,确保网络通信畅通,为系统运行提供稳定可靠的网络链路,利用规范的网络实时监测工具对网络通信状态进行诊断,对网络通信进行优化。
应用系统的维护主要由应用系统设计人员负责升级维护,在软件系统建设的质保期在维护期内,无条件对软件进行升级维护,保障软件各项功能正常运行稳定。同时,加强对软件操作人员进行培训,至少具备解决常见应用系统故障的能力。业务运行單位要组建维护队伍开展应用系统的改正性和完善性维护;对于新增需求,用户应按照新立项目开展系统的开发建设工作。
数据的维护将按照各项数据采集的责任主体,由行业主管部门及相关人员完成,如需改变数据交换平台的数据转化接口,则应加强与软硬件平台维护方的沟通协调,但不得轻易改变信息资源的数据库结构。
6 结语
吉林省预警信息发布系统运维保障工作直接关系到预警信息的精准发布,熟悉整个系统的硬件构架和软件系统的业务流程,加强资源共享,建立集约高效的预警信息发布体系,形成合力,能更好地服务于各级突发事件预防、应急和处置工作,保障预警信息发布系统的稳定运行。