周一波+麻建+王璟+熊文敬
摘 要:国网英大国际控股集团有限公司根据金融信息通信应急保障需要,紧密结合信息系统现状,组织开展了金融信息通信应急保障体系设计。金融信息通信应急保障体系包括应急工作组织建设、应急处置总体流程设计、应急预案管理、应急演练等四个方面。通过金融信息通信应急保障体系的建设和应急演练实施,进一步提升了企业信息通信应急保障能力,下一步将全面总结在实际工作中遇到的问题,不断优化与完善现有应急保障体系。
关键词:应急保障体系;流程设计;预案编制研究;演练方式研究
中图分类号: TP309 文献标识码:A
The Design of Financial Information Communication Emergency Support System
Zhou Yi-bo, Ma Jian, Wang Jing, Xiong Wen-jing
(State Grid Yingda International Holdings Co., Itd. Beijing100005)
Abstract: According to the strict requirements for financial information communication during emergency time, our enterprise designed the Emergency Response System (ERS) on current infrastructure. ERS includes four aspects: the emergency organization construction, the emergency response process design, the emergency plan management, and the emergency drill. Constructing and implementing the ERS improved enterprise`s capabilities in information communication field. In next stage, to sum up the operating experience and keep improving the stability and reliability of ERS is needed.
Key words: Emergency Support System; Process Design; Emergency Planning Research; Drill Method
1 引言
在我國现阶段,信息通信系统突发事件应急管理工作在某些企业,特别是国有大型企业有了一定的发展。但从总体情况来看,系统业务停止、数据丢失、服务器宕机、设备故障等事件时有发生,故障节点难定位;应急预案不够完善,在实际应用上,缺乏实用性和可操作性;应急处置协调工作重,公司缺乏统一的信息系统应急协调机制及应急体系;缺乏对信息系统应急人员的培训和管理;信息系统的应急物质准备不到位。
基于上述分析,随着公司规模的不断扩大,信息通信系统复杂程度日益加深,信息通信系统作为公司业务的支撑,直接影响金融业务的运转。公司如何合理地建立信息通信系统突发事件应急管理体系,最大限度地降低信息通信系统突发事件的负面影响,就成了一个迫切需要解决的问题。
2 设计原则
在进行组织体系建设时,通过学习应急管理相关方法论,总结先进经验,全面坚持几项原则。
(1)统筹规划:信息化工作部从企业整体建设方面来规划突发事件应急保障管理体系,循序渐进,有步骤地实施应急保障体系。
(2)全面性:建立的体系应能涵盖各类突发事件。
(3)集成性:要集成企业各部门及企业外部相关的人员和资源,协调管理。
(4)层次性:根据不同类别和级别的突发事件要采取不同的处置措施。
(5)实用性:应急保障体系的构建既要高效又要实用,确保突发事件应急保障措施能够落到实处。
(6)可操作性:主要体现在平时能够防范突发事件、对相关员工进行培训以及进行应急演练;在突发事件发生时能消除或减少对业务应用方面造成的影响。
3 组织体系设计
为确保应急体系运行有力,处置过程高效、顺畅,坚持“统一指挥、分工协作、预防为主、平战结合、及时灵活、科学有效”的原则,企业应成立以信息化分管领导为组长、信息化工作部牵头、各相关业务部门参与、专业技术人员保障的信息通信应急组织,形成规模适度、素质优良、结构优化、布局合理、管理规范的应急组织体系,负责统筹协调开展应急处置工作,持续提高突发事件应急处置能力。
3.1领导组
主要职责包括贯彻企业信息通信应急管理相关方针政策,负责全面领导信息通信应急保障工作,决策和协调信息通信应急处置重大事件。
3.2 调度指挥组
主要负责组织信息通信应急处置工作开展;组织各应急组对故障可能产生的风险进行评估预测;参与并进行全过程管控,向领导组及时汇报应急处置工作进展。
3.3 秘书处
主要负责接收来自监控、巡检人员及各业务部门反馈的信息通信故障信息;负责对故障信息进行确认、风险预判,组织、跟踪、协调各专业应急组故障处置,及时向上级报告并转达处置指令。
3.4 运行监控及安全监控组
主要负责各类硬件设备、资源池等平台软硬件、安全设备的巡检、监控值班;负责配合各信息系统进行安全防护及故障处置,保障信息系统安全稳定运行。
3.5 各专业应急组endprint
主要负责各类硬件设备、资源池等平台软硬件、安全设备的故障处置和防护措施落实;应用系统监控巡检、故障上报、故障处置和安全防护措施落实;协调各应用系统三线技术人员予以故障处置和隐患消缺,保障平台软硬件、数据中心安全稳定运行。
3.6 三线应急支持组
主要负责根据需要提供网络出口链路应急故障处理支持;负责根据故障排查结果,遵照对备品备件的到场时间要求,提供应急响应;负责提供安全事故排查、日志分析等安全处置与技术支持。
3.7 业务部门
主要包括企业各信息化业务部门。负责将应用系统使用中的突发问题上报秘书处;配合应用系统应急处置完毕后的系统可用性验证。
4 应急处置流程设计
为确保应急处置过程科学、合理、高效、顺畅,将各应急组织有机串联,发挥各应急组织的专业特长,保证全体应急组织人员各司其职、协同处置,形成整体处置能力,公司信息化工作部经反复研讨、沙盘推演,全面完善了应急处置总体流程。
处置流程共分三大阶段十六个步骤。
发现阶段:由运行、安全监控组、系统日常巡检人员及业务用户发现问题后立即将故障基本情况上报秘书处;秘书处根据故障现象及故障定级矩阵图预判故障影响,确定需要启动应急处置流程后,通知调度指挥组及相关应急组人员立即到达指定岗位;调度指挥组下达故障排查指令后,秘书处通知受影响各业务部门客户信息系统暂停业务处理,并向各专业应急组传达故障排查指令。
处置阶段:各专业应急组接到指令后,应急组内部按既定流程逐步排查,应急组之间相互协同、相互沟通并行开展故障排查,及时联系三线应急组或外部单位协助支持排查工作;经初步判断故障定位,核實排查结果后,向调度指挥组汇报;调度指挥组下达启动应急处置指令,各专业应急组按照故事原因所对应的应急预案内容协同开展应急处置工作;应急处置完毕,由秘书处请各业务部门人员及运行、安全监控组确认故障排除后,向调度指挥组上报处置结果。
结束阶段:调度指挥组审核处置结果,下达应急处置结束指令;秘书处通报全体应急人员应急处置结束,通知受影响业务部门信息系统故障恢复,业务可正常处理;按照“四不放过”原则,组织总结应急故障处置中的经验教训,本着“举一反三”的原则,对在运信息系统进行全面隐患排查,及时消除安全隐患,杜绝类似问题再次发生。
5 应急预案编制方式研究
5.1 应急预案编制思路
应急预案是针对可能发生的重大事故所需的应急准备和应急响应行动而制定的指导性文件。它是在辨识和评估潜在重大危险、事故类型、发生的可能性及发生过程、事故后果及影响严重程度的基础上,对应急机构职责、人员、技术、装备、设施、物质、救援行动及其指挥与协调等方面预先做出的具体安排。
通过编制各系统应急预案,旨在当信息通信系统一旦发生可预测的系统故障情况,就可以按照预定的方案实施处置措施,同时根据具体的事态发展及时调整处置措施,以最快的速度发挥最大的效能控制事态的发展,通过有组织、有秩序地实施应急处置措施,达到降低故障造成的危害,减少损失的目的。
5.2 应急预案的编制原则
应急预案应本着几点要求进行编制工作。
(1)科学性。预案的指导思想、生成方法和步骤、实施的处置措施等都应该是科学的,即预案的制定应该符合突发事件发生、发展、演化的机理,以保证预案在实施过程中能真正发挥效果。
(2)系统性。完备的应急预案应成为一个系统,这主要表现在应急能力评价要成系统,应急措施的制定要成系统,生成应急预案的方法、原则、程序等也应形成一个体系。这些系统之间并不是独立的,而是有机联系,相互制约的。
(3)完整性。应急预案应包含突发事件应急管理的整个过程,以及突发事件应急管理中所需的尽可能全面的数据和资料。
(4)实用性。应急预案是建立在风险分析的基础上的,应急响应也是建立在现在资源的基础上的,提出明确具体的措施,具有明确的针对性,可操作性很强。
(5)动态灵活性。突发事件往往是复杂多变的,任何详尽的应急预案都不可能全部概括各种可能的情景。一方面是有些突发事件是应急预案中没有提及的,另一方面是在突发事件发生过程中,情景是动态变化的,甚至有些情况是不可预测的。因此应急预案不是一成不变的操作手册,必须能动态灵活地调整。
5.3 应急预案的编制步骤
企业在编制应急预案时主要遵循七个步骤,如图3 所示。
6 应急演练方式研究
为实际检验信息通信保障方案中应急处置流程的实用性、合理性、顺畅性,信息系统应急预案的可操作性,各应急组织协同处置能力,考察三线支持人员及备件到场时效性,全面提高信息通信应急保障能力,企业应持续并深入开展信息系统应急演练工作,并将演练工作情况纳入评价考核内容。
应急演练根据演练中的人力、物力等组织、投入的形式,划分不同的演练类型,以演练组织形式可划分为桌面演练、模拟演练、实操演练等,应急演练的实施根据是否具备演练脚本的指导,分为有脚本演练和无脚本演练。
6.1 桌面演练
桌面演练也称为沙盘推演,在参演单位之间进行,采取多方参演单位协同参与的方式,确保各单位协同工作。
6.2 模拟演练
即模拟实际环境搭建模拟系统,进行一些故障模拟和应急测试,可以此做参考,当生产环境发生类似故障时,在较短时间内完成应急故障处理。
6.3 实操演练
采用实际生产环境进行应急操作,实现故障紧急处理或在生产环境模拟数个应急场景或灾难性应急恢复,通过实际操作达到应急演练目的。实操演练实施应提前提报检修,具体操作以检修流程为准。
6.4 无脚本演练
网络与信息系统无脚本应急演练是指应急处置人员在事先不知晓故障预设场景、原因及故障恢复处置措施的情况下,根据故障现象在演练过程中进行分析和判断,按照实际自动触发故障处置流程,恢复网络与信息系统正常运行的一种应急演练形式。无脚本应急演练应具有两个特点。
特点一:无脚本应急演练应具有“无预知、有预案”的特点。无脚本应急演练对应急处置人员采用“事先不预知”的方式,即应急处置人员事先不知晓演练故障预设及触发时间,但是应急处置人员在处置过程中需遵守现场运行规程和应急预案,应根据预案及规范有序开展应急处置。
特点二:无脚本应急演练应具有“无脚本、有范围”的特点。无脚本应急演练在演练过程中采用无脚本的方式,但是必须在一定的预设故障范围内,避免产生次生故障,即不能对演练范围以外的网络或系统产生影响。无脚本应急演练须做好全面的风险评估,对演练过程潜在的风险做到可控、能控、在控,有效控制风险范围,保障演练安全。
7 结束语
随着企业信息系统建设的深入,企业对信息系统的依赖性越来越大。可能发生的信息系统突发事件将危害到企业的正常运作,要采取及时有效的措施对突发事件进行处理,企业必须将突发事件应急管理的理论应用到信息系统中,建立企业信息系统突发事件应急管理体系,为企业建立信息系统突发事件应急管理体系提供指导和借鉴。
参考文献
[1] 徐海东.应对挑战建立完善的网络与信息安全保障体系[J].电信科学,2007,(2).
[2] 刘娟.电信企业业务应急保障管理体系[J].信息与电脑:理论版,2014 (10) :182-183.
[3] 刘怡,张荣伟.浅谈应急通信保障体系[J].黑龙江科技信息, 2016 (34) :126-126.
[4] 刘景凯.企业突发事件应急管理[M].北京:石油工业出版社,2010.endprint