吴 昊,甘 纯,叶君华
(国网浙江省电力公司舟山供电公司,浙江 舟山 316021)
全过程安全管控在舟山电力信息机房搬迁中的实现
吴 昊,甘 纯,叶君华
(国网浙江省电力公司舟山供电公司,浙江 舟山 316021)
结合舟山电力网络与信息系统运行的特点,从3个方面对信息机房搬迁全过程安全管控进行阐述,即搬迁过程管控、人员管理和应急管理,总结出一整套保安全、便管理、有特色的工作经验,为信息机房搬迁工作探索出一种切实可行的安全管控模式。
网络;信息系统;搬迁;安全管控
近年来,随着信息技术的大力发展和国家电网公司“SG186”工程的实施,供电企业信息系统重要性日益显现,对信息机房搬迁也提出了新的要求,主要表现在:机房搬迁过程中,网络与信息系统的业务连续性必须得到保障;重要业务系统主机的搬迁需根据业务应用需求的不同来确定。
因此,针对信息机房搬迁新的要求,舟山电力公司特别制定了详细的信息机房搬迁方案,对搬迁过程中的风险点进行梳理,做好搬迁过程前、中、后全方位的衔接和保障工作,落实人员保障和应急安全措施,确保实现信息机房搬迁的全过程安全管控。
由于本次信息机房搬迁涉及在运网络与信息系统设备的搬迁,承载了公司信息内外网的核心业务,涵盖生产、营销、ERP等重要业务应用,因此在信息机房搬迁过程中保证网络与业务应用的连续性显得尤为重要。通过多年来对网络与信息系统的运行分析和总结,针对本次搬迁,创新性地提出了全过程安全管控的理念,具体包括过程管控、人员管理和应急管理3个方面,如图1所示。
图1 搬迁全过程安全管控范围
信息机房的搬迁要遵循以下原则:
(1)最低安全保障原则。在信息机房搬迁过程中,要求对重要业务应用提供最低安全保障,以保证网络与信息系统的连续性。
(2)平稳过渡原则。信息机房搬迁涉及信息网络割接,需提前做好策略设置、配置调整、链路准备及数据备份等工作,保证网络与信息系统安全平稳过渡。
(3)管理同步原则。安全管控措施与搬迁方案要同步到位,以安全管控保障搬迁方案的实现。
(4)分步实施原则。信息机房搬迁应在保障网络与信息系统安全稳定运行的前提下有计划、有步骤、分阶段地实施。
根据信息机房搬迁的安全要求,从过程管控、人员管理、应急管理3个方面出发落实全过程安全管控措施,如图2所示。
图2 信息机房搬迁全过程安全管控
3.1 搬迁前准备
为了保证信息机房搬迁工作的顺利进行,在搬迁之前,需完成大量的准备工作。
3.1.1 相关资料收集
信息机房搬迁前期需要大量、准确的基础数据作为支撑,需要全面的设备静态数据,如设备品牌、型号、物理位置、拓扑关系等,同时还需要掌握设备的动态数据,如缺陷情况、运行指标、加固情况等,只有全面掌握大量基础数据,才能有效地开展信息机房搬迁工作。
3.1.2 信息通道准备
信息机房搬迁涉及3类信息通道,即主用通道、临时通道、备用通道。信息通道按照先准备、再割接的原则,信息专业提出详细需求,由通信专业进行通道准备,并在正式搬迁前完成相关功能性测试工作。
搬迁前需检查新机房的基础设施是否符合要求,需对机房供/配电、空调、UPS、防雷接地等重要基础设施进行测试,确保机房环境满足设备运行要求。
3.1.4 搬运路线调查
根据机房搬迁的要求,需提前对设备搬运路线进行调查,在新旧机房之间勘察出最合理的运输路线。
3.1.5 备品备件、材料和工具准备
在搬迁过程中可能会有一些零部件损坏,影响搬迁工作的顺利进行,甚至影响到网络与信息系统的正常运行。针对这种情况,必须提前做好搬迁所需各类备品备件、信息类材料和工具的准备工作。
3.2 搬迁中管控
3.2.1 落实安全防护措施
设备搬迁前,对新旧机房环境、电梯地面,墙面等必要的区域进行保护措施的布置,同时对设备采用纸箱、海绵、保温薄膜等必要的保护材料进行包装。拆卸前,需确认设备是否关闭,记录所有线缆的连接位置,按照拆卸手册进行设备拆卸,连同设备电源线、导轨等一起包装运输。剩余的配件(如网线等)要保持原状,为回退做好准备。设备运输途中,货车时速不得超过60 km/h,由随车监护人员控制。如遇到雨天,由包装人员负责为设备包装一层防雨布,保证设备不会被雨水渗入。
溶蚀作用和红土化作用二者相互促进,紧密集合,并且二者的作用过程与母岩成分、CO2含量、气候条件、地形地貌等有关。
3.2.2 保障业务系统数据安全
在主机系统搬迁前,对业务系统的数据进行备份,具体分为系统备份和数据备份。Linux系统利用TAR进行系统备份,Windows系统则利用GHOST进行系统备份,针对舟山电力公司主机设备实际部署情况,为防范搬迁过程中出现数据意外丢失,在搬迁前采用NAS(网络附加存储)方式对关键业务系统进行安全备份操作。
3.2.3 规范检修计划执行
信息机房搬迁需提前上报检修计划,在搬迁过程中严格执行两票(工作票、操作票)制度,按照作业指导书的要求进行标准化操作。同时建立省地县联动机制,确定省地县网络与信息系统的具体联络人员,做到全过程安全管控的省地县三级联动,确保机房搬迁过程中网络与信息系统的安全稳定运行。
3.3 搬迁后测试
在信息机房搬迁完成后,开展有针对性的安全性测试工作,具体测试内容包括:设备测试、功能测试、链路测试和业务测试。
(1)设备测试主要包括查看外包装的完整性、设备面板上指示灯的状态、设备的配置内容,并对新增的网络设备(含板卡、光纤模块、机柜、电源等)进行软硬件测试。
(2)功能测试主要对搬迁设备进行功能性测试,可以利用模拟环境进行测试,确认搬迁后设备系统功能正常。
(3)链路测试主要针对需要割接的网络链路进行测试,主要包括割接的链路的通断情况,链路带宽和负载情况等。
(4)业务测试是会同业务部门对业务系统的应用情况进行测试。
3.4 人员管理
为了保证信息机房搬迁工作的协调推进,专门成立了由分管局领导负责的信息机房搬迁领导小组,负责协调、督促和指导搬迁工作。为进一步明确各专业组的工作职责,领导组下设搬迁工作组、外协技术支持组,负责搬迁实施、组织措施、技术措施、现场安全措施的具体落实,同时有针对性地进行安全交底,签订安全责任书,进一步落实安全责任。
3.5 应急管理
搬迁工作针对关键任务节点制订了有针对性的应急措施,以保障工作的顺利进行。主要从以下方面做好风险预控及应急措施:
3.5.1 人员风险及应对措施
风险点:机房搬迁工作所涉及的技术支持单位多、搬迁人员复杂,在搬迁人员的管理上存在一定的安全风险。
应对措施:与外协技术支持单位及参加搬迁人员签订安全保密协议,对搬迁人员进行安全教育,特别是重点工作执行前要进行安全交底。对系统内信息技术人员加强考核力度,组织学习各种系统故障经验教训,加大违章的考核力度,杜绝违章作业。
3.5.2 机房环境影响及应对措施
风险点:因机柜问题、机房电源供电不足、机房空调异常等机房环境因素,导致设备无法正常运行或存在风险运行。
应对措施:在机房正式搬迁前,对上述机房环境因素进行确认,并要求施工单位出具相关测试报告,确保机房环境符合搬迁条件后再进行设备搬迁。设备搬迁过程中,由机房基础设施厂家(如空调、UPS等)派人到场进行必要的技术保障,做好设备搬迁后机房环境的保障工作。同时根据搬迁要求,同步完成机房有序用电方案的编制。
3.5.3 设备异常应对措施
风险点:在设备搬迁过程中,可能会发生因搬迁而造成模块故障、板卡故障、设备故障、供电引起的设备故障等异常情况,导致设备存在运行风险。
应对措施:针对搬迁中可能出现的各类设备异常情况,调拨了包括整机、引擎等各类型的备品备件,同时根据异常的影响程度,择时启动各类故障现场处置预案,及时处理各类因设备故障引起的信息系统突发事件。
通过对信息机房搬迁进行全过程安全管控,全面梳理掌握了舟山电力信息运维基础数据,针对搬迁过程管控、人员管理以及应急管理3个方面,总结出一整套保安全、便管理、有特色的工作经验。提高了信息运维人员应对突发事件的能力,有效地保障了搬迁过程中网络与信息系统业务连续性,为地市供电企业开展信息机房搬迁工作提供了参考依据。
[1]金燕,冯悦鸣,陈华智.机房搬迁中全过程安全技术督查的PDAS方法实践[J].浙江电力信息化,2010(3)∶32-34.
[2]莫春花.邮政综合网省中心机房搬迁实施之我见[C]//海南省通信学会学术年会论文集,2011.
作者介绍:吴 昊(1982),男,高级工程师,从事电力信息化管理工作。
(本文编辑:徐 晗)
Implementation of Whole Process Safety Control in Relocation of Zhoushan Power Information Room
WU Hao,GAN Chun,YE Junhua
(State Grid Zhoushan Power Supply Company,Zhoushan Zhejiang 316021,China)
According to the characteristics of Zhoushan power network and the operation of information system,this paper elaborates on the whole process safety control of information room relocation in three aspects∶the relocation process control,personnel management and emergency management.The paper sums up a set of safe,convenient and unique work experience and explores a viable safety control mode for information room relocation.
network;information system;relocation;safety control
F416.61
B
1007-1881(2015)10-0058-03
2015-08-05