杨雪霁
随着信息化技术的发展,信息化在科研单位开展科研和生产活动、提高组织竞争力等方面发挥着极其重要的战略作用。然而,随着科研单位信息化建设的不断深入和完善,硬件设备、软件资源、应用系统和数据量的日益增加,信息化的运维工作已成为不堪重负的问题。因此,必须提升信息化运维管理的效率与质量,保证信息系统安全、稳定、高效的运行,从而有效保证科研工作的顺利开展。
(一)运维工作涉及范围广,运维难度大
科研单位信息化有别于其他企业,信息化建设的特点是“麻雀虽小,五脏俱全”。信息化的设备总数随不多,但涉及范围却一点也不少,包括以机房、综合布线、UPS、空调等为主的基础设施;以服务器、交换机、存储系统、防火墙等为主体的硬件设备;以操作系统、数据库系统、应用系统等为核心的软件系统;由此可见,信息化运维其涉及范围广,专业性强,运维难度大。
(二)运维问题响应处理及时性强,工作压力大
随着信息化应用的不断深入,科研单位对信息化的依赖性与日俱增,信息化已成为是科研工作的正常开展的基础。信息化运维工作不但要做到防患于未然,尽量避免问题的发生,同时还要做好应急处理。一旦信息化系统出现问题,必须第一时间响应并及时解决问题,将影响降到最低。因此,信息化运维工作及时性非常强,运维人员工作压力大。
(三)运维管理制度不完善,操作流程与衡量标准不统一
目前科研单位虽然制定了信息化运维管理制度,但是大多都流于形式,没有制定详细的运维操作规程和质量衡量标准,这样就造成了运维管理制度与实际工作并不能有效结合,对运维工作的质量、效率、工作量等无法进行评判,无法对运维人员进行有效的考核,没有有效的评价机制,导致信息化运维管理制度失去约束力。
(四)运维队伍建设不到位,绩效评价机制不完善
一方面,信息化运维对专业技能要求高,而对运维人员的技术相关培训不到位,导致技术水平滞后,造成运维水平落后。
另一方面,信息化运维人员在科研单位作为支撑岗位,往往存在不受重视的现象,绩效评价机制不完善,出现相关人员待遇低、岗位低、职称低的现象,导致人才流失,人才队伍建设滞后等现象。
(一)建立信息化运维管理体系,实现运维管理的有效机制
信息化运维管理涉及到众多信息系统、硬件设备、运维数据等,因此,科研单位可以充分运用当前流行的ITIL管理流程, 依据自身特点总结出与自身相符的规范的管理。
首先,运维管理体系要明确运维的对象和内容。信息化资源是运维工作的对象,必须建立资源基础数据库,全面掌握信息化资源的基本信息、详细配置、设备状态等情况,明确运维工作的具体内容,才能有效的开展信息化运维工作。
其次,运维管理体系要明确问题事件影响度和紧急度,并实现分级管理。通过分析单位信息化系统会产生的事故,并对事故的影响度、紧急度来进行分级。通过分级管理,制定好应急预案处理,明确相应的响应时间、解决措施和解决方案,从而及时处理问题事件。
再次,运维管理体系要明确管理责任制。明确运维团队的人员组成,人员的具体工作内容与职责,同时做到岗位备份机制,避免工作落实不到位。
总之,通过信息化运维管理体系的建设,完整、全面、细致的规划好运维工作,依靠技术和管理手段,使得每项运维工作有据可查、有章可循、有器可用,保证科研单位信息化运维工作顺利开展。
(二)加强日常巡检工作,动态掌握信息化设备的状态
日常巡检全面掌握信息化设备的状态,是开展运维工作的重要手段。巡检工作可以按照不同的巡检对象和内容,建立周期性巡检工作机制。例如,可以分为每天、每周、每月、每季度巡检。每天巡检工作可以固定时间开展,进行例行检查,例如登录应用系统检查是否正常、机房是否有报警、硬件设备是否有故障等;每周巡检工作,运维人员可以对设备使用状态进行检查、分析,一旦发现问题及时解决;每月、每季度巡检,可以针对某些基础设施或是部分外包维保的设备,监督运维商开展相关的运维服务并检查完成的质量和有效性;
巡检工作发现的问题及时处理,一方面通过检查最先发现问题,在问题没有扩散或是影响最低时及时解决问题,避免问题严重化;另一方面,要追溯问题的根源,不断优化系统的架构,改善架构设计的不完善和不合理的地方,避免单点故障的产生,保证系统运行正常。
(三)加强信息化运维工作知识的储备,积累运维方法和问题处理方案
信息化运维工作中日常问题的处理,是信息化运维工作能力的体现。建立知名故障库,通过对运维工作中每次遇到的问题都需要详细记录,尤其是对新遇到的问题,记录问题的表象和解决问题的方法,形成知名的故障库,并逐步完善该库,储备运维知识,从而指导后期运维工作中问题的处理,缩短解决时间,提升工作效率。
建立信息化运维工作手册,制定详细的运维操作规程和质量衡量标准。信息化运维管理人员建立且不断完善信息化运维管理工作手册,作为日常运维操作的参考和指导,对信息化应用系统、硬件设备的运维内容、操作流程、运维方法、注意事项进行详细的描述,将运维管理工作书面化、标准化、规范化,提升运维管理水平。
(四)明确运维界面划分,建立内控与外包相结合的运维管理模式
信息化运维作为科研单位信息化工作的支撑,应建立符合自身实际情况的运维管理模式,建议采用内控与外包相结合。
将信息化的基础设施和硬件设备的保修等运维采用外包的方式,如机房空调、UPS、服务器、存储等设备的硬件维修外包,在服务外包过程中,我们坚持“以我为主”,保持对系统建设运维的控制权。但关键技术、重要文档和关键权限必须控制在自己手中,关键操作如系统的集成、变更工作不能外包。按照“服务外包、责任不外包”的原则,加强运维责任的监督落实,采取定期检查、事后审计的方式对服务外包进行监控管理,建立风险防控三道防线。
内控管理则针对科研单位内部的核心应用系统,实现内部自主运维管理。核心应用系统是科研单位赖以生存和发展的基础,是结合本单位业务和管理的特点建立的应用系统。因此,必须实现内部管理,系统日常运维由科研单位内部人员自主运维,一方面可以不断优化完善应用系统,另一方面保证当应用系统出现问题时,可以及时处理与解决。
(五)加强人才队伍的建设,提高运维人员自身技术与管理水平
人才队伍建设与能力提升,是信息化运维工作水平提升的重要途径。通过定期组织相关专业的技术培训,提升运维人员专业技术水平;通过经常性开展技术研讨和经验交流,提高运维人员团队协作能力;通过参加一些产品宣讲了解当今主流信息化技术与产品,提升科研单位信息化可持续发展的先进性。由此,通过不断对运维工作人员开展技术培训,自学、外部培训等,从而提高信息化运维技术水平。
随着科研单位信息化建设的不断推进,信息化系统和硬件平台的逐渐增加,运维管理任务日益繁重。为了保证信息化运维工作的顺利开展,需要按照运维原则和运维范围,规范运维行为,明确运维需求和目标。通过对信息化运维工作实现规范化、专业化、流程化、标准化的管理,提升运维工作的技术水平和管理水平,保证科研单位信息化系统安全、稳定、高效的运行,从而保证科研单位科研工作的顺利开展。
作者单位:中国科学院电子学研究所