随着信息科技的不断发展,以及各种商业银行业务的迅速发展,运维领域遇到的问题也越来越严重,其中主要是传统运维方式需要改变,另外就是需要完善主动运维规范体系。传统的运维方式也就是我们平时说的“被动式”运维,这种方式只有在发现问题后起到作用,根本无法适应银行业务的迅猛发展,严重影响开发部门和运维部门的沟通。而且因为商业银行业务多种多样,技术队伍庞大,所以在技术类、组织类、管理类规范等方面不够完善。因此,对于现在商业银行应用的统一运维规范体系,不仅可以防范应用系统运行风险,提升应用系统的稳定性和可用性,而且通过有序的组织结构和精细的流程管理以及合理的技术规范,来保障主动运维工作的稳定推进,有力支撑银行业务发展。
商业银行应用系统的主动运维是一种现代管理理念,指对一切可能发生故障或者突发情况下提前进行处理的一种运维模式。相比于传统的运维模式而言,它可以从技术和管理两个方面实现商业银行应用系统的运作,一方面可以通过完善的运维流程、合理的运维规划去提升主动运维管理水平;另一方面,通过建设智能化、自动化的运维平台来处理大量的运维工作,明显提高工作的效率。而且传统的运维支撑工具自动化程度不高,不能完全自动的过滤海量的告警信息,也不能监控到所有的运维对象。传统的运维流程并不规范,导致运维工作出现混乱,再加上运维人员的主动意识比较弱,同时一些商业银行也缺乏相应的激励措施,所以运维人员的主动运维意识也不高,根本无法起到预防突发事件的作用。因此主动运维改变了传统运维模式的经验运维以及人海战术等特点,还提升了商业银行应用系统的智能化水平,极大的节约了运维成本,提高了运维工作效率。
对于主动运维规范体系中的技术类规范来讲,首先需要注意的一点就是应用运维需求,第二点需要注意的就是应用监控的规范。应用运维不仅仅需要满足业务功能,还必须得满足一些与运维工作相关的需求,分别得满足运维功能的五大特性,资源使用性、可维护性、可靠性、功能适应性和性能效率性。其中,可靠性中包括系统可用性、异常处理、容错响应三大指标;可维护性则包括报错信息、版本升级、数据备份与清理三大指标。因此,针对于具体应用的不同系统运行特性时,要设计详细的运维需求说明,然后根据应用系统制定开发每个需求项,而且这些运维需求要经过项目经理、总工程师和业务经理的评审,只有通过之后才可以实施。对于应用监控规范,必须要全部统一接口和设计标准,才能够集中监控管理平台建设,规范被监控系统与平台间的信息交流,同时可以将告警事件和性能数据接入集中监控管理平台,然后将统一的数据采集、数据处理和数据表现通过监控管理平台展现出来。
主动运维规范体系的基础和保障就是组织类规范,而且完善、健全的组织结构能够有效推动商业银行主动运维工作的开展,因此改进和完善传统组织架构体系是实现主动运维规范的先决条件,因此从全局出发要先对本部门相关的研发和运维工作实现统一的指导和督促,并且统筹运维管理工作和安全生产办公室。其次,我们还可以在运维部门设置运维经理岗位,设立研发总工程师和运维总工程师,实现和项目团队的零距离沟通,贯彻运维规范、组织运维实施,进而推动运维与开发的协作。而且还应该改变之前运维部门与开发部门相互独立的情况,重新调整组织结构,从而加强了商业银行的统筹管理、促进运维与开发的交流,达到主动运维的目的。
管理类规范首先需要做到评审规范,其次是支持规范,最后还需要对一些机制进行改革,从而实现主动运维规范。对于评审规范,主要包括运维需求评审规范和运行架构评审规范。也就是说,在项目需求研制阶段,我们需要对运维经理收集汇总的运维保障需求进行评审规范,确保这些运维需求的适用性和合理性。当然也需要运维经理修改完善评审时给出的意见。而运行架构评审则是由科技部门组织,并且在项目团队的配合之下进行架构设计及架构评审。应用架构、数据架构、基础架构和运行架构这四个方面是评审的主要内容。对于支持规范则包括应用变更管理规范和测试技术支持规范,应用变更管理规范以变更评审为核心,统一原则、规范操作为原则,强化变更评审意识,控制变更风险,而且商业银行运行事件多发生于应用系统投产和变更期间,因此做好投产阶段的变更管理是防范风险的重要一环。在改进机制这一方面,主要包括问题解决优化机制、事件协同分析机制。在应用系统投产后,对于那些大量发生且加重的事件要进行彻底的调查和修复,从根源上减少这一类事情的发生,保障应用系统的安全稳定运行,而且对于改进这些问题的意见和一些措施,都需要由安全生产办公室收集、记录并且分析,有效的规避以往侧重事件原因调查而忽略的总结整改现象。
随着商业银行的不断发展,对主动运维规范的研究也越来越透彻,而且主动运维规范的优势也越来越大,不仅可以预防突发事件,而且还可以提高运维工作的效率。商业银行应用系统主动运维规范主要包括有技术类、组织类、管理类规范三类。希望未来的主动运维规范可以给商业银行带来更大的发展空间。