陈元赫
昆仑银行股份有限公司西安分行 陕西 西安 710000
随着商业银行的不断发展和进步,其业务范围也得到了一定的延伸和拓展,由此使得商业银行内部业务系统的数量和功能不断增加,进而使得数据中心运维人员的工作变得更加繁杂。就目前商业银行的运维工作而言,尽管部分银行的运维管理技术已经得到了较大的发展和进步,但其并未为运维人员带来真正的解放,比如日常的巡检任务仍需要运维人员进行手动操作,这不仅增加了运维人员的工作任务和工作强度,也使得商业银行的运行成本有所增加。因此,如何实现标准和高效的智能化运维管理是目前商业银行亟待解决的问题。
就目前商业银行运维人员的工作现状而言,只有当异常情况发生且对系统造成一定影响时才会被运维人员所注意到,而后再采取行动来予以解决,这种情况通常被称作“救火式”运维。顾名思义,这种运维方式通常较为紧急且关键,由此使得其对运维人员带来了较大的工作压力,因此,长期处于这种被动的工作环境中使得运维人员极易产生疲倦等负面情绪,进而使得其工作积极性受到较大的影响[1]。
通过对商业银行运维人员的工作情况进行调查和研究,发现目前其运维管理过程中所出现的困难和挑战主要体现在:其一,银行的运维管理系统较多,其所涉及的产品群、应用程序数量和类别较为繁杂;其二,银行所使用的设备较为复杂,其服务器、存储及网络等设备的型号种类较多;其三,运维系统的标准难以统一,其操作系统、数据库及各种部件的种类和版本各异,进而使得运维标准过于混乱。
随着科学技术的不断进步和应用,IT运维管理技术得到了较大的进步,同时也出现了各式各样的运维工具,但就目前商业银行的运维管理部门而言,很多运维人员并未使用现代化的运维工具,而是依然通过手工的方式来进行一些烦琐的操作,比如在给中间部件打补丁的时候,很多银行的运维部门仍需要运维人员进行逐一登录设备来实现该操作,由此使得自动化运维工具的使用频率不高。因此,作为银行的运维管理人员,应当重视运维相关人员自身专业素养的提升,通过定期或者不定期的培训或讲座来提高员工的专业素养,从而使其能够更加了解该行业的发展现状,同时通过技能培训来提高自己的系统操作熟练度,进而使得商业银行能够更好地实现互联网技术与银行业务发展的融合。
运维管理体系是商业银行数据中心实现智能化运维管理的重要前提条件,只有完善和科学的管理体系,才能够使得商业银行的运维管理在一个有序的环境中得以发展和进步。通常而言,一个完整的运维管理体系包括管理制度、管理平台、运维团队等部分组成,只有当运维管理体系中的每一个组成部分都发挥出自身的作用时,商业银行数据中心的运维工作才能得以有序进行。在运维管理的过程中,其应当以运维管理制度为重要基础,以先进的运维管理平台为重要手段,以相同的运维管理目标为导向,各组成部分独立且配合,这样才能够使得运维管理工作实现其预想的效果。
对智能化运维而言,标准统一的运维监控体系是必不可少的元素,其贯穿了整个运维的过程,并对运维管理过程起到一定的监督作用,这样能够为商业银行数据中心的运维管理工作质量起到一定的保障作用。在具体的运维管理工作中,运维部门通常采用分层的方式来进行监控,而后再通过统一的数据总线来对不同维度的监控数据进行标准化处理,从而为运维管理人员提供有效的比较基础,进而使得运维人员的后续分析和决策工作更加便捷。对于整个运维管理体系而言,监控体系的作用主要体现在监督和记录上,其不仅能够使得运维系统的运行更具保障性,也能够在一定程度上推动运维管理工作整体的发展和进步[2]。
要想使得商业银行数据中心运维管理工作的效率得以明显提升,其离不开先进的智能化运维工具。智能化运维工具既能够提高运维服务的质量,也能够在一定程度上为商业银行节约一定的运行成本。就智能化运维工具而言,其不是简单地将银行的业务与互联网技术进行简单的结合,而是在总结和提炼的基础上进行一个系统化的处理,从而使得商业银行数据中心的日常巡检、系统故障修复等方面均实现自动化,由此可见,其不仅规范了运维管理的操作流程,也在较大程度上提高了运维管理工作的效率。
就流程服务而言,流程自动化是其中十分重要的应用场景,其在银行业务处理方面的应用具体体现为流程机器人。在商业银行中,流程机器人主要是用在一些工序简单且重复的场景中,其不仅能够提高业务处理的效率,也能够在一定程度上降低出错的频率。以商业银行的信用卡审批流程阶段为例,银行的风控人员会花费大量的时间来验证和审批客户的信用卡申请,并且会涉及客户的信用背景调查,由此使得客户的等待期较长,进而使得客户会产生一些不满情绪甚至取消申请,但通过利用流程机器人,相关软件可以跨系统实现客户相关信息的收集工作,从而通过相关的信用背景调查来进行快速决定,这不仅加快了信用卡审批的速度,也在一定程度上简化了相关流程,使得银行的运行效率得到了较大程度的提高[3]。
就资源管理而言,其主要涉及实体管理、成本优化和动态可视化三个方面的场景,其中,实体管理主要适用于物联网资产管理和机器人巡检方面,成本优化则包括设备、CPU效率等方面的优化,其可以通过发现资源中的短板而后通过优化不同服务器的配比来实现成本的智能优化,而动态可视化主要是利用三维可视化技术来整合相关设备的资源、规范相关设备的流程等。就数据中心的日常巡检工作而言,运维人员应当合理利用智能化技术,尽可能减少人工的干预,通过编写不同的自动巡检程序来适配银行不同型号的设备或系统,并且尽可能保证定期进行自动巡检,进而使得日常巡检的效率得到较为明显的提高,这不仅节约了银行的运营成本,也使得银行的发展更加符合现代化趋势,从而使得银行在金融行业中能够具有较强的竞争力。
就监控管理而言,其主要包括异常检测和关联分析两种应用场景,其中,异常检测主要涉及指标、数据源或者文本日志等方面的异常检测,而关联分析则主要指多指标关联或告警关联,其将相同或者同类的时间进行有效的关联,从而使得运维人员能够更快地进行定位和操作。以银行的总账信息为例,在编制银行财务报表的过程中,相关人员需要从多个独立的系统中获取资产、负债等大量准确的信息,而后再根据财务报表的编制规则来进行编写,以便为相关利益者或银行管理者提供相关的信息,通过利用智能化运维技术,能够将不同系统的信息进行关联,这样不仅大大提高了信息收集的效率,也减少了出错的概率。除此之外,在客户账户出现短时间频繁转账的情况时,如果客户未开通短信提醒或者网银提醒等,则其不能够在短时间发现自己账户可能存在的安全隐患问题,但如果利用自动化运维系统,则其能够更加快速地识别出账户异常的情况,从而为银行相关人员和客户发送提醒,这样不仅能够提高客户账户的安全性,也能够使得银行得到更高的客户满意度,这对银行未来的发展具有一定的积极作用。
就操作管理而言,其主要涉及故障修复和智能变更等方面,通过自动化平台的故障分析后,即可实现自动的决策操作,但这对于运维人员的经验有着较高的要求。运维人员应当具备足够的专业素养和丰富的工作经验,从而通过机器学习等手段将经验转化为系统可用的数据模型,进而使得系统能够通过分析等流程来实现自动决策,这样不仅降低了运维人员的工作任务量,也在一定方面激励运维人员专业素养的提升[4]。
就安全管理而言,安全合规分析是智能化运维的一个重要场景,其主要包括发现潜在安全问题和对敏感数据告警两种具体应用。其中,发现潜在安全问题也被称作安全态势感知,即是指运维系统通过从数据中挖掘管理员的行为,然后发现其中潜在的安全或合规问题,而对敏感数据告警即是指运维系统对一些较为敏感的后台处理或后台处理,并且通过一定的关联分析来进行提醒和告警,从而分析运维过程可能出现的问题,从而达到提醒或者预测的效果。对于商业银行而言,反欺诈是一个十分重要的环节,客户的信息安全是银行相关人员必须重视的问题,就传统的反欺诈管理而言,商业银行主要通过人工的方式来制定相关的检测规则和流程,但随着时代的进步,欺诈的数量和方式不断增多,仅仅依靠人工是完全不够的,因此,商业银行则可依靠智能化运维系统来实现欺诈行为的识别和标记,通过利用“if-then”方法来识别客户账户潜在的欺诈行为,并且进行相应的提示和警告,这样不仅提高了客户账户的安全性,也大大提高了反欺诈的效率,进而使得客户对银行有更高的信任度。
就分析决策而言,其主要涉及应用分析、故障诊断和故障预测三种场景,其中,应用分析主要根据传统的数据来进行发展趋势的预测,比如客户喜好、交易量等方面;故障诊断主要是指故障的定位和原因分析,而故障预测则是对潜在的故障进行预先的推测,从而为运维人员带来一定的提醒作用。通过使用智能化运维系统,商业银行可以利用相应的程序来收集客户的信息,并且按照自身的风控标准来进行相关信息的分类和整理,从而为风控人员提供更加准确和明晰的结果,这不仅节约了商业银行的人力成本,也大大提高了客户信息收集的效率,进而能够为风控人员节约更多的时间来进行分析和决策[5]。
随着互联网技术与金融行业的不断融合,数据中心的运维管理对商业银行的发展发挥着越来越重要的作用,由此使得运维人员的工作压力有所增加,因此,商业银行管理人员应当重视运维管理的智能化发展,并且不能过度追求其智能化的实现速度,只有在不断的尝试和探索中才能使得自身银行的发展与智能化运维进行有效的融合,进而使其成为推动银行发展的重要工具。本文首先分析了商业银行数据中心传统运维的运维人员工作积极性不高等现状,而后详细说明了智能化运维的特点和优势,最后阐述了智能化运维在流程服务、资源管理等方面的具体应用,希望能够带来一定的启发意义。