天津市住房公积金管理中心软件运行维护体系探索

2014-04-29 15:59潘明
中国管理信息化 2014年6期
关键词:运行公积金维护

潘明

[摘 要] 天津住房公积金管理中心经过20多年的信息化发展,已经完成了一定程度的信息化建设,已进入一个比较高的阶段;对于软件运行维护工作怎样管理、探索新模式调整下软件系统运行维护及监控怎样工作的方法、怎样才能设计出适合中心新模式架构下的安全、规范、高效、便捷的软件运行维护工作模式这几个问题成为笔者作为一名在信息部门工作12年的软件运行维护科负责人本篇文章研究的背景。

[关键词] 公积金;软件;运行;维护

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 06. 024

[中图分类号] TP307;F272.7 [文献标识码] A [文章编号] 1673 - 0194(2014)06- 0038- 03

1 软件运行维护现状分析

根据国际软件分析公司Gartner Group的调查发现,在软件运维过程出现的问题中,源自技术或产品本身 (包括硬件、软件、网络等)方面的只占了20%,而流程失误方面的占40%,人员疏失方面的占40%。流程失误包括软件变更管理没有做好、超载、程序上的测试错误或不完整等,人员疏失包括忘了做某些事情、训练不足、备份错误或无意识安全疏忽等。进一步分析上面所述的80%问题方面,中心软件系统运行维护过程中的问题,主要包括以下几项:

(1)主动的、定期的软件运维较少,大量运维活动还是被动式的。

(2)系统使用者提出的软件系统问题需经过复杂流程和漫长等待才能被解决。

(3)系统使用者面对太多的支撑部门,使用中出现的问题不知道该找哪个部门。

(4)对其他人提出的同类问题不知道,对已经收集的信息再次努力去收集。

(5)缺少一个集中的知识库来存放已知問题的解决方法。

(6)软件使用中提出的问题在外部单位和中心支撑部门间往返过多。

(7)对于提出的问题跟踪反馈不及时。

(8)对软件运维工作质量缺乏实际有效的控制手段。

(9)人员力量薄弱,非关键系统数量庞大因此占用运维人员大量时间。

目前的软件运行维护管理体系模式主要指导思想是在各个网络建立统一的软件运行维护平台,按照软件系统和时间两个维度划分工作环节,按照工作流程进行管理,重视操作、重视流程间的衔接。

2 调研相关单位及国际先进方法

笔者调研了建设银行和招商银行软件运维团队,其中建行系统运维管理完全按照ITIL架构要求并结合自身实际制定了一套运维管理体系。包含工作职责、岗位人员管理、生产需求管理、系统运行计划管理、值班管理、变更管理、配置管理、事件管理、问题管理、可用性与性能管理、数据管理、安全管理、机房及场地管理、运维服务商外包管理、服务质量考核管理共15项管理。

招商银行软件运维管理架构是在信息技术部下设运行中心负责软件系统的运维工作;运行中心设系统管理室、安全内控室、值班室等处理软件、硬件及网络的安全、软件系统日常维护、软件系统管理以及数据备份、异地容灾备份和数据手工查询修改工作。

目前涉及软件运维护管理工作的规范在国际上有3套体系,分别是ISO 9000系列、CMM软件成熟度体系、ITIL“信息技术基础构架库”体系。

结合中心实际工作,根据上面比较笔者将以ITIL框架标准体系为研究对象,作为中心软件运行维护管理体系的实践标准。

3 在中心软件运维管理工作中如何实施ITIL框架理念

在中心建立“一个中心、五个平台、八项管理”的ITIL中心核心系统软件运维实践框架(见图1);在“一个中心、五个平台、八项管理”中,一个中心和五个平台是架构是中心实施ITIL的骨架,在一个中心和五个平台基础上实现八项管理,八项管理是操作是在架构上运行的具体流程。

(1)“一个中心”即一个运维中心,起到服务台或运维坐席功能,是软件运维工作的对外唯一节点,对各部门对系统使用中遇到的各种问题进行分类,按照是否为核心系统、问题优先级、问题种类进行详细分类,分类后进入不同处理流程中。此外运维坐席人员还应产生和报告监控信息,按照运维手册处理日常运维计划和一般性系统使用问题。

(2)“五个平台”即:软件运维监控平台、软件运维事件响应平台、运维技术服务平台、运维知识库平台、运维辅助分析报表平台。由软件运维监控平台发现各类问题或由系统使用者提出相关问题后进入软件运维事件响应平台进行跟踪解决反馈。问题解决过程中进入运维技术服务平台和运维知识库平台,问题解决后回到运维坐席人员进行反馈。全过程完毕后进入运维分析报表平台使运维工作管理者方便监督。一个中心、五个平台及核心管理流程图详细说明了一个中心和五个平台以及核心流程之间的关系。

(3)“八项管理”即:事件管理、问题管理、变更管理、配置管理、发布管理、人员管理、运维服务水平管理、服务连续性管理。其中核心管理流程包括图2中5项管理内容:

①事件、问题管理:现场维护管理值班人员负责接收来源于电话、网络、监控信息的事件。对事件内容、事件边界、事件解决办法进行分析处理,从而制订出事件解决方案或从运维知识库中找到已有解决方案,解决后反馈相关人员。针对无解决方案或事件解决方案重大等情况进行决定是否对事件级别升级。

业务控制处室、审计、合规等部门负责人、主管领导负责对涉及核心系统和事件分类为较严重影响级别以上事件进行审批。人事处、纪检部门负责对相关违规事件及涉及责任人进行处理。

②变更管理。各处室负责提交变更申请,业务主管处室负责对变更申请进行审批。软件开发管理人员和开发人员共同确定变更操作计划和变更方案,变更操作计划和变更方案描述变更实施操作步骤、验证方法以及变更失败情况下的回退方案及应急措施。信息处负责人负责对计划方案进行审批。软件运行维护人员负责按照计划执行变更操作,软件开发人员负责辅助支持。

③配置管理。运维技术管理人员负责确定需要进行配置管理的元素及所有必需的配置属性,指定与软件运行环境中其他配置元素之间的关系,对配置管理数据库提供日常维护。信息处负责人负责对相关配置维护进行审核,软件运行维护科科长负责对相关配置操作进行授权和销权。

④发布管理。信息处软件开发管理人员和开发人员负责编制软件上线、变更、停用、注销计划(含回退),科技信息处负责人进行审核,科技信息处软件运行维护人员对审核通过的系统进行下发、启用、停用、注销操作管理,软件开发人员负责协助支持。运维水平管理是通过一套持续的协商、监控和报告机制维护和提升软件系统运维服务质量,满足中心系统使用人员的业务连续性需求。通过定义服务清单、服务目录、支撑合同、服务改进计划、服务质量计划等进行细粒度量化管理。

4 掌握软件运行维护先进理念的精髓、灵活运用

本文粗略地分析了中心软件运行维护工作的架构模式,其精髓就是将传统认为高科技的信息技术运行维护看作为一个一般的服务产品、一个可以用标准化工作流程运作的服务、一个可以分层次分模块管理和分类的服务,一个把复杂的软件系统运维工作分解成若干细小的标准的问题解决流程的系统体系。因此我们只要把握住运维架构体系的精髓建立起适合中心业务发展、适合中心的信息化建设阶段的就是一个好的软件运维体系,就能实现运维工作的最高阶段——价值实现;中心各项业务的发展和软件运行维护管理工作在一个互相驱动、交替上升的过程中共同完善。从而使中心软件系统运维工作与先进水平接轨,为中心业务的发展建立起一套保障支撑体系,实现软件系统运维的核心价值理念。

猜你喜欢
运行公积金维护
2022 年中国住房公积金缴存额同比增长9.53%
大学生缴存公积金,这个可以有
浅谈输配电线路运行与维护管理措施
秦山第二核电厂电气厂房冷冻水系统(DEL)运行分析
发射台中央控制系统典型故障分析及维护
广州:公积金贴息贷款方案公开征求意见
那些你不知道的公积金
1938年法入侵西沙 日军积极“维护”中国主权