宁夏银行业务中断37小时的思考

2014-08-26 15:20
中国计算机报 2014年30期
关键词:容灾中断宁夏

2014年7月1日15时37分,宁夏银行核心系统数据库系统出现故障,导致其全部业务中断超过37个小时,在此期间,全部业务只能依靠手工完成。回想几年前,记者曾经亲赴宁夏银行,现场见证了宁夏银行进行800公里异地容灾演练的全过程。前后反差之大不禁令人感叹。由宁夏银行此次事故再联想到其他一些银行今年曾出现的业务中断,对业务连续性要求极高且大多建有较完备的容灾系统的银行,为什么会频频发生业务宕机的事件呢?

银行业在数据大集中方面一直走在各行业的前列。数据大集中在带来业务管控便利性的同时也增加了数据的风险,这就像把所有鸡蛋放进了同一个篮子。在客观上,银行业确实面临着巨大的安全压力。

为了应对风险,银行业在容灾方面表现得十分积极,甚至容灾系统是否完备已成为银行能否开业的重要条件。但即使在这种情况下,业务中断现象仍然频发,这就要深究一下导致业务中断的到底是技术、管理还是其他方面的原因了。从已经对外公布的资料看,引发这次事故的主要原因是核心数据库版本严重老化,且从2007年至今未再购买维保服务,而在系统出现故障后,应急恢复处置不当和应急管理体系的缺失也是不容忽视的重要原因。

事件曝光后,记者也通过相关渠道了解了一些情况。据称,提供容灾解决方案的厂商在事故发生半年前进行巡检时已经发现了一些不好的苗头(比如备份盘被挪作他用),并向客户发出了公函,但没有收到回应。现在,银监会还在对整个事件进行调查,提供相关硬件和软件的厂商也都在积极配合调查。我们不好评论此次事故到底是由于技术上的原因还是管理上的疏漏造成的,但这次事故确实又给我们上了一课:技术虽然重要,但对容灾和安全来说,管理更重要。投入大把银子建成的容灾系统在有些单位中确实只是一个摆设,没有定期的容灾演练,也没有应急预案,当事故真正发生时,系统切换也就成了一句空话。

企业的IT系统正变得越来越复杂。在业务系统之外,企业还要建备份、容灾、监控等更多保障性的系统。对于企业来说,每一个系统的建设和维护都不能马虎,而且要实现全面的监控和均衡发展,只有这样才不会像“木桶理论”说的那样,因为某一块木板的缺失而造成整个木桶失效。

就在完稿之时,记者接到了一个提供数据中心服务的厂商的电话,他们也注意到了此次宁夏银行事故在业界引起的强烈反响,准备借此时机推广一下他们的数据中心机房安全评估服务。安全是一项系统工程,由诸多微小的细节组成,任何一个细节的疏忽都可能酿成大祸。愿此次宁夏银行的事故对各行业的客户都是一个警醒,让大家注意系统的均衡发展。(郭涛)

猜你喜欢
容灾中断宁夏
宁夏
跟踪导练(二)(5)
千里移防,卫勤保障不中断
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
宁夏
实施存储虚拟化及应用容灾保障医院信息系统业务连续性
AT89C51与中断有关的寄存器功能表解
FPGA内嵌PowerPC的中断响应分析