朱华樑
如今,分布式云架构应用越来越广,但随着IT应用的扩展后,资源共享才能促进共同进步。
运维管理的挑战
江西省农村信用社(简称“江西农信”)目前共有2400多个网点,是江西联系广大农户、服务农村社区的金融主力军,今年1月份其贷款总额达到1万亿元,日均交易在千万元左右。如今IT人员总共有60余名,具体负责基础架构运维的只有3位,服务器设备多达700多台。3位IT运维人员支持如此庞大的基础架构,工作量非常大,随之而来的问题也很明显:
资源使用效率低:在上云之前、未曾虚拟化时,硬件资源几乎都是每个系统单独购买、单独使用的,因此经常存在冷热不均的现象,部分系统可能资源不够用,有些系统可能资源利用率非常低,这也是无奈之举;
上线速度慢:互联网金融需求增多后,上线速率冲突变得愈加严重;
运维工作量非常繁重:由于操作基本是手工的,无论是上线之前还是上线之后的运维,都是难以承受的;
规范和标准落实难到位:出于架构管理的职责要求,江西农信制定了很多技术规范、文档,要求从开发、测试到生产一一落实,但是如果没有工具、没有抓手落实,经常会有一些遗漏。
牵手IBM 漫步云端
江西农信的痛点包括了节能减排,主要是指PUE,国有企业原则上机房的PUE要低于1.5;利用率方面,机房设备资源利用率如果可以提高,设备的数量就可以下降,利于节能;可用性与云计算的关联,云计算一般都是分布式应用,分布式之后在应用的层次上高可用性提高了很多;自动化更不在言下。
2015年在IBM的帮助下,江西农信制定了整体的工作思路和初步的规划。
基础是在IaaS层对基础设施环境的管理,首先解决了资源利用不高的问题。换而言之,不仅可以交付基础设施部署,也可在上面尽可能做一些自动化的运维工作、部署、配置、变更等;在此之上做总体的云管理平台的管理和调度;再往上做一些编排,可以形成数据库、中间件,完整的PaaS環境。
江西农信总架构师王志坚介绍道:“我们的云平台不是一个独立的系统,而是云平台和企业整体的互联互通,整个企业内部IT不是一个孤立的系统,云平台亦然。按照这一思路我们开发测试和云平台进行对接,云平台留给IT运维人员,外部的流程留在原系统里,体验更好。”
云平台逻辑架构设计以OpenStack为基础。云平台根本概念是平台+服务,最上面一层关键在于服务,主要是服务的编排、交付,包括服务的流程。而在服务之下需要很多支撑,云计算里最重要的是存储、计算和网络,即软件定义存储、软件定义计算、软件定义网络。
IBM拥有基于OpenStack的发行版本ICO,江西农信早在两三年前已开始使用ICO,其架构特点很明显:跨平台融合,兼容Power和X86;开放对接,包括对不同厂商的硬件设备、对公有云和私有云的对接;以及运维。
云管理核心的组件主要是负责编排、BPM流程设计,可通过KVM预控制器管理KVM虚拟化环境,也可通过VMware管理其数据化;Power预控制器对接PowerVC,实现Power数据化资源管理;还有网络管理。
王志坚认为云平台最关键的因素是OpenStack和HEAT。上云前江西农信曾考虑过走何种技术路线,而王志坚的直觉是选择OpenStack。为何如此信任OpenStack?OpenStack由于开源,已形成一个庞大的生态系统,里面任何一个模块都有非常多的开发者和公司在参与。在2015年,OpenStack已成为市场上绝对的主流之选,江西农信选择其商用版本,省时省力。
另外一个选择是HEAT。当用户想实现比较复杂的环境,数据库、中间件,甚至中间件集群、数据库集群,则需要一个强大的编排组件来实现,在OpenStack里就是HEAT模块。江西农信通过它实现了开发测试环境95%的应用场景资源交付,95%的资源申请提交后,无需任何人为的手工操作即可完成。同时其开源能力很强,适用场景多。
高质量 高效率
江西农信上云后,最直接的效果是资源和成本的下降,包括生产。使用云平台后,机器设备的购买减少了68%,运维工作量也得到大幅精简。其次是上线效率,节约了90%的时间,仅需原来10%的时间就可完成全部的工作量。最后是运维压力减轻,3个IT运维人员5年来数量未曾改变,但如今运维质量却是有保证的。
王志坚认为,2013年可谓是江西农信的二次创业。虽于2004年成立,但在2005年江西农信就完成了数据大集中,实现新业务系统的上线。2013年,启动江西农信后援中心建设后,引入IBM PureApplication集成了专家的云平台,来满足后援中心项目的开发测试和投产需求。“当时令我们震撼的是,为了满足后援中心项目的开发测试和投产的需求,用了IBM PureApplication,从机房到上线2天就可完成。里面包括虚拟机、引擎等软件,最多一两个小时就可以完成部署。据我了解,相同的工作量,如果由人来工作,一周都不可能做完,还有可能出错。”在王志坚看来,高效,不言而喻。
“我们当时还做了SVC。当时引入SVC最开始考虑的是高可用,引入之前经常是一个项目买一个存储,管理不便,维护存储时提心吊胆,万一出问题怎么解决。因此,2013年我们引入了SVC,把关键应用存储集中在一起,实现了双备份。当初引入SVC是为了实现高可用、存储的集中管理,但是没想到第二年引入了PowerVC,才知道PowerVC最佳搭档就是SVC。因为存储如果是各种品牌的,PowerVC对接起来相对复杂一些,由于我们SVC已落地,PowerVC只需要跟SVC对接,可直接对存储进行管理和分配。”他说。
如今PowerVC和PureApplication并存。王志坚希望用相对开放的技术路线去扩展、升级,PureApplication相对来说比较封闭,用于特定的场景。如果真是构建一个整体的统一的云平台,还是OpenStack这样的产品更适合,PowerVC的核心也是基于OpenStack。2015年江西农信引入了KVM环境,利用ICO实现了生产虚拟化环境管理,测试环境的优化更进一步,不仅管理KVM虚拟化,还实现了与PowerVC的对接。2016年主要是编排和流程的对接。
江西农信始终坚持以加快发展为第一要务,以极大的精力去开拓业务,提高效益。
革命尚未成功,同志仍需努力。王志坚认为还要进一步提升:在SDN层面,IaaS网络未来将考虑三层设置;在各管理平台的对接上,基于现有的程度再度提升;对于应用架构的云化,江西农信虽然是朝着分布式方向而设计,但在互联网弹性的需求上仍有一定的上升空间。
相关链接
关于IBM PureApplication
IBM PureApplication是一种混合云应用平台,用于快速和重复地为内部和外部云模式部署应用环境。应用部署通常需要编制脚本和配置任务,以便部署和管理应用、应用环境以及底层基础架构。IBM PureApplication有助于简化和自动执行这些任务和流程,从而加快应用交付,降低成本,减少错误。