本刊记者 | 黄海峰
辽宁移动探索“小机x86化”成星星之火点亮运营商数据库转型之路
本刊记者 | 黄海峰
通过在x86服务器上部署分布式软件的方式,辽宁移动把所有服务器的本地硬盘组织成一个虚拟存储资源池,提供块存储功能。
“又慢、又贵、利用率又低。”这是中国移动多省现网数据库的真实写照。
曾经强大的运营商数据库,采用“小型机+老旧式传统存储”方式部署,但面对业务的快速发展、数据量指数式增长,开始存在业务风险高、投资费用高和资源利用率低等问题,已经无法满足新类型业务发展的需求。
现在,运营商已到了不得不改变的时刻。在诸多改造方案中,小型机“x86化”探索如“星星之火”在全国各地燃起。而中国移动辽宁公司(以下简称辽宁移动)携手华为进行的分布式x86数据库改造十分成功,其实践经验被业内所推崇。
辽宁移动是中国移动在东北的重要省公司,其下辖14个市级分公司,56个县级分公司。辽宁移动正不断开拓进取,创新发展,致力于肩负起“创无限通信世界,做信息社会栋梁”的企业使命。
目前,辽宁移动采用“小型机+老旧式传统存储”的方式部署了60多套Oracle数据库,数据库小型机60多台,承载计费、网管、管信、数据增值业务、位置业务等100多套系统,数据总量近700TB。
但是这些数据库系统慢慢成为了业务发展的重要瓶颈,主要问题是“慢、贵、低”。
具体而言,一是在业务风险方面,随着业务数据不断增长,现有数据库数据运行越来越慢,导致业务处理周期越来越长;现网老旧存储故障恢复需要手动从硬盘恢复数据,故障恢复时间长,业务在故障恢复期间无法提供服务。
二是扩容投资、维保费用高:如某厂商的DMX 4存储必须整柜扩容,每次扩容成本非常高昂;维保服务费高昂,甚至高于新购设备价格。
三是资源利用率低:不同功能小型机间负载差别较大;部分设备负载峰值较高但均值很低,长时间处在低负荷运转状态。
这种糟糕的现状,让辽宁移动IT系统运维人员苦不堪言。工程师们特别希望有新的方案带来4方面的改变:降低业务风险、提高业务性能、降低维护成本和提高资源利用率。
比如在降低业务风险方面,新方案要能解决老旧传统存储故障导致业务数据库无法继续使用的问题,提高业务连续性,解耦软硬件关联;存储需要快速部署,能够按需分配;提高业务可用性、连续性和稳定性。
为解决上述数据库面临的问题,两条发展路径浮出水面。路径一是开源数据库解决方案,颠覆性地变更,传统应用大量修改,部分复杂关系数据模型无法支持。路径二是分布式x86数据库解决方案,分布式存储+x86实现I+E替换,数据库无需修改。
到底哪种方案更适合辽宁移动呢?通过测试验证发现:互联网公司的数据类型以非结构化和半结构化为主,因此适合采用开源非关系型数据库解决方案;而辽宁移动公司主要处理结构化数据,且业务系统改造难度极大,因此路径二更适合辽宁移动现状、更易实现并节省投资。
经过仔细地对比测试,辽宁移动最终选择了华为FusionStorage解决方案:通过在x86服务器上部署分布式软件的方式,把所有服务器的本地硬盘组织成一个虚拟存储资源池,提供块存储功能。
据了解,传统架构被改造为分布式x86架构,经过了应用层、平台层以及数据层“三步走”。第一步在应用层,辽宁移动实现上层应用系统的分布式改造;第二步在平台层,辽宁移动搭建分布式X86集群环境,安装分布式存储系统和数据库管理系统;第三步在数据层,辽宁移动将业务系统数据从集中式数据库导出,并导入至分布式x86数据库中。
其主要工作包括以下5方面:一是计算节点:高性能x86服务器替代传统小型机;二是存储节点:FusionStorage+服务器本地存储替代传统老旧式存储,存储资源统一管理,I/O性能大幅提升;三是网络:InfiniBand网络替代传统SAN网络,存储带宽由10G扩展至128G;四是备份:存储平面备份替代传统带库式备份,无须通过物理带库和虚拟带库进行数据备份,直接将数据库数据备份至分布式备份资源池;五是容灾:分布式容灾复制替代传统集中式容灾同步,分布式x86数据库系统将源数据打散后分别同步给多个目标服务器,通过软件实现了分布式容灾数据的一致性复制。
以业务支撑的经营分析系统为例,随着数据量的快速膨胀,日报、月报业务的处理时间需要10个小时以上。系统主要的性能瓶颈是高端存储与小机之间的I/O吞吐。
系统采用大吞吐、低时延的InfiniBand交换机打破FC交换机的网络带宽瓶颈;采用分布式存储技术,彻底打破高端存储的机头限制,实现性能的线性扩展;利用SSD存储介质及分布式Cache技术,让I/O性能大幅提升。通过对经营分析系统的现场测试,月报性能可提升到1小时15分钟。
此次改造项目,辽宁移动的收益十分显著,具体表现在系统提升、成本节省以及未来发展方面。
首先,改造后应用系统性能实现大幅度提升。针对100T经分数据进行分析处理,效果明显,处理时长由10小时18分缩短至2小时9分,性能提升5~6倍;支持最大并发用户数由400增加至1000。
其次,经济效益表现出色。辽宁移动采用通用的x86服务器,代替原有的小机及高端存储设备,降低IT建设的整体投资;同时有效地降低了主机服务器的维保费用,以替换1台小型机为例,每年可节省维保费用59万;以替换1T传统老旧存储为例,每年可节省维保费用1.8万。
最后,社会效益十分突出。辽宁移动采用新的数据库云平台,可以实现日报、月报的及时性,进而提升服务质量和用户满意度;通过降低小型机和高端存储的采购数量,实现节能减排、绿色环保的健康持续发展;有力地推进了辽宁移动业务支撑网建设卓越运营体系的进程。
华为方面表示,在该改造项目实施初期,辽宁移动各方面经济效益即得到很大提高,相信随着传统数据中心向云计算业务中心转型的不断深入,一定会为企业创造更大的经济收益。