覃涛
(中国移动通信集团设计院有限公司重庆分公司,重庆 401147)
电信行业日益激烈的市场环境和不断提升的客户服务需求,对业务支撑系统的能力要求和可靠性要求越来越高,需要不断的优化和完善BOSS,以增强对业务运营的支撑能力。
随着某公司业务迅速发展,金阳生产中心机房空间和配套设施变得日益紧张,服务器响应时间变长、存储系统性能面临挑战、营业厅业务办理响应较慢等诸多性能问题逐渐显现。现有系统的部署及定位,日益成为业务支撑系统发展的瓶颈。
结合某公司BOSS双中心发展现状、对未来BOSS生产及容灾系统架构进行的分析与评估以及中国移动总部的战略指导,提出某公司业务支撑中心主机和存储设备的性能优化及能力提升策略。在确保数据安全的基础上提高业务连续运行能力,降低企业运营风险,提升服务质量和服务水平,增强企业竞争力,构建满足某公司长远发展同时也符合技术演进趋势的业务支撑系统架构。
通过大量的现网统计数据和科学的预测模型,准确的估算出主机和存储的能力需求,在移动业务高速发展环境下,为建设方案提供了合理的思路和决策数据。从方案源头为支撑系统的建设提供有效的参考依据,为企业精细化管理和运营奠定了基础。
某公司现网用户数据统计,2006年1月为458万,2011年8月为2 265万。6年时间,用户增长了1 800万。
移动用户的发展和人口增长密切相关,2007年底全省常住人口为3 975万,人口自然增长率为6.68‰,2013年底人口约为4 137万。
现网移动用户市场渗透率为50%,处于快速增长阶段。结合省公司市场目标和经济发展情况,假定2013年底移动用户市场渗透率为75%,则2013年底移动用户将达到3 103万。
结合全省人口发展情况、移动用户市场渗透率和2013年底某公司用户数,作为用户发展趋势预测的条件,通过曲线拟合等预测方式,得到2012年底用户规模。
用户发展趋势曲线图与多项式曲线类似,其中三次多项式曲线符合用户实际发展情况。假定2013年底用户为3 103万,通过曲线拟合,得到三次多项式拟合函数y=-35.19x3+5 199x2+43 861x+5 000 000。
2012年12月某公司用户数为:y=-35.19x3×(68+16)3+5 911×(68+16)2+43 861×(68+16)+5 000 000=2 954万,实际取值为3 000万。
话音话单统计,2006年1月为97 588万条,单用户话音月话单数为213条。2011年8月为2 265万条,单用户话音月话单数为177条。
话音话单是用户话务行为的重要体现。月人均话音话单由210条到180条,天人均话音话单由7条到6条,话音话单呈下降趋势。
短信话单统计,2008年7月为64 750万条,单用户短信月话单数为64条。2011年8月为94 624万条,单用户短信月话单数为42条。
数据话单统计,2008年7月为7 574万条,单用户数据月话单数为8条。2011年8月为226 782万条,单用户数据月话单数为101条。
数据话单是用户话务行为的重要体现。月人均数据话单由70条到140条,天人均话音话单由3条到5条,数据话单呈上升趋势。
根据以上统计数据,用户月话音话单呈下降趋势,月数据话单呈上升趋势,整体呈上升趋势。用户天话音话单为6张,数据话单为5张,合计为11张。
上述分析得到结论如下:
(1)2008年7月人均话音话单每天为7条,2011年8月为6条;2008年7月人均数据话单每天为3条,2011年8月为5条。
(2)人均话单每天合计为11条,用户话务行为由话音转向数据。
曲线拟合图趋势如图1所示。
图1 单用户月话单统计情况示意图
BOSS核心业务主要为营业数据库、账务数据库、账务应用、计费数据库、计费应用、结算数据库和客服数据库。
(1)CPU忙时利用率:在业务忙时,每5 min统计一次CPU利用率,1h内CPU利用率数据的算术平均值为CPU忙时利用率。
(2)CPU天忙时利用率:每天CPU忙时利用率最大值为CPU天忙时利用率。
(3)CPU月忙时利用率:每月CPU天忙时利用率的算术平均值为CPU月忙时利用率。
统计主机CPU天忙时利用率和月忙时利用率,通过对营业数据库等业务主机CPU天忙时利用率和月忙时利用率比对分析,CPU天忙时利用率和月忙时利用率趋势基本吻合。对主机的分析以CPU月忙时利用率为主。
BOSS业务系统单用户TPCC需求曲线拟合图趋势如图2所示。
图2 单用户TPCC需求曲线拟合图
BOSS主要存储对象是话单,结合话单数据,分析如表1所示。
表1 话单数与存储现状数据统计表
从BOSS 2.0到2009年紧急扩容项目建设,单话单存储空间需求上升了50%;BOSS 3.0和NG1.0一阶段,CRM和BOSS数据库分库后,单用户和单话单存储需求明显上升。
统计营业数据库、账务数据库、客服数据库、计费数据库、结算数据库和电子渠道数据库每月存储空间需求数据,结合话单数据得到单话单月存储空间需求数据,曲线拟合图趋势如下:
表2 营业和账务数据库IOPS统计表
营业和账务数据库主机IOPS统计情况,如表2所示。
从营业系统服务器的sar -d数据可以看出,系统在相对较短的时间段内,不同时间点运行状态存在很大差异,I/O响应时间在某些时段普遍达到200 ms以上,处于性能非常不健康的状态。
通过对主机、存储、数据库、SAN网络及容灾链路的综合分析,并有计划、有步骤的优化与改造,系统性能取得了显著成效。
主机能力提升策略,主要结合现网单用户TPCC需求数据,进行分析和预测,从主机选型和能力需求方面提升方案合理性。
图3 业务系统单话单存储容量需求曲线拟合图
营业数据库、账务数据库、账务应用和计费应用4类业务,每月单用户TPCC需求较高,且在区间内波动,结合2012年3 000万用户规模,设备选型时,应选择配置为400~600万TPCC的主机。
计费数据库、结算数据库和客服数据库,每月单用户TPCC需求近似恒定,设备选型时,应选择配置为100~150万TPCC的主机。
图4 营业数据库单用户TPCC需求曲线拟合图
营业数据库每月单用户TPCC需求算术平均值为0.151,根据拟合曲线函数,建设末期单用户TPCC(2012年 12月)=0.18。
营业数据库单用户TPCC曲线拟合图趋势如图4所示。
账务数据库每月单用户TPCC需求算术平均值为0.10,根据拟合曲线函数,建设末期单用户TPCC(2012年 12月)=0.14。
主机能力需求=单用户TPCC(建设末期)×用户规模(3 000万)。
例如营业数据库主机能力需求=0.18×3 000=540万TPCC;账务数据库主机能力需求=0.14×3 000=420万TPCC。
合理配置存储方案,有效考虑性能和容量的需求,步骤如下:
(1)估算业务系统主机IOPS总量,根据单盘IOPS(70~90 IOPS),计算盘片数量。
(2)根据业务系统存储容量需求和单盘容量(146 GB/300 GB等),计算盘片数量。
(3)不一致时,调整盘片容量,到合理方案。
(4)IO合理响应时间为10 ms左右,一般不超过100 ms。
现网2 200万用户,存储配置为146 GB 10 000r/m的盘片,建设末期3 000万用户,配置为146 GB 10 000r/m/146 GB 15 000r/m/300 GB 15 000r/m的盘片时,根据存储IOPS需求,以营业数据库和账务数据库为例,存储性能容量需求如表3所示。
表3 营业和账务数据库存储性能容量需求
存储能力需求=单话单存储容量需求(建设期末)×用户规模(3 000万)×单用户月话单(11条/天)×30(天 )。
营业数据库单话单存储容量需求曲线拟合图趋势如图5所示。
营业数据库存储容量需求=5×3 000×10 000/1 02 4/1 024×11×30=48.8TB;账务数据库主机能力需求=74TB。
结合IOPS需求,平衡存储性能容量需求和业务系统存储容量需求,营业数据库存储容量需求为95TB,账务数据库存储容量为117TB。
本文通过统计BOSS在网用户数,结合人口发展趋势,提出了适用于某公司的用户增长模型,并预测出了建设末期用户数。
根据现网主机CPU天忙时利用率的数据,结合主机TPCC值和在网用户数,得出现网单用户的TPCC能力需求。通过分析和预测,得到建设末期单用户TPCC能力需求,提出主机选型策略,由此预测主机能力需求。单用户TPCC需求在区间内波动,没有随着业务复杂度变化而明显变化。
图5 营业数据库单话单存储容量需求曲线拟合图
通过分析单用户话音话单和数据话单的变化情况,得出用户话务行为由话音转向数据。同时,统计和分析各业务系统每月实际存储空间需求,结合单话单存储容量需求,通过分析和预测,得到建设末期单话单存储容量需求,由此预测出满足容量时存储容量需求。单话单存储容量需求变化趋势缓慢,没有随着业务复杂度变化而明显变化。通过统计和分析业务系统IOPS总量和单盘IOPS能力,预测出满足性能时存储容量需求。综合考虑存储性能和容量的需求,合理配置出存储方案。
[1]王明松.移动用户预测方法的分析.电信工程技术与标准化[J].2004.17(10):19-22.
[2]李晓鑫.浅析EXCEL序列之预测趋势——实验结果预测[J].知识经济.2009(7).
[3]郭天印.Markov预测与决策的Excel实现[J].陕西工学院学报.2003(3).
[4]吕岩.基于马尔代夫分析的计算机预测和决策应用[J].价值工程.2011,30(14).
[5]吴辉.利用EXCEL进行未来现金需求量的预测[J].中国管理信息化.2009(9).
[6]高凡修.构建EXCEL模板预测企业资金需求量[J].财会月刊(综合版).2008(6).