张洪波
(中国电信股份有限公司云计算分公司,北京 100093)
在云平台中其中的核心内容就是数据资源,其不仅仅是支撑整体平台的基础,同时也是为客户提供服务的最终目标。按照数据形式可以划分为虚拟和物理资源,按照资源数量可以划分为单个资源和群资源。对单个、群资源进行管理是运行管理中的重点内容,主要内容后资源的识别、例如、维护、分配、优化等各项内容。通过对资源群进行优化,才能够更加清晰的看到群落中的内容。
由于云中的数据信息量巨大,这就需要具备更加高效的运行管理机制,这就需要利用自动化技术。构建自动化维护体系,可以完成大部分的运维工作,包括信息数据的自动化备份、自动恢复等,从而解放人为工作,降低人力成本。
想要确保云平台正常运行,必须要注重人才的培养,综合素质高的人才永远是市场所需。运维人员需要掌握计算机软硬件、操作系统的技术,同时也要具备多个脚本语言能力。如果自动化运维手段无法实现相应的功能时,则复合型人才是最好的补充手段。
云平台维护管理出了日常管理之外,还包括安全性管理,其主要表现在:
由于云资源体系十分庞大,需要运维人员时刻都掌握每项资源的运行状态,仅凭借人工操作无法全面保障云平台的运行安全性,需要借助相应的监控技术才可以达到以上目的。其主要的监控内容有:(1)物理资源监控。云平台需要大量的硬件设备提供支持,通过监控技术可以掌握物力资源的运行情况,在硬件出现故障时可以展开精准判定,从而加强对物理资源的维护工作;(2)性能指标监控。通过利用迁移技术,例如监控系统检测到某个硬件性能不足时,为了避免影响其正常业务开展,可以将虚拟资源迁移到性能更好的硬件上,从而保证业务正常开展;(3)资源容量监控。在虚拟机创建时无法一次性完全分配各项资源,而是随着虚拟机在运行中逐渐进行资源优化,这就要对各类资源容量进行监控。
采用规范化管理模式,加强安全管理保障,服务商需要采用更加有效的服务功能保障信息安全,从而提高用户对云平台的信任度和依赖性。加强云平台运行环境质量,需要从访问控制、身份鉴别、信息标记、强制访问控制、系统安全审计、用户信息保障、程序执行保护方面出发。这样才能够全面保障云平台的运行安全。
云平台资源优化是保障平台运行效率、安全、质量的重要一环,可以说云平台的发展就是优化资源。
将所有的物理资源按照1:16的比例划分出虚拟机,这样即可增加虚拟机的数量,提高运行能力。这样可以同时支持多个系统以及多个应用。在实际优化当中,由于个别虚拟机的占用率峰值会达到15%以上、整体内存峰值达到90%以上,所以可以对内存进行适当扩充,将系统CPU核数按照1:8的比例进行配置,例如当今普遍采用8核CPU,因此可以配置内存为64G。
物理资源是支撑云平台运行的基础,例如有14个物理资源,总系统分为4个子系统A、B、C、D,其中A、B系统是主运行系统,C、D是备用系统,可以将A交互系统分配5个物理资源、B服务器系统分配8个物理资源,其余的都用作于C、D系统。这样可以在保障A和B系统正常运行的基础上,采用C和D备用系统减低运行风险,不需要创建新的子系统即可实现保护功能。此外,如果需要扩展功能,在A和B系统资源占满的基础上,可以向C和D的系统中扩展。如果应用层使用了HA软件,则不建议将虚拟机进行整合,但是可以在开发新虚拟机时提供使用。
(1)如果虚拟机对IO的要求较高,可以将存储数据传输到RAID1+0上,其余虚拟机放入到RAID5上。例如PLTP类型应用系统,即可保存在RAID1+0当中。
(2)如果应用系统对IO的要求较高,可以把数据信息放入到存储多系统中。该存储多系统主要是适用于吞吐量在300Mb/s以上或IOPS大于1200的数据。
(3)可以在RAID1+0当中存储A业务平台数据以及业务处理数据。
(4)在RAID1+0中放入虚拟机服务器,采用云存储技术将数据信息备份,这样即可在RAID1+0出现故障时恢复信息数据。
在云平台资源优化当中,想要确定虚拟机资源规划比例、服务上运行多少虚拟机,无法通过指定比例进行计算,而是通过资源调查、分析,根据云资源群、系统情况,按照下述原则进行分配:
(1)如果某些系统资源利用率在50%以下,则优先向此系统进行迁移。将系统资源利用率在50%以及利用率在30%以下的服务器要进行虚拟机整合,共享一台服务器。
(2)多个服务器资源利用率在30%以下时,需要进行虚拟器整合,共用一个服务器。
(3)如果不同系统的峰值不重合,例如部分系统使用峰值在白天、另一部分在夜晚时,则可以考虑进行虚拟器整合,并按照峰值时间点进行调整,避免出现峰值重叠情况。
(4)如果不同系统的资源需求不同,例如某个系统对内容要求高、对CPU处理性能要求低,而另一个系统对内存要求高、CPU性能要求低,则可以考虑虚拟机整合。
(5)如果物理资源利用率低于60%,则可以增加虚拟机数量,如果物理资源利用率在80%以上,则不可增加虚拟机。
(6)物理资源利用率超过90%时,可以将内部虚拟机转移到负荷较低的物理资源中。
综上所述,云平台在当今社会生产与服务当中有着重要地位,想要全面发挥云平台的积极作用,就必须要做好云平台的运行与维护管理工作,确保云平台日常运营符合用户需求。同时也要不断对云平台资源进行优化调整,实现性能最优、利用率最优,充分利用云资源的利用率,这样才能够充分发挥云平台的性能。