方跃龙
(国家管网集团东部原油储运有限公司,徐州221008)
IaaS(Infrastructure as a Service),即基础设施即服务[1],指把计算机、存储、网络等各类IT基础资源作为一种服务通过互联网络向用户提供,用户不必构建自己的数据中心。在云计算的三种服务类型(SaaS、PaaS、IaaS)中,IaaS具有最高的灵活性与对基础资源的管控能力[2]。
随着企业信息化技术的不断提高,信息数据的安全性和完整性对企业的重要意义也愈发显著。利用IaaS云平台技术搭建灾备云平台,成了各大厂商的第一选择。当前国内的IaaS市场主要有阿里云、腾讯云、百度云、中国电信、AWS(中国)、华为云、金山云等诸多厂商产品。面对如此繁杂的云平台产品的,用户需要对其进行POC功能性测试,选出符合自身需求的云平台。
POC(Proof Of Concept),即概念验证。通常是企业进行产品选型时或开展外部实施项目前,进行的一种产品或供应商能力验证工作[3]。进行灾备云平台的POC测试,需要首先掌握用户对灾备平台的性能、实现功能和扩展的需求,在此基础上,在测试用的云平台上模拟真实情况下数据的运行,观察在一定用户数据量下云平台的运行情况,检查云平台是否能实现预想功能,并根据用户未来业务扩展的需求适当加大数据量,查看此时云平台的性能和承载能力。然而由于当前云计算技术不断发展,针对云平台的测试指标和方法仍不完善,因此本文从性能测试角度出发,仅关注平台基本性能而不涉及底层架构,提出了一套针对基于IaaS的灾备云平台的通用POC测试指标及其测试方法,方便用户快速有效地完成灾备云平台的性能测试,选出合适的产品。
根据《YD/T 2850-2015灾备系统性能测试方法》标准要求,衡量灾备平台主要采用两个主要的容灾指标RTO和RPO作为评判依据[4]。RTO(Recovery Time Object,恢复时间目标)是指灾难发生后,业务从停顿到必须恢复的时间要求。RPO(Recovery Point Object,恢复点目标),是指灾难发生后,灾备系统能够把数据恢复到灾难发生前的时间点要求。
对于企业来说,灾备平台的选择需要在满足RTO和RPO需求的前提下,选择合适的灾备技术,一方面要考虑如何保障自己核心数据资产不丢失,一方面要保障核心业务如何在最短时间内恢复。因此,一套合格的灾备系统应该满足以下建设要求:
(1)可靠性与实用性相结合,可靠性是灾备平台建设和服务得以延续的基础,同时灾备云平台设备选型、设计规划、运维方案等也要考虑现场实际情况。
(2)安全性,要充分考虑信息数据的安全性,建立有效的安全机制,保障数据传输安全;
(3)快速性,灾备云平台的数据备份和灾备恢复时间要短,同时也要尽可能地减少对主机资源和网络带宽的消耗;
(4)可扩展性,灾备云平台能够兼容主流应用系统和数据库部署方式,满足用户业务扩展要求;
(5)统一运维管理,具有统一的运营管理平台,为用户提供统一的资源分析理、运维监控等功能。
根据灾备云平台整体建设要求,为方便用户从众多云平台产品中进行选择,我们分别从云主机、云平台网络、云平台性能三个方面,在不考虑底层硬件架构的前提下,列出了灾备云平台POC功能性常用的测试项目、测试方法和预期成果。
2.1.1 云主机密钥对登录
测试方法:新建一台云主机,配置云主机的登录方式使用创建的密钥对。云主机创建完成后,使用SSH(Secure Shell,安全外壳协议)客户端加载创建的密钥对登录云主机,测试是否登录成功,同时检查此时是否禁用SSH密码登录。
预期结果:使用SSH客户端加载创建的密钥对登录服务器成功,云主机sshd服务配置禁用了密码登录。
2.1.2 云主机规格变更
测试内容:①创建一台云主机,分别挂载基于分布式块存储的云硬盘,创建NAS存储,挂载到云主机;②对云主机的CPU和内存进行扩容,扩容成功;③扩容已挂载的基于分布式块存储的云硬盘,扩容成功;④扩容挂载到云主机的NAS存储,扩容成功;⑤为云主机增加一个块虚拟网卡,指定或者自动获取虚拟网卡的IP地址,IP地址配置正确。
预期结果:①云主机CPU和内存扩容成功;②云主机挂载的分布式块存储扩容成功;③云主机挂载的NAS存储扩容成功;④网卡增加成功。
2.1.3 云主机整机冷(热)迁移
测试方法:在云平台创建一台云主机,查看云主机所在宿主节点。然后对该主机执行冷(热)迁移操作,将云主机迁移到另外的宿主节点。
预期结果:云主机迁移操作成功,云主机启动运行正常,网络配置未改变。
2.1.4 云主机备份功能
测试方法:创建一台云主机,挂载一块云硬盘作为数据盘。
①在开机状态下为系统盘和数据盘创建手工备份,备份完成后,删除云主机上的文件,通过备份进行恢复操作,已删除文件可以找回;②创建定时备份任务,确认在云主机开机状态下备份成功,备份成功后,删除云主机上的文件,通过备份进行恢复操作,已删除文件可以找回。
预期结果:支持手动和定时创建云主机备份,云硬盘上的数据删除后通过云硬盘备份功能可以进行数据恢复,同时云主机的IP等未发生变化。
2.1.5 云硬盘的快照备份与恢复
测试方法:①创建一台云主机,挂载一块云硬盘作为数据盘,在系统盘和数据盘写入文件;②分别为系统盘和数据盘创建云硬盘快照,创建成功后,删除数据盘和系统盘上的写入文件;③使用创建的云硬盘快照恢复云主机的数据盘和系统盘,恢复后,启动云主机验证之前写入文件是否存在。
预期结果:云硬盘快照创建成功,数据删除后通过云硬盘快照功能可以进行数据恢复,同时云主机的IP等基本信息未发生变化。
2.2.1 VXLAN网络支持
测试方法:通过云平台控制台,创建1个基于VXLAN的VPC网络,并VPC下创建2个子网,再在每个子网下分别创建一台云主机,并在2台云主机的安全组配置上开放ICMP协议。分别在2台云主机上通过Ping工具相互进行测试,测试是否可以到达对端。
预期结果:支持VXLAN网络,主机之间通过互ping验证可以正常通信。
2.2.2 虚拟私有云(VPC)对等连接
测试方法:①分别在不同的VPC网络的子网下创建2台云主机,开放所有安全组规则;②配置两个VPC下的子网路由;③分别VNC登录两台云主机,ping另外一台云主机地址,观察是否可以互通。
预期结果:配置成功,可以直接ping通。
2.2.3 负载均衡服务
测试方法:在云平台创建一个负载均衡,后端加入1个应用实例1,访问应用实例正常。之后再加入相同的一个应用实例2到负载均衡后端,负载均衡自动识别新加入实例,添加过程中应用访问不中断,且添加后2个实例均提供服务。
预期结果:添加过程中应用访问不中断,且添加后2个实例均提供服务。
2.2.4 QoS控制
测试方法:创建虚拟对虚拟网卡通过对虚拟网卡进行配置。①通过ML2的使用OVS对虚拟网卡进行配置,对对虚拟机的网络I/O进行限制;②通过GBP实现网络QoS的限制。
预期结果:网络QoS控制成功。
2.3.1 异构虚拟机镜像上传
测试方法:测试方将统一提供的镜像文件通过云平台上传,通过已上传镜像创建新的云主机,配置网络并挂载云硬盘。
预期结果:支持虚拟机镜像上传功能,由镜像创建的新云主机启动正常,网络配置和云硬盘挂载功能正常。
2.3.2 云平台双因子认证登录
测试方法:打开云平台控制台登录界面,查看登录方式是否为双因子认证,且通过双因子认证方式登录成功。
预期结果:登录方式是双因子认证,且通过双因子认证方式登录成功。
2.3.3 云平台安全能力
测试方法:①通过云平台创建一台堡垒机,可以通过堡垒机可以登录到与堡垒机同VPC的云主机;②在云平台上创建软件的WAF,增加WAF的后端服务,验证通过WAF是否可以访问到后端的服务;③查看平台是否支持SSL VPN和IPSec VPN,创建VPN服务,并创建账号密码,并配置网络路由,创建完成后,验证通过VPN是否可以访问到VPC内网的云主机。
预期结果:①通过堡垒机可以登录堡垒正常;②通过WAF是否可以访问到后端的服务;③IPSec VPN和SSL VPN创建成功,且通过VPN可以访问到VPC内网的云主机。
2.3.4 服务器和存储监控
测试方法:①通过云平台,可以监控到服务器的健康状态、CPU使用量、内存使用量、网络流量,以及运行在节点上的云平台服务的运行状态;②通过云平台,可以查看到云平台存储的监控信息,包括存储的健康状况使用情况。
预期结果:能够看到服务器的健康状态、CPU使用量、内存使用量、网络流量,以及运行在节点上的云平台服务的运行状态,能够看到云平台存储的监控信息,包括存储的健康状况使用情况。
2.3.5 资源分析报表
测试方法:能够在管理员界面和租户项目界面看到云平台计算、存储、网络资源的资源使用报表。
预期结果:①能够看到云平台计算资源的CPU、内存等信息的统计报告表;②能够查看到云平台存储资源的统计报表,包括总资源量、资源总使用量、存储资源的总分配量等;③能够查看到云平台网络资源的统计报表,包括网络的资源使用量和分配量。
本文提出了一套基于IaaS云平台技术的灾备平台的测试指标和对应测试方法,为用户进行云平台产品的选择和测试提供了一种参考依据。由于IaaS云平台具有特有的云计算模式,涉及大量云计算技术,因此在实际的灾备云平台的POC测试中,测试标准与方法也要针对具体应用场景进行分析。测试人员在进行POC测试中,需要将测试时间、测试过程、测试人员进行记录,对用户需求文档和测试厂商提供的技术资料分类归档,及时对不同云平台产品进行对比分析,总结评价。