刘瀚宇 贾文胜 吴家欣
(中国特种设备检测研究院)
随着信息技术的高速发展,智慧监管也成为一个热门的话题。为了实现智慧监管,需以云服务平台为“抓手”,用以提高办公效率,保障信息安全,提升政务系统运行中的可靠性和安全性。因此,中国特种设备检测研究院(以下简称:特检院)需要打造一套完整且功能完备的云服务平台,立足已有资源,满足市场监管总局以及行业的需求。
在事业单位信息机房建设的过程当中,为了科研和教学的需求得到满足,物理服务器的数量与日增多,在管理的过程中管理员发现以下几个问题。
(1)服务器的利用率很低。例如,一台服务器只部署了一个网站,并且是一个只有几个页面的普通网站,利用率如此低下,造成了严重的资源浪费。
(2)管理困难。实际需求的增加导致物理服务器数量的增加,管理员要清楚每个服务器上运行的具体服务项目,需要进行记录,且不能集中操作简化工作,这就大大地增加了管理的难度。
(3)灵活性和安全性很难得到保障。假如某一个物理服务器的存储设备损坏,那么这个物理服务器上的数据将会全部丢失,造成不可逆的严重后果。
目前,一般中大型事业单位均设有两个信息机房。假设分别设立信息机房A和信息机房B(以下简称:A机房和B机房),两个信息机房之间通过100 M点对点互联网专线连接。A、B机房已经部署虚拟化环境,服务器、存储控制器、网络存储组成,通过Local的部署方式实现本站点内的存储保护机制。两个机房各自都是主备模式,利用现有资源,搭建云服务平台,以解决同城异地灾备问题,起到资源互联互通的效果,支撑单位及行业发展,实现智慧监管的目的。
(1)技术原则
采用成熟先进的IT资源整合技术和复制数据的技术,达到生产中心数据的资源整合,保证A机房与B机房数据的一致性和完整性。在云服务平台搭建技术方案的选择上遵循满足先进性、可靠性和可扩展性的原则,先进性以保障在不短的一段时间内在技术上的更替及设备上的投入;同时通过高度的可靠性及灵活的可扩展性,保障新的功能以及新的业务在原有的平台系统上可以顺利地增加、扩展。
(2)等保原则
根据《重要信息系统灾难恢复指南》,灾难恢复有六个等级:基本支持备用场地支持、电子传输和部分设备支持、电子传输及完整设备支持、实时数据传输及完整设备支持、数据零丢失和远程集群支持。灾难恢复资源要素,对于不同的等级应满足的要求,在指南中有明确的描述。
(3)经济原则
云服务平台建设应考虑云服务平台设备的性能价格比和云服务平台的运营成本。充分发挥原有资产的价值,本着低成本、高效率的建设原则,最大限度地降低云服务平台的建设成本。
通过调研了解,目前主要的主流云计算平台技术 有 Google App Engine、Amazon EC2、VMCD、Eucalyptus filecoin Apache VCL、Open Stack、Mfi Amazon EC2。其中 Google App Engine、VMCD 属于商业云平台,并且Amazon EC2 和 Google App Engine专属于亚马逊和谷歌公司,用户只能通过租用服务器的方式来运行自己的应用,VMCD则可以用来搭建企业、学校或机关单位等内部的云平台。目前开源的云平台技术有Eucalyptus filecoin Apache VCL、Open Stack,Open Stack 在业界最受欢迎也是运用最多,Eucalyptus filecoin Apache VCL 只能提供 laas 服务。所以,本着可行性和沿用原有配置的原则,最终选择VMCD。
用户可以使用VMCD将基础性资源架构整合成虚拟数据资源池,并让用户可以按需使用这些资源,从而构建安全的私有云。特检院用VMCD搭建的云服务平台架构见图1。
图1 VMCD搭建的云服务平台架构
(1)V.C Director 数据库和 V.C 数据库用来 VMCD管理和 V.C Server 管理,现在可以使用 VMCD 的数据库有微软的 SOL.Server 和甲骨文公司的 Oracle。
(2)提供防火墙保护的是VM vShield、流量分析及外围的网络服务用于保护 vCenter Server 基础虚拟架构。V.S Manager 是vShield 的集中管理组件,使用 V.S Manager用来监视并集中配置 V.S App、V.S Endpoint 和 V.S Edge。
图1中的节点表示虚拟主机,节点与ESXi 相连表示计算机分配给这个虚拟机所使用到的资源 (例如内存、硬盘、CPU等)为这个 ESXi 所在计算机上的资源(例如:内存、硬盘、CPU等)。用户通过web 门户来访问 vCloud 上的资源,VMCD 服务器通过vCloud Director 数据库来保存它所管理的 vCenter服务器的信息(IP 地址、内存等信息)、VMCD 用户的信息(用户名、密码和权限等信息)以及自身的一些信息(IP地址、域名等)。每台 vCloud Director 服务器可以管理多台 V.C 服务器,通过 V.S Manager 来保障 vCenter 服务器单元的安全可靠性,ESXi的信息以及 vCenter用户的信息通过 vCenter 数据库来保存。每一台vCenter 服务器可以用于管理多个ESXi,这些被管理的ESXi共享使用同一个存储设备,这台 ESXi 的计算资源为每一台ESXi上的虚拟机所使用的计算资源所分配,与这台 ESXi相链接的存储设备提供存储资源。每当在ESXi上新建一台虛拟机时,就会自动给新建的这台虚拟机分配所适用的计算和存储资源,这些计算和存储资源分別用于与这台ESXi相链接的存储设备。
企业级私有云的构建是VMCD基于V.M vSphere和V.M vShield。其搭建的虚拟数据中心为企业内部和员工提供服务。用户如果需要定制资源可通过VMCD提供的web界面来请求,这些可定制的资源包括存储空间、操作系统以及计算资源。当用户请求的定制资源生成后,定制产品会以虚拟主机的形式提供给用户使用。
(1)第一阶段——对A机房进行改造升级
随着应用及业务系统数量不断地增加,业务流量不断地增长,面对不断增长的存储和吞吐需求,部分事业单位8G的SAN网络已无法满足现有生产业务的支撑,为保障业务指标以及未来不断增长的高性能要求。本次实施SAN网络的升级扩容及存储控制器升级换代,将原有的2台8G的光纤交换机替换为2台16G的光纤交换机,将原有的ESXi主机8G HBA卡替换为16G HBA卡。
(2)第二阶段——对B机房进行灾备建设
对B机房部署一套新的虚拟化环境,其中计算部分由7台服务器组成,存储部分由2台48路光纤交换机、2台网络双活(Active-Active)存储组成,消除存储系统单点故障,保障数据可靠性。
(3)第三阶段——建立同城数据级异步复制灾备系统
目前信息机房的基础设施及网络资源均已部署到位,两个信息机房的存储设备均已实现双活(Active-Active),且生产中心在存储双活(Active-Active)保障的同时还利用备份软件做了定期策略备份。为了保障业务中断时间降到最低,为了在灾难发生后能够以最快速度恢复数据服务,快速拉起业务,第二阶段采用Veeam Backup & Replication CDP(连续数据保护)功能,建立A机房B机房容灾中心的连续数据保护。
事业单位云服务平台是结合单位自身的需求条件进行规划搭建的,是目前云计算的应用模式的一种资源管理系统,规划中主要涵盖了对于云服务的发布、维护和应用的管理等。云平台的思想核心,是统一管理云服务所需的计算资源组成的资源池,然后根据用户的实际需求提供计算资源。通过云平台,用户可以在web上访问云平台所提供的应用和服务,以满足用户的需求;与此同时,研发人员也可以将应用软件灵活安装到云管理平台上,由云平台进行统一的管理。通过云平台,可以充分满足网络云服务的快速响应和实时处理的需求,并且云平台可以统一地对资源调度进行管理,提升云平台的资源利用率,减少云服务的开发和维护成本。