王 骞,邹 联
(国电大渡河流域水电开发有限公司 成都610041)
信息作为现代企业的宝贵资源,占据着越来越重要的地位,已经成为现代企业科学管理的基础、正确决策的前提、有效调控的手段。多年来,各企业一直按照传统IT基础架构发展自己的信息系统,其硬件平台已经具备一定的规模和现代化水平,并支撑起企业各业务信息系统,如OA、财务、人力资源、网站等多项业务。而传统IT基础架构意味着一个应用即占用一台或多台服务器(一对一或一对多),随着应用的增长,机房内的服务器数量也将越来越多。机房空间压力、能耗、成本和管理复杂度急剧增加。
近年来,随着云计算、虚拟化等技术的发展,服务器整合技术已经相当成熟。虚拟化技术主要是将多台服务器整合为一个计算资源池(IT云),并将其中的资源灵活“组合”为多台“虚拟”的服务器。原有应用可以平滑迁移到虚拟服务器上运行。多个应用可以在一台或多台实际服务器上运行(多对一或多对多),因此能以低成本实现强大的计算能力、灵活的部署方式以及高可靠性。
表1为传统方式与虚拟化方式对比。
企业信息系统实施云计算改造并非从零开始建设,必须充分考虑到原有信息系统如何在云环境中正常运行,同时要将云迁移过程对业务连续性的影响降到最低。因此,企业信息系统云计算实施与直接搭建云计算环境不同,应遵循自身特点,按照“统一规划、分步实施、系统推进”的原则进行建设。
云计算平台的优势非常明显,但在实施之前,必须充分评估本企业实施云计算平台的必要性和可行性。
云计算具有高度兼容性和整合能力,适合将企业原有计算平台和信息系统进行统一整合。但是,云平台固有特性决定其暂时不能胜任以下特殊应用。
·采用非PC架构平台搭建的应用系统。例如运用小型机担任计算平台的应用系统,或者主要由苹果MAC平台构成系统。现有的企业虚拟平台只支持在PC服务器上部署,也只能虚拟出PC服务器硬件。
·复杂图形处理及3D处理应用。虚拟软件暂时无法支持高性能图形卡,无法实现硬件加速功能。
·需要单机多屏显示或者多机独立显示的应用系统。
·外接端口使用较多的应用。例如大量使用RS232串口、USB端口的应用,此类应用因外接端口与物理主机对应,无法实现虚拟机自由迁移,失去了虚拟化的重大优势,如果利用串口服务器、USB服务器等第三方硬件实现资源共用,又可能因单点故障影响可靠性。
·I/O密集型应用。云平台实施后,每台物理服务器上同时有若干台虚拟服务器在运行,其CPU、内存等资源均能得到合理划分。但是,外部存储I/O一般都是通过SAN光纤存储实现,多台虚拟机会对主机的I/O通道进行抢占,在I/O压力较大的应用中可能难以满足要求。
·因安全问题要求物理隔离部署的应用。例如在电力二次安全防护中,生产控制大区的应用系统和管理信息大区的应用系统无法实现整合。
企业信息化基础资源调查是建设企业云计算平台的重要步骤。主要工作是调查统计现有信息化基础资源情况,包括PC服务器、数据存储设备、网络情况等,建议以表格形式整理汇总,具体见表2。
本步骤有两个目的:一是确定企业云平台建设规模,根据现有服务器的实际数量和配置要求决定迁移至虚拟平台后的虚拟机数量和资源需求,从而推断出所需物理服务器的实际数量;二是可筛选出现有服务器中配置较高者,经升级后作为云平台的资源池,尽量节省成本。根据经验,在典型的企业应用环境中,一台主流的PC服务器可承载6~8台中等负荷的虚拟服务器稳定运行(内存需根据虚拟服务器要求进行扩充)。
表1 传统方式与虚拟化方式对比
完整的企业云平台基础设施由物理服务器、存储系统、网络以及平台软件组成。这里采用的是市场占有率较高的VMware软件。
在本步骤中,物理服务器要求如下。
·单个CPU内核数尽量高,因VMware通过物理CPU个数授权,因此同等价格下,单个CPU内核数越多,性能和处理器负荷冗余度越好。
·内存足够大,单台物理服务器要支持多个虚拟服务器同时运行,足够的内存必不可少,以笔者的实施经验,单台物理服务器内存应大于64 GB。
·应配置2块以上8 GB HBA卡接入冗余多路径SAN或者采用冗余10 GB iSCSI存储网络,以保证数据存储可靠性等性能。
·对磁盘I/O要求不高、网络结构较为简单的,可以选用刀片式服务器,以节省安装空间和能耗。
·可尽量利用原有配置较高的服务器升级而成。
存储系统一般采用SAN结构,也可以使用iSCSI。结构简单、主机数量少时,也可以用SAS、SCSI电缆等直接组网,只要满足“存储设备发布的LUN能同时被所有主机访问”即可。存储设备容量根据现有服务器的总容量选取,必须支持RAID5或RAID6,并根据需要增加热备份盘,介质应尽量采用高速FC或SAS硬盘(15 000 r/min),为节省成本,也可使用其他类型硬盘。
网络系统与传统架构相同,建议每台物理服务器有两块及以上的网卡连接到企业内部网交换机。
本步骤开始为正式实施安装阶段,主要工作由集成商完成,步骤及注意事项如下。
(1)规划各硬件设备安装位置,网络、光存储连接方案。
(2)安装存储设备,上电后进行基本阵列配置,建立RAID,设定热备份盘,划分LUN(逻辑单元号)并予以全局发布。因虚拟机迁移需要,此处应至少划分2个LUN。
(3)安装新增的物理服务器,连接HBA卡和光纤交换机,连接网络。
(4)在新增的物理服务器上安装虚拟平台软件,如VMware的ESXi及vCenter,云平台基本成型。
(5)将拟升级加入云平台资源池的服务器上的现有应用迁移到云平台中。
(6)对这些服务器进行升级(主要是内存及HBA卡),安装虚拟平台软件,加入云平台资源池。
(7)将其他应用逐一迁移至云平台。
(8)配置云环境下的高可用,例如HA或FT。
系统迁移是将运行在物理服务器上的应用程序及操作系统平滑转移到虚拟机中运行,每台服务器数据量往往都在数十吉比特以上,较为耗时。为保证迁移过程中应用系统正常运行,需要利用专用工具软件进行在线迁移,因为操作系统和软件环境的影响,在线迁移有时会失败。
各虚拟技术提供商均会免费提供适合自身平台使用的在线迁移工具,如VMware的Convert Standalone。软件具体使用方法不再赘述,仅提出如下使用过程中的要点。
·Convert可以安装在被转换的Windows服务器上,也可以安装在网络中其他Windows服务器上,前者转换速度稍快,后者可同时转换多台服务器,可根据实际需要进行选择。
·迁移时尽量选取服务器访问量较小的时间段进行,避免二次同步中出现错误。
·迁移操作前应保证被迁移服务器和vCenter服务器网络连接可靠,并关闭被迁移服务器上的网络防火墙和病毒防火墙。
·被迁移服务器上的server、workstation服务应保持开启,系统策略中应允许具有管理员权限的账号在网络登录。
·迁移选项中,转换后的系统服务应将物理机硬件相关服务全部禁用,例如HP Smart Array、HP System Management Homepage、HP Remote Monitor等。
·如果想在Windows主机转换后对系统进行自动配置,如刷新SID等操作,需提前按迁移工具的提示,自行在网络上下载对应版本的sysprep包,复制到指定的目录方可进行操作。
·如果转换过程中报错失败,可根据错误提示对被迁移的系统进行调整后重新转换。如果始终无法转换,则只能将被迁移主机停机,用另一工具VMware ConvertCD光盘启动系统,进行离线冷克隆。冷克隆兼容性最好,但速度较慢,且被迁移主机在迁移期间无法提供服务。
·转换后应检查虚拟机的数据完整性,为网卡配置IP地址,检测相关服务是否正常。
为便于管理,各类云平台支撑软件都会给用户提供方便、直观的管理控制台,为适应云环境下的主机管理,建议在给虚拟机命名时包含主机名、系统名及IP地址等基本信息,尽量使用英文、数字及英文标点,不要使用中文。
以本单位实施过程为例,迁移过程中可能出现的一些常见错误及解决方案如下。
(1)在对Windows主机进行迁移时提示VSS快照创建失败
VSS(volume shadow copy,卷影复制)是Windows提供的系统服务,用于创建基础存储设备的高保真时间点映像,如果该服务运行异常,迁移程序将无法正常运行。
解决方法:检查系统服务中VSS运行是否正常,可重启服务后再次尝试。另外,如果源主机挂载有USB或ESATA存储设备,建议在迁移时将其排除。
(2)转换后的虚拟机无法设置原IP地址,提示该IP地址已经分配给其他适配器
迁移前后,操作系统识别到网卡发生变化,但原IP地址仍关联到已经不存在的网卡上,导致无法分配给新网卡使用。
解决办法:运行“注册表编辑器(regedit.exe)”,搜索原IP地址,将值改为空,再重新在网络属性中为新网卡配置IP地址。
(3)不明原因的反复迁移失败
部分服务器可能因特殊的软件兼容性问题导致不可预料的迁移过程反复失败。对此,建议将迁移程序安装在被转换的服务器进行尝试。如果仍不能成功转换,则采用光盘启动进行冷克隆。
系统迁移完成后,应及时对应用系统进行全面测试和检查,包括云平台的运行情况、主要资源占用;各虚拟机的资源分配是否充足;检查虚拟网络是否通畅;验证虚拟机迁移能否正常动作;对关键服务器进行性能分析,如果有硬件瓶颈应采用升级或资源调配的方式予以解决,确保正式投运后平台长期稳定运行。
企业信息系统迁移到云平台后,传统IT架构下的信息安全策略及方法大部分仍然适用。同时,鉴于云平台自身的特点,也具有一些新的安全风险和相应的防范技术。
云平台将原有分立的各服务器集成到统一的资源平台中,操作员可以远程在集成的管理环境中进行硬件层面的操作,而默认平台管理员对所有资源和虚拟服务器拥有完整的操作权,在多管理员的环境下,可能带来越权使用的风险。因此必须根据企业的实际情况,对不同级别的操作人员分配相应的管理权限,并按照AAA(认证、授权、审计)规则严格进行访问控制。
云平台中的所有数据全部存储在集中存储设备(磁盘阵列)中,一旦存储出现故障,可能导致系统大规模停运和严重的数据损失。在企业环境中必须绝对避免这种情况。
硬件层面:集中存储设备必须拥有高可靠性,必须采用合理的RAID级别(RAID 5或RAID 6),指定足够数量的热备份盘,有条件者建议采用双机镜像克隆。在日常巡检中,应特别注意存储设备的运行情况,及时处理出现的问题。
数据层面:合理制定备份策略,对重要数据定期进行备份。主要方法有虚拟机克隆、平台级备份工具Veeam Backup Server、传统的主机级备份工具等;病毒防范可沿用原有防毒体系,也可采用云平台认证的嵌入式防毒体系,可根据企业自身实际情况选择。
企业云计算从本质上隔离了应用。对于运维的单一个体来说安全性必然会提高,防止安全问题的引入以及隐患扩散。同时对于整个平台来说,整体管理控制、局部独立管理模式也提高了平台的安全性,通过补丁管理,以push方式可以短时间内弥补所辖虚拟机的安全漏洞,同时也使得平台本身安全性提高。针对具体应用系统的安全,可以利用同步镜像、负载均衡技术提供进一步的保护。
该信息系统云平台使用效果较好,既大幅度降低了数据中心运维成本和总体拥有成本,又保障了数据安全和系统、应用的稳定。经过一年多的正常运行,云计算平台与以往传统方式相比,资源利用、节能降耗成效显著。据初步测算,云计算平台实施后,现有规模下可减少服务器25台,节约投资成本125万~200万元;节约机房空间、制冷量约60%;每年节约电能2.6×106kW·h;后续管理运维成本显著降低。随着信息化建设的推进,企业云平台也将进一步完善,最终建成一套数据高可靠、业务高可用、设备高效用的基础平台,更好地为企业信息化应用提供保障。