舒崇河 林晓方
(江西中烟工业有限责任公司广丰卷烟厂 江西省上饶市 334600)
随着现代工厂工业化与信息化深度融合推进,生产业务的信息系统日渐增多,需要更快及更高的计算、存储、网络带宽能力的基础设施。为保障信息系统高效并稳定地运行,迫切需要改造升级或重建数据中心硬件基础设施。传统建设的信息系统数据中心科归纳为以下特征:
(1)硬件基础性能及架构设计受限于与建设时的技术,已凸显出瓶颈,也不易于扩展;
(2)不同系统通过项目招标由不同的集成商开发与建设,运行环境不统一,系统应用场景也不同——表现对硬件配置、操作系统、中间件等要求各不相同;
(3)不同业务系统一般都对应各自独立的服务器设备,消耗更多机房机柜空间和能耗;
(4)部分系统业务较为简单,属于轻量级应用,服务器运行负荷较轻,对硬件资源较为浪费。以上特征使得数据中心中的所有系统服务器时面临运维管理繁杂、人力成本高、资源利用率低、数据备份困难等问题。如何解决上述存在的问题成为数据中心建设与运行中重点考虑的因素。将超融合架构应用到现代工厂数据中心建设中,较好地解决传统架构数据中心面临的以上问题,为数据中心部署提供了一种新的解决方案[1]。
超融合基础架构(Hyper-Converged Infrastructure,HCI)是在同一套设备单元中集成计算、网络、存储等资源和技术,多套单元可以通过网络整体聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池[2]。传统三层架构一般采用服务器主机+光纤交换机+存储磁盘阵列(RAID)的形式,光纤交换机与磁盘阵列组成存储区域网络(Storage Area Network,SAN)[3]。
(1)随着数据中心应用的不断增加,由于SAN 的架构限制,整体数据中心无法轻松横向扩展,造成存储系统无论是容量上还是IO 性能上的瓶颈。超融合架构科无缝横向扩展,无须停机便可添加其它超融合节点,从而线性地提高系统性能和数据存储。
(2)传统三层架构中,数据的IO 路径都是通过“服务器主机”↔“主机总线适配器(HBA)”↔ “SAN 交换机”↔“RAID控制器”↔“RAID”,IO 跨多种设备,存在单点架构,非常依赖于硬件可靠性,当出现故障需要人工干预进行恢复[4]。超融合架构将计算、存储网络资源虚拟化整合到同一个系统平台。通过软件定义基础设施,进行数据分布式部署,并具有软件保障的自动恢复能力。
(3)传统架构当业务需要更多存储器时,扩展存储器资源;当需要更多计算能力时,扩展服务器资源。新增扩展设备初始化部署工作量大,操作繁琐,一般需要把整个系统全部停机后操作,在某此情况下会影响用户工作的连续性及工作效率[5]。超融合架构,很小的融合节点即可独立地扩展集群的计算能力,同时地调节 CPU和存储容量的平衡。因此,从设备采购投入、运维管理成本、机房机柜空间、能耗等,大幅降低总拥有成本(TCO)。
图1
图2
目前广丰卷烟厂数据中心云平台采用思科HyperFlex 3.0 超融合系统以及VMware 主机虚拟化解决方案,真正实现计算、网络、存储的一体虚拟化,形成统一的资源池进行集中化管理。目前超融合上部署虚拟机96 个,承载了15 个工厂业务系统。
超融合云平台物理架构包括2 台思科UCS 6296 UP 交换机,6 台HX240C-M5 机架式服务器,3 台USC 5108 刀片机箱,配备了12 片UCS B480-M5 的刀片服务器。6296UP 交换机HX240C 机架服务器、UCS B 系列刀片服务器组成光纤交换互连矩阵,连接到UCS 6296 UP 交换机的每一个计算节点都成为了一个高可用的统一管理域的组成部分,超融合软件采用思科统一计算管理系统(UCS Manager)对UCS 中的所有软件和硬件组件进行统一的内嵌管理,可以控制多个机架、刀箱,并管理上千部虚拟机的资源。目前广丰卷烟厂超融合云平台部署完成后,计算能力:CPU 总计168 核(物理核)Intel Xeon E5,CPU 频率1.6THz,内存4.5TB;存储能力:共285TB 高速SAS 磁盘空间,支持连接外部存储;网络能力:支持万兆IP、iSCSI、FC SAN,总共192 个端口。如图1所示。
图3
超融合云平台基于思科HyperFlex 系统构建,将计算、网络和存储基础设施与管理和虚拟化功能结合到一起,提供出色的速度、简便性和可扩展性,从而促进实现快速IT。该平台将云的“随增长,随投资”消费模式套用到内部基础设施,提供高度敏捷性、效率和适应能力。实现端到端软件定义基础设施的超融合平台,思科HyperFlex 系统可在数据中心、私有云和混合云、远程位置和边缘计算环境中支持更广泛的应用和工作负载。这款新一代解决方案将超融合系统在部署、管理和支持方面的简易性扩展至中央数据中心以外,直至多云环境和网络边缘。
大多数超融合基础设施在建设时未将网络考虑在内,广丰卷烟厂数据中心云平台具备完整的超融合系统,其中网络作为系统不可或缺的组成部分。通过思科UCS 交换矩阵互联,可以实现一个连接和管理点将 HX 系列节点和思科 UCS 服务器结合在一起:部署集群后,无需重新设计网络即可对其进行最大限度的扩展。这种解决方案的设计初衷就是可以轻松扩展。超融合系统需要大量东西向流量带宽和低延迟,而且我们可以提供最高支持40Gbps 网络的交换矩阵互联。网络在超融合系统中极为重要,因为数据平台性能取决于网络。借助思科 UCS 交换矩阵互联,云平台将获得高带宽、低延迟统一交换矩阵连接,通过一组电缆承载所有生产IP 流量、超融合层流量和管理流量。如图2所示。
由于思科HyperFlex 超融合系统的硬件承载使用的是思科UCS服务器,而思科UCS Manager(简称UCSM)是思科UCS 服务器解决方案提供x86 管理平台。UCSM 能通过直观的GUI、CLI 或XML API,将系统作为单一逻辑实体实行端到端管理,UCSM 使用服务配置文件来配置服务器及其I/O 属性。服务配置文件由服务器、网络和存储管理员创建,存储在Cisco UCS 6200 系列互联阵列中。服务配置文件中封装了部署应用所需的基础设施策略,如电源和冷却、安全、身份识别、硬件健康状态以及以太网和存储网络等策略。这些策略在每一层硬件上自行协调和自动执行组件管理,包括RAID 级别、BIOS 设置、固件修订和设置、适配器身份和设置、VLAN 和VSAN 网络设置、网络服务质量(QoS)以及数据中心连接等。
UCSM 软件内置在思科FI 超融合交换机内,每套软件可以管理160 台思科UCS 刀片或者机架式服务器,完全的计算型数据中心的一体化解决方案,通过UCSM vCenter 解决方案可以将管理范围扩展到几千台,真正实现了计算型数据中心服务器的单界面管理。
UCSM 提供原生的网络、计算、存储基础设置统一管理,UCSM 可以看到所有的硬件信息。如具体配置,环境状况,每个端口的流量和是否有错误包等非常详细的信息。这是最直观看到端口和线缆,特别是光缆是否衰减过大的方法,可以大大提高排障效率。如图3所示。
广丰卷烟厂超融合架构的云平台为数字化工厂转型升级需要,基于思科HyperFlex 3.0 超融合系统解决方案构建,超融合私有云平台通过软件定义基础设施,实现对计算、网络、存储资源虚拟化,形成统一资源池。思科 HyperFlex 3.0 系统将思科 UCS 网络与计算技术、功能强大的Intel Xeon 可扩展处理器以及 HX 数据平台结合起来。可实现快速配置主机集群,无论需要支持虚拟化应用还是容器化应用,集群均可根据自身业务需求所用,将获得统一的计算、网络和存储资源池,为企业应用提供支持。系统上线将更加快速,无需为扩展FC-SAN 网络投入较大成本,在超融合云平台上只需要按照业务系统实际需求创建预设的计算、网络、存储资源的虚拟机即可。在运维管理上,通过UCS Manager、HyperFlex Connect 以及VMware vSphere 套件完成主机集群快速配置、主机等基础设施监测、虚拟机在线迁移、动态资源管理,超融合架构云平台屏蔽物理设备的差异性,让运维人员能够更专注于系统自身的运维。基于超融合架构的数据中心替代传统三层架构使得整个数据中心的基础设施架构更简单清晰,为现代工厂后期的基础设施扩展、迈向更深层次云环境等数字化转型升级提供了更多可能。超融合架构的管理软件主机集群检测、虚拟机管理、系统备份、快照技术、在线去重压缩等,可以为数据中心提供更高效、更灵活、更加安全的优点,超融合架构建设的数据中心,相比传统三层架构,不论从前期设备采购投入、使用时的运维管理成本、机房机柜空间、能耗,后期改造升级等,大幅降低工厂在建设数据中心的总拥有成本。