文|戴尔科技集团
在2019 年超算大会上,戴尔科技集团(下简称“戴尔”)推出了新的解决方案、参考架构以及升级的产品组合,旨在简化并加速企业的高性能计算 (HPC) 和人工智能 (AI) 工作。
目前,各行各业的都开始采用 AI技术来解决问题,这刺激了整个 HPC 行业的增长。根据 Hyperion Research 最近报告显示,到 2023 年,全球 HPC 行业预计增长 7.1%,而基于 HPC 服务器的 AI 市场预计将在 2018 年到 2023 年之间增长超过 29%,达到 27 亿美元的规模。
戴尔HPC副总裁 Thierry Pellegrino 表示:“企业机构所积累的数据具有很大价值,而采用HPC 和 AI 手段可以帮助企业机构充分利用这些数据。我们致力于构建各种解决方案,让不同规模的机构在部署应用的各个阶段中,能够更简便地使用这些技术。”
戴尔推出配置ThinkParQ BeeGFS 文件系统和 ArcaStream’s PixStor 文件系统的全新交钥匙解决方案,扩展了戴尔易安信HPC 存储解决方案产品组合。基于经过工程和测试设计的戴尔易安信HPC 存储解决方案,能够将技术合作伙伴的软件与戴尔易安信硬件、网络和支持服务相结合,以简化、加快解决方案的部署和管理。
戴尔易安信HPC BeeGFS 存储解决方案可借助 ThinkParQ 软件定义的并行文件系统,加快输入/输出 (I/O) 密集型工作负载,具备从小型群集扩展到企业级系统(本地或云端)的能力。
此外,戴尔易安信HPC PixStor存储解决方案提供高性能并行文件系统,支持大规模数据管理,并能够执行
归档和分析。该解决方案拥有经过验证的可扩展设计,包括对象、磁录和云分层功能,可在 PowerEdge 服务器、PowerSwitch 和 Mellanox 网络,以及 PowerVault 存储设备上运用 PixStor Ngenea,并由戴尔提供部署和支持服务。 有了这些解决方案,企业在应用性能和规模方面都有所提高。例如,澳大利亚国家级科研机构联邦科学与工业研究组织(CSIRO),是拥有全球最大型的 NVMe 存储系统的组织之一,它所有 NVMe 存储系统中就有 2 PB 使用了戴尔易安信HPC BeeGFS 存储解决方案。该存储系统目前在IO-500序列中排名全球第 8 位,该序列展示了全球 HPC 领域最快存储系统的基准排名。在伦敦帝国理工学院,戴尔易安信HPC PixStor 存储解决方案可同时为现有的2500 节点的高性能计算系统提供服务,并提供超过 20GB/s 的数据吞吐量,而不会降低交互应用性能。
戴尔还扩展了戴尔易安信PowerVault ME4 的存储容量,提供 16TB 硬盘,让企业可以在 15U 机架空间中将存储容量扩展到 4PB,将存储密度提升 25%,从而在更小的空间中提供更高的 HPC 存储容量。PowerVault 采用简化管理方式,为 HPC 配置带来了规模、带宽和内置数据保护等优势。
戴尔易安信PowerVault ME4
戴尔易安信正在扩展其 AI 解决方案产品组合,为 Domino Data Science 平台提供全新验证设计。该验证设计由戴尔易安信与 Domino Data Lab 合作开发,让数据科学家能够更快地开发和交付模型,同时提供一个跨整个数据科学生命周期的中心化可扩展平台,从而加快构思和部署过程。 Domino Data Labs 联合创始人兼首席执行官Nick Elprin 表示:“戴尔科技集团正在将面向Domino Data Science 平台的验证设计推广至开展模型驱动转型的企业,这一工作毋庸置疑。我们极为重视戴尔科技集团在推行这一解决方案上的第一手观点和经验,并期待通过戴尔易安信AI 解决方案来帮助全球企业交付集中、可重复和可测量的数据科学结果。”
为进一步简化 AI 部署,戴尔还引入了五项新的参考架构,与领先的 AI 合作伙伴一起对戴尔易安信技术进行优化。这些合作伙伴包括了 DataRobot、Grid Dynamics、H2O.ai 和 Iguazio 平台上的架构,以及 Red Hat OpenShift 平台上的 Kubeflow。利用上述架构,各机构可使用业界领先的戴尔易安信融合基础架构、服务器、存储和数据保护技术,以加快 AI 解决方案的部署,这些架构针对英特尔至强可扩展处理器进行了优化,让各组织机构能够通过戴尔易安信融合基础架构、服务器、存储和数据保护技术,来加快部署用于AI 训练和推理的解决方案,最终实现组织机构数据中心的现代化、自动化和转型。
戴尔易安信PowerSwitch Z 系列网络交换机
戴尔推出一款戴尔易安信PowerSwitch Z 系列网络交换机——戴尔易安信PowerSwitch Z9332F-ON,这是一款专为高性能工作负载设计的 400GbE 开放式网络交换机。作为开放式网络的先行者,戴尔兑现了其在软件定义网络方面的承诺,使网络操作更加灵活、可编程且更易于管理。
戴尔易安信PowerSwitch Z9332FON 专为需要密集计算和存储流量的云服务提供商的数据中心网络而打造。相较于现有的 100GbE 平台,戴尔易安信新型交换机的吞吐量为现有平台的四倍,性价比提高两倍,能效也几乎翻了一番。
加州理工大学物理学教授Harvey Newman 表示:“多年来,我们一直在研发网络和 HPC 设施,如在全球大型强子对撞机(LHC)网络的组成部分中使用戴尔易安信 PowerSwitch Z 系列产品。我们对高性能计算环境中交换机的成本、性能和可靠性都非常重视。它对软件定义网络 (SDN) 的支持,让我们能够开发新的分布式系统和智能网络,更好地服务于高能物理和其他数据密集型科学学科。新款 Z9332FON 是一款功能强大的 400GbE 开放式网络交换机,能够提供必要的宽管道,让我们能够将 SDN 和系统开发扩展到新的规模,以满足 2021 ~ 2023 年及更远的未来在 LHC 上运行下一波数据采集的需求。”
戴尔易安信DSS 8440 服务器
戴尔将NVIDIA T4 Tensor Core GPU 作为戴尔易安信DSS 8440 服务器的新加速器选件。该 GPU 带有多达 16 个加速器,提供高容量和高性能的机器学习推理能力,并且能效极其出色(每 GPU 70W)。该 GPU 专为需要在企业或部门之间共享机器学习资源的多租户环境而设计。
戴尔还将为其 PowerEdge 服务器引入新的 GPU 和 FPGA 支持,包括:
◎ NVIDIA Tesla V100S GPU,带宽增加 25%,可直接与 Mellanox InfiniBand 互联,还可与PowerEdge Express Flash NVMe Performance PCIe SSD 通信,以实现更快的数据传输。
◎ NVIDIA RTX GPU 通过比传统渲染集群低得多的成本、空间和功率需求来提升性能,并能以前所未有的速度生成高质量内容。
◎ 戴 尔PowerEdge R740xd 和 R940xa 服务器搭载英特尔 FPGA 可编程加速卡 D5005,可增强推理、流分析、视频转码以及金融和基因组方面的应用性能。