面向移动高端装备的银河衡芯敏捷交换芯片

2021-06-17 14:03刘汝霖吕高锋孙志刚
计算机研究与发展 2021年6期
关键词:应用层集中式报文

杨 惠 李 韬 刘汝霖 吕高锋 孙志刚

(国防科技大学计算机学院 长沙 410073)

(huihui19870124@126.com)

随着装备智能化、信息化的发展,卫星、舰船等移动高端装备亟需具备高算力的集中式计算平台[1]为数据采集、计算、处理、分发提供统一的基础支撑[2-3].然而,移动高端装备在体积、重量和功耗等方面受到诸多限制.

在受限条件下,移动高端装备集中式计算平台要求承载异构资源互连的交换网络具有3方面的敏捷交换能力:1)高能效、低功耗交换,以满足平台部署在空间、散热等方面的要求;2)端到端的系统级解决方案,降低平台开发部署复杂度,实现网络透明化;3)卸载加速能力,有效减轻计算资源的负载,提升系统整体算力.现有商用网络交换芯片,如Broadcom、盛科[4]等,主要面向数据中心、园区网、企业网等大规模固定网络,出于市场与成本考虑,更强调实现丰富的功能协议集合,支持大规模、高性能的网络交换,难以满足高能效、低功耗等敏捷连接需求.最重要的是,基于商用网络交换/网卡芯片构建集中式计算平台,需集成多芯片厂商的驱动、交换及网卡芯片,定义网络管理软件、网管代理通信接口和协议,驱动适配和调试工作繁琐复杂,用户开发难度大.

国防科技大学计算机学院针对上述问题,提出了基于以太网的低功耗、端到端敏捷交换解决方案,主要包括系列化敏捷交换芯片、端适配器和网络控制器.作为系列化敏捷交换芯片中的一款多万兆数据交换芯片,HX-DS40针对集中式计算平台异构资源的敏捷互连需求,在架构、功能上进行了深入优化,实现了协议无关转发架构和基于应用标记的交换功能,从而支持应用层精细交换和异构资源统一连接,可为打造下一代移动高端装备的高能效、低功耗、高算力集中式计算平台提供有力支撑.

1 芯片概述

国产银河衡芯敏捷交换芯片HX-DS40如图1所示,于2020年7月流片成功,采用324引脚塑封BGA封装,尺寸15 mm×15 mm,焊球节距0.8 mm,典型功耗1.6 W.HX-DS40提供4个万兆以太网接口和4个千兆以太网接口,支持全端口线速转发交换处理.支持基于10 GBASE-R/KR背板传输协议的板间高速互连.此外,HX-DS40具备多种应用模式,包括独立应用模式、协处理模式以及堆叠扩展模式等.

Fig.1 HX-DS40 chip图1 HX-DS40芯片

HX-DS40支持基于L2-L7协议以及用户自定义协议的分组交换、应用层交换与卸载加速、轻量化管理控制功能.

1)协议无关转发.HX-DS40采用协议无关网络转发处理技术,支持基于L2-L7协议的分组交换和自定义转发,可有效支撑通专结合网络协议的高性能转发处理.

2)应用层交换与卸载加速.HX-DS40提供超宽位搜索匹配引擎,支持宽度超600 b的关键字搜索,从而可实现基于应用层信息的交换;此外,基于元数据的分组交换结构,可以有效实现网络查表搜索功能的卸载与加速,减轻CPU网络处理负载.

3)轻量化管理控制.HX-DS40提供以太网、SPI和I2C轻量化管理配置接口,支持通过外置EPLD,EEPROM等方式的管理配置,从而避免集成复杂CPU配置系统.

2 创新特点

商用以太网交换芯片,通常面向数据中心等大规模固定网络交换需求,强调匹配引擎的表项数目、功能及协议的丰富程度[5],支持百万级流量的转发、交换管理.敏捷交换芯片更多针对移动高端装备集中式计算平台的设计需求,强调高能效、低功耗,以提供空间、散热受限条件下的高效敏捷连接;强调匹配引擎的表项宽度,以提供上层的精细化流量识别和交换管理;强调平台异构资源的统一连接和卸载加速,为上层业务应用提供统一的数据交互,支撑业务优化.

1)高能效与低功耗

与数据中心等固定平台信息处理装备不同,机载、车载、舰载等移动装备平台通常采用小型VPX、CPCI单板或多槽机箱形式集成计算、加速等资源,在供电、散热等方面要求高,高能效、低功耗的敏捷交换芯片具有更广泛的应用.HX-DS40采用高效能、低功耗的体系结构优化等设计方法,44 Gbps(单向)吞吐率下功耗为1.6 W.与应用广泛的某国产120 Gbps以太网交换芯片相比,性能功耗比提升3倍以上(27.5 Gbps/W与7.5 Gbps/W).

2)应用层交换

商用以太网交换芯片(如BCM53346,CTC5160等)通常支持L2~L3端到端的交换,缺乏根据目的主机应用需求动态交换数据的能力.部分以太网交换芯片提供L4交换功能,允许用基于目的地址、目的端口号(应用服务)的组合进行流量管理.然而,对于流量负载均衡,感知到端口业务数据是流媒体还是XML等数据对象请求,对规划系统处理资源非常关键.移动高端装备集中式计算平台主要承载Web服务以及分布式计算业务,因此,实现基于HTTP请求、Cookie等的应用层交换,对保证不同类型内容的流量差别及策略服务,以及实现对传输流和内容的精细控制极为重要.应用层交换可为负载均衡、内容缓存等优化技术提供基础支撑.

3)统一连接与卸载加速

算力提供是面向移动国产高端装备中集中式计算平台构建的核心目标.集中式计算平台在有限集成度限制内,提供高算力的方法主要依赖于异构计算资源集成以及卸载加速.敏捷交换芯片通过定义和支持基于统一元数据格式的连接,可以实现异构资源的统一连接,为上层业务应用提供统一的数据交互与计算处理接口和模型.此外,协议无关的模块化深度流水交换架构可以有效卸载网络分组的解析、查表、动作等耗费CPU的功能及操作,从而避免网络处理对CPU算力的占用.

3 芯片架构

敏捷交换芯片HX-DS40采用基于集中缓存的模块化深度流水交换架构,如图2所示.作为I/O密集型芯片,采用集中缓存结构可以有效降低分组数据搬移造成的动态功耗.模块化深度流水架构能够有效提升芯片的处理性能和可扩展性,为形成高中低端系列化敏捷交换芯片提供架构支撑.

Fig.2 The architecture of HX-DS40图2 HX-DS40架构示意图

作为敏捷交换芯片的核心引擎,通配及精确匹配引擎设计采用了相关的优化设计技术,以满足移动高端装备平台的特殊要求.

1)基于通用存储的超宽通配匹配引擎.采用基于SRAM+寄存器混合的通配匹配实现技术,相对于传统基于TCAM器件实现方式而言,在能耗、搜索宽度、可扩展性方面更具优势,可有效支撑应用层交换和卸载加速需求.

2)基于Bucket的改进精确匹配引擎.基于并行Cukoo Hash解决匹配冲突问题.此外,通过增加基于Bucket的通配匹配能力,扩展了精确匹配引擎对通配规则的支撑能力,有效提升了精确匹配引擎的灵活性.在资源受限情况下,实现了敏捷交换芯片对于通配匹配能力的扩展需求.

4 原型系统与测试

基于银河衡芯敏捷交换芯片HX-DS40构建了面向移动装备的嵌入式超算原型系统,如图3所示.嵌入式超算原型系统中,HX-DS40实现了通用多核CPU、高性能FPGA等异构计算及加速资源的统一连接,形成了面向应用的卸载加速能力.基于该原型系统,对敏捷交换芯片的线速转发、功能卸载等能力进行验证,测试HX-DS40吞吐率和加速卸载处理延迟.由100 Gbps网络测试仪构建长度为64~1 518 B的以太网报文,接口线速连接HX-DS40的4个万兆接口与4个千兆接口,原型系统中配置匹配表项进行接口转发,并进行报文收发数量统计.如图4所示,针对不同大小的报文的吞吐率测试结果表明,HX-DS40可满足报文线速处理需求.另外,配置嵌入式超算原型系统中HX-DS40的加速卸载路径,由网络测试仪构建长度不同的以太网报文,报文经由HX-DS40的一个万兆接口,进入加速卸载路径从另一个万兆接口转发至网络测试仪,测试仪测算路径延时,获取HX-DS40的加速卸载延时.查表加速卸载延迟实验表明,随着报文尺寸的增大,加速卸载延迟有所增加,最大不超过3.275μs.然而,由于查表加速应用中关键字通常不超过76 B(即64 B+12 B),查表结果不超过64 B,分组头部开销34 B,因此报文长度一般不超过174 B.根据延迟测试结果,查表加速延迟通常可控制在1μs延迟内.

Fig.3 Embedded supercomputing prototype system based on HX-DS40图3 基于HX-DS40构建的嵌入式超算原型系统

Fig.4 Performance analysis based on prototype system图4 基于原型系统的性能分析

猜你喜欢
应用层集中式报文
基于J1939 协议多包报文的时序研究及应用
以太网QoS技术研究及实践
基于Python的汽车CAN总线报文格式转换系统的设计与实现
基于报文类型的限速值动态调整
传输层和应用层的隧道技术
基于分级保护的OA系统应用层访问控制研究
硬式内镜器械清洗消毒集中式与分散式的管理效果比较
国有企业的集中式财务管理模式分析
集中互动式多媒体术前宣教在门诊手术患者中的应用
物联网技术在信息机房制冷系统中的应用