宋梦洋,朱 虎,江 毅(武汉光迅科技股份有限公司,湖北武汉 430205)
随着云计算、大数据、超高清视频、人工智能、5G行业应用等快速发展,网络访问频率、接入手段、数据处理和计算需求不断增加。特别是随着AI 大模型应用的快速发展,国内外公司纷纷推出相关模型,各地开始启动智算数据中心建设。国际知名咨询公司LightCounting 数次上调光互联模块市场规模预测,主要驱动力均来源于AI 大模型智算数据中心旺盛的算力需求。
根据中国信息通信研究院发布的《中国算力发展指数白皮书(2022)》(见图1),2021年美国算力规模占全球份额的34%,中国以33%的占比位居全球第二。美国、中国、日本的GDP 依次位居全球前三,而三者的算力能力也为全球前三,算力规模与国家GDP 呈现正相关关系[1]。2023 年10 月,工业和信息化部等六部门联合印发《算力基础设施高质量发展行动计划》,完善算力综合供给体系,提升算力高效运载能力。2023 年12 月,国家发展改革委等五部门联合印发《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,大力推进算力网络建设,预计到2025 年底,综合算力基础设施体系将初步成型。
图1 2021年全球算力分布情况[2]
算力网络的发展需要高速率、高带宽与高能效的互联技术来支撑,将高性能计算数据中心、AI 数据中心以及基础算力数据中心统一连接起来,形成集成化的数据中心,从而实现算力的协同调度。
在这些需求带动下,用于数据中心互联的光模块处于高速发展阶段:400 Gbit/s光互联模块发货量快速增长,800 Gbit/s进入批量化进程,更高速率的1.6 Tbit/s 光互联模块研发工作已经开展,全球主要标准化机构和多元协议组织(MSA)纷纷启动了基于单通道200 Gbit/s 的1.6 Tbit/s 光模块标准的研究和制定,IEEE 在2021年底给出了相关标准的预计完成时间(见图2)。
图2 基于单通道200 Gbit/s的标准化时间节点[3]
数据中心光互联应用主要分为两大类(见表1):一类是数据中心内部的互联,典型光纤传输距离为2 km 及以内;一类是数据中心之间的互联,典型光纤传输距离为80 km及以上。
表1 数据中心互联场景[4]
典型光互联方式包含以下几种。
a)直连电缆(DAC),该方案采用铜缆,传输距离随带宽的增加而减少,但成本相对较低。
b)有源光缆(AOC),将光缆和光模块进行集成,光缆可根据传输距离进行配置,传输距离通常为100 m及以内。
c)光模块,根据传输距离需求采用不同规格的光模块,用于连接服务器、交换机等网络设备,承载高速数据的收发。
在数据中心内部互联场景中,以上几种互联方式均有采用,随着数据中心不断向高带宽、高速率演进,并且由于供电、GPU 应用数量等原因,数据中心内部互联以基于直调直检方案的光模块和AOC 为主。在数据中心之间的互联场景中,主要采用相干光模块进行连接。
数据中心内部光互联模块的发展与交换机交换芯片串行-解串行器(Serdes)的发展进度密切相关,交换机及光模块发展趋势见表2。2023 年交换芯片Serdes 的速率达到112 Gbit/s,交换芯片吞吐量相应达到51.2 Tbit/s,根据交换芯片演进趋势、市场需求及技术成熟度,预计2025 年交换芯片吞吐量将达到102.4 Tbit/s,2027 年将达到204.8 Tbit/s,光互联模块也需要相应演进到1.6 Tbit/s和3.2 Tbit/s对其实现有效支撑。
表2 交换机及光模块发展趋势预测
相干技术已经成为数据中心之间互联的主流方案。在多个标准化组织的大力推进下,400 Gbit/s光模块已发布多项标准,如400ZR、400G OpenROADM、Open ZR+等均采用DWDM 技术,在C 波段进行传输,结合DP-16QAM 调制格式,可实现80~120 km(纯裸纤传输距离为40 km,增加光放可达到120 km)的高速传输。
随着400 Gbit/s 光互联模块的批量化应用,800 Gbit/s 光互联模块开始进入样品或小批量发货阶段,标准研究接近尾声(见表3和表4),后续随着标准的正式发布,将逐步走向批量化应用。
表3 800 Gbit/s光模块标准化进展
表4 800 Gbit/s光模块标准部分技术方案[4]
AI 算力网络与常规数据中心相比,对计算的需求量每18 个月增长10 倍,对高带宽、低时延的光互联需求更加迫切。目前国内外标准化组织纷纷启动1.6 Tbit/s光互联模块的研究工作,主流光模块厂家均已完成1.6 Tbit/s光模块的样机研制工作(见表5)。
表5 1.6 Tbit/s光模块标准化进展
随着速率和带宽的增长,功耗也随之成倍增长。交换芯片、SerDes 和光模块是功耗增加的主要因素。据推算,交换机从640 Gbit/s发展至51.2 Tbit/s,带宽增长80 倍,功耗同时增长22 倍。其中,专用集成电路核心(ASCI Core)的功耗增长8 倍,系统风扇的功耗增长11 倍,交换芯片SerDes 的功耗增长25 倍,光模块功耗增长26倍。将51.2 Tbit/s交换机的整机功耗按照上述4 个维度进行分解,光模块的功耗约占交换机整机功耗的一半。因此在进行更高速率光互联模块开发设计时,功耗是无法绕开的瓶颈,目前行业中正在蓬勃发展的各项新技术,其主要需求驱动均为功耗控制。
硅基光电子(简称硅光子)基于微米/纳米级光子、电子及光电子器件的新颖工作原理,可使用与硅基集成电路技术兼容的技术和方法,在同一硅衬底上实现单片或混合集成[5]。以此为基础的硅基光电子集成平台,可以利用现有的微电子工艺和成果,在硅衬底上同时集成微纳米尺寸光学回路与各类CMOS 集成电路如调制器、探测器、互阻放大器、数字信号处理模块以及各类无源器件等,形成具有若干种功能的大规模集成芯片。硅光子技术结合了CMOS 技术的超大规模逻辑、超高精度制造特性和光子技术超高速率、超低功耗优势,是一种可解决技术演进与成本矛盾的创新性热点技术,并已在通信光模块应用中发挥了积极作用,目前其技术发展势头强劲,产业规模不断扩大,产品与应用进展也在不断推进[5]。
硅光子集成技术的发展受到多方力量驱动。首先,从集成角度来看,集成光器件相比分立光器件具有体积小、稳定性高等优势,可以大大减少分立光器件的数量和封装界面,减少传输路径,从而降低产品功耗;其次,从材料角度来看,硅相对于InP 和GaAs 等半导体材料价格更为低廉,且有望基于现有成熟、发达的微电子工艺,发挥规模优势提高工业化水平,从而进一步降低成本。
硅光子产品主要包括硅光子集成芯片和硅光子光模块(见图3)。目前硅光子技术凭借高集成度、低功耗、小型封装、大规模可生产性等优势,与共封装技术和薄膜铌酸锂调制技术联合应用,有望在800 Gbit/s、1.6 Tbit/s甚至更高速率的短距和相干应用中成为主力方案。
图3 1.6 Tbit/s光收发模块的COB封装器件
根据LightCounting 预测,到2028 年,硅光产品的市场份额将从2022年的25%增长至43%,领先的供应商都在布局硅光技术。但硅光技术的耦合效率仍相对较低,产业链完整性相比于Ⅲ-Ⅴ族仍有缺失,垂直整合能力有限。目前,国内硅光厂家已经开始硅基光电芯片晶圆级测试方法、硅光集成芯片技术规范等方面的行业标准编制工作。
光电合封(CPO)是将交换芯片、专用集成电路(ASIC)和光/电引擎(光收发器)共同封装在同一基板上,使引擎尽量靠近ASIC,以最大程度地减少高速电通道损耗和阻抗不连续性,从而有效降低整个系统的功耗。
光电合封的技术方案和应用场景主要聚焦在以下2个方面。
a)基于垂直腔面发射激光器(VCSEL)和多模光纤的解决方案,以30 m 以内的应用为主,主要面向超算及AI机群的短距离光互联。
b)基于硅光和单模光纤的解决方案,以2 km以内的应用为主,主要解决大型数据中心机架及机群之间的光互联。
相较于可插拔光模块以及板载光模块,光电合封技术有如下优势。
a)光模块中高速电信号在印制电路板(PCB)上传输越来越困难,目前的PCB技术将112 Gbit/s以上的电信号从交换芯片传送到位于交换机面板的光模块难度较大。光电合封技术将交换芯片与光电转换单元封装在一起,可降低高频线路以及信号完整性电器件的使用要求,突破电信号传输瓶颈,提高数据通信的交换容量。
b)光电合封技术将光引擎置于板载上,靠近ASIC芯片,可释放前面板的压力。
c)在热插拔光模块中,DSP 是高功耗的主要来源。在光电合封场景中,考虑到交换芯片本身具有均衡能力,可直接由交换芯片的Serdes驱动光引擎,光模块中高功耗的DSP/CDR 可被省略,从而降低功耗。此外,光电合封技术采用外置光源方案,将激光器置于光收发单元外部,可降低光收发单元的热量,同时便于维修,出故障时只更换激光器即可,进而降低成本[6]。
1.6 Tbit/s光模块虽然已基本确认仍将采用可插拔方式设计生产,但随着AI计算等大交换机吞吐量需求的出现,光电合封技术在提升整个链路性能方面具有较大潜力,或将是更高速率光互联的主流解决方案。CPO 技术目前仍有许多亟待解决的关键技术问题,例如高密度光纤连接的管理、散热管理、封装测试的良率以及可靠性等问题,需要业界共同摸索和实践。标准化方面,OIF 已发布外置光源和3.2 Tbit/s 的CPO 标准,CCSA也立项了关于外置光源的行业标准。
伴随着光刻技术的不断进步和混合集成工艺的发展,铌酸锂薄膜脊型波导结构的制造为薄膜铌酸锂调制器的开发奠定了基础。薄膜铌酸锂调制器继承了体材料铌酸锂良好的物理化学稳定性,具有光学窗口宽、电光系数大、高线性度等优点,并通过优化设计可有效避免调制效率低、尺寸大等缺点。薄膜铌酸锂调制器的技术核心是对光波导结构和电极结构进行匹配设计,使其光电响应匹配,提高工艺精度,损耗减少,从而实现高性能、低功耗、小尺寸、低驱动电压的新型调制器,降低光互联模块的功耗。
各大厂商正在积极开发800 Gbit/s 光互联芯片,128 GBaud 波特率相干光通信芯片以及60~70 GHz 以上带宽的特种通信用调制器芯片,它将成为未来超高速光互联领域的主流方案之一。
在光模块内部,发送端信号需经过数模转换(DAC),将数字信号转换为模拟信号;在接收端,模拟信号经过模数转换(ADC)后,再转换为数字信号。数字信号处理(DSP)芯片的主要功能是进行ADC/DAC、变速管理芯片(gearbox)的信号变速、电信号劣化补偿以及时钟数据恢复(CDR)。DSP 是高速光模块的关键部件之一,但是功耗较高,其功耗约占光模块总体功耗的50%~60%。
线性直驱技术(LPO)在光模块中去除DSP/CDR芯片,模块内部只处理线性信号,由设备侧进行非线性信号的处理,从而降低光模块的功耗和成本。目前,LPO技术已在400 Gbit/s、800 Gbit/s速率上得到一定应用,但传输距离主要为500 m 及以内,后续的规模化应用还需要技术的进一步发展、测试方法的建立以及标准的牵引。目前中国通信标准化协会已经启动LPO光模块研究课题,为后续标准化进行行业和技术分析。IPEC也启动了关于LPO方面的研究。
为解决数据中心高密度设备散热和降低电源使用效率(PUE)的难题,液冷技术已获得广泛应用,从而产生对能够在液冷环境中配套使用的液冷光模块的需求。
液冷光模块需防止冷却液进入光模块内部光路,即光器件、光器件与光接口之间、光接口与尾纤之间存在的光路需整体采用密闭封装(液密封装),以实现同外部冷却液的完全隔离。液冷光模块的密封技术包括气密封装和液密封装或者2 种封装方式的结合,这些技术保证光模块的密封性,防止气体或液体从内部泄漏到外部或从外部进入内部等。
液冷光模块能够很好配合系统进行散热,但相比常规光模块在成本方面有一定增加。主要体现在2个方面:一是物料成本,需采用绝缘、导热性能好、稳定性强的密封材料;二是加工成本,需通过较高的工艺和制造水平实现密封,且不能影响原性能参数、电磁兼容特性等要求[7]。
目前中国通信标准化协会已经完成用于液冷系统中的光模块的研究课题,正在进行用于液冷系统的光模块的标准立项申请。
随着算力网络概念的提出和推进,数据中心将进入高速发展快车道,光互联模块的机遇与挑战并存,国内外企业积极开展各项新技术的研究和实践。建立和完善涵盖光互联模块产业上下游的产业生态至关重要,为数据中心互联的健康发展提供有效支撑。