袁瑞明,章钢,余剑宇,侍书成,张裕,赖学华
(中国电子科技集团第五十二研究所,杭州 311100)
随着商用服务器性能和集成化程度越来越高,相关电子元器件散热问题变得越来越突出[1]。因此,合理的服务器散热设计对其能够高效稳定的运行至关重要。目前,绝大部分服务器设备采用强迫风冷冷却技术[2,3],而风冷系统的核心部分为风机和散热器。强迫风冷冷却技术虽然已经被广泛应用于服务器散热设计中,但如何优化风机和散热器,提高服务器的散热能力,依然是值得深入研究的课题。
近年来,关于风机性能研究主要集中在风机串并联[4]、风机安装方式[5,6]、风机结构参数[7-9]以及风道尺寸[10]方面的研究。文献[4]研究了风机串并联对电子设备散热的影响,研究表明,系统的散热性能与风机的排布形式有关,当系统风阻较大时,串联风机应用能起到明显的降温作用。文献[5]研究了风机距离蜂窝板的距离对风机散热特性的影响,研究表明散热风机与蜂窝板之间间距越小,风机的散热性能越好。文献[6]研究了风机中心与散热中心的偏移程度对整机流场及散热特性的影响。文献[7]研究了不同风腔厚度对风冷系统散热特性的影响,研究表明风腔厚度过小,风机性能受到明显抑制,随着风机厚度增大,风腔性能会随之提升,当风腔厚度增大一定值时,再增加厚度,风机性能会随之降低。文献[8]研究了不同风机出口形状对风机性能的研究,研究表明椭圆形支撑架较之方形和圆柱形支架,风机尾迹区内气流流动明显更加均匀,能量损失较小;文献[9]研究了叶片安装角、叶片高度、叶片数和转速等因素对轴流风扇性能的影响,基于组合优化策略以多工作点平均流量系数最大为目标函数对多参数结构风扇进行快速优化,找到风扇的最佳设计安装,将所设计的8025 轴流风扇性能提升14.5 %。文献[10]研究了在不同进风口宽度以及不同风道宽度工况对整机散热特性的影响。研究表明当风机内径为D 时,进风口宽度一般为(1~1.2)D,长度方向上则选取风道的最外边长度。
本文不同于以往单一风扇以及全速工况下性能的研究,而实际服务器是使用过程中,往往会考虑噪音要求,内部不同类型的风机往往不是全速状态,基于这一背景,本文研究了服务器设备中不同类型风机耦合的情况对整机散热特性影响的研究,同时考虑风扇不同旋转特性对整机散热特性影响的研究。
本文所研究的服务器设备为国产S2500 双路高性能服务器,该设备研发过程中优先选用经过考验、验证,技术成熟的设计方案,充分考虑设计的继承性。设备在设计过程中充分考虑降额设计、简化设计、冗余设计、环境防护设计、电路防护设计和减震缓冲设计等。设备的平均失效间隔工作时间MTBF ≥10 000 h。设备为外形尺寸为736 mm×447 mm×87 mm,其中主控模块主要发热芯片包括2 个S2500 CPU 芯片和2 个8764 桥片,仿真模型示意图如图1 所示。
图1 服务器设备仿真模型示意图
本次研究的服务器中包含2 种风机,分别为系统风机和CPU 散热器风机,系统风机尺寸为60 mm×60 mm×38 mm,CPU 散热器风机尺寸为60 mm×60 mm×25 mm。图2 展示了2 种风机的P-Q 曲线,从曲线中可知:系统风机风量范围为(0~56.2)cfm,对应的风压范围为(43.9~0)mmH2O,CPU 散热器风机风量范围为(0~38.5)cfm,对应的风压范围为(13.2~0)mmH2O。
图2 系统风机和CPU 散热器风机P-Q 线
图3(a)展示了本文所研究的服务器设备温度测试实验模型,实验模型与计算模型配置一致。芯片表面布置测温热电偶,用于测量芯片表面温度,本文选用的热电偶为T 型热电偶,测量范围为(-40~350)℃,测温精度为±1 ℃。本次实验测试使用Fluke 多通道数据采集器,这是一种适应于测试要求的通用仪器,仪器的后部可以扩张多个 60 通道插槽,通过网线连接互相传输信号。通过多通道记录仪可以把需要的温度以数字的形式显示出来。图3(b)展示了本文所研究的服务器设备功耗测试实验模型,芯片功耗测试需要针对芯片每种电压,分别进行电流检测,通过示波器获取电流的数值进行统计计算,分别对每组电流电压进行功耗计算,得出最终芯片总功耗。本文研究的服务器设备S2500 和8764 芯片功耗分别为136 W 和15.6 W。
图3 服务器设备温度和功耗测试图
服务器设备工作温度一般为(0~40)℃,为了使设备满足高温要求,服务器选用耐高温、耐低温、热稳定性好的元器件和材料,机壳采用导热良好的金属材料,同时针对每个发热芯片,单独设计满足芯片功耗的散热器,保证设备满足高温散热要求。表1 展示环境温度40 ℃,系统风机转速Q1为12 000 rpm,CPU 散热器风机转速Q2为8 000 rpm 时,主板模块各芯片仿真和实测数据对比。从表中可以看出高温40 ℃环境下,各芯片温度均在许用节温内(S2500 许用节温90 ℃、8764 许用节温105 ℃),留有较为充足的设计余量,满足环境适应性要求,且实验数据和仿真数据接近,误差最大的为芯片8764-1,两者之间的误差为3 %,表明仿真数据真实可靠,为后面的结果讨论提供数据支撑。
表1 环境温度40 ℃仿真与实验各芯片数据对比
图4展示了环境温度25 ℃,CPU 散热风机转速Q2为6 000 rpm 时,在系统风机不同旋转方向(顺时针和逆时针旋转)下,服务器设备内各发热芯片节点温度随系统风机转速Q1关系图。从图4(a)可以看出:当系统风机为顺时针旋转时,设备内各发热芯片节点温度随系统风机转速的提高而降低;不同系统风机转速下,S2500-2节点温度都略低于S2500-1 节点温度,而8764-2 节点温度要明显低于8764-2 节点温度;而从图4(b)可以看出:当系统风机为逆时针旋转时,S2500-1 和S2500-2温度分布同系统风机为顺时针旋转一致,而8764-1 和8764-2 节点温度几乎一致,完全不同于系统风机为顺时针旋转时的温度分布。由此可知,当芯片靠近风机布置时,风机的旋转方向对芯片节温影响不大,而当芯片远离风机布置时,风机的旋转方向对芯片节温产生很大影响。
图4 不同风机旋向下服务器内芯片节点温度随转速关系图
图5展示了系统风机不同旋转方向下,服务器设备内同种各发热芯片节点温度随系统转速Q1关系图。从图5(a)和(b)可以看出,当芯片靠近系统风机布置时,S2500-1 和S2500-2 节点温度在系统风机低转速时,系统风机旋转方向对芯片节点温度影响不大,当系统风机处于高转速时,顺时针旋转下的芯片节点温度要略低于逆时针旋转下的芯片节点温度。从图5(c)和(d)可以看出,当芯片远离系统风机布置时,系统风机旋转方向对芯片节点温度影响很大,顺时针旋转下的8764-1 节点温度温要高于逆时针旋转下的节点温度,而顺时针旋转下的8764-2 节点温度要低于逆时针旋转下的节点温度。由此可以,当芯片远离风机布置,尤其是芯片靠板边布置时,要充分考虑风机的旋转方向对芯片节点温度的影响。
图5 不同转速下风机旋转方向对芯片节点温度影响图
图6(a)展示环境温度25 ℃,系统风机和CPU 散热器风机转速互为4 000 rpm 和6 000 rpm 两种工况下,服务器设备内各发热芯片节点温度分布。从图中可以看出当设备处于工况1 时,S2500-1 和S2500-2 节点温度分别为73 ℃和70.1 ℃,略高于工况2 下S2500-1 和S2500-2 节点温度(72.2 ℃和69.5 ℃),两者工况下的芯片节温均低于S2500 芯片许用节温90 ℃。而工况1 下的8764-1 和8764-2 节点温度分68 ℃和61.5 ℃,低于工况2 下8764-1 和8764-2 节点温度(75.9 ℃和69.9 ℃),两者工况下的芯片节温也均低于8764 芯片许用节温110 ℃。即2 种工况下,设备均可以安全稳定运行。但在这两种工况下,设备噪音却不一样,设备噪音测试方法如图6(b)所示,即测试设备前、后、左、右、上五个方向,测试点距离设备中心1 m,取五个方向机器稳定运行下的最大噪音。设备在工况1 下运行,设备噪音为65.8 dB,而设备在工况2 下运行下,设备噪音仅为58.9 dB。由此可知,在兼顾考虑整机散热和噪音指标时,需要合理设置系统风机和CPU 散热器风机转速,尤其是对CPU 散热风机转速的控制。文中研究表明,当系统风扇转速较低,CPU 散热风机转速较高时,不仅整机噪音更低,CPU 芯片(S2500-1&S2500-2)散热性能也更优。
图6 风机旋转方向对芯片节点温度及整机噪音测试图
图7展示了在相同外形尺寸下,设计2 款CPU 散热器,分别为CPU 散热器(新增风机)和CPU 散热器(拉长翅片),用于对比研究有无CPU 散热器风机对CPU 散热影响。图8 展示了环境温度为25 ℃,CPU 散热器风机转速为6 000 rpm 时,CPU 散热器(新增风机)和CPU 散热器(拉长翅片)两种工况下S2500-1 节点温度在不同系统风机转速下的分布情况。从图中可以看出:相同系统风机转速下,相比较CPU 散热器(拉长翅片),CPU 散热器(新增风机)下的芯片节点温度要更低;当Q1=4 000 rpm 时,CPU 散热器(拉长翅片)和CPU 散热器(新增风机)下S2500-1 节点温度Tj分别为85.6 ℃和72.2℃,节点温度降幅Tj%为18.6 %,而当Q1=12 000 rpm,两者对应的节点温度Tj分别为64.7 ℃和64.6 ℃,Tj%仅为0.15 %,即相比CPU 散热器(拉长翅片),CPU 散热器(新增风机)下的CPU 节点温度降幅Tj%随Q1的提高而减小。
图7 相同外形尺寸下两款CPU 散热器示意图
图8 两款CPU 散热器下S2500-1 节点温度随系统风机转速影响图
本文利用热仿真软件,研究了系统风机旋转特性对整机散热影响、系统和CPU 散热器风机转速对整机散热及噪音影响、以及有无CPU 散热风机对CPU 散热影响。通过这些研究得出以下结论,这些结论对优化服务器散热和噪音设计具有指导意义。
1)设备内各发热芯片节点温度随系统风机转速的提高而降低。当芯片靠近风机布置时,风机的旋转方向对芯片节温影响不大,而当芯片远离风机布置时,风机的旋转方向对芯片节温产生很大影响。尤其是芯片靠板边布置时,要充分考虑风机的旋转方向对芯片节温的影响。
2)在兼顾考虑整机散热和噪音指标时,需要合理设置系统风机和CPU 散热器风机转速,尤其是对CPU 散热风机转速的控制。文中研究表明,当系统风扇转速较低,CPU 散热风机转速较高时,不仅整机噪音更低,CPU 芯片(S2500-1&S2500-2)散热性能也更优。
3)在相同外形尺寸和系统风机转速下,相比于CPU 散热器(拉长翅片),CPU 散热器(新增风机)所对应的CPU 节点温度要更低,但随着系统风机转速的提高,CPU 散热器风机对芯片节点温度的影响逐渐减小。