全球各地的企业越来越意识到他们必须承担管理和减少环境影响的全部责任。否则,投资者可能会反对,政府可能会介入监管,而客户可能会开始寻找其他更清洁、更高能效的供应商。随着越来越多的公司制定气候目标,目前还不清楚这些美好的愿景是否能体现出实现气候变化目标的雄心和最终可衡量的结果。但减少温室气体排放是一项相当紧迫的问题。
为了改善这种情况,公司首先必须解决的问题之一是提高其IT基础设施的能效。越来越多的人认识到这一事实:在2022年7月的451ResearchDigitalPulse用户调查中,近一半接受调查的IT决策者表示,IT运营现在占其环境影响的大部分(25%)或全部(19%)。我们的调查显示,许多公司已经制定了减少环境影响的正式目标,他们认为提高能效和减少排放是影响其技术购买决策的重要因素。许多人还表示,愿意为能够减少环境影响的产品支付额外的费用。他们期望供应商能够提供必要的工具来跟踪这种影响。
但这里的好处不仅仅是安抚投资者和和展示良好的企业公民意识。在这样具体的信息技术背景下,通过努力减少环境影响而实现的能效将直接导致更有意义的成本优势,而日益全球化的能源价格上涨问题只会使总拥有成本收益更加明显。
451Research估计:2019年美国所有数据中心,包括从企业设施到服务器机房和机柜以及多租户、主机托管型设施的能耗共计约为268TWh。这相当于美国总能源使用量的6.3%,如果美国的数据中心和服务器机房代表一个国家,那么这个国家在总能耗方面将超过墨西哥。自2019年以来,数据中心能源消耗的复合年增长率为2.2%。将这一数字与同期电力需求的总增长(总体为0.3%)相比较,很明显数据中心消耗的能耗增长速度远远超过该国总体平均水平。
管理机构当然已经注意到该问题。在某些情况下,他们甚至会介入,为不断增长的数据中心能耗踩刹车。但环保倡议往往只是口头上的承诺,只不过是“洗绿”而已。碳补偿并没有什么实际意义。需要采取实际行动,取得可衡量的结果。数据中心运营商和提供商必须采取持续改进的姿态,除了减碳之外,还必须优先使用新的方法来提高效率。可持续发展必须作为优先事项。
数字化转型的需求将在未来几十年内继续推动数据中心的大幅增长。必须通过部署更高效的新技术和运营模式来补偿所有这些盲目的扩张。在我们的DigitalPulse调查中,核心IT基础设施的现代化(约41%的受访者提及)和采用公有云服务(36%)是客戶为实现其环境目标而最常采用的策略。劳动力生产力和协作工具(36%)以及客户体验和商务工具(28%)的影响排在其次。
而对于那些在数字化转型道路上走得更远的企业来说,数据平台和数据科学工具(35%,调查平均值为27%)以及人工智能和机器学习工具(34%,调查平均值为27%)被视为是对其环境改善最值得期待的贡献。在本文的其余部分,我们将深入探讨前两项战略-核心IT基础设施和云服务。
依据摩尔定律(Moore'sLaw),CPU的晶体管数量大约每两年就会增加一倍,自近60年前引入这一概念以来,已证明其具有令人难以置信的普适性。
然而,简单地提高功耗以在新一代CPU中提供更高的性能已不可持续。芯片公司仍在继续提高能效。
熟悉的x86-64架构已经扩展和迭代了几十年。如今,针对工作负载的加速器芯片(GPU、TPU、FPGA/ASIC和量子计算机)已用作异质计算架构的一部分,以补充通用“传统”CPU的功能。
这些加速器更大大抬升了功耗。2020年,AMD表示其目标是到2025年将能效提高30倍,以用于在加速计算节点上运行的人工智能训练和高性能计算应用。这比过去五年整个行业的总体改进速度快了2.5倍以上。如果实现30倍的目标,将在2025年节省数十亿千瓦时的电力,从而在五年内将这些系统完成一次计算的能耗减少97%。
虽然利用这些CPU和工作负载加速器的组合需要一些努力,但从纯粹的预算角度看,节省的成本则值得企业采用。性能功耗比指标应当用于指导全新工作负载的放置和架构决策。
电力使用效率(PUE)是大多数企业在能源转型中关注的指标。PUE评级用于衡量数据中心的整体效率,包括散热、服务器机房设计、可再生能源,甚至照明和安全。这相对易于观察,而且可以采取一些行动立即做出改进。但更重要的是服务器本身的能效水平以及使用情况。在过去,企业很难确保服务器以最高效率部署的方式进行虚拟化。随着气候治理工具的出现,这种情况正在发生变化,这些工具将环境数据整合到其平台中,用于指导运营团队根据生态性能部署工作负载。
显然,除了碳影响和能源状况之外,还有更多因素涉及到工作负载部署的决策。那些处于高度监管行业的公司可能无法选择将工作负载转移到云中,而其他公司则更愿意保持对其基础设施的性能或数据安全的完全控制。但随着时间的推移,能效问题将在决策矩阵中占据更高的位置。对于不能迁移到云的工作负载,或者需要留在本地的工作负载,企业应该考虑可以进行哪些升级以改进能效,并最终有助于降低给定工作负载的能耗,从而降低其相关的碳排放。
与分布式技术相比,利用云计算模式集中IT资源有助于减少碳足迹。打个比方,一辆公共汽车可能比汽车产生更多的碳排放,但一辆载有20人的公共汽车比路上的20辆小汽车更有利于减少碳排放。同样,由数千个应用程序共享的服务器池可能比分散在不同数据中心的数千台服务器更具成本效益和减碳效率。云提供商享受着巨大的规模经济性。我们都在更多地依赖技术,但使用云资源意味着我们应让更多的人选择乘坐公共汽车,而不是独自开车。
可扩展性(向上或向下)是迁移到云的主要优势。计算和存储资源可以根据使用情况进行调整。但要有效地执行此操作,必须将应用程序拆分成多个虚拟机或容器,以便与其他应用程序并排放置,以提高服务器利用率。较小的设备可以更轻松地利用服务器上的空闲容量。
这是云原生架构的一个关键原则,使应用程序能够大规模高效管理,同时优化资源使用并减少浪费。
总体而言,451Research调查和数据建模表明,如果企业将IT转移到云,他们可能会减少能源消耗,从而减少碳足迹。然而,那些仍在使用企业本地数据中心的企业必须认真规划转型方案,以确保运营管理跨混合IT资产,即实现企业本地和基于云资源的混合,以便將云计算运行成本保持在最低水平。
为了提高效率,基本上会采用如下的策略和行动:
◆云计算数据中心的设备通常使用最尖端的设备进行更新,从而最大限度地提高性能功耗比并为客户提供卓越的性能。
◆云计算基础设施资源池化和共享以实现最大的利用率,而利用率是整体运营成本的最大决定因素之一。
◆最新的云计算数据中心专为三个领域的效率而构建:高效的基础设施(电力和散热);高效的服务器、存储和网络;以及使用清洁电源、可再生能源技术和可再生发展项目。
◆新建企业本地的数据中心,通过更有效的基础设施和服务器来提高PUE或者改造现有的数据中心,以节省整个生命周期的碳排放量。
◆根据开放数据中心委员会(ODCC)“数据中心算力碳效白皮书”数据显示,在特定算力条件下,基于AMDEPYC处理器的服务器其使用周期内的碳排放量最多减少43%◆采用AMD第三代EPYC处理器的腾讯云星星海灵动水系AC221服务器,由于卓越的每瓦性能表现,在2022年获得中国信息通信研究院和开放数据中心委员会的全五星碳排放认证,达到中国数据中心绿色等级评估的领先水平。