DPU提升数据中心能效,助力实现双碳战略
数据中心是国家、社会和企业的数字化转型的基础设施和重要支撑。在全球及国内“双碳”战略的大背景之下,数据中心作为数字新基建的重要组成,不仅承担着支撑数字经济发展的重任,也是实现“双碳”目标的重要组成部分。由于成本上升和供电量方面的限制,能效在数据中心内变得越来越重要。提升能效的最佳方式之一是,使用DPU(数据处理器)或智能网卡来卸载和加速网络、安全、存储或其他基础架构功能以及控制平面应用,从而将服务器耗电量降低。
全球数据中心耗电量不断增加
最近,由于需求旺盛和供应链受到限制,全球电价在不断飙升, 加上许多数据中心可以获得的供电量都有硬性限制,这就形成了一个强劲的激励因素,促使数据中心提高效率,以便通过一个数据中心来容纳更多应用、租户,并实现更高的生产力,而不是再构建或租用一个新的数据中心。此外,云服务提供商不仅承受着持续的竞争压力,要不断降低软件即服务、平台即服务和基础设施即服务(SaaS、Paas、IaaS)的每小时租用成本,而且在许多地区还要承受不断上涨的电力成本。各种组织(服务提供商、企业和政府机构)都面临着提高能效来应对气候变化的压力,通常是通过购买更昂贵的“绿色”电力来替代火力发电产生的电力。在节省资金、更大限度地提升每个数据中心的利用率以及应对气候变化等压力下,每个数据中心运营商都在力争提升服务器的能效。
据估计,数据中心目前消耗的电量占全球发电量的比例略高于1%,这一占比在美国为1.8%,在欧洲为2.7%。根据华为在2015年发布的一项研究,到2030年,数据中心消耗的电量占全球发电量的比例预计将上升到8% (可能的估算值),甚至会高达13% (最差情况预测值)。
图1:到2030年,数据中心的耗电量预计将占到全球电力需求量的3% (最佳情况)到13% (最差情况)
(来源:2015年华为论文;作者是Anders S.G. Andrae.和Tomas Edler)
采取提升每台服务器的效率和能效的策略
数据中心运营商通常会采取多种策略来降低耗电量和电力成本:
一是在电力供应成本更低或供应量更丰富的地区建立新的数据中心,这种方式可以降低电力成本而非耗电量。
二是改善电源使用效率(PUE),这意味着更大限度地提升供应给数据中心的电力中用于实际计算设备的电力所占的百分比。不过,这本身并不能衡量或提升各个服务器的能效。
三是提高冷却效率,因为冷却所消耗的电量在数据中心用电量中所占的比例最高可达 30%。这可以降低冷却所需的电力,并降低PUE比率。
四是使用虚拟化、容器和可组合基础架构更大限度地提升每台服务器的工作负载利用率。
五是提升单台服务器的能效。
六是将选定的IT工作负载外包给公有云,或外包给电力成本更低的主机托管中心。不过,并非所有工作负载都可以外包,公有云的高能效所带来的好处也并非始终都能惠及租户。
在过去的几年中,在数据中心采取了前三种策略来降低耗电量并节省电力成本,使得数据中心的PUE持续大幅下降,但目前数据中心的平均 PUE 已经趋于平稳。为进一步降低数据中心耗电量和电力成本,就需要采用第四种和第五种策略来更大限度的提升每台服务器的效率和能效,而DPU有助于实现这些策略目标。
DPU卸载是提高数据中心效率的新一波浪潮
使用DPU(数据处理器)或智能网卡来卸载和加速网络、安全、存储或其他基础架构功能以及控制平面应用,从而将服务器耗电量降低多达30%。节省的电量会随着服务器负载的增加而增加。在3年的服务器生命周期内,对于拥有1万台服务器的大型数据中心可以轻松节省500万美元的电力成本,同时还可进一步节省冷却、配电、机架空间和服务器资本成本。
例如近期,NVIDIA将助力一家北美知名的无线运营商通过Open vSwitch (OVS)网络卸载来实现节能降耗。OVS是一款用于软件定义网络(SDN)的通用开源工具。通常,OVS作为操作系统内核软件运行在服务器的x86 CPU上,但现在可以卸载到BlueField DPU的网络加速器上。在这项测试中,NVIDIA对比了工作负载在空载(0%)至满载(100%)不等的情况下,在内核(CPU上)中运行OVS与将OVS卸载到DPU上的耗电量变化。
图2:与在CPU上运行内核态OVS相比,采用BlueField DPU OVS卸载所节省的耗电量达127瓦(29%)
当工作负载为满载时,DPU卸载最多可降低29% (127瓦)的耗电量,因为BlueField DPU在处理OVS SDN任务时,比x86 CPU速度更快、更节能高效。
网络卸载将节能降耗转化为经济效益我们看到,将网络任务卸载到BlueField DPU可将每台服务器的耗电量降低多达34%或高达247瓦。我们还看到,服务器利用率越高,基于硬件的网络卸载所节省的能耗就越多。节能的价值取决于当地的电力成本和PUE比率。如果DPU卸载和加速能够减少支持相同工作负载所需的服务器数量,则可以节省更多的资本性支出和能耗。
展望未来,DPU卸载是提高数据中心效率的新一波浪潮。使用适当DPU实现通过硬件加速的网络卸载,可大幅减少每台服务器的耗电量,从而提高服务器效率、数据中心效率,降低用电量,减少冷却负载,最终大幅降低成本。在这个能源成本不断.上涨和对绿色环保IT基础设施需求不断增加的世界中,采用DPU将是大势所趋,通过它来降低数据中心的资本性支出和运营性支出,进而降低TCO(总体拥有成本)。