专用加速器从SMARTNIC到DPU的崛起
它的另一个职责是减轻CPU的负担,节省服务器上有限的处理器核心。因此,虽然DPU看起来类似于一些PCIe智能网卡或GPU,但它本质上是一个微服务器,为数据流和数据包处理提供加速、卸载和本地服务。当服务器和数据中心开始节能减排时,如何权衡每个组件的功耗无疑是一个大问题。
随着计算架构和负载变得越来越复杂和多样化,处理器制造商已经开始了自己的造词方式。为了体现产品定位,让大家对其缩写印象深刻,PU成为最常见的后缀。如今,处理器家族中有许多成员。除了常见的CPU、GPU和APU,NPU和TPU也根据不同的处理对象出现,随着人工智能和深度学习的兴起。
DPU模糊的定义
然而,这些明确定义的处理单元并不是我们今天的主角,而是找到了一个新定义的xpu。很难定义什么是xpu,包括DPu(数据处理单元)、IPU(基础设施处理单元)和FAC(功能加速卡)。这些新产品是xpu,它们代表了新时代的加速器硬件,从smartnic演变而来,超越了它们的定位。除了smartnic,这些xpu虽然有不同的名字,但实际上它们在很多情况下是完全重叠的。现在,为了方便,它们通常被称为DPU。
这样,DPU的定义仍然非常模糊,我们看看它的特点。Smartnic通常需要主CPU来完成管理。虽然DPU通常属于主系统中的一个组件,但它可以完全独立,可以部署到边缘、JBOF存储和网关,并为它们提供网络接口和虚拟功能。它的另一个职责是减轻CPU的负担,节省服务器上有限的处理器核心。
因此,虽然DPU看起来类似于一些PCIe智能网卡或GPU,但它本质上是一个ADC0809CCV微服务器,为数据流和数据包处理提供加速、卸载和本地服务。虽然它在服务器中提供了一个独立的单元,但它并不缺乏协助其他单元的处理能力。
DPU需要什么样的任务
至于为什么使用DPU,我们必须讨论越来越多的数据密集型任务。随着短视频和实时金融交易的兴起,高带宽数据流需要数据中心有效地处理网络、存储、安全和AI/ML。例如,谷歌几年前提到,在他们的数据中心,三分之一的任务是数据密集型的,这些任务是由底层基础设施完成的,这类任务的比例正在逐渐增加。由于CPU和GPU等通用计算单元不擅长,专门用于此类任务的DPU必须承担这一重大责任。其次,企业数据中心和公共数据中心也希望获得超大型巨头制造商的效率。要做到这一点,我们必须解决和收集那些昂贵的硬件资源,如SSD、GPU等。DPU为数据中心的解决和收集提供了极高的效率,并优化了占地面积和安全性。
DPU可以完成卸载和加速的各个方面,特别是在网络、安全和存储方面。在网络端,DPU可以有效实现虚拟路由器、辅助数据包交换、定义交换规则等工作,减少延迟,增加吞吐量;在安全性方面,DPU可以用来加速下一代防火墙(NGFW),完成数据包过滤、内容检测、头部检测和重写,将性能提升数倍以上;在存储方面,DPU可以卸载高速NVMe/TCP,进一步提高存储性能。最重要的是,这三者都能有效地接管CPU控制面的负载,节省CPU本身的计算核心。
以上是DPU为服务器提供的强化,主要以PCIe加速卡的形式提供。此外,还有单独的DPU存储产品。在传统的CPU存储方案中,整个系统由DRAM、X86CPU、Smartnic、加速器和PCIe接口组成,在未来的存储方案中,如高性能存储、计算存储、软件定义网络应用等,单片集成方案可以更好地满足要求,这种方案不仅可以提高IOPS,还可以进一步降低能耗。
因此,数据中心将使用DPU来完成数据密集型任务,从而降低功耗、拥有成本和占用空间。此外,他们还将使用基于DPU的存储器、GPU/TPU资源池和主机卡,以有效地完成高成本硬件资源的聚合。
混战DPU市场
在很多厂商对DPU的宣传中,经常提到这将是除了CPU和GPU之外的第三大硬件。人们可能会认为,一些AI处理器似乎也提到了类似的承诺,但GPU在市场上仍然占据主导地位。DPU会有什么区别?事实证明,市场对DPU有足够的信心,这可以从DPU的制造商那里看出。
目前制造DPU的企业有三种,一种是创业公司,比如:云豹智能、星云智联、中科数字、云脉核心、核心源头、大禹智芯、Fungible等。;二是市场上一些现有的服务器巨头,如AMD/Xilinx、英特尔、Marvel、英伟达;第三,CSP(云服务提供商)制造商,如亚马逊AWS、微软Azure、阿里云等。后者更负责设计或联合设计这些XPU,这样它们就可以专门用于自己的云服务器。除了DPU制造商,还有基础设施的OEM和ODM、增值经销商和集成解决方案制造商。CSP制造商在销售服务器时,自然会间接体现DPU的价值。
随着Mellanox被英伟达收购,Pensando被AMD收购,而Fungible的DPU主要是为了加速存储和卸载。虽然没有被收购,但也获得了软银主导的融资。国内DPU厂商也受到青睐,如腾讯反复投资的云豹智能、字节跳动投资的云脉核心、美团、百度投资的星云智联等。这些投资者要么是CSP,要么拥有大型数据中心。与其他CSP制造商不同,他们缺乏或有限的硬件设计能力,但他们也看到了DPU的前景。
DPU并不完美
尽管大型制造商对此持乐观态度,但从目前的情况来看,DPU的部署对一些中小企业来说仍然是一把双刃剑。当然,DPU可以卸载基础设施任务,减轻负担,使服务器的CPU空置,专注于应用程序本身。随之而来的是更高的效率、更低的拥有成本和更高的安全性。几乎每个服务器都可以享受这些优势。
然而,在一些服务器中,DPU的引入不可避免地增加了服务器的资本投资。此外,与CPU和GPU等硬件相比,它只能卸载和加速特定负载,而不是通用加速单元。此外,当一些服务器增加DPU时,功耗仍然会增加。当服务器和数据中心开始节能减排时,如何权衡每个组件的功耗无疑是一个大问题。此外,DPU的灵活性体现在可编程性上,但这需要一定的编程能力。此外,目前每个制造商都是单独工作,没有标准接口,因此适应绝对不容易。这也是为什么许多DPU选择ARM作为核心架构的原因,以降低其编程难度。
正是因为这些原因,从市场渗透率的角度来看,DPU主要是大型CSP厂商使用的,再加上托管应用的增加,这也将推动未来DPU产品的销售。对于自主开发的DPUCSP,他们肯定会继续增加这方面的投资,进一步降低成本。对于第三方制造商来说,服务器CPU和GPU制造商英伟达、AMD和英特尔无疑会有更多的优势,因为他们提供更具竞争力的集成解决方案。