一片蓝海的DPU市场
“东数西算”工程能够更合理的分配资源,从一定程度上缓解供需失衡问题。但是未来如何从根本上解决算力供需失衡的问题,还是要细分算力需求,有针对性解决。作为继CPU、GPU之后数据中心的第三颗主力芯片,DPU(Data Processing Unit)提出新的解决方案。
DPU为何能和CPU、GPU构成数据中心的“铁三角”?
从数据中心发展与算力增长速度来看,近年来,我国以信息网络等新型基础设施为代表的“新基建”战略帷幕的拉开,5G、千兆光纤网络建设发展迅速,移动互联网、工业互联网、车联网等领域发展日新月异。云计算、数据中心、智算中心等基础设施快速扩容。此外,据IDC统计,全球算力的需求每3.5个月就会翻一倍,远远超过了当前算力的增长速度,CPU的性能增长率与数据量增长率出现了“剪刀差”现象。寻求效率更高的计算芯片就成为了业界寻求高效的新方法,DPU芯片就是在这样的趋势下提出的。
从技术层面来看,DPU要解决的核心问题是基础设施的“降本增效”,即将CPU处理效率低下、GPU处理不了的负载卸载到专用DPU,提升整个计算系统的效率、降低整体系统的成本。简单来说,CPU用于通用计算,GPU用于加速计算,而数据中心中传输数据的DPU则进行数据处理。新一代的DPU不仅可以作为运算的加速引擎,还具备“控制平面”(即追求数据处理功能的覆盖面)的功能,能更高效地完成网络虚拟化、IO虚拟化、存储虚拟化等任务,彻底将CPU的算力释放给应用程序。
从市场规模角度来看,根据Fungible公司和英伟达公司的预测,用于数据中心的DPU量级将达到和数据中心服务器等量的级别。服务器每年新增大约千万量级,一台服务器可能没有GPU,但一定会有一颗或者多颗DPU,好比每台服务器都必须配网卡一样。
头部厂商也努力
在这个千亿量级市场中,国际传统芯片巨头如英伟达、英特尔、Marvell、博通等厂商,都在积极布局DPU产品研发。2020年,中国DPU产品主要由英伟达、英特尔与博通三家企业提供。
英伟达
英伟达凭借在网卡上积累的优势,占据市场龙头位置。英伟达在其数据中心和高性能计算GPU的开发上投入了大量精力,另外,数据中心变得越来越复杂,CPU进行的各种数据操作在性能和功耗方面变得越来越昂贵,DPU实际上可能在未来几年面临不断增长的需求。英伟达发展DPU是其在数据中心进一步发展的布局。
2021年,英伟达发布的Bluefield-3 DPU包含其Mellanox技术和16个Arm Cortex-A78处理器,将能够取代300个传统处理器内核,预计2022年第一季度提供样品。英伟达还表示,Bluefield-4 将带宽翻倍至800Gbps。
在GTC 2021上,英伟达宣布将产品路线升级为“GPU+CPU+DPU”的“三芯”战略,通过CPU、GPU、DPU之间的协调计算,可以在数据中心和边缘计算都达到非常好的性能,而且能提供非常高的安全性。前日,英伟达收购Arm失败后,掌门人黄仁勋表示,公司将继续延续“三芯”战略。
英特尔
2021年6月,英特尔推出了全新的基础设施处理器(IPU,全称Infrastructure Processing Unit),英特尔的IPU被业界视为英特尔版本的DPU。IPU是一个网络设备,可以安全地加速和管理数据中心的基础设施功能与可编程硬件,旨在使云和通信服务提供商减少在中央处理器方面的开销,并充分释放性能价值。利用IPU,客户能够部署安全稳定且可编程的解决方案,从而更好地利用资源,平衡数据处理与存储的工作负载。
IPU可将CPU或XPU连接到网络,加速主机基础设施功能,并适用于现有和新兴基础设施用例,包括安全性、虚拟化、存储、负载平衡,以及虚拟网络功能和微服务的数据路径优化。IPU增强了基础NIC中丰富的以太网网络功能,通过高度优化的硬件加速器和紧密耦合的计算引擎的组合处理任务来实现加速。适应性是通过标准且易于使用的编程框架实现的,该框架结合了硬件和软件功能。IPU扩展了英特尔的智能网卡功能,旨在应对当下复杂的数据中心,并提升效率。
Marvell
2021年7月,Marvell Technologies发布了其OCTEON 10系列DPU。OCTEON 10采用Arm Neoverse N2和TSMC的5纳米工艺构建,有望提供比其前身高出3倍的性能。作为DPU的重要补充,Marvell还为OCTEON 10引入了内部机器学习(ML)引擎。
OCTEON 10集成了1Tb的交换机,支持内联加密,并且网络包处理可编程,把功耗、控制和数据平面加速设定提升到了新高度。数据路径和安全工作负载的性能范围从50G到超过400G。基于机器学习的硬件加速引擎,比软件处理的性能提升100倍。基于VPP的硬件加速器可将数据包处理速度提高多达5倍。Marvell OCTEON 10 DPU面向云计算、5G通信、企业、运营商和数据中心应用场景。
博通
博通在网卡市场处于领导者地位,其DPU布局更多源自SmartNIC。Broadcom在Stingray的中心设计了NetXtreme-S BCM58800芯片,将8个3GHz主频的ARM?v8 A72内核放置其中。博通在逐步将产品转移到7纳米,使得可以从8核扩展到12核。
国产DPU,挑战与机遇并存
在国际DPU市场上,英伟达、英特尔以及博通均推出了多款产品。中国本土DPU企业起步较晚,与国际头部厂商相比,有着1-2代的技术差距。另外,本土企业DPU商用化不足,在性能上、可靠性上都无法满足当代云计算厂商的需求。
DPU产品最初主要由一定市场和技术储备的成熟网络设备生产商以及芯片巨头提供。如今,数据流量暴涨,CPU算力瓶颈凸显,很多中小企业也开始布局DPU市场,DPU市场处于早期阶段,技术路线与产品形态等都不是不明确,对于国内一些中小企业来说,DPU的试错成本高,很难较快布局。
虽然国内厂商在芯片产品化的环节与国外一线厂商相比还有差距,但是在DPU架构的理解上还是有独到的见解的,而且我国目前在数据中心这个领域,无论是市场规模还是增速,特别是用户数量,相较于国外都有巨大的优势。国内厂商有望充分利用这一市场优势,加快发展步伐,在DPU这个赛道与国外厂商逐鹿中原。
国产DPU虽迟但到
芯启源
近日,芯启源宣布再获超亿元战略投资,本轮融资由国家集成电路产业基金旗下子基金上海超越摩尔领投,老股东允泰资本继续坚定跟投。获得的投资款将继续用于公司下一代DPU产品研发,和目前产品的商业化推广。芯启源拥有全球化的技术、人才、产品整合能力和迭代能力,在DPU/智能网卡领域已整合有自己的完整产品链,同时在大客户开拓方面已取得进展,具备先发优势。芯启源还考虑将DPU产品应用于元宇宙。DPU数据处理单元芯片通过不断提升元宇宙载体的算力,提升了AR、VR、AI等元宇宙内容和各项功能的用户体验。芯启源认为,虽然目前还处于元宇宙的初始发展阶段,但基础设施算力的提升是持续的,多技术协同演进和生态建设也在进行中。这一切必然会带来源源不断的创新和机遇到元宇宙载体领域的DPU产品中。
中科驭数
2021年12月,中科驭数近日宣布完成数亿元规模A+轮融资,本轮融资由麦星投资和昆仑资本联合领投,老股东灵均投资、光环资本追加投资。中科驭数本轮融资距A轮融资不过5个月,所筹资金将用于数据处理单元(DPU)芯片的研发和量产、以及市场开拓。中科驭数是国家高新技术企业,创始团队来自中科院计算所计算机体系结构国家重点实验室,成立三年来已获得50项发明专利授权。
中科驭数自主研发KPU芯片架构,打造了业界首颗拥有网络数据库一体化加速功能的DPU芯片和智能网卡系列产品和解决方案,并已联合交易所、多家头部券商机构等合作伙伴进入金融计算行业,在风控、极速交易等业务场景中大展拳脚。中科驭数还推出了业界领先性能的超低时延智能网卡,可实现亚微秒级超低时延、纳秒级抖动,性能相当于普通网卡的10倍。
持续融资后,中科驭数表示将以金融计算加速作为抓手,面向数据中心、电信运营商等客户类型,不断推进DPU方案的应用落地。据了解,在第一代产品基础上,中科驭数正在研发的第二代DPU芯片K2已经完成设计和验证工作,预计将于2022年第一季度投产流片。
星云智联
2月15日,珠海星云智联科技有限公司(以下简称“星云智联”)发生工商变更,股东新增百度关联公司达孜县百瑞翔创业投资管理有限责任公司。同时星云智联注册资本由1801.75万元增至约1829.19万人民币,增幅1.52%。
星云智联成立日期为2021年3月22日,该公司专注于数据中心基础互联通信架构和DPU芯片研发,团队成员有来自硅谷、以色列、加拿大等地ICT领域的专家。不到一年,星云智联就已经完成多轮融资。
云豹智能
2021年12月15日,云豹智能发布全功能云霄DPU网卡,全面支持裸金属、虚拟机和容器服务资源一体化和性能加速。作为软件定义DPU行业头部半导体公司,云豹智能已成功开发全功能云霄DPU网卡解决方案,全面支持裸金属、虚拟机和容器云服务一体化,以及高性能2x25G网络,提供弹性存储、弹性网络、虚拟化管理和安全加速等一站式解决方案,将极大地提升云服务商的服务质量和业务灵活性,并降低其整体投入和运维成本,帮助云服务商解决真正的痛点,引领数据中心新趋势。
结语
从目前行业的关注度来看,DPU带来的机遇已经基本形成共识,期待在这一趋势下,再加上国内大好的发展机遇,国内厂商能早日在国内的DPU市场占据一席之地。