英伟达、阿里巴巴入局,Chiplet生态渐行渐近
8月2日,UCIe(通用芯粒高速互连)联盟宣布阿里巴巴和英伟达新当选董事会成员,加上此前的创始成员日月光半导体、AMD、Arm、谷歌云、英特尔、Meta、微软、高通、三星、台积电,该联盟董事会成员拓展到12家。阿里巴巴也成为首家加入UCIe董事会的大陆企业。
UCIe定义了封装内Chiplet(芯粒或小芯片)之间的互连标准,以打造开放的芯粒生态系统并更好地支持芯片之间的高速互连。英特尔、AMD、英伟达等主流通用处理器供应商与云厂商积极组建、加入UCIe联盟,也令Chiplet的生态渐行渐近。
通用处理器企业的技术储备
如何在制程工艺之外开辟一条继续提升处理器性能的道路,并使处理器功能更加定制化,覆盖云服务、深度学习、元宇宙等层出不穷的高性能计算需求,已经成为头部芯片厂商进行技术研发和储备的重要考量。此次英伟达加入UCIe董事会,也显示出主流通用处理器厂商对Chiplet的重视。
各类先进封装市场营收占比(2016-2022,单位:10亿美元)
来源:Yole
对于英特尔而言,Chiplet是延续摩尔定律的技术路线和IDM 2.0战略的重要组成。英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示,半导体行业的未来是将多个芯粒集成到一个封装中,以实现跨细分市场的产品创新,这也是英特尔IDM 2.0战略的重要一环。英特尔的3D Foveros封装可以把不同计算功用的小芯片在垂直层面上进行封装,实现更小更简单的电路和更快的芯片互联速度。结合英特尔的封装微缩技术,Foveros能进一步缩短封装凸点(裸芯片连接点)的间距,以提升芯片之间和总线的传输速率。
AMD也在基于Chiplet技术,推行模块化的SoC设计理念。早在2019年发布的7nm Zen2架构锐龙处理器中,AMD就采用了Chiplet设计,将不同工艺、不同架构的芯片电路按需搭配,实现更加灵活的配置。AMD面向CPU与GPU互联的Infinity架构也在第四代版本中支持AMD IP和第三方小芯片的无缝集成。在GPU领域,AMD面向数据中心图形的CDNA 3架构在单个封装中结合了5nm小芯片,面向游戏的5nm GPU架构RDNA 3也融入了Chiplet设计,预计每瓦性能提升超50%。
“Chiplet的主要功能就是通过将单芯片中的功能块分拆出来,通过模块化封装实现高集成度单芯片功能,可以用相对成熟的工艺制程去做、成本更低,同时可以实现更短的产品开发周期,实现更快的产品迭代。” 芯谋研究分析师张先扬向《中国电子报》表示。
而向来专注GPU的英伟达,在近两年推出DPU和Grace CPU之后,显然也有了在异构计算领域的布局需求。尤其Grace CPU在设计之初就充分考虑了与英伟达GPU的耦合,英伟达为此推出了提供“CPU+GPU一致性内存模型”的NVLink技术。此次加入UCIe联盟董事会,显示出英伟达进一步提升GPU、CPU和DPU等芯片集成密度和配置灵活性的意向,未来或将与英特尔、AMD一样,推出更多面向消费电子和高性能计算的SoC产品。
云厂商融入Chiplet生态
自研服务器处理器乃至加速器,正在成为头部云厂商的同步动作。相比第三方的通用芯片,自研的定制化芯片能够使硬件性能与云厂商各自的业务更加匹配,进而实现效能的提升。头部云厂商还可以基于自身的业务特点和功能需求进行IP的开发和储备,进而降低芯片的开发和部署成本。同时,定制化的芯片有利于云厂商形成软硬件闭环,更好地保护客户的数据安全。
来源:IDC
UCIe联盟的创始成员谷歌云和本次加入董事会的阿里巴巴,都是“为云造芯”的行家里手。
谷歌研发的TPU被广泛应用于谷歌翻译、搜索、相册等产品以及围棋机器人Alpha Go的学习模型训练和计算加速。这种定制化的芯片针对机器学习的工作负载加速进行了优化,支持研究人员、开发者和企业构建可使用CPU、GPU和TPU的TensorFlow(端到端开源机器学习平台)计算集群。谷歌于2018年向云客户开放了TPU的beta版本,其2021年发布的TPUv4 可通过4096个TPUv4单芯片组成的POD运算集群释放高达1exaflop(每秒10的18次方浮点运算)的算力。
阿里巴巴在云端有着相对丰富的自研芯片品类。2021年,阿里巴巴旗下半导体公司平头哥发布自研ARM服务器芯片倚天710,采用5nm工艺,含128核CPU,面向云场景的高并发、高性能和高能效需求进行设计和优化。今年6月,阿里云发布自研CIPU,其定位是用于加速和管控计算资源的数据中心专用处理器,以进一步提升数据中心的计算、网络和存储效率。目前,阿里云已建立芯片、服务器、飞天操作系统等软硬一体的自研基础设施。
在不断积累研发底蕴的同时,云厂商要为客户提供更加丰富且定制化的产品组合,就需要继续拓展硬件的产品矩阵。Chiplet不依赖先进制程提升产品性能,且能够兼容多种IP、芯片的特性,会让云厂商的硬件开发更加灵活高效。
“Chiplet降低了云厂商的芯片设计门槛,能让厂商更高效地把产品定义落实到芯片层面。” 开源证券副所长、电子行业首席分析师刘翔向《中国电子报》表示。
而云厂商的加入,也让Chiplet产业更紧密地结合用户企业,有利于产业生态的成熟。
“云服务厂商对高性能计算芯片需求不断攀升,高性能计算和数据中心市场对异构集成有着明确的需求。在市场需求的推动下,Chiplet生态将进一步加速完善。”赛迪顾问集成电路产业研究中心总经理滕冉向《中国电子报》指出。
CHIPLET生态标准需持续完善
从云服务厂商、芯片代工厂、系统原始设备制造商、芯片IP供应商和芯片设计公司纷纷加入UCIe联盟,不难看出计算产业对于Chiplet标准建设和生态构建的期许。UCIe联盟主席Debendra Das Sharma表示,目前已经有超过60家企业加入了联盟。
UCIe等标准的出现,让Chiplet能够结合计算产业各个环节的需求,更好地优化技术标准。目前来看,UCIe的技术指标还有进一步提升的空间。
“UCle集聚了一批产业龙头企业,并推动他们与用户企业联合,可以更快推动Chiplet技术的发展。目前UCle标准可以实现的时延迟和传输性能还有很大的进步空间,以苹果为例,UCle对比苹果的Chiplet技术能力,还有较大差距。Chiplet封装的工艺也需要不断完善以实现更高的产品性能。”张先扬说。
同时,人工智能、虚拟仿真、物联网等技术,使高性能计算不断涌现新的需求和场景,Chiplet的行业规范和标准也需要与时俱进,覆盖更多场景需求。
“目前大型芯片企业都推出了基于Chiplet的产品,但各家厂商的互联标准都是私有协议,限制了不同企业的Chiplet的融合使用,提升了行业进入门槛。UCIe联盟的建立意在打造Chiplet通用互联标准,提供高带宽、低延迟、高性价比的芯片封装连接。在标准制定方面,Chiplet技术还在不断演进,行业标准需要紧跟技术发展、市场需求的变化动态调整。” 滕冉说。