你好!欢迎来到深圳市品慧电子有限公司!
语言
当前位置:首页 >> 技术中心 >> 传感技术 >> Chiplet,芯片行业救世主!

Chiplet,芯片行业救世主!


? ? 2015 年,在担任芯片公司 AMD 的CEO几个月后,Lisa Su试图扭转公司命运。因为自2009年剥离晶圆厂以来,公司每况愈下。于是,她开始实施一项雄心勃勃的计划,以重新进入多年来一直由英特尔主导的服务器芯片市场。
? ? 但 AMD 的高管们得出的结论是,它没有资源来复制英特尔广泛的服务器芯片设计并在所有这些类别中展开正面竞争。对于这个规模小得多的竞争对手来说,这将太昂贵和困难。如果它复制英特尔模式,新的服务器芯片系列也不会脱颖而出。
? ? AMD 高级副总裁塞缪尔·纳夫齐格 (Samuel Naffziger) 在谈到公司当时的计划时说:“我们在芯片设计方面只有一颗子弹可以射中。”
? ? 因此,AMD 的工程师回顾了过去。他们没有尝试将大量功能打包到一块被称为“die”的大硅片上,而是选择将旗舰芯片分成四个独立的部分并将它们“缝合”在一起。
? ? 这种方法被称为“chiplet”,它很可能在未来几年成为一种主要的芯片设计形式。
? ? “这些小die对我们来说是一个巨大的推动力,”Naffziger 说。“我认为这是业界和最近记忆中最伟大的工程成就之一,因为它一次解决了很多问题。”
? ? 从某种程度说,是AMD 出于需要发明了chiplet。通过将芯片分解成更小的部分,它降低了 40% 的制造成本。这带来了两个“后果”:首先,它让 AMD 制造了一整套服务器芯片,它可以根据需要添加和移除chiplet,以创建多个性能选项并针对不同的服务器芯片价格区间。而且,通过转向chiplet,AMD 可以重用两个服务器chiplet,并设计出成本更低的产品,也适用于台式机,这是该公司当时最赚钱的部分。
? ? 该计划帮助拯救了 AMD——收入从 2015 年的 40 亿美元增长到去年的 164 亿美元——它可能有助于拯救摩尔定律。
? ? AMD 多年前所取得的成就现在正在成为行业规范。就连英特尔也开始涉足这个领域并在路线图上介绍了多款包括带有chiplet的产品,而业内其他公司正在围绕一个标准联合起来,该标准有朝一日允许芯片制造商在一个封装中混合和匹配来自不同供应商的硅。
? ? 专家告诉协议,基于chiplet的新设计目前很不错,但它们很快就会成为必需品。
? ? 世界以快速增长的速度生产和处理数据,如果没有支持chiplet的技术,它将变得过于昂贵,并且难以继续提供软件开发人员每年对传统处理器设计所期望的计算能力的飞跃。从长远来看,那些较旧的设计将消耗过多的功耗,在经济上不可行。
? ? TechInsights 的芯片经济学家丹·哈奇森 (Dan Hutcheson) 说:“我们将陷入这样一种情况,即你购买的是具有相同性能、相同功耗的相同盒子(box)。” “这意味着要扩展它们,要么减缓互联网和数据的增长,要么你必须建造更多的数据中心和更多的发电厂来为它们提供食物。”
? ? 一个久远的故事
? ? chiplet概念的一个令人着迷的方面是它可以追溯到戈登摩尔在 1965 年撰写的开创性论文,该论文为下一个半个世纪的行业制定了基本规则。这些被称为摩尔定律的观察结果预测,芯片每两年就会变得更快、更便宜,因为芯片设计人员可以安装在芯片上的晶体管数量以同样的速度翻倍。
? ? 但在同一篇论文中,摩尔描述了一个世界,在这个世界中,将单个芯片分解成更小的部分的经济学有一天会变得有意义。混合和匹配组件将为系统设计人员提供更大的灵活性,并可能提高性能,以及其他好处。
? ? “事实证明,用较小的功能构建大型系统可能更经济,这些功能分别封装和互连,”摩尔写道。“大功能的可用性,结合功能设计和构造,应该允许大型系统的制造商快速和经济地设计和建造各种各样的设备。”
? ? 摩尔的建议是有道理的:早在 1964 年, IBM 就已经在构建包含chiplet概念的系统——当时,这是实现必要计算能力的唯一方法。几十年来,IBM 等公司继续沿着这条路线走下去,并将chiplet的松散概念应用于最复杂和最昂贵的系统,例如超级计算机和大型机。
? ? 但过去的chiplet复杂且昂贵,这导致半导体公司将图形或内存等更多离散功能压缩到单个硅片上:智能手机、一些服务器处理器和苹果公司的片上系统 (SoC)其笔记本电脑和台式机的最新设计。
? ? “换句话说,当我们指的是chiplet时,我们的意思是占用一个 SoC 并将其拆分为其组件功能,”IBM 的混合云技术专家 Rama Divakaruni 说。“现在我们又开始使用chiplet了,我们变得更聪明了——凭借我们在 50 年硅片历史上的所有创新,我们将把它带入封装领域。所以这就是兴奋。”
? ? 大die,大问题
? ? 过去,当芯片设计人员将更多组件添加到称为芯片的单个单片硅片上时——该术语来自将硅晶片“切割”成芯片大小的片——这意味着芯片必须变得更大。这很直观:理论上,更大的表面可以适应更多的特征,特别是因为每次制造商推出更好的技术时,这些特征本身都会缩小。
? ? 因此,更大的die转化为更多的计算能力。根据 Jefferies 的研究,对于服务器芯片来说,这一点尤其引人注目,因为它们的运行尺寸往往是典型 PC 中芯片的五倍。
? ? “现在事情变得如此之快,性能如此之高,以至于你不得不将 [更多芯片] 移动到封装中,”Hutcheson 说。“芯片制造的几个技术和经济方面共同推动该行业向chiplet发展。”
? ? 但是大芯片尺寸会产生大问题。一个基本问题是,目前无法打印比芯片制造的光刻阶段使用的蓝图更大的芯片,称为光掩模。由于技术限制,通过光掩模照射以将蓝图复制到硅晶片上的光束无法打印大于约 850 平方毫米的芯片。
? ? 大芯片也更容易出现缺陷,这反过来会减少可以从每个晶圆上切割出的好芯片的数量,并使每个工作芯片的成本更高。与此同时,人们担心晶体管在缩小时会变得越来越贵——再加上现代芯片上的某些关键特性不能很好地缩小——这意味着使用最先进的工艺节点没有意义例如,用于无线通信芯片。
? ? “当 AMD 在2017年开始 Naples 处理器设计时,最初的想法时想将其制造工艺从 14 纳米缩小到 7 纳米,单纯地通过光刻缩放实现其功能,但他们发现这行不通。”Columbia Threadneedle 分析师 Dave Egan 说。“在第一次设计时,他们基本上只能缩小一半左右。”
? ? 没有来自 Nvidia 的chiplet
? ? 据英伟达副总裁伊恩·巴克(Ian Buck)称,五年多前,英伟达遇到了光掩模问题,也称为标线限制(reticle limit),但该公司尚未选择chiplet方法。
? ? 部分原因是英伟达以图形芯片着称,其运行方式与英特尔和 AMD 的 CPU 根本不同。Nvidia 的芯片使用数千个计算内核一次执行大量相对简单的计算,这使得它们非常适合图形或数据中心的 AI 加速计算。
? ? “GPU 是一种非常不同的野兽,”Buck说。“在图形空间中,呈现给开发人员的不是单独的内核;他们得到了场景描述,他们必须分发作品并进行渲染。”
? ? 为了在不采用chiplet方法的情况下应对光掩模尺寸的基本限制,英伟达将精力集中在构建所谓的超级芯片上。该公司开发了自己的称为 NVLink的互连技术,将多个图形芯片和服务器连接在一起。对 Buck 来说,到目前为止,该战略的最终体现是该公司即将推出的 Grace Hopper 产品,该产品将基于 Arm 的 CPU 融合到 Nvidia 的服务器 GPU 之一。
? ? 英伟达确实为人工智能推理和生产等企业应用制造了更小的芯片。但是,对于为 AI 训练设计的旗舰芯片,该公司发现其客户需要尽可能多的计算量,并且看重公司制造的最大处理器。
? ? “这种增长极大地简化了编程模型,而且,对于 AI,您可以将 CPU 的内存视为 GPU 内存的扩展,”Buck 说。“它们基本上是两个超级芯片放在一起。”
? ? “连连看”
? ? AMD 可能是第一家大规模生产和销售基于chiplet的处理器的主要芯片制造商,但除了 Nvidia 和少数其他公司之外,该行业的其他公司也在朝着相同的方向发展。几家最大的芯片制造商,如 AMD、英特尔、三星和云服务提供商,支持连接不同公司制造的chiplet的新标准。这种被称为“universal chiplet interconnect express”的方法可以重塑新的半导体设计。
? ? 由于新的 UCI Express,整个行业都围绕着chiplet这个术语,”Hutcheson 说。“今天与我们之前所做的事情之间的真正意义在于,在一家公司必须自己做这一切之前——你不能购买这个芯片和这个芯片,然后制造我自己的电子设备。”
? ? 在理想情况下,UCIE 标准将允许芯片制造商混合和匹配使用不同制造工艺技术的芯片,并由不同公司制造成内置在单个封装内的产品。这意味着将美光制造的内存、AMD 制造的 CPU 内核和高通制造的无线调制解调器组装在一起——这可以大大提高性能,同时节省大量电力。
? ? 英特尔高级研究员 Debendra Das Sharma 说:“为了允许在封装上构建异构系统,您需要封装内存,因为内存带宽更高。” “某些加速功能可以通过使用相同的封装而受益,并且还具有访问系统中所有组件(包括内存)的低得多的延迟和低功耗方式。”
? ? 混合和匹配chiplet还将使 AMD 和英特尔能够为有特定需求的大客户创建定制产品。加速计算通常用于解决 AI 计算任务,这对 Das Sharma 来说是唾手可得的成果。如果一个客户需要用于特定类型人工智能的芯片,英特尔可以用通用加速器代替更专业的加速器。
? ? Universally interconnecting chiplets尚未成为现实。根据几位行业观察家的说法,随着标准的敲定,它不太可能在几年内实现。第二个版本——大约在 2025 年左右推出——更有可能预示着 Das Sharma 所讨论的热插拔类型。
? ? 但无论该行业在 2025 年还是 2026 年走到一起,chiplet都是处理器的未来——至少目前如此。数据中心消耗了大量的世界能源,而且随着马克·扎克伯格试图展示他的虚拟世界版本,这种消耗只会增加,并且在短期内,我们生活的更多方面将变得数字化。
? ? “当你将这些电子沿着这条管道移动时——只要离开芯片,完成它所需的功率大约是 10,000 倍,”Hutcheson 说。“要将信号从一个芯片转移到另一个封装中的另一个芯片,这就像 100,000 倍的差异。”

用户评论

发评论送积分,参与就有奖励!

发表评论

评论内容:发表评论不能请不要超过250字;发表评论请自觉遵守互联网相关政策法规。

深圳市品慧电子有限公司