英伟达、AMD：确认对华断供高端GPU芯片

相比于英伟达前一代的 Volta GPU，A100 的性能提升了 20 倍，非常适合于人工智能、数据分析、科学计算和云图形工作负载。该芯片由 540 亿个晶体管组成，打包了第三代 Tensor 核心，并具有针对稀疏矩阵运算的加速功能，对于 AI 推理和训练来说特别有用。此外，每个 GPU 可以划分为多个实例，执行不同的推理任务，采用 Nvidia NVLink 互连技术可以将多个 A100 GPU 用于更大的 AI 推理工作负载。

然而，这些在 H100 出现之后显得略有不足了。在今年春季的发布会中，英伟达CEO黄仁勋发布了面向高性能计算（HPC）和数据中心的下一代 Hopper 架构，搭载新一代芯片的首款加速卡被命名为 H100，它就是 A100 的替代者。

H100 是一款针对大模型专门优化过的芯片，使用台积电 5nm 定制版本制程（4N）打造，单块芯片包含 800 亿晶体管。同时也是全球首款 PCI-E 5 和 HBM 3 显卡，一块 H100 的 IO 带宽就是 40 terabyte 每秒。

Transformer 类预训练模型是当前 AI 领域最热门的方向，英伟达以此为目标专门优化 H100 的设计，提出了 Transformer Engine，集合了新的 Tensor Core、FP8 和 FP16 精度计算，以及 Transformer 神经网络动态处理能力，可以将此类机器学习模型的训练时间从几周缩短到几天。

针对服务器应用，H100 也可以虚拟化为 7 个用户共同使用，每个用户获得的算力相当于两块全功率的 T4 GPU。此外，H100 还实现了业界首个基于 GPU 的机密计算。

基于 Hopper 架构的 H100，英伟达还推出了机器学习工作站、超级计算机等一系列产品。8 块 H100 和 4 个 NVLink 结合组成一个巨型 GPU——DGX H100，一共有 6400 亿晶体管，AI 算力 32 petaflops，HBM3 内存容量高达 640G。

与此同时，得益于与 Equinix（管理全球 240 多个数据中心的全球服务提供商）的合作， A100 和 H100 的新型 GPU 通过水冷方式来节省用户的能源成本。使用这种冷却方法最多可以节省 110 亿瓦时，可以在 AI 和 HPC 推理工作中实现 20 倍的效率提升。

今年 5 月份，英伟达曾开源了 Linux GPU 内核模块代码，未来是否还会有更多开源计划，暂未可知。

指向中国超算

从全球 GPU 整体市场格局来看，Intel 得益于在笔记本电脑及传统 PC 行业的优势，一直是集成 GPU 市场的龙头，市场份额高达68.30%。但是，在独立显卡市场，则主要由英伟达和 AMD 两家公司垄断。

根据Jon Peddie Research的数据，2021年四季度，在全球独立 GPU 市场，英伟达份额高达81%，其余19%则被AMD拿下。虽然近两年英特尔推出了Xe系列独立显卡，但目前销量仍相对有限，预计其最新的市场份额可能仍在5%以下。同样，在面向数据中心的高端独立GPU市场，也几乎是由英伟达和AMD两家垄断。

北京半导体行业协会副秘书长朱晶对经济观察网表示，根据消息，被封锁的产品是有足够双精度计算能力的高端GPU，就NVIDIA来说，是以A100算力为基准，比它先进的所有显卡产品都会受限。

朱晶表示，根据消息，被封锁的产品是有足够双精度计算能力的高端GPU，对于低端GPU不受影响。具备较高双精度计算能力的高端GPU主要用于高性能计算领域，包括科学计算，CAE（计算机辅助工程），医疗等方面。

超算中心即国家超级计算中心，由数千甚至更多处理器组成，具备超高算力，被誉为“计算机中的珠穆朗玛峰”，主要满足国家高科技领域和尖端技术研究的需求。

相比之下，普通的数据中心面向所有需要信息技术支撑的场景，包括大量互联网应用。中国的电信运营商、互联网公司都自建数据中心。朱晶表示，企业级数据中心经常采购NVIDIA消息中的A100、H100产品，这些产品都是有足够双精度计算能力的高端GPU，上述断供行为如果落实，造成的波及范围会比较大。

英伟达、AMD：确认对华断供高端GPU芯片

相关文章

用户评论

发表评论

最新内容