你好!欢迎来到深圳市品慧电子有限公司!
语言
当前位置:首页 >> 技术中心 >> 传感技术 >> 存内计算有机会与GPU计算能力猛禽竞争吗?

存内计算有机会与GPU计算能力猛禽竞争吗?


说到存储计算,大多数人的第一印象是超低功耗和大计算能力。边缘计算可以说是许多存储计算技术和公司的第一步。在其结构的优势下,存储计算比传统的边缘人工智能芯片具有更可观的计算能力。这些人工智能应用程序只是存储计算到智能手机等消费边缘的下一步。

说到存储计算,大多数人的第一印象是超低功耗和大计算能力。存储计算技术打破了冯诺依曼结构的限制,突破了存储墙,给半导体行业带来了新的创新。但你可能会问,存储计算的应用场景是什么?

下一步是边缘计算

边缘计算可以说是许多存储计算技术和公司的第一步。存储计算具有低功耗的特点,可穿戴等端设备可以说是为该技术定制的。在其结构的优势下,存储计算比传统的边缘人工智能芯片具有更可观的计算能力。因此,对于智能手表、智能眼镜等功耗高、有一定人工智能计算需求的应用,AON7702存储计算芯片无疑是最佳选择。

然而,今天的MCU已经将功耗降低到了极低的水平,其中一些可以完成一些简单的人工智能操作。如果只是在语音识别和事件测试中竞争,即使这些存储计算有优势,用户在实际使用过程中的个人感知变化也可能相对较小。

然而,边缘计算并不局限于此,图像处理的主要问题需要解决。与上述应用程序相比,该应用程序具有更高的计算能力要求。国内领先的存储计算公司知识存储技术最近透露,他们正在创建更强的下一代存储计算芯片进行超清晰视频处理,根据演示,芯片主要针对人工智能插帧、人工智能超分辨率、人工智能视频降噪和人工智能高动态分辨率,这些边缘感知更明显的人工智能应用程序。

这些人工智能应用程序只是存储计算到智能手机等消费边缘的下一步。边缘人工智能芯片的最终目标是自动驾驶。如果你能实现更高的计算能力,存储计算芯片将有机会进入汽车市场,与自动驾驶芯片的玩家竞争。

超越GPU的计算能力

既然存储计算已经证实了它在边缘端的计算能力优势,那么有机会与GPU等计算能力猛禽竞争吗?以波动模拟为例,波动模拟在医学图像、石油勘探、减少地震灾害和国防系统等许多应用中都很流行。然而,大多数应用程序在使用波动模拟时都使用超级计算机来解决波动方程。虽然这些应用程序不像可穿戴的那样,对成本和体积要求不高,但它们更注重速度和能耗。

目前,主导的波动仿真解决方案是CPU和GPU。然而,由于缺乏并行性,即使是高端CPU的运行也需要很多时间来完成计算。GPU凭借其巨大的内存带宽优势,无疑具有更高的速度。即便如此,在实际应用中,波动仿真是一个极端的数据移动过程,GPU仍然会遇到瓶颈。即使数百GB/s的内存带宽不能免受影响,数据移动的功耗甚至高于计算。

存储计算可以减少处理器之间的数据移动,因为它消除了存储器之间的数据移动,但存储器之间的数据移动仍然是一个大问题。埃克森美孚的研究人员提出了Wave-PIM的存储计算方案,使用大型集成电路中常用的H树结构来减少存储块之间数据移动的延迟。他们模拟了900GB/s带宽的16GBHBM2内存,得到了52.8TFLOPS(FP32),超过了Teslav100GPU。这证明了存储计算芯片在服务器级和HPC级应用中具有独特的优势。

然而,随着HBM3和英伟达的H100芯片,GPU内存带宽已经达到3TB/s,而法国UPMEM的DDR4PIM只实现了2.5TB/s。即使存储计算在功耗方面具有巨大的优势,但要进一步超越GPU,它仍然需要更先进的内存技术和更多的架构创新。幸运的是,现在越来越多的公司开始尝试商业化存储计算。虽然存储制造商还没有确定这个方向,但存储计算与其开发技术没有冲突。从生产创新和投资方向来看,他们已经开始布局这项技术。在未来的高性能计算中,存储制造商和GPU制造商很可能互卷的情况。




用户评论

发评论送积分,参与就有奖励!

发表评论

评论内容:发表评论不能请不要超过250字;发表评论请自觉遵守互联网相关政策法规。

深圳市品慧电子有限公司