Arm 2022年的全面计算战略都带来了哪些创新?
2019 年,Arm推出了全面计算(Total Compute)战略,采用整体、以解决方案为中心的 SoC 设计方法。通过超越单个 IP 元素来设计和优化系统,以创建用例驱动的解决方案,为下一个十年不同行业的计算创新提供动力。
2021年,伴随着Armv9指令集的诞生,以及Cortex-X2/A710/A510等IP发布,标志着Arm首次进入了全面计算时代,并标志着64位计算时代的全面到来。
时隔一年,Arm在2022年继续更新了全面计算解决方案,并作出了多项重要创新。其中包括全新旗舰产品 Immortalis GPU,实现了基于硬件的光线追踪功能,为手游体验带来了显著增强。此外,旗舰型CPU Cortex-X3的性能也得到了进一步增强,从而更好地支持手机和笔记本在内的多项终端产品。
给GPU加上了硬件光追功能
Arm 发布了全新旗舰 GPU 产品 Immortalis,这一全新系列产品,传承了全球出货量最高(超过80亿颗)的 GPU Mali系列的深厚技术积淀,并经过配置和增强,旨在提供终极的移动 3D 体验。
Immortalis-G715 是Arm第一款在移动设备上提供基于硬件的光线追踪支持的 GPU。光线追踪技术可以生成逼真的光照和阴影,从而提供更好的游戏体验。
但目前光线追踪技术还存在一些挑战,主要原因是权衡功耗、效率与面积。Immortalis-G715 上的光线追踪仅使用了 4% 的着色器核心区域,同时通过硬件加速实现了 300% 以上的性能提升。
去年的 Mali-G710 已经启用了基于软件的光线追踪支持。联发科已经在其旗舰天玑 9000 芯片组中利用了这一功能,该芯片组已用于旗舰智能手机中,比如 OPPO 的 Find X5 Pro 天玑版。
Arm 高级副总裁兼终端事业部总经理 Paul Williamson 表示,今年早些,Arm与OPPO在旧金山的游戏开发者大会(GDC)上进行了光追演示,并且他还表示,目前主要的 OEM 均对未来的光追充满兴趣并积极支持。除了硬件上的支持,其合作伙伴和开发者生态系统也已经或即将准备就绪,并得到了广泛的行业伙伴认可。
比如,Epic Games 工程副总裁 Nick Penwarden就表示:“Arm 致力于不断创新,我们乐见包含 Immortalis GPU 在内的 Arm 新的全面计算解决方案为开发者提供了新选项。凭借功能的增强和性能的提升,我们迫不及待地想要看到虚幻引擎社区将如何利用这些先进技术,为未来的移动设备提供一流的体验。”
MediaTek 副总经理暨无线通信事业部总经理徐敬全博士也表示:“Arm发布全新的 Immortalis GPU,展示了硬件级别的光线追踪功能。搭配性能强悍的 Cortex-X3 CPU,我们期待 MediaTek 高端旗舰移动 SoC 的体验更上一层楼,为用户带来顶级的移动游戏性能和更高的工作效率。”
Unity 高级副总裁兼 Core Unity 和云业务部门总经理 Ralph Hauwert则说道:“Unity 和 Arm 在提供终极游戏体验方面有共同的目标,Arm 新的全面计算解决方案和全新旗舰 Arm Immortalis GPU 是实现这一目标的关键,除游戏之外,它们还能实现更多的实时 3D 体验。Arm 为人熟知的持续性能和能效技术,结合 Unity ,我们将赋能创作者打造高质量的 3D 视觉体验,实现创新的沉浸式内容。”
除了支持硬件光追的Immortalis GPU之外,Arm还宣布推出新的Mali-G715 GPU和G615,增添了一些新功能,其中包括用于显着节能和进一步提升游戏性能的可变速率着色技术,以及改进的引擎。G615与G715的主要区别在于,G615支持的内核数量为6个或以下,G715则为7-9个。
可变速率着色技术,是通过优化渲染,从而在图形和视觉效果方面提供显着的节能和性能提升。从本质上讲,它需要一个场景并将渲染集中在需要聚焦的地方,并以精细的像素粒度进行渲染。通常,这是游戏中主要的关注点。需要较少焦点的区域(例如背景风景)以更粗的像素粒度进行渲染。游戏场景仍可保持其感知的视觉质量,但会节省能源。实际测试结果显示,可实现每秒帧数 (FPS) 40%的提升。
处理器的性能及能效继续提升
首批 Armv9 CPU 在 2021 年推出。今年,Arm 通过新的扩展 CPU 集群,因应市场对性能和效率的需求。新的 CPU 设计旨在提升峰值性能,并提供出色的持续性能和效率。?
新的 Arm Cortex-X3 可面向广泛的基准和应用市场,与最新款的安卓旗舰智能手机和最新的主流笔记本电脑相比,其性能分别提升了 25% 和 34%。
Arm Cortex-A715 则专注于高效性能,与 Cortex-A710 相比,其能效提升了 20%,且性能提升了 5%,达到了可媲美 Cortex-X1 性能的重要里程碑。
鉴于高效性能的重要性,Cortex-A715 的 CPU 集群采用了基于大小核 (big.LITTLE?) 的配置,这也是目前全球消费级设备最常用的异构处理架构。
基于 Armv9 架构的 Arm Cortex-A510 在 2021 年推出,这是 Arm 四年来推出的首款高效小核。今年的更新版本在保持性能不变的同时,将功耗降低了 5%。同时,与去年的上一代产品相比,更新版的 DSU-110 所支持的 CPU 集群内核数增加了 50%,实现了不同等级消费级设备的可扩展性。
Williamson再次强调了64位的重要性。他表示:“中国主要的应用商店已表明,到今年 8 月,所有新上架的应用都应该是 64 位的。事实上,64 位的应用能够为用户带来最佳的体验,在应用启动时间方面也能够加快 20%。所以,任何没有过渡到 64 位的应用都会因为性能上的欠佳,让用户感到失望。我们期望所有的应用都将过渡到 64 位。”
OPPO、VIVO和小米等公司参与的中国金标联盟近期的宣布,中国的计算生态系统和应用生态系统已全面就绪 64 位,这意味着未来几年的旗舰级智能手机都需保证为全 64 位设计,以确保获得最佳的效率以及最强的性能。
Project Volterra帮助Windows On Arm开发者生态发展
Williamson还提到了微软今年发布的Project Volterra,这为微软开发的基于高通处理器的迷你开发主机。此外,微软还表示将会推出 Arm 原生版本的开发工具,包括 Visual Studio、VSCode、Visual C++、.NET、Windows Terminal,以及适用于 Linux 和 Android 的 WSL 和 WSA。 “这意味着开发者现可在基于 Arm 架构的 Windows 环境中进行基于 Arm的应用开发。”Williamson说道。
面向未来的全面计算战略
Williamson介绍了Arm未来的产品路线图。在大核 CPU 产品线方面包括了Hunter 和 Chaberton。GPU产品线包括了Titan和Krake。同时也包括了系统IP,以确保低延迟的内存路径和系统级缓存性能。针对安全方面,Arm正在增加对隔离和虚拟化的支持,这与安卓的 pKVM 倡议保持一致。
Williamson强调,全面计算是Arm对未来的承诺,它比其各IP组件重要得多,因此Arm不只投资IP产品,提升性能,而是全面围绕开发者、安全等多个领域追加投资。全面计算2022正是这一战略的具体实践。