英特尔公布代号Arctic Sound-M数据中心GPU的更多细节
英特尔?至强?可扩展处理器是面向云游戏、多媒体处理与传输、虚拟桌面基础架构和推理运算的处理器标杆,致力于为当今的媒介消费提供鼎力支持。随着当前工作负载密度和复杂程度的快速增长,以上每个细分领域都将提出不同的工作负载需求,包括从处理像素、推理和分析、到渲染新的画面内容,再到将这些像素输出至客户端设备进行查看或进一步分析。然而,目前这些工作都是通过在云端的各个独立产品来完成的。
本文引用地址:http://www.eepw.com.cn/article/202205/434042.htm在本届英特尔 On 产业创新峰会(Intel Vision)上,英特尔分享了其代号为 Arctic Sound-M(ATS-M)的数据中心 GPU 的更多细节。ATS-M 是一颗支持高质量转码和高性能的强大 GPU,能够提供每秒 150 万亿次运算(150 TOPS),共拥有两种配置。ATS-M 能够通过单一解决方案灵活地处理广泛的工作负载,并在不牺牲性能或者质量的同时,优化总体拥有成本(TCO)。
面向数据中心工作负载的多用途GPU
该英特尔数据中心 GPU 将包含两种不同的配置。150W 功率版本在一个3/4长、全高尺寸的 PCIe 4.0 加速卡中封装了 32 个 Xe 内核。75W 功率版本则在半高尺寸的 PCIe 4.0 加速卡中封装了两颗具有 8 个 Xe 内核的 GPU,共 16 个 Xe 内核。这两种配置均配备了 4 个 Xe 媒体引擎、英特尔首款面向数据中心的 AV1 硬件编码器和加速器、GDDR6 内存、光线追踪单元和内置 XMX AI 加速。
采用开源软件的行业领先数据中心GPU
该英特尔数据中心 GPU 由完整的解决方案堆栈支持,为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈,并广泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的编解码器。
oneAPI 为加速计算提供了高效、智能的路径,让开发者免受专有编程模型所带来的经济和技术负担。它为专用硬件的封闭编程语言供了开放的选择,即通过一套完整、可靠的工具包来完善现有编程语言和并行计算模型,从而释放硬件的全部性能,并且能够让开发者设计出开放、可移植的代码,更大限度地利用多种 CPU 和 GPU 的组合。
云游戏
全球云游戏市场呈现持续快速增长趋势,预计到2026年,其复合年增长率(CAGR)将达到 43.2%,市值将近 32 亿美元[1]。英特尔可为 Windows 和 Android 云游戏平台提供支持,为广大玩家带来高品质的游戏体验。ATS-M 拥有两种不同的产品外形设计,用户可灵活地选择符合他们特定工作负载的产品配置。无论用户对峰值性能、高密度提出需求,还是期待通过一个平台满足跨智能手机和 PC 游戏的融合云游戏解决方案,这款 GPU 均可以提供出色的游戏串流体验。
全堆栈媒体流支持
该GPU配备了英特尔首款基于硬件加速的 AV1 编码器,可在不牺牲质量的同时,带来 30%[2]比特率的提升。[3]作为引领新一代媒体串流的 GPU,它可实现一卡同时处理多达 8 路 4K 视频流或超过30 路 1080p 视频流。在一台 4 卡服务器中,可以实现每节点处理 120 路视频流以及每机架处理 13,000 路视频流。?
利用 Intel? oneVPL,媒体串流和传输软件堆栈可以面向包括 AV1 在内的所有主流编解码器进行解码和编码加速。流媒体发行商可以在 FFmpeg 或 GStreamer 这两大领先多媒体处理框架中进行选择,它们均可通过 oneVPL 针对英特尔 CPU 和 GPU 进行加速。英特尔还提供了开放视觉云(Open Visual Cloud),这是一套用于媒体、分析、图形和沉浸式媒体的开源软件堆栈,它针对云原生部署进行了优化,使其能够在 FFmpeg 和 GStreamer 框架内运行。
全堆栈虚拟桌面基础架构支持(VDI)
过去两年,随着远程办公需求的增加,虚拟桌面基础架构(VDI)和设备即服务(DaaS)迎来了快速增长(最近一项研究表明增长超过 11%[4])。现代操作系统和应用程序对图形处理的要求越来越高,显示器的分辨率也随之提高;GPU 可以通过承载渲染和编码功能,以更短的响应时间和更高的帧率来改善用户体验。由此释放出来的 CPU 处理能力可以带来应用程序工作负载的性能提升。
英特尔的这款数据中心 GPU 还提供了灵活的虚拟 GPU(vGPU)调度策略(固定的、灵活的以及硬件利用率优化过的时间片任务调度器),让管理员能够单独微调 GPU 上每个虚拟机的运行指令。目前,其他厂商的产品仅允许在所有虚拟机的全局设置中进行相关调整。
与目前市面上其他产品不同的是,英特尔不会针对基于硬件的可扩展 I/O 虚拟化(SIOV)额外收取任何软件授权费,这将有助于相关提供商降低虚拟化部署的总成本。
全堆栈媒体分析支持
每个在视觉媒体场景执行的推理都需先经过视频解码和预处理,然后才能交给 AI 模型进行下一步操作。集成两颗 GPU 的 75W 功率版本 ATS-M 能够在计算和解码能力上实现很好的平衡,且不受媒体限制。因此,它能够针对媒体分析类的工作负载提供良好的扩展性,为客户提供更高的流密度和更低的成本。
在使用 oneVPL 对于视频流的解码和编码进行加速的同时,oneDNN(oneAPI 深度神经网络库)可针对内核进行 AI 优化,加速面向 TensorFlow 或 PyTorch 框架的推理模型;也可通过 OpenVINO 的模型优化器和推理引擎,进一步加速推理以及客户工作负载的部署。上述 AI 和媒体软件以及堆栈的组合可以在至强处理器和英特尔数据中心 GPU 之间无缝运行。
代号为 Arctic Sound-M 的英特尔数据中心 GPU 已经获得超过 15 款来自业界领先合作伙伴的设计,并将于 2022 年第三季度发布。
##
注意事项与免责声明:
实际性能受使用情况、配置和其他因素的差异影。更多信息请访问:www.Intel.com/PerformanceIndex。
性能结果基于配置信息中显示的日期进行测试,且可能并未反映所有公开可用的更新。配置详情见备用信息。没有任何产品或组件能够保证绝对安全。
您的成本和结果可能有所不同。
2GPU 质量数据由英特尔于 2022 年 2 月 9 日在试验生产的英特尔数据中心? GPU(150)上取得,配置为 IFWI ATS_M1_512_B0_EU_008_IFWI_21WW50_01_GS1463_PC9446A_HEADLESS_OP1040_P2SB_DS_14GT_LRG_TR_DS,1 节点双插槽第三代英特尔?至强 Gold 6336Y 微代码 0x11,服务器主板(Coyote pass)客户参考号 128GB 32-ch 3200 MT/sec,HT 启用,睿频加速开启,Ubuntu 20.04 LT2 内核 5.10.54,gfx-driver-master-10017,试验生产FFMPEG。CPU 质量数据由英特尔于 2022 年 2 月 9 日在Intel SawTooth Pass Server 上取得,配置为 1 节点双插槽英特尔?至强? Platinum 8180 CPU @ 2.50GHz,HT 启用,睿频加速开启,CPU 微代码 0x4D,Windows 10 Enterprise LTSC 64位操作系统,240GB 15-ch,DDR4-2666 DRAM。命令行参见预发布版本https://github.com/intel/media-delivery。 用27个播放/游戏序列的 TU1 (质量模式)收集“2 秒延迟”的数据,详情请参见https://dgpu-docs.intel.com/devices/iris-xe-max-graphics/guides/media.html,使用 VBENCH 序列收集的“超低延迟”数据,详情请参见 http://arcade.cs.columbia.edu/vbench。PSNRY-BDRATE质量指标与在英特尔至强 6336Y上测量的x264-medium(PSNR 调优, 1-pass)相比。
所有产品计划和路线图可能随时更改,恕不另行通知。
英特尔不控制或审核第三方数据。在评估数据准确性时,请参考其他信息源。
英特尔技术可能需要已启用的硬件、软件或激活服务。
本文中有关未来计划或预期的陈述均为前瞻性陈述。此类陈述基于当前的预期,涉及若干风险和不确定,并可能导致实际结果与这些前瞻性陈述中明示或隐含的内容之间存在重大差异。欲进一步了解有关可能导致实际结果出现重大差异的因素,请参见我们最近发布的收益报告和美国证券交易委员会文件,网站:www.intc.com
?英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。
[1] 《对2026年全球云游戏市场的洞见——包括英特尔、谷歌和微软等公司》——《调查与市场》,2022年1月4日。https://www.globenewswire.com/news-release/2022/01/24/2371478/28124/en/Insights-on-the-Cloud-Gaming-Global-Market-to-2026-Featuring-Intel-Google-and-Microsoft-Among-Others.html
[2] 基于主张与免责声明下的性能
[3] H.264/AVC声明根据https://engineering.fb.com/2018/04/10/video-engineering/av1-beats-x264-and-libvpx-vp9-in-practical-use-case/.
[4] https://www.gminsights.com/industry-analysis/virtual-desktop-infrastructure-vdi-market?gclid=EAIaIQobChMIyKDg3bLD9wIVF5BoCR2P1gbvEAAYAiAAEgK7YfD_BwE