英特尔推最强数据中心CPU,甩出七大算力神器!还有1000亿晶体管GPU
芯东西(公众号:aichip001)
编译 | ?ZeR0
编辑 | ?漠影
芯东西1月11日报道,今日,英特尔面向数据中心推出了第四代英特尔至强可扩展处理器(代号为Sapphire Rapids),包括首款集成高带宽内存(HBM)的英特尔至强CPU Max系列。
▲英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰展示第四代英特尔至强可扩展处理器的晶圆
同时,英特尔也正式发布集成47块Chiplets、包含有超过1000亿晶体管的英特尔数据中心GPU Max系列(代号为Ponte Vecchio)。
腾讯云、天翼云、京东云、阿里云、火山引擎等英特尔云计算客户代表分别在现场分享了他们如何通过采用第四代英特尔至强解决大规模计算挑战,实现网络、存储、加解密、AI推理加速等性能的提升。
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰谈道,除了看重主频、核数增长外,英特尔意识到提供内置加速器能够更有效地提升工作负载的性能,更极致地处理数据中心客户日益增长的算力需求。
一、七大算力神器登场,从AI加速到为安全保驾护航
第四代英特尔至强可扩展处理器系列采用了新架构,单核性能更高,其支持每个插槽最多60个内核,及每个系统1、2、4或8个插槽,每个插槽有80个PCIe Gen5通道,搭配DDR5内存和CXL 1.1等新技术,以支持高带宽和附加加速器效率。
第四代至强系列拥有52款产品组合。英特尔至强白金8400处理器支持最多8插槽,每个处理器8个内存通道,高达4800MT/s;至强金牌6400和至强金牌5400处理器支持最多4插槽;至强银牌4400处理器支持最多2插槽。
此次第四代英特尔至强可扩展处理器的一大亮点,是内置多种加速器引擎,涉及人工智能(AI)、科学计算(HPC)、安全、网络、数据分析、存储等,性能较前一代平均提升1.53倍。
相比增加CPU内核数,内置加速器能更加高效地提高工作负载性能。最新的英特尔加速器引擎、高带宽内存和软件优化,能够提高工作负载的性能和效能,并通过充分CPU资源而节约成本。
现场,庄秉翰总结了英特尔七大算力神器:
1、英特尔高级矩阵扩展(英特尔AMX):帮助提升CPU上的AI实时推理和训练性能,现纳入调优功能,并支持中小型深度学习训练模型,适合自然语言处理、推荐系统及图像识别等工作负载。与前一代(FP32)相比,通过内置英特尔AMX(BF16),PyTorch实时推理和训练性能提升了高达10倍。
2、英特尔动态负载均衡器(英特尔DLB):显著提升网络工作负载的系统级处理性能,根据系统负载的变化而动态地在多个CPU内核上分配网络数据,同时能够还原在多个CPU内核上同时处理网络数据包的顺序,提供高效的硬件负载均衡。集成英特尔DLB在相同吞吐量下,能够降低96%的延迟。
3、英特尔数据流加速器(英特尔DSA):专为卸载常见的、会导致数据中心规模部署开销的数据移动任务所设计,帮助加速CPU、内存和缓存,通过优化数据移动和转换操作,提高了存储、网络和数据密集型工作负载的性能。内置DSA加速器可将性能提升至1.7倍。
4、英特尔存内分析加速器(英特尔IAA):提高分析性能,将任务从CPU内核卸载,以加速数据库查询吞吐量和其他工作负载。相比前一代,集成英特尔IAA把RocksDB的性能提升了3倍。
5、英特尔数据中心与压缩加速技术(英特尔QAT):可通过卸载加密、解密和数据压缩,释放处理器内核,降低系统能耗。据介绍,得益于此,第四代英特尔至强可扩展处理器成为单一数据流压缩并加密数据性能最高的CPU。与前一代相比,集成QAT能够实现多大2倍数据压缩,且核心数更少。
6、英特尔安全引擎:包括英特尔软件防护扩展(英特尔SGX)、英特尔Trust Domain Extension(英特尔TDX)、英特尔密码操作硬件加速、英特尔内存故障管理技术、英特尔平台固件弹性技术等,提供增强的安全防护能力。
7、英特尔至强CPU Max系列:首款集成高带宽内存(HBM)的英特尔至强处理器。据介绍,它为内存受限的工作负载提供了3.7倍的性能提升,同时实现能耗的显著减少。
不同系列处理器会内置不同的加速器,比如英特尔至强CPU Max系列产品不支持英特尔QAT、英特尔DLB和英特尔IAA。
二、第四代至强实际性能提升如何?“五朵云”客户现身说法
据腾讯云星星海实验室研发总监曾钦杵分享,腾讯全新第七代云服务器实例S7/M7基于第四代英特尔至强可扩展处理器,借助AMX特性,有效提升腾讯搜索暨视频业务的效率。
天翼云科技有限公司云网产品事业部总经理杨鑫现场发布天翼云第八代弹性云主机,基于其自研技术架构和第四代英特尔至强可扩展处理器,能够支持128 vCPU大规格实例,较上一代在整型、浮点型、科学计算等场景中分别带来50%、60%、30%及更高的性能提升。
天翼云利用第四代至强的英特尔DLB加速技术来解决IPSec业务的挑战,DLB加速带来了高达4倍的吞吐收益。
京东科技京东云事业部硬件架构总监董可新谈道,京东新一代天枢服务器平台基于第四代英特尔至强可扩展处理器,性能较上一代天枢提升超1.7倍。特别是借助英特尔IAA和DSA加速技术,在线下模拟测试中性能提升显著。
阿里云智能服务器首席架构师刘礼寅说,在实例用户场景中,阿里云基于第四代英特尔至强可扩展处理器的第八代ECS实例,带来了最高60%的整体算力提升,数据库读写性能提升15%、加解密/压缩解压缩性能提升达4倍、AI推理性能提升达4倍。
火山引擎云基础产品负责人罗浩分享说,借助第四代英特尔至强可扩展处理器,火山引擎第三代弹性计算实例在整机算力、单核算力、网络转发、存储IOPS、加解密、AI推理加速等性能均较上一代实例明显提升,将提升客户上云性价比。
结语:七大重点方向,撑起未来数据中心
在临近发布会末尾,英特尔分享了展望未来数据中心建设的七类重点方向,包括数据中心可持续发展、现代工作负载灵活部署、先进存储技术、异构算力、安全解决方案、端到端可编程智能网络、智能管理运维。
据知名市研机构IDC预测,2021-2026年中国企业级ICT市场级支出规模持续上扬,2023年有望达到1.94万亿人民币,2026年预计将达到2.75万亿人民币。迄今英特尔至强可扩展处理器累计卖出8500万颗,第三代至强更是短短两年即卖出1500万颗,在数据中心市场的影响力与日俱增。
从最新推出的第四代英特尔至强可扩展处理器来看,英特尔的设计思路已经摆脱了单纯追求主频、核数等硬件指标的提升,而是更加聚焦数据中心客户需求,从解决问题的角度着手,来帮助合作伙伴满足数据中心客户对更高算力、更高安全、更高能效的追求,带来实实在在的收益。