英特尔最新数据中心处理器跑步进场,侧重点有何不同?
近年来,为了应对指数级增长的算力需求,数据中心的核心和线程数量呈倍数级增长。但与此同时,5G、AI、虚拟现实等新兴技术,短视频、超高清、元宇宙等新兴业态,以及各行各业的数智化转型,使算力的使用场景迅速更迭、裂变。因此,相比性能,企业级用户也对专用工作负载的计算加速和资源分配更加看重。1月11日,英特尔围绕“以结果为导向、工作负载至上”的理念,推出了第四代英特尔至强可扩展处理器(代号“Sapphire Rapids”)等产品,腾讯云、京东云、阿里云等云厂商分享了利用该处理器平台提升专用工作负载和云实例能力的案例与经验。
为多场景工作负载提速
除了工艺、核心数等指标,第四代英特尔至强可扩展处理器一个引入注意的特点是搭载了多种内置加速器,面向深度学习实时推理和训练、网络数据系统、流数据移动、优化内存占用和查询吞吐量等不同的工作负载。
“从行业应用需求到真实物理世界的局限性,使我们越来越清晰地感知到,仅仅依靠核心频率和核心数量的增强,将不能满足我们在真实工作负载场景下对CPU性能更高的追求。”英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示。
以流媒体服务场景为例,近年来,手机等移动端的短视频、直播业务,使高清晰度、低码率的编码视频成为泛IT企业的需求。腾讯视频云的明眸高清是提供低码率流媒体画质提升业务的流媒体服务平台之一。腾讯云星星海实验室研发总监曾钦杵表示,视频前处理已经从传统的数值方法转变成目前深度学习的方法。通常部分基于AI的前处理往往需要额外的GPU集群来进行处理,这使得完整的CPU转码业务需要调度额外的GPU资源,不仅会造成计算成本的提高,也会使业务调度变得更加复杂。使用Sapphire Rapids的指令加速和优化之后,视频增强和目标检测推力部分的性能均提升1倍以上,使视频增强的服务由独立CPU计算集群就可以完成,从而降低了运营成本。
物流平台具有产业链条长,上下游节点众多的特点。为提升供应链的可靠性,京东持续推进链网融合,实现了货网、仓网、云网的三网通。
“具体到底层基础设施上,我们承载的业务类型日益复杂多样,数据量也越来越大,对底层硬件性能要求也越来越高,如何发挥每一代平台的性能优势,是我们关注的重点方向之一。”京东科技京东云事业部硬件架构总监董可新表示。在实验室测试中,京东在ClickHouse(用于联机分析的列式数据库管理系统)这一数据库场景中使用Intel IAA(数据分析工作负载中优化内存占用和查询吞吐量加速器)进行了线下性能测试,实现了压缩率、每秒查询率等指标的提升,并节省了一定的内存带宽。
提升云实例的性价比
云实例指云计算资源中虚拟出来的独立计算单元,也是常见的云服务交付单位。对于综合性的云服务厂商来说,根据不同时延、不同性价比的算力要求交付实例,就需要构建具有足够弹性的云服务微架构。
“作为一家云计算的厂商,我们在考虑云上计算型产品的时候,看到客户主要存在三个需求。一是端到端的性能,主要指计算的性能和IO的性能。二是端到端的性价比,只有提供更好的高性价比产品,才能让客户更多选择云上的产品。三是安全稳定,这是客户上云的基本前提。”阿里云智能服务器首席架构师刘礼寅表示。
结合自研的飞天操作系统和CIPU,阿里云基于第四代英特尔至强可扩展处理器推出了第八代ECS实例。除了芯片性能指标的升级,阿里云基于IO虚拟化,将至强处理器集成在CPU中的加速器能力全部提供给云上客户。在业务测试中,第八代阿里云ECS的数据库读写性能提升了15%以上,加解密、压缩、解压缩的性能提升了4倍以上,AI推理能力提升了4倍以上,训练场景也可以得到2倍的性能提升。
火山引擎云基础产品负责人罗浩指出,用户的在线、近线、离线计算需求需要不同的基础设施配置。时延敏感型的需求需要更低延迟的基础设施,成本也会更高。离线算力需求会布置在成本优势更明显的机房里,以提升性价比。这就需要云架构有足够的弹性。火山引擎基于这种逻辑构建了整个云原生基础设施的整体设备,并以此为基础构建微服务引擎。基于第四代英特尔至强可扩展处理器,火山引擎发布了对应的弹性计算实例,提升了单核、网络转发、加解密等能力。罗浩表示,接下来火山引擎实例,包括计算密集型、内存密集型、IO密集型以及HPC的场景实例会切换到基于第四代英特尔至强可扩展处理器的引擎上来,帮助游戏、汽车、医药、金融等行业释放算力,并提升性价比。
除了处理器和加速器性能等硬件能力,软件也对云实例的交付效率起到重要作用。浪潮信息服务器产品部总经理赵帅表示,基于英特尔的Sapphire Rapids处理器以及OpenCloud云方案,浪潮InCloud OS云海操作系统利用英特尔QAT(加速网络吞吐量以及压缩解压缩功能)技术,可以将虚拟机的迁移性能提升8.19倍,进一步提升用户收益。