阿里云回归云计算技术实质,CIPU搭配“神龙”、“盘古”、“洛神”
围绕这一核心主题,张建峰详细介绍了阿里云新一代云数据中心处理器CIPU,以及与之相关的飞天操作系统。从CIPU的名称来看,每个人都有一种非常熟悉的感觉,因为它和处理器CPU只有一个字母I的区别。但事实上,CIPU和CPU有明显的区别,CIPU是Cloudingunits的简称,是为新型云数据中心设计的专用处理器。
6月13日,阿里云智能总裁张建峰在2022年阿里云峰会上表示,今年阿里云最重要的战略是BacktoBasic,回归云计算的本质,坚持技术长征。
围绕这一核心主题,张建峰详细介绍了阿里云新一代云数据中心处理器CIPU,以及与之相关的飞天操作系统、神龙计算层结构等。
CIPU,专为云数据中心设计
从CIPU的名称来看,每个人都有一种非常熟悉的感觉,因为它和处理器CPU只有一个字母I的区别。但事实上,CIPU和CPU有明显的区别,CIPU是Cloudingunits的简称,是为新型云数据中心设计的专用处理器。
当然,CIPU和CPU也有着深厚的关系,CIPU是CPU在云数据中心领域的替代者,成为一种新的计算引擎。
让我们来看看CIPU的背景。传统的数据中心以CPU为核心。经过多年的持续优化,这种方法已经达到了上限,在性能、功耗和延迟方面存在明显的瓶颈限制。同时,需求端数据中心的显著变化进一步放大了这一短板,数据密集型计算需求不断出现,低延迟和高带宽是必要的参数配置,满足这些需求的前提是更低碳和环保。
此外,超大型数据中心目前正在世界各地大规模部署。根据市场调研公司synergyrearchGroup的数据分析,目前全球有314个超大型数据中心,未来三年将增加到1000个。张建峰指出,以CPU为中心的架构无法解决超大规模复杂的管理问题。
张建峰表示,CIPU作为CPU在云数据中心领域的接班人,主要具有以下几个重要特点:
(1)网络:通过构建大规模的ERDMA分布式高性能网络,加速高带宽物理网络的硬件,实现RDMA技术的普惠化;
(2)存储:硬件加速存算分离架构的块存储接入,提供超高性能的云盘;
(3)计算:神龙计算平台快速接入不同类型的资源,带来计算力的0损耗,以及硬件级安全的加固隔离。
以上是对质变的更多描述。让我们看看量变。据张建峰介绍,在CIPU主流通用计算场景下,Nginx性能提升89%,Redis性能提升68%,MySQL性能提升60%;在大数据和AI场景下,AI深度学习场景训练性能提升30%,Spark计算性能提升30%。
在存储方面,CIPU的存储时间最低可达30us(PLX),IOPS高达300万,存储带宽可达200Gbps,完全超过市场上所有云产品。
需要指出的是,CIPU不是一个独立的高性能硬件,而是一个硬件基础。它可以加速计算资源的云计算,并部署飞行操作系统来控制云资源。结合阿里云目前的飞和神龙架构,可以产生1+1大于2的效果。
软硬件一体化布局阿里云
目前,全球数据中心的发展已经进入了一个新的阶段,数据中心的建设和对计算能力的需求发生了巨大的变化,传统的通用处理器越来越难以满足这些变化。我们可以看到,不仅阿里云,而且所有大型数据中心运营商都致力于开发自己的特殊处理器,并与自己的架构系统合作,以在功耗、延迟和性能方面创造最佳平衡。
近年来,阿里云不断投入软硬件,收获颇丰,并逐步实现了自身软硬件的深度融合。
回顾2021年阿里云峰会,阿里云宣布飞天操作系统与X86、ARM、RISC-V等多种ADS805E芯片架构完全兼容,实现一云多芯。根据阿里云的描述,一云多芯的实现,使阿里云成为全球支持CPU类型最多的云厂商。
随后,在2021年的阿里云大会上,阿里云发布了第一款采用最新ARMV9架构的通用芯片益田710,多达128核,主频高达3.2GHz,可以兼顾性能和功耗,适应云的不同应用场景。2022年4月,基于益田710的公共云ECS实例已经上线。在硬件方面,阿里云去年还发布了自己的潘久服务器。
为了最大限度地发挥这些硬件的潜力,阿里云在云数据中心部署设施和核心平台,在云数据中心部署各个关键节点。为了解决服务器长期虚拟化性能损失的问题,阿里云在计算层推出了自主开发的神龙架构,将神龙与CIPU相结合,可以将虚拟化转移到特殊硬件中加速,将物理机器的高性能与虚拟机的灵活性相结合,虚拟化损失几乎为零,性能更强;为了提高存储传输速度。安全保护和灾难容忍能力,阿里云在存储层推出了自主开发的盘古架构,是阿里云底部的统一存储架构,采用先进的容错架构和分布式系统的灵活平台设计,具有弹性膨胀。自动负载平衡等能力,大大提高了存储系统的可靠性和安全性,可以支持块存储。对象存储。表格存储。文件存储。离线大数据处理等存储模式;为了实现让网络更简单的理念,阿里云推出了自主研发的洛神核心技术平台,支持百万用户的业务部署,让更多人体验到云计算带来的高效便捷的服务。在2021云会议上,阿里云更新推出了洛神云网络3.0的新平台架构。
在如此多样化的软硬件和大规模投资中,阿里云的目标是在提供更好的计算支持的同时建立一个更绿色的数据中心。根据Supermicro发布的《数据中心与环境2021绿色数据中心现状分析报告》,目前全球数据中心占全球发电总量近3%,预计到2030年将迅速增长到8%,也可能接近10%。
张建峰表示,阿里云是中国最早实施绿色数据中心的制造商之一。目前阿里云自建的数据中心已经达到国家绿色数据中心标准,年平均PUE低于1.3。