阿里云再阐释Back to Basic:云计算不是由芯片决定的
打破即重生,阿里云今年忙着重新定义云计算。
“现在是重新定义云的窗口期,如果我们定义好了,中国就可以在下一个技术时代有自己的一席之地。”阿里云智能总裁、阿里巴巴达摩院院长张建锋在今年六月向外界宣布了阿里云今年最重要的B2B战略,即Back to Basic。
而在正在举行的2022云栖大会现场,张建锋再次呼应了Back to Basic。他用不同的方式向外界强调,未来云计算,并不是眼前所见。
穿越周期的技术长征
“技术发展有自己的逻辑和周期,经历不同的高峰和低谷。”在2022云栖大会上,阿里云智能总裁、阿里巴巴达摩院院长张建锋如此表示。
技术周期和商业周期并不总是同步的,而从历史发展来看,每一次商业周期的下行阶段,常常伴随技术周期新的开端。
技术外生论认为,技术创新是由科学重大突破推动的,科学重大突破来自基础研究及投入,在经济萧条期,研发投入的机会成本低,因此萧条期应该加大基础研究的投入,促使科学重大发明和技术突破的产生,这样的基础创新是逆周期的。
2020年,全球云计算基础设施投资首次超过了传统IT领域的技术投资,世界正在加速驶向云计算。而今天,张建锋认为,我们又到了打破平衡的新节点,云计算不仅是计算体系结构的创新,计算体系结构创新会带来其他领域的创新,包括研发方式、企业生产经营等等都会面临大的变化。
从阿里云的角度,将之归纳为三大变革:云重构了整个IT硬件体系,软件研发范式发生深刻变革,云和端加速融合。
即便三大变革清晰可见,但历经十多年的发展,这些变革能够带来的影响却被严重低估。“它正在重构整个IT软硬件和终端世界,形成一个全新的计算体系。”张建锋说。
在全新计算体系之下,张建锋认为新一轮的科技变革正在深入发展,而阿里云将“坚持技术长征,面向下一代体系去构建第二技术曲线,抓住未来技术的定义权。”
云重构硬件,自研CPU规模应用
技术长征,硬件重构是关键。
云计算从专用的IT基础设施,变成公共服务的过程,其内涵发生了很多变化,云计算初期通过分布式技术驱动,从线下机房到上云买资源,围绕CPU来做处理。
如今云计算已经超越了分布式阶段,进入了存算分离、资源池化的第二个阶段。“在这个阶段下,我们一定要有新的计算机体系结构”,张建锋笃定道。
以后整个IT产业不是以CPU为中心,而是多种处理器的融合计算环境,新环境里需要一个新的处理器来综合调度,阿里云正在研发新的硬件。
此外,云计算产业更接近软件定义、硬件加速的协同创新时代,软件定义越来越标准化,需要专门的硬件来做定制化的加速。
“以后产业也不仅是拼工艺,拼制造,它更多拼对计算机未来架构的理解,能不能开发出更适合计算架构新一代硬件。到今天为止,我们自研了几乎所有称为硬件设备的东西,从服务器到路由器、交换机等,慢慢走向更深的深水区,我们在研究设备里的部件。包括一些核心的部件,包括像CIPU重新定义的部件;也有像CPU这样原来传统上可能是很常用的部件,在云计算环境下我们做了新的创新。”张建锋说。
去年,阿里巴巴发布了首款“为云而生”的芯片倚天710。目前,倚天710云实例已在多家互联网科技公司大规模应用,算力性价比提升超30%,单位算力功耗降低60%,这是中国首个云上大规模应用的自研CPU。
张建锋在采访期间强调,今天大家关注芯片的问题,可能更多关注“他有我没有”,当未来如果所有IT设施都是云提供的,云上买到的都是能力,芯片都不必看到,到那个时代,传统技术平台是没有任何竞争力的,而且不是再去研发一款芯片就可以补平的。
“如果不是一个完全基于云的体系,都不是在一个水平上竞争。现在中国可能也是站在这么一个十字路口,今天云是未来,云未来是一个新的体系。阿里的云计算能发展,是因为阿里淘宝、天猫定义了很多需求,云计算以后不是芯片决定的,云计算以后一定是系统决定的,它是个体系决定的,芯片肯定是硬件的一个重要组成部分,例如CIPU就是作为一项芯片硬件在云计算体系里的作用和价值。”他说。
在2021年双11期间,天猫双11核心交易系统平滑迁移至倚天710实例。据了解,未来阿里云还将继续扩大自研CPU的部署规模,预计未来两年内20%新增算力将使用自研CPU芯片倚天710。
为了实现规模应用,阿里云倚天710也做了降低门槛和提高效率的工作。客户代码不需要做任何改造,零代码改造;性能方面,倚天710和主流CPU比,在音视频压缩上大概有80%的性能提升,在数据库上大概30%左右的性能提升,在AI推理上大概70%的性能提升。
软件变革,Serverless化当先
云计算架构发生翻天覆地的变化,必然会带动软件体系的改变。
阿里云认为,软件研发范式的变革有三个层次,第一是新兴的软件开发方式崛起,软件架构全面Serverless化;第二是软件开发不再是程序员的专利,低代码让未来80%应用能够由业务人员直接开发;第三是未来所有软件都是AI化的,大模型开源将加速AI真正普及。
通过产业维度观测,很多客户上云之后和过去主流研发方式没有发生特别本质的变化,因为云最开始还是以资源的形态给客户提供服务,随着客户从上云到用云的深化,云的能力也在持续升级,Serverless将让云计算从一种资源真正变成一种能力。
现在云计算的主流售卖方式,还是“几核几G服务器”的模式,当云计算将全面Serverless化,更加接近“电网”模式,按计算的调用次数付费。
这将带来软件开发方式的深刻变化,软件架构从原来的主机架构迁移到Serverless架构,客户只需要开发业务逻辑,不再需要关心运维问题。此外,Serverless架构可以降低软件开发门槛,提供更多的预制模块,大幅提高软件生产效率。
例如,一家烟草公司只需要两个开发人员就可以做出整套物流系统。对互联网新兴应用而言,Serverless架构让应用轻松抗住流量高峰。以南瓜电影为例,Serverless架构让这个视频APP无人值守就能应对百万级流量,并且总成本较此前下降40%。
其次,低代码将进一步降低应用开发门槛,张建锋认为,未来80%的应用将由业务人员开发,不懂低代码就和20年前不会用word一样。数据显示,钉钉上,两年新增了500多万个低代码应用,聚集了380余万低代码开发者。
最后,越来越多的软件将AI化,大模型开源将推动AI真正普及。张建锋表示,开源是软件进步的核心推动力量,过去开源推动了软件架构的进步,未来开源还将推动AI应用的进步和普及。目前,达摩院在中文AI模型社区魔搭ModelScope上,开源了超过300个优质模型,可以帮助开发者利用基础模型快速开发AI应用。
云端融合,无影是另一种形态的云
云网边端互相牵连和影响,云的发展一定会影响到端的变化。张建锋认为,云端加速融合,算力正在不断从终端转移上云,这让终端突破了物理限制,不仅手机、电脑、汽车、音箱会变成计算机,未来万物皆是计算机。
需要看到的是,无影面对的算力市场,和传统提到的云计算市场不太一样。传统算力市场更多是数据中心、服务器这种算力上云,云端一体计算架构更多是端的算力,如果能够通过云化提供更好的体验,业务算力规模将是原来算力规模的好多倍,带来超出原来端的体验。
在云栖大会主论坛上,阿里巴巴CEO张勇发布了“少年云”,就是端侧变革的一种体现,原来教育领域机房淘汰率或者不可使用率很高,采用云电脑模式之后,算力不断演进,云电脑能力也在不断演进。
云计算正在创造越来越多的终端形态,不止是B端市场,C端市场的个人娱乐需求也有不小的应用前景,例如,Rokid在推出的AR眼镜中接入阿里云无影架构,利用云上算力,用户打开仅有85克重量的眼镜,就能在眼前的虚拟现实画面中,与人聊天、办公,并且还能做3D渲染、大数据编程等复杂工作。
在PC电脑端,未来阿里云继续将RISC-V芯片和无影架构结合,实现更高性能、更低能耗,并实现全栈自研。目前,阿里巴巴已经完成RISC-V芯片和云操作系统的适配,迈出了端边云一体的重要一步。
“成熟的市场,一定会有成熟的产品,有成熟的服务,成熟的客户,成熟的云计算市场不会这么发散。”张建锋表示。中国云计算市场的不成熟是多方因素促就的,如果市场不成熟,那就在下一次技术变革中,用破坏式创新革命现有的云计算体验。
2010年,阿里云筚路蓝缕,难题在于从无到有,2022年,阿里云Back to Basic,难点在于从旧到新。而选择技术长征,某种程度上,这是一次更大的挑战,或许也是中国云计算行业的又一次发轫。(本文首发钛媒体APP 作者 | 张帅 编辑 | 秦聪慧)