芯片突围记
本文来自微信公众号:知识自动化(ID:zhishipai),作者:包云岗,题图来自:视觉中国
被人忽略的微架构能力
精简指令集RISC是计算器芯片发展史上的一个传奇。它最得意的作品,就是1983年英国Acorn公司,开启了基于加州大学伯克利分校RISC项目理念的新处理器架构研发项目Acorn RISC Machine (ARM),这就是如今统治移动芯片的ARM架构的肇始。而伯克利的RISC项目在1980年代发展了四代,2010年启动了第五代设计,即RISC-V。
RISC-V是一种指令集,并不是一种处理器的实现。指令集是一种标准规范,相当于是大家的一个约定。如果遵循同一个标准规范,那么不同厂商生产的软件和硬件就能在一起工作,就跟螺钉螺母的尺寸规范一样。
有了指令集标准规范,下一步最重要的就是芯片设计。根据指令集来去完成微架构的设计,形成文档,然后通过工程开发形成源代码。有了源代码之后,就可以用EDA软件形成芯片版图,最后交给台积电或中芯国际这些代工厂去流片,实现芯片制造。
芯片制造流程
当很多人将焦点集中在制造的装备或者设计的软件的时候,也很容易悄悄地忽略了看不见“微架构的设计和实现”。实际上,这是非常重要的能力,是芯片设计的核心竞争力。
当具备微架构设计和实现能力后,将不再受限于指令集。如果要更换一种指令集,也将非常容易。在过去几十年,英特尔处理器的性能在不断地提升,原因到底是什么?指令集的增加固然是看得见的积累,但更重要的是,英特尔处理器微架构和工艺的不断演进。
从1995年英特尔的P6架构开始,到2000年再到2006年,大概每五年一代架构就会演进一次。不断迭代过程中,实现微架构层面的优化。而这正是英特尔设计能力的核心。甚至从这个角度来看,指令集在某种程度上并不是那么重要,因为它只是一种标准规范。
而微架构的设计和实现能力,才真正决定了一颗芯片的性能、功耗和面积。苹果公司在过去几十年更换了多个指令集,从摩托罗拉到英特尔、到PowerPC、再到今天的ARM。由于苹果自身的垂直协同设计能力很强,更换指令集并不是一件太难的事情。
国内的龙芯公司,因为具备很强的芯片设计能力,从MIPS指令集更换到自有指令集龙芯(longArch)指令集时,微架构设计也几乎不用做太多改变。国内还有企业在研发可以同时支持Arm和RISC-V的设计,也是因为底层的微架构设计并不需要大的变化,就可以支持不同的指令集。
指令集与生态
指令集不重要了吗?如果从软件生态而言,却是至关重要的。它会决定软件生态开发的效率。早年的IBM计算机,每一台计算机的指令集都是独立的,导致计算机的软件投入特别大。1964年IBM推出的System/360计算机改变了这个格局,形成了统一的指令集,从而计算机软件和硬件可以分离开。这次标准化的指令集延伸开来,逐渐使得独立的软件产业成为可能。统一的指令集,虽然对单一公司的作用没有架构能力重要,但对于软件生态却是决定性的影响。
但是,在过去的几十年时间里,指令集均属于公司私有,如X86、ARM、MIPS、SPARC等。2010年,加州大学伯克利分校David Patterson教授提出一个响亮的口号 “指令集应该免费”,这个理念立刻得到全世界的认可。伯克利分校所推出的RISC-V更是蓬勃发展起来。
既然指令集不再属于某一个公司,那么全世界可以共同去建设。一种全新的开源开放共享的处理器生态出现了。而共建模式的核心,就在于把标准规范和产品实现进行分离。这就和通信领域的5G通信标准的建设机制非常类似。5G标准由非盈利组织3GPP组织来负责制定,而各个企业可以根据5G标准去做自己的产品,在开放的模式下去竞争。
类似的,RISC-V也带来了这样的新机会,指令集的标准由RISC-V国际基金会来制定。基于这个标准,不同国家的不同企业都可以来研制不同的RISC-V产品,例如,美国硅谷新秀Sifive公司的RISC-V产品、国内阿里平头哥的玄铁RISC-V处理器、以及中科院在开发的香山处理器。这为后进入赛道的处理器厂家,带来了一种新模式,即“5G模式发展芯片”。
在过去20多年,国内的处理器发展模式,主要有“高铁模式”和“北斗模式”。高铁模式代表了一种融入现有生态的思路,通过引进-消化-吸收-再创新,实现产品升级,代表企业有海光、海思和飞腾。而北斗模式则是独立构建技术体系和生态,以龙芯、申威为代表。而“5G模式”意味着中国的处理器可以采用第三种模式,制定开放标准,自研核心技术,在开放的框架下去竞争和合作,并且面向国际市场和生态建设。
RISC-V的再认识
尽管RISC-V意义重大,但行业依然有很多误解。2022年12月,David Patterson教授写了一篇文章,专门来纠正关于RISC-V的一些谬误。
第一个误解,RISC-V是一个开源处理器,就像Linux是一个开源操系统。实际上,RISC-V不是一个开源处理器,它只是一种标准规范,本质上是一本描述性手册,类似以太网标准、USB标准等。而Linux操作系统是一种源代码。所以这两个不具备可比性。RISC-V就是一个标准,而国际基金会就类似一个制定标准规范的工作组。
第二个误解,成熟封闭的指令集要比选择开放的指令集更安全可靠。安全性跟封闭和开源并无关系。封闭指令集属于公司,就会和公司的命运紧密绑定。如果公司不景气,该公司的指令集就会消失,供应链安全无法得到保障。历史上消失的指令有很多,包括像曾经一度流行的DEC VAX和DEC Alpha指令集。此外,封闭指令集也未必稳定,当年MIPS曾经卖给了六个企业,ARM也有三个东家,而更换一个东家就意味着商业模式可能会发生变化。
第三个误解,封闭的指令集是整齐划一,没有碎片化的割裂状态。实际上,封闭指令集会在其生命周期中,经常碰到无法预见的不兼容问题。即使在ARM的一个体系下,也出现过不兼容的情况。ARMv1到ARMv7使用32位地址空间,然而在下一代能够同时提供32位和64位地址版本的ARMv8-a,却无法兼容。而且,即使同一代产品,ARMv8-a和ARMv8-m也存在不兼容。碎片化,在某种程度上其实是一种常态。
第四个误解,相对于封闭指令集,RISC-V的模块化导致了更加碎片化的软件生态。在这一点上,RISC-V技术工作组已经在提供一些新的机制,比如通过配置(Profile)机制,来规范软件生态,从而使软件不会像想象得那么碎片化。
最后一个谬误,很多人断言RISC-V不可能成为主流指令集。这一点结论为时过早。从技术上而言,RISC-V是可以去支持从嵌入式、到普通计算机、一直到超级计算机领域的,并不存在系统性缺陷。如果从商业角度而言,更加开放的标准,往往会更有生命力。这一点倒是可以跟Linux操作系统的成功相媲美。
RISC-V的五大趋势
RISC-V已经开始往高性能领域发展了。以前很多人认为它只能在嵌入式领域,但最近这几年,已经出现了一批RISC-V高性能处理器实现,代表企业有硅谷的Sifive、Ventana,在技术上有一定优势。国内还有香山处理器,以及上海赛昉。SiFive近期推出高达3.4GHz的RISC-V处理器,性能可以对标ARM A78,是一个相当高性能的处理器。对比国内来看,在研发进度上,这款设计领先国内的香山大概一年左右。但是香山也有它的优势,因为是通过开源开放的模式联合多个企业一起来研发,可以更快地迭代,同时通过分摊降低成本。
值得注意的是,许多国家在国家层面上在积极地推动或支持RISC-V。例如2022年6月份,俄罗斯数字发展部宣布将大力扶持RISC-V处理器的发展。印度也启动了“数字印度RISC-V处理器”(DIR-V)发展规划”。同时,印度的电子信息部(相当于国内的工信部)以部的名义加入了RISC-V国际基金会,并成为了高级会员。
此外,欧盟在2022年9月8号发布了《关于建立欧洲开源硬件、软件和RISC-V技术主权的建议和路线图》报告,支持RISC-V与开源硬件,尤其给出了九大优先发展关键方向,并给出了实施路径,包括建立非盈利机构来支持研发、实施教育政策和措施等等。由此可见,全世界都在积极投入RISC-V生态建设。
RISC-V关键软件生态的发展也是非常迅速。一方面,RISC-V国际基金会在积极推动基础软件的适配工作;另一方面,很多开源软件社区也在主动适配。这就使得全世界的软件力量也都在支持RISC-V生态的发展。以Linux发行版Debian为例,开源社区于2019年开始支持RISC-V,在全世界开源社区的努力下,仅用3年时间就完成了2万多个软件包中95%的移植,使RISC-V成为Debian支持的Tier-1架构。在RISC-V生态建设上,中国处于第一梯队。尤其是2018年以来,很多企业都在推出各种各样基于RISC-V的芯片产品。同时,地方政府也出台一系列政策。特别是北京政府,在RISC-V方面有很大的投入。
由于RISC-V软件生态也在加速,RISC-V正在得到了越来越多企业的支持。除了初创公司外,包括像英特尔这样的巨头也积极投入到RISC-V的生态建设当中。美国企业在高性能处理器领域的投入比较大,总体处于领先地位。但在国内,初创公司非常活跃,数量上也远大于美国。尽管目前,还是主要还集中在MCU级别。但这对于欧美日垄断性的市场,注入了一点新鲜的空气。
整体而言,RISC-V应用正在全球快速地增长。2022年上半年,RISC-V国际基金会的数据显示,RISC-V的出货量已经超过一百亿颗,预计到2025年有望突破800亿颗。总体来讲,RISC-V还是缺少一些里程碑的、标杆式的RISC-V应用。但好消息是,欧盟计划投入2.7亿欧元,来研制超级计算机,这将是里程碑的事件。
中国的落地生花
RISC-V国际基金会作为负责标准制定的机构,目前非常活跃。在全球已经有70多国家、3000多个会员加入到RISC-V国际基金会,近几年每年都以超过100%的速度在增长。而从国家分布情况来看,中美欧并驾齐驱。中国国内企业的参与度非常高,在RISC-V国际基金会高级会员中,有14个国内企业是高级会员;在全球25个理事中,其中有9个成员是来自中国;还有一些技术发展伙伴,中国的机构和企业也在积极参与。这是一个非常充满中国活力的组织。
在北京市和中科院支持下,有18家企业联合发起了北京开源芯片研究院(开芯院),是RISC-V基金会的高级会员。开源芯片研究院希望像构建开源软件一样去构建开源芯片生态。在这样的一个开源芯片生态下,有很多开源的硬件组件可以被充分复用,从而大幅降低构建一颗芯片的成本,进一步让更多的中小企业去释放他们的创新活力。
目前,开芯院启动了香山开源高性能处理器核的研发。它的目标就是像Linux一样。如前所属,Linux和RISC-V并不在一个层次,但香山和Linux是在一个层次。RISC-V是一个标准规范,而香山是一个具体的实现。RISC-V本身并不像Linux,但香山像Linux。开源芯片研究院的香山,定位成类似Linux开源处理器主线,既能够被工业界广泛应用,同时又可以支持学术界去做创新。
它的源代码是开源的,同时开发代码的整个平台和工具也是开放的。用冰山做类比,芯片本身可看做是冰山水上面的部分,那冰山水下面的部分就是如何设计芯片所需要一系列的基础设施、测试及验证工具等。就是要把所有的这些内容都开源开放,这样可以联合更多的企业来共同研发。
目前香山的架构设计,已经发展到第三代。第一代叫“雁栖湖”,在2022年初已经实现流片,并达到了预期性能。第二代叫“南湖”,目前已经实现了对第一个客户的交付。南湖的性能是对标ARM A76的水平,并持续迭代新的版本。香山,是一个通过开源模式来构建的芯片设计,得到了全世界开源社区的大力支持。从2021年公开以来,香山在GitHub上非常活跃,是国际上最活跃的开源芯片项目之一。
从性能对比图来看,目前香山在全世界的开源芯片中性能最高,在这个基础上,开芯院进一步确定了“两核”发展目标。第一个是经典核,能够适用于中高端工业、泛工业技术平台的处理器核,对标ARM A76。第二个核是高性能核,主要应用在高性能场景,比如数据中心、算力基础设施等,对标ARM N2。
更长远的计划也在跟进。2022年8月,第三代香山“昆明湖架构”的联合研发,形成了将约100人的研发团队,面向新未来而拉开大幕。
更轻更广:第四代芯片商业模式
很多人非常关注的问题是:开源芯片有未来吗?
这个问题,可以从历史中获得一些启发。IBM在1981年推出了个人电脑,并且把所有的文档都进行了公开。至今,人们还可以到网上找到IBM当年公开的这个近400页的文档。这个文档包含了所有的源代码、电路图以及各种寄存器的配置等。这在当时高度竞争、相互不兼容的个人计算机市场,是非常令人震惊的行动。
它带来了两个深远的影响:第一个影响是诞生了一批新兴的企业,像戴尔、康柏,以及国内的联想和长城等。戴尔和联想都是在1984年成立,至今仍然是全球三大家的主宰者(另外一家是老牌惠普)。由于降低了个人电脑设计的门槛,使得很多企业都可以进入个人电脑领域找到企业发展的新空间。第二个影响是PC的价格和成本大幅降低,原来一台PC要将近一万美元,因为IBM的开源开放,PC售价降低到了1500美元,使得PC真正能进入到每家每户,并成就了一个新兴的PC市场。
开源芯片有着同样的潜力,激活一个更大的产业,即“人-机-物”融合的新兴物联产业。这个产业规模会更大,因为万物互联、人机互联的场合到处都是,无论是智能家居、还是车联网等。那么在过去几十年,面对不同的产业,不同的芯片企业是怎么去支撑的?一个有趣的现象是:企业的模式越开放,所需要的资源越少,但撬动的产业却越来越大。
英特尔的模式是“IDM模式+销售芯片”,企业只能拿英特尔的芯片做整机。这种模式可以看作是重资产模式,因此英特尔需要有超过五百亿美元的营业额、上百亿美元的利润才能支撑PC产业。以图像GPU起家的英伟达的模式,比英特尔模式更加轻一些,采用的是“无制造的芯片设计Fabless模式+芯片销售”的模式,它只需要一百五十亿美元以上的营业额以及三十亿美元的利润,就可以包打天下,支撑人工智能产业的发展。第三代模式是英国ARM公司,资产更轻。它采用了“Fabless+IP授权”的模式,只做IP而让其他企业去做芯片。于是只需要二十亿美元营业额、三亿美元的利润的ARM,就可以统治天下的智能手机产业。
现在物联网是奥迪,如果开源芯片,可以把IP、开发工具都进行实现开源开放,它所撬动的市场就会更大。通过非盈利机构,采用“联合Fabless+共享IP授权”的模式,只需要两亿美元的研发经费,就足以撼动一个丰富的物联网产业。更多的初创企业,将具备根据场景需求而快速定制芯片的能力。开源芯片,将会有一个非常广阔的前景。
小记:开源是条值得尝试的路
RISC-V为集体智慧开发芯片,开启独特之路。考虑到全球供应链大环境下的安全性,开源芯片适逢其时。它对于创新的贡献,不仅仅是技术,更是带来组织和商业模式的颠覆性变化。芯片事关未来,开源打开了一个全新的天地。
作者简介:
作者:包云岗,中科院计算所/北京开源芯片研究院
编审:林雪萍,北京联讯动力咨询公司总经理
本文来自微信公众号:知识自动化(ID:zhishipai),作者:包云岗