只有基于图形学的AI新范式,元宇宙才可能成功 原创
编辑:千山
嘉宾:王晟
元宇宙在过去一年风生水起。但凡是娱乐、科技和游戏领域的明星公司,无不在借助“元宇宙”的概念来吸引媒体和市场的关注。那么,在资本的眼中,元宇宙究竟意味着什么?在日前51CTO主办的MetaCon元宇宙技术大会上,英诺天使基金合伙人王晟带来了主题演讲《元宇宙与新范式》,为大众呈现了全新的视角。
王晟指出,元宇宙是在既有互联网基础上,以图形学、人工智能和算力的巨大提升为动能,构建3D沉浸式的新应用场景和内容。元宇宙的底层是媒介革命。只有基于图形学的AI新范式、3D图形学的AI新范式等新的技术范式,元宇宙才有可能成功。
本文将摘选其中精彩内容,统一整理,希望为诸君带来启发。
一、当新范式被创造出来,新的科学革命就将启幕
1、范式的概念
范式这一概念由著名科学哲学家托马斯·库恩提出,并在《科学革命的结构》里做了更进一步的解释。
所谓范式,指的是由一个科学共同体所共同接受的一组假说、理论、准则或者方法。可以认为,范式在某一个阶段是相对地接近正确或者真理的,也是某一个阶段对一些科学事物相对更优的解决方案。需要注意的是,范式是不断迭代的,当一个范式无法再进一步地解决现有的科学现象的时候,也就发生了范式危机,新的范式就会被创造出来,这就产生了科学革命。
2、元宇宙与Web3
如果我们用范式的思想去研究元宇宙与Web3,那么就会发现元宇宙与Web3是不同的范式,其共同体、目标、方法、理论和系统都不同。
元宇宙其实本质就是在既有的互联网的技术应用的基础上,以图形学、人工智能和算力巨大地提升作为动能,去构建一个3D沉浸式的新应用场景和内容。因此,可以看到Meta、微软、Google、苹果都是元宇宙的主力推手,简言之,元宇宙是现有互联网技术和业务场景的升级。
而Web3的本质全然不同,它是以区块链和加密货币为底层的新一代的网络系统。Web3其实是在去中心化的结构上重新构建全球的网络服务,把整个网络服务产生的资产的所属权、治理权和收益权让渡给网络服务的用户。所以,Web3实质上是为了打倒原有的互联网巨头,把庞大的互联网资产重新分配给用户。
这是两者间的巨大差异。目前,元宇宙在国内很热,在美国主要是由互联网巨头引导。而Web3在海外的创投市场也是巨大的风口,但是因为Web3涉及到区块链和加密货币,所以在国内鲜少见到Web3的项目。
3、文明范式的递进
纵观人类文明发展史,从刀耕火种到农牧文明,再到工业文明,文明范式的递进离不开一些公认的要素——能源、生产力、通讯、交通。
以工业文明为例,重点是机械。在能源方面,是用蒸汽来驱动机械产生机械能。在生产力方面,远在改良蒸汽机发明之前,珍妮纺纱机和其它自动化的纺织设备已经在水利的驱动下,孕育了工业革命的开端。通讯和交通对于商业和经济的巨大影响也不容忽视。通讯的发展扩大了人类的组织规模和组织边界,对建立商业合作、形成公司组织都非常重要。交通对于商品服务的流通的重要性无须赘述。
当前,在整个元宇宙的宏观概念下,这些要素的前景不仅值得期待,而且很可能助推第四次工业革命的到来。在能源上,碳减排、碳达峰和清洁能源的实现,将使能源的来源、利用方式与利用规模都发生很大变化;在生产力上,原来的工业革命是强化人类的力量,如今AI的发展将强化机器的智能;在通讯上,元宇宙带来的媒介颠覆将在下文重点阐述;在交通上,智能交通的兴起和普及也将带来不一样的图景。
个人认为,我们有可能会迅速进入到第四次工业革命。人类在很多领域的技术和范式已经发生了改变,这些要素汇总在一起,会推动我们进入到一个新的元宇宙的文明里。
二、元宇宙底层是媒介革命
1、媒介变革推动价值创造
元宇宙的底层是文明迭代中非常重要的一个方面,实质是一场关于媒介的革命。
媒介革命为什么重要?以马丁·路德领导的宗教改革举例。当时的教会铁血、强大、独裁,马丁·路德何以对抗?因为马丁·路德开动了古登堡的印刷系统,这个印刷系统使得马丁·路德发表的任何内容、任何挑战教会和教宗的意见,都能迅速地在整个欧洲传递。而在印刷术发明前,全欧洲境内藏书不过三万册,而且全是手抄本。可以说,古登堡印刷术的问世,对人类的进化包括文明、知识、政治社会组织形态的进步都有极大的推动作用。这就是媒介的重要性。
回望媒介变革史,从报社、广播、电视、互联网、移动互联网到现在的VR/AR,可以很容易发现,当一个媒介因为技术引导发生变化的时候,它创造了大量的经济价值、新的产业业态,以及新的经济行为和经济形式。
2、媒介的终极形态
我们今天要思考的是媒介进化的逻辑。媒介被技术驱动之后,它解决的核心问题是什么?第一,信息密度。第二,可得性。
信息密度关系到媒介的质量,即在有限时间内所传递的信息的丰富程度。用短信、用广播和用视频发送信息,信息的承载量肯定有很大差异。对人类来说,最理想的信息质量是什么呢?是接近我们现实的场合,我们看到的山、看到的水、看到的我们工作或休闲的环境,它的信息密度对人类就是最友好的信息密度。从这个角度来讲,我们可以理解为什么VR会重要,为什么沉浸式会变得如此重要。
可得性(媒介效率)指一段内容的获取成本,包括媒介的生产成本、发行成本、流通成本、获取成本、时间成本、认知成本。假设未来不会出现脑机接口的前提下,那么可得性的极致就是AR。总体来说,技术进步推动媒介进步,媒介总是从低信息密度向高信息密度发展,媒介效率总是从低到高进化。
在下图中,我们可以看到媒介进化的总趋势。在有限的时间里其终极就是VR跟AR的融合,一个MR或者XR,我们通过这种媒介工具既可以得到极高的信息质量,同时又可以获得极大的信息效率。
3、元宇宙的媒介
媒介是一门很重要的科学,媒介的范式变化会影响人类社会的其他范式产生变化。从狭义上说,媒介就是信息的载体,而从广义上讲,媒介就是我们生活的空间、环境,是我们跟其他任何事物(人、物、知识)交互的界面、渠道。媒介的价值就在于人类的经济行为(交易)都通过媒介发生。
那么元宇宙的媒介是什么呢?它应该是由技术创新推动的3D沉浸式的媒介。PC互联网和移动互联网在过去几十年间将媒介抽象到了极致,把效率提升到了极致。元宇宙其实是把互联网的媒介具像提升到极致,极其真实地拟合人类的现实环境,容纳更多的经济活动和行为。
三、Web3的两个基础
Web3有两个很重要的基础,一是共识,二是社会网络模型。
关于共识。举例来说,为什么智人能打赢尼安德特人?智人和尼安德特人都是南方古猿 Lucy 的后代,大约6万年前,智人走出非洲开始进击尼安德特人,最终智人击败了尼安德特人。从天赋属性来说,尼安德特人更强壮、脑容量更大、视觉能力更强。有一种推论是,从智人的骨骼结构来分析,智人的语言能力更强、逻辑能力更强、社会属性更强。归根到底,语言、逻辑思维、社交性都是解决群体共识问题,使群体更有力量。之前有研究说明,因为有了互联网和移动互联网的存在,人类的有效社交规模可以从150人扩展到300人。可以说,社交网络的存在大幅提升了社交效率。共识会产生非常大的价值。比如数字货币,去年高点的时候已经形成了一个3万亿美金的资产市场。这个东西没有实体,你说它价值何在?首先共识给了它的价值,从0形成一个3万亿美金的资产价值。
关于社会网络模型。我们会发现Web3的结构更像是高效、高信任感的社会网络模型的进步,往小世界的网络模型来进步。从过去农牧时代人类最落后的低效的洞穴的模型,到我们现在比较复杂的大世界模型,未来小世界的模型,它变得效率更高,变得交易效率更好。
四、元宇宙技术的新范式
简要介绍一下元宇宙技术的新范式。
第一,图形学的AI新范式。自2014年开始,CNN开始横扫整个人工智能的领域,Deep Learning成为了新范式。相对于这个范式,过去我们用的各种人工智能的范式都变得不堪大用。过去一个世界顶配的科学家的团队,用大刀长矛做出来的东西,都比不上一个现在的学生团队用新范式做出来的东西,这就是技术范式革命带来的重要影响。所以,我们看到CNN、LSTM、BERT、Transformer、GPT,越来越进化,越来越活跃。所以,新的技术范式导致了颠覆性的创新。
举例来说,不久前OpenAI发布的文本生成图片系统DALL-E 2,如果给定一段文本:An astronaut + lounging in a tropical resort in space + in a vaporwave style(一个宇航员+在太空热带度假悠哉地躺着+蒸汽波风格),DALL-E 2就会生成如下图像:
这不是既有的照片调出来的,也不是用多张照片合成的,这是机器理解了语义之后自动生成的。机器要有足够的智能去理解单个对象以及对象之间的联系,从中我们可以理解,这种范式已经不是过去很多开发者遵循的范式,图形学已经从一些图形学相关的算法转向了人工智能,会产生范式迭代。
第二,3D图形学的AI新范式。过去我们看到,整个3D管线无非是用玛雅、3DMAX、C4D、Blender去创造、去建模、去绑定、去动组、去驱动、去动画……传统的算法,诸如光栅、光追、Mesh等构建起了传统的生产管线。而当下,我们需要注意的是3D GAN,包括神经场渲染NeRF,其实有非常大的潜力会颠覆传统的3D图形学的管线。我认为,AI范式一定会取代几何范式,当然几何范式也不一定会完全消失,很可能是两者长期共存。另外,几何范式未来可能还会变成AI大范式下的小补充。
英伟达新发了Instant NeRF的相关论文。下图左侧是34张图片训练的一个较复杂的神经场渲染。只需要34张图片,渲染出来的质量就极好。另外,这个模型的训练,可能最多只需要几分钟。右边它做了模型训练的案例,像这样简单的模型几秒钟就可以训练出来,就可以去做各种类似物体的渲染。
结语
我们认为只有基于新的技术范式,元宇宙才有可能成功。因为过去的范式,我们发现它已经有点穷途末路了。英伟达提出一个概念,如果要让我们在未来元宇宙里面的体验感媲美现实场景,需要把算力提升多少倍?需要把算力再提升100万倍。所以,传统的管线是不可为继的,我们必须有新的管线。就像Deep Learning现在制霸了整个人工智能领域一样,我们认为未来整个元宇宙的图形学的基础也会由人工智能的范式来主导。
欢迎查看MetaCon元宇宙技术大会官网,了解更多内容。地址:???https://metacon.51cto.com/????