年终访谈:人工智能技术与产业的发展变革 原创 精选
?嘉宾 | 谭中意、祝世虎
整理 | 徐杰承
2022年对于人工智能而言注定是值得被铭记的一年,在这一年中,人工智能无论在技术还是产业层面都取得了巨大发展与长足的进步,大量创新技术从概念走向实践。年初,AI加持下的冬奥为我们带来了焕然一新的观赛体验;年中,AI绘画从虚幻走向现实并斩获多项赛事大奖;年末,ChatGPT的横空出世将再次将这一整年的狂欢推向高潮......
无论是底层技术的一次次突破,还是各类应用的接连绽放,在过去的一年之中,人工智能向我们展示了它的无限可能。为了能更加全面地了解到人工智能领域的发展现状与未来趋势,51CTO内容中心特别邀请第四范式架构师谭中意;光大信托信息技术部副总经理祝世虎两位业内资深专家,共同探讨了有关人工智能技术与产业的5个话题,希望能够从中收获更多答案。
1、2022人工智能领域的关键词
谭中意:技术层面2022年最热的关键词无疑是“AIGC”,而在产业层面我想应该是“AI 工程化”或者叫MLOps。因为如今无论是国内还是国外,技术媒体、产品以及风投领域对于AI工程化的关注度都非常高。AI工程化和MLOps的核心理念就是让机器学习在企业内部更快地实现规模化落地,这也是过去一年人工智能相关产业所最关注的。??
祝世虎:从政策角度看,2022年政府主导了数据要素的国家战略,提出了数据要素是重组全球资源;重塑全球经济结构;改变竞争格局的关键力量。目前中国的 IT 底层的标准、架构、产品、生态,大多是由国外的科技厂商决定的,因此存在诸多的底层技术、信息安全等问题。所以随着全球的 IT 生态由过去的单级向未来的多级方向去发展,我们需要建设自己的 IT 的底层框架。因此,在信创的背景下,我认为2022年人工智能甚至是整个科技产业的关键词应该是“科技有国界”。??
2、前沿人工智能领域技术发展与应用现状
谭中意:应用层面,在AI工程化领域,第四范式在过去一年将大量自研技术积累进行了对外开源,其中包括线上线下一致性的生产级特征平台OpenMLDB,能够实现对快速开发企业内部的实时预测、风控与场景推荐,解决时序特征、高效读取以及线上线下一致性问题。开源一年多以来,与上下游的开源技术生态形成了良好的合作,也取得了很好的成绩。??
在技术层面,第四范式始终坚持AI方向的深耕,现阶段主要专注于企业内部两种AI的落地。其一是感知类AI落地,例如CV、NLP。另一种则是决策类AI的落地,针对企业进行策略制定,例如风控、推荐、预测等此类与企业经营密切相关的场景。这一过程中比较重要的两个关键点,其一是将模型以较高的质量进行快速上线;其二则是对模型进行持续的训练、反馈与调整,使模型始终保持其前沿性与高效性。
对于AI场景较多的企业而言,在这种情况下,一家企业中就能够产生规模化的效益,实现从量变到质变的跃迁,使企业从传统的数据公司进化为AI公司,达到通过AI提升核心竞争力的目的。
祝世虎:近几年金融行业对于人工智能技术的应用已经比较成熟了,过去一年包括未来几年主要做的事情就是利用金融业务去引领金融科技的发展。例如在消费金融领域,银行在做消费金融的准入模型时,第一代是规则驱动的模型、第二代是规则 + 数据驱动的模型,第三代则是大数据驱动的模型。??
而在现阶段,智能算法要解决的一个核心问题就是样本不足。在实际做智能风控的过程中,我总结一套手册。例如当数据的维度不足时,第一种方式,可以使用新型特征组合方法AutoCross升维。第二种方式则是当样本不足时,可以使用迁移学习。当样本的标注成本较高的时候,很多样本标注没有,可以使用Active learning的方法。当样本标注错误率偏高的时候,比如存在外来的一些数据,它标注的数据标签错误率比较高,我们要用Confident Learning的算法。而在当样本的标签非常少时,例如在用于交易反欺诈时,这个时候可以选择用半监督学习的算法。这也是在过去一两年内总结出的相对成熟的应对方案。
3、人工智能上下游产业市场环境的演化方向
谭中意:未来从事AI应用的技术企业,可能会分为三种。第一种是有资源做大模型,例如拥有海量数据、海量算力;拥有业界顶尖科学家的企业,他们能做出精度很高且普适性较好的大模型,就像AutoAI,他们可能会以API的方式对外提供服务。??
第二类则是具备丰富场景的企业,针对各个场景,例如AIGC可以用在各种需要内容的地方,来做出各种的应用。
第三类则是介于两者之间,更多的是提供工具,能够帮助两者做更好的连接,例如保证数据的准确性、保证线上服务的稳定和监控、做模型的版本和Beta这类的企业。
从行业角度讲,国内目前AI落地主要集中在企业智能化转型的相关行业,目前最热门的行业是金融行业,有场景、有钱。几乎是每一个AI技术企业必争的行业。
第二种有前景的是新消费、新零售。新消费和新零售在目前的状态下,很多企业、很多行业在不断推出新品,新品的爆发速度是相当快的,而且它们通过现在很多新媒体和新渠道的方式来做,对于营销、物流、供应链方面有很多很多AI的需求。
第三种则是一些制造业,目前重点都还在一些安全检查、安全生产、故障检测这种传统的CV领域,CV领域也能够提升一定的效率,但是还到不了能够彻底改变行业工作模式的时候,彻底颠覆可能还需要几年时间。
祝世虎:从一个AI从业者的职业变化中,我们就很容易了解到人工智能产业的变化趋势。以个人为例,我最初从事的人工智能算法行业,而后从算法转做科技,再从科技转到了做数据,现在又从做数据变成了做业务,这其中实际上是有很深刻的逻辑的。??
起初在做模型时,我发现如果没有科技去承载的话,模型只能嵌入到企业的风险管理中,它只能嵌入管理流程,并不能嵌入到具体的业务中,必须把模型嵌到科技系统中,才能下沉到具体的业务中,所以我从做模型到了做科技。
到了做科技之后,发现了第二个问题,就是对模型和算法而言,数据对模型的贡献度远远大于算法对模型的贡献度,意识到数据的重要性后,又转而用科技去做数据去了。做完数据之后,又转去做业务,这其中有两个逻辑在里面。第一,模型是基于数据的,数据是基于统计的,统计是基于口径的,口径是业务部门定的。但是业务部门在制定业务口径的时候,往往出于业务的需要,对业务口径进行战略性的模糊处理。其次,大多数行业的数字化转型,本质还是业务去引领的,在产业发展这方面其实也是如此。
4、生成式AI的演进路径与可能的落地场景
谭中意:生成式AI近期得到了业界的广泛关注,这的确是一件好事。AI领域这两年来,大模型的新场景其实是比较匮乏的。而如今ChatGPT之所以让大家耳目一新是在于,真的让用户感觉它解决了很多之前多轮对话解决不了的问题,而且也用大模型的方式生成出了一些比较切实的答案,给大家更多的信心。市场永远是需要技术热点的,技术热点的存在才能保持资本家的信心,而资本家的信心才能够推动他们掏钱把这些技术更快的落下去。??
对于生成式AI的商业化落地,可能会分为三种。第一种,OpenAI这种有钱、有人、有算法,通过API就可以足够的生成Revenue了。例如AutoCAD这家公司,它的Photoshop现在已经集成了AIGC的部分功能,而另外几家做AIGC的公司也产生了上千万的Revenue。这是少数几家做大模型的公司能做出的事情。
第二类就是将AIGC的能力跟业务场景结合,业务集成商需要寻找很多业务的具体场景,然后再去思考成本、效率等问题,需要很多的设计,如果在刚需、利润、推广三方面都能够实现进步,才能形成很好的模式。
第三类模式也是OpenAI的CEO最近提到的,在这两者之间还有第三类公司,能对普通的、普适的大模型做Finetune的技术提供商,它能针对一个具体的商业场景,然后对大模型进行针对这种具体商业场景的Finetune,也能够实现商业落地。
回到根本,都还是需要解决商业或者解决用户的实际问题,而这是需要不断地去摸索和尝试的。我很高兴看到AIGC的火,让大家对AI的事业有更多的信心,也能让更多的风险投资把钱投进来。我觉得这都是好事。
祝世虎:同样以OpenAI的ChatGPT为例,它最吸引人的地方在于,每次和它进行沟通,所收获的内容都不一样,这也是它最有意思的地方。但从应用的角度来看,这里存在着一个很严重的问题,当用户对这个系统每次输入同样的变量时,它返回的变量是不可控的,这就意味着这个AI很难承担责任。??
以前包括现在,我们所使用的智能客服都令用户感到非常傻,其语料都是事先设定好的。但恰恰是这种“傻”,才使得很多行业敢去使用智能客服,因为其反馈给用户的每一条信息都是受控的,它的每一句话都是公司能够负责的。但是当智能客服不可控时,在实用中就会产生很多问题。比如说当一个联邦学习的公司来推荐联邦学习算法时,他会介绍这个算法能干什么,但对于很多行业而言,恰恰关注的是我把我的数据联邦给你了,我的数据使用范围一定要受控,它一定不能干某些事,我关注的是它不能干什么,而不是它能干什么。
同样,对ChatGPT来说,我关注的是你的说法一定要在我们能承受的范围内,你的说法一定要受我们的控制,你不能异想天开的做一些你自己的发散的想法。但是作为技术上来讲,很遗憾我们目前还无法实现这点,太过于灵活、太聪明的AI能干出我们很多想不到且难以承担后果的事,这是做技术和做产业不同的地方。
总的来说,技术的风光和商业模式之间更多的是间接的关系,生成式AI现阶段的确能够帮我我们做一些创造性的工作,但这里的商业模式,目前我们还没有完全跑通。而在需要更高精确度的工作中,生成式AI需要走的路还很遥远。
5、未来人工智能技术与行业的结合趋势
谭中意:AI是一个算法,它与各个企业的结合是必然的,尤其是随着各个企业做数字化、做智能化转型的展开,AI+各种企业 + 各种场景,也就是就是AI+everything,已经呈现出了越来越快的趋势。??
未来几年内的killer app个人认为会是自动驾驶,自动驾驶是AI集大成的应用,它是能在极大程度方便人们出行的应用,当它和车、和路很好的结合,各种算法都能发挥很好的作用,同时又把这种规章制度完善起来,未来五年内能大批落地的、能让大家耳目一新的killer app很可能会是L4甚至L5级别的自动驾驶。
祝世虎:未来五年之内,证券、股票的自动化交易将变得更加成熟,甚至于取代人类。在这个领域中机器取代人是一个非常明显的趋势。并且很值得关注的一点是,此前基于股价因子库的算法正在被逐渐抛弃。AI未来在自动化交易领域中面临的最大的问题不会再是股价的变化,而是AI1要和AI2成为交易对手,两者之间将会是模型的对抗。??
也就是学习你的对手会怎么处理这只股票,当AI模拟得差不多时,用户就可以赚到钱了。所以说AI算法未来会在自动化交易的领域90%甚至99%取代人类,并且未来自动化交易的算法将不再是现在常用的基于因子库的模型,而会是借鉴博弈论模型对抗的一套理论。而人们要做的,只是选中目标与策略,剩下的全权交给AI就够了。?