ChatGPT崛起背后:人工智能踏上“通用与工程化”之路?
2022年末,ChatGPT横空出世,让人工智能产业再起涟漪。
?
人工智能(Artificial Intelligence,简称“AI”)诞生于1956年,至今已六十余年。在漫长的岁月中,一些新技术或新方法的出现,给AI产业带来过乐观浪潮,但随之而出现的,则是数次AI寒冬。
?
如同任何新兴事物一样,人工智能的发展没有一蹴而就,而是历经坎坷和挫折。直到近十年,得益于深度学习算法的突破,以及算力提升和大数据的积累,人工智能才真正迎来从实验室研究走向产业实践的黄金时代。
?
2016年,谷歌AlphaGo与人类围棋冠军李世石进行的人机大战,让AI走向社会舞台中央,同时,也推动了AI商业浪潮的来临。
?
过去五年,人工智能与千行百业加速融合,其价值在很多场景得到释放,并催生出一大批AI公司或团队。然而,在产业实践过程中,AI也面临新的瓶颈:解决单一场景问题,AI的能力毋庸置疑,但如何复用解决更多场景的问题,成为很多AI公司盈利的掣肘。
?
而AI工程化,是解决这一问题的重要手段。此前,Gartner已连续两年把AI工程列为年度战略技术趋势之一。在Gartner看来,AI工程化是AI大规模发展的必经之路。因为任何行业或企业,只要有场景、数据和算力,都可以落地AI应用,但落地效率、周期会远超预期。
?
因此,AI要成为企业的生产力,就必须以工程化的技术来解决模型开发、训练、预测等全链路生命周期的问题。所以在2022年,AI工程化成为AI行业的一个关键词。
?
ChatGPT走入大众
?
以ChatGPT为例,它其实也是AI工程化的产物。一位AI领域专家告诉21世纪经济报道记者,AI工程化的过程包括需求分析、模型设计、模型训练、模型部署等环节。
?
其中,在需求分析阶段,需要明确人工智能技术应用的目标和需求。比如OpenAI开发ChatGPT,其目的就是满足人们对自然语言处理技术的需求,希望通过自然语言交互的方式给人们提供帮助。
?
而在模型设计阶段,需要根据需求分析的结果,设计合适的模型来解决问题。就像ChatGPT其实是一种被称Assistant的大型语言模型,为了让它能够理解和回答用户的问题,并生成用户可读的回复,OpenAI选择用Transformer深度学习模型进行训练。
?
在训练过程中,则需要通过训练大量的文本数据,让模型学习如何对话。它需要先识别用户输入文本中的语法、语义和结构,更难的则是要学会如何生成更像是人类回复的文本。
?
“ChatGPT能实现目前这样自然的语言交互,与过去几年AI产业在算法、算力、数据等方面的不断突破密切相关,但光有技术上的创新还不够,人们能够如此便捷的体验到ChatGPT,则是AI工程化的功劳”,该AI领域专家表示。
?
其实早在2020年,OpenAI就推出过大型语言生成模型GPT-3(Generative Pre-training Transformer 3),其训练参数量达到1750,在当时,这已是世界之最。
?
虽然都是使用深度学习技术开发的大型语言模型,但GPT-3比ChatGPT要更大,训练数据也更多,所以GPT-3的能力要强于ChatGPT。然而,GPT-3的能力只能通过API的形式开放给外界,这也让很多普通用户无法体验到GPT-3的强大。
?
而ChatGPT在定位上,就是一款To C产品,上线仅5天,便吸引了超过100万用户。而且它给社会带来的震撼,要远超AlphaGo,毕竟相比只能远观AlphaGo,现在人们可以直接与ChatGPT对话,感受AI的魔力。
?
对业界来说,ChatGPT的出现,更是让人看到了AI工程能力的又一次进化。真格基金管理合伙人戴雨森当时便表示,“从ChatGPT中,我看到新一代的AI技术随着不同组件走向成熟,已经进入乐高化模块化的趋势。这意味着迭代速度会越来越快,原来需要单独开发的部分变成了公用的、可复用、可调用的组件。”
?
规模与效率
?
在产业界,AI工程化则带来了更直接的经济效益。
?
近日,阿里巴巴集团副总裁、AI科学家贾扬清提出,工程化和开源是AI普惠最重要的两大支撑。而实现AI工程化的关键,是要提升三个效率:通过云原生的计算,提升计算效率;通过标准研发范式,提升研发效率;通过大数据AI一体,提升数据应用效率”。
?
贾扬清以阿里达摩院上云为例称,通过一个云原生的AI平台PAI,就支撑算法团队从规模、效率和易用性上面不断突破。在规模上,可以支撑10万亿参数的预训练大模型,在效率上,通过AI开放服务平台OpenMind则可以服务日均1万亿次左右的调用。
?
借助AI工程化体系,阿里云服务了非常多云上的客户,而腾讯云,也凭借AI工程化解决了规模化的难题。
?
2021年初,腾讯云帮助上海富驰高科技股份有限公司(简称“富驰高科”)解决了一个大问题。作为一家金属粉末注射成型(MIM)产品专业制造商,如何提高质检效率,一直困扰着富驰高科。
?
过去,富驰高科的质检工作主要是由人工完成,这并非它不愿意使用自动化手段,而是市面上几乎没有能够满足其质检需求的方案。后来,腾讯云研发团队经过半年的艰苦攻坚,成功敲开了工业质检的大门。
?
但是,让腾讯云副总裁、腾讯云智能研发负责人、优图实验室研发负责人吴永坚头疼的是,做完富驰高科项目后,该如何把AI质检能力复制到更多项目中。吴永坚告诉21世纪经济报道,“如果每个项目都要像在富驰高科这样投入,那成本方面,腾讯云承担不起”。
?
在又做了几个项目之后,腾讯云终于找到了可行办法。“我们拆解算法里的每一个流程,精细到每一步明确要做什么,然后将其沉淀到腾讯云AI开发服务平台——TI平台上,最终形成了一个面向工业质检场景的产品化平台”,吴永坚说。
?
今年,生产3C产品金属结构件的立铠精密也成为腾讯云的工业质检客户。相比富驰高科,立铠精密的产品种类更多,涉及的工艺也更复杂,但在服务立铠精密时,吴永坚觉得容易了很多。
?
“当初我们还需要派大量算法工程师去富驰高科驻场办公,但现在,只需在项目前期派少量算法人员过去,其余大部分工作都可以在TI平台上完成,效率提高非常多”,吴永坚说。
?
这种转变,就是AI工程化价值的体现。现在,面对不同的质检场景,腾讯云都可以通过工业质检训练平台来提供解决方案,这背后,依靠的已不仅仅是算法团队,而是需要工程、产品、数据运营等团队共同支撑,进行的是一种体系化建设。
?
奔向通用AI
?
中国信通院今年发布的《人工智能白皮书(2022)》(以下简称“白皮书”)指出,未来,人工智能除了重视技术创新以外,还会更加关注工程实践和可信安全,这也构成了新的“三维”发展坐标,牵引人工智能技术产业迈向新的阶段。
?
其中,工程实践能力正成为释放人工智能技术红利的重要支撑。白皮书提到,AI行业在工程实践方面的努力,最早可追溯至Caffe、TensorFlow、PaddlePaddle等开源框架的诞生,通过屏蔽底层硬件和操作系统细节,大幅降低模型开发和部署难度,有效推动了人工智能技术的扩散。
?
而当前,人工智能与云计算、大数据等技术的融合不断深入,围绕着数据处理、模型训练、部署运营和安全监测等各环节的工具链不断丰富,也使得人工智能研发管理体系日益完善。
?
白皮书认为,随着工程实践能力的不断提升,“小作坊、项目制”的AI赋能方式正在成为历史,未来将会更加便捷、高效地实现人工资高就能落地应用和产品交付。
?
具体而言,AI工程化主要聚焦于工具体系、开发流程、模型管理全生命流程的高效耦合。在工具体系层面,体系化与开放化成为研发平台技术工具链的发展特点;开发流程方面,工程化关注AI模型开发的生命流程,追求高效且标准化的持续生产、持续交付和持续部署。
?
而模型管理方面,随着企业智能化应用的逐步加深,模型种类和数量大幅增长,企业需要建设对模型生命周期的管理机制,并对模型的版本历程、性能表现、相关数据、衍生的模型档案等进行标准化的管理运维。
?
所以接下来,AI企业能否快速赋能各行各业,响应多样化需求,关键因素就在于企业的工程化能力。
?
另一方面,通用人工智能(AGI,Artificial General Intelligence)作为AI领域的终极目标,实现的过程也需要依靠AI工程化能力。虽然目前距离实现真正的通用人工智能还有很长一段距离,但是,在一些特定场景下的通用AI,已经出现。
?
比如ChatGPT,便是一种自然语言处理的通用AI模型,因为它可以回答覆盖各种领域的问题,而不是专门针对某一个领域设计的模型。
?
目前,在很多领域人工智能已经赶上甚至超过人类水平,比如语言理解、语音识别、视觉识别等。当人们能够借助AI工程化能力,把这些AI技术规模化应用到诸如工业质检、机器人等产业当中时,将大幅提升人类的工作效率和质量,而这,也是人工智能产业致力于实现的目标。