仿生智能,藏在传感器与算法中的秘密
2000年,一个名叫倪华良的上海小伙从复旦大学电子工程系毕业,进入到张江集成电路设计行业。8年后,由于喜欢挑战和折腾的性格,他选择远赴加拿大工作和生活,在高通加拿大分公司继续从事芯片研发的工作,成为staff engineer,并因为兴趣爱好喜欢上了人机接口交互,于是兜兜转转又在2015年回到了老家上海,成立了一家从事神经科学和人机交互领域研究的科技公司——傲意科技,而他自己即是这家仿生智能公司的CEO,又是产品研发的技术担当。
在谈到为什么要进入仿生智能这个赛道时,倪华良表示:“在成立公司之前,我的兴趣爱好是和AR/VR相关的,当时做的就是非接触式的手势交互方法,后来在一路发展的过程中,我们将产品做出来了,由于行业发展的一个周期性问题,于是我们选择了当下的一个刚需方向,也就是仿生智能中的假肢,我认为这个方向也值得我们去技术改革、去创新。”
假肢其实是一个比较独特和垂直的市场,是上万种辅具里面的一个分支,根据残联公开的数据显示,目前全球需要手部截肢的人数大概在1600万左右,中国没有一个很明确的数据,事实上大概在200-300万左右。此外,在中国,下肢截肢的数量是超过上肢的,大概在500-600万左右。虽然这不是一个安全意义上像消费电子这种非常广的市场,但对于这些非常的个体而言,它是一个非常重要的辅具产品,存在较强的社会意义。
什么是“仿生智能”?
那么究竟什么是“仿生智能”呢?其实从字面上我们就能感受到其本质,“仿生”就是要尽量地模仿我们的真正人体,“智能”就是它要能明白这个人想要做什么,同时它又可以通过一些软件的方式,能实现一些个人的定制化的功能。
心电、肌电、脑电三大传感器有何异同?
说到仿生智能,就不得不提到传感器。而“心电、肌电、脑电传感器”被称为组成仿生智能系统最底层的要素。顾名思义,这三种传感器采集的分别是心电信号、肌电信号和脑电信号,但这三者之间是否存在某些异同点呢?
倪华良表示:“这三种传感器的前端是非常接近的,都是对一种弱信号的放大和提取,只是由于信号强度的不同,其采集到的信号的频谱和噪音是有所不同的。”
比如心电信号相对来说是比较强的,它的波形是一种周期性的比较固定的一种形态,如果出现波形上的不一致,我们就可以用来判别疾病的情况。
肌电信号则不同,它只有在大脑控制一块肌肉进行收缩的时候才会产生,从信号的形态来看,肌电信号和语音信号是比较相似的,都是一种上上下下的起伏信号,当你不用力的时候,这种跳跃式的信号就变成接近于一条直线,就像一个马达开通以后,马达里面有电流信号一样。所以,如果我们用一个肌电传感器基本上就能判断这块肌肉是否在用力,但是如果我们要判断一个更大范围的复杂的动作意图的时候,我们就需要比较多的传感器组成一个阵列,因为我们一个动作通常是由好多块肌肉共同运动所产生出来的一个动作。此外,由于肌电信号也是直接在肌肉上方获取的,所以信号强度也相对较大。
而与心电、肌电信号不同,脑电信号的获取难度较大,目前有两种方法,一种是侵入式的,一种是非侵入式的。常规采用的是非侵入式的,因为这种方法不存在手术开颅的风险,也不会涉及伦理问题。但是非侵入式的脑电信号采集是一种巨大的挑战,因为我们的脑神经颅骨以内的这个信号从我们的大脑的脑神经里面往上穿透的时候,它要穿过颅骨、头皮和头发,信号的衰减会非常严重。“就像它要爬过一座大山一样,你在山的这边喊一嗓子,到山的另外一头去获取信号,声音是嗡嗡的,只能听个大概,这是因为信号的衰减以及信息含量更多的高频的信息已经丢失了。”倪华良打了个生动的比喻。
如果说肌电信号是mV级的,那么脑电信号就是μV级的。所以,我们在还原脑电信号的时候,除了要选用非常好的放大器以外,通常还要做一堆的滤波,然后才能用非常高分辨率的ADC将模拟信号转化为数字信号。如果说肌电信号我们用8个bit,256个梯度表示,就能获得很好的信号质量的话,脑电信号就至少要用24个bit,2的24次方,就是16M这样的分辨率才能很好的去获取该信号。
数据处理和算法放在端侧,还是在云端?
有了传感器获取数据,就还需要处理器和算法去识别和处理这些数据。众所周知,在很多图像传感器中,已经有非常多的应用场景是将简单的实时处理放在端侧,甚至传感器上,那么对于仿生智能来讲,它的数据处理又有何特色呢?
倪华良表示:“根据不同的应用,我们会选择不同的方法。比如我们的肌电,传感器和主控芯片之间的距离是很短的,其中带来的噪音是可以容忍的,所以没有必要在每块芯片侧将其转换为数字信号。而对于数据处理量的问题,通常我们在假肢里面会放8个或者更多的传感器,事实上综合系统的复杂性和成本控制,8个已经蛮多了,半分钟大概会产生240k的数据量,当技术端往前走,市场端要往回推,这中间需要达到一个大家都比较比较舒服的平衡点。这个时候,我们就在边侧的设备端就把它全部处理完了。”
“对于脑电来说,我们的产品有64个通道,它在边缘处理的时候就很困难,这一方面和我们采用的是低功耗的MCU相关,将信号转化到实时的无线传输,然后在边缘侧处理很吓人,另一方面选处理能力很强的CPU成本也会上升,功耗也会上升。所以,在脑电系统的应用里,需要将大量的数据放到PC端去处理。”
在仿生手的应用里面,傲意科技在应用里面加入了一些人工智能的算法,目的是要理解截肢的用户他到底想要做什么动作,到底是想要把手握起来,把手打开,还是说要做个捏的动作?本质上就是一个个的指令,这个信号处理是不可能连着手机或云端的,因为整个环路下来,延时太大了。所以,我们就要求在现场就要能识别。但对于“仿生手如何能明白这个人想要做什么”,也就是模型或者知识库,这个事情需要在云端来做。
为什么要放在云端呢?还是要回到一个数据处理的能力的问题。人工智能分为三个方面:算力、算法和数据,当前云端server的算力已经很强了,由于算力的提升,几十年以前提出来的好多算法,比如BP网络、CNN这些现在比较流行的AI算法,当年没有算力跑不起来,但现在有了算力都能跑起来了。当然,对于仿生智能来说,不是单一地使用某种算法,而是围绕着用户体验展开的算法集合。
此外,数据是非常关键的东西,所谓巧妇难为无米之炊,在仿生手中,数据来源于用户自己,他们自己采集,建立自己的数据库,然后将其扔给算法,生成出抽象的AI模型,或者称之为抽象的知识库,再把它加载回设备中,这个时候就可以离开云端,用一块比较便宜的Cortex-M系列芯片,就能跑一个边缘的人工智能的算法,基于用户自己的数据和它以往的一个AI模型,去判别手要执行的动作,再将其转化为机器指令,发给机械的手去做出相应的动作来。这种做法即在逻辑上比较合理,有在成本上具有一定的优势。
仿生智能设备是否需要通过医疗认证才能进入市场?
事实上,由于假肢没有任何的治疗作用,所以在不同的国家,对于仿生智能设备的管理法规是不一样的。在中国的法律体系下面,它是一种辅助设备,不是医疗产品,是属于民政管辖的,在北京这边有一个中国康复辅具中心,在那里去做过质量检验并合格后就能上市。而在美国或欧盟国家,因为这些国家没有专门的民生部门,所以假肢是属于医疗范畴的,需要通过比如说class one的一个认证后,才能正常上市。
写在最后
由于底层技术的相似性,做仿生智能的公司在进军AR/VR/XR市场市场时,拥有先天性的优势,而傲意科技起点就是倪华良对于AR/VR这些人机交互技术的喜爱,所以在未来,傲意科技一定也会在AR/VR/XR等市场绽放独有的光彩。
?