新型AI系统用陀螺仪和加速度传感器读取人的说话内容
近日,索尼计算机科学研究所(CSL)联合日本东京大学,共同研发出一款人工智能(AI)系统Derma。该AI系统可借助MEMS加速度传感器和陀螺仪,来监测佩戴者喉咙和下颚的皮肤的震动,进而识别出人体在说话时的口型、语音等信息。一起来看看吧!
人工智能系统Derma工作示意图,图自IT Media
据相关研究人员透露,研究灵感最初来源于视听障碍者的触诊唇读法,他们会用手指触摸说话者的嘴唇和下巴周围,以此读取说话内容。也就是说,他们通过触摸障碍者嘴唇周围的皮肤,就可以知道他们的说话内容。
研究中,研究者们利用机器学习把整个过程自动化,完成了深层学习的无声语音交互(Silent Speech Interaction,SSI)。据介绍,Derma通过将传感器贴合在喉咙周围的皮肤上,就可实现从口形(无声说话)到语音的转化。
传感器安装,图自IT Media
具体来说,只要在下颚皮肤的两个位置安装MEMS加速度计和角速度传感器(陀螺仪),利用深层学习进行分析和识别,就能通过随着说话发生的下颚运动和舌肌运动引起的从下颚到喉咙的皮肤颤动,进行无声的语音识别了。
该研究采用的陀螺仪、加速度传感器,图自IT Media
在具体的实验中,研究者从传感器上获取到了12维皮肤运动信息,通过深度学习分析识别出来35种发声命令短语。而且,他们发现,系统的识别准确率达到了94%以上。
据介绍,与现有的无声语音交互研究相比,这个MEMS传感器设备在安装时并不显眼,且体积小、重量轻、耗电量低,不易受到照明条件等周围环境因素的影响。在生活中,该设备也不会影响到使用者的正常生活,吃饭和日常的交流可以照常进行,简直不能再实用。目前,相关设备还在进一步完善中,与可穿戴电子设备和身体嵌入式计算设备结合也还处于设想阶段。研究者相信,未来这个设备将会造福大批残障人士。
自新型冠状病毒肺炎疫情爆发以来,传感器专家网一直密切关注疫情进展,根据国家及地方政府的最新调控与安排,为更好的服务相关企业,在疫情期间,传感器专家网免费发布企业相关文章,免费成为传感器专家网认证作者,请点击认证,大家同心协力,抗击疫情,为早日打赢这场防控攻坚战贡献自己的一份力量。