“无屏时代”即将来临?揭秘AR/VR智能成像系统
视觉可以说是人类最重要的感官体验之一,人类大脑几乎一半的内存都用于视觉图像处理。正因视觉体验的重要性,科技巨头纷纷布局增强现实/虚拟现实(AR/VR), 随着巨头的加入,“元宇宙”概念引爆了整个市场。他们以增强视觉为切入点,将其视作下一代硬件设备的人机交互界面(HMI)的关键技术。随着科技发展,“无屏时代”必将到来,AR/VR技术将取代电脑屏幕,而AR/VR眼镜设备将取代智能手机。但电子元件(大脑)和光学元件(眼睛)仍然面临许多技术障碍。这篇文章从光学和智能成像系统角度起底AR/VR黑科技。
什么是成像系统?
它们在AR/VR中作用是什么?
在太空探索、工业5.0机器视觉、信息娱乐、驾驶辅助、计算机和智能手机等各类应用中,成像系统主要用于观测、图像捕获或图像显示等功能。成像系统一般由一个相机带着镜头与显示器所组成,它可以是独立单元,也可以是模块化组件。
数字化概念起步于20世纪中叶。最早的人机界面(MHI)是只有计算机专家才能操作的大型计算机。到了20世纪70年代末,第一台个人电脑走进家庭,随后智能手机诞生让人机交互成为生活日常。根据预测,抬头显示和免提AR/VR系统将是人机界面的下一波浪潮。目前,没有人能够准确预测人机界面的未来形态,但要实现边缘计算的无缝连接(非云连接)还面临着巨大挑战。
?
沉浸式虚拟现实生活环境目前看来还只是美好的愿景。处理周围环境的大量信息叠是增强现实系统面临的极大挑战。此外,还存在价格、整体性能(图像质量、功耗)和人体工学方面的诸多限制。但终有一日,AR/VR系统将能够像隐形眼镜一样轻巧、无缝、高效,佩戴舒适,且不会导致注意力分散的问题,相反可以通过给视野中的目标位置提供定制化信息而提高人们注意力。
正如我们的大脑和眼睛是人体两个主要器官一样,计算芯片和成像系统也是未来AR/VR人机界面的核心。在遵循摩尔定律的基础上,半导体生态系统几十年来为计算芯片的小型化付出了巨大努力。也因此我们现在实用的智能手机的计算能力可以堪比20世纪70年代的超级计算机。光电子学界正在努力创新,使用AR/VR智能成像系统的小型化和数字化。
成像系统小型化
如今,花1美元就可以买到一套8个自由曲面塑料透镜,总共尺寸不到千分之一英寸。这套复杂的透镜在优化一千多个参数后才得以设计完成。紧随镜头组之后的CMOS图像传感器和计算机视觉芯片也已实现小型化并得到改进,当前的智能手机一般配有四个摄像头,所拍摄的图像要比20年前的第一台数码相机更好,20年前的数码相机配有庞大且镜头却仅有100万像素。
同样,显示器也越来越小型化,下一代AR设备可能不仅仅是佩戴的眼镜,更有可能放入我们的眼睛中。一些公司正在开发可安装在隐形眼镜上的微小系统,即隐形AR眼镜。这款仿生眼的显示屏比一颗沙粒还小,它将光线发射到我们眼睛最敏感的部位,即光受体数量和密度最高的中央凹。下一代版本将包括处理器、眼球追踪传感器和通信芯片,用一块小电池便可以为整个设备供电。
成像系统数字化
与几十年前的电子元件类似,今天的光学元件主要是模拟技术。光学系统由复杂的大块表面、多层薄膜或连续形状组成。这种传统方法的替代方案直到最近才出现。随着平面光学元件的出现,纳米结构器件(尺寸小于一个波长)应运而生,能够重复实现聚焦、滤色和反射等光学功能。该项技术的主要优势在于其紧凑性、多功能性以及与半导体工艺的兼容性,为光学元件和电子元件之间的集成带来了新的可能性。要使该项技术走向成熟,需要克服许多障碍。材料和半导体工艺领域的领导者正在利用他们的专业知识,帮助推动平面光学元件进入各类规模市场。
每个光学元件都将从模拟技术转换为数字技术。全数字化成像系统将以更灵活、更具体的方式收集或显示图像。中心凹相机或显示器有效地证明了如何以更个性化、更高效的方式使用像素成像系统,将详细的视觉信息精确地带到信息处理单元,并同时降低其他区域的分辨率。从某种意义上说,数字成像系统是模仿人类眼睛功能。
为未来而设计:成像系统智能化
我们人类大脑几乎一半的内存都用于视觉图像处理。同样,成像系统必须实现智能化,这意味着光学元件和电子元件必须共同设计、共同优化,甚至可能共同制造。
成像系统由收集光线的传感器、将原始传感器信号传输至处理单元的转换器以及对数字信号进行后处理以做出决策的计算机视觉单元组成。每个组件由不同的团队分别设计,并采用不同的技术制造。
近传感器计算或传感器内计算将成为主流计算方式,有助于实现更具创新性的成像系统,降低能耗,实现低延迟和更高的安全性。例如,CMOS图像传感器可以由一个平面系统芯片组成,该芯片集成光电二极管阵列、脉冲调制电路和一个简单的ADC转换器,使前端处理单元靠近或进入传感器层。其他方式包括将光学元件、传感器和算法进行联合优化,然后相互配合使用以解决某一特定的成像问题:与拍照不同,还需要识别物体并作出决定,视频监控摄像头应该不同于眼球跟踪摄像头。智能化显示引擎经充分优化后,我们甚至不需要构建中间图像来呈现真正沉浸式的内容。