科普:什么是机器视觉?
机器视觉帮助机器人看到并识别周围环境,以便它们可以执行更复杂的任务。
就在过去的几年里,机器视觉的进步帮助许多机器人和自动驾驶汽车达到了几乎类似人类的感知水平。使用无数的光学传感器,如高分辨率的摄像头,这些机器人和汽车,以它们自己的方式,终于能够看到。
什么是机器视觉?机器视觉是一种允许基于计算机的硬件和机器(如机器人和自动驾驶汽车)使用相机和其他光学传感器感知其环境的技术。
什么是机器视觉?
机器视觉是使机器人和其他机器(如自动驾驶车辆)能够看到和识别周围环境中的物体的技术。通过将光学传感器与能够分析和处理图像数据的人工智能和机器学习工具配对,配备机器视觉系统的机器人和自主车辆能够执行更复杂的任务,如在仓库中拉动订单或在市区交通中导航。
随着相机价格的下降,计算能力的提高和算法的成熟,机器视觉已经帮助机器人技术摆脱了Rapid Robotics公司技术副总裁Tom Hummel所说的静态编程状态。Hummel说,由于深度学习的最新进展,使机器人能够实际分析它们所看到的东西,机器人能够完成曾经看起来不可能或成本太高的任务,比如从垃圾箱中挑选特定的物品。
机器视觉是如何工作的?
大多数机器视觉系统需要一个光源,要么直接安装在机器人上,要么设置在机器人运行的设施内,这样,所使用的摄像机(或照相机)可以清楚地捕捉到周围的物体、人类、潜在的危险和其他特征。
一旦机器人捕捉到图像,这些视觉数据就会被发送到处理器或机载计算机,该计算机使用人工智能和机器学习算法对图像进行分析,通常还包括从其他传感方式(如LiDAR、雷达和麦克风)收集的数据。
在对图像和其他数据进行处理后,这些信息被传回给机器人或与它一起工作的其他机器。在那里,机器可以做出适当的决定,无论是在人行横道上停车,还是为订单挑选合适的物品,从而提高效率和安全性。
机器视觉的类型
机器视觉主要分为三种类型:
一维视觉:一维视觉不会一次分析整个物体的图像,而是一次读取一行,通常使用线扫描相机。这种类型的机器视觉通常用于检测过程,以发现在传送带上移动的产品中的缺陷。
二维视觉:二维视觉使用数码相机收集图像数据,然后通过比较一幅图像与另一幅图像的对比度变化来处理这些数据。这种类型的机器视觉通常用于跟踪物体,以及验证和检查。
三维视觉:3D 视觉使用位于不同位置的多个数码相机和其他传感器来捕捉物体的数字模型,从而提供对其位置、大小和特征的准确评估。这种类型的机器视觉通常用于帮助机器人在周围环境中导航以及执行与订单履行相关的任务,例如从箱子和容器中挑选产品。
机器视觉应用
由于大多数人严重依赖视觉来工作和与世界互动,因此由于机器视觉,机器人也能做同样的事情。机器人手臂用它来检查从装配线上下来的零件和产品,确定哪些符合质量标准。自动驾驶出租车使用视觉系统帮助在行人过马路之前读取他们的细微提示,而人类司机似乎在这方面做得越来越差。在仓库中,自主移动机器人使用机器视觉来帮助完成订单。
机器视觉应用
●用于装配线以检查零件以改进质量控制。
●帮助在仓库中工作的机器人定位产品并在周围环境中导航。
●允许自动驾驶汽车感知周围的世界并识别潜在的危险。
制造业使用机器视觉进行质量控制
当人们检查从装配线上下来的零件时,他们通常不会仔细检查每个零件以寻找缺陷。Hummel 说,这将花费太多时间、太多金钱,并且需要人类无法做到的专注程度。
但是配备机器视觉系统的机器人手臂,如 Rapid Robotics 的 Rapid Machine Operator,可以检查每一个。Hummel 说:“相机不睡觉。相机不在乎。而且相机速度很快。所以你可以检查从注塑机出来的每个零件,或者从任何过程中出来的,然后决定丢弃它。”
因此,Hummel 表示,工厂不太可能运出不良零件,操作员也能更好地了解他们生产的产品的质量。
机器视觉帮助自动驾驶出租车了解周围环境
就在行人过马路之前,他们通常甚至在脚踏入人行横道之前就暗示他们要做什么。他们可能会从手机上抬起头来,或者向左看,或者稍微举起双手。这些信号虽然微妙,但可以被自动驾驶汽车观察到或感知到。
亚马逊旗下机器人出租车公司Zoox的感知总监 RJ He 说:“当你考虑行人、司机和车辆之间的互动时,这些线索非常重要。识别这些线索是机器视觉的优势之一,也是该技术的亮点。当你对如何使用各个传感模式以及它们如何相互补充进行深思熟虑时,奇迹就会发生。”
Zoox 的电动自动驾驶汽车使用人工智能和机器学习算法以及摄像头和其他传感方式,例如测量和收集位置、速度和其他重要道路数据的 LiDAR、雷达和热像仪,能够看到周围的世界并与之互动.这些汽车正在旧金山湾区、拉斯维加斯和西雅图进行测试,甚至可以预测附近的汽车、卡车、骑自行车的人和行人可能会或可能不会做什么,就像一个人踏入道路一样。
他说:“当你非常仔细地考虑如何使用单独的传感模式以及它们如何相互补充时,魔法就会发生。无论是在视野和覆盖范围等方面,但更重要的是,在算法方面。”
通过利用机器视觉的个人优势和所有这些不同的传感器模式和算法,Zoox 能够创建他们的汽车可以实时响应的世界的准确表示,而不会伤害他们的乘客或其他人和周围的生物或给他们带来不便他们。
在美国这样的国家,近年来道路变得更加危险,这变得非常重要,这也是 Zoox 所做事情背后的动机之一。
“对于人类司机在分心等等 ,我们需要确保我们能够对所有这些不良行为做出反应。”他说。
机器视觉帮助机器人完成订单
虽然许多从事物流行业的机器人公司都依赖 LiDAR (激光雷达)来帮助他们的机器人在仓库中导航和完成订单,但专门从事仓库自动化的机器人公司inVia Robotics却依赖机器视觉。
据 inVia 的首席执行官兼联合创始人 Lior Elazary 称,该公司的机器人使用机器视觉在仓库内操作,通过扫描 AprilTags为电子商务订单提取产品,Elazary 将其描述为贴在容器上的二维码。机器人分析它捕获的代码,这使它能够理解它在看什么。
机器视觉系统也在仓库内进行训练,在那里它收集并捕获周围的特征,这些特征使用算法进行分析,从而从本质上形成 Elazary 所说的机器人在仓库内以及容器或箱子中所处位置的“假设”它需要从中拉出来。它使用视觉伺服控制机器人的运动,并允许它像人类一样抓取物体。
Elazary 说:“最终,我们会用眼睛去抓住东西——你看到它在哪里,然后你就会磨练。这就是我们的机器人所做的。”
从本质上讲,机器视觉让机器人能够适应,而不是让弯曲的架子或放错地方的盒子等小东西绊倒它——人类的小问题通常会给依赖激光雷达的机器人带来问题,并可能导致更大的开支,比如更换货架仓库。
Elazary 说:“他指的是机器视觉系统,这要难得多,但它的成本效益要高得多。”
机器视觉与计算机视觉
虽然机器视觉和计算机视觉这两个术语经常互换使用,但主要区别在于:
机器视觉系统需要相机来捕捉和提供图像数据,而计算机视觉系统可以从其他来源(比如互联网)获取图像。
计算机视觉系统是处理视觉数据的人工智能和机器学习算法所在的地方。
从本质上讲,机器视觉是眼睛,而计算机视觉是大脑。