关于机器学习:深度解析机器视觉四大光学成像方法

46次阅读

共计 2744 个字符,预计需要花费 7 分钟才能阅读完成。

原文:深度解析机器视觉四大光学成像办法

工业 4.0 时代,三维机器视觉备受关注,目前,三维机器视觉成像办法次要分为光学成像法和非光学成像法,这之中,光学成像法是市场支流。

01  航行工夫 3D 成像

航行工夫成像(Time of Flight),简称 TOF,是通过给指标间断发送光脉冲,而后用传感器接管从物体返回的光,通过探测光脉冲的航行(往返)工夫来失去指标物间隔。光发射进来后,会被物体反射回来,并且被相机检测到。

目前市面上的 ToF 产品按技术路线能够分为两大类:
1、DToF(间接测量航行工夫,direct-ToF);
2、IToF(间接测量航行工夫,indirect-ToF)。
DTOF 测量发射脉冲与接管脉冲的工夫距离。其外围组件次要有 VCSEL、单光子雪崩光电二极管 SPAD,以及工夫数字转换器(TDC)。DTOF 会在单帧测量工夫内发射和接管 N 次光信号,而后对记录的 N 次航行工夫做直方图统计,其中呈现频率最高的航行工夫 tof 用于计算指标间隔。
ITOF 大部分间接测量计划都是采纳了一种测相位偏移的办法,即发射正弦波 / 方波与接管正弦波 / 方波之间相位差。
从利用角度来说,DToF 功耗低,体积小适宜于在较小的设施应用,并且因为抗扰性较好,在户外的应用上也更胜一筹。并且因为 DToF 的原理,测量间隔增大时精度不会大幅衰减,能耗也不会大幅晋升。而 IToF 的图像分辨率较高,在物体辨认,3D 重建以及行为剖析等利用场景中可能重现场景中更多的细节信息。
总体而言,TOF 成像可用于大视野、远距离、低精度、低成本的 3D 图像采集,其特点是:检测速度快、视线范畴较大、工作距离远、价格便宜,但精度低,易受环境光的烦扰。例如 Camcueb3.0 具备牢靠的深度精度(<3mm @ 4m),每个像素对应一个 3D 数据。

02  扫描 3D 成像

三维扫描的根本定义是通过肯定办法获取被扫描物体的几何结构和外表图像。扫描 3D 成像办法可分为扫描测距、被动三角法、色散共焦法。
扫描测距是利用一条准直光束通过 1D 测距扫描整个指标外表实现 3D 测量的;被动三角法是基于三角测量原理,利用准直光束、一条或多条立体光束扫描指标外表实现 3D 成像,如图 2 所示。色散共焦通过剖析反射光束的光谱,取得对应光谱光的汇集地位,如图 3 所示。

图 2

图 3 三维扫描成像的最大长处是测量精度高。但毛病是速度慢、效率低;用于机械手臂末端时,可实现高精度 3D 测量,但不适宜机械手臂实时 3D 疏导与定位,因而利用场合无限。
三维扫描利用的畛域有:
(1)逆向工程。通过三维扫描获取物品三维信息,而后输出到软件中进行批改,欠缺,最初失去准确的三维模型。
(2)产品检测。三维扫描被利用于生产线上,检测产品的形态,管制产品的品质。
(3)生物医疗畛域。例如牙齿改正,器官复制等。
(4)考古畛域。例如文物复制。

03  构造光投影 3D 成像

构造光技术就是应用提前设计好的具备非凡构造的图案(比方离散光斑、条纹光、编码构造光等),而后将图案投影到三维空间物体外表上,应用另外一个相机察看在三维物理外表成像的畸变状况。
如果构造光图案投影在该物体外表是一个立体,那么察看到的成像中构造光的图案就和投影的图案相似,没有变形,只是依据间隔远近产生肯定的尺度变动。然而,如果物体外表不是立体,那么察看到的构造光图案就会因为物体外表不同的几何形态而产生不同的扭曲变形,而且依据间隔的不同而不同,依据已知的构造光图案及察看到的变形,就能依据算法计算被测物的三维形态及深度信息。

构造光投影三维成像目前是机器人 3D 视觉感知的次要形式。其成像零碎是由若干个投影仪和相机组成,罕用的构造模式有:单投影仪 - 单相机、单投影仪 - 双相机、单投影仪 - 多相机、单相机 - 双投影仪和单相机 - 多投影仪等。
依据构造光投影次数划分,构造光投影三维成像能够分成单次投影 3D 和屡次投影 3D 办法。
单次投影 3D 次要采纳空间复用编码和频率复用编码模式实现。因为单次投影曝光和成像工夫短,抗振动性能好,适宜静止物体的 3D 成像,如机器人实时静止疏导,手眼机器人对生产线上间断静止产品进行抓取等操作。然而深度垂直方向上的空间分辨率受到指标视场、镜头倍率和相机像素等因素的影响,大视场状况下不容易晋升。
屡次投影 3D 具备较高空间分辨率,能无效地解决外表斜率阶跃变动和空洞等问题。不足之处在于:精度容易受到投影仪、相机的非线性和环境变动的影响且抗振动性能差,不适合测量间断静止的物体;对于毛糙外表,构造光能够间接投射到物体外表进行视觉成像;但对于大反射率润滑外表和镜面物体 3D 成像,构造光投影不能间接投射到被成像外表,须要借助镜面偏折法。
偏折法对于简单面型的测量,通常须要借助屡次投影办法,因而具备屡次投影办法雷同的毛病。另外偏折法对曲率变动大的外表测量有肯定的难度,因为条纹偏折后反射角的变化率是被测外表曲率变化率的 2 倍,因而对被测物体外表的曲率变动比拟敏感,很容易产生遮挡难题。

04  平面视觉 3D 成像

平面视觉字面意思是用一只眼睛或两只眼睛感知三维构造,个别状况下是指从不同的视点获取两幅或多幅图像重构指标物体 3D 构造或深度信息。目前平面视觉 3D 成像办法能够分为单目视觉、双目视觉、多(目)视觉和光场 3D 成像等。
单目视觉深度感知线索通常有:透视、焦距差别、多视觉成像、笼罩、暗影、运动视差等。在机器人视觉里还能够用镜像 1,以及其余 shape from X10 等办法实现。
双目视觉深度感知视觉线索有:眼睛的收敛地位和双目视差。在机器视觉里利用两个相机从两个视点对同一个指标场景获取两个视点图像再计算两个视点图像中同名点的视差取得指标场景的 3D 深度信息。
典型的双目平面视觉计算过程蕴含上面四个步骤:图像畸变改正、平面图像校对、图像配准和三角法重投影视差图计算,如下图。

图 5 双目平面视觉零碎与计算过程示意图多(目)视觉成像也称多视点平面成像,用单个或多个相机从多个视点获取同一个指标场景的多幅图像,重构指标场景的三维信息。其基本原理如下图所示。

图 6 多视点成像基本原理多视点平面成像次要用于下列几种场景:
应用多个相机从不同视点,获取同一个指标场景多幅图像,而后基于特色的平面重构等算法求取场景深度和空间结构信息;从静止复原形态(SM)的技术。
应用同一相机在其内参数不变的条件下,从不同视点获取多幅图像,重构指标场景的三维信息。该技术罕用于跟踪目标场景中大量的控制点,间断复原场景的 3D 构造信息、相机的姿势和地位。
1、LOCUS:以 LiDAR 为核心的多传感器高精度里程计与三维建图零碎
2、书籍举荐 -《基于多视图几何的机器人零碎视觉感知与管制》
3、开源三维重建算法 colmap 特征提取代码解析
4、书籍举荐 -《3D 计算机视觉》
5、点云压缩研究进展与趋势
6、多视图点云配准算法综述

正文完
 0