基于图像语义的可视化同时定位和建图的面向应用程序的移动机器人自主导航解决方案综述 (5)

定位和建图的准确性,可以衡量一个自主导航系统的可靠性。一般而言,如果需要提高准确性,语义几乎可以被包含在传统SLAM算法框架的所有阶段,例如:初始化,后端优化,重定位,回环检测等等。在后面章节陈述详细的讨论之前,我们要首先总结语义SLAM相关的研究。

这些研究致力于系统准确性的提高,如表6所示。

基于图像语义的可视化同时定位和建图的面向应用程序的移动机器人自主导航解决方案综述

单目尺度初始化

由于图像之间没有绝对的基准,单目V-SLAM系统的尺度不可避免地随着时间出现模糊和漂移。因此,在开发单目V-SLAM系统初始化中地一个关键问题是,如何矫正尺度模糊和漂移。这些问题研究中相同重点是,它们都引入了图像语义地概念。作为图像语义地一种形式,对象的大小被完全考虑在内,并且单目尺度初始化过程被认为更加简洁有效。在公开数据集上地实验结果验证了这些方法在大量应用上的有效性,包括从小范围地室内场景到大范围地室外场景。

语义和几何联合优化

最紧密地语义和几何联合优化框架之一被Bowman等人提出,他们首先提出了概率数据关联地方法。如果连续和离散数据都涉及到数据关联任务中,直接使用一个MLE(最大概率估计)方法不能解决问题。因此,作者巧妙地将主要问题分解为多个子问题,就是,他们将所谓的混合关联分为两个步骤:离散语义关联和连续姿态估计。这个两部联合迭代计算问题,能够被经典地期望最大算法简单地解决。此外,被对象检测所提取出的语义最重要的点是,它在后端优化中发挥重要作用。

Linaos等人提出了一个合并SLAM后端中的语义信息(通过语义分割提取出)。事实是,2D对象边界不能准确地表达出所匹配地3D对象地边界,Linaos的方法被认为在实际应用更加有效。最新的研究将2D对象检测运用到推理3D对象的边界边框。从工程角度,这个方法能够适用于准确度要求较低但是具有实时要求的语义SLAM系统中。

重定位和回环检测

重定位和回环检测检测采用相同的技术,但是,它们却是解决不同的问题。重定位的目标是恢复相机姿态,但是回环检测的功能则是获得几何一致地图。不考虑单个技术功能的差异性,我们更加关注这些技术的相同点。因此,这一小段主要是描述基于语义的重定位算法,大多遵循面向运用的思路。

几何定位的主要限制在于,对于预先构建好的地图,长期定位具有难度场景的能力。但是,基于语义的方法是这个具有挑战性问题的答案。从近来的研究中可见,一项基于语义的交叉推理定位算法被提出。原则上,几何定位算法依赖于图像形状之间的相似性,并且这明显受限于研究者,即使图像从相同位置采集,季节的变化足以使所关注的图像表现得不一致,以至于匹配关系变得不可靠。在这种情况下,语义肯定会让人联想到,跨季节本地化研究的重要贡献之一是,单个图像中语义对象的拓扑随着时间的推移将保持一致。这个跨季节定位方法被应用在无人驾驶中,可以表现出足够的可靠性。一个新颖的基于图的语义重定位方法被Gawel提出,在这样的系统中,带有语义的关键帧被转化为一组3D图,并且这些3D图被用来在预先构建好的环境地图中进行匹配。处理季节变化,引入的语义信息同样解决更大的视点变化或照明变化,甚至部分由于时间引起的场景结构变化。重定位和回环检测方案所产生的准确性提升验证,作为V-SLAM系统的一个附加功能。

公开问题

部分语义SLAM研究者关注基于深度学习方案的流程设计,从而可以搭建一个可训练的端到端的SLAM系统。近年来,已经有尝试使用CNNs的方法来估计一张图像的深度信息。即使可行性得到了验证,限制CNN泛化能力所带来的困难仍然是一个固有的不适定问题。一些研究者做出一些努力,即采用一些端到端的方案,在一对图像中联合估计位姿信息和相机的移动。此外,Wang和Clark提供一个可替代的方案,就是直接从视频中推理姿态和不确定性。从他们的实验中可知,他们已经采用层级式网络设计,伴随认真的参数配置和充足的训练,这样能够在给定数据集上得到当前最优的准确性。与此同时,反对者仍在争论管线形SLAM在实际应用中的不良性能;他们在强调“可解释性”和“泛化性能”的问题。对于此,研究者目前致力于深度学习建模方法,为了更好的解释下和多维度可视化。

Ⅵ.讨论

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywswd.html