基于图像语义的可视化同时定位和建图的面向应用程序的移动机器人自主导航解决方案综述 (6)

在上述章节,主要涉及到语义SLAM的感知、鲁棒性和准确性问题。此外,用于提升SLAM性能的技术工具中,一些对应的公开问题被提出。这项调查的主要关注之一,就是从宏观角度提出了这个公开问题的解决方法。因此,这个章节主要是宏观角度的讨论。主要涉及多尺度地图表达,对象SLAM和弱监督、无监督学习SLAM。

多尺度地图表达

我们相信,时标地图有助于机器人的长期自主定位。近几年来,V-SLAM的倡导者忽略了他们研究者存在的问题。例如,图像序列的时空上下文信息已经被地图表达所考虑,这也就不可能重构所希望的时间变化语义地图。近来,关于RNN的研究,已经表现出构造图像序列中时空上下文的帮助。从我们的观点,RNN可被用来处理V-SLAM的建图任务,建图需要长期的强自主的定位能力。

伴随着时变地图(在某个时间段中包含整体的环境信息),全景语义地图构成了可被用来进行多尺度表达的主要形式。如果要求使用一个V-SLAM框架来构造一个全景语义地图,那么就要在全局角度分割一个全景语义地图。作为CV领域的难点之一,多项方法被提出用来解决,在像素级别上进行分割前景对象,但是前景和背景的统一标定问题仍然存在。所提出的全景语义分割是这类问题的一种解决方案。它通过融合从语义分割和实例分割所获得的信息,产生一个全局一致的标定,这是对于之前获取到结果信息的更好的理解。据上述分析,在语言SLAM领域,我们坚信多尺度地图的发展前景可观,在高级别人机环境交互和长期自治位置方面具有相同的一般特征。

对象SLAM

从我们的角度来看,DNNs作为一个新颖的方法,对于提升视觉里程计的鲁棒性却不具备实用性。许多情况下,由于忽视特征点的鲁棒性,过度训练的DNN方案不但会产生过多的时间损耗,而且在全新场景下的某些SLAM任务中也无法使用。通过建立起对于3D场景下单个对象的单独跟踪,它使2D到3D以及单线程到多线程的高效特征选择和数据关联得以实现,从而切实提高了VO的鲁棒性和准确性。

一个可靠的对象SLAM框架如图6所示。

基于图像语义的可视化同时定位和建图的面向应用程序的移动机器人自主导航解决方案综述

SLAM++提出最早对于对象SLAM领域的研究。基于对象数据集应该首先被建立的事实,SLAM++仍不适用于在线任务。最近,关于SLAM++的研究可分为两个方向:一个是CubeSLAM提出的通过立方体描述对象,另一个是QuadricSLAM提出的用椭圆体描述对象。我们详细对象SLAM有着广阔的研究前景,并且它的观点是在3D场景下,整个过程直接追踪动态目标。伴随CV领域中3D对象追踪(包括3D语义估测器)的快速发展,有理由相信它对于创建一个更加高效对象SLAM系统有所帮助。

弱监督和无监督学习SLAM

伴随数据集的出现,端到端的语义SLAM框架一般会带来最佳定位精度,但是其可解释性和泛化性受限于它的广泛的应用范围。以DNN为例,泛化能力的减弱同时伴随着过拟合,这是由于过于细致的参数配置和训练过程。因而,基于弱监督或无监督的学习框架被提出,应用来提高DNNs的泛化能力。但是,该项研究仍处于初期阶段。事实上,在端到端的SLAM领域,基于无监督的单目深度估计器已经被认为是一个主要研究方向;与此同时,机器学习专家的兴趣现在集中在DNN的可解释性上。这些线索令我们相信,高级的学习策略将是语义SLAM框架的强大而有力的工具。重要的是,可以将语义SLAM管道轻松集成到深度强化学习范例中,以构建具有一般智能的机器人系统。

Ⅶ.总结

对于自主机器人的导航任务,一个致力于更好理解和感知机器人工作中信息的SLAM系统,已经引起了越来越多的关注。这项总结中,我们回顾了语义SLAM在感知,鲁棒性和准确性方面的发展,然后讨论了与最新进展和挑战相关的开放问题。具体而言,我们尝试从宏观的角度寻求对这些公开问题的可能解决方案,并以建设性方式进一步提出建议。我们相信通过实际应用可以证明SLAM框架的完善性,语义SLAM将通过图像语义的显着融合来区分自己。基于深度学习的方法的发展显然为研究人员提供了利用其强大的图像处理能力来估计姿势,检测环路闭合,构建3D地图等的机会。 从我们的角度来看,深度学习和语义SLAM现在已经密不可分,并且在未来的研究中必将它们融合在一起。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywswd.html