资讯

《sciencedirect》:基于人工智能的室内环境中自主移动机器人定位改进方法

转载 2025-10-10 10:04 王守德,努尔·赛兹林 ·艾哈迈德 来源:王守德,努尔·赛兹林 ·艾哈迈德

概述

室内自主移动机器人(AMR)的应用大幅增长,因为它们能够集成各种传感器、保持较低的运营成本、易于部署,并表现出卓越的机动性。尽管如此,在复杂的室内环境中导航仍存在巨大挑战,可能会阻碍 AMR 性能并降低整体系统效率。为了克服这些障碍,研究人员专注于开发自主定位技术,使 AMR 能够在复杂的环境中有效地导航和执行任务。人工智能 (AI) 应用的最新进展深刻地影响了这一领域,增强了 AMR 的控制和决策能力。

本文全面回顾了旨在改善室内 AMR(包括飞行器)定位的基于 AI 的策略。我们系统地分类和批判性地分析了基于同步定位和地图构建(SLAM) 的方法、基于里程计的方法和多传感器融合技术此外,我们还讨论了基于人工智能的方法所面临的实时性能挑战,并阐述了人工智能增强型定位方法与传统定位技术之间的区别,强调了采用基于人工智能的解决方案的必要性和优势。通过阐明这些方法,我们的目标是加深对它们的理解,并促进其在该领域的广泛应用。最后,我们讨论了新兴的研究方向和持续的挑战,为室内AMR领域的未来研究和发展提供指导。

(1)引言

自主移动机器人(AMR) 已成为现代工业、服务业和智能家居中不可或缺的自动化工具。这些机器人涵盖各种平台,包括轮式、腿式、空中、医疗、搜索救援、物流、制造和水下机器人,均专为自主导航和任务执行而设计。然而,在室内环境中,由于无法依赖GPS进行定位, AMR 在精确导航和定位方面面临挑战。

AMR 的定位方法通常分为两类:一类依赖于外部射频 (RF) 传感器或信标,例如 Wi-Fi、超宽带 (UWB) 或低功耗蓝牙(BLE),另一类利用板载传感器,例如激光雷达、惯性测量单元(IMU)、编码器和摄像头。表 1对这两种方法进行了详细比较。外部传感器在受控环境中提供可靠的定位,但通常需要对基础设施进行大量改造,例如安装信标或接入点。此外,这些系统可能面临信号干扰、范围有限以及在动态或混乱环境中适应性降低等问题。相比之下,板载传感器提供了更灵活、独立的定位解决方案,而无需改变现有的基础设施。

然而,传统的基于机载传感器的定位技术,例如同步定位与地图构建SLAM和基于里程计的方法,在实际应用中面临诸多限制。这些方法通常依赖于几何特征或原始传感器数据,在动态或杂乱的环境中可能会遇到困难。它们在应对光照变化、动态障碍物或具有多个形状相似的物体的环境中表现不佳,这使得 AMR 在实际部署中难以实现高效稳定的自主移动和任务执行。

表1. AMR定位中机载和外部传感器的比较。

比较标准板载传感器外部传感器
示例激光雷达、摄像头、IMU、编码器、光电传感器Wi-Fi、UWB、BLE
基础设施要求无需额外的基础设施需要专用基础设施
环境适应性适应动态环境最适合受控环境
抗干扰性抗射频干扰易受射频干扰
成本降低成本成本更高
定位精度取决于环境复杂性信号强,稳定
可扩展性易于扩展容量受限
部署时间快速设置冗长的设置

计算技术和硬件的最新进展使人工智能(AI) 成为几乎所有工程相关研究领域的基础组成部分。对于缺乏具体解决方案或传统方法需要大量手动调整的复杂问题,人工智能是解决这些问题的理想工具。自动特征提取消除了对昂贵的手动特征工程的需求,这是人工智能与传统认知算法之间的显著区别。通常,人工智能可以检测异常,预测潜在情景,应对不断变化的情况,深入了解涉及大型数据集的复杂问题,并识别可能被人类忽视的模式。它可以利用大数据并从中学习,以增强 AMR 的移动性和决策能力。此外,与传统的优化方法相比,人工智能可以智能地管理机载资源。

基于人工智能的 SLAM 和里程计方法为 AMR 的室内定位带来了显著的改进。传统方法虽然在静态环境中表现良好,但在动态复杂环境中性能往往会下降。人工智能方法的集成,尤其是深度学习(DL) 和机器学习(ML),增强了环境感知和特征提取能力。人工智能使 AMR 能够智能地识别动态障碍物、过滤环境噪声并实时区分可移动和不可移动物体。这大大提高了地图绘制的准确性和更新速度,使机器人即使在不断变化的环境中也能保持高效的导航。

此外,人工智能方法有助于优化和增强车载传感器的多模态数据融合,从而提高AMR定位系统的鲁棒性。借助人工智能模型,多模态数据融合可以优化数据冗余,使机器人在激光传感器发生故障或其精度下降时,能够依靠视觉或IMU数据进行补充定位。这能够保持对环境的全面感知和理解。这种多模态融合在动态或复杂环境中尤为重要,可确保AMR在不断变化的条件下保持高精度导航和避障能力。

综上所述,研究基于人工智能的AMR定位技术对未来机器人系统的发展具有重要意义。基于人工智能的定位系统能够显著增强AMR在各种室内场景下的适应性,从而实现更深入的环境理解和更高效的决策。因此,本文系统地探讨了人工智能在AMR室内定位中的应用,分析了其在提升定位精度、适应性和计算效率方面的优势与挑战。

尽管AMR技术在过去几十年中取得了长足的进步,但近期的综述研究主要集中于SLAM、路径规划和传感器数据融合等单个技术方面。如表2所示,自2019年以来的现有调查为这些领域提供了宝贵的见解,探讨了AMR中使用的传感器和机器人的类型。然而,对于如何将基于人工智能的方法应用于AMR的室内定位,目前还缺乏系统的分析和全面的评估。特别是,尚未对如何通过基于SLAM的方法、基于里程计的方法和车载传感器融合来增强室内定位的基于人工智能的集成方法进行彻底的综述。

为了弥补这一差距,本文对基于人工智能的室内AMR定位方法进行了全面回顾。我们将内容分为三个层次:车载传感器、定位技术和人工智能模型/方法。整体系统架构如图1所示。

2调查方法

2.1.研究设计

本研究采用了系统综述方法,该方法经过精心设计,旨在识别与抗菌药物耐药性(AMR)局部发展最相关的文献。根据芬克(Fink)的定义,系统综述是一种发现、分析和综合现有知识的方法。它要求系统严谨性、明确性、完整性和可重复性。本研究的研究框架以PRISMA(系统综述和荟萃分析的首选报告项目)指南为指导。PRISMA是一种广受认可的循证方法,可确保系统综述和荟萃分析的全面性和透明度。

研究程序分为四个主要阶段:识别、筛选、资格评估和最终纳入。每个阶段都经过严格执行,以确保审查过程的完整性和质量。此外,本研究还采用了包含27个条目的PRISMA清单,以增强研究的结构和形式。该清单确保审查遵循清晰度、可重复性和系统性评估的高标准,并对文献的优缺点进行透明的评估。

2.2资格标准

本研究重点关注基于人工智能的AMR室内定位方法,强调集成先进的机器学习算法以提高定位精度和鲁棒性。这些算法包括但不限于深度学习模型、卷积神经网络(CNN)、循环神经网络(RNN) 和生成对抗网络(GAN)。目标应用涉及在复杂室内环境中运行的机器人。

基于人工智能的方法旨在通过处理和解读来自各种传感器的数据来提高室内定位的准确性和可靠性。这些传感器可能包括激光雷达、摄像头、惯性测量单元 (IMU)和车轮编码器。通过利用人工智能算法,机器人可以更好地理解和导航其环境,从而实现更高效、更安全的运行。

本综述全面探讨了这些基于人工智能的定位技术的实施策略、优势和局限性。它评估了如何训练和部署不同的机器学习模型,以便在动态且杂乱的室内环境中有效实现精确定位。通过对各种基于人工智能的方法进行比较分析,本研究探索了它们在不同AMR场景中的适应性及其潜在应用。

此外,为了系统地评估人工智能技术在室内定位中的应用,本综述定义了纳入研究的具体资格标准。入选研究需提出或利用基于人工智能的AMR室内定位方法,并将机器学习方法和深度学习与传感器数据相结合,以提高定位精度,同时展示基于人工智能的定位方法的实际有效性,且为过去五年内发表的论文,以确保与当前技术进步保持相关性。

通过遵循这些资格标准,本综述确保全面深入地探索基于人工智能的室内定位方法在实际应用中的挑战和潜力。这种系统性方法有助于全面审视最先进的方法,从而确定AMR定位领域的当前趋势、研究差距和未来发展方向。

2.3搜索策略

我们采用 PRISMA 2020 框架系统地回顾了基于人工智能的方法在 GPS 受限环境 (GDE) 中改进自主移动机器人定位的文献。回顾的重点是理解和分析这些方法在解决动态目标定位相关的复杂性和挑战方面的有效性。为了确保研究的全面性和高质量,我们选择了 Web of Science 和 Scopus 作为主要信息来源。选择这些数据库是因为它们广泛且高质量地涵盖了科学技术领域的文献。

3.基于AI的室内定位方法概述

人工智能在移动机器人领域得到了广泛的应用,尤其是在定位领域,它使机器人能够理解周围环境并准确确定其在环境中的位置。虽然在可见、静态或密闭空间中定位相对简单,但在动态环境中却面临着巨大的挑战。基于人工智能的定位技术利用先进的数据驱动方法,增强了移动机器人有效克服这些挑战的能力。

为了说明基于人工智能的方法在室内定位中的应用,算法 1 提出了一个通用的人工智能定位框架。该框架支持多种人工智能方法,包括机器学习、深度学习、强化学习和混合方法。通过利用这些方法的优势,该框架显著提升了 AMR 在动态复杂室内环境中的定位精度、鲁棒性和适应性。以下章节将讨论几种主要的基于人工智能的室内定位方法。

3.1机器学习(ML)

机器学习是跨学科执行各种任务的重要框架,在基于人工智能的室内机器人定位中具有重要价值。定位涉及估计机器人在特定环境中的位置,这对于机器人理解环境和做出导航决策至关重要。机器学习的最新进展极大地推动了机器人技术的发展,在运动控制、抓取、人机交互、感知、建图、规划和定位等应用方面取得了实质性的改进。通过机器学习,机器人可以掌握路径规划和轨迹跟踪等技能,而无需手动编码路点,从图像和激光雷达等感知输入生成导航模型,以便在环境中进行实时定位和移动。

图 3全面展示了基于机器学习 (ML) 的方法在增强 AMR 定位方面的优势。图 3(a)展示了机器学习模型通过最小化不稳定偏差来平滑轨迹的能力,从而确保路径更稳定、更准确。基于机器学习的方法有效地纠正了传统方法中常见的轨迹突变,凸显了其在管理噪声传感器数据方面的稳健性。

图 3(b)展示了机器学习在未知环境中高效探索的能力。在基于机器学习的框架的引导下,机器人能够生成一条在探索和目标导向导航之间取得平衡的轨迹。这在地图不完整或动态变化的环境中尤其有利,而传统的启发式方法则难以适应这些环境。

图 3(c)强调了机器学习在校准视觉信号误差方面的作用,从而提高了定位精度。通过利用多模态传感器融合和误差校正算法,机器学习模型可以减轻由传感器噪声或环境变化引起的差异,确保预测轨迹与地面实况紧密一致。

最后,图 3(d)突出显示了一个失败案例,其中机器学习方法由于视觉里程计中的累积误差而遭遇挑战。这一失败凸显了机器学习在处理极端输入失真或与训练数据明显不同的场景时的局限性。然而,此类案例也表明,通过领域自适应和迁移学习等技术可以进一步改进机器学习模型。

总体而言,基于机器学习的方法优于传统方法,后者通常依赖于预定义的启发式方法,并且不太适应动态和嘈杂的环境。通过利用数据驱动的洞察力,机器学习技术能够有效地泛化各种条件,适应新环境,并提升在复杂场景下的性能。这些特性使得基于机器学习的方法对于推进AMR定位至关重要,尤其是在具有挑战性的室内环境中。

图 3.四种室内场景中机器学习增强的机器人定位轨迹性能。红色圆圈表示起点,绿线表示地面真实轨迹,蓝线表示使用基于机器学习的模块预测的轨迹。蓝色箭头表示机器人的最终位置和方向。子图分别说明了机器学习对 (a) 轨迹平滑、(b) 探索、(c) 误差校准和 (d) 故障情况的影响。

3.2 .强化学习(RL)

强化学习是机器学习的一个基本范式,与监督学习和无监督学习并列,致力于使代理能够通过与环境的交互来学习最优行为,从而最大化累积奖励。通过探索可能的控制行动空间,代理可以获得反馈,例如对良好表现的奖励和对不良表现的惩罚。这种反复试验的方法使代理能够迭代地改进其决策策略。

深度强化学习(DRL) 结合了 DL 强大的函数逼近能力和RL 的最优策略学习框架,近年来获得了广泛关注,尤其是在 AlphaGo等应用中。图 4展示了一个专为改善复杂动态条件下室内移动机器人定位而定制的 DRL 框架。该系统首先从 IMU、LiDAR、摄像头和编码器等设备收集多传感器测量数据。这些测量数据既能捕捉静态环境特征(如墙壁、门),也能捕捉动态因素(如移动障碍物、NLOS 条件)。具有多个隐藏层的深度神经网络(DNN) 处理这些高维输入,以学习对决策至关重要的潜在表示。

基于此表示,DRL 策略通过最先进的算法进行训练,涵盖在线策略方法(例如,Actor-Critic、近端策略优化(PPO)、异步优势 Actor-Critic (A3C))和离线策略方法(例如,Q-Learning、深度 Q 网络 (DQN)、深度确定性策略梯度 (DDPG)、软 Actor-Critic (SAC))。该策略输出位置更新或速度命令,使代理能够实时优化其姿势。

奖励信号源自定位误差指标、精度反馈和时间平滑度,从而驱动持续的策略更新。这种闭环学习机制使机器人能够快速适应环境不确定性,同时保持较高的定位精度。通过利用深度强化学习 (DRL) 自适应探索和利用传感器数据的能力,该框架显著提升了室内移动机器人在挑战性场景下的定位鲁棒性和精度。

在室内定位和路径规划领域,强化学习已成功应用于改进导航策略,以实现在动态和未知环境中的高效移动。强化学习的仿生学习系统模拟了在生物体中观察到的反复试验学习过程,使机器人能够迭代地增强其行为,并提高导航和定位的效率。

然而,强化学习在室内 AMR 中的应用也面临着挑战,尤其是随机探索相关的计算时间和成本,这会限制实际的效率和可靠性。为了应对这些挑战,研究人员提出了一些优化技术,例如有信息偏差的 softmax 回归,它使用启发式成本函数来减少无效的探索时间,从而加速收敛。此外,A2C 算法与经验回放相结合,可以更好地捕捉机器人与障碍物之间复杂的相互作用。这些优化使 RL 对于室内 AMR 更加可行和高效,使它们能够不断优化定位策略,有效避开障碍物,并根据环境变化实时调整路径规划。

图 4.基于DRL 的室内定位结构图。基于 DRL 的室内定位框架示意图,突出显示了静态和动态环境条件下传感器观测、神经网络推理、策略学习和奖励机制之间的相互作用。

3.3 .深度学习

深度学习在室内自主移动机器人 (AMR) 中扮演着不可或缺的角色,它为感知、特征提取以及集成学习和决策系统提供强有力的支持,使其能够更好地适应动态复杂的环境。深度学习通过迁移学习,有效地将从模拟中获得的知识应用到现实场景中,弥合“现实差距”。如图 5所示,用于室内机器人定位的深度学习框架展示了深度学习技术与定位过程的集成。该框架分为两个部分:模拟和现实,分别针对任务的不同方面。

在模拟组件中,几何特征()从输入数据中提取,以捕捉环境的空间结构。这些特征通过特征学习模块()生成高级表示,输出()提供机器人位置的初步估计。

在现实组件中,通过特征提取来处理实时数据() 和优化模块 ()来使学习到的特征适应真实环境。这个过程产生了精细的输出(和)来提高定位精度。模拟与现实之间的反馈确保框架能够适应模拟数据和真实世界数据之间的差异,从而提高鲁棒性。

该框架展示了如何结合基于模拟的训练和现实世界的适应来解决室内机器人定位中的挑战,利用 DL 的分层特征提取和迭代学习能力。

文献表明,深度学习在解决机器人定位中的感知不确定性方面展现出巨大潜力。例如,CNN能够高效处理来自环境的传感器数据,提供精确的物体识别和语义理解,这对于室内定位至关重要。深度学习利用深度神经网络的特征提取能力,帮助机器人探索最优路径规划和决策策略,在动态和未知的室内环境中表现出色。

GAN通过生成逼真的模拟环境和数据来支持大规模虚拟训练,从而降低在现实环境中进行训练的成本和风险。此外,将深度学习与不确定性估计方法(例如贝叶斯方法)相结合,可以增强机器人在复杂室内环境中的决策信心,从而更好地平衡感知信息和环境交互,最终提高导航和路径规划的可靠性。

图 5.室内AMR 定位的深度学习框架。该图展示了一个用于室内机器人定位的仿真-现实集成深度学习框架。该框架结合了基于仿真的特征学习和实时自适应技术,以解决模拟数据与真实世界数据之间的差异。反馈机制通过迭代改进来提高定位精度和鲁棒性。

如图 6所示,结果凸显了各种特征提取方法在室内环境中的性能。几何方法(例如 ORB-SLAM2(图 6(a))依赖于手工制作的特征,在结构化环境中提供了可靠的性能。ORB-SLAM3(图 6(b))在此方法的基础上,通过逐步改进特征匹配,在特定条件下增强了鲁棒性。然而,这些几何方法在动态且混乱的室内环境中往往表现不佳,手工制作的特征可能无法有效地泛化。

相比之下,基于 DL 的方法在复杂和动态环境中表现出了出色的适应性和鲁棒性。深度学习增强型SLAM(DXSLAM)图 6(c)集成了 DL 增强功能,有效地结合了几何和语义信息,以解决动态和非结构化场景带来的挑战。几何对应网络 v2(GCNv2)图 6(d)作为一种基于图的神经网络,擅长捕捉复杂的空间关系,即使在高度非结构化的环境中也能实现密集而鲁棒的特征提取。例如,在图像的右上角(键盘区域),这两个图表明 DL 产生了更密集、更丰富的特征集,突显了其捕捉复杂空间关系和提取详细图像信息的卓越能力。这种增强的特征提取能力对于在具有挑战性的室内环境中实现准确可靠的定位至关重要。

图 6。AM中使用的特征提取方法的说明性示例。(a)使用 ORB-SLAM2的特征提取结果,(b)来自 ORB-SLAM3的结果,(c)由 DXSLAM提取的特征,以及(d)来自 GCNv2的特征。这些图像突出显示了从几何方法到基于 DL 的方法的进展,证明了基于 DL 的技术在提取密集和鲁棒特征方面的卓越性能。

3.3.1 .卷积神经网络(CNN)

CNN是一种深度学习模型,它通过卷积运算直接从原始数据中提取特征,广泛应用于机器人领域的图像分类、目标检测和图像分割任务。它会分析输入图像或数据集,识别图像的关键特征,并区分各个元素。CNN 在机器人定位能力方面取得了显著进步,尤其是在 SLAM 特征提取方面,其匹配精度优于 Oriented FAST 和 Rotated BRIEF (ORB) 等传统方法。虽然 ORB 在某些情况下表现良好,但对于复杂场景、光照变化和视点变化较大的情况,其匹配精度和鲁棒性可能不足。

最近的研究证明了其显著的性能优势。例如,SuperPoint 通过学习图像中的特征点和描述符,显著提高了匹配准确率,比传统方法提高了 10% 到 30%。通过从海量数据中学习更复杂、更抽象的特征表示,CNN 有助于提高机器人定位的准确性和可靠性。

CNN 也已用于各种机器人系统中基于视觉的定位等功能。研究人员展示了CNN 架构如何将低成本 MR 传感器与单目摄像机图像和扩展卡尔曼滤波器(EKF) 数据相结合以实现精确定位。CNN 可应用于分类、避障、视觉里程计 (VO) 和其他定位过程等任务。然而,CNN 的缺点之一是其计算成本高,这对机器人技术提出了重大挑战,因为机器人通常在高度动态的环境中操作。缓慢的定位框架会在控制回路中引入延迟,使机器人难以快速响应环境变化。

3.3.2 .生成对抗网络(GAN)

GAN 是一类深度学习模型,旨在生成与给定训练数据集高度相似的新数据实例。例如,基于图像训练的 GAN 可以生成捕捉多种自然特征的新图像,使其在视觉上令人信服。在机器人和定位应用中,GAN 已被用于减少复杂行为学习过程中对大量人工反馈的依赖。

在机器人定位和控制策略开发的背景下,GAN 通过生成真实的模拟环境和行为数据提供了一种有效的工具。这种能力使机器人能够更好地了解周围环境并制定精确的定位和导航策略,特别是在复杂的室内环境中。此外,GAN 在确保面临定位攻击的移动机器人的稳健运动规划方面发挥了至关重要的作用。通过生成潜在的机器人位置,GAN 可以纠正受损的数据,使机器人能够在对抗环境中保持准确的定位和导航,从而实现安全、无碰撞的运动规划。这种方法显著增强了机器人运动规划在恶劣条件下的稳健性,强调了 GAN 在改善移动机器人定位和确保操作安全方面的重要性。

近年来,人工智能在移动机器人室内定位与导航领域取得了显著进展。研究人员探索了各种基于人工智能的方法,包括深度学习、强化学习、机器学习和多传感器融合,旨在提高定位精度和导航性能,同时减少对高精度传感器和特定硬件的依赖。

3.4 .基于人工智能的进化方法

基于人工智能的进化方法 (EM) 在提升AMR定位性能方面展现出巨大潜力。这些方法利用仿生优化技术来解决室内导航和定位中固有的复杂、非线性和多目标挑战。定位和路径规划本质上是相互关联的过程:精确的定位提供有效路径规划所需的空间数据,而优化的路径可以减轻不必要的操作、传感器噪声或动态环境变化造成的定位误差。通过将进化算法集成到定位框架中,AMR 可以在具有挑战性的环境中实现更高的精度、稳健性和适应性。路径规划方法大致可分为两类:

•基于人工智能的进化算法,包括蚁群优化算法(ACO)、遗传算法(GA)、粒子群优化算法(PSO)、布谷鸟搜索算法(CSA)、灰狼优化算法(GWO)和鲸鱼优化算法(WOA),已被证明能有效解决各种路径规划难题。这些算法在非线性和多目标优化任务中表现出色,例如最小化能耗或避开动态障碍物。例如,PSO 已成功应用于静态环境路径规划,并取得了显著的效果。通过修改信息素扩散梯度公式和回溯策略,ACO 可以在复杂环境中得到增强。CSA 已用于未知集群环境中的移动机器人导航,重点是训练前提部分。在无人机的三维路径规划场景中,GWO 表现出了优于 PSO 的性能。此外,一项比较研究表明,WOA 在二维路径规划任务中的表现优于 CSA 和 PSO。

•传统的基于图的搜索算法,例如 Dijkstra 算法(DA)和 A* 算法,广泛应用于具有预定义图表示的结构化环境,例如仓库或自动导引车(AGV)。

综上所述,基于人工智能的进化路径规划方法和传统的路径规划方法都通过提高导航效率和最小化误差来补充定位。虽然路径规划间接影响定位精度,但其在确保无缝导航方面发挥着至关重要的作用。有关路径优化技术的全面讨论,请参阅专门的综述。

4.基于AI的地面AMR定位方法

4.1 .基于AI的AMR无里程计和SLAM定位

Sun 等利用 CNN 从单目图像预测深度信息,实现了适用于 GPS 信号不可靠区域的三维 LiDAR 地图内的摄像机定位。然而,该方法在光照变化和图像质量较差的情况下表现出局限性。为了减少对高精度传感器的依赖,Foroughi 等在小型数据集上使用 CNN,设计了一种新的损失函数来增强模型泛化能力,但有限的数据集大小限制了模型的鲁棒性。Ballesta 等将全景图像与 CNN 相结合,实现了分层定位,提高了房间级精度,但仍然对图像质量较为敏感。

为了提高定位精度,李等采用YOLOv5和多层感知器(MLP),实现了误差小于 10 cm 的高精度定位,但在复杂环境下仍存在局限性。随后,李等融合分层语义信息,提出一种基于上下文向量和知识图谱的视觉导航方法,增强模型在未知环境中的泛化能力。赵等提出了智能室内超表面机器人 (I2MR),通过集中式微波感知增强定位能力并降低计算需求。俞等提出了 Relo-Net 来解决“机器人被绑架问题”,利用 2D LiDAR 进行高精度室内场景分类和重定位,但仍然对环境变化较为敏感。

在视觉导航领域,Ran 等利用浅层 CNN 和自适应加权控制算法来提升导航性能,但在动态环境中性能有限。Wu 等提出了生成模仿学习 (GIL),通过预测下一个预期观测值来提高导航成功率和路径效率。尽管计算需求增加,但这种方法显著提高了目标驱动导航的决策鲁棒性。Kulhánek 等提出了一个端到端深度强化学习框架,实现了实时导航和对非结构化环境的适应性。

在强化学习领域,Sleaman 和 Yavuz采用深度 CNN 实现自主导航,但在动态环境中性能有限。Fang 等将深度 RL 与模仿学习相结合,以提高导航性能。Lee 和 Yusuf应用DQN和双深度 Q 网络 (DDQN) 算法实现自主导航和避障,其中 DDQN 提高了稳定性。Bezerra 等将EKF与 DQN相结合,以提高导航效率。Li 等提出了一种基于PPO和门控循环单元(GRU) 的主动嗅觉定位方法,提高了复杂环境下的定位效率。

在机器学习方法中,Klein 等人使用随机森林回归器进行毫米级定位,但受到标记精度的限制。Wang 等人利用弱监督学习进行相对定位,减少了对精确地理信息的依赖,但在较大空间中性能有限。Ye 等人提出了一种针对家庭服务机器人的算法,该算法集成了图像去模糊和物体检测技术,以提高目标识别的精度和速度。

其他研究,例如 Chiang 等人,将磁场特征与深度神经网络相结合,用于室内物体定位,适用于富含金属的环境。Zou 等人使用 GAN 重建 WiFi 信号,提高了定位自动化程度。Capra 等人将超宽带定位系统与家用机器人相结合,用于老年人跌倒检测,提高了定位精度,但成本也更高。

在多传感器融合方面,李等融合了 2D LiDAR 和 IMU 数据,以增强定位的鲁棒性。蔡等采用卡尔曼滤波融合各种传感器数据,实现多机器人协作定位。曾等提出了一种受神经生物学启发的贝叶斯吸引子网络 (BAN) 模型,以降低计算复杂度。李等提出了一种基于语义角点特征的自适应蒙特卡洛定位方法,提高了重定位速度和鲁棒性。Papadaki 和 Pateraki利用深度学习在汽车装配中进行 6D 物体定位,有效地处理了反光和遮挡。陈等提出了一种仰视视觉室内定位方法,使用 YOLO V7 来提高地标检测精度并减少隐私问题。

Jia 等提出了一种上下文感知的多层信息融合系统来提高障碍物检测的准确性,但在快速变化的环境中性能有限。Popovic 等提出了一种基于 RGB-D 图像的深度完成算法,改进了占用图和导航地图的完整性,但对 RGB-D 摄像机的依赖限制了其适用性。Miranda-Vega 等提出了一种基于去模糊化算法 (DFA) 的光学扫描系统(OSS) 定位方法,显著提高了工业机器人室内定位的准确性和鲁棒性。实验结果表明,该方法效果最佳,实现了 0.021° 的最小定位误差,证实了去模糊化算法在室内定位中的有效性。

综上所述,人工智能在移动机器人室内定位与导航方面取得了显著进展。早期研究在提高定位精度和导航性能方面取得了突破,但面临着依赖高精度传感器、计算成本高、对环境敏感等挑战。后续研究引入了新方法和改进算法,如将RL与模仿学习、多视图信息融合、弱监督学习相结合,逐渐克服了这些限制,提高了模型泛化能力和计算效率。然而,还需要进一步研究以实现更高的鲁棒性、减少对硬件的依赖、增强系统的灵活性和可扩展性。表4总结了不依赖里程计和SLAM的基于AI的方法。

表 4.基于AI 的无里程计和 SLAM 定位技术总结。

4.2 .用于AMR的AI增强SLAM

SLAM 结合了定位(确定机器人的位置和方向)和建图(构建环境地图)两项任务。这种双重能力使得 SLAM 成为未知或动态环境中导航不可或缺的一部分。虽然定位是 SLAM 的核心组成部分,但它对建图的额外关注使其有别于那些仅仅致力于在预先绘制地图的环境中实现精确定位的独立定位技术。

基于人工智能的 SLAM 技术利用 DL、RL 和计算机视觉等先进的计算方法,彻底改变了传统方法。这些基于人工智能的技术显著增强了 SLAM 系统感知、解释和与复杂环境交互的能力。与几何或基于特征的 SLAM 不同,基于人工智能的 SLAM 擅长处理动态障碍物、环境噪声和模糊视觉特征等挑战。基于人工智能的 SLAM 的核心是对象跟踪、语义映射和传感器数据增强等技术,这些技术使系统能够自适应地响应环境变化并支持广泛的应用,包括 AMR、工厂自动化、智能农业和自动驾驶。如图 7所示,这些能力使基于人工智能的 SLAM 成为下一代自主系统。

在AMR领域,基于AI的SLAM在提升定位精度和鲁棒性方面具有显著优势。通过集成语义地图,AMR可以区分静态和动态物体,从而提高导航效率和避障能力。基于AI的多传感器融合技术通过整合来自激光雷达、摄像头和惯性测量单元(IMU)的数据,进一步提升性能,并有效应对传感器噪声、遮挡和视野受限等挑战。这些创新技术即使在传统SLAM系统经常失效的动态、杂乱或低能见度环境中也能确保可靠的定位。

虽然地图绘制本质上是 SLAM 的一部分,但本研究主要关注 SLAM 的定位能力,地图绘制则被视为次要目标。基于 AI 的 SLAM 与多传感器融合的结合,使 AMR 能够在复杂的室内环境中实现高精度定位。以下小节将探讨具体的 AI 增强 SLAM 方法,包括 VSLAM、LiDAR SLAM 以及多传感器融合集成,以应对 AMR 定位的挑战。

图7.基于AI的SLAM的应用和核心组件。

4.2.1 .AMR 的视觉 SLAM(VSLAM)

VSLAM 是 AMR 的基础技术,使其能够构建环境地图并利用视觉数据进行自我定位。传统的 VSLAM 方法依赖于从图像中提取的几何特征,在光照变化、动态障碍物或缺乏独特特征的环境中,这些特征可能会丢失并导致定位不稳定。为了克服这些局限性,VSLAM 中已经集成了多种技术,以增强特征提取和环境适应性。深度学习模型(尤其是 CNN)擅长从图像中提取丰富的高级特征,从而克服了传统几何特征的限制。这种集成使 VSLAM 系统即使在动态环境以及光照和天气等变化条件下也能保持稳定的定位。结合回环检测和动态障碍物识别算法,可以实现实时地图更新,从而增强 VSLAM 系统在复杂环境中的可靠性。

许多研究利用深度学习来提升 VSLAM 性能。Li 等人提出了一种 DXSLAM,Jin 等人开发了一种新颖的 VSLAM 框架,该框架利用对抗性迁移学习(ATL) 来提高动态环境中的定位精度。该框架集成了基于 ATL 的无监督语义分割来过滤动态特征并减少领域差异,与传统方法相比,显著提高了 VSLAM 系统的性能;Li 等人提出了 DeepSLAM。这些工作采用深度学习模型进行特征提取和回环检测,显著增强了动态场景下的鲁棒性和适应性。通过解决传统 SLAM 方法在光照变化和动态物体干扰下的不足,这些研究为复杂室内环境下的自主定位提供了技术支持。DynaSLAM 系列,包括 DynaSLAM和 DynaSLAM II,充当 SLAM 领域的深度学习。它结合了动态物体检测和背景恢复技术,进一步提高了动态场景下的性能。此外,Cui 等人提出了一种基于改进的 ORB-SLAM2 的3D 语义地图系统,实现了适用于服务机器人的低资源环境下高效的三维语义地图构建。Teed 和 Deng提出了 DROID-SLAM,这是一个用于单目、立体和 RGB-D 相机的深度视觉 SLAM 系统,它集成了用于迭代姿态和深度优化的卷积门控循环单元 (CGRU) 以及用于特征提取的 CNN。该系统结合了密集的捆绑调整来优化相机姿态和深度,与 ORB-SLAM3 相比,在鲁棒性和准确性方面取得了显着的提升,尤其是在动态场景和使用 RGB-D 等多模态数据的情况下。尽管取得了这些进步,但该方法的高计算开销对实时应用提出了挑战。

将深度学习与多模态数据相结合,使 SLAM 系统能够增强对环境的语义理解。Tao 等人提出了一种基于掩模评分区域的 CNN (R-CNN)的 3D 语义 VSLAM 方法,该方法将语义分割与改进的 ORB-SLAM2 相结合,以提高在复杂室内环境中的建图精度。同样地,Yang 等人开发了 SDF-SLAM,融合深度和语义信息,为家庭和服务机器人提供强大的环境理解。动态环境对 SLAM 系统提出了重大挑战。Sun 等人提出了一种基于深度学习和 VSLAM 的多目标定位与建图方法,有效地处理动态场景。An 等人引入了一种涉及深度特征和邻域图的增量式回环检测方法,以提高大规模环境中的回环效率和精度。

对于低功耗和资源受限设备上的 SLAM 应用,Tang 等人提出了GCNv2 模型,该模型支持在嵌入式设备上运行,可实现室内环境中无人机和轻型机器人的高效自主导航。Masuda 等人开发了一种神经隐式事件生成器来解决低光和高速场景下的动态跟踪问题,扩展了 SLAM 系统在极端环境下的适应性。为了增强 SLAM 系统在复杂室内环境中的结构映射能力,Liao 等人提出了 SO-SLAM,结合了尺度和对称纹理约束。Chen 等人提出了精确物体关联和姿态更新的方法,集成了公平多物体跟踪 (FairMOT) 进行实时多物体跟踪。通过增强物体关联和姿态细化,该系统显着提高了室内环境中的定位精度和鲁棒性,特别是对于服务机器人应用。提出了一种基于深度学习特征的单目视觉SLAM方法(LIFT-SLAM),将DL与VSLAM相结合,在嘈杂环境和动态场景中表现出优异的性能。

Li 等人提出了一种基于 AI 基础模型的 VSLAM 回环消歧方法,解决了重复环境中的混淆问题,提高了 SLAM 系统的可靠性。这些进步有助于提高 SLAM 系统在实际应用中的鲁棒性,因为实际应用中的条件可能差别很大。提出了一种创新的基于 AI 的室内定位方法,特别是一种基于深度学习的视觉 SLAM 系统,该系统利用多任务特征提取网络和自监督特征点,以提高在复杂环境中的准确性和稳定性。提出了一种基于 AI 的 SLAM 室内定位方法,利用 DeconvNet 和局部连接的自动编码器(LCA) 提取低维特征表示,从而提高机器人应用中回环检测的准确性和速度。

基于人工智能的方法利用激光雷达数据解决了动态环境适应、传感器融合和轨迹优化等难题,显著推进了室内 SLAM 的发展。Bian 等采用粒子群优化 (PSO)和多目标粒子群优化(MO-PSO) 来增强 FastSLAM,在复杂的室内环境中实现了卓越的实时性能和定位精度。Zeng 等利用遗传算法 (GA)优化自适应蒙特卡洛定位 (AMCL),并将其与人工地标相结合,以提高使用 2D 激光雷达在特征稀疏场景下的定位鲁棒性。同样,Fusic 等将自适应粒子群优化 (PSO) 与 Hector SLAM 相结合,显著提高了动态条件下的实时建图和导航能力。Nedjah 等应用群体智能和混合遗传算法 (GA) 方法来优化 SLAM,依靠激光雷达数据在高度动态的环境中实现精确、高效的定位。

总而言之,基于人工智能的定位方法将深度学习、对抗性迁移学习和自监督学习与多模态数据相结合,显著推动了 VSLAM 领域的发展。这些技术弥补了传统 SLAM 在动态复杂环境中的不足,提高了系统的实时性、适应性和鲁棒性。这些研究为 AMR 在室内环境下的精准导航和环境感知奠定了坚实的基础,推动了 AMR 在服务机器人和智能家居领域的应用。

4.2.2 .用于AMR的LiDAR SLAM

基于激光雷达的 SLAM 利用激光雷达传感器获取点云数据,实现环境建图和姿态估计。然而,在复杂的光照条件和动态环境下,激光雷达 SLAM 可能会面临数据丢失等挑战。在近期的 SLAM 研究中,基于人工智能的深度学习方法已被广泛应用,以提升激光雷达 SLAM 系统的鲁棒性和准确性。

Chen 等人开发了一种用于室内 LiDAR SLAM 的结构语义引导 LiDAR 超分辨率网络 (SGSR-Net),可生成高密度、结构感知的点云。这显著提高了复杂室内场景下 SLAM 的精度和稳定性。然而,SGSR-Net 对高性能硬件的依赖限制了其在资源受限环境中的适用性。

综上所述,基于AI的深度学习方法不断发展,以应对LiDAR SLAM中的各种挑战,从增强点云分割和回环检测,到多源数据融合和超分辨率增强。这些进步展现了LiDAR SLAM在复杂环境中的巨大潜力。表5总结了各种基于AI的SLAM算法及其相关细节。

表5.各种基于AI的SLAM算法及相关细节的总结。

H = 高,M = 中,L = 低。

4.2.3多传感器融合增强AMR的SLAM定位

集成多种传感器(例如视觉摄像头、激光雷达和惯性测量单元)的 SLAM 系统,通过充分利用每个传感器的优势来提升稳健性和准确性,显著提升了室内定位技术。人工智能技术(尤其是机器学习和深度学习)的结合,在有效融合数据、纠正错误和适应动态环境方面发挥着至关重要的作用。

Chen 和 Hong开发了一种融合激光雷达和视觉数据的四足机器人系统,增强了复杂室内地形的环境感知。同样,Singh 等人在主动 SLAM 框架内集成了立体视觉摄像头和超声波传感器,利用人工智能进行障碍物检测和深度感知,改善了社交环境中的导航和地图绘制。Uganya 等人通过将激光雷达数据与机器学习方法相结合,进一步推进了多传感器融合,通过基于人工智能的数据集成,在各种室内环境中实现了更高的精度和适应性。

Saputra 等人提出了一种热惯性 SLAM 系统,该系统利用概率神经网络(PNN) 进行特征提取,并利用混合密度网络 (MDN) 进行不确定性感知的姿态估计。这种方法显著提高了低光照和低特征环境下的定位精度。Liu 等人通过整合 IMU 数据并使用 YOLOv5 进行动态物体检测,增强了视觉 SLAM 的性能,从而通过基于深度学习的运动补偿提高了动态和模糊室内环境中的定位精度。

Zhou 等提出了融合 SLAM (FSLAM),这是一种紧密耦合的视觉-激光雷达系统,它集成了分层特征网络 (HF-Net),用于分层特征提取和回环检测。通过利用 HF-Net 提取局部和全局特征的能力,该系统显著提高了地图建图的可靠性和定位精度,尤其是在特征稀缺的环境中。Ramezani 等提出了一种激光雷达-惯性 SLAM 系统,它集成了高效段匹配 (ESM),这是一种基于深度学习的回环检测方法,利用深度学习的点云描述符。通过学习复杂模式并识别先前访问过的位置,ESM 显著提高了工业室内环境中的定位精度和地图建图的可靠性。

利用多传感器融合的基于人工智能的方法,通过提高动态和复杂环境中的准确性、鲁棒性和适应性,显著提高了 SLAM 性能。Nam 等人提出了室内导航深度强化学习 SLAM (iNAV-drlSLAM),这是一个结合 DRL 和ACO 的框架,利用激光雷达和摄像头数据增强动态障碍物密集环境中的 SLAM。Xie 等人开发了一个多机器人 SLAM 框架,利用 GA 进行全局路径优化,利用 DRL 进行实时避障,通过融合激光雷达和 IMU 数据有效地协调多个机器人。Tang 等人进一步证明了基于人工智能的方法在利用多传感器输入优化 SLAM 方面的潜力,确保在部分已知的环境中实现精确高效的定位。

总体而言,这些研究强调了人工智能在室内 SLAM 多传感器融合中的关键作用,展现出其增强的鲁棒性、准确性和适应性。通过有效整合各种传感器数据并利用先进的人工智能技术,这些基于人工智能的 SLAM 系统能够应对动态复杂室内环境的挑战,为更可靠、更高效的自主导航和地图绘制解决方案铺平道路。

4.3 .基于AI增强里程计的AMR定位

4.3.1 .AMR的航位推算方法(DR)

传统里程计中的DR方法主要依靠IMU、车轮编码器等传感器数据,通过积分运动参数进行位置估计。然而,这些方法在复杂动态环境中往往面临精度下降、鲁棒性不足等挑战。这主要是由于IMU数据中固有的噪声和偏差,导致长期定位过程中累积误差较大。基于AI的DR利用ML和DL技术,实现多源传感器数据的高级融合与分析,提升定位精度和对复杂环境的适应性。例如,利用CNN处理IMU和车轮编码器数据可以更有效地滤除噪声和误差,提供更稳定的位置信息。此外,基于AI的方法可以学习和适应不同的运动模式和环境变化,从而减少对高精度传感器的依赖。然而,这些方法也面临着需要大量训练数据和高计算资源等挑战。因此,在保证实时性的同时优化模型性能成为当前的研究重点。

近年来,人工智能增强型DR方法的研究主要集中在几个关键领域。首先,在INS的增强方面,Hurwitz等人研究了如何使用人工智能辅助INS在GNSS信号中断期间实现精确定位。他们引入了一种混合DL-惯性融合滤波器,利用CNN来提高IMU在周期性运动期间的定位精度。他们的方法被称为惯性加权航位推算(DR-IW),验证了人工智能增强型DR在没有外部参考的情况下的有效性,并提高了传感器融合能力。

其次,针对低成本IMU在DR中的应用挑战,Guo等将模型驱动方法与深度学习方法相结合,利用不变扩展卡尔曼滤波器(InEKF)和深度学习模型来提高IMU的精度。这种方法在降低成本的同时提高了定位性能,从而拓宽了人工智能增强型DR的应用范围。同时,Brossard等提出了一种基于深度学习的IMU陀螺仪去噪方法。他们利用CNN消除IMU数据中的噪声和偏差,实现了精确的姿态估计,其性能优于一些主流惯性导航系统。这进一步证明了深度学习在DR方法中处理IMU数据的能力。

最后,Li 等人使用全连接神经网络 (FCNN) 将里程计数据与激光雷达数据融合,提高了室内 AMR 定位精度。他们利用 DR 获取初步里程计信息,并将其与 FCNN 中的激光雷达数据相结合,有效利用网络的非线性映射和自适应学习能力来补偿传感器误差。这种方法实现了厘米级的定位精度,显著优于传统的概率方法。该研究凸显了基于人工智能的 FCNN 在推进基于 DR 的室内移动机器人定位方法方面的潜力。

综上所述,AI增强型DR方法通过深度学习方法有效解决了IMU和车轮编码器数据中的噪声和漂移问题,从而实现了多传感器融合和经济高效的应用。这些研究表明,AI方法不仅提高了传感器数据的利用效率,而且显著增强了系统整体的定位精度和鲁棒性。然而,基于AI的DR方法也面临着需要大量训练数据和高计算资源等挑战。因此,未来的研究应侧重于探索AI与其他滤波器或定位方法的深度融合,在保证实时性的同时优化模型性能,从而不断提升DR方法的定位能力。

4.3.2基于视觉的AMR里程计

视觉里程计(VO)通过追踪图像特征来估算机器人的运动轨迹,但它容易出现累积误差,并且在长期运行中面临着动态环境的挑战。为了突破这些局限性,近期的研究进展主要集中在改进特征提取、通过稳健的优化技术减少漂移,以及集成特定领域的增强功能,以使视觉里程计能够适应复杂场景。

近年来,视觉里程计 (VO) 在室内机器人导航领域取得了显著进展,尤其是在深度学习 (DL) 的推动下。这些发展有助于克服传统几何方法在复杂动态环境中的一些局限性。深度学习模型可以学习稳健的特征表示和运动模式。这种集成提升了里程计估计的性能,使机器人能够在具有挑战性的条件下更有效地导航。

自 2019 年起,Liang 等人提出了 SalientDSO,首次将视觉显著性与直接稀疏视觉里程计 (VO) 相结合,通过移除信息量较低的特征点来提高视觉里程计的鲁棒性和准确性。这项工作为深度学习应用于特征选择奠定了基础,显著提升了视觉里程计的性能;然而,它仍然局限于直接方法,缺乏对深度信息等多模态数据的有效利用。

为了进一步增强环境感知,Zhang 等将 RGB-D 摄像机与深度学习相结合,以提高动态环境中的视觉里程计 (VO) 性能。RGB-D 摄像机提供丰富的深度信息,能够在特征匹配过程中更有效地处理环境动态。虽然该方法提高了视觉里程计的鲁棒性,但它高度依赖于传感器质量,限制了其在深度信息不完整或噪声环境中的性能。

为了应对视觉里程计在复杂现实环境中的泛化挑战,Wang 等人提出了 TartanVO,通过在多样化数据集上进行训练,显著提升了视觉里程计的泛化能力。这一突破使 TartanVO 能够在不同数据集上保持稳健的性能,为视觉里程计的普遍适用性奠定了基础。然而,该模型的有效性依赖于大量的标记数据,并且在完全未知的环境中泛化能力仍然有限。

在此基础上,Kim 等人在同步视觉里程计、目标检测和实例分割(SimVODIS++) 网络的基础上,引入了一种新颖的神经语义视觉里程计架构,将多任务学习与注意力机制相结合,使系统能够识别和处理动态场景中的关键目标。SimVODIS++ 不仅提高了系统准确率,还展现了在动态环境中聚焦显著区域的能力,从而在复杂场景中表现出色。然而,计算需求的增加使得在资源受限的设备上部署它变得具有挑战性。

为了进一步优化动态场景中的视觉里程计性能,Shen 等提出了基于学习的动态视觉里程计 (DytanVO),该方法联合优化了摄像机自运动和运动分割,以应对动态物体的干扰。该方法通过优化摄像机运动与分割结果之间的相互依赖性,显著提高了动态环境下的轨迹估计精度。尽管训练和优化过程需要大量资源,但联合优化有效地解决了先前研究中动态物体处理能力不足的问题。

为了减少对标记数据的依赖,曹等提出了一种集成动作的无监督视觉里程计 (VO) 用于导航。该系统结合了路径积分,减少了对 GPS 等外部定位系统的依赖,从而能够高效地执行室内导航任务。无监督方法为视觉里程计训练提供了新的方向,但其路径积分方法在长期运行过程中容易出现累积误差,从而可能导致精度下降。

为了进一步探索如何降低数据需求,Ghafourian 等人提出了一种少样本学习视觉导航系统。该方法使用少量的视觉地标样本来引导导航,即使没有大量标记数据也能实现有效的性能。虽然该方法在降低训练数据需求方面表现出色,但其灵活性和对复杂场景变化的适应性仍需进一步改进。

Kostusiak 等利用深度学习增强 RGB-D 视觉里程计 (VO) 中的深度信息,解决了深度传感器数据质量低的问题,使低成本传感器能够实现高精度轨迹估计。这项工作使得廉价传感器应用于视觉里程计成为可能,但仍需进一步改进,以增强系统在深度信息缺失或噪声情况下的鲁棒性。

Prasad 等人提出了基于运动结构学习器 (SfMLearner++),这是一种基于人工智能的室内机器人定位方法。该方法采用深度学习进行单目深度和自运动估计,并结合几何约束来提高准确性,使其适用于室内环境。

GANVO和堆叠生成对抗网络 (SGANVO)分别利用 GAN 进行无监督单目深度和六自由度相机运动预测,以此为例展示了这种方法。GANVO 可以有效地处理RGB 图像序列;然而,由于难以捕捉随时间变化的特征,其在动态场景中性能会下降。SGANVO 通过堆叠 GAN 层来缓解这一限制,从而改进了对时间动态的捕捉,并提升了在运动剧烈的环境中的性能。

最后,Eirale 等人开发了 Marvin,这是一款模块化的全向辅助机器人,旨在在复杂的家庭环境中实现灵活导航。Marvin 集成了轻量级人工智能算法,并在狭窄空间内展现出高效的导航能力。然而,它主要面向家庭应用,其对更复杂环境的适应性和可扩展性需要进一步验证。

4.3.3 .基于里程计的多传感器融合AMR定位

近年来,基于融合的里程计取得了重大进展,这主要得益于深度学习的发展。这些现代方法采用端到端深度神经网络,无需传统方法中固有的手工特征提取。因此,它们表现出增强的准确性和鲁棒性,特别是在复杂环境中。如图 8所示,通用多传感器里程计框架结合了来自各种传感器的数据,以增强运动估计的鲁棒性和准确性。尽管如此,在实际应用中仍然存在某些局限性。为了便于全面理解,我们根据核心方法和技术的相似性对相关研究进行了分类。通过整合和总结类似的研究,我们系统地阐明了每种方法的缺点和后续改进。

视觉-惯性里程计 (VIO) 融合的最新进展利用 GAN 和其他深度学习方法来增强深度和自我运动估计,同时减少对标记数据集的依赖。值得注意的是,SelfVIO将 GAN 与自监督学习相结合,无需标记数据即可进行单目 VIO 和深度估计。尽管 SelfVIO 拥有创新的框架,但在复杂场景下鲁棒性有限,这促使人们探索堆叠GAN 架构,以在挑战性条件下提升性能。作为基于 GAN 方法的补充,DeepVIO和鲁棒神经惯性导航辅助 VIO (RNIN-VIO)等方法结合了视觉和惯性传感器数据,以提高里程计精度。DeepVIO 利用 CNN 和LSTM网络从立体序列中学习三维几何约束;然而,它在低纹理环境下面临鲁棒性问题。

图8.基于人工智能的通用多传感器里程计框架。

DR = 航位推算。

为了解决这些限制,RNIN-VIO 集成了 IMU 数据,从而提高了在低纹理和动态环境中的性能。基于这些进步,(ATVIO) 注意力引导的视觉-惯性里程计引入了一种注意力机制来改进视觉和惯性数据的融合过程,有效地克服了传统融合方法在异构环境中的限制,提高了里程计的准确性和可靠性。VIOLearner进一步提高了系统鲁棒性,它包含一个在线纠错模块。虽然这一新增功能增强了鲁棒性,但 VIOLearner 在长时间跟踪过程中仍然面临误差累积的问题,这表明在长期应用中需要进一步改进。

为了应对计算挑战,CodeVIO采用条件变分自编码器 (CVAE) 进行密集深度推理,并结合 VIO 系统生成详细的深度图。尽管该方法有效,但需要大量的计算资源;后续的轻量级变体有助于实现实时深度和运动估计,同时降低计算开销。基于学习的方法的进步进一步促进了该领域的发展。基于学习的单目 VIO结合了卷积神经网络和循环神经网络,通过滤波器融合实现高精度轨迹估计。该方法最初的特点是训练复杂度较高,后续的优化简化了训练过程,从而增强了其在实际应用中的实用性。

此外,自举单目视觉输入输出 (BooM-VIO)将传统的视觉输入输出尺度估计与端到端深度学习训练相结合。尽管传统的尺度信息在恶劣环境下可能不可靠,但深度学习模型对尺度理解的改进显著提升了 BooM-VIO 在挑战性条件下的性能。此外,提出了一种基于人工智能的室内机器人定位解决方案,引入了一个集成卷积神经网络和循环神经网络的无监督框架,将单目视觉数据与惯性测量单元 (IMU) 测量数据融合。该方法创新地估计了深度图和自运动,同时解决了误差累积和数据污染等难题,从而有效地增强了室内定位能力,而无需依赖标记的地面实况数据。

总的来说,这些进展凸显了VIO融合技术的重大进展,每项技术都通过创新的神经网络架构和数据融合策略解决了特定的局限性。未来的研究有望进一步增强鲁棒性,降低计算复杂度,并提高长期跟踪精度,从而满足日益复杂和动态的环境需求。

在LIO融合下,LO-Net将CNN与自监督学习相结合,用于LiDAR姿态估计,适用于稀疏特征和动态环境。然而,在稀疏特征场景下,其准确率仍然会下降。通过优化网络架构,可以更好地捕捉稀疏特征,从而取得了一些改进。

为了扩展多传感器融合方法,紧学习惯性里程计 (TLIO)采用紧耦合的扩展卡尔曼滤波器框架进行行人状态估计,利用 IMU 数据段实现高效的无摄像头状态估计。然而,TLIO 对 IMU 数据质量较为敏感。引入滤波器优化策略提高了对低质量 IMU 数据的鲁棒性。5G/地磁/VIO 融合定位集成了 5G 信号、地磁信号和 VIO,实现高精度室内定位。通过结合反向传播神经网络 (BPNN) 进行非线性数据融合,该系统有效地组合了多源信号,解决了异质性和非线性难题。此外,优化数据融合算法显著增强了实时多源数据处理能力,提高了定位精度和系统效率。

基于人工智能的进化方法在改进室内定位里程计方面显示出巨大的潜力。Arbabmir 等利用多目标遗传算法 (MO-GA) 优化VINS 中的滤波器参数和传感器校准。该方法通过最小化位置和速度的 RMSE 来提高轨迹精度和鲁棒性,尤其是在动态室内和室外环境中。同样,Sehgal 等引入了 GA 框架来优化 VO 中 LiDAR 和单目摄像机数据融合的参数设置。该方法有效地减少了定位误差,并改善了静态室内环境中的轨迹估计。Palacín 等进一步利用 GA 对里程计系统中的逆运动矩阵进行非参数校准,从而显著提高了定位精度和轨迹估计。

综上所述,以上研究凸显了基于人工智能(AI)的方法(包括进化算法、深度学习和机器学习)在解决里程定位关键挑战方面的多功能性。这些方法有效地解决了传感器融合、轨迹优化和动态环境适应等问题,显著提高了里程计系统的精度和鲁棒性。通过不断改进,这些方法逐步提高了系统在复杂动态室内环境中的适应性和应用潜力。表6全面总结了基于人工智能的AMR里程计算法及其相关细节。

5.基于人工智能的无人机定位

在室内定位场景中,无人机的自主导航尤为重要。基于人工智能的室内定位为无人机提供了精确、实时的环境感知和路径规划能力,对于确保无人机在密闭空间内安全高效地运行至关重要。鉴于室内环境通常具有复杂的结构和障碍物,传统的GPS信号难以穿透,因此室内定位是无人机应用中的一项重大技术挑战。通过人工智能算法,无人机可以融合传感器数据实现自主定位和导航,提高任务精度并提高在动态环境中的适应性。基于人工智能的无人机室内定位对于从精准农业和建筑任务到室内监视任务等各种应用领域的任务完成至关重要。人工智能的集成使无人机能够在不断变化的环境中自主运行,这标志着人工智能成为当前无人机研发的核心方向。

此外,Aslan 等人提出了双向长短期记忆(PSO)和基于目标距离的快速探索随机树星(BiLSTM-PSO-GDRRT)框架,该框架集成了BiLSTM、PSO 和 GDRRT,以增强无人机在复杂三维环境中的路径规划与定位。该框架利用 GDRRT 改进采样策略以加速路径收敛,通过 PSO 优化路径以逼近最短轨迹,并利用 BiLSTM 进行实时路径预测。实验结果表明,该框架显著提高了动态环境下的路径规划效率和定位精度,满足无人机的实时应用需求。

以下章节将回顾各种无人机室内定位技术,包括基于人工智能的方法,例如视觉输入输出 (VIO)、深度学习 (DL) 和强化学习 (RL)。我们将通过研究这些方法在不同应用场景中的创新之处,展示该领域的进展。

5.1 .基于里程计的无人机定位

基于里程计的定位是无人机导航的基础,它利用传感器数据来估算位置和方向随时间的变化。基于人工智能的方法显著推动了这一领域的发展,增强了里程计在传统方法难以应对的挑战性环境中的能力。这些基于人工智能的方法在缺乏GPS信号的情况下至关重要,使无人机能够依靠惯性测量单元(IMU)和摄像头等机载传感器进行精确的状态估计。尽管传统里程计方法潜力巨大,但在动态或视觉效果较差的环境中仍面临挑战,因此需要提高算法的鲁棒性和精度。

最近的研究集中于通过基于人工智能的方法增强DR,以改进无人机定位。Bajwa等人提出了集成CNN的深度惯性速度辅助估计(DIVE)算法。通过直接从IMU测量值推断速度来校正EKF状态估计,DIVE与传统DR相比显著减少了漂移,尤其是在VIO失效的情况下。

类似地,Yang 等提出了学习型惯性航位推算 (IDR) 算法,将左不变扩展卡尔曼滤波 (EKF) 与统计神经网络相结合,以增强在突发光照变化下的 DR 性能。在光照充足的条件下,LIDR 的精度与 VIO 相当,并且在模拟和实际测试中优于其他基于 IMU 的方法。将 LIDR 与 VIO 相结合,进一步提高了动态光照环境下的定位鲁棒性。

除了这些基于人工智能的DR增强技术外,基于里程计的定位方法也得到了广泛的探索。Aslan等人提出了VIONet系统,将高斯过程回归(GPR)与深度学习模型Inception-v3相结合,将惯性数据转换为图像,并将其与光流(OF)帧融合。Inception-v3高效的特征提取显著增强了无人机姿态估计的稳定性,尤其是在具有挑战性的环境中。然而,VIIONet在处理低光或低纹理场景方面存在局限性,并且难以部署在需要更高计算效率的嵌入式设备上。

为了解决上述特征提取效率的局限性,Yu 等人开发了一种更高效的视觉里程计系统,该系统采用轻量级 CNN,包括可变形卷积(DFConv) 和深度可分离卷积(DWConv),显著提高了特征提取效率和系统在嵌入式平台上的适用性。此外,Yu 等人设计了有效的卷积网络,在低光和低纹理的室内环境中取得了优异的性能。然而,该方法仍然存在尺度恢复问题,而尺度恢复对于无人机精确定位尤为重要。

针对前人研究中尺度恢复问题,张等人提出了一种自监督的VIO方法,利用自注意力机制和解耦姿态网络(D-PoseNet)增强IMU数据处理能力,提高尺度恢复精度。该方法通过建立IMU与视觉融合姿态之间的约束关系,有效解决了传统方法中尺度信息缺失的问题,使得无人机在复杂环境中实现更精确的定位。然而,张等人的方法仍然依赖于视觉信息,在完全缺乏视觉数据的场景下性能受限。

为了解决上述适应性问题,Pan 等提出了自适应 VIO,将神经网络与传统的视觉惯性束调整相结合,构建了一个学习-优化集成框架。该方法引入了在线持续学习机制,使系统能够自适应地适应环境变化,从而显著提升了 VIO 系统在不同场景下的泛化能力和定位精度。自适应 VIO 有效地克服了以往研究中观察到的适应性不足的问题,使无人机具有更强的动态适应性和更强的鲁棒性。

总而言之,这些论文展现了一条持续改进的道路,从增强视觉-惯性数据融合、提升嵌入式系统效率,到解决规模恢复、应对视觉故障场景以及提升系统适应性。每一步研究都在前人研究的基础上解决了新的挑战,使基于人工智能的无人机视觉输入输出系统更加精确、稳健和智能。

表7.基于人工智能的无人机定位方法及相关细节的总结。

LZ = 定位,NV = 导航,PP = 路径规划,Q = 四旋翼飞行器,Mr = 多旋翼飞行器。

SR = 搜索和救援,IDR = 惯性导航。

5.2基于多传感器融合的无人机定位

近年来,基于人工智能的无人机在室内定位和导航方面取得了显著进展。当前的研究主要集中于应用深度学习、强化学习和传感器融合技术来应对复杂环境中的目标识别、路径规划和避障等挑战。本节基于关键研究成果,对这些基于人工智能的无人机导航和定位方法进行了分类综述。

深度学习方法在各种环境中都表现出了很高的鲁棒性,这使其特别适合于视觉复杂场景中的目标识别和路径规划。Hsieh 等提出了一种计算复杂度较低的视觉导航方法,专为资源受限的无人机平台而设计。Kim 等利用闭路电视 (CCTV) 系统结合深度学习实现了动态人群感知,这在拥挤的室内环境中非常有效。Oh 等利用集成 CNN 的 PTZ 摄像机进行标记检测,显著降低了室内定位的部署成本。同样,Ekici 等开发了一种仓库无人机系统,该系统在标记特征上采用自适应增强(AdaBoost) 模型,实现了仓库环境中的高精度室内定位和库存跟踪。

Chhikara 等提出了一种深度卷积神经网络 - 遗传算法 (DCNN-GA),这是一种将深度卷积神经网络与遗传算法相结合的混合方法,有效增强了室内导航和避障能力。Li 等 提出了一种基于深度学习的目标点定位技术,集成了点云输电塔分割 (PCTTS) 模型,用于在复杂结构化环境中实现精确的目标识别和分割。PCTTS 利用改进的 PointNet 架构和偏移注意机制来增强特征提取和定位精度。Yi 等开发了 SA-MLP-mixer 模型,这是一种紧凑的MLP架构,非常适合硬件资源有限的无人机,为室内导航提供了有效的解决方案。Yusefi 等采用 LSTM 网络和滤波器融合 IMU 传感器数据,以实现高效的姿态估计,尤其是在快速变化的环境中。Ollachica 等将深度学习与面部识别和跟踪相结合,使无人机能够在没有 GPS 的环境中实现自主定位和跟踪。 Ashour 等人提出了一种利用环境语义辅助无人机在未知环境中进行物体探索和建图的方法。该方法集成了基于深度学习的语义分割模型金字塔场景解析网络 (PSPNet),从二维图像中提取物体类别和空间信息。这些语义数据被投影到三维点云上,显著提高了室内定位和建图的精度。

虽然这些深度学习方法在路径规划和动态避障方面表现良好,但它们通常需要大量计算资源,并且会受到不良光照条件的显著影响。另一方面,强化学习方法在管理动态环境和优化导航路径方面表现出显著优势。Singla 等提出了一种基于记忆的深度强化学习方法,通过捕捉和回忆复杂的环境细节来提高无人机避障能力,增强其在复杂环境中的操作可靠性。Lin 等应用强化学习开发了一个基于无人机的仓库系统,该系统通过优化路径规划有效地管理库存。Walker 等集成了马尔可夫决策过程(MDP) 和部分可观测马尔可夫决策过程(POMDP) 模型,实现了鲁棒的路径规划和避障,解决了复杂室内环境中固有的不确定性。

这些强化学习方法使无人机能够在动态环境中自主学习和执行最佳导航策略,尽管它们在训练时间和计算要求方面有相当大的需求。多传感器融合技术集成了来自不同传感器的数据,以增强无人机在挑战性环境中的鲁棒性和适应性。Kao 等提出了 VIUNet,它结合了视觉、惯性和 UWB 传感器,可提供鲁棒的室内定位,从而减轻了单传感器方法固有的局限性。该框架集成了基于 CNN 的光流估计模型光流网络简单 (FlowNetS) ,以增强视觉特征提取并提高定位精度。Bigazzi 等利用多层架构融合异构传感器数据,增强了自主导航的鲁棒性。Iaboni 等开发了一个事件驱动的多无人机系统,结合YOLOv5进行检测,在复杂的动态环境中提供了高效的多无人机跟踪能力。

此外,Brommer 等人 提出了 INSANE 数据集,这是一个大规模多传感器数据集,支持无人机在不同环境中的定位,包括具有挑战性的室内外过渡和火星模拟地形。该数据集促进了基于人工智能的定位算法的开发,集成了 PointNet,可实现精确的 3D 点云特征提取和环境理解。虽然这些技术可以实现高精度的姿态估计,但它们需要精确的传感器校准,并且涉及复杂的部署过程。

信号强度和基于Wi-Fi的定位方法在未知或动态变化的环境中表现出良好的性能,因此特别适用于搜索和救援行动。Chowdhury等采用了基于RSS的Q学习技术进行无人机定位,无需事先了解环境知识,因此非常适合搜索和救援任务。

综上所述,利用深度学习、强化学习和传感器融合技术的无人机定位与导航研究,逐步提升了无人机系统的智能化、自主性和适应性。通过组合和优化不同的技术,这些研究为室内无人机导航与定位提供了多样化且有效的解决方案,为未来的智能搜索、环境感知和复杂任务的执行奠定了重要基础。表7总结了基于人工智能的无人机定位方法及相关细节。

6.出版物分析与讨论

人工智能定位技术的快速发展催生了越来越多的文献,涵盖了为应对室内环境挑战而开发的各种方法、人工智能模型和传感器技术。为了系统地分析该领域的研究趋势和重点领域,我们考察了三个关键维度的出版物分布:定位方法、人工智能模型类型和传感器使用情况。本分析全面概述了地面AMR和无人机定位技术进步背后的技术进步。

图 9、图 10、图 11共同展示了基于 AI 的定位研究的主要趋势。这些图分别突出显示了出版物在定位方法、AI 模型类型和传感器使用方面的分布。它们共同提供了该领域的技术进步和研究重点的全面概述,强调了基于 SLAM 的方法、深度学习模型和多传感器融合在提升地面 AMR 和无人机定位能力方面的关键作用。

图 9展示了地面 AMR 和无人机定位方法的出版物分布情况。对于地面 AMR,“基于 SLAM”的方法占主导地位,反映了它们在使机器人能够在动态室内环境中同时进行地图绘制和定位方面发挥着基础性作用。“无里程计和 SLAM”和“基于里程计”的方法也显示出显著的出版物数量,凸显了正在进行的替代或补充方法的研究。对于无人机,“多传感器融合”方法占主导地位,解决了空中导航的独特挑战,其中传感器集成对于在复杂的室内空间中实现可靠定位至关重要。

图 10突出显示了用于定位研究的 AI 模型类型的出版物分布情况。“深度学习 (DL)”模型的出版物数量最多,凸显了其在提取复杂特征、环境理解和自适应学习方面的适应性和有效性。“机器学习 (ML)”也占有重要地位,尤其是在基于视觉的定位任务中,其中空间感知至关重要。虽然“视觉模型 (EM)”和“学习模型 (TL)”的代表性较低,但它们对于高效训练流程和利用预训练模型等专业应用仍然至关重要。这些贡献共同证明了 AI 模型在解决室内定位复杂性方面日益占据主导地位。

图 11侧重于传感器级分析,强调了“多传感器融合”在已综述的出版物中的主导地位。这反映出人们越来越依赖于融合来自不同传感器的数据来增强定位的鲁棒性和准确性。基于“摄像头”的方法也占据了相当大的份额,它们利用基于视觉的方法的能力来实现精确的空间理解。同时,“激光雷达”和“惯性测量单元”的使用率适中,表明它们在运动跟踪和空间数据采集方面发挥着重要作用。“光传感器”和“编码器”的数量较少,表明它们具有专门或有限的应用,通常用于补充更广泛的多传感器系统。

图9.AMR和UAV定位方法的出版物。

图 10.按AI 模型类型划分的出版物数量。

图 11.按传感器类型划分的出版物数量。

总而言之,以上三幅图共同揭示了基于 SLAM 的方法、深度学习模型和多传感器融合在推进 AI 定位方面的关键贡献。这些趋势凸显了研究界致力于开发稳健且适应性强的解决方案,以应对地面 AMR 和无人机在动态复杂室内环境中面临的挑战。

7.基于AI的AMR定位实时性能评估

随着深度学习、机器学习和传感器融合方法的快速发展,基于人工智能的室内机器人定位在实时性能方面取得了显著进步。这些先进技术能够实时处理来自各种传感器(包括Wi-Fi、蓝牙、UWB、摄像头和IMU)的数据,从而实现高精度定位。然而,实现高实时性能仍然面临诸多挑战,例如计算复杂度、数据处理速度以及环境的动态特性。

7.1人工智能模型的计算复杂性

基于人工智能模型定位的实时性很大程度上取决于其计算复杂度。尽管深度学习模型具有强大的特征提取能力,但其高计算复杂度往往导致处理延迟,尤其是在资源受限的嵌入式系统中。为了解决这个问题,人们提出了各种优化方法,包括模型压缩、剪枝和量化,以降低模型复杂度和计算要求。此外, MobileNet和SqueezeNet等轻量级网络架构已广泛应用于嵌入式设备,在保持高精度的同时,显著降低了计算资源消耗。例如,一项研究将MobileNet部署在机器人上,实现了实时图像处理,显著提高了导航效率。

7.2 .硬件限制

硬件性能是影响基于人工智能的AMR定位方法实时性的关键因素。高性能硬件可以加速算法执行,提高能效,并支持更复杂的实时计算任务。为了优化实时性能,NVIDIA Jetson系列、Google Edge TPU和AMD的Kria KV260等专用人工智能加速芯片已在AMR中得到广泛应用。

表 8展示了使用常见深度学习模型(包括 ResNet-50、YOLO 和MobileNetV2)的各种硬件平台的性能。该表涵盖了处理速度、功耗、工作温度和效率等指标,深入了解了不同硬件配置如何影响实时定位任务。

不同的硬件平台在处理速度、功耗和工作温度方面各有优缺点。像 RTX 3060 这样的高性能GPU拥有卓越的处理能力,非常适合对实时性要求严格的应用。然而,它们较高的功耗和散热需求可能会限制其在能源受限环境中的使用。相比之下,Edge TPU 和 Jetson Nano 在能效方面表现出色,非常适合电池供电的 AMR 应用,而 Kria KV260 则在性能和热稳定性之间实现了良好的平衡。

综上所述,选择合适的硬件平台需要仔细考虑具体的定位算法需求和部署环境,并权衡处理速度、功耗、温度管理等因素,以确保基于AI的定位方法在实际应用中达到最佳的实时性能。

表8.不同硬件平台的性能比较。

硬件平台模型处理速度(FPS)功耗(瓦)工作温度功效
杰森纳米ResNet-50十三9/1.9最高 109 °C(GPU:93 °C)缓和
空单元格YOLO十三9/1.9不受调节的热量缓和
空单元格MobileNetV2158/2高温缓和
克里娅 KV260ResNet-503310.7/5.5测试中最酷的高的
空单元格YOLO3310.7/5.5稳定的高的
空单元格MobileNetV2三十五10.3/6稳定的高的
RTX 3060ResNet-5024045/10稳定的最好的
空单元格YOLO24045/10稳定的最好的
空单元格MobileNetV228046/12稳定的出色的
Edge TPUResNet-50不适用不适用不适用不适用
空单元格YOLO82稳定的缓和
空单元格MobileNetV24002稳定的出色的

7.3 .延迟和吞吐量

系统延迟和吞吐量直接影响机器人在动态环境中的响应能力和导航精度。高延迟可能导致机器人无法及时响应环境变化,从而影响避障和路径规划的准确性。为了平衡精度和实时性,引入了边缘计算和雾计算等分布式计算架构。边缘计算将计算资源和数据存储靠近最终用户或基站,支持在传感器处进行数据处理并实现实时响应定位,从而在加速数据处理的同时增强系统的实时输出。雾计算在传感设备和云之间增加了一层用于数据预处理、处理和分析,提供更好的计算性能和数据管理能力。例如,一项研究提出了一种基于深度强化学习的物联网应用程序调度算法(DRLIS),以自适应、有效地优化异构物联网应用程序的响应时间,同时平衡边缘和雾服务器上的负载。

实际应用案例展现了不同技术在实时性方面的优缺点。例如,利用FPGA进行神经网络加速的研究显著提高了处理速度,满足了复杂环境下的实时定位要求。另一项研究通过在机器人上部署轻量级网络MobileNet实现了实时图像处理,提高了机器人在动态环境下的导航效率。此外,基于边缘计算和雾计算架构的系统在多传感器数据融合和实时响应方面表现出色,显著增强了机器人在复杂环境下的自主导航能力。

8.基于AI的定位方法与传统定位方法的比较

在AMR室内定位中,基于AI的方法和传统的非AI方法各有优缺点。

传统方法包括基于 RSSI 的指纹定位,它根据来自不同接入点的信号强度确定位置,以及基于 CSI 的定位,其中信道状态信息 (CSI通过捕获详细的信道特性提供比 RSSI 更丰富的数据,从而提高定位精度。

基于距离和角度的定位方法也很常用,例如三边测量(根据信号传输时间或到达时间差计算位置)和三角测量(根据与已知参考点的角度确定位置)。

此外,基于几何的定位涉及使用带有卡尔曼滤波或粒子滤波的传感器数据,其特点是简单、能耗低、实时性好,适用于资源受限的环境。

然而这些传统方法在复杂、动态变化的环境中往往表现出较低的定位精度和鲁棒性,并且容易受到信号干扰和环境变化的影响。

为了更清楚地说明基于AI的方法与传统方法之间的差异,设计了如下的对比表(表9)。下面讨论每种方法的详细评估标准。

表9.基于AI的方法与传统方法的比较。

评估标准基于人工智能的方法传统方法
准确性在复杂环境中表现优异中等,依赖于环境
即时的需要高性能硬件低硬件要求
复杂高的低级、简单的算法
能源使用高,依赖于硬件低的
鲁棒性强大,适应变化虚弱,对变化敏感
成本需要高端专用硬件低的
维护复杂、持续的训练简单、易于维护
可扩展性随着复杂性的增加,扩展性更好在有限的硬件上更容易扩展

8.1准确性

基于人工智能的方法实现了显著更高的精度,这使其特别适合在动态和混乱环境中运行的室内 AMR。它们能够从大型数据集中学习复杂的模式,即使在具有挑战性的室内场景中也能实现精确定位。例如,基于 CNN 的模型在受控环境中可以实现低至 0.2 米的定位误差,而传统方法在类似条件下的定位误差通常会超过 1 米。这种精度优势在物体密集的仓库或信号干扰严重的区域等环境中尤为明显,而传统的基于几何的方法在这些环境中经常失效。此外,人工智能模型可以利用端到端学习同时优化特征提取和决策,减少通常会影响传统分步过程的错误累积。然而,在简单、静态的室内环境中,传统方法可以在没有计算开销的情况下实现相当的精度。

8.2 .实时性能

由于深度学习模型的计算需求,基于人工智能的方法还需要高性能硬件(如GPU或 TPU)来实时处理数据。例如,用于实时定位的 ResNet-50 架构可能需要超过 4 GFLOPS。尽管有这样的硬件要求,基于人工智能的方法在实时处理大规模、高维传感器数据(如激光雷达点云或高分辨率相机图像)方面表现出色。对于自动仓库导航或机器人路径规划等应用,这种能力是必不可少的。传统方法虽然能够以较低的硬件要求(如 CPU)实现实时性能,但在动态和嘈杂的环境中往往难以保持相同的精度和鲁棒性。然而,在简单静态的室内环境中,传统方法可以在没有计算开销的情况下实现相当的精度。

8.3 .复杂性

人工智能方法的复杂性源于其深层架构,通常涉及数百万个参数。一个典型的用于定位的最先进的 CNN 可能拥有超过 5000 万个可训练参数,而像 Transformers 这样的高级模型则可能超过数亿个。这种复杂性使这些模型能够捕捉传感器数据中复杂的空间和时间关系,这对于精确定位至关重要。虽然传统方法算法更简单、参数更少,更容易实现和调试,但它们缺乏适应不同环境或数据源的灵活性,这使得它们在实际应用中的通用性较差。

8.4 .能源使用情况

由于训练和推理的计算强度,基于人工智能的方法能耗显著增加。例如,训练深度学习模型(如 CNN 或 RNN)可能消耗数十到数百千瓦时(kWh)的电能,具体取决于模型复杂度和数据集大小。这一挑战在模型训练过程中尤为明显,因为大规模数据集和多次训练周期需要大量的计算资源。在推理过程中,人工智能模型还需要 GPU 或专用硬件,这比传统的基于 CPU 的方法消耗更多电能。然而,硬件效率的提升(例如能耗优化的 GPU 和边缘人工智能设备)正在逐步缓解这一问题。在室内自主移动学习 (AMR) 领域,实时处理和自适应性至关重要,因此必须在能耗需求与显著的性能优势之间取得平衡。相比之下,传统方法轻量级且计算要求较低,因此能耗效率更高,非常适合资源受限的场景。

8.5 .鲁棒性

基于人工智能的方法表现出卓越的鲁棒性,非常适合室内 AMR 定位。通过利用迁移学习或微调,预先训练的深度学习模型可以适应新的室内环境,例如办公空间、仓库或购物中心,即使在传感器噪声或环境变化等具有挑战性的条件下也能保持一致的性能和可靠性。这种适应性使机器人能够在动态和混乱的室内环境中始终如一地工作,而传统方法通常需要进行大量的手动重新配置。此外,基于人工智能的方法可以集成多模态传感器数据,例如摄像头、激光雷达、UWB 和 IMU 输入,从而增强对传感器故障或噪声的鲁棒性。这种多模态融合能力即使在复杂的真实室内环境中也能确保可靠的定位和导航。

8.6 .成本

由于需要专用硬件(例如 GPU)、大量数据收集和频繁重新训练,基于 AI 的室内 AMR 方法的实施成本通常较高。例如,使用云端 GPU 训练深度学习模型来处理定位和导航等任务可能要花费数百美元。然而,这项前期投资通常可以通过长期效益来证明,例如减少对手动重新校准的依赖,增强对动态室内环境的适应性,以及在仓库、购物中心和办公空间等不同环境中更高的可扩展性。相比之下,传统方法对于小规模或静态室内应用更具成本效益,但它们需要频繁的人工干预,并且缺乏应对复杂多变场景所需的灵活性。

8.7 .维护

基于人工智能的室内AMR方法需要持续维护,包括定期更新模型、数据管道以及检查与不断发展的硬件的兼容性。例如,已部署的用于定位和导航的神经网络可能需要频繁更新,以适应室内环境的变化,例如家具的重新布置、动态障碍物或新传感器类型的添加。这种复杂性与人工智能模型的适应性相平衡,人工智能模型可以根据更新后的数据集进行重新训练,从而在不断变化的室内场景中保持稳健的性能。相比之下,传统方法虽然更简单、更易于维护,但缺乏处理此类变化的灵活性,并且在动态室内环境中面临新挑战时,通常需要彻底重新设计。

8.8 .可扩展性

随着数据和环境复杂性的增加,基于人工智能的方法能够有效扩展,这使其特别适合室内 AMR 定位。通过利用庞大而多样化的数据集,这些方法可以在动态室内环境中学习复杂的空间和时间模式。例如,随着更丰富的空间和语义数据的可用性增加,基于图的神经网络通过提高定位精度展示了其可扩展性。这些数据(包括详细的房间布局或动态物体分布)使这些模型能够学习和适应更复杂的室内环境,从而有效地处理更大的数据集和更高维的信息。在智能工厂、大型仓库或多层办公楼等应用中,这种可扩展性对于管理高密度数据和满足多样化的定位要求至关重要。相比之下,传统方法难以推广和扩展,尤其是在高维或大规模室内环境中,这限制了它们在现代机器人应用中的有效性。

尽管存在一些弊端,例如更高的复杂性、能耗和实施成本,但基于人工智能的方法凭借其在处理复杂动态环境方面无与伦比的优势,仍然是室内定位的首选。它们在传统方法常常失效的地方表现出色,能够从多传感器数据中提取分层特征,并通过再训练和微调适应各种场景。基于人工智能的方法还能通过从额外数据中学习来持续提升性能,即使在存在动态障碍物或遮挡的复杂条件下也能实现稳健的定位。此外,其可扩展性确保了其在大规模和高维环境中的有效运行,而这些环境在现代应用中越来越常见。随着时间的推移,虽然硬件和模型开发的前期投资较高,但基于人工智能的方法通过减少手动重新校准和维护的需求,证明了其在长期部署中更为高效。这些特性使得基于人工智能的方法对于在室内定位任务中需要高精度、稳健性和可扩展性的应用而言不可或缺。

9.未解决的问题和未来展望

通过对基于AI的AMR室内定位方法的广泛文献综述,我们认识到该领域涵盖了广泛的问题和已提出的解决方案。与该主题相关的主要挑战和未解决的问题如下。

9.1 .未解决的问题

一个尚未解决的重要问题是,许多基于人工智能的模型需要大量的数据才能达到令人满意的性能。获取大量有价值的数据进行模型训练通常是一项艰巨的任务。开发能够从有限或未标记的数据中学习的高效算法仍然是一个悬而未决的研究课题。

另一个关键挑战是确保移动机器人的稳健性和可靠性,因为这些方面对于在不同环境中的可靠运行越来越重要 。尽管机器人技术和人工智能取得了重大进步,但确保自主系统(尤其是那些采用自学习算法的系统)的安全性和可靠性至关重要,尤其是在涉及人机交互的场景中。开发通用的AMR异常检测系统有助于比较和集成各种异常检测技术,从而促进更安全、更可靠的自主系统。

此外,我们的综述强调了探索特定人工智能方法与其对应的移动机器人任务之间关系的必要性。例如,虽然深度学习方法经常应用于移动机器人路径规划,但在各种方法中确定最优方法仍然是一个悬而未决的问题。

神经机器人技术是一个新兴的研究领域,它将生物学原理应用于机器人系统。受神经行为学(研究自然动物行为的神经基础)的启发,研究人员正在探索神经网络扰动对机器人行为的影响,力求提高机器人系统的性能和适应性。

9.2 .挑战

将复杂的人工智能方法与移动机器人机载控制系统有限的计算资源相结合,是一项巨大的挑战。让移动机器人能够使用基于人工智能的方法进行实时决策和运动控制也极具挑战性。此外,增强算法对动态变化环境的适应性仍然是一项尤为艰巨的挑战。

处理动态物体和环境是移动机器人面临的主要挑战之一。大多数研究未能充分考虑动态障碍物和环境。移动机器人要适应环境变化,需要有效地绕过动态障碍物。

移动机器人的功耗、分配和管理是经常被忽视的关键因素。同样,针对功耗和性能的算法优化在移动机器人研究中也很少得到重视。解决这些挑战对于延长机器人运行时间和提高整体效率至关重要。

设计新的、可扩展的方法,有效地训练协作机器人执行各种任务,也是一个紧迫的挑战。例如,无人机与地面机器人之间的协作可以增强机器人的适应性,并扩展其能力。

隐私问题是设计机器人辅助系统时面临的另一个重大挑战。机器人监视人类可能会引发影响人类行为的隐私问题;通过直接观察个人并增加获取个人信息的渠道,它们可能会危及隐私。AMR还面临物理攻击(例如,传感器干扰)和数字攻击(例如,篡改导航和控制系统)。此类攻击可能导致系统误解环境,对路径规划和控制产生不利影响,例如,导致机器人走错误的路径或使其在紧急情况下无法停止。此外,在AI模型训练和推理阶段遭受攻击可能导致数据泄露和模型误导等隐患。降低安全风险和加强数据保护是AI机器人未来面临的关键挑战。

我们预见,未来的研究将侧重于确保值得信赖的人工智能机器人系统能够抵御各种攻击场景,遵守其部署领域的伦理和法律原则,并确保与这些系统的交互保持私密。为了在推理攻击期间保护隐私,未来的机器人应用中可以实施各种安全策略。可以考虑诸如差异隐私和数据混淆等概念。

10.结论

本文全面回顾了过去五年基于人工智能的AMR定位方法的文献。我们系统地总结了人工智能方法的基本原理及其在AMR定位中的算法应用,特别关注了基于SLAM、里程计和多传感器融合的人工智能方法,这些方法适用于地面AMR和无人机。我们对基于人工智能的方法与传统方法进行了比较分析,以突出它们各自的优势和局限性。尽管人工智能模型展现出显著的技术优势,但在实现最佳实时性能方面仍然存在挑战。

此外,我们还评估了各种 AI 模型在主流硬件平台上的性能,强调了 AMR 实时定位所必需的关键权衡。

通过对现有文献的详细分析和对未来研究方向的探索,我们强调了基于人工智能的方法在增强室内机器人对复杂动态环境的适应性方面的重要性。

展望未来,AMR 的进步取决于弥合当前的技术差距、促进创新、提高系统可靠性和效率,以及增强人机交互,从而彻底改变其在不同领域的应用。总而言之,我们讨论了基于人工智能的定位面临的尚未解决的问题和挑战,并强调先进技术的广泛应用将为未来的研究提供宝贵的指导,最终促进制定新的战略来提升 AMR 能力。

3、ATI Motors 发布 双臂移动操作机器人(中叉网、agv网、无人系统网)

在自动化与智能制造浪潮之下,具有操作臂的移动机器人(mobile manipulator)正成为连接“搬运”与“作业”能力的关键。近日,印度机器人公司ATI Motors 正式发布其最新研发成果——Sherpa Mecha,一款配备双臂的移动操作机器人,该产品的亮相意味着公司从传统自主移动机器人进一步扩展至具备灵巧操作能力的工业人形机器人领域。

ATI Motors 成立于印度班加罗尔,其主营业务是开发和销售自主移动机器人,并提供其软件平台与集成服务。该公司已有的 Sherpa 系列产品在工厂、仓储等环境中应用广泛,包括牵引型、托盘搬运型、升降型等机器人。根据公开资料,其 AMR 产品已在印度、东南亚、美国、墨西哥等地的工厂部署,累计执行任务量正快速增长。

在 Product Day 2025 的新品发布会上,ATI Motors 除了推出重载牵引机器人 Sherpa 10K,也重点展示 Sherpa Mecha。该机器人采用“类人灵感”(humanoid-inspired)设计,但不追求生物仿真,而是聚焦工业实用性。Sherpa Mecha 配备两条机械臂、一个“头部”模组和轮式底盘,用以在工业环境中完成搬运、检测、拣选等任务。

据 ATI Motors 的联合创始人兼 CEO Saurabh Chandra 表示,Sherpa Mecha 是“受人类启发但并不刻意模仿人类”的机器人,其目标是利用机器本身的优势完成任务。在设计上,Sherpa Mecha 放弃了机械腿的复杂结构,而采用轮式底盘以提升行驶稳定性与效率;其碳纤维结构高度轻量,对臂部负载能力目前可达约 12 kg(在约 1 米臂展位置),未来版本则瞄准 35 kg 的能力。其机械手并非传统仿生手指,而是支持可更换工具模块,使机器人在执行如分拣、检测、搬运等多种任务间切换时具灵活性。视觉感知方面,其手部还内置摄像头,以支持精密识别与测量。

Sherpa Mecha 的推出,实际上是 ATI 在其 Sherpa 平台基础上的一次“能力向上扩展”。此前,ATI 的 AMR 产品线包括 Sherpa Monofork、Sherpa Lifter 500、Sherpa Pallet Mover 1.5T 等型号,覆盖搬运、托盘、推拉、提升等功能。此前已有报道指出 Sherpa Monofork 的额定载荷为 500 kg,续航时间约 8 小时;Sherpa Lifter 500 支持多种顶端模块(剪叉、回转台、滚筒等),载重 500 kg,续航可达 16 小时;Sherpa Pallet Mover 1.5T 的载荷能力已提升至 1.5 吨(1,500 kg)水平。 而 Sherpa 10K 则是一款重载牵引机器人,其最大牵引能力为 5 吨(约 11,000 磅),具备 3D LiDAR + 摄像头融合导航能力,并支持原地转向功能,适应狭窄车间环境。

在新产品发布会上,ATI 同时公布其 Sherpa 系列在全球部署的任务量已达每年超过百万级的水平(即其机器人系统每年执行超过 1,000,000 次自主任务)。该数字反映了公司在自主导航、路径规划、场景适配与调度能力上的积累。ATI 也指出,将开放 Sherpa Mecha 给高校、研究机构和产业伙伴进行联合开发,以推动人机协作研究与工业落地。

Sherpa Mecha 的面世意味着 ATI Motors 正试图打破传统 AMR 只能“搬运”的局限,向具备“操作能力”的机器人平台迈进。若能在可靠性、控制精度、感知能力、软件生态与成本控制层面取得平衡,其有望成为制造业中的柔性作业力量。而从行业视角看,Sherpa Mecha 的推出也呼应全球范围内越来越多厂商将“操控臂 + 移动平台”融合为一体的趋势,以实现更高层级的自动化与柔性制造。

取消