资讯

日本丰田研究院推出大型行为模型实现机器人学习用量减少80%

原创 2025-07-22 09:18 南山 来源:AGV网

2025年7月14日,日本丰田研究院(Toyota Research Institute,简称TRI)发布了其在机器人学习领域的重要突破——基于“Diffusion Transformer”架构的大型行为模型(Large Behavior Model,LBM)。该团队研究表明,通过单一通用行为模型,机器人在执行数百种操控任务时可实现训练数据需求降低达80%,为通用智能机器人的发展提供现实路径振奋人心的验证。

TRI成立于2016年,总部设立于日本加州的高级研究中心,致力于将AI技术在机器人、交通和人机交互领域实现落地。此次发布的LBM模型,引领机器人从传统“任务单一”向“多任务泛化”演进的关键一步,是其通向“通用助手”或“泛用工厂”战略的重要里程碑。

TRI团队通过扫描近1700小时涵盖仿真与现实世界的机器人操作数据,训练出一个含29类任务的预训练模型,包括抓取、组合装配、扭转拧紧等复杂动作。值得关注的是,该模型仅用原来20%的训练样本便达成相似或更优表现——机器人能在陌生任务与环境下实现快速迁移式学习,表现出超越传统Policy网络的适应能力与鲁棒性。

TRI采用的“Diffusion Transformer”架构,支持将视觉、语言、力觉与姿态等多模态感知输入,转化为连续运动控制输出,流程执行符合实时要求,并在标准A/B盲测中获高置信度评价。研究团队还开发出一套统计评估系统,确保模型表现可靠且可复制。

TRI机器人研究副总裁Russ Tedrake指出:“LBM使我们朝‘训练一次,部署多处’的机器人学习范式迈进,这是建立通用机器人能力的方向。”后续的系统改进,包括引入更多预训练任务、强化自我纠错与在线更新机制,均将在未来迭代中逐步展开。

这项技术潜在应用于制造、物流甚至家庭服务等多领域。TRI称其为“universal factories”范式:一套模块化、灵活可编排的机器人模型,能应对大规模混合生产、小批量定制或复杂装配任务,使得“敏捷制造”成为可能。

LBM与传统DQ/DDP或RL方法相比具备以下优势:其一,依赖通用预训练与少量微调即可适用新任务,增加模型泛化度;其二,减少训练所需采样、实验量和计算资源,将机器人部署成本大幅压缩;其三,使机器人具备“从经验学习”的能力,不再完全依赖人类教学或脚本硬编码。

目前,LBM仍处于初期阶段,TRI正与学界和工业界密切合作,比如与美国Boston Dynamics联合研究,将LBM部署于Atlas类人机器人,验证其在走路、搬运等复杂全身协调任务中的实用性与效率。

机器人操作行业专家评价认为,LBM的发布代表机器人向“行为基础模型”方向重构的开端。相比模型专注单工种、难以扩展的历史,LBM支持机器人进行一体化智能培训,类似于LLM赋能语言应用的范式,将为机器人快速落地带来启发。

值得注意的挑战包括:一是如何获取高质量、多物体、多模态训练数据;二是保证模型在现实世界执行的可控性与安全性;三是路径采样与决策速度需进一步与现场工业节拍匹配。

但从根本来看,Toyota研发的LBM为机器人行业提供了新的智能基石。在全球机器人成本与效率成为竞争关键的背景下,LBM模式可能开创新一代通用机器人生态,为制造、物流、服务乃至农业环境带来全方位变革。

TRI的这一突破不仅是机器人技术层面创新,更为全球产业智能化提供可复制路径。接下来若Farmbot、Fetch Robotics等行业方案商能与TRI此类模型融合,将带来前所未有的研发效率与商业应用速度,“训练—部署—协同”将成为机器人推广的新框架。

0 0

网友评论

取消