如何让机器人突破单纯的视觉识别,获得像人类一样理解物理世界,进行自主推理与行动的能力,一直是具身智能领域面对的终极难题之一。如今,西北工业大学人机物融合智能计算团队给出了全新答案。近日,西北工业大学计算机学院於志文教授、郭斌教授团队的综述论文《Bio-inspired Cognitive Navigation for Embodied Agents》被Nature子刊《Nature Reviews: Electrical Engineering》录用。
研究团队从动物导航的生物学机制出发,系统梳理了“认知导航”这一前沿领域,并创新性地提出了面向具身智能体的认知导航框架,该框架旨在赋予机器超越简单移动的能力,使其能像动物一样,在未知环境中理解空间、调用经验并做出灵活决策。

从“按图索骥”到“灵活认路”
受动物导航机制启发开启仿生学探索
很长一段时间里,机器人的导航方式显得有些“笨拙”。它们遵循“建图—定位—规划—控制”的固定流程,这种导航方式在仓储、巡检等高度结构化的“稳定”场景中尚能应付,一旦进入开放、动态、未知的真实世界,便会暴露出致命弱点。
首先是泛化能力差,即环境发生改变机器人便会因为地图对不上而瞬间“失智”;
其次为了维持高精度地图,机器人需要消耗巨大的算力和能源耗能耗时、响应迟钝,易“犯迷糊”,难以走向复杂多变的真实世界。
而动物靠的是“认知地图”,是一种会思考、会抽象、会预测的空间能力,简单来说就是“两不一新”:不记无关细节,只抓关键地标,保留高价值经验;不只看当下,还能预判下一步;遇到新环境,直接复用旧经验。
一言概之,动物会认路,靠的不是记性好而是会总结、会联想、会活用。研究团队受动物导航机制的启发,开启了仿生学探索,探索能否将动物在认路过程中表现出的地标识别、经验记忆和灵活决策能力进行系统性提炼与解构,进而转化为可学习、可计算的机器人导航框架。

类脑认知导航未来应用场景示意(AI生成)
“带着思考走路”给机器人装上“生物大脑”
“按图索骥”走不通,团队便从认知神经科学角度拆解动物导航机理,创新性提出一套类脑具身认知导航框架。简单来说,团队试图给机器人装上一个“生物大脑”,让它们不再依赖外部的地图数据而是通过内部的认知机制来理解空间,即可在动态环境中实时感知、灵活避障。这一框架的关键,在于实现了从“被动执行”到“主动思考”的跨越。核心可概括为四个关键词——多模态感知、预测式表征、记忆复用、分层规划。
据研究团队介绍,多模态感知打破了传统机器人“只靠眼睛看”的局限,使其还能结合运动、姿态、环境信号,更精准地判断自己在环境中的状态,预测式表征不只知道 “我在哪”,还能预判 “前面会有什么”,提前做出反应;记忆复用解决了机器人在陌生环境中“水土不服”的问题,把经验变成可迁移知识,陌生场景也能快速适应,并且“举一反三”;分层规划则先定大方向,再走小步子……从此,机器人导航不再是“执行指令”,而是真正“带着思考走路”。
从“执行指令”到“灵活认路”开启具身智能新赛道
从“执行指令”到“灵活认路”,不仅仅是技术参数的优化,更是一场深刻的范式转移。长期以来,家庭养老陪护、矿井作业、仓储物流等复杂场景的共同特点是动态、未知且充满变数,一直是机器人技术落地的“最后一公里”难题。
类脑具身导航框架的出现赋予了机器人像生物一样在未知与动态环境中,自主感知、决策与行动的能力成功打通了具身智能规模化应用的关键路径,使其真正具备了走进复杂真实世界的潜力,更标志着一条融合人工智能与神经科学的全新技术路线正在逐步展开。
记者:李卓然
审核:魏诠 张建成
编辑:呼乐乐