当前位置:首页 > AI资讯 > 正文内容

自动驾驶如何学会空间记忆

admin21小时前AI资讯8

当自动驾驶学会“回忆”:从实时感知到空间记忆的范式跃迁

在自动驾驶技术不断演进的今天,一个根本性挑战始终横亘在工程师面前:如何让车辆在“看不清、看不全、看不远”的复杂场景中,依然做出安全、可靠的决策?无论是夜间无灯的路口、暴雨中的反光路面,还是错综复杂的立交桥,传感器受限于物理条件,往往只能捕捉到局部、模糊甚至失真的信息。而人类司机之所以能在这些场景中从容应对,靠的不仅是眼前的画面,更是对道路环境的“空间记忆”——我们记得这条路有几条车道,前方是否有斑马线,哪里是高架入口。

如今,这一人类驾驶的“天赋”正被AI系统逐步掌握。复旦大学可信具身智能研究院与上海交通大学的联合团队在CVPR 2026上发表的论文《Spatial Retrieval Augmented Autonomous Driving》,提出了一种全新的思路:为自动驾驶系统注入可检索的“空间记忆”。

从“看见”到“回忆”:Geo信息如何补足感知短板

传统自动驾驶系统高度依赖车载传感器的实时输入——摄像头、激光雷达、毫米波雷达等。然而,这些设备在极端天气、光照不足或遮挡严重时,极易丢失关键道路结构信息。例如,雨夜中车道线被水膜覆盖,摄像头无法识别;立交桥上视野受限,车辆难以判断前方匝道走向。

该研究的核心创新在于,不再一味追求更强的传感器或更复杂的实时感知模型,而是引入“地理图像”(Geo Images)作为空间先验。系统通过车辆的GPS与位姿信息,实时检索对应位置的街景图、卫星图或历史地图,并将这些离线地理信息与车载相机采集的图像特征进行融合。

这种“检索增强”机制,本质上是为自动驾驶系统构建了一个可查询的“空间记忆库”。当实时感知失效时,系统可以“回忆”起这条路的原始结构:车道如何分布、人行道在何处、道路边界在哪里。这就像给车辆配备了一本高精度的“道路日记”。

Geo的适用边界:静态结构强,动态目标弱

值得注意的是,这项技术并非“万能钥匙”。研究团队通过大量实验发现,Geo信息对不同类型任务的提升效果差异显著。

在线建图任务中,效果最为突出。MapTR模型的mAP从50.3跃升至61.2,MapTRv2更是从61.5提升至73.4。尤其在低曝光、雨天和遮挡场景下,Geo图像帮助模型恢复了更多道路细节,显著提升了车道线、道路边界的识别精度。

占用预测任务中,Geo也带来稳定提升。FBOcc模型的整体mIoU从39.11提升至39.74,其中可行驶区域的识别精度从80.07%提升至82.47%。这表明Geo信息能有效辅助系统理解静态空间结构,如道路、人行道和地形。

然而,在3D目标检测任务中,提升微乎其微——BEVFormer的mAP仅从41.60提升至41.64。原因显而易见:Geo图像反映的是历史地理信息,无法捕捉当前道路上行驶的车辆、行走的行人等动态目标。它擅长的是“道路原本的样子”,而非“此刻发生了什么”。

这一发现恰恰揭示了Geo技术的本质定位:它不是替代实时感知,而是作为空间结构的补充先验,在传感器“失明”时提供可靠的参考框架。

从感知到认知:开启自动驾驶的新范式

这项工作的意义,远不止于几个百分点的指标提升。它标志着自动驾驶系统正在从“被动感知”向“主动认知”演进。

传统系统如同一个“近视眼”,只能看到眼前一帧画面;而引入空间记忆后,系统开始具备“上下文理解”能力——它知道自己在哪条路上,这条路的历史结构如何,从而在信息缺失时做出更合理的推断。

在端到端规划中,尽管Geo对轨迹误差影响不大,但在夜间场景中,碰撞率从0.55%显著下降,说明其在提升安全性方面具有潜在价值。这进一步印证了:空间记忆不是锦上添花,而是安全冗余的重要组成部分。

未来,随着高精地图、众包街景和车队经验的不断积累,这种“检索增强”机制有望成为自动驾驶系统的标配模块。它不依赖昂贵的硬件升级,而是通过软件层面的智能融合,让车辆真正“看懂”道路。

当自动驾驶学会“回忆”,它不再只是一个反应机器,而开始像一个有经验的司机——在迷雾中,依然记得前行的方向。

标签: 自动驾驶 空间记忆 地理检索 CVPR 2026 具身智能

相关文章

智算赋能教育:校企协同培养AI人才新范式

智算赋能教育:校企协同推动人工智能人才培养新范式在人工智能技术迅猛发展的今天,算力已不再是单纯的硬件指标,而是驱动科研创新与教育变革的核心引擎。4月9日,一场意义深远的合作在中国人民大学立德楼悄然落地...

高德发布全球首款开放环境全自主具身机器人

从地图到机器人:高德如何用“ABot”打开AGI新世界的大门? 在大多数人眼中,高德地图是导航、是出行助手,是城市交通的智能“大脑”。但4月19日,在北京亦庄机器人半程马拉松的赛场上,高德用一场震撼的...

Cursor 3重塑开发范式:智能体成代码主力

从“写代码”到“管智能体”:Cursor 3 如何重塑开发范式 当开发者还在适应 AI 辅助编程的“副驾驶”模式时,Anysphere 已经将 Cursor 推向了一个更激进的阶段——智能体优先。最新...

曦望S3专芯重塑AI推理算力格局

推理时代的算力革命:曦望如何用“专芯”重构AI基础设施 2026年,AI产业正式迈入“推理落地、智能体普及”的新纪元。当大模型不再只是“会聊天的助手”,而是进化为能思考、会执行的数字员工,一场围绕推理...

22岁开发者逆推Claude Mythos架构

当“堆参数”遇上“循环思考”:22岁开发者逆推Claude Mythos架构 在AI大模型领域,“更大即更好”曾是颠扑不破的真理。千亿参数、万亿参数……模型规模一路狂飙,算力成本也随之水涨船高。然而,...

AI模型建微信群:协作新革命

当大模型建起了「微信群」:一场 AI 协作的范式革命 4 月的大模型战场,硝烟弥漫。从 ChatGPT 到 DeepSeek,从腾讯混元到阿里通义,各家蓄势待发,准备在两周内轮番亮剑。然而,就在这波技...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。