42digest首页
代币是你需要的:通过信念共同进化的认知规划

Token Is All You Need: Cognitive Planning through Belief-Intent Co-Evolution

Shiyao Sang

arXiv
2025年10月30日

我们挑战了长期以来的假设,即高性能端到端自动驾驶(E2EAD)需要详尽的场景建模。 受认知科学的启发,我们提出有效的规划不是来自重建世界,而是来自信仰和意图在最低限度的语义丰富的代币中共同进化。 nuPlan基准测试(720个场景,11k+样本)的实验揭示了三个原则:(1)稀疏的意图代币仅实现0.487m ADE,在没有未来预测的情况下表现出强劲的性能;(2)预测未来代币的调节轨迹解码将ADE降低到0.382米,提高了21.6%,表明从认知规划中产生性能;(3)显性重建损失降低了性能,证实了任务驱动的信念意图共同进化在可靠的感知下已经足够了。 至关重要的是,我们观察到认知一致性的出现:通过长时间的训练,该模型自发地发展稳定的代币动力学,平衡当前的感知(信念)和未来目标(意图)。 这个过程,伴随着“暂时模糊”,在不确定性和持续的自我优化下实现了稳健性。 我们的工作建立了一个新的范式:智能不在于像素保真度,而在于信念和意图的象征性二元性。 通过将规划重新构建为理解而不是反应,TIWM弥合了世界模型和VLA系统之间的差距,为通过想象力规划的有远见的代理人铺平了道路。 注意:与nuScenes报告结果的方法进行数值比较仅具有指示性,因为nuPlan提出了更具挑战性的以规划为重点的评估。

We challenge the long-standing assumption that exhaustive scene modeling is required for high-performance end-to-end autonomous driving (E2EAD). Inspired by cognitive science, we propose that effective planning arises not from reconstructing the world, but from the co-evolution of belief and intent within a minimal set of semantically rich tokens. Experiments on the nuPlan benchmark (720 scenarios, 11k+ samples) reveal three principles: (1) sparse intent tokens alone achieve 0.487 m ADE, demonst...