由李曼玲、李飞飞、吴佳俊等学者联合提出的具身大模型空间能力评估范式Theory of Space,已被国际顶级学术会议ICLR 2026正式接收。该范式打破了传统静态图文问答的评估局限,能够系统性考察基础模型在部分可观测的动态环境中,通过自主探索构建、修正和利用空间信念的类人能力,为具身人工智能的性能评估提供了全新参考框架。
在具身人工智能快速落地的当下,传统的模型评估方式却存在明显短板:多数评估仅依托静态图文问答,只能验证模型对已知场景的语义理解,无法还原真实物理环境中自主探索、动态修正空间认知的核心需求。无论是人形机器人的导航避障,还是自动驾驶的空间感知,都需要模型具备动态构建空间信念的能力,而传统评估体系难以覆盖这类真实场景下的性能校验。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录