由李曼玲、李飞飞、吴佳俊等学者联合提出的具身大模型空间能力评估范式Theory of Space,已被国际顶级学术会议ICLR 2026正式接收。该范式打破了传统静态图文问答的评估局限,能够系统性考察基础模型在部分可观测的动态环境中,通过自主探索构建、修正和利用空间信念的类人能力,为具身人工智能的性能评估提供了全新参考框架。
在具身人工智能快速落地的当下,传统的模型评估方式却存在明显短板:多数评估仅依托静态图文问答,只能验证模型对已知场景的语义理解,无法还原真实物理环境中自主探索、动态修正空间认知的核心需求。无论是人形机器人的导航避障,还是自动驾驶的空间感知,都需要模型具备动态构建空间信念的能力,而传统评估体系难以覆盖这类真实场景下的性能校验。
此次推出的Theory of Space评估范式,正是针对这一痛点做出的突破。它不再局限于静态的图文输入,而是为模型搭建部分可观测的虚拟空间场景,要求模型通过自主探索获取环境信息,逐步构建并修正自身的空间认知框架,最终完成导航、物体定位等具身任务。与传统静态评估相比,该范式更贴近人类在真实世界中感知空间的过程,能够更精准地衡量模型的类人空间智能水平。
该研究成果已被ICLR 2026收录,作为国际顶级机器学习学术会议,其认可的评估范式有望成为具身AI领域的通用参考标准。参与研究的李曼玲、李飞飞、吴佳俊均为AI领域的顶尖研究者,其中李飞飞在计算机视觉、具身智能领域拥有深厚积累,曾主导多项推动行业发展的核心研究。从产业端看,该范式可以帮助企业快速验证具身机器人、自动驾驶等场景下的模型性能,大幅缩短产品研发周期。
目前Theory of Space仅完成了虚拟环境下的原型验证,后续研究团队计划将其拓展至真实物理机器人场景,进一步优化评估的复杂度与真实性。此外,该范式还可与多模态大模型、强化学习算法结合,为通用人工智能的空间智能评估提供更完整的框架,为AI技术的落地应用打下更坚实的基础。

1 小时前
2026年春节开工后,AI行业的落地场景正发生显著转向。曾引发广泛失业焦虑的AI技术,不再仅局限于开发者圈层:职场社交平台上,Openclaw部署心得、Token消耗效率成为热门讨论话题,不少无专业编程背景的普通人也开始尝试用AI编程制作实用工具,AI正从专业开发工具加速转向大众可及的生产助手。

1 小时前
2026年3月4日,阿里旗下通义千问(Qwen)大模型核心负责人林俊旸通过社交媒体宣布卸任,其“再见我亲爱的千问”的感性动态迅速引发科技圈关注。当日下午林俊旸回应称因需休息暂不处理外界咨询,同时叮嘱通义千问团队按原计划推进工作。作为深耕大模型多年的核心人物,他的离职动向引发行业对阿里大模型研发节奏的讨论。

1 小时前
2026年3月4日,新闻集团首席执行官罗伯特·汤姆森在摩根士丹利科技大会上披露,公司已与Meta达成一项为期三年、价值1.5亿美元的AI内容合作协议,将授权Meta抓取旗下《华尔街日报》《纽约邮报》《伦敦时报》等英美顶级媒体的优质内容,用于训练其大语言模型,正式转型为AI领域的输入公司,为行业提供核心训练数据支撑。

2 小时前
据彭博社消息,成立仅四年的AI编程助手Cursor年化收入已突破20亿美元(约合138.3亿元人民币),过去三个月收入运行率翻倍。此前因独立开发者转投Anthropic旗下Claude Code引发增长质疑,Cursor通过转向企业级市场,让高消费企业客户贡献六成营收,成功抵消个人用户流失带来的压力,扭转了外界对其增长停滞的猜测。

2 小时前
近日《商业内幕》结合薪酬平台Levels.fyi的披露数据,曝出AI初创公司Anthropic的员工造富案例:入职满一年的高级软件工程师账面持股价值可达160万美元,资深员工18个月身家超800万美元,业务运营负责人入职两年持股价值至少900万美元,其2024年估值曾达180亿美元,引发行业对AI初创薪酬机制的热议。

3 小时前
2026年3月4日凌晨,X平台上一则简短英文动态引爆全球科技圈:阿里巴巴最年轻P10级技术负责人、千问大模型核心掌舵者林俊旸宣布卸任。此次离职距其带队发布Qwen3.5系列小模型并获马斯克点赞仅48小时,也距阿里官宣将全栈AI品牌统一为“千问大模型”、全力加注C端市场的战略仅一天,消息传出后阿里高层已出面挽留。

3 小时前
2026年2月,微信发布第五期专项治理公告,落实国家广电总局要求,针对AI魔改类短视频开展专项整治。当月平台共巡查处置3956条违规内容,涉及扭曲经典名著、恶意歪曲历史名人与英模故事等类型。目前微信已将AI魔改治理纳入长效机制,持续升级算法识别与人工审核能力,从严处置违规账号。

5 小时前
近日,阶跃星辰创始人及董事长印奇启动科技领域双线布局:旗下AI大模型企业阶跃星辰完成超50亿元B+轮融资,刷新国内大模型单笔融资纪录,国有资本与老股东参投,计划年内完成pre-IPO并冲刺上市,有望成为国内第三家上市大模型企业;同时其管理的千里科技(前力帆汽车)将在2025年推出基于阶跃星辰大模型的L2+级智驾方案。