2026年5月31日,复旦大学深度学习实验室孵化的具身智能企业眸深智能,正式发布全球首款机器人原生通用具身大脑STI-WM时空一体世界动作模型。该模型破解了当前主流VLA模型在空间感知、长时序规划、真机鲁棒性上的行业痛点,标志着我国在物理世界AGI落地路径上取得关键突破,企业成立半年已完成5轮融资。
过去两年,通用人工智能的落地重心始终停留在内容生成、办公协作等数字世界场景,而随着人形机器人、工业自动化需求的爆发,能适配物理世界交互需求的具身智能,正成为下一阶段AGI竞争的核心赛道。
此前行业主流的VLA(视觉语言动作)模型,普遍存在空间感知精度不足、长时序任务规划偏差大、真机运行容错率低的问题,难以适配复杂的真实物理场景,成为限制具身智能规模化落地的核心瓶颈。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录