2026年6月,英伟达联合清华大学、多伦多大学及Vector Institute正式发布多智能体世界模型Gamma-World,突破传统视频世界模型的单智能体假设瓶颈,解决了此前同类方案身份编码对称性破坏、算力成本随人数平方级暴涨的缺陷,实现视频世界模型从单人向多人协作的底层架构革新,可支持多主体在虚拟场景中同步操作、交互。

随着开放世界游戏、数字孪生、机器人集群训练等场景的快速发展,多智能体实时交互仿真已经成为行业公认的刚需技术,但长期以来受限于底层模型架构,这一领域的落地进展十分缓慢。
传统视频世界模型大多基于单智能体假设搭建,仅能支持单个主体在虚拟场景中的操作与视角渲染,一旦出现多个智能体同时操作、互相观察的场景,就会出现时序混乱、视角信息冲突、交互逻辑错误等问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录