少找工具,多做创作

DiT作者谢赛宁团队发布Solaris 全球首个多人视频世界模型估值超35亿

2026年3月11日,Diffusion Transformers(DiT)作者、全球AI视觉领域领军人物谢赛宁及其团队正式发布全球首个多人视频世界模型Solaris。该模型基于昆仑天工2025年开源的Matrix-Game2.0架构开发,创新性引入多人自注意力层,目前所属项目种子轮估值已超35亿美元,实现了视频生成模型从单人单视角到多人交互世界的关键跨越。

3月11日下午的新品发布会上,谢赛宁团队现场演示了Solaris的运行效果:4名测试人员同时接入《我的世界》虚拟空间协同搭建二层木屋,不同终端输出的画面中,建筑结构、物体位置、光影参数完全对齐,没有出现此前同类模型常见的穿模、场景漂移、视角错位等问题。

过去两年,世界模型技术快速迭代,但主流产品始终停留在单人单视角的生成阶段,唯一此前公布的多人方案Multiverse仅能支持弱交互场景,多人同空间下的场景一致性不足40%,完全无法满足游戏、虚拟办公、数字孪生等场景的实际需求。

行业普遍认为,多人实时感知协同能力,是世界模型从实验室走向大规模商用的核心门槛,也是元宇宙、AI原生游戏等赛道等待了近3年的关键技术突破。

Solaris的核心架构基于昆仑天工2025年8月开源的Matrix-Game2.0实时长序列交互式生成世界模型开发,团队创新性加入了多人自注意力层模块,实现了不同用户视角的信息实时交换与全局校准。

在《我的世界》的标准测试场景中,Solaris的建筑一致性准确率达到97%,视角对齐延迟低于80ms,完全满足实时交互的要求,首次验证了多玩家在虚拟世界中的协同感知能力。

据了解,Solaris项目的种子轮估值已经超过35亿美元,刷新了AI基础模型领域种子轮估值的最高纪录。目前团队已经和3家头部游戏厂商、2家工业数字孪生服务商达成初步合作意向,预计首款基于Solaris的AI原生多人游戏会在2026年第四季度上线。

谢赛宁在发布会上透露,团队接下来会重点优化模型的算力消耗,目前每用户每小时的运行成本约为0.12美元,预计18个月内可降至0.03美元,具备面向C端用户大规模开放的商业化基础。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创