2026年3月11日,Diffusion Transformers(DiT)作者、全球AI视觉领域领军人物谢赛宁及其团队正式发布全球首个多人视频世界模型Solaris。该模型基于昆仑天工2025年开源的Matrix-Game2.0架构开发,创新性引入多人自注意力层,目前所属项目种子轮估值已超35亿美元,实现了视频生成模型从单人单视角到多人交互世界的关键跨越。
3月11日下午的新品发布会上,谢赛宁团队现场演示了Solaris的运行效果:4名测试人员同时接入《我的世界》虚拟空间协同搭建二层木屋,不同终端输出的画面中,建筑结构、物体位置、光影参数完全对齐,没有出现此前同类模型常见的穿模、场景漂移、视角错位等问题。
过去两年,世界模型技术快速迭代,但主流产品始终停留在单人单视角的生成阶段,唯一此前公布的多人方案Multiverse仅能支持弱交互场景,多人同空间下的场景一致性不足40%,完全无法满足游戏、虚拟办公、数字孪生等场景的实际需求。
行业普遍认为,多人实时感知协同能力,是世界模型从实验室走向大规模商用的核心门槛,也是元宇宙、AI原生游戏等赛道等待了近3年的关键技术突破。
Solaris的核心架构基于昆仑天工2025年8月开源的Matrix-Game2.0实时长序列交互式生成世界模型开发,团队创新性加入了多人自注意力层模块,实现了不同用户视角的信息实时交换与全局校准。
在《我的世界》的标准测试场景中,Solaris的建筑一致性准确率达到97%,视角对齐延迟低于80ms,完全满足实时交互的要求,首次验证了多玩家在虚拟世界中的协同感知能力。
据了解,Solaris项目的种子轮估值已经超过35亿美元,刷新了AI基础模型领域种子轮估值的最高纪录。目前团队已经和3家头部游戏厂商、2家工业数字孪生服务商达成初步合作意向,预计首款基于Solaris的AI原生多人游戏会在2026年第四季度上线。
谢赛宁在发布会上透露,团队接下来会重点优化模型的算力消耗,目前每用户每小时的运行成本约为0.12美元,预计18个月内可降至0.03美元,具备面向C端用户大规模开放的商业化基础。

1 小时前
2026年4月2日,百度健康正式发布国内首个面向医生群体的任务型医疗AI产品「有医助理」。该产品基于自研Claw框架,依托数千万级权威医学数据,同时配备五层医疗级数据防护体系,可覆盖检索、学术科研、患者随访等多场景需求,标志着国内医疗AI正式从资料检索阶段迈入深度参与临床、科研执行的新阶段。

2 小时前
2026年4月,联想正式对外展示旗下轻量化AI工具天禧AI Claw,实测数据显示该产品可实现最快1小时完成企业业务场景适配,相比行业平均70%中小企业部署AI需10人天以上的配置周期,效率提升超90%,解决了过往AI工具部署复杂、定制成本高、落地效果不达预期的行业普遍痛点。

2 小时前
4月2日消息,消费级AR眼镜头部厂商XREAL于日前正式向港交所递交招股书,冲刺港股AI眼镜第一股。该公司由前英伟达员工、浙江大学校友徐弛联合创办,获得雷军旗下投资机构注资,2023年全年实现营收5.16亿元,净亏损4.56亿元,是目前国内消费级AR眼镜赛道出货量位居前列的核心玩家。

4 小时前
4月2日火山引擎于AI创新巡展·武汉站正式宣布Seedance 2.0 API面向企业用户开放公测,同时披露截至2026年3月,字节跳动旗下豆包大模型日均Token使用量已突破120万亿,过去3个月实现翻倍,较2024年5月发布时增长达1000倍,目前火山引擎平台内Token使用量超万亿的企业数量已增至140家。

4 小时前
2026年4月,全球AI二级交易市场出现明显分化:曾经一券难求的OpenAI现有6亿美元待售股权无人接盘,其直接竞争对手、主打Claude系列大模型的Anthropic却获得资本市场热捧,买方市场已积压约20亿美元资金等待入场。这一估值倒挂现象,折射出通用人工智能赛道的投资逻辑正在发生深层转向。

4 小时前
2026年4月2日,火山引擎总裁谭待正式披露字节跳动旗下豆包大模型最新运营数据:其日均Token使用量已突破120万亿大关,近三个月用量实现翻倍,较两年前增长超1000倍,刷新国内大模型用量纪录。这一数据也印证国内AI产业已从模型研发竞赛转向规模化应用阶段,国产大模型调用量已在部分领域反超海外主流产品。

4 小时前
2026年4月,谷歌旗下视频平台YouTube遭200余名儿童发展专家及教育机构联名公开信抵制。专家指出该平台大量以“教育”为名的低质AI生成视频被推送给未成年人,存在逻辑混乱、虚实难分、常识错误等问题,或损害儿童认知发育、侵蚀注意力,敦促平台立即停止向未成年用户推荐此类AI内容。

5 小时前
2026年4月2日,Anthropic旗下AI编码工具Claude Code正式推出全新终端渲染方案NO_FLICKER模式,用户仅需配置一行环境变量即可启用。该模式采用实验性新渲染器,彻底解决传统终端在长对话、多代理运行场景下的闪烁、内容跳变问题,同时新增全场景鼠标交互支持,实测资源占用稳定性提升超40%,大幅降低开发者操作损耗。