2026年4月16日,腾讯混元团队正式发布并开源新一代多模态世界模型混元3D世界模型2.0(HY-World2.0)。该版本实现了从生成视频到产出可交互、可编辑3D资产的功能升级,支持文本、图像、视频三类模态输入,可自动生成包含人、物、景的完整3D空间,兼容多种3D格式导出,能无缝对接Unity、UE等主流游戏引擎,为3D创作与游戏开发领域提供了新的开源工具。
相比此前版本,混元3D世界模型2.0最大的突破,是完成了从生成视觉片段到交付可落地开发资产的功能跨越。该模型统一了空间理解、生成与重建的全流程,带来三项关键技术升级。
端到端隐式学习方案HY-Pano-2.0模型,可在无需提前提供相机参数的情况下完成360度全景映射,大幅降低了输入门槛;自研空间Agent技术,结合视觉语言模型(VLM)与navmesh表征,让模型具备智能规划场景漫游轨迹的能力,可直接适配虚拟空间交互需求;WorldStereo机制,则解决了新增场景拼接的一致性问题,确保新生成区域与既有场景在几何结构、视觉效果上高度统一。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录