登录体验完整功能(收藏、点赞、评论等) — 已累计有 12573 人加入

腾讯混元团队开源混元3D世界模型2.0 支持生成可编辑3D资产

详情页推荐

2026年4月16日,腾讯混元团队正式发布并开源新一代多模态世界模型混元3D世界模型2.0(HY-World2.0)。该版本实现了从生成视频到产出可交互、可编辑3D资产的功能升级,支持文本、图像、视频三类模态输入,可自动生成包含人、物、景的完整3D空间,兼容多种3D格式导出,能无缝对接Unity、UE等主流游戏引擎,为3D创作与游戏开发领域提供了新的开源工具。

相比此前版本,混元3D世界模型2.0最大的突破,是完成了从生成视觉片段到交付可落地开发资产的功能跨越。该模型统一了空间理解、生成与重建的全流程,带来三项关键技术升级。

端到端隐式学习方案HY-Pano-2.0模型,可在无需提前提供相机参数的情况下完成360度全景映射,大幅降低了输入门槛;自研空间Agent技术,结合视觉语言模型(VLM)与navmesh表征,让模型具备智能规划场景漫游轨迹的能力,可直接适配虚拟空间交互需求;WorldStereo机制,则解决了新增场景拼接的一致性问题,确保新生成区域与既有场景在几何结构、视觉效果上高度统一。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。