2026年6月1日,英伟达正式发布全球首款全开源全模态物理AI大模型Cosmos3,该模型采用创新混合Transformer架构,可将物理AI训练评估周期从数月大幅缩短至数天,针对性解决具身智能领域数据有限、仿真零散的行业痛点。同期英伟达联合多家行业巨头成立“宇宙联盟”,共同推进物理AI技术落地与生态建设。

过去三年,全球具身智能赛道累计融资额突破127亿美元,但商业化落地进度远低于市场预期。行业调研显示,92%的具身智能原型产品无法通过真实场景泛化测试,核心掣肘在于行业缺乏统一的物理世界仿真底座:不同厂商使用的仿真框架零散、交互数据标准不统一,单款机器人的场景适配训练周期普遍超过3个月,研发成本居高不下。
和此前行业内分散的专用仿真模型不同,Cosmos3是首个能在单一系统内同时实现视觉推理、世界生成与动作预测的基础大模型。它创新性融合了推理类Transformer与生成类Transformer架构,首先通过推理模块解析物体交互规律、运动状态等物理规则,再通过生成模块输出高还原度的仿真场景与动作指导,最终实现端到端的物理AI训练支撑。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录