我可以帮您推荐合适的AI工具,有什么需要帮忙的吗?
2026年5月,国内具身智能企业自变量机器人正式开源其研发的VLA(视觉-语言-动作)模型Wall-OSS-0.5。该模型基于20余种机器人形态、百万条轨迹数据及9000万条多模态语料完成预训练,打破行业传统的“考前微调”范式,无需任务特定微调即可实现零样本部署,推动具身智能从定制脚本向通用大脑方向演进。
在过去三年的具身智能赛道热潮中,“刷榜性能高、落地适配难”始终是行业无法回避的通病。不少厂商发布的模型尽管在公开测试集上的数据表现亮眼,一旦进入真实生产、服务场景,往往需要数周甚至数月的针对性微调才能正常运行,落地成本居高不下。
长期以来,具身智能领域的模型评估存在一个隐形漏洞:多数公开测试的优异成绩,都是在针对特定任务完成大规模微调后取得的。这种模式下,外界很难判断模型是真正具备通用泛化能力,还是仅仅背熟了特定场景的“操作脚本”。
这直接导致具身智能的落地成本高企,单场景适配的微调成本动辄数十万,适配周期超过1个月,很难在中小场景批量复制,也限制了具身智能向更多细分领域渗透的速度。
此次开源的Wall-OSS-0.5,正是自变量机器人针对上述痛点推出的解决方案。作为一款VLA(视觉-语言-动作)模型,其训练阶段覆盖了20余种主流机器人形态、百万级真实机器人操作轨迹数据,以及9000万条多模态图文语料,预训练完成后无需任何针对性任务微调,即可直接在真实机器人上完成零样本部署。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录