地平线开源HoloBrain VLA基座模型 赋能机器人三维空间理解

14 小时前 AI快讯 1

地平线开源HoloBrain VLA基座模型 赋能机器人三维空间理解

2月13日,地平线正式开源专为具身智能打造的HoloBrain-0基座模型及配套RoboOrchard框架。这款模型创新性融入具身先验信息,突破传统机器人在三维空间感知与跨形态控制的技术瓶颈,同步推出的端侧友好版本,为缩短具身智能从实验室到真机落地的“最后一公里”、降低行业研发门槛提供了关键支撑。

在AI向“具身化”演进的浪潮中,业界一直面临着一个现实困境:实验室中表现优异的算法模型,一旦落地到真实场景的机器人本体,往往会出现感知偏差、控制失效等问题,这被业内称为具身智能商业化的“最后一公里”鸿沟。传统的视觉-语言-动作(VLA)模型大多仅依赖视觉与语言数据训练,缺乏对真实三维空间的认知能力,也难以适配不同形态的机器人本体,导致研发团队需要投入大量资源进行定制化开发。

地平线此次开源的HoloBrain-0基座模型,正是瞄准这一痛点而生。作为国内首个专为具身智能设计的全栈VLA框架,它最大的突破在于引入了具身先验信息——即让模型预先学习不同机器人在真实物理空间中的感知、运动与交互经验,比如机械臂的关节运动极限、移动机器人的空间导航逻辑等。这种设计让机器人能更快理解三维环境中的物体位置、距离关系,甚至能预判操作行为的物理可行性,大幅提升了空间感知的准确性与跨本体控制的灵活性。

配套开源的RoboOrchard框架,则为开发者提供了从数据采集、模型训练到真机部署的全链路支持。据介绍,该框架已完成对机械臂、移动机器人、人形机器人等多种主流机器人形态的适配,开发者无需从零搭建技术栈,只需基于现有框架进行二次开发,就能快速实现特定场景的功能落地。更值得关注的是,地平线同步推出了HoloBrain-0的端侧友好版本,通过模型压缩与计算优化,将模型体积与算力需求降低了40%以上,能在边缘设备上实现低延迟的实时推理,无需依赖云端算力,这对于依赖本地响应的服务机器人、工业巡检机器人等场景至关重要。

具身智能被视为下一代AI的核心方向之一,据行业预测,全球具身智能市场规模将在2030年突破千亿元,但当前高企的研发门槛让众多中小团队望而却步。地平线此次开源动作,相当于向行业开放了一套经过验证的具身智能底座,不仅能降低研发成本,还能加速技术迭代——开发者可以在HoloBrain-0的基础上,针对医疗护理、仓储物流、家庭服务等细分场景快速优化模型,推动具身智能从概念走向更多真实落地场景。

从AI大模型到具身智能基座,地平线的开源实践也为行业提供了新的思路:通用化的技术底座是推动AI规模化落地的关键。未来随着更多开发者加入生态,或许我们能看到更多能灵活适应复杂环境、完成多样化任务的机器人,走进我们的日常生活与生产场景。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创