2026年4月,小米正式开源旗下视觉-语言-动作(VLA)大模型Xiaomi-Robotics-0的真机后训练全流程,推动全球具身智能技术研发与落地。该模型依托预训练基座,仅用约20小时的任务数据训练,就能让机器人完成耳机精准收纳等高难度操作,实现亚毫米级对位精度。本次开源开放了模型权重、源代码与技术报告,大幅降低了具身智能领域的研发门槛。
耳机收纳进盒看似简单,对服务机器人来说却是不折不扣的高难度任务——耳机盒的对位公差往往不足1毫米,光滑的塑料表面还容易引发动作位移,对模型的空间感知和实时调整能力要求极高。
小米研发团队的测试结果显示,依托预训练VLA基座,仅用20小时的真机任务数据完成后训练,Xiaomi-Robotics-0就能稳定完成这项操作,在连续执行过程中保持亚毫米级的对位精度,还能实时修正动作偏差,实现丝滑流畅的任务执行。这种小数据量下的快速学习能力,打破了以往高精度具身任务需要大量标注数据的限制。
不同于行业内常见的仅开放模型权重的开源模式,小米此次开放了从训练到部署的完整技术链条,除了Xiaomi-Robotics-0的模型权重外,还同步公布了完整技术报告与可运行的源代码,真正实现了“开箱即用”的开发基础。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 小时前
2026年4月,腾讯 Robotics X 实验室与混元团队联合发布并开源了专为机器人具身任务优化的多模态大模型HY-Embodied-0.5-X。该模型推出MoT-2B端侧版与MoE-32B大参数两个版本,基于自研架构优化,强化机器人“感知-决策-执行”能力,在精细操作、空间推理等核心任务上表现突出,旨在推进具身智能机器人在真实场景的落地。

9 小时前
2026年4月,小米在今年2月开源机器人VLA大模型Xiaomi-Robotics-0的基础上,正式公布并开源了该模型的真机后训练全流程,瞄准AI机器人从实验室落地到实际应用的“最后一公里”难题。公开演示显示,搭载该模型的机器人仅需20小时任务训练,即可实现亚毫米级精度的精细操作,有望推动AI机器人成为开箱即用的通用生产力工具。

7 天前
2026年4月国家统计局发布最新AI产业运行数据显示,我国人工智能日均Token调用量已突破140万亿次,较去年末增长超40%。这一里程碑数据标志着国内AI产业已从技术实验验证阶段迈入规模化应用期,当前腾讯、阿里巴巴加码底层“世界模型”研发,特斯拉推进具身智能硬件落地,多赛道共同推动AI产业格局加速重构。

10 天前
2026年4月16日英伟达正式推出3D场景生成系统Lyra2.0,可依托单张照片生成延展90米的高连贯性3D虚拟环境,攻克长距离相机路径下的图像失真痛点,基准测试中在图像质量、相机控制等维度优于GEN3C、Yume-1.5等6款竞品,快速版本生成效率提升13倍,将有效满足具身智能训练对高质量虚拟场景的迫切需求。

10 天前
4月16日,戴盟机器人联合Google DeepMind,携手中国移动、新加坡国立大学等海内外数十家产学研机构,正式发布全球最大规模含全模态触觉信息的物理世界具身数据集Daimon-Infinity。该数据集将触觉信息纳入具身智能训练主干,可将机器人训练效率提升10倍,目前已向全行业开放10000小时标注数据,年内整体规模将扩展至数百万小时。

11 天前
2026年4月16日,波士顿动力宣布完成旗下Spot机器狗的AI能力升级,本次升级是波士顿动力与谷歌DeepMind达成的合作成果,双方将面向机器人场景开发的Gemini Robotics-ER1.6模型集成进Spot的自主决策系统,升级后的Spot在工业泄漏识别、仪表读数读取等核心工业检测任务上的能力获得显著提升,进一步拓展了四足机器人在高危工业场景的落地空间。

13 天前
2026年4月,阿里巴巴旗下高德具身业务部首款硬件产品曝光,这款四足机器人不但是高德首次机器人产品化尝试,也是阿里巴巴集团推出的首款具身机器人。今年1月高德成立专属业务部门后,2月已发布自研ABot-N0具身导航基座、ABot-M0具身操作基座模型,拿下全球首个具身导航与操作双SOTA成绩,标志阿里具身智能布局进入落地加速期。

14 天前
由前华为“天才少年”彭志辉(稚晖君)联合创立的国内具身智能头部企业智元机器人,宣布将于2026年4月17日在上海举办成立以来规模最大的2026合作伙伴大会。本次大会将集中发布“一体三智”全栈架构下的8项重磅成果,包括4款全新本体硬件、4个配套AI大模型,同时公布7套落地场景解决方案并开放行业数据集,智元创始人邓泰华与彭志辉将到场解读“具身生产力”发展路径。