2026年3月,蚂蚁数科天玑实验室发布AoE持续性第一人称视频采集框架,推出低成本具身数据采集方案:仅用一台手机搭配不足20美元的颈挂式支架,即可替代数万美元的专业采集设备。该技术支持数千台设备并发采集与云端自动化处理,实测引入200条数据后,机器人任务成功率从45%跃升至95%,相关论文已在Arxiv发布。
在具身智能的落地赛道上,第一人称视角的行为数据是训练机器人感知、决策能力的核心燃料。但长期以来,这类数据的采集依赖专业头戴设备、动作捕捉系统等硬件,单套成本动辄数万美元,不仅抬高了技术研发门槛,也让规模化数据积累成为行业共性难题。
具身智能的核心是让AI系统像人类一样感知和操控物理世界,而第一人称视角数据能精准还原人类的行为逻辑与环境交互细节,是训练这类AI的关键样本。但传统采集设备的高成本,让多数中小开发者和企业难以搭建稳定的采集体系,导致训练数据量不足、场景覆盖有限——此前不少团队的机器人任务成功率仅能维持在45%左右,无法满足实际应用需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
2026年4月21日,蚂蚁数科旗下智能体产品DTClaw正式上线AI支付功能,用户完成身份核验授权后,仅需语音下达需求、确认订单即可完成会员续费等付费操作。该功能基于支付宝为OpenClaw(俗称“龙虾”)类AI智能体打造的专属支付方案开发,标志着AI智能体正式突破信息交互边界,具备实现价值闭环的自主支付能力。

4 天前
2026年4月国家统计局发布最新AI产业运行数据显示,我国人工智能日均Token调用量已突破140万亿次,较去年末增长超40%。这一里程碑数据标志着国内AI产业已从技术实验验证阶段迈入规模化应用期,当前腾讯、阿里巴巴加码底层“世界模型”研发,特斯拉推进具身智能硬件落地,多赛道共同推动AI产业格局加速重构。

7 天前
2026年4月16日英伟达正式推出3D场景生成系统Lyra2.0,可依托单张照片生成延展90米的高连贯性3D虚拟环境,攻克长距离相机路径下的图像失真痛点,基准测试中在图像质量、相机控制等维度优于GEN3C、Yume-1.5等6款竞品,快速版本生成效率提升13倍,将有效满足具身智能训练对高质量虚拟场景的迫切需求。

7 天前
4月16日,戴盟机器人联合Google DeepMind,携手中国移动、新加坡国立大学等海内外数十家产学研机构,正式发布全球最大规模含全模态触觉信息的物理世界具身数据集Daimon-Infinity。该数据集将触觉信息纳入具身智能训练主干,可将机器人训练效率提升10倍,目前已向全行业开放10000小时标注数据,年内整体规模将扩展至数百万小时。

7 天前
2026年4月16日,波士顿动力宣布完成旗下Spot机器狗的AI能力升级,本次升级是波士顿动力与谷歌DeepMind达成的合作成果,双方将面向机器人场景开发的Gemini Robotics-ER1.6模型集成进Spot的自主决策系统,升级后的Spot在工业泄漏识别、仪表读数读取等核心工业检测任务上的能力获得显著提升,进一步拓展了四足机器人在高危工业场景的落地空间。

10 天前
2026年4月,阿里巴巴旗下高德具身业务部首款硬件产品曝光,这款四足机器人不但是高德首次机器人产品化尝试,也是阿里巴巴集团推出的首款具身机器人。今年1月高德成立专属业务部门后,2月已发布自研ABot-N0具身导航基座、ABot-M0具身操作基座模型,拿下全球首个具身导航与操作双SOTA成绩,标志阿里具身智能布局进入落地加速期。

11 天前
由前华为“天才少年”彭志辉(稚晖君)联合创立的国内具身智能头部企业智元机器人,宣布将于2026年4月17日在上海举办成立以来规模最大的2026合作伙伴大会。本次大会将集中发布“一体三智”全栈架构下的8项重磅成果,包括4款全新本体硬件、4个配套AI大模型,同时公布7套落地场景解决方案并开放行业数据集,智元创始人邓泰华与彭志辉将到场解读“具身生产力”发展路径。

14 天前
2026年4月,腾讯Robotics X实验室联合腾讯混元团队正式推出专为具身智能打造的HY-Embodied-0.5基础模型,在22项行业通用具身评测中拿下16项最优成绩刷新纪录。该系列模型从架构到训练范式全链路重构,同步推出MoT-2B、MoE-32B两款主力模型,可填补通用视觉语言模型三维空间感知与物理交互能力短板,推动大模型向机器人控制领域延伸。