2026年4月16日,蚂蚁灵波科技正式对外开源流式三维重建模型LingBot-Map。该模型仅依靠单个普通RGB摄像头,即可实时完成相机位姿估计与场景三维结构重建,可为机器人导航、自动驾驶及AR硬件等领域提供在线建图能力。在国际主流评测中,该模型轨迹误差仅为此前最优流式方法的三分之一,支持20FPS实时推理,万帧长场景运行精度几乎无衰减。
随着AI技术向机器人、消费级AR、自动驾驶等实体场景渗透,对实时空间感知能力的需求正在快速上涨。现有主流三维重建方案中,要么需要搭配多摄像头、激光雷达或深度相机等专用硬件,大幅推高了产品落地成本;要么受算法框架限制,必须采集完整视频序列后才能离线处理,无法满足需要即时交互的场景需求。
此次蚂蚁灵波科技开源的LingBot-Map,核心突破在于采用了全新的流式处理架构,从根本上改变了传统方案的处理逻辑。不同于传统方法需要预先收集完整画面序列再统一计算重建,LingBot-Map可以实现边接收摄像头画面、边输出定位结果与三维结构,真正满足了在线实时建图的需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 分钟前
2026年4月16日,谷歌DeepMind公布最新AI视觉领域研究成果TIPSv2,瞄准当前视觉-语言大模型“全局理解强、局部定位弱”的行业通病。该技术基于研究发现的“小参数量学生模型精细分割表现反超大教师模型”结论改进训练方案,可帮助AI精准定位图像局部细节,解决了领域内长期悬而未决的精细分割难题。

1 小时前
2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。

1 小时前
2026年4月,盖洛普发布针对美国职场的AI应用最新调查报告,本次调查覆盖超过2.37万名各行业员工,结果显示美国工作场所AI渗透率已达历史新高,近半数员工在工作中使用AI,不过仅26%的员工获得雇主明确的AI整合使用指导,不当使用导致美国员工平均每周因AI浪费近8小时,暴露了全球企业AI落地的普遍痛点。

1 小时前
4月16日,外媒The Information援引知情人士消息披露,苹果公司正为旗下语音助手Siri开发团队推进紧急AI能力升级,安排约200名程序员进入为期数周的AI编程训练营,系统性学习大模型时代的AI开发工具。培训后团队将重构分工:60人保留为核心开发组,60人转岗负责运行监测与安全审查,新版Siri预计今年6月正式亮相。

1 小时前
2026年4月16日,OpenAI正式推出更新版Agents开发工具包(Agents SDK),针对企业构建生产级智能代理的安全痛点推出多项核心更新,原生集成的隔离沙箱成为本次更新最大亮点。OpenAI产品团队成员Karan Sharma表示,本次更新的核心目标是平衡智能代理的自动化效率与运行安全性,帮助企业更快部署可控的AI自动化助手。

2 小时前
2026年4月,网络安全公司OX Security发布专项安全报告,披露AI企业Anthropic推出的开源标准MCP(模型上下文协议)存在架构层面设计缺陷,其SDK的STDIO接口未对传入命令做安全校验,可被攻击者利用实现远程代码执行,目前全球已有超过20万台基于MCP开发的AI服务器暴露在网络攻击风险下,该漏洞引发AI开发与安全领域的高度关注。

2 小时前
2026年4月,湖南广播电视台董事长龚政文在第十三届中国网络视听大会上公布最新运营与AI转型成果:芒果TV有效会员数量已突破7560万,湖南广电自研的芒果大模型已孵化出80余款行业智能体,规模化应用于30余档自制节目生产全流程,帮助内容生产整体效率提升超30%,成为传统广电机构落地AI的代表性实践。

2 小时前
2026年4月16日,阿里巴巴旗下ATH团队正式推出全新开放世界交互AI模型Happy Oyster,目前已开放早期用户体验申请。该模型是团队继视频生成模型HappyHorse之后的新作,标志阿里AI技术布局从静态视频生成正式延伸至交互式开放世界赛道。此前权威评测平台LM Arena数据显示,HappyHorse-1.0以1299分Elo评分登顶视频编辑方向全球榜首,超越Grok等国际主流模型。