2026年4月16日,波士顿动力宣布完成旗下Spot机器狗的AI能力升级,本次升级是波士顿动力与谷歌DeepMind达成的合作成果,双方将面向机器人场景开发的Gemini Robotics-ER1.6模型集成进Spot的自主决策系统,升级后的Spot在工业泄漏识别、仪表读数读取等核心工业检测任务上的能力获得显著提升,进一步拓展了四足机器人在高危工业场景的落地空间。
作为全球商业化落地最成熟的四足机器人,Spot此前已经进入油气开采、化工生产、电力运维等多个高危工业巡检场景,但受限于原有AI模型的推理能力,Spot在非结构化场景下的异常识别,大多仍然需要人工远程辅助完成,难以实现全流程自主作业。
目前全球工业领域,大量偏远、高危的场站巡检仍然依赖人力完成,不仅人力成本居高不下,安全事故风险也长期难以降低。传统移动机器人只能按照预设路线完成固定动作,面对复杂多变的工业环境,无法灵活识别处理各类突发异常,具备自主推理决策能力的智能移动机器人,已经成为工业安全领域的刚需产品。
波士顿动力与谷歌DeepMind的此次合作,正是瞄准这一产业痛点展开,双方希望借助大模型的通用推理能力,解决实体机器人在复杂场景下的决策难题。
本次升级中,波士顿动力将谷歌DeepMind专门为机器人开发的Gemini Robotics-ER1.6模型,深度集成到Spot的核心决策模块中。不同于通用大语言模型,这款模型针对性优化了视觉-语言-动作的联动推理能力,可以直接适配Spot的移动与感知系统,不需要额外改造硬件就能完成升级。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
10 小时前
2026年4月15日,谷歌正式推出Mac原生版Gemini应用,该应用采用Swift原生开发,针对苹果设备深度优化,支持快捷键快速唤起、屏幕感知上下文交互等功能。至此,全球AI领域头部玩家OpenAI、Anthropic、谷歌的核心AI服务均已完成苹果Mac桌面端布局,标志着AI厂商对桌面端用户入口的争夺正式进入白热化阶段。

10 小时前
2026年4月16日,谷歌正式面向全球推出适配macOS 15及以上版本系统的原生macOS版Gemini应用,这款桌面AI产品支持全局快捷键唤起、屏幕感知与多模态创作,通过系统级集成实现原生使用体验,直接对标OpenAI、Anthropic旗下同类桌面AI产品,核心集成谷歌最新Nano Banana图像生成能力,标志着谷歌正式加码桌面端AI助手赛道竞争。

13 小时前
近日,Google将旗下旗舰大语言模型Google Gemini抢先接入苹果Mac桌面平台,比苹果计划今年秋季推出的自研AI系统Apple Intelligence提前落地,也抢在了苹果Siri的全AI升级之前完成Mac端布局。目前支持百万级token处理的完整版Gemini已经可以让Mac用户获得原生级调用体验,这一动作打乱了苹果AI生态的推进节奏,让Mac桌面端AI竞争提前升温。

17 小时前
2026年4月15日,谷歌正式推出适配苹果Mac平台的原生Gemini客户端应用,这是谷歌首次为macOS系统打造独立原生AI助手产品。不同于此前依托浏览器运行的Gemini网页版,新应用支持用户实时共享Mac屏幕全内容,包括本地存储的各类文档、媒体文件,AI可直接基于本地内容完成分析、总结等操作,覆盖桌面端办公创作、信息整理等多场景需求。

17 小时前
当前海外科技领域AI赛道热度持续攀升,OpenAI、谷歌、xAI、苹果等头部科技企业的新一代大模型产品已进入市场预热阶段,GPT-5、下一代Google Gemini、Apple Intelligence、Grok 2等技术产品均位列近期核心热门议题,行业最新统计显示,2024年第三季度全球大模型产品迭代频次较去年同期提升62%,消费级AI落地进程明显加速。

1 天前
近期一项针对全球主流生成式AI工具的公众医疗咨询测试显示,OpenAI开发的ChatGPT、谷歌开发的Gemini等多款头部AI聊天机器人,在响应普通人常见健康咨询需求时,超半数情况下会输出错误甚至存在误导性的医疗建议。该结果再次引发AI领域对大模型医疗应用落地风险的讨论,也为普通用户使用AI获取健康指导敲响了安全警钟。

1 天前
2026年4月15日,谷歌正式发布面向Windows平台的全新桌面AI应用Google app for desktop,该应用内置谷歌Gemini AI技术,无需依托浏览器即可运行,用户通过Alt+Space组合键即可快速呼出搜索界面,支持网页信息、本地文件、已安装应用及Google Drive云端文件跨场景搜索,还集成Google Lens工具,进一步降低用户获取AI搜索服务的门槛。

1 天前
2026年4月15日,Google正式更新桌面版Chrome浏览器,为内置生成式AI工具Gemini推出全新的“技能库”功能。该功能支持用户将自定义复杂提示词固化为可复用技能,支持跨标签页批量调用,官方还预置了覆盖购物、效率、健康等场景的多款模板,支持用户二次调整,改变了浏览器端AI的传统交互逻辑,大幅提升日常AI使用效率。