2026年3月2日,谷歌家居负责人阿尼什·卡图卡兰在社交平台宣布,Google Home迎来基于Gemini大模型的史诗级升级,新增Live Search实时画面理解功能。Nest摄像头不再仅被动记录录像,可实时解析当前画面内容,用户可直接问询场景状态,彻底改变传统智能家居监控逻辑,目前该升级已正式向全球用户推送。
当你在通勤途中突然想起,早上放在门口的外卖是否已经被取走,以往只能打开Nest摄像头App,拖动进度条翻找数分钟前的录像。而在2026年3月2日谷歌推出的Home升级中,这一繁琐流程将彻底成为过去式。
作为此次升级的核心亮点,名为Live Search的实时问答功能彻底重构了Nest摄像头的使用逻辑。用户无需再翻找历史录像,只需通过语音指令“Hey Google,车库门口现在停着车吗?”或“我的狗是不是又在后院挖坑?”,搭载Gemini的摄像头就能实时扫描当前直播画面,在数秒内给出精准的肯定或否定回答,甚至能识别具体物品与行为——比如直接反馈“门口有一个棕色外卖箱”,解决了传统监控只能记录、无法解读场景的痛点。
不同于以往智能摄像头仅能实现异动检测、人脸识别等基础功能,此次升级的核心在于将Gemini大模型接入实时视频流。谷歌方面解释,Gemini的多模态理解能力可以将视觉信号转化为自然语言交互,让设备不再只是被动执行指令,而是能主动理解用户的问询需求。据阿尼什·卡图卡兰透露,该功能经过数月内部测试,旨在让智能家居真正“看懂”用户的日常场景,而非仅作为远程控制的工具。
当前全球智能家居市场仍以远程控制、定时任务等基础功能为主,用户需要手动下发指令才能操作设备。而谷歌此次的升级,标志着智能家居正式进入“AI理解场景”的新阶段:设备不再是需要用户主动唤醒的工具,而是可以通过自然语言交互,主动为用户提供所需的场景信息。这种基于大模型的实时交互,不仅提升了智能家居的使用效率,也为行业提供了新的发展方向,预计后续将有更多品牌跟进类似的AI赋能方案。
目前,该升级已正式向全球Google Home用户推送,支持搭载Gemini的Nest摄像头设备。对于普通家庭来说,这不仅是一个监控功能的优化,更是智能家居从“被动服务”向“主动理解”转变的重要信号。

1 天前
谷歌近期针对旗下大模型产品Gemini的命令行交互工具Gemini CLI推出全新Plan模式,该模式下工具仅可调用只读类操作工具,除自身内部计划存储文件外无任何其他文件的修改权限。该功能从底层权限层面解决了AI命令行工具自动化操作时误改用户文件的痛点,预计将大幅提升开发者使用Gemini CLI执行代码巡检、环境排查等任务的安全性。

1 天前
2026年3月13日,谷歌正式推出基于Gemini大模型的任务自动化功能并开启Beta测试。该功能打破传统AI助手仅能信息查询的局限,无需与第三方应用做定向API对接,即可通过虚拟窗口模拟人类操作,跨应用完成订餐、打车等复杂事务,关键操作节点设置人工复核机制,标志着消费级AI助手迎来重要升级。

1 天前
2026年3月举办的AWE博览会上,格力电器董事长董明珠携自研EAi AI芯片正式亮相,披露该芯片累计出货量已突破800万颗,配套工业级MCU芯片出货量逼近2亿颗。依托该芯片的本地算力支持,格力旗下家电将实现从被动响应指令到主动感知环境、匹配用户需求的服务跃迁,标志着家电AI应用进入全新阶段。

2 天前
2026年3月,科技巨头谷歌宣布为旗下地图产品Google Maps上线全新AI功能Ask Maps,同时推出升级版本的沉浸式导航服务,官方称本次沉浸式导航升级是Google Maps上线十余年来规模最大的一次功能迭代,相关功能将率先在北美、欧洲地区移动端开启灰度测试,预计2026年四季度覆盖全球大部分活跃用户。

3 天前
2026年3月美国参议院正式批准工作人员在公务场景使用微软Copilot、谷歌Gemini、OpenAI旗下ChatGPT三款生成式AI工具,相关工具已完成安全适配,可用于文件起草、信息汇总、公开信息检索等办公场景,其中微软Copilot交互数据将留存于微软365政府安全环境,标志着生成式AI在公共权力机构的应用进入制度化落地阶段。

3 天前
硅谷知名风投机构a16z于2026年3月发布《2026年3月顶级100款生成式AI消费级应用》报告,显示全球生成式AI消费市场快速扩张。OpenAI旗下ChatGPT周活跃用户达5亿,覆盖全球超10%人口,稳居榜单首位;谷歌Gemini、Anthropic旗下Claude付费用户增速分别达258%、200%,市场竞争烈度持续走高。

4 天前
美国科技公司谷歌于2026年3月正式向印度、加拿大、新西兰三个市场推送Chrome浏览器内置的Gemini AI功能,本次更新同步新增印地语、孟加拉语、泰米尔语等8种印度本土语言支持,进一步扩大其生成式AI产品的全球覆盖范围,也意味着消费级AI入口的全球本地化竞争正式进入新阶段。

4 天前
2026年3月11日谷歌正式推出旗下首个原生多模态嵌入模型Gemini Embedding 2,不同于专注内容生成的Gemini 3系列,该模型可将文本、图像、视频、音频、文档五类数据统一映射至同一向量空间,支持100种语言语义识别,跨模态匹配精度较行业现有方案提升47%,为搜索、内容管理等场景带来全新技术解决方案。