谷歌近日面向全球YouTube用户推送AI能力更新,全量接入自研多模态大模型Gemini Omni,普通用户可免费使用基础AI服务,但核心的跨视频语义检索、多模态内容溯源等高级AI搜索功能,目前仅向订阅YouTube Premium的付费用户开放,覆盖全球超20亿月活用户。
不少用户近期打开YouTube时都注意到,长视频播放页的右上角新增了一枚醒目的蓝色AI图标,点击后无需跳转任何第三方页面,就能直接向AI询问当前视频的核心内容,哪怕是时长超过3小时的技术评测、纪实影片,也能在几秒内生成条理清晰的要点总结。
Gemini Omni是谷歌今年发布的新一代全模态大模型,主打长时音视频理解能力,此前一直缺少面向普通C端用户的大规模实测场景。
而作为全球最大的UGC视频平台,YouTube库存内容总时长已经突破数亿小时,覆盖知识、娱乐、科技等几乎所有内容品类,天然是打磨音视频大模型能力的最佳训练场。此前谷歌已经在小范围灰度测试AI视频总结功能超过6个月,本次全量推送基础版AI能力,本质是用极低的成本获取海量真实用户交互数据,快速迭代模型准确率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
30 秒前
2026年5月20日,谷歌在I/O 2026开发者大会正式推出全新轻量大模型Gemini 3.5 Flash,其运行速度较前代提升4倍,综合表现超越上一代旗舰模型Gemini 3.1 Pro,在智能体运行、代码开发等核心场景达到顶级水准。谷歌宣布该模型即日起面向全球所有用户免费开放,大幅拉低顶尖大模型的使用成本,或将推动整个AI应用开发生态迎来新一轮变革。

2 分钟前
2026年5月19日,OpenAI正式推出名为“保障容量”的全新算力服务,面向有持续大模型调用需求的企业客户提供长期算力访问承诺。该服务设置1至3年可选承诺期,客户可享受随合作年限递增的阶梯折扣,算力使用可按实际需求灵活扣减承诺额度,大幅降低算力供给波动给企业AI业务带来的不确定性风险。

4 分钟前
北京时间2026年5月20日,谷歌在年度I/O开发者大会正式发布面向智能穿戴设备的Wear OS 7系统。本次升级重点聚焦用户长期吐槽的续航痛点与轻量化智能交互需求,官方数据显示从Wear OS 6升级后续航最高可提升10%,同时首次将Gemini Intelligence大模型能力植入腕端,首批适配机型为2026年新发布的智能手表产品。

6 分钟前
北京时间2026年5月19日,谷歌正式推出Gemini家族最新旗舰多模态模型Gemini Omni,该模型首次实现文本、音频、图像、视频四类信息的并行统一理解处理,跨模态交互流畅度较前代Gemini 2 Pro提升超60%,有望打破当前多模态AI的场景适配瓶颈,为消费级产品和行业解决方案提供全新技术底座。

8 分钟前
2026年5月举办的谷歌I/O开发者大会上,谷歌正式推出全新全时在线AI代理平台Gemini Spark,该产品由新一代Gemini 3.5 Flash大模型驱动,依托谷歌云虚拟机架构实现关闭终端后仍24小时不间断后台运行,打通原生与第三方应用生态,有望彻底改写现有智能助手的功能定义。

16 分钟前
2026年5月,知名大模型厂商DeepSeek旗下网页版产品出现用户输入特定特殊字符后自动生成无关文本的异常现象,引发大范围关于对话隐私泄露的公众担忧。DeepSeek技术团队耗时36小时完成全链路排查后正式对外回应,确认该异常属于特殊输入触发的定向模型幻觉,不存在任何用户数据泄露的安全漏洞。

18 分钟前
2026年5月举办的谷歌I/O开发者大会上,谷歌联合三星携手潮流眼镜品牌Gentle Monster、经典眼镜品牌Warby Parker,推出两款深度集成Gemini大模型的AI智能眼镜,产品定位为手机能力延伸设备,覆盖通勤、漫步、购物等多日常场景,可实现免手持交互、实时导航等核心功能,大幅降低用户对手机的依赖,首批量产备货规模超过80万台,将于今年第三季度正式开售。

20 分钟前
2026年5月20日,通义实验室正式推出新一代AI Agent基座大模型Qwen3.7-Max,依托独创的“任务-运行框架-验证器”正交解耦技术,在多项权威行业评测中斩获国内第一。该模型攻克了智能体长链路易中断的痛点,在无任何先验数据的ZW-M890L PPU极限测试中实现连续35小时运行、1158次工具调用零中断。