腾讯旗下微信AI团队在2026年西班牙巴塞罗那举办的ICASSP国际声学与信号处理大会上,凭借面向视障出行的WalkVLM-LR新型视觉语言模型成果拿下最佳工业论文奖。这一设立于2016年的奖项此前十年均由海外科技巨头包揽,本次是中国企业首次获奖,相关技术大幅降低信息冗余延迟,为AI无障碍落地提供了全新可行路径。
5月的巴塞罗那格拉西亚大道旁,ICASSP 2026的颁奖典礼现场响起了中文致谢的声音,台下来自全球的信号处理领域研究者首次看到,来自中国互联网企业的团队站上了分量最重的工业类奖项领奖台。
作为全球信号处理领域历史最久、认可度最高的顶级学术会议,ICASSP的最佳工业论文奖一直坚持严苛的双重评选标准,既要求成果在算法层面具备全球首创的学术贡献,也要求技术拥有明确的规模化落地场景,绝非停留在实验室的纸面研究。
自2016年该奖项正式设立以来,历届得主基本被谷歌、微软、亚马逊等海外科技巨头的产业实验室包揽,从未有中国企业团队入围最终获奖名单,微信AI团队此次的突破,也直接打破了海外厂商对该奖项长达十年的垄断格局。
本次获奖的核心成果,是微信AI模式识别中心专为视障出行场景研发的WalkVLM-LR轻量型视觉语言模型,瞄准的正是过往同类辅助产品长期存在的行业痛点。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
41 秒前
本次资讯聚焦Google最新推出的全模态通用生成工具Gemini Omni,该产品整合新一代Gemini大模型的多模态能力覆盖图文、音视频全品类内容生产环节,可替代绝大多数中小型创作工作室的标准化工作流程,目前已有超2000家内容制作团队提交内测申请,将直接改写当前AI创作赛道的竞争格局。

3 分钟前
近日谷歌正式官宣将在其全球搜索引擎的图片检索模块上线全新AI生成内容溯源标注功能,依托Google自研的Content Credentials元数据技术,用户点击对应标注即可查看图片的生成工具、生成时间等完整信息,应对当前全网AI生成图片占比已突破40%带来的内容真伪辨别难题,为全网内容透明化树立行业参照。

5 分钟前
谷歌在2026年I/O开发者大会上正式发布全新音频驱动智能眼镜产品,该产品跳出此前AR眼镜依赖视觉显示的传统路径,深度整合Gemini大模型生态与谷歌全栈服务能力,主打全语音交互完成各类操作。业内认为该产品对标Meta近年推进的轻量化穿戴路线,有望在高速增长的AI穿戴市场打出差异化优势。

6 分钟前
近日谷歌正式宣布对旗下核心AI服务Gemini的全订阅体系完成重大调整,新增定价100美元/年的中高端专属档位,所有现有订阅方案同步下调定价,同时为不同层级用户开放此前仅面向内部测试的数十项新特性,覆盖网页、移动端及谷歌全硬件生态,进一步对标ChatGPT、Copilot Pro等头部AI订阅产品。

8 分钟前
近日谷歌旗下AI开发平台Google AI Studio完成重大功能迭代,依托Gemini大模型的原生适配能力,零编程基础用户无需编写任何代码,仅通过自然语言描述就能生成可直接部署运行的原生Android应用。该功能上线首周公开测试阶段,参与体验的用户数已经突破12万,大幅拉低了移动应用开发的准入门槛。

10 分钟前
近日美国陪审团快速驳回埃隆·马斯克针对OpenAI联合创始人及合作伙伴微软提起的诉讼,此前马斯克指控山姆·奥特曼窃取原本定位非盈利属性的OpenAI将其转为商业化实体。庭审披露的大量内部文件显示,马斯克早年执掌机构期间,本身就提出过将OpenAI商业化变现、引入科技巨头资源的相似规划,这起耗时近3年的行业标志性诉讼最终以马斯克败诉告终。

16 分钟前
谷歌依托Gemini大模型技术底座正式推出Workspace 24/7全时AI代理,据内部测试数据显示,该产品无需人工触发即可自主完成邮件回复、会议预约、文档协同整理等全场景办公操作,可将普通白领的日常行政类事务耗时降低42%,是当前消费级办公AI领域首个实现无人值守全时段运行的落地商用产品。

18 分钟前
近日谷歌旗下大模型产品Gemini推送2024年下半年最大规模功能更新,新增原生AI视频生成、晨间事务简报、后台离线批量处理三大核心能力,据官方披露该更新已面向所有Gemini Advanced付费用户全量推送,早期灰度测试数据显示,用户日均处理零散数字琐事的耗时可降低62%,大幅提升日常信息处理效率。