《纽约时报》近日披露谷歌搜索AI概览功能准确率约为90%,结合谷歌年超5万亿次的搜索基数测算,该功能每小时可产生超5700万条错误答案,每分钟错误信息量近百万条。初创公司Oumi的评估显示,谷歌Gemini模型准确率已从2025年10月的85%提升至2026年2月的91%,但源信息匹配率却反向下滑,虚假信息传播风险引发行业关注。
此次披露的测试数据来自初创公司Oumi针对谷歌搜索的专项评估,团队采用SimpleQA基准覆盖了4326次搜索请求的返回结果,相关测试方法与结论也得到了《纽约时报》的交叉验证。
在普通C端用户的感知里,90%的准确率已经属于可用水平,但放到谷歌每年超5万亿次的搜索大盘中,10%的误差对应的绝对数值足以引发行业警惕:换算下来,AI概览功能每小时会产生超过5700万条错误回答,平均每分钟就有近百万条错误信息直接传递给用户,远高于传统搜索链接模式下用户自行甄别信息的错误概率。
Oumi的测试数据显示,2025年10月搭载Gemini 2的AI概览准确率为85%,到2026年2月升级Gemini 3后,准确率已经提升至91%,半年提升6个百分点的迭代速度符合谷歌此前公布的大模型优化节奏。但值得注意的是,**AI概览内容与原始信息来源不符的比例从37%飙升至56%**,也就是说超过一半的错误回答,会在下方附上与结论完全矛盾的原始链接,很容易误导没有点击查看详情的用户。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 小时前
近日,微软宣布调整Office套件的Copilot AI助手交互逻辑,新增悬浮Copilot按钮的手动关闭选项,解决了此前用户反馈的常驻悬浮键遮挡编辑区域、误触率高等问题。作为微软面向办公场景落地的核心AI工具,Copilot目前已覆盖Office全系列办公应用,全球付费企业用户规模已突破3000万,本次功能更新将进一步优化不同使用习惯用户的体验。

6 小时前
近日,AI开源研究机构Nous Research正式发布全新大模型调控技术对比神经元归因(Contrastive Neuron Attribution,简称CNA)。该技术无需进行稀疏自动编码器(SAE)训练,也不需要修改模型权重参数,仅通过消融稀疏MLP电路即可实现对大语言模型行为的精准控制,大幅降低了大模型对齐与功能定向修改的技术门槛与算力成本。

1 天前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

1 天前
近日独立AI创作者借助OpenAI GPT-4o、DeepSeek大模型等工具,成功复刻科幻名作《挽救计划》(Project Hail Mary)的全星系恒星地图,经原著爱好者联合校验,该星图对书中提及的12万颗天体坐标还原度达99.7%,误差控制在0.3%以内,远超此前所有同人衍生内容的制作精度,成为近期生成式AI落地小众创作领域的标杆案例。

1 天前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。

1 天前
B站于2026年5月发布的第一季度财报显示,公司单季总营收达74.7亿元同比增长7%,首次实现净利润2.02亿元正式扭亏,经调整净利润5.85亿元同比大增62%。B站CEO陈睿将AI定义为历史性增长机遇,本季度广告收入25.9亿元同比激增30%,AI全链路赋能成为核心驱动因素,为国内内容平台的AI商业化落地提供了可参考的全新样本。

1 天前
国内头部大模型厂商DeepSeek近期官宣累计融资额突破700亿元,管理层正式对外披露全新战略方向,不再将短期商业化收益作为核心考核目标,集中全部资源攻坚前沿AI技术,其中面向开发者的编程专属大模型DeepSeek Code已进入落地筹备阶段,相关配套的Agent Harness技术团队招聘工作也已全面启动。

1 天前
2026年5月22日,OpenAI正式发布嵌入微软PowerPoint底层架构的ChatGPT for PowerPoint测试版插件,面向所有普通用户与ChatGPT Plus会员完全免费开放,支持一句话生成幻灯片、自动排查逻辑与格式错误等功能,直接打破传统PPT工具的创作效率瓶颈,是近期AI办公赛道最受瞩目的落地产品。