近日,埃克塞特大学研究团队在《公共科学图书馆·生物学》刊发论文《生物学中的深度学习正面临一场迁移性危机》,直指AI野生动物识别技术暴露致命缺陷。研究显示,这类AI模型在封闭训练数据集上表现优异,但迁移到真实野外场景时准确率骤降,可能误导野生动物保护决策,专家呼吁摒弃单一基准测试,改用真实使用场景评估AI性能。
3月4日,科技媒体Phys的一则深度报道将AI落地的隐秘漏洞公之于众:埃克塞特大学的两位研究者在最新刊发于《公共科学图书馆·生物学》的论文中,拆解了当前AI野生动物识别技术的主流宣传误区——尽管不少厂商宣称其模型能像人类观察者一样适配多样生态,但实际效果远未达预期。
研究团队通过对比实验发现,当前主流的AI野生动物识别模型,其训练数据集大多来自标准化的采集场景:比如专业红外相机拍摄的清晰素材、圈养野生动物的图像库,或是实验室环境下的受控拍摄内容。但当模型被部署到真实野外环境中时,光线变化、植被遮挡、不同季节的物种外观差异等变量,会让模型的识别准确率出现断崖式下跌,甚至会将本土保护物种误判为入侵物种,直接干扰野生动物保护的决策制定。
这篇论文并未将问题局限于野生动物识别领域,而是以医学诊断成像作为另一典型案例进行佐证:当前不少AI医学影像辅助诊断模型,在实验室基准测试中能达到接近90%的准确率,但放到真实临床场景中,因患者个体差异、医疗设备参数波动、扫描角度变化等因素,准确率会下滑至70%以下,甚至可能出现严重的误诊风险。这也意味着,“迁移性危机”是当前深度学习落地的普遍痛点。
研究人员在论文中明确指出,当前AI行业过度依赖实验室基准测试来评估模型性能,这种评估方式本质上是在“理想化环境”下完成的,无法反映真实使用场景的复杂性。不少厂商为了快速推进商业化,刻意放大模型在基准测试中的优势,却回避真实场景下的性能短板,这不仅会误导行业认知,还可能引发更严重的信任危机。因此,研究团队呼吁,AI落地前的评估必须转向真实使用环境,只有经过真实场景的验证,才能真正判断模型的实用价值。
从野生动物保护到医疗诊断,AI的落地场景正在不断拓展,但这场“迁移性危机”也提醒行业:AI的价值并非仅由实验室数据决定,只有真正贴合真实需求的技术评估,才能让AI真正服务于社会。

13 小时前
2026年3月科技巨头Meta宣布收购AI初创公司Moltbook,本次收购核心目标并非升级普通对话式AI机器人,而是提前布局智能体网络(Agentic Web)赛道。业内普遍认为,本次交易将推动Meta探索AI智能体在广告投放、社交电商等场景的商业化落地,为其现有超30亿月活的用户生态提供新的交互与变现路径。

16 小时前
近日,甲骨文(Oracle)正式回应开源社区长期诉求,明确拒绝放弃对关系型数据库MySQL的控制权,同时宣布将提升MySQL社区版开发透明度与参与度,向开源用户开放此前仅商业版专属的7项核心性能优化特性。当前全球活跃MySQL用户超1200万,其中近6成应用于AI相关业务的存储场景,本次调整将直接影响大量AI开发者的技术选型。

17 小时前
科技媒体InfoWorld近期针对2300名全球企业IT负责人的调研显示,68%的受访企业反馈现有AI办公工具的专有平台绑定问题,导致跨团队文档协作效率下降30%以上。主打跨生态兼容、多AI能力调用的开放协作式AI文档解决方案正成为替代方向,可帮助企业显著降低工具锁定成本,提升全链路办公效率。

17 小时前
全球知名科技媒体InfoWorld近期发布行业观察指出,当前智能体编码(Agentic Coding)技术落地速度远超行业预期,具备自主需求拆解、多工具调用能力的AI编码助手已能覆盖70%以上的常规开发场景,仍坚持排斥AI辅助编码的开发者,不仅会大幅降低个人产出效率,也将在未来3-5年的人才市场竞争中处于明显劣势。

17 小时前
2026年3月,谷歌旗下流媒体平台YouTube TV正式在全球范围上线30秒不可跳过广告,本次更新依托Google AI系统实现广告智能调度,可根据用户观看状态动态切换6秒、15秒、30秒不同时长广告,精准捕捉用户高投入度时段提升品牌触达效率,标志着流媒体大屏商业模式正在向传统广播模式靠拢,变现效率有望进一步提升。

21 小时前
2026年3月11日,Diffusion Transformers(DiT)作者、全球AI视觉领域领军人物谢赛宁及其团队正式发布全球首个多人视频世界模型Solaris。该模型基于昆仑天工2025年开源的Matrix-Game2.0架构开发,创新性引入多人自注意力层,目前所属项目种子轮估值已超35亿美元,实现了视频生成模型从单人单视角到多人交互世界的关键跨越。

21 小时前
微软旗下开源编程语言TypeScript近日正式推送6.0版本的发布候选(RC)版本,本次更新新增泛型调用场景下函数表达式的类型检查调整功能,同时官方披露正在推进TypeScript向Go语言重写的底层架构迭代计划。作为当前AI应用开发的主流编程语言,本次升级预计将覆盖全球超千万开发者,显著降低生成式AI应用的开发调试成本。

22 小时前
美国初创公司AgentMail近期完成600万美元种子轮融资,面向AI代理场景推出专用邮箱API平台,支持双向会话、内容解析、线程管理、标签分类、全局搜索与自动回复等全链路邮件处理能力,填补了当前AI智能体对外交互场景的基础设施空白,本轮融资将主要用于技术研发与商业化落地拓展。