2026年2月26日,一款名为Mercury 2的扩散推理大语言模型正式亮相,凭借每秒生成1009个tokens的速度登顶全球最快AI深度思考模型宝座——这一速度是GPT-5(mini)、Claude-4.5(haiku)等传统自回归模型的5倍。该模型由获英伟达、微软投资的团队研发,颠覆了自回归“打字机式”生成范式,引发AI行业的广泛热议。
不少AI从业者对“token等待焦虑”并不陌生:在使用自回归大模型生成万字报告时,需要等模型逐个吐出近7000个tokens,耗时往往超过10分钟;而Mercury 2的出现,让这类等待直接缩短至7秒以内。
传统自回归大模型的速度瓶颈,根源在于其“单向顺序生成”的底层范式——就像老式打字机只能从左到右逐个敲字,每生成一个token都要依赖此前所有token的结果,GPU的多核心算力无法被并行利用,这也让自回归模型的速度天花板早早显现。
Mercury 2则跳出了这一框架,将原本多用于图像生成的扩散模型引入大语言模型推理环节。其核心逻辑是“并行生成+全局优化”:模型可以同时预测多个token的概率分布,再通过多轮扩散过程调整优化,就像人类编辑先搭好全文框架再逐段润色,而非从零开始逐字撰写。
在英伟达GPU的硬件支持下,Mercury 2实现了每秒1009个tokens的生成速度,经第三方测评,这一成绩是GPT-5(mini)的5倍、Claude-4.5(haiku)的4.8倍,且在常识推理、逻辑问答等任务上的准确率,与传统顶尖自回归模型持平。
英伟达第一时间在官方社交平台发文祝贺Mercury 2的发布,除了技术层面的认可,更因为其是该模型研发团队的早期投资方之一;微软也参与了该团队的A轮融资,看中的是扩散模型在实时交互、批量内容生成等场景的落地潜力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
10 分钟前
OpenAI近日为旗下大语言模型ChatGPT新增第三方影视平台Tubi的内容检索功能,用户可通过自然语言提问的方式,让ChatGPT结合自身语义理解能力,匹配Tubi全库超5万部电影、剧集资源,生成符合个人观影偏好的专属推荐,无需跳转多个平台即可快速定位想看的内容,目前该功能已向所有ChatGPT Plus付费用户开放测试。

2 小时前
全球AI算力需求爆发背景下,英伟达投资的亚洲AI数据中心服务商Firmus近期披露最新估值达55亿美元。过去6个月内,该公司累计完成13.5亿美元融资,刷新AI基建领域同期融资纪录。作为主打高功率密度的AI算力基础设施提供商,Firmus的估值跳涨也印证了当前一级市场对算力上游环节的投资热度。

2 小时前
2026年4月,半导体巨头英特尔正式宣布加入埃隆·马斯克主导的Terafab先进芯片制造项目。此次合作将把英特尔积累数十年的晶圆制造、先进制程工艺经验注入Terafab项目,双方将共同瞄准AI训练所需的高算力芯片产能缺口,计划在3年内将Terafab的12英寸晶圆月产能提升至10万片规模,为下一代大模型落地提供稳定算力支撑。

4 小时前
2026年4月7日,OpenAI模型行为团队创始负责人、OpenAI Labs总经理Joanne Jang正式宣布离职,结束其在OpenAI长达4年半的任职。作为GPT-4o交互体验的核心负责人,Joanne Jang主导的模型拟人化优化工作被业内认为是GPT-4o用户体验大幅领先同期竞品的核心原因。目前其暂未披露离职原因与后续规划,仅表示将逐步公开OpenAI Labs在研的人机交互项目细节。

4 小时前
AI大模型厂商Anthropic近日宣布深化与谷歌、博通的长期算力合作协议,以应对当前大模型训练与推理需求的爆发式增长。最新披露数据显示,Anthropic当前年化运营收入已突破30亿美元,较去年同期实现超3倍增长,成为仅次于OpenAI的全球第二大独立生成式AI厂商,本次合作将围绕TPU芯片供应、云算力调度等维度展开。

6 小时前
2026年4月业内消息显示,随着Anthropic、OpenAI等厂商迭代新一代AI编程模型,代码编辑器Cursor加速普及,企业软件开发领域出现全新的代码过剩问题。谷歌调研数据显示当前90%软件开发者已使用AI编程工具,代码产能大幅提升的同时,人工审核、安全校验能力严重滞后,大量企业出现未处理代码积压,原有开发流程面临重构。

7 小时前
伴随Agentic AI(智能体人工智能)落地速度加快,自动化工具的误用风险正在快速上升。本次梳理出2026年职场人最易踩中的5类AI自动化使用错误,该类错误轻则拖慢工作效率、引发同事不满,重则触发数据泄露、团队信任崩塌,甚至直接损害个人职业声誉,相关避坑指南已成为当前职场AI应用领域的关注热点。

7 小时前
英伟达近期完成对开源集群调度工具Slurm的开发主体SchedMD的收购,引发全球AI计算领域对开源工具商业独立性的广泛讨论。据行业调研数据,当前全球超70%的AI训练GPU集群采用Slurm作为调度核心,其中近六成集群搭载多品牌异构GPU,此次收购后Slurm的开源属性与路线适配性成为企业用户核心关切。