2026年3月12日,英伟达(NVIDIA)正式发布专为AI智能体设计的开源大模型Nemotron 3 Super。该模型采用Mamba-MoE混合架构,总参数达1200亿、激活参数仅120亿,推理速度提升300%、吞吐量上涨5倍,支持1M超长上下文,多项权威测评表现突出,发布后迅速成为开源社区关注焦点。
在闭源大模型不断拉高性能上限的当下,开源阵营的效率突破往往更能牵动整个开发者生态的神经。英伟达此次发布的Nemotron 3 Super,没有一味堆高参数规模,而是瞄准AI智能体落地的核心痛点做了针对性优化,也让开源模型的商用价值再上一个台阶。
不同于传统大模型的Transformer架构,Nemotron 3 Super采用了创新的Mamba-MoE混合架构,总参数规模达到1200亿,但单次推理的激活参数仅为120亿,仅为总参数的十分之一。这种设计在保留大模型通用能力的同时,直接将推理速度提升300%,吞吐量更是暴涨5倍,大幅降低了大模型的部署和调用成本。
此外,该模型还支持1M超长上下文窗口,可一次性容纳数十万字的交互信息,有效解决了多智能体协同场景中常见的“目标跑偏”“上下文爆炸”等行业共性问题,为复杂任务的多智能体调度提供了稳定的底座支撑。
在Artificial Analysis发布的最新大模型评测榜单中,Nemotron 3 Super同时登顶效率榜与开放性榜两大核心榜单,综合任务表现已经接近闭源头部模型GPT-5.4的水平,打破了此前开源大模型与闭源产品之间的性能断层。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

15 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

15 小时前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

15 小时前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

15 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

15 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

15 小时前
2026年5月15日,埃隆·马斯克旗下人工智能公司xAI正式推出首款专业编程AI智能体Grok Build,进军高增速的开发者服务市场。该产品目前处于早期测试阶段,仅面向xAI付费订阅用户开放,可自动完成代码编写、逻辑构建等复杂编程任务。xAI总裁迈克尔·尼科尔斯明确将Anthropic旗下Claude列为核心对标目标,计划短期内追平行业标杆表现。

15 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。