2026年3月12日,英伟达(NVIDIA)正式发布专为AI智能体设计的开源大模型Nemotron 3 Super。该模型采用Mamba-MoE混合架构,总参数达1200亿、激活参数仅120亿,推理速度提升300%、吞吐量上涨5倍,支持1M超长上下文,多项权威测评表现突出,发布后迅速成为开源社区关注焦点。
在闭源大模型不断拉高性能上限的当下,开源阵营的效率突破往往更能牵动整个开发者生态的神经。英伟达此次发布的Nemotron 3 Super,没有一味堆高参数规模,而是瞄准AI智能体落地的核心痛点做了针对性优化,也让开源模型的商用价值再上一个台阶。
不同于传统大模型的Transformer架构,Nemotron 3 Super采用了创新的Mamba-MoE混合架构,总参数规模达到1200亿,但单次推理的激活参数仅为120亿,仅为总参数的十分之一。这种设计在保留大模型通用能力的同时,直接将推理速度提升300%,吞吐量更是暴涨5倍,大幅降低了大模型的部署和调用成本。
此外,该模型还支持1M超长上下文窗口,可一次性容纳数十万字的交互信息,有效解决了多智能体协同场景中常见的“目标跑偏”“上下文爆炸”等行业共性问题,为复杂任务的多智能体调度提供了稳定的底座支撑。
在Artificial Analysis发布的最新大模型评测榜单中,Nemotron 3 Super同时登顶效率榜与开放性榜两大核心榜单,综合任务表现已经接近闭源头部模型GPT-5.4的水平,打破了此前开源大模型与闭源产品之间的性能断层。
作为一款完全开源的大模型,Nemotron 3 Super允许开发者免费商用、自主微调,无需像闭源模型一样受限于API调用额度和数据安全限制,对需要定制化AI智能体方案的企业而言吸引力极强。
此前AI智能体的落地一直受限于两大瓶颈:一是高配置大模型的推理成本过高,中小团队难以负担;二是现有模型的上下文长度不足,无法支撑多轮复杂协同任务。Nemotron 3 Super的出现刚好同时解决了这两个问题,也为AI智能体从demo阶段走向规模化商用扫清了核心障碍。
从英伟达的全栈布局来看,从底层GPU算力,到中间层大模型底座,再到上层的智能体开发工具,英伟达已经形成了完整的AI生态闭环,此次开源模型的发布也将进一步巩固其在AI基础设施领域的主导地位。
据了解,英伟达后续还将推出配套的微调工具包和轻量化部署方案,覆盖从边缘设备到云端算力集群的全场景部署需求,进一步降低AI智能体的开发门槛。

1 小时前
2026年3月31日,美国加利福尼亚州政府宣布将推进全美最严AI监管法案,无视特朗普政府放宽AI产业约束的号召,重点覆盖模型训练透明度、灾难性风险预防等维度,要求头部AI企业提交详细合规报告。此举旨在填补联邦层面AI安全治理真空,也直接加剧了州政府与联邦在技术主权领域的博弈。

1 小时前
2026年3月31日,AI接入层头部初创公司LiteLLM正式宣布全面移除平台内争议辅助工具Delve,回应开发者社区关于该工具数据隐私、模型透明度的质疑。LiteLLM创始人公开承认此前合作伙伴安全评估存在疏漏,团队将剔除全部关联代码,转向可审计的开源替代方案,该事件也暴露出AI中间层架构平衡效率与安全的行业共性难题。

1 小时前
2026年3月31日,开源AI项目OpenClaw创始人在全球AI架构创新峰会上正式提出,2026年将成为通用AI代理爆发元年。当前AI正从聊天机器人进化为可自主处理复杂工作流的智能数字员工,具备跨平台操作、任务逻辑拆解能力,其落地将彻底重塑现有SaaS软件格局与大众办公习惯。

2 小时前
2026年3月30日消息,国产大模型厂商月之暗面(Moonshot AI)旗下Kimi K2.5大模型发布仅1个月,公司年度经常性收入(ARR)已正式突破1亿美金,创下国内大模型赛道商业化变现新纪录。伴随产品性能大幅提升,Kimi API算力配额供不应求,已有企业客户开出千万美元级预付承诺锁定优先供应权。

2 小时前
2026年3月,全球大模型聚合路由平台OpenRouter发布最新监测数据显示,国产大模型全球调用量已连续1个月超越海外模型,上周Top9上榜模型中国产占6席,总调用量达9.82T,较此前一周增长33.4%;海外仅Anthropic等2家入榜,总调用量下滑15.4%。此轮增长核心驱动力为OpenClaw平台走红,智谱CEO张鹏指出AI Agent时代算力需求正出现非线性增长。

2 小时前
欧洲本土AI龙头企业Mistral AI近日完成8.3亿美元债务融资,由7家国际银行组成的银团提供支持。资金将用于在巴黎近郊建设旗舰AI数据中心,计划部署超1.3万块英伟达GB300 GPU,总供电容量达44MW,预计2026年二季度投运,此举将大幅提升欧洲本土AI算力储备,强化区域AI发展自主权。

2 小时前
2026年3月31日,微软宣布对旗下365 Copilot研究代理功能进行重磅更新,首次支持用户在同一研究任务中同时调用OpenAI旗下GPT模型与Anthropic旗下Claude模型,通过「GPT草拟初稿、Claude评审校验」的分工模式实现跨厂商大模型能力整合,为深度研究场景的AI应用提供了全新范式。

2 小时前
据MIT科技评论2026年3月30日发布的专项报道,记者Grace Huckins调研发现,当前全球获批及待上线的AI医疗工具数量较2023年增长超270%,涵盖专科问诊、慢病管理、影像筛查等多个场景,但仅有不足19%的工具通过了大规模真实世界临床验证,其实际效用与潜在风险尚未形成统一评估标准,引发医疗与AI领域的双重讨论。