登录体验完整功能(收藏、点赞、评论等)

英伟达GTC 2026发布Nemotron 3 开源模型推理效率升5倍

2026年3月17日举办的GTC大会上,英伟达正式推出Nemotron 3系列开源多模态模型家族,其中基于Blackwell架构深度优化的Nemotron 3 Ultra吞吐量效率较前代提升5倍,可适配复杂代码辅助、企业级工作流等场景,目前已获得CrowdStrike、ServiceNow等行业巨头的部署支持,同时亮相的还有面向物理AI、医疗领域的配套模型方案。

作为全球AI产业的年度技术风向标,英伟达GTC大会的每一次产品更新,都直接影响着下游开发、企业应用的技术路线选择。2026年的本次发布,英伟达没有继续堆高闭源大模型的参数天花板,反而选择给开源模型家族做“重量级扩容”,瞄准的正是高速增长的企业级AI落地需求。


本次发布的Nemotron 3是英伟达首个全栈开源多模态模型系列,覆盖从边缘端到数据中心的全场景部署需求。其中定位最高的Nemotron 3 Ultra针对Blackwell架构做了深度适配,吞吐量效率较前代提升5倍,可以同时承载多用户的复杂代码生成、企业工作流调度请求,推理成本直接降到原有水平的五分之一。

除了核心推理模型,该系列还补全了多模态交互的细分场景能力:Nemotron 3 Omni实现了音频、视频、文本能力的无缝整合,支持直接处理多模态输入的复杂指令;Nemotron 3 VoiceChat则打通了端到端的语音识别、大模型推理、语音合成链路,能提供毫秒级延迟的实时语音对话体验,适合智能客服、车载交互等场景。

目前该系列模型已经开放下载,网络安全厂商CrowdStrike、企业数字化服务商ServiceNow已经率先完成部署,将其用于各自的产品功能迭代。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创