2026年3月17日举办的GTC大会上,英伟达正式推出Nemotron 3系列开源多模态模型家族,其中基于Blackwell架构深度优化的Nemotron 3 Ultra吞吐量效率较前代提升5倍,可适配复杂代码辅助、企业级工作流等场景,目前已获得CrowdStrike、ServiceNow等行业巨头的部署支持,同时亮相的还有面向物理AI、医疗领域的配套模型方案。
作为全球AI产业的年度技术风向标,英伟达GTC大会的每一次产品更新,都直接影响着下游开发、企业应用的技术路线选择。2026年的本次发布,英伟达没有继续堆高闭源大模型的参数天花板,反而选择给开源模型家族做“重量级扩容”,瞄准的正是高速增长的企业级AI落地需求。
本次发布的Nemotron 3是英伟达首个全栈开源多模态模型系列,覆盖从边缘端到数据中心的全场景部署需求。其中定位最高的Nemotron 3 Ultra针对Blackwell架构做了深度适配,吞吐量效率较前代提升5倍,可以同时承载多用户的复杂代码生成、企业工作流调度请求,推理成本直接降到原有水平的五分之一。
除了核心推理模型,该系列还补全了多模态交互的细分场景能力:Nemotron 3 Omni实现了音频、视频、文本能力的无缝整合,支持直接处理多模态输入的复杂指令;Nemotron 3 VoiceChat则打通了端到端的语音识别、大模型推理、语音合成链路,能提供毫秒级延迟的实时语音对话体验,适合智能客服、车载交互等场景。
目前该系列模型已经开放下载,网络安全厂商CrowdStrike、企业数字化服务商ServiceNow已经率先完成部署,将其用于各自的产品功能迭代。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
英伟达近期完成对开源集群调度工具Slurm的开发主体SchedMD的收购,引发全球AI计算领域对开源工具商业独立性的广泛讨论。据行业调研数据,当前全球超70%的AI训练GPU集群采用Slurm作为调度核心,其中近六成集群搭载多品牌异构GPU,此次收购后Slurm的开源属性与路线适配性成为企业用户核心关切。

9 小时前
近期凭借OpenClaw(俗称“小龙虾”)插件走红的国产大模型MiniMax 2.7,官方于2026年4月7日确认将于本周末在Hugging Face社区发布开源版本。该模型3月18日上线后调用量长期位居行业前列,SWE-Pro基准测试得分达56.22%接近顶尖闭源模型水平,开源后将大幅降低开发者Token调用成本,利好下游AI应用落地。

13 小时前
近日谷歌正式发布全开源Gemma4系列大模型,该系列通过底层架构创新实现性能跨级跃升,其中最小激活参数量仅3.8亿的版本,性能超越参数规模20倍的同类大模型。Gemma4覆盖2.3B到31B多参数档位,可直接部署于手机、轻薄本等消费级终端,将大幅降低通用AI落地门槛。

1 天前
谷歌旗下人工智能实验室DeepMind近日推出全新升级的AI音乐生成工具Lyria 3,支持文本提示词、图片两种输入方式,最快数秒即可生成演播室级、免版权的完整音乐作品,覆盖自定义歌词、拟真人声、专业编曲全环节,目前已获得全球超1万名音乐创作者的使用认可,新用户登录即可领取免费使用额度。

4 天前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

4 天前
2026年4月3日消息,2023年成立的印度AI初创公司Sarvam AI正式开启新一轮融资,计划募集3亿至3.5亿美元,由贝塞默风险投资领投,亚马逊、英伟达及沙特阿美旗下风投Prosperity7Ventures均在参投行列,融资完成后公司投后估值将达15亿至15.5亿美元,凸显全球资本对印度本土AI赛道的长期看好。

4 天前
2026年4月3日,Cursor团队正式推出代码编辑器Cursor 3版本,核心搭载智能体统一工作区,支持多智能体协同、本地与云端多代码仓库无缝切换,开发者可通过多终端启动智能体,将软件开发模式从传统人机协作升级为智能体自主工作阶段,可大幅降低跨环境开发的沟通与操作成本。

4 天前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。