登录体验完整功能(收藏、点赞、评论等) — 已累计有 11063 人加入

英伟达发布Nemotron 3 Ultra 550B参数混合架构开源大模型适配长周期智能体

详情页推荐

英伟达AI部门近期正式推出开源大模型Nemotron 3 Ultra,该模型采用混合专家(MoE)架构,总参数达550B,融合了Mamba与Transformer两种技术路径的优势,专为长周期运行的AI智能体场景优化。本次发布填补了开源高参数大模型在长上下文智能体适配领域的空白,有望推动Agentic AI领域的研发效率进一步提升。

配图

就在Agentic AI赛道融资热度连续8个季度走高的节点,英伟达这款定位明确的开源大模型,直接击中了当前行业最核心的研发痛点。

近两年来,AI智能体已经从概念验证阶段走向小规模落地,覆盖了企业服务、工业调度、科研辅助等多个场景,但研发端的瓶颈始终十分突出。行业调研数据显示,超过62%的智能体研发团队表示,开源模型的长运行稳定性不足是最大的研发障碍:传统Transformer架构的高参数开源模型普遍存在长上下文注意力衰退的问题,连续运行超过24小时后工具调用准确率会下降40%以上,而闭源API又存在成本高、数据无法留存在本地等问题,无法满足工业级场景的需求。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。