登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

商汤开源SenseNova U1原生多模态模型 破解拼接式架构痛点

2026年4月28日,商汤科技正式开源旗下“日日新SenseNova U1”原生理解生成统一多模态大模型。该产品基于商汤2026年3月自主研发的NEO-unify架构打造,突破传统多模态模型视觉、语言模块拼接导致的信息损耗瓶颈,实现单框架内理解、推理、生成能力深度融合,标志着国产多模态AI技术路径实现重要创新。

长期以来,全球多模态大模型的主流技术路径始终停留在“拼接式”设计阶段:独立训练的视觉理解模块和大语言模型通过接口耦合,相当于给“会说话的语言模型”外接了一个“视觉插件”。但两套系统的表征逻辑完全独立,信息跨空间传递时天然存在损耗,处理复杂图文推理、跨模态创作任务时的准确率和自然度始终存在明显天花板,这也是此前不少多模态产品常常出现图文匹配错误、理解偏差的核心原因。

SenseNova U1的核心价值,正是彻底跳脱了延续多年的拼接式设计思路。该系列模型基于商汤2026年3月刚刚自研落地的NEO-unify统一架构打造,首次在单一模型框架内构建了通用的多模态表征空间,视觉信号和语言信号无需经过额外转译即可直接协同处理,实现了多模态理解、逻辑推理、内容生成三类能力的原生打通。

从实测表现来看,相较同参数级别的拼接式多模态模型,SenseNova U1在复杂工业图纸解读、图文交叉推理、多模态内容创作等核心场景的测试得分平均提升超32%,同时推理效率还提升了27%,能够同时满足高精度、低延迟的落地需求。本次商汤也同步开放了不同参数规格的模型权重,允许开发者免费用于商用场景,大幅降低了多模态应用的研发门槛。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创