2026年3月7日,商汤科技联合南洋理工大学发布全新多模态模型架构NEO-unify,这一成果彻底摒弃行业长期依赖的视觉编码器(VE)与变分自编码器(VAE),通过混合变换器(MoT)架构实现原生端到端的视觉语言融合,在2B参数规模下性能远超传统多模态范式,为多模态大模型研发带来颠覆性重构方向。
长期以来,多模态大模型的研发始终被“组件拼凑”的范式束缚——视觉编码器(VE)负责将像素转换为标准化特征,变分自编码器(VAE)处理生成任务的中间表征,这些中间环节不仅不可避免地损耗原始信息,更让模型陷入预训练先验固化、参数规模边际效益递减的双重瓶颈。直到NEO-unify的出现,这一延续多年的研发逻辑被彻底推翻。
在商汤科技与南洋理工大学的联合研发中,NEO-unify最具颠覆性的设计,就是彻底砍掉了所有中间编码器——包括行业依赖已久的VE和VAE。不同于传统多模态模型通过“视觉表征转换-语言对齐-生成解码”的多链路流程,NEO-unify直接以近乎无损的像素和文字作为原生输入,回归AI建模的第一性原理,彻底绕过了视觉表征标准之争带来的技术桎梏。
支撑这一设计的核心是混合变换器(MoT)架构。通过在同一个模型体系内融合视觉与语言的处理逻辑,MoT不仅实现了对视觉内容的深度理解,还打通了“理解-生成”的双向能力:既可以精准完成图文检索、视觉问答等感知任务,也能直接生成高保真的图文内容,真正实现了多模态能力的原生统一。
研发团队透露,NEO-unify在仅2B参数规模下,性能就远超传统多模态范式。这一结果打破了“性能依赖参数规模扩张”的行业惯性——传统多模态模型往往需要更大参数体量才能弥补中间编码器带来的信息损耗,而NEO-unify凭借无编码器设计,在保留高保真细节恢复能力的同时,还显著提升了数据与算力的利用效率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
27 分钟前
全球AI算力需求爆发背景下,英伟达投资的亚洲AI数据中心服务商Firmus近期披露最新估值达55亿美元。过去6个月内,该公司累计完成13.5亿美元融资,刷新AI基建领域同期融资纪录。作为主打高功率密度的AI算力基础设施提供商,Firmus的估值跳涨也印证了当前一级市场对算力上游环节的投资热度。

4 小时前
2026年4月业内消息显示,随着Anthropic、OpenAI等厂商迭代新一代AI编程模型,代码编辑器Cursor加速普及,企业软件开发领域出现全新的代码过剩问题。谷歌调研数据显示当前90%软件开发者已使用AI编程工具,代码产能大幅提升的同时,人工审核、安全校验能力严重滞后,大量企业出现未处理代码积压,原有开发流程面临重构。

5 小时前
伴随Agentic AI(智能体人工智能)落地速度加快,自动化工具的误用风险正在快速上升。本次梳理出2026年职场人最易踩中的5类AI自动化使用错误,该类错误轻则拖慢工作效率、引发同事不满,重则触发数据泄露、团队信任崩塌,甚至直接损害个人职业声誉,相关避坑指南已成为当前职场AI应用领域的关注热点。

5 小时前
近日,芯片厂商Intel被曝正在研发下一代移动处理器Serpent Lake,该芯片集成对标Nvidia RTX系列显卡的独立级AI计算单元,推理算力较当前14代酷睿提升300%,可本地运行70B参数大语言模型,有望2025年第二季度上市,为PC端AI应用普及带来硬件层面的重大突破。

10 小时前
2026年4月,亚马逊创始人杰夫·贝索斯旗下全新神秘AI实验室Project Prometheus宣布前OpenAI联合创始人Kyle Kosic正式入职。该实验室专注于开发可理解物理世界的先进人工智能系统,旨在突破现有大模型技术边界,打造更高自主性的智能系统,标志着贝索斯在AI前沿领域的布局进入落地阶段。

12 小时前
2026年4月初,英格兰依什米安超级联赛球队联合联正式签约全球首批AI职业球员Holly与Harvey,二者因无物理实体无法参与实际赛事,定位为俱乐部内容创作与品牌运营核心。4月7日联合联官宣已出售两名AI球员,收取数额未公开的虚拟转会费,该事件在足球界与科技界引发关于体育数字化边界的广泛讨论。

12 小时前
2026年4月国际大模型API分发平台OpenRouter公布的最新榜单显示,阿里旗下千问3.6 Plus登顶全球大模型周调用量榜首,且已连续4天霸榜日榜,该模型也成为平台上线以来首个单日调用量突破1万亿Token的大模型,标志着国产大模型凭借技术迭代、高性价比优势在全球市场的竞争力进一步提升。

13 小时前
印度人工智能初创企业Rocket于近期正式发布全新智能咨询平台,该平台跳出传统AI工具聚焦代码生成的限制,整合战略规划、产品搭建、竞争情报三大核心能力,可输出对标麦肯锡等头部咨询公司的专业分析报告,而服务成本仅为传统咨询的几分之一,大幅降低了中小微企业获取专业决策支持的门槛。