当地时间2026年4月28日,英伟达正式推出开放式多模态大模型Nemotron3Nano Omni,该产品采用30B-A3B混合专家架构,内置视觉与音频编码器,可同步处理视频、音频、图像、文本四类内容。官方数据显示其吞吐量为同类开放式全向模型的9倍,在六大权威多模态能力排行榜中均位列第一,可大幅降低开发者部署AI应用的成本。
近两年企业级AI智能体的落地潮中,多模态能力的适配始终是核心难点。市面上绝大多数多模态方案都采用「大语言模型外挂独立感知模块」的拼接式设计,不仅跨模态上下文衔接不畅、理解准确率偏低,多重模型调用也会拉高推理成本、拉长响应延迟,不少企业都卡在「效果和成本二选一」的落地困境中。
过去几年,多模态大模型的能力边界不断拓展,但落地端的痛点始终没有得到根本解决。为了实现对图像、音频、视频等非文本内容的处理,大多数厂商选择在通用大语言模型之外,额外接入独立的视觉识别、语音识别模型,再通过中间层做数据对齐。
这种模式下,不同模态的信息无法在同一上下文空间内交互,很容易出现「用户发了带文字的图片,AI只能识别图片内容却读不懂图中文字」的低级错误,同时多轮接口调用也会让推理成本翻倍,高并发场景下的延迟甚至能到秒级,完全达不到实时交互的要求。
英伟达此次推出的Nemotron3Nano Omni,核心创新就是从架构层面解决了多模态拼接的问题。该模型采用30B-A3B混合专家(MoE)架构,首次将视觉编码器、音频编码器直接集成到模型的原生架构中,所有模态的数据都能在统一的上下文空间内处理,彻底告别了过去碎片化的信息流转模式。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月29日,英伟达正式发布开放式多模态大模型Nemotron 3 Nano Omni,采用30B-A3B混合专家架构,原生集成音视觉编码器无需额外感知模型,推理效率较传统方案提升9倍,在复杂文档解析、音视频理解等领域表现优异,跻身六大权威评测榜单前列,H Company首席执行官Gautier Cloix称其为智能体技术的重要突破。

2 小时前
2026年4月28日,商汤科技正式开源旗下“日日新SenseNova U1”原生理解生成统一多模态大模型。该产品基于商汤2026年3月自主研发的NEO-unify架构打造,突破传统多模态模型视觉、语言模块拼接导致的信息损耗瓶颈,实现单框架内理解、推理、生成能力深度融合,标志着国产多模态AI技术路径实现重要创新。

2 小时前
2026年4月28日,商汤科技正式发布并开源日日新SenseNova U1系列原生多模态模型,该产品基于商汤2026年3月自主研发的NEO-unify架构,摒弃主流拼接式设计,去除视觉编码器与变分自编码器,首次在单一框架下实现多模态理解、推理与生成的深度统一,标志着多模态AI从“集成式”向“原生统一”的核心技术跨越。

3 小时前
2026年4月29日公开的SuperCLUE-VLM最新中文多模态视觉语言模型测评结果显示,字节跳动旗下Doubao-Seed-2.0-Pro-260215以90.66分的总得分位列17款参测国内外模型榜首,超越谷歌Gemini-3.1-Pro-Preview的89.35分。本次测评覆盖基础认知、视...

4 小时前
2026年4月SuperCLUE-VLM视觉语言大模型评测报告正式发布,在对全球17款主流多模态产品的深度横评中,字节跳动旗下Doubao-Seed-2.0-Pro-260215以90.66分力压谷歌Gemini-3.1-Pro-Preview登顶总榜,阿里Qwen3.5、商汤SenseNova、智谱GLM等多款国产模型跻身第一梯队,国产阵营综合得分整体反超海外顶尖产品。

9 小时前
近日,芯片厂商英伟达在官方驱动更新博客中低调披露新版GeForce RTX 5070 GPU,该产品针对生成式AI本地运行需求强化Tensor Core性能,较上一代同级别产品AI推理算力提升约35%,可支持7B参数大语言模型本地流畅运行,面向消费级PC用户补齐AI应用硬件短板。

20 小时前
2026年4月28日,美图公司旗下AI智能体产品RoboNeo正式接入阿里巴巴ATH创新事业部研发的多模态视频生成模型HappyHorse,结合自身Seedance 2.0技术完成视频创作能力的全面迭代。瑞银发布的行业报告显示,RoboNeo自2025年7月上线后增长迅猛,2026年3月全球环比增长近4倍,曾多次登顶多国应用商店下载榜单。

1 天前
2026年4月27日,日本AI创业公司LifePrompt公布最新测试结果:搭载OpenAI最新模型的ChatGPT,在日本顶尖学府东京大学、京都大学本科入学考试中取得远超录取线的成绩。其中东大理科三类医学方向入学考中,ChatGPT斩获数学满分,总分较人类考生最高分高出50分,打破人类状元纪录,较2024年测试的“落榜”表现实现跨越式突破。