2026年4月29日公开的SuperCLUE-VLM最新中文多模态视觉语言模型测评结果显示,字节跳动旗下Doubao-Seed-2.0-Pro-260215以90.66分的总得分位列17款参测国内外模型榜首,超越谷歌Gemini-3.1-Pro-Preview的89.35分。本次测评覆盖基础认知、视觉推理、视觉应用三大维度25项细分任务,阿里Qwen3.5系列、商汤SenseNova、智谱GLM等国产模型均跻身前列。
过去三年,中文多模态视觉语言模型(VLM)的第三方测评头部位置长期被海外科技厂商垄断,国产模型最好成绩仅能进入前五,而最新出炉的榜单彻底改写了这一行业固有认知。
本次SuperCLUE-VLM测评共纳入17款国内外主流视觉大模型,测试维度覆盖基础认知、视觉推理、视觉应用三大方向,包含通用物体识别、复杂场景推理、医疗影像判读等25项细分任务,是目前国内覆盖场景最全面的中文VLM专项测评之一。
字节跳动旗下Doubao-Seed-2.0-Pro-260215以90.66分的综合得分拿下总榜第一,比排名第二的谷歌Gemini-3.1-Pro-Preview高出1.31分,这也是国产视觉大模型首次在全维度综合测评中超越谷歌旗下的旗舰多模态产品。
除了豆包之外,其余上榜的国产模型表现同样亮眼:阿里巴巴Qwen3.5视觉版、商汤SenseNova多模态模型、智谱GLM-4V分别拿下总榜第三、第五、第六名,而此前被普遍看好的OpenAI GPT-5.4仅排在总榜第八位,落入中游区间。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 分钟前
2026年4月29日,英伟达正式发布开放式多模态大模型Nemotron 3 Nano Omni,采用30B-A3B混合专家架构,原生集成音视觉编码器无需额外感知模型,推理效率较传统方案提升9倍,在复杂文档解析、音视频理解等领域表现优异,跻身六大权威评测榜单前列,H Company首席执行官Gautier Cloix称其为智能体技术的重要突破。

1 小时前
2026年4月28日,商汤科技正式开源旗下“日日新SenseNova U1”原生理解生成统一多模态大模型。该产品基于商汤2026年3月自主研发的NEO-unify架构打造,突破传统多模态模型视觉、语言模块拼接导致的信息损耗瓶颈,实现单框架内理解、推理、生成能力深度融合,标志着国产多模态AI技术路径实现重要创新。

1 小时前
2026年4月28日,商汤科技正式发布并开源日日新SenseNova U1系列原生多模态模型,该产品基于商汤2026年3月自主研发的NEO-unify架构,摒弃主流拼接式设计,去除视觉编码器与变分自编码器,首次在单一框架下实现多模态理解、推理与生成的深度统一,标志着多模态AI从“集成式”向“原生统一”的核心技术跨越。

2 小时前
当地时间2026年4月28日,英伟达正式推出开放式多模态大模型Nemotron3Nano Omni,该产品采用30B-A3B混合专家架构,内置视觉与音频编码器,可同步处理视频、音频、图像、文本四类内容。官方数据显示其吞吐量为同类开放式全向模型的9倍,在六大权威多模态能力排行榜中均位列第一,可大幅降低开发者部署AI应用的成本。

3 小时前
2026年4月SuperCLUE-VLM视觉语言大模型评测报告正式发布,在对全球17款主流多模态产品的深度横评中,字节跳动旗下Doubao-Seed-2.0-Pro-260215以90.66分力压谷歌Gemini-3.1-Pro-Preview登顶总榜,阿里Qwen3.5、商汤SenseNova、智谱GLM等多款国产模型跻身第一梯队,国产阵营综合得分整体反超海外顶尖产品。

6 小时前
近日全球科技行业消费级AI赛道热度持续攀升,OpenAI ChatGPT、Google Gemini、微软Copilot、苹果Apple Intelligence等头部产品迭代加速,DeepSeek、Perplexity、X平台Grok等垂类工具用户增速超30%,当前全球消费级AI月活跃用户已突破18亿,不同技术路线的产品差异化竞争格局已经基本形成。

19 小时前
2026年4月28日,美图公司旗下AI智能体产品RoboNeo正式接入阿里巴巴ATH创新事业部研发的多模态视频生成模型HappyHorse,结合自身Seedance 2.0技术完成视频创作能力的全面迭代。瑞银发布的行业报告显示,RoboNeo自2025年7月上线后增长迅猛,2026年3月全球环比增长近4倍,曾多次登顶多国应用商店下载榜单。

21 小时前
2026年4月,据知情人士透露,全球头部AI开发机构OpenAI近期未能完成内部设定的年度收入目标,这是继此前ChatGPT用户增长未达标后,该公司再度传出业绩不及预期的消息。当前谷歌Gemini大模型使用量激增,核心竞争对手Anthropic成立五年收入已接近追平OpenAI,全球大语言模型市场的竞争格局正快速重构。