SuperCLUE最新测评：豆包跻身全球第一梯队 MiMo数学获高分

AI创作导航管理员 LV4 资深连续登录7天萌新

3 个月前

风向

170

2026年3月30日，中文大模型权威基准测评SuperCLUE发布2026年3月最新测评结果，本次共有22款国内外主流大模型参评，覆盖六大核心能力维度。测评显示，字节跳动旗下豆包Doubao-Seed-2.0-pro以71.53分拿下国内第一，跻身全球第一梯队，与OpenAI GPT-5.4的分差已缩小至0.95分，小米MiMo在数学推理单项取得顶尖成绩，标志国产大模型进入高速追赶新阶段。

作为中文领域覆盖维度最全面的第三方大模型测评平台之一，本次SuperCLUE将数学推理、科学推理、代码生成、智能体任务规划等六大核心任务纳入考核，能够较为客观反映模型的综合实用能力，本次参评的22款模型涵盖了当前全球范围内最受关注的闭源、开源大模型，结果行业参考价值较高。

在总分榜单上，海外闭源头部模型依然凭借多年技术积累占据领先位置，Anthropic的Claude-Opus-4.6、Google的Gemini-3.1-Pro、OpenAI的GPT-5.4牢牢占据榜单前三，延续了海外大厂的先发优势。字节跳动旗下豆包Doubao-Seed-2.0-pro本次拿到71.53分的总成绩，不仅蝉联国产模型第一，还成功冲进全球前五，稳稳站在全球第一梯队行列。值得注意的是，豆包和第三名GPT-5.4的分差仅为0.95分，放在三年前，这样的分差几乎是不可能缩小的差距，足以体现国产头部模型的迭代速度。

大语言模型国产大模型豆包小米MiMo SuperCLUE

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

SuperCLUE最新测评：豆包跻身全球第一梯队 MiMo数学获高分

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

SuperCLUE最新测评：豆包跻身全球第一梯队 MiMo数学获高分

最新文章

X社区 · 无限公约

二狗PPT

特朗普政府宣布解除Anthropic两款旗舰AI模型出口管制

OceanBase发布湖库一体AI数据库 为AI Agent筑牢核心数据底座

新浪开源VibeThinker-3B，小参数模型比肩百倍规模大模型

AI落地缺标准化训练体系 超六成开发团队陷“盲飞”困境

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

OceanBase发布湖库一体AI数据库为AI Agent筑牢核心数据底座

AI落地缺标准化训练体系超六成开发团队陷“盲飞”困境