登录体验完整功能(收藏、点赞、评论等) — 已累计有 8663 人加入

让AI触手可及,让应用激发潜能

SuperCLUE最新测评:豆包跻身全球第一梯队 MiMo数学获高分

2026年3月30日,中文大模型权威基准测评SuperCLUE发布2026年3月最新测评结果,本次共有22款国内外主流大模型参评,覆盖六大核心能力维度。测评显示,字节跳动旗下豆包Doubao-Seed-2.0-pro以71.53分拿下国内第一,跻身全球第一梯队,与OpenAI GPT-5.4的分差已缩小至0.95分,小米MiMo在数学推理单项取得顶尖成绩,标志国产大模型进入高速追赶新阶段。

作为中文领域覆盖维度最全面的第三方大模型测评平台之一,本次SuperCLUE将数学推理、科学推理、代码生成、智能体任务规划等六大核心任务纳入考核,能够较为客观反映模型的综合实用能力,本次参评的22款模型涵盖了当前全球范围内最受关注的闭源、开源大模型,结果行业参考价值较高。

在总分榜单上,海外闭源头部模型依然凭借多年技术积累占据领先位置,Anthropic的Claude-Opus-4.6、Google的Gemini-3.1-Pro、OpenAI的GPT-5.4牢牢占据榜单前三,延续了海外大厂的先发优势。字节跳动旗下豆包Doubao-Seed-2.0-pro本次拿到71.53分的总成绩,不仅蝉联国产模型第一,还成功冲进全球前五,稳稳站在全球第一梯队行列。值得注意的是,豆包和第三名GPT-5.4的分差仅为0.95分,放在三年前,这样的分差几乎是不可能缩小的差距,足以体现国产头部模型的迭代速度。

除了综合能力的快速提升,国产大模型在细分能力赛道的突破同样值得关注,小米自研的MiMo大模型本次就在数学推理单项中脱颖而出,拿下国产模型第一的成绩,全球排名也进入前五,展现了国产大模型走垂直优化路线的成果。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创