2026年3月30日,国内权威大模型测评基准SuperCLUE发布最新综合性测评报告。本次测评覆盖全球主流大模型,结果显示字节跳动旗下豆包Doubao-pro跻身全球大模型第一梯队,可与国际顶级模型正面竞争,小米自研MiMo大模型首次登榜,国产大模型整体在中文理解等多维度能力显著提升,集体向OpenAI GPT-4看齐,引发行业对国产大模型进展的广泛讨论。
本次SuperCLUE测评围绕大模型全场景能力设置十余个核心打分维度,测评结果在国内AI领域具备较高的行业参考价值。字节跳动旗下豆包(Doubao-pro)是本次测评中表现最突出的国产模型,不仅基础对话质量获得高分评价,在复杂任务规划、长文本处理两个高难度维度上,也展现出远超上一轮测评的稳定性,最终总分成功跻身全球大模型第一梯队,具备了和GPT-4等国际顶级模型正面竞争的能力。
除豆包外,百度文心一言、阿里通义千问等头部国产模型依然稳居榜单前列,进一步验证了国内头部厂商在语料积累、人类对齐技术上的长期投入已经形成深厚壁垒。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录