2026年3月30日,中文大模型权威基准测评SuperCLUE发布2026年3月最新测评结果,本次共有22款国内外主流大模型参评,覆盖六大核心能力维度。测评显示,字节跳动旗下豆包Doubao-Seed-2.0-pro以71.53分拿下国内第一,跻身全球第一梯队,与OpenAI GPT-5.4的分差已缩小至0.95分,小米MiMo在数学推理单项取得顶尖成绩,标志国产大模型进入高速追赶新阶段。
作为中文领域覆盖维度最全面的第三方大模型测评平台之一,本次SuperCLUE将数学推理、科学推理、代码生成、智能体任务规划等六大核心任务纳入考核,能够较为客观反映模型的综合实用能力,本次参评的22款模型涵盖了当前全球范围内最受关注的闭源、开源大模型,结果行业参考价值较高。
在总分榜单上,海外闭源头部模型依然凭借多年技术积累占据领先位置,Anthropic的Claude-Opus-4.6、Google的Gemini-3.1-Pro、OpenAI的GPT-5.4牢牢占据榜单前三,延续了海外大厂的先发优势。字节跳动旗下豆包Doubao-Seed-2.0-pro本次拿到71.53分的总成绩,不仅蝉联国产模型第一,还成功冲进全球前五,稳稳站在全球第一梯队行列。值得注意的是,豆包和第三名GPT-5.4的分差仅为0.95分,放在三年前,这样的分差几乎是不可能缩小的差距,足以体现国产头部模型的迭代速度。
除了综合能力的快速提升,国产大模型在细分能力赛道的突破同样值得关注,小米自研的MiMo大模型本次就在数学推理单项中脱颖而出,拿下国产模型第一的成绩,全球排名也进入前五,展现了国产大模型走垂直优化路线的成果。
而在智能体任务规划这一对标下一代AI应用的核心能力维度,豆包也取得了接近海外头部模型的成绩,说明国产模型并没有只盯着总分追赶,而是已经提前布局下一代AI的核心竞争力。
从过去几年SuperCLUE的测评结果变化能看出,国产大模型的进步速度远超行业初期预期,2024年时,国产头部模型和GPT-4的分差还在5分以上,仅仅两年时间,头部国产模型和最新GPT系列的分差已经缩小到1分以内,这种追赶速度是行业大量研发投入堆叠的必然结果。
业内观点普遍认为,当前国产大模型已经完成了从“跟跑”到“并跑”的转变,接下来随着中文场景训练数据优势的释放、国内算力基础设施的逐步完善,1到2年内国产头部模型就有望在综合能力上实现对海外主流闭源模型的超越,进一步推动AI在国内各行业的落地。

13 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

13 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

14 小时前
2026年3月30日,埃隆·马斯克旗下AI创业公司xAI曝出核心人事变动,公司最后一位联合创始人、原谷歌DeepMind明星工程师Tony Wu确认离职。这意味着xAI2023年成立时招募的12位来自OpenAI、谷歌、微软的顶尖创始成员,在成立不到三年内已全部流失,此事引发业内对xAI技术研发连续性、内部管理的广泛讨论,也折射出当前AI大模型赛道人才争夺的激烈现状。

16 小时前
2026年3月30日,国内权威大模型测评基准SuperCLUE发布最新综合性测评报告。本次测评覆盖全球主流大模型,结果显示字节跳动旗下豆包Doubao-pro跻身全球大模型第一梯队,可与国际顶级模型正面竞争,小米自研MiMo大模型首次登榜,国产大模型整体在中文理解等多维度能力显著提升,集体向OpenAI GPT-4看齐,引发行业对国产大模型进展的广泛讨论。

20 小时前
2026年3月30日,国内大模型产品千问正式上线AI打车、AI充话费等一系列“AI办事”新功能,同步启动用户体验官招募计划,3月30日至4月6日期间每日开放100万体验名额,参与者可领取最高17元体验补贴,平台将基于用户反馈优化AI对复杂场景意图的理解与执行能力,推动通用人工智能落地真实生活场景。

20 小时前
2026年3月30日消息,科技巨头谷歌与AI独角兽Anthropic达成里程碑式融资协议,谷歌将投入数十亿美元,为后者建设专属AI数据中心算力基地。此次合作标志着全球AI领域的竞争已从大模型技术研发层面,延伸到底层算力基础设施的布局,算力正成为科技巨头划分AI赛道势力范围的核心筹码。

21 小时前
2026年3月30日披露的合作信息显示,科技巨头谷歌将向AI独角兽Anthropic提供数十亿美元定向融资,专项用于后者租用谷歌数据中心的算力开支。作为OpenAI的核心竞品,Anthropic当前估值已突破3500亿美元,此次合作标志着双方从股权投资到算力基建的绑定进一步深化,凸显算力在大模型竞争中的核心地位。

21 小时前
2026年3月,据知名科技记者马克·古尔曼在《Power On》通讯中的爆料,苹果计划在iOS27系统中推出激进AI策略:一方面深度集成自研Apple Intelligence能力,另一方面向第三方开放Siri与Apple Intelligence底层接口,同时在App Store增设独立AI应用专区,允许用户自由安装第三方AI机器人,以此在全球AI竞赛中缩小与竞品的差距。