登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

Anthropic发布Claude Opus 4.7 主打可靠性编程跑分反超头部竞品

2026年4月17日,AI大模型厂商Anthropic正式推出Claude Opus 4.7版本,该版本未沿袭行业常规的参数堆料路线,重点升级可靠性而非单纯提升智能上限。其在硬核编程基准测试SWE-bench Pro中得分达64.3%,较前代提升近11个百分点,性能超过OpenAI GPT-5.4、谷歌Gemini 3.1 Pro等头部竞品,引发行业高度关注。

和此前行业所有新品发布都要强调“史上最强”的惯例不同,Anthropic在Claude Opus 4.7的发布公告里开篇就明确表示,“这并非我们最强大的模型”,市场期待已久的下一代旗舰模型Claude Mythos Preview依然没有放出上线时间表。

在Anthropic看来,当前大模型落地的最大痛点并非“不够聪明”,而是“输出不稳定”——不管是代码生成、多模态识别还是工具调用,偶发的幻觉、低级错误足以抵消所有“超水平发挥”的价值,这也是很多企业不敢将大模型接入核心生产流程的核心原因。

此次Claude Opus 4.7的迭代逻辑完全围绕“降低出错概率”展开,并未刻意提升通用场景的解题上限,反而针对企业用户使用频率最高的编程、多模态识别、工具调用三大场景做了专项优化。

作为主打可靠性的升级版本,Claude Opus 4.7的实测成绩超出了市场预期。在最考验代码落地能力的硬核编程基准SWE-bench Pro测试中,该版本得分从前代的53.4%跃升至64.3%,单代涨幅接近11个百分点,直接超过了OpenAI GPT-5.4的57.7%、谷歌Gemini 3.1 Pro的54.2%,登顶当前公开测试的大模型编程性能榜首。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创