登录体验完整功能(收藏、点赞、评论等) — 已累计有 11660 人加入

Anthropic发布第五代Claude 编程与专业能力登顶行业基准

详情页推荐

2026年6月10日,AI企业Anthropic正式推出第五代Claude系列两款大模型:面向通用场景的Claude Fable5与面向专业领域的Claude Mythos5。前者在SWE-Bench Pro真实编程测试中拿下80.3%的高分,较GPT5.5领先超21个百分点,后者则在跨学科科研任务上实现突破性进展,目前已结束预览正式开放。

配图

在行业普遍认为大模型通用能力增长进入平台期的当下,80.3%的SWE-Bench Pro得分足以震动整个AI圈。该测试要求模型在无任何外部辅助的前提下,解决GitHub上真实存在的复杂软件工程问题,此前行业头部模型的得分普遍在60%以下,即便是此前公认编程能力最强的Claude Opus4.8,得分也仅为69.2%。

过去几年大模型的技术竞争始终围绕通用榜单跑分展开,随着参数红利逐步见顶,头部厂商纷纷将重点转向场景化能力的适配。Anthropic此前凭借Claude系列的长上下文处理能力、高安全合规性,在企业级市场占据了稳定的份额,此次推出的两款同基座差异化模型,正是其应对场景化竞争的核心布局。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。