2026年6月10日,AI企业Anthropic正式推出第五代Claude系列两款大模型:面向通用场景的Claude Fable5与面向专业领域的Claude Mythos5。前者在SWE-Bench Pro真实编程测试中拿下80.3%的高分,较GPT5.5领先超21个百分点,后者则在跨学科科研任务上实现突破性进展,目前已结束预览正式开放。

在行业普遍认为大模型通用能力增长进入平台期的当下,80.3%的SWE-Bench Pro得分足以震动整个AI圈。该测试要求模型在无任何外部辅助的前提下,解决GitHub上真实存在的复杂软件工程问题,此前行业头部模型的得分普遍在60%以下,即便是此前公认编程能力最强的Claude Opus4.8,得分也仅为69.2%。
过去几年大模型的技术竞争始终围绕通用榜单跑分展开,随着参数红利逐步见顶,头部厂商纷纷将重点转向场景化能力的适配。Anthropic此前凭借Claude系列的长上下文处理能力、高安全合规性,在企业级市场占据了稳定的份额,此次推出的两款同基座差异化模型,正是其应对场景化竞争的核心布局。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录