Anthropic发布Sonnet 4.6 上下文窗口翻倍至百万Token

2 小时前 AI快讯 0

2月18日，AI厂商Anthropic按每四个月一次的既定节奏推出中等规模模型Sonnet 4.6，核心升级将上下文窗口翻倍至100万Token，可单次处理完整代码库或长篇合同。新版本在代码能力、指令遵循等维度均有显著提升，类人智能测试得分超越多数同级别对手，且将成为免费与Pro版用户的默认模型。

在AI模型迭代速度日益加快的今天，Anthropic始终保持着对中等规模模型的高频更新，每四个月一次的Sonnet系列升级，已成为其巩固市场竞争力的重要策略。此次发布的Sonnet 4.6，在延续系列模型“性能与成本平衡”核心优势的基础上，带来了几项关键突破，直接击中了用户处理大型文档和复杂任务的痛点。

最引人注目的无疑是上下文窗口翻倍至100万Token——这意味着模型单次请求可容纳约75万字的文本内容，相当于一整套完整的代码库、数百页的商业合同或长篇学术专著。在此之前，多数中等规模模型的上下文窗口多在50万Token以内，用户处理大型文件时不得不反复拆分内容，不仅效率低下，还容易丢失全局上下文信息。而Sonnet 4.6的升级，让开发者无需拆分代码库即可分析整个项目的依赖逻辑，企业法务团队能一次性完成对多份关联合同的合规审查，大幅降低了复杂任务的处理门槛。

除了上下文窗口的跨越式升级，Sonnet 4.6在核心能力上也有针对性优化。Anthropic在官方公告中重点提及了代码能力、指令遵循与计算机操作三个维度的提升：在代码任务中，模型编写复杂函数、调试bug的准确率较上一代提升约12%，能更好理解开发者的业务需求；指令遵循方面，对多步骤、模糊化需求的响应精度提升，减少了用户反复调整提示词的成本；计算机操作能力则体现在控制浏览器、执行自动化脚本等场景的稳定性增强，能更高效完成办公自动化任务。

性能测试数据也印证了Sonnet 4.6的进步：在衡量类人推理能力的ARC-AGI-2测试中，模型取得了60.4%的得分。尽管这一成绩不及Anthropic旗舰模型Claude 3 Opus（约73%），但已远超行业内多数同级别中等规模模型，甚至逼近部分早期旗舰模型的水平。这一表现意味着，Sonnet 4.6在兼顾成本优势的同时，已经具备了处理复杂推理任务的能力。

值得注意的是，Sonnet 4.6将成为免费版与Pro版用户的默认模型——这意味着无论是普通用户还是付费用户，都能直接享受到新版本的所有升级，无需额外付费切换模型。对于企业用户而言，这一策略进一步降低了AI工具的普及成本，中型团队无需承担旗舰模型的高昂费用，就能获得满足日常需求的高效AI能力。

行业分析师指出，中等规模AI模型正在成为市场的核心增长极：旗舰模型虽然性能顶尖，但训练和部署成本极高，仅适合特定高价值场景；小型模型则在复杂任务中力有不逮；而中等规模模型恰好填补了这一空白，兼顾性能与性价比，是当前绝大多数个人用户和中小企业的首选。Anthropic此次的Sonnet 4.6升级，不仅巩固了自身在这一赛道的领先地位，也为行业设定了中等规模模型的新标杆。

随着AI模型上下文窗口的不断扩大，以及核心能力的持续优化，未来AI工具将能处理更复杂、更庞大的任务。对于Anthropic而言，每四个月一次的稳定迭代，正在逐步构建起覆盖不同需求的AI产品矩阵，而Sonnet 4.6的推出，也让市场对其后续旗舰模型的升级充满期待。

本文内容来源于公开互联网信息，并包含平台新增内容及用户发布内容，旨在进行知识整理与分享。文中所有信息与观点均仅供参考，不代表任何官方或特定立场，亦不构成任何操作或决策建议，请读者谨慎甄别，详情请见完整免责声明

所属分类

AI快讯

Anthropic发布Sonnet 4.6 上下文窗口翻倍至百万Token

Anthropic拒向军方开放Claude军事权限 2亿美元合作濒临破裂