Anthropic发布Sonnet 4.6 上下文窗口翻倍至百万Token

2 小时前 AI快讯 0

Anthropic发布Sonnet 4.6 上下文窗口翻倍至百万Token

2月18日,AI厂商Anthropic按每四个月一次的既定节奏推出中等规模模型Sonnet 4.6,核心升级将上下文窗口翻倍至100万Token,可单次处理完整代码库或长篇合同。新版本在代码能力、指令遵循等维度均有显著提升,类人智能测试得分超越多数同级别对手,且将成为免费与Pro版用户的默认模型。

在AI模型迭代速度日益加快的今天,Anthropic始终保持着对中等规模模型的高频更新,每四个月一次的Sonnet系列升级,已成为其巩固市场竞争力的重要策略。此次发布的Sonnet 4.6,在延续系列模型“性能与成本平衡”核心优势的基础上,带来了几项关键突破,直接击中了用户处理大型文档和复杂任务的痛点。

最引人注目的无疑是上下文窗口翻倍至100万Token——这意味着模型单次请求可容纳约75万字的文本内容,相当于一整套完整的代码库、数百页的商业合同或长篇学术专著。在此之前,多数中等规模模型的上下文窗口多在50万Token以内,用户处理大型文件时不得不反复拆分内容,不仅效率低下,还容易丢失全局上下文信息。而Sonnet 4.6的升级,让开发者无需拆分代码库即可分析整个项目的依赖逻辑,企业法务团队能一次性完成对多份关联合同的合规审查,大幅降低了复杂任务的处理门槛。

除了上下文窗口的跨越式升级,Sonnet 4.6在核心能力上也有针对性优化。Anthropic在官方公告中重点提及了代码能力、指令遵循与计算机操作三个维度的提升:在代码任务中,模型编写复杂函数、调试bug的准确率较上一代提升约12%,能更好理解开发者的业务需求;指令遵循方面,对多步骤、模糊化需求的响应精度提升,减少了用户反复调整提示词的成本;计算机操作能力则体现在控制浏览器、执行自动化脚本等场景的稳定性增强,能更高效完成办公自动化任务。

性能测试数据也印证了Sonnet 4.6的进步:在衡量类人推理能力的ARC-AGI-2测试中,模型取得了60.4%的得分。尽管这一成绩不及Anthropic旗舰模型Claude 3 Opus(约73%),但已远超行业内多数同级别中等规模模型,甚至逼近部分早期旗舰模型的水平。这一表现意味着,Sonnet 4.6在兼顾成本优势的同时,已经具备了处理复杂推理任务的能力。

值得注意的是,Sonnet 4.6将成为免费版与Pro版用户的默认模型——这意味着无论是普通用户还是付费用户,都能直接享受到新版本的所有升级,无需额外付费切换模型。对于企业用户而言,这一策略进一步降低了AI工具的普及成本,中型团队无需承担旗舰模型的高昂费用,就能获得满足日常需求的高效AI能力。

行业分析师指出,中等规模AI模型正在成为市场的核心增长极:旗舰模型虽然性能顶尖,但训练和部署成本极高,仅适合特定高价值场景;小型模型则在复杂任务中力有不逮;而中等规模模型恰好填补了这一空白,兼顾性能与性价比,是当前绝大多数个人用户和中小企业的首选。Anthropic此次的Sonnet 4.6升级,不仅巩固了自身在这一赛道的领先地位,也为行业设定了中等规模模型的新标杆。

随着AI模型上下文窗口的不断扩大,以及核心能力的持续优化,未来AI工具将能处理更复杂、更庞大的任务。对于Anthropic而言,每四个月一次的稳定迭代,正在逐步构建起覆盖不同需求的AI产品矩阵,而Sonnet 4.6的推出,也让市场对其后续旗舰模型的升级充满期待。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创