2026年4月17日,AI大模型厂商Anthropic正式推出Claude Opus 4.7版本,该版本未沿袭行业常规的参数堆料路线,重点升级可靠性而非单纯提升智能上限。其在硬核编程基准测试SWE-bench Pro中得分达64.3%,较前代提升近11个百分点,性能超过OpenAI GPT-5.4、谷歌Gemini 3.1 Pro等头部竞品,引发行业高度关注。
和此前行业所有新品发布都要强调“史上最强”的惯例不同,Anthropic在Claude Opus 4.7的发布公告里开篇就明确表示,“这并非我们最强大的模型”,市场期待已久的下一代旗舰模型Claude Mythos Preview依然没有放出上线时间表。
在Anthropic看来,当前大模型落地的最大痛点并非“不够聪明”,而是“输出不稳定”——不管是代码生成、多模态识别还是工具调用,偶发的幻觉、低级错误足以抵消所有“超水平发挥”的价值,这也是很多企业不敢将大模型接入核心生产流程的核心原因。
此次Claude Opus 4.7的迭代逻辑完全围绕“降低出错概率”展开,并未刻意提升通用场景的解题上限,反而针对企业用户使用频率最高的编程、多模态识别、工具调用三大场景做了专项优化。
作为主打可靠性的升级版本,Claude Opus 4.7的实测成绩超出了市场预期。在最考验代码落地能力的硬核编程基准SWE-bench Pro测试中,该版本得分从前代的53.4%跃升至64.3%,单代涨幅接近11个百分点,直接超过了OpenAI GPT-5.4的57.7%、谷歌Gemini 3.1 Pro的54.2%,登顶当前公开测试的大模型编程性能榜首。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
10 分钟前
2026年4月,字节跳动正式启动首次“豆包股”回购,本次回购价格定为13.08美元,较2025年10月该激励计划推出时的10美元授予价上涨约30%。该计划面向豆包大模型业务核心团队开放,目前已在负责前沿预训练研发的Seed部门全面落地,此举既反映豆包业务估值的快速增长,也为AI核心人才提供了明确的收益退出渠道。

12 分钟前
2026年4月,以色列网络安全公司OX Security发布研究报告,披露由AI公司Anthropic主导开发维护的模型上下文协议(MCP)存在架构级安全漏洞。该漏洞目前已波及超3.2万个代码仓库,超20万台服务器存在数据暴露风险,攻击者可借此窃取用户隐私、API密钥等敏感信息,Anthropic仅发布警示文档草草回应,引发行业广泛讨论。

39 分钟前
2026年4月17日,人工智能厂商Anthropic正式推出新一代旗舰大模型Claude Opus 4.7。该模型较前代Opus 4.6在高级软件工程任务处理、指令执行效率上提升显著,新增自我验证功能优化输出准确率,视觉处理支持最高2576像素边长图像识别,内置网络安全防护模块,定价与前代保持一致。

43 分钟前
AI大模型厂商Anthropic近日正式推出新一代生成式AI模型Claude Opus 4.7,该版本长文档摘要准确率提升22%、多轮对话连贯性提升18%,但官方主动下调其能力上限,综合性能弱于研发中的下一代旗舰模型Mythos,此举是Anthropic将安全优先级置于短期性能竞争之上的标志性动作。

1 小时前
2026年4月,人工智能企业OpenAI与AI芯片初创公司Cerebras达成长期战略合作,未来3年将投入超200亿美元采购后者晶圆级引擎(WSE)技术驱动的算力服务,同时获得Cerebras少数股权认股权证,另投入10亿美元资助其建设专属高性能数据中心,此举核心目标为降低算力成本、减少对英伟达GPU的依赖,加速下一代大模型迭代。

1 小时前
2026年4月,专注于企业级AI编程解决方案的初创企业Factory宣布完成1.5亿美元融资,估值达15亿美元。本轮融资由Khosla Ventures领投,红杉资本、Insight Partners、黑石集团跟投,Khosla管理合伙人Keith Rabois将加入其董事会。尽管赛道已有Anthropic、Cursor等成熟玩家,资本仍对该领域盈利前景持乐观态度。

1 小时前
2026年4月,人工智能企业OpenAI宣布全面升级旗下自动化编程工具Codex,新增后台运行、内置浏览器等核心功能,直接对标此前被多家企业选为首选AI编程工具的Anthropic旗下产品Claude Code,此举标志着全球头部AI厂商在AI编程细分赛道的竞争进入全新阶段,实用性、场景适配能力成为核心比拼维度。

2 小时前
2026年4月14日,Anthropic首席产品官Mike Krieger正式辞任Figma董事会,该变动已由Figma向美国证券交易委员会披露。市场普遍认为此举与Anthropic即将推出的下一代大模型Opus 4.7集成原生设计工具的规划相关,双方将从此前的技术合作伙伴转向设计赛道直接竞争对手,AI大模型厂商的场景落地边界正持续扩张。