Anthropic收购Vercept,Claude将获高精度UI视觉操控能力

2026年2月26日,AI公司Anthropic完成对西雅图初创企业Vercept的收购,将整合后者高精度UI识别与空间推理技术,为旗下智能体Claude补足视觉能力短板。Vercept自研模型在ScreenSpot v1基准测试中UI识别准确率达92%,远超OpenAI同类模型的18.3%,此举或将推动智能体进入“视觉操控”新阶段。

当用户还在依赖Claude处理复杂的文本推理任务时,Anthropic已经在为它搭建通往更真实交互的桥梁。2026年2月26日的收购公告,让这家AI公司的战略野心清晰可见——通过纳入Vercept的视觉技术,Claude将首次拥有“看懂”并操控软件界面的能力,打破智能体长期以来的文本交互局限。

在大语言模型智能体的发展浪潮中,文本能力的天花板正在显现。无论是ChatGPT还是早期版本的Claude,它们都能凭借强大的语言理解能力生成文案、解答问题,但面对人类日常高频的软件操作场景——比如在Photoshop中调整图层、在CRM系统中录入客户数据——这些智能体却束手无策。
核心原因在于,传统智能体依赖软件开放的API接口实现交互,一旦软件没有提供接口,就无法完成任何操作。而人类与软件的交互逻辑截然不同:我们通过视觉识别界面元素,再用鼠标或键盘执行操作,这种“看-判断-操作”的流程,正是当前智能体缺失的核心能力。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创