2026年2月26日,AI公司Anthropic完成对西雅图初创企业Vercept的收购,将整合后者高精度UI识别与空间推理技术,为旗下智能体Claude补足视觉能力短板。Vercept自研模型在ScreenSpot v1基准测试中UI识别准确率达92%,远超OpenAI同类模型的18.3%,此举或将推动智能体进入“视觉操控”新阶段。
当用户还在依赖Claude处理复杂的文本推理任务时,Anthropic已经在为它搭建通往更真实交互的桥梁。2026年2月26日的收购公告,让这家AI公司的战略野心清晰可见——通过纳入Vercept的视觉技术,Claude将首次拥有“看懂”并操控软件界面的能力,打破智能体长期以来的文本交互局限。
在大语言模型智能体的发展浪潮中,文本能力的天花板正在显现。无论是ChatGPT还是早期版本的Claude,它们都能凭借强大的语言理解能力生成文案、解答问题,但面对人类日常高频的软件操作场景——比如在Photoshop中调整图层、在CRM系统中录入客户数据——这些智能体却束手无策。
核心原因在于,传统智能体依赖软件开放的API接口实现交互,一旦软件没有提供接口,就无法完成任何操作。而人类与软件的交互逻辑截然不同:我们通过视觉识别界面元素,再用鼠标或键盘执行操作,这种“看-判断-操作”的流程,正是当前智能体缺失的核心能力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
AI生成游戏应用Aippy近期在欧美市场走红,产品采用类似TikTok的滑动信息流逻辑,用户可像刷短视频一样快速切换体验不同AI生成小游戏。截至2026年4月,该应用谷歌应用商店评分为4.7,全渠道累计下载量突破100万次,单款游戏内容最高获赞超10万次,成为2026年开年以来AI C端娱乐应用落地的代表性案例。

6 小时前
美国法律AI初创Patlytics近日完成4000万美元B轮融资,本轮由风险投资机构SignalFire领投,N47、Myriad Venture Partners及多位美国法律行业资深人士、数据公司参投。成立不到两年半的Patlytics主打专利起草AI服务,核心客户包括Meta等科技巨头,累计融资额已达约6500万美元,目标打造专利律师领域的专属AI生产力工具。

6 小时前
4月9日消息,埃隆·马斯克旗下人工智能公司xAI公布最新人事任命,SpaceX旗下Starlink高级副总裁迈克尔·尼科尔斯正式出任xAI总裁。尼科尔斯已在SpaceX任职近6年,本次任命同步伴随xAI模型训练、产品与基础设施团队重组,标志着xAI与SpaceX的业务协同进入全新阶段。

6 小时前
近日,普渡科技正式发布全球首款AI原生大型洗地机器人,瞄准当前商用清洁机器人普遍存在的AI功能噱头化、复杂场景适配性差、死角需人工补扫、极端光照下定位波动等行业痛点。该产品跳出传统机器人附加AI功能的开发逻辑,从底层架构完成AI原生设计,有望大幅提升中大型商用场景的清洁作业效率。

7 小时前
近日一款搭载OpenAI旗下ChatGPT大语言模型的智能导盲机器狗正式公开亮相,该产品可通过自然语言交互实时为视障用户反馈路况信息、解答出行疑问,测试数据显示其复杂路况识别准确率达92%以上,相较传统导盲杖和导盲犬,在环境感知、即时响应等维度具备明显优势,有望填补视障出行辅助领域的供给缺口。

7 小时前
2026年4月9日,阿里云旗下AI开发平台百炼正式上线“记忆库”功能,可赋予AI Agent跨会话长期记忆能力,破解多轮对话遗忘痛点。该功能目前限时免费开放,检索性能较常规方案提升50%,配置成本降低50%,平均响应时间下降50%,开发者可通过API调用或在Agent产品中一键部署。

7 小时前
2026年4月,谷歌正式为旗下大模型产品Gemini推出全新Notebooks功能,该功能打通了Gemini与AI研究助手NotebookLM的数据壁垒,支持用户集中管理单主题聊天记录、文档、PDF等资料,可通过自定义指令引导AI完成多场景复杂任务,目前已进入灰度测试阶段,预计未来几周将逐步向全量用户开放。

7 小时前
4月9日行业消息显示,人力资源软件巨头、财富500强企业Workday前首席技术官彼得·贝里斯(Peter Bailis)已在上月离职加入AI大模型公司Anthropic。贝里斯2025年5月才出任Workday CTO,任期不足一年便跳槽,其加入也印证了Anthropic正筹备切入AI原生人力资源产品赛道,推进大模型在企业服务垂直场景的商业化落地。