艾伦人工智能研究所(AI2)于2026年3月26日正式发布全开源视觉驱动网络代理MolmoWeb,该产品打破传统网络代理依赖网页DOM底层代码的技术路径,仅通过分析屏幕截图即可完成点击、滚动等网页操作。其8B参数版本在WebVoyager基准测试中得分达78.2%,性能逼近OpenAI专有模型,填补了开源视觉网络代理领域的技术空白。
在近日更新的WebVoyager网页导航能力基准测试榜单中,一款仅8B参数的小模型挤入了第一梯队,得分甚至超过了不少科技巨头的闭源大模型——这正是AI2刚刚推出的全开源网络代理MolmoWeb。
传统网络代理的运作逻辑高度依赖网页底层DOM代码,一旦网站前端迭代修改代码结构,原有的代理脚本就会直接失效,适配成本极高。而MolmoWeb采用纯视觉驱动的技术路径,完全不需要读取网页代码,运作逻辑和人类用户浏览网页的行为完全一致:先捕获当前浏览器窗口的截图,通过视觉分析识别页面元素、判断操作路径,再输出点击、滚动、输入等指令,完成操作后再次捕获截图判断下一步动作。
这种模式的优势十分明显:网页的视觉布局远比底层DOM代码稳定,且MolmoWeb的决策过程对人类完全透明,开发者可以直观看到它是基于哪些页面元素做出的操作判断,可解释性远高于传统依赖代码的网络代理。
此次AI2推出的MolmoWeb共开放两个参数版本,分别为4B和8B,均属于轻量级大模型范畴,对部署硬件的要求极低,普通消费级显卡即可本地运行。
从测试数据来看,其8B参数版本在WebVoyager基准测试中拿下了78.2%的得分,不仅在所有开源网络代理模型中位列第一梯队,性能更是逼近OpenAI尚未开源的专有网络代理模型,实现了典型的“以小博大”。更重要的是,MolmoWeb采用完全开源协议,所有开发者都可以免费获取权重进行二次开发,不需要支付高额的API调用费用,也不存在数据传输的安全风险。
视觉驱动的技术特性,让MolmoWeb的适配范围远超过传统网络代理。除了常规的PC端网页操作外,移动端H5页面、小程序、甚至是客户端内嵌的网页界面,只要可以输出屏幕截图,MolmoWeb都可以完成操作,不需要单独做适配开发。
目前已经有不少开发者开始测试MolmoWeb的落地场景:比如互联网公司的前端自动化测试,不再需要工程师针对每个版本的DOM结构写测试脚本,只要输入测试需求即可自动完成全流程操作;针对视障群体的网页辅助工具,也可以基于MolmoWeb开发,自动识别页面内容并完成用户的语音指令;此外电商自动比价、政务服务自动填报、企业内部系统自动化运维等场景,都可以通过MolmoWeb大幅降低自动化成本。
据AI2团队透露,目前MolmoWeb还在优化复杂验证码识别、多标签页协同操作等能力,预计2026年下半年将推出12B参数的进阶版本,进一步提升复杂任务的处理成功率。

4 小时前
当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。

4 小时前
2026年4月,中国信通院基于新发布的《云端OpenClaw基线能力要求》开展首批安全评估,腾讯公司公关总监张军披露,旗下龙虾特攻队系列的WorkBuddy、QClaw、轻量云OpenClaw、云桌面云手机Claw、ClawPro共5款产品全部通过评估,覆盖功能可信、收费可控等五大核心安全维度,为国内AI龙虾类产品落地树立了安全合规标杆。

4 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

4 小时前
国内大模型厂商智谱日前发布2025年全年业绩公告,全年营收达7.24亿元,同比增长131.9%,经调整净亏损31.82亿元,同比扩大29.1%。其最新推出的GLM-5发布24小时内即获字节、阿里、腾讯等头部大厂接入,国内前10大互联网公司已有9家深度集成GLM系列模型,旗下GLM Coding Plan付费开发者规模突破24.2万。

4 小时前
2026年4月,AI智能体与自动化框架OpenClaw正式发布v2026.3.31版本,俗称“龙虾”框架的该平台首次原生捆绑腾讯QQ机器人作为内置渠道插件。本次更新免去了开发者此前依赖第三方桥接工具的接入流程,实现QQ生态全覆盖,支持多账号配置、安全凭证管理等功能,大幅降低AI智能体接入社交场景的开发门槛。

5 小时前
2026年4月,华为面向内测用户推送HarmonyOS 6负一屏应用「智慧助手·今天」15.0.22.210测试版本,首次接入Claw智能体能力,新增AI任务提醒、晨间简报、AI搜索、通勤动态提醒等多项功能,覆盖日程管理、信息查询、场景化服务等多个日常场景,为鸿蒙生态的端侧AI交互落地新增核心入口。

5 小时前
美国科技巨头Meta近日公布新一代超算级AI数据中心Hyperion的配套能源方案,将新建10座天然气发电厂为其专属供能,整体发电容量达1.2GW,足以覆盖美国南达科他州全州的民生与工业用电需求,该方案也引发行业对AI算力能耗与清洁能源转型路径的广泛讨论。

11 小时前
2026年4月,AI创企Anthropic旗下闭源编程工具Claude Code意外泄露引发行业震荡,项目负责人鲍里斯·切尔尼公开承认团队手动操作部署流程失误导致事故,第三方基于泄露代码推出的平替版本上线后短时间内便斩获GitHub 10万星,Anthropic随后紧急启动下架封杀措施,此次事件也引发行业对闭源AI项目安全管控的广泛讨论。