少找工具,多做创作

蚂蚁数科发布百灵企业版金融大模型 破解Token无效消耗痛点

2026年3月26日中关村论坛未来产业创新发展论坛上,蚂蚁数科大模型技术创新部总经理章鹏正式发布百灵企业版金融大模型。该产品针对OpenClaw类自主执行智能体落地中的Token无效消耗、算力浪费、合规性不足等痛点,提出大模型产业落地将从“参数竞赛”转向“Token效能竞争”的新判断,为企业级AI规模化落地提供了新的技术路径。

近两年以OpenClaw为代表的自主执行智能体快速起量,正在把AI的应用边界从一问一答的对话交互,拓展到可自动完成多步骤操作的任务执行,成为企业数字化升级的重要抓手。但产业侧的落地实践很快暴露了新的问题:多数通用智能体缺乏对行业规则、业务流程的深度适配,在处理金融等高复杂度场景的任务时,往往会反复调用工具、生成无效内容,导致Token消耗远超实际产出,算力浪费问题突出。

蚂蚁数科大模型技术创新部总经理章鹏在中关村论坛演讲

随着企业对智能体的调用频率快速提升,效能短板的影响被进一步放大。据产业调研数据显示,在金融客服、合规审核等高频调用场景中,通用智能体的无效Token占比最高可达45%,不仅推高了企业的算力成本,还会拖慢任务响应速度,不符合金融业务对低时延、高合规的要求。此外,通用大模型缺乏行业专属的安全防控机制,也容易引发数据泄露、合规风险等问题,成为AI规模化落地的主要障碍。

此次发布的百灵企业版金融大模型,正是针对上述痛点打造的行业专属解决方案。不同于追求大参数的通用大模型,百灵企业版从设计之初就锚定金融场景的落地需求,在训练阶段就嵌入了金融行业全量合规规则、标准化业务流程,让智能体在执行任务时可以精准判断操作路径,减少不必要的工具调用。

章鹏在演讲中透露,该模型最高可降低60%的无效Token消耗,同时推理速度较通用大模型提升3倍,模型体积压缩40%,真正实现了“更快、更轻、成本更低”的落地效果。在安全合规层面,模型也做了专属优化,支持本地化部署,全流程数据不出域,符合金融行业的强监管要求。

在章鹏看来,OpenClaw类智能体的爆发,本质上是产业界对AI落地价值的回归:过去行业比拼的是谁的模型参数更大、生成内容更炫,而接下来的竞争核心,是单位Token能为企业创造多少实际业务价值。

“参数竞赛的时代已经过去了,接下来企业级大模型的比拼,核心是效能。”章鹏表示,随着更多行业专属大模型的落地,未来2-3年企业级AI的渗透率有望从当前的不足20%提升至50%以上,真正进入规模化普及阶段。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创