由Meta前AI研究员Anand Kannappan、Rebecca Qian创立的AI安全测试初创公司Patronus AI近日完成5000万美元B轮融资,总融资额达7000万美元。该公司核心业务为构建高仿真数字孪生测试环境,为可自主执行多步任务的AI智能体提供全场景压力测试,解决其落地现实场景时的稳定性、安全性痛点。

今年以来,搭载AI智能体的无人配送车、金融智能客服、工业巡检机器人相继进入规模化落地阶段,但其暴露的突发任务处理失误、极端场景响应失灵等问题,也让整个行业开始重新审视AI智能体的安全验证体系。
过去几年,AI大模型的性能评判大多依赖各类基准测试跑分,这套标准沿用到AI智能体领域时却出现了明显的“水土不服”。不少跑分领先的智能体产品,在真实场景中遇到用户非常规操作、环境突发变化等情况时,往往会出现逻辑混乱、决策失误等问题,甚至可能造成用户财产损失、公共秩序受影响等严重后果。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录