让AI触手可及,让应用激发潜能

Anthropic发布Project Deal实验:Claude完成186笔真实市场交易

2026年4月24日,AI初创公司Anthropic低调发布内部研究项目Project Deal,测试旗下大模型Claude作为AI代理在真实市场中的自主交易能力。本次实验在Slack搭建的办公室内部市场开展,由Claude代表69名员工完成买卖操作,最终在500余件上架商品中促成186笔真实交易,总成交额突破4000美元,证实了大模型参与真实市场博弈的可行性,引发行业热议。

和此前多数停留在模拟环境的AI代理研究不同,本次Project Deal实验全程基于真实利益场景开展。Anthropic内部原本就有基于Slack的员工闲置物品交易社群,本次实验中,Claude获得授权,代表69名有买卖需求的员工,直接和其他员工对接谈判、促成交易,所有交易都涉及真实资金往来,并非虚拟测试。

本次测试共有超过500件商品上架,Claude最终成功促成186笔交易,总成交额超过4000美元,成交率接近三成,整体表现超出研究团队的初期预期。

为了验证不同性能大模型在交易场景中的表现差异,Anthropic设计了并行对照测试,分别让旗下两个不同规格的Claude模型——Opus和Haiku参与交易。研究结果证实,高规格的Opus模型在谈判博弈中的获利能力,显著优于轻量版的Haiku模型

有意思的是,这个性能差异带来的策略区别,并没有被和AI对接的人类参与者发现。大多数人类交易者都认为和自己对话的就是普通员工,没有察觉到AI模型能力差异带来的议价策略不同,这说明大模型已经能够以足够自然的方式完成复杂人际交互任务。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创