2026年4月24日,AI初创公司Anthropic低调发布内部研究项目Project Deal,测试旗下大模型Claude作为AI代理在真实市场中的自主交易能力。本次实验在Slack搭建的办公室内部市场开展,由Claude代表69名员工完成买卖操作,最终在500余件上架商品中促成186笔真实交易,总成交额突破4000美元,证实了大模型参与真实市场博弈的可行性,引发行业热议。
和此前多数停留在模拟环境的AI代理研究不同,本次Project Deal实验全程基于真实利益场景开展。Anthropic内部原本就有基于Slack的员工闲置物品交易社群,本次实验中,Claude获得授权,代表69名有买卖需求的员工,直接和其他员工对接谈判、促成交易,所有交易都涉及真实资金往来,并非虚拟测试。
本次测试共有超过500件商品上架,Claude最终成功促成186笔交易,总成交额超过4000美元,成交率接近三成,整体表现超出研究团队的初期预期。
为了验证不同性能大模型在交易场景中的表现差异,Anthropic设计了并行对照测试,分别让旗下两个不同规格的Claude模型——Opus和Haiku参与交易。研究结果证实,高规格的Opus模型在谈判博弈中的获利能力,显著优于轻量版的Haiku模型。
有意思的是,这个性能差异带来的策略区别,并没有被和AI对接的人类参与者发现。大多数人类交易者都认为和自己对话的就是普通员工,没有察觉到AI模型能力差异带来的议价策略不同,这说明大模型已经能够以足够自然的方式完成复杂人际交互任务。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
50 分钟前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

54 分钟前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

56 分钟前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

1 小时前
AI编码初创企业Cursor于2026年5月宣布启动全球化扩张进程,未来半年将在亚太地区招聘200名技术及市场类员工,新加坡办事处由资深科技高管Simon Green负责。此前该公司已与SpaceX达成重磅合作协议,SpaceX拥有600亿美元收购Cursor的权利,若未触发收购则需支付100亿美元采购其研发成果,充足资金加持下Cursor正加速技术出海落地。

1 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。

1 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

1 小时前
2026年5月15日,埃隆·马斯克旗下人工智能公司xAI正式推出首款专业编程AI智能体Grok Build,进军高增速的开发者服务市场。该产品目前处于早期测试阶段,仅面向xAI付费订阅用户开放,可自动完成代码编写、逻辑构建等复杂编程任务。xAI总裁迈克尔·尼科尔斯明确将Anthropic旗下Claude列为核心对标目标,计划短期内追平行业标杆表现。

1 小时前
2026年5月,旧金山AI初创公司depthfirst开发的AI安全分析系统,自主发现潜伏18年的NGINX高危漏洞CVE-2026-42945。该漏洞CVSS评分为9.2,属于严重级别,影响2008年以来发布的NGINX 0.6.27至1.30.0版本,波及全球近三分之一网站,攻击者可利用漏洞实现远程代码执行,目前NGINX官方已发布对应修复补丁。