美国大模型研发公司Anthropic近日推出一项前沿AI应用实验,上线全球首个专为AI代理打造的分类测试交易市场。在该实验场景中,AI代理可分别代表买方与卖方,独立完成真实商品的议价、撮合与成交流程,所有交易均使用真实资金结算。这项实验首次验证了AI自主完成商业交易的可行性,为Agent生态商业化开辟了全新方向。
在过往的多数AI交易场景中,人工智能始终扮演辅助角色:帮用户整理商品信息、对比价格,最终的成交决策依然由人类拍板。而Anthropic这次实验彻底打破了这一定位,所有交易的议价、决策、成交全流程都由AI代理独立完成,人类不干预核心环节。测试场景中,AI分别代表买卖双方,针对真实商品的交易需求,用实际资金完成了多笔有效成交,这也是全球范围内首次AI代理之间完成的真实商业交易。
近两年全球大模型行业的竞争逻辑已经发生转变,此前比拼参数规模、训练数据量的“底座竞赛”逐渐降温,行业开始把注意力转向AI Agent(AI智能体)的落地场景探索。作为通用大模型领域的核心玩家,Anthropic一直试图在Agent领域走出差异化路线。
在本次测试之前,行业对AI Agent的商业化想象大多集中在个人助理、办公协作等辅助场景,“AI代理自主参与商业交易”始终停留在概念阶段。Anthropic的本次实验,第一次把这个概念变成了可运行的真实商业场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 小时前
微软近日宣布对旗下Windows Insider预览计划完成重构升级,新计划简化了原有复杂分层测试结构,向普通用户开放更多AI功能的优先测试权限,允许用户根据自身需求自主选择测试内容,原本负责前沿功能测试的Canary通道也将保留,本次调整核心围绕微软Windows平台原生AI功能Windows Copilot的落地测试推进,预计将覆盖全球超1000万注册预览用户。

8 小时前
近日有社区用户在Discord平台绕过了AI公司Anthropic设置的内部访问控制,提前接触到该公司尚未公开发布的全新大模型Mythos。该事件目前已引发全球AI领域对未发布模型内测权限管理的广泛讨论,Anthropic暂未公开回应该事件,也未披露Mythos模型的具体参数与正式发布计划,业内推测该模型性能将超越Anthropic现有的Claude 3系列产品。

8 小时前
近期多位开发者和内容创作者发现,包括ChatGPT、谷歌Gemini、微软Copilot在内的多款主流大语言模型,生成文本时出现无意义错别字的概率明显上升,部分场景下错别字发生率从年初的不足2%升至当前的8%左右。本文梳理了AI错别字高发的行业背景,结合技术侧观点解析这一反常现象背后的逻辑,探讨大模型适配落地中的新问题。

14 小时前
谷歌旗下AI研究助手NotebookLM近日推出重要功能更新,新增自动整理研究资料来源功能,目前已面向全球所有免费及付费用户开放。该功能可针对用户上传的文献、笔记、网页内容等各类素材,按主题、研究方向自动分类归档,解决学术研究、内容创作中资料杂乱的痛点。据谷歌内部测试数据,该功能可帮助研究者平均节省40%的资料整理时间。

16 小时前
2026年4月,全球头部AI企业OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)公开发信,就公司未向加拿大执法机构通报近日大规模枪击案嫌疑人相关风险信息一事,向加拿大塔姆布勒里奇社区全体居民致歉。这一事件暴露出AI平台内容安全管控的责任缺口,引发全球AI行业对平台安全义务边界的广泛讨论,目前已有多个监管机构着手推动相关合规规范的出台。

17 小时前
2026年4月,加拿大AI创业公司Cohere正式与德国大模型厂商Aleph Alpha完成合并,交易获得德国零售巨头Lidl母公司施瓦茨集团(Schwarz Group)支持,且得到加德两国政府官方许可。本次合并旨在美国厂商主导的全球AI格局下,为全球企业提供符合区域数据主权要求的替代AI方案,是欧洲AI产业整合的标志性事件。

1 天前
当前AI行业赛道拥挤,大量创业公司和科技巨头争相推出独立AI产品,但越来越多行业观察者提出,AI的最优落地路径并非打造独立新品,而是将能力嵌入用户已在使用的各类电子设备。目前苹果推出Apple Intelligence,谷歌整合Gemini进Pixel系列,微软将Copilot嵌入Windows系统,OpenAI推进ChatGPT设备端落地,调研显示近68%用户更偏好原生嵌入的AI功能。

1 天前
科技巨头Meta近日与亚马逊云科技AWS达成全新合作,将在AWS部署数千万颗Graviton Arm架构处理器核心,用于搭建支撑下一代AI研发的多架构计算堆栈。目前Meta已整合英伟达、AMD、Arm以及自研芯片的多元算力资源,该布局是Meta为AI智能体时代提前储备算力,押注无单一芯片能满足下一代AI需求的判断。