登录体验完整功能(收藏、点赞、评论等) — 已累计有 8630 人加入

让AI触手可及,让应用激发潜能

谷歌新机制破解AI层次化思考难题,终结“随机鹦鹉”争论

2026年2月27日,谷歌团队发布一项突破性AI研究,通过引入元控制器操控模型内部残差流,让AI智能体在稀疏奖励环境中学会“跳跃式思考”,首次揭示大模型可自发形成类人脑层次化决策机制,为复杂多步任务提供全新训练范式,终结了学界长期存在的“随机鹦鹉”争论。

当AI在复杂迷宫中反复碰壁,或是在多步骤科学实验中无的放矢时,“AI是否真的会思考”的质疑始终萦绕学界——传统大模型被批评为“随机鹦鹉”,只是拟合海量数据而非具备真正的推理能力,在稀疏奖励环境下,这一缺陷暴露得淋漓尽致。

稀疏奖励环境指的是任务中奖励信号极少或延迟极高的场景,比如围棋终局才会给出胜负反馈,或是工业机器人组装只有完成全部步骤才能得到正向激励。传统AI在这类场景中,只能依靠随机试错探索路径,无法像人类一样将复杂任务拆解为多个子任务进行层次化规划,这正是“随机鹦鹉”争论的核心依据:批评者认为AI没有自主决策能力,只是在“复读”训练数据中的既有模式。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创