2019年由“强化学习之父”理查德·萨顿撰写的《苦涩的教训》一文,被AI学界奉为进化纲领,其核心观点——人类硬塞领域知识不敌机器自主试错——正成为当下AI发展的真实写照:当前AI正从语言理解阶段转向经验实践层面,通过自主试错积累认知,开启新一轮技术跃迁。
当大语言模型还在以流畅的文本交互能力占据AI话题C位时,一批AI系统已经悄然跳出语言理解的舒适区,在真实物理世界或虚拟模拟场景中通过自主试错积累经验——这与六年前那篇仅六页纸的学术短文所预言的AI进化路径高度契合。
2019年,“强化学习之父”理查德·萨顿发表的短文《苦涩的教训》,全文仅六页却成为此后AI领域被反复提及的底层逻辑纲领。文章的核心观点直白却尖锐:人类花费数十年向AI硬塞领域知识、设计人工特征和专家规则,但最终在几乎所有AI赛道上,都输给了让机器通过大规模计算自主试错、从数据中学习的方案。
从国际象棋到围棋,人类棋手总结的棋谱定式在AlphaGo等强化学习系统面前不堪一击;语音识别领域,人工设计的声学特征最终被基于深度学习的端到端模型全面取代;计算机视觉中,手工标注的特征工程也逐渐被大规模图像数据驱动的卷积神经网络淘汰。这些案例反复印证着萨顿的判断:AI的进化潜力,远超过人类对特定领域知识的认知边界。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录