登录体验完整功能(收藏、点赞、评论等) — 已累计有 12333 人加入

前OpenAI安全VP翁荔发万字长文 质疑大模型Scaling Laws核心共识

详情页推荐

前OpenAI安全研究副总裁、现Thinking Machines Lab联合创始人翁荔近日在个人博客发布拖更三年的万字技术长文《Scaling Laws, Carefully》,拆解支撑大模型行业数百亿美元投入的规模定律(Scaling Laws),指出从Kaplan到Chinchilla的主流预训练数据配比并非最优,行业沿用多年的训练路径可能存在根本性偏差,引发全球AI从业者对大模型预训练配方的集体反思。

配图

2026年6月26日,停更13个月的知名AI研究者翁荔的个人博客Lil'Log,上线了一篇超过1.2万字的技术长文,发布仅12小时就被Hugging Face、X平台AI社区等多个行业渠道置顶,不少从业者甚至称这篇文章“可能把整个大模型行业的发展路线掰回半厘米”。

2020年OpenAI研究员Jared Kaplan发布的论文首次提出Scaling Laws,明确在对数坐标系下,大模型的训练损失和参数量、算力、训练数据量呈幂律下降关系,而“参数量增长速度应当快于训练数据增长速度”是这套定律最核心的落地指引。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。