近年来生成式AI大语言模型快速普及落地,不过学界和产业界普遍认为,当前主流模型缺乏对物理世界运行规则的基础认知,难以产生AI真正需要的“常识”。目前AI领域已将世界模型视作下一核心研发方向,该技术不同于传统大模型仅预测文字序列,核心目标是学习真实世界运行逻辑,被认为是通往通用人工智能的关键路径。
我们日常使用ChatGPT等生成式AI产品时,经常会遇到不符合常识的错误回答——比如违背物理规律的问题解答、脱离生活逻辑的方案输出。这类问题的根源,并不在于模型参数不够大或者训练数据不够多,而是当前主流大语言模型存在天生的逻辑缺陷:主流大模型的训练目标始终是预测下一个文字的概率,从未真正学习过真实世界是如何运转的。这种缺陷也成为当前AI落地机器人、自动驾驶等实体场景的核心瓶颈。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录