登录体验完整功能(收藏、点赞、评论等)

前通义千问核心骨干林俊旸:大模型正转向行动导向智能体思维

2026年3月26日,原阿里通义千问(Qwen)大模型技术负责人林俊旸离职后首次公开发声,指出当前大模型行业正从“推理式思维”向“智能体思维”跨越,核心方向是让模型为采取行动思考,在现实交互中动态修正计划。他还公开了2025年千问团队合并推理与指令数据的研发教训,为行业技术演进提供了具象参考。

3月26日晚间,一则发布在个人社交平台的技术长文,迅速在大模型研发圈刷屏。作为国内头部大模型通义千问的前核心技术负责人,林俊旸离职三周后的首次公开发声,没有涉及外界普遍猜测的创业动向,反而直接抛出了对大模型下一阶段演进的核心判断,同时罕见公开了千问团队此前的内部研发教训。

林俊旸在长文中首先回顾了千问团队2025年初的一次重要试错:当时团队希望构建一套统一的大模型系统,能够根据用户问题的难度自动调节推理深度,无需用户手动调整参数,理想状态下可同时覆盖复杂推理和轻量指令两类场景。
但实际测试结果远不及预期,推理数据和指令数据的分布存在本质差异,强行合并训练后,模型在两类场景的表现同时下滑:处理数学推导、逻辑分析等复杂问题时输出冗余、决策优柔寡断,执行信息查询、工具调用等简单指令时准确率明显下降,单位推理成本还比单独训练的模型高出32%。这次试错也直接促成了后续千问系列分开推出推理专项、指令专项模型的产品策略。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创