2026年3月26日,原阿里通义千问(Qwen)大模型技术负责人林俊旸离职后首次公开发声,指出当前大模型行业正从“推理式思维”向“智能体思维”跨越,核心方向是让模型为采取行动思考,在现实交互中动态修正计划。他还公开了2025年千问团队合并推理与指令数据的研发教训,为行业技术演进提供了具象参考。
3月26日晚间,一则发布在个人社交平台的技术长文,迅速在大模型研发圈刷屏。作为国内头部大模型通义千问的前核心技术负责人,林俊旸离职三周后的首次公开发声,没有涉及外界普遍猜测的创业动向,反而直接抛出了对大模型下一阶段演进的核心判断,同时罕见公开了千问团队此前的内部研发教训。
林俊旸在长文中首先回顾了千问团队2025年初的一次重要试错:当时团队希望构建一套统一的大模型系统,能够根据用户问题的难度自动调节推理深度,无需用户手动调整参数,理想状态下可同时覆盖复杂推理和轻量指令两类场景。
但实际测试结果远不及预期,推理数据和指令数据的分布存在本质差异,强行合并训练后,模型在两类场景的表现同时下滑:处理数学推导、逻辑分析等复杂问题时输出冗余、决策优柔寡断,执行信息查询、工具调用等简单指令时准确率明显下降,单位推理成本还比单独训练的模型高出32%。这次试错也直接促成了后续千问系列分开推出推理专项、指令专项模型的产品策略。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
近期GitHub、Stack Overflow等全球开发者平台监测数据显示,AI编码工具普及后开发者人均编码效率提升超220%,但低质量重复“垃圾代码”占比同比上涨47%。包括OpenAI ChatGPT、GitHub Copilot、DeepSeek Coder在内的主流AI编码工具均被指易生成冗余、兼容性差的代码,给长期项目维护埋下风险,引发全球开发社区广泛热议。

1 小时前
4月6日,小米MiMo大模型负责人罗福莉在海外社交平台X公开发文,结合此前Anthropic宣布Claude封禁OpenClaw等第三方工具、小米MiMo推出分层Token定价套餐的行业动态,系统拆解Agent场景下的算力分配与大模型定价逻辑,驳斥当前行业盲目开展价格战的短视行为,引发AI产业界对大模型健康商业化路径的广泛讨论。

2 小时前
4月7日,AI大模型厂商Anthropic官方披露其年化收入(ARR)已突破300亿美元,首次反超竞争对手OpenAI同期250亿美元的年化收入水平。该公司2025年末年化收入仅为90亿美元,3个多月内收入规模大涨约210亿美元,同时同步官宣最新AI芯片采购大单,引发全球AI产业对大模型商业化格局的广泛讨论。

3 小时前
2026年4月,欧洲头部人工智能企业Mistral AI联合创始人兼CEO Arthur Mensch访韩期间,与三星电子副董事长兼CEO全永铉及核心高层会晤,双方重点围绕AI半导体存储芯片供应链、技术协同方案展开磋商。Mistral AI正寻求稳定XPU算力芯片供应以支撑模型迭代,三星在高带宽内存...

3 小时前
2026年4月,OpenAI首席执行官山姆·奥特曼在公开专访中首度回应文生视频模型Sora停用传闻,明确表示关停并非源于技术瓶颈,而是公司当前存在极大算力缺口,有限的芯片资源将优先供给GPT系列大模型迭代等更高优先级项目,Sora因内部优先级排位靠后遭遇资源挤兑暂时下线。

3 小时前
2026年4月国际大模型API分发平台OpenRouter公布的最新榜单显示,阿里旗下千问3.6 Plus登顶全球大模型周调用量榜首,且已连续4天霸榜日榜,该模型也成为平台上线以来首个单日调用量突破1万亿Token的大模型,标志着国产大模型凭借技术迭代、高性价比优势在全球市场的竞争力进一步提升。

4 小时前
近期凭借OpenClaw(俗称“小龙虾”)插件走红的国产大模型MiniMax 2.7,官方于2026年4月7日确认将于本周末在Hugging Face社区发布开源版本。该模型3月18日上线后调用量长期位居行业前列,SWE-Pro基准测试得分达56.22%接近顶尖闭源模型水平,开源后将大幅降低开发者Token调用成本,利好下游AI应用落地。

6 小时前
2026年4月7日,通义千问宣布升级旗下“深度研究”功能,正式上线专业财经分析模块。本次升级基于Agentic架构整合同花顺实时金融数据,覆盖全球1.3万只股票分钟级行情、近百万份上市公司财报及权威研报,可全链路自主生成可溯源的专业研报,当前已在多端开放免费体验。