2026年4月30日,蚂蚁集团正式开源万亿参数旗舰大模型百灵Ling-2.6-1T,该模型采用MLA与LinearAttention混合架构打造快思考机制,实测仅需16M tokens即可完成全量评测,输出成本仅为同类模型的四分之一,综合性能对标非推理模式下的GPT-5.4,推理、代码等实战指标达开源领域SOTA。
过去两年,大模型行业始终陷入“参数越高能力越强”的路径依赖,不少万亿级模型为了提升评测分数,不仅盲目堆叠冗余参数,还刻意拉长思考链长度,最终导致推理成本居高不下,难以在真实生产场景中大规模落地。
此次开源的Ling-2.6-1T跳出了传统的参数竞赛逻辑,核心目标是解决万亿级模型的“智效比”痛点。其采用的MLA与LinearAttention混合架构,创新性地实现了快思考(Fast-Thinking)机制,在保留大模型强大通用能力的前提下,大幅压缩了无效推理步骤,从架构层面降低了运行成本。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录