2026年4月22日,蚂蚁集团正式发布旗下百灵大模型迭代产品Ling-2.6-flash Instruct。该模型总参数量达104B,运行时激活参数仅7.4B,据国际权威机构Artificial Analysis评测,其完成同等任务仅消耗15M tokens,推理成本仅为Nemotron-3-Super等主流同类模型的十分之一,凭极高“智效比”引发AI行业广泛关注。
大模型行业的参数竞赛持续了3年之后,越来越多的从业者意识到,高昂的推理成本已经成为AI规模化落地的最大阻碍。正是在这样的行业共识下,蚂蚁集团的新模型甫一发布就吸引了全行业的目光。
过去两年,全球头部科技企业普遍将大模型研发的核心目标放在提升绝对性能上,百亿、千亿级参数模型层出不穷,但这类模型普遍存在推理成本高、部署门槛高的问题,大量中小开发者、垂直行业客户难以负担相关开支。随着AI应用进入规模化落地期,行业需求已经从“追求最强性能”转向“追求最合适的性能成本比”,低能耗、高效率的大模型产品成为市场刚需。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录