2026年4月29日,蚂蚁集团正式开源旗下百灵大模型最新迭代版本Ling-2.6-flash,该模型总参数104B、激活参数仅7.4B,同步推出BF16、FP8、INT4多量化版本,H20显卡环境下推理速度最高达每秒340Token,同等任务下智效比较同级别模型提升10倍,大幅降低大模型部署门槛。
就在半个月前,一款参数规模未公开的大模型在MMLU、HumanEval等多个国际主流技术评测榜单冲进同赛道TOP3,彼时不少业内人士猜测其来自国内头部科技企业,谜底直到今日才正式揭晓:这款产品正是蚂蚁集团刚刚开源的百灵Ling-2.6-flash。
过去两年,大模型的性能迭代速度远超行业预期,但落地端的“算力鸿沟”却始终存在:100B级大模型的推理能力足以覆盖绝大多数商用场景,但单卡部署成本高、推理速度慢的问题,让大量中小开发者望而却步。不少团队为了适配硬件只能选择参数更小的模型,却不得不牺牲部分任务表现,效率与性能的平衡成为全行业共同的诉求。
此次开源的Ling-2.6-flash给出了新的解题思路。该模型采用先进的混合线性架构,总参数达到104B的同时,激活参数仅为7.4B,相当于用7B级模型的推理成本,就能获得接近100B级模型的性能表现。
在主流H20显卡环境下,Ling-2.6-flash的推理速度最高可达340Token/秒,吞吐能力远超同级别竞品。针对开发者最关心的部署灵活性问题,蚂蚁同步推出了BF16、FP8、INT4等多个量化版本,不同硬件条件的团队都能找到适配的版本,无需额外做大量量化优化工作。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
54 分钟前
2026年4月29日,第九届数字中国建设峰会在福州开幕,腾讯携智能体生态参展,同步带来腾讯云智能体开发平台ADP、腾讯混元Hy3preview语言模型展会首秀。腾讯公司副总裁韩开创表示,当前AI已实现从对话到执行的范式跃迁,腾讯将依托自主可控技术底座,推动“好用的AI”落地为普惠新质生产力。

1 小时前
2026年4月29日,蚂蚁数科正式推出商用大模型产品LingDT-2.6-flash,该模型主打Token效率优势,同等测评任务下较同参数级别大模型可降低90%Token消耗,104B总参数量搭配7.4B激活参数兼顾性能与成本,同时搭载金融级安全防护体系,适配企业场景低成本规模化部署需求。

1 小时前
2026年4月,人工智能企业Anthropic未发布正式公告即调整旗下AI编程工具Claude Code计费标准,Token消耗成本较此前翻倍,开发者活跃日日均使用成本从此前的6美元升至13美元,月度使用成本区间为150-250美元,90%用户日支出可控制在30美元以内,此次调价凸显AI编程赛道运营成本压力正持续传导至客户端。

1 小时前
2026年4月最新行业监测数据显示,自2025年8月OpenAI正式发布GPT-5并启动商用落地以来,其旗下网络爬虫整体活跃度较此前激增约300%,其中用于实时内容检索的OAI-SearchBot访问量已超过传统训练爬虫GPTBot。此举标志着全球生成式AI领域的竞争已正式进入深挖高质量、高时效性数据的全新阶段。

1 小时前
2026年4月29日,蚂蚁集团正式开源百灵大模型系列新品Ling-2.6-flash。该模型总参数达104B、激活参数仅7.4B,同步推出BF16、FP8、INT4三类精度版本适配不同硬件环境,大幅降低部署门槛。该模型此前曾以“Elephant Alpha”匿名在OpenRouter平台完成两周测试,优化后中英文切换、编程框架适配能力均有显著提升。

1 小时前
2026年4月29日消息,国产AI厂商月之暗面宣布将于今年第三季度正式推出下一代主力大模型Kimi K3,该模型参数规模达2.5万亿,超过DeepSeek V4 Pro的1.6万亿、百度文心5.0的2.4万亿,有望登顶国产大模型参数榜,同时其标志性的长文本处理能力也将迎来升级,或将进一步拉高国内大模型竞争门槛。

2 小时前
2026年4月28日,伦敦帝国理工学院、互联网档案馆与斯坦福大学联合发布研究报告,对2022至2025年33个月的网页样本分析显示,截至2025年中期全球35%新发布网站内容全部或部分由AI生成,较2022年底ChatGPT发布前的近乎零占比实现爆发式增长,AI内容语义相似度较人类原创高33%,正深度改变互联网话语体系。

2 小时前
2026年4月28日,欧洲头部大模型厂商Mistral AI正式发布企业级AI编排层工具Workflows。作为Mistral Studio平台的核心组件,该工具基于Temporal引擎构建,支持Python开发,内置人工在环审批机制,目前已进入公开预览阶段,获得ASML、ABANCA、CMA-CGM等多家跨国巨头核心业务场景采用,可帮助企业将零散AI流程转化为可规模化落地的生产级系统。