蚂蚁开源全球首个混合线性架构万亿模型 兼得推理深度与速度

8 小时前 AI快讯 2

蚂蚁开源全球首个混合线性架构万亿模型 兼得推理深度与速度

春节后AI大模型赛道竞争再度升级。2月14日,蚂蚁集团正式发布全球首个开源混合线性架构万亿参数模型Ring-2.5-1T,该模型不仅斩获IMO金牌级数学推理成绩,更通过架构创新打破了业界“深度思考必然牺牲速度与显存效率”的固有认知,为大模型在复杂场景的落地提供了全新技术路径。

当AI大模型领域还在为春节期间的技术比拼余热未消时,蚂蚁集团的新发布直接将竞争推向了更深层次的技术维度。此次推出的Ring-2.5-1T,核心聚焦两大关键能力的突破:顶尖数学逻辑推理与高效长程任务自主执行。

在数学推理这一AI智力水平的“试金石”上,Ring-2.5-1T的表现堪称惊艳。它在国际数学奥林匹克竞赛(IMO)的模拟测试中拿到35分,达到金牌选手的准入线;在代表国内最高数学竞赛水平的CMO模拟考核中,更是斩获105分,远超国家集训队90分左右的入选线。要知道,IMO金牌代表着人类青少年数学逻辑的顶尖水平,而CMO国家集训队则是国内数学人才的金字塔尖,这一成绩意味着该模型已具备媲美顶尖人类的抽象思维、多步骤推导和复杂问题拆解能力,能处理从数论证明到代数运算的各类高难度数学任务。

除了逻辑推理,Ring-2.5-1T在长程自主执行能力上同样独树一帜。在需要多轮规划、跨上下文整合的搜索、编码等复杂任务中,它能独立完成从需求分析到结果输出的全流程——比如面对“优化一个1000行以上的Python项目性能”这类指令,它可以自主拆解任务、定位性能瓶颈、生成优化代码并完成调试,无需人类额外介入。

但最让业界关注的,是该模型打破了长期困扰大模型发展的“不可能三角”:深度思考、推理速度、显存效率三者难以兼得。此前,万亿参数模型要实现深度逻辑推理,往往意味着推理速度大幅放缓、显存开销急剧增加,这使得这类模型只能在特定实验室场景中运行,难以走向大规模实用。而Ring-2.5-1T采用全球首创的混合线性架构,通过对模型计算流程的重构,当生成长度拉至32K以上时,访存规模直接降至传统万亿参数模型的1/10以下,同时生成吞吐量提升3倍以上。这意味着,兼具“深思考”与“快响应”的AI模型不再是幻想,而是能真正落地到实时交互、大规模并发的实际场景中。

作为全球首个开源的混合线性架构万亿参数模型,Ring-2.5-1T的发布更具行业普惠意义。它为全球AI研究者和开发者提供了可免费使用的技术底座,让更多中小团队也能接触到万亿参数模型的核心技术,无需再为高昂的算力和研发成本望而却步。

从早期的参数竞赛到如今的架构创新,AI大模型的发展正在从“量的积累”转向“质的突破”。Ring-2.5-1T的出现,不仅为行业提供了一个高性能、高效率的大模型样本,更预示着大模型技术的下一个风口——如何在提升智能水平的同时,兼顾落地的实用性与经济性。未来,这类兼具深度思考与高效运行的模型,或将成为推动AI在教育、科研、企业服务等领域深度渗透的核心动力。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创