蚂蚁开源全球首个混合线性架构万亿模型 兼得推理深度与速度
春节后AI大模型赛道竞争再度升级。2月14日,蚂蚁集团正式发布全球首个开源混合线性架构万亿参数模型Ring-2.5-1T,该模型不仅斩获IMO金牌级数学推理成绩,更通过架构创新打破了业界“深度思考必然牺牲速度与显存效率”的固有认知,为大模型在复杂场景的落地提供了全新技术路径。
当AI大模型领域还在为春节期间的技术比拼余热未消时,蚂蚁集团的新发布直接将竞争推向了更深层次的技术维度。此次推出的Ring-2.5-1T,核心聚焦两大关键能力的突破:顶尖数学逻辑推理与高效长程任务自主执行。
在数学推理这一AI智力水平的“试金石”上,Ring-2.5-1T的表现堪称惊艳。它在国际数学奥林匹克竞赛(IMO)的模拟测试中拿到35分,达到金牌选手的准入线;在代表国内最高数学竞赛水平的CMO模拟考核中,更是斩获105分,远超国家集训队90分左右的入选线。要知道,IMO金牌代表着人类青少年数学逻辑的顶尖水平,而CMO国家集训队则是国内数学人才的金字塔尖,这一成绩意味着该模型已具备媲美顶尖人类的抽象思维、多步骤推导和复杂问题拆解能力,能处理从数论证明到代数运算的各类高难度数学任务。
除了逻辑推理,Ring-2.5-1T在长程自主执行能力上同样独树一帜。在需要多轮规划、跨上下文整合的搜索、编码等复杂任务中,它能独立完成从需求分析到结果输出的全流程——比如面对“优化一个1000行以上的Python项目性能”这类指令,它可以自主拆解任务、定位性能瓶颈、生成优化代码并完成调试,无需人类额外介入。
但最让业界关注的,是该模型打破了长期困扰大模型发展的“不可能三角”:深度思考、推理速度、显存效率三者难以兼得。此前,万亿参数模型要实现深度逻辑推理,往往意味着推理速度大幅放缓、显存开销急剧增加,这使得这类模型只能在特定实验室场景中运行,难以走向大规模实用。而Ring-2.5-1T采用全球首创的混合线性架构,通过对模型计算流程的重构,当生成长度拉至32K以上时,访存规模直接降至传统万亿参数模型的1/10以下,同时生成吞吐量提升3倍以上。这意味着,兼具“深思考”与“快响应”的AI模型不再是幻想,而是能真正落地到实时交互、大规模并发的实际场景中。
作为全球首个开源的混合线性架构万亿参数模型,Ring-2.5-1T的发布更具行业普惠意义。它为全球AI研究者和开发者提供了可免费使用的技术底座,让更多中小团队也能接触到万亿参数模型的核心技术,无需再为高昂的算力和研发成本望而却步。
从早期的参数竞赛到如今的架构创新,AI大模型的发展正在从“量的积累”转向“质的突破”。Ring-2.5-1T的出现,不仅为行业提供了一个高性能、高效率的大模型样本,更预示着大模型技术的下一个风口——如何在提升智能水平的同时,兼顾落地的实用性与经济性。未来,这类兼具深度思考与高效运行的模型,或将成为推动AI在教育、科研、企业服务等领域深度渗透的核心动力。

1 个月前
DeepSeek升级至1M Token上下文窗口 万亿参数模型在路上 2月11日,AI模型DeepSeek的网页端与移动应用同步完成版本迭代,其核心突破在于将上下文窗口长度提升至100万(1M)Token,较此前128K版本的处理能力跃升近8倍,可一次性处理整本长篇小说、完整项目代码库等大规模...

1 个月前
蚂蚁开源全球首个混合线性架构万亿参数思考模型Ring-2.5-1T 2月13日,蚂蚁集团正式开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,该模型在长文本推理、数学逻辑推导及智能体任务执行上达到开源领域领先水平,不仅将32K以上长文本推理效率提升3倍,更具备国际数学奥...

1 个月前
蚂蚁集团近期开源发布全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,在长文本生成、数学推理及智能体任务执行等领域达到开源领先水平。在32K以上长文本场景中,其访存规模降低10倍以上,生成吞吐提升3倍以上,模型权重与推理代码已开放,API服务近期上线。

40 分钟前
近日,人工智能企业OpenAI正式宣布关停旗下AI视频生成工具Sora。该产品2024年2月首次亮相时,曾凭借最高生成60秒4K分辨率连贯视频的能力引发行业震动,上线后累计有超12万创作者获得测试资格。本次关停并未如外界最初猜测一般源于版权纠纷,而是与模型训练成本高企、商用化落地不及预期直接相关。

43 分钟前
斯坦福大学人机交互实验室近日发布专项研究结果,针对ChatGPT、Google Gemini、DeepSeek等12款主流生成式AI聊天机器人的测试显示,其在医疗、财务、个人职业选择等高风险决策场景的平均错误率达37%,专家明确提示普通用户不应将AI聊天机器人作为个人决策的唯一参考依据,需对其输出内容保持审慎验证态度。

44 分钟前
微软近期正式上线AI协作工具Copilot Cowork,搭载全新升级的智能研究引擎,可自动扫描用户工作文档、项目材料中的逻辑漏洞、数据缺失及论证空白,目前已向Office 365商业版用户开放灰度测试。据内部测试数据显示,该工具可帮助职场用户减少42%的跨部门信息核对时间,项目前期漏洞排查效率提升近60%。

46 分钟前
近日,家用智能设备厂商Beatbot正式发布面向泳池护理场景的Sora系列机器人,产品搭载边缘端AI视觉模型,可自主识别水体杂质、规划清洁路径,清洁覆盖率较传统自动清洁设备提升47%。与此同时,OpenAI、Google、DeepSeek等主流大模型厂商均在加速布局智能家居赛道,AItoC落地场景边界正在持续扩容。

49 分钟前
近期苹果公司旗下原生AI功能Apple Intelligence在国内iOS 18开发者预览版用户设备中短暂现身,上线仅数小时后便被快速关停。作为苹果首款端云协同大模型服务,Apple Intelligence此前官宣仅面向欧美英语市场率先推送,本次意外曝光也引发业内对其中国区落地进程、监管适配进度的广泛讨论。