32倍压缩率下性能反超25%,阿里COMI破解长文本压缩难题登ICLR2026
阿里巴巴未来生活实验室研发的COMI长文本压缩框架在ICLR 2026上正式亮相,成功破解高压缩率下性能断崖下跌的行业难题。该框架在32倍压缩率下,相比现有主流方法性能反超25个百分点,核心创新在于跳出仅关注“相关性”的传统思路,同时优化信息的“相关性”与“多样性”,避免冗余相似信息干扰模型决策。
当大模型处理32K长度的学术论文、合同文书等长文本时,若要将其压缩至1K规模以提升推理效率,现有压缩方法往往遭遇“翻车”:模型不仅无法精准响应查询,甚至会生成完全错误的结果。这一困扰AI行业已久的长文本压缩痛点,如今被阿里巴巴未来生活实验室的研究团队彻底破解,相关成果已入选顶级学术会议ICLR 2026。
当前主流的长文本上下文压缩方法,普遍将“与查询的相关性”作为信息筛选的唯一核心指标。但在高压缩率场景下——比如将32K长文本压缩至1K,这种思路会陷入“信息内卷”的陷阱:系统会密集保留大量语义高度相似的冗余token,看似覆盖了与查询相关的内容,实则这些重复信息无法叠加有效价值,反而会相互干扰,让大模型在冗余信息中迷失方向,最终导致性能断崖式下跌。
阿里巴巴未来生活实验室的研究团队通过分析发现,问题的根源在于传统压缩目标的根本错位。为此,他们提出了颠覆性的优化思路:高质量的长文本压缩,需要同时兼顾“信息与查询的相关性”和“信息单元间的多样性”。
基于这一思路,团队研发了COMI(Coarse-to-fine Multi-Interest Optimization)框架,采用粗到细的两层筛选机制:首先从长文本中快速圈定与查询相关的信息片段,再通过精细化的语义比对,剔除其中内容重复、语义雷同的冗余部分,确保每一个保留的token都能为模型提供独特的有效信息。
实验数据验证了这一思路的有效性:COMI框架在32倍压缩率下,相比现有最优压缩方法,性能反超25个百分点,彻底打破了“高压缩率必然伴随性能暴跌”的行业固有认知。
此次COMI框架入选ICLR 2026,不仅代表其在学术层面的创新性获得认可,更具备广阔的产业落地前景。
对于依赖长文档处理的场景——比如企业内部知识库问答、法律文书智能解析、长对话式客服系统等,COMI框架能在大幅降低上下文窗口占用、削减模型推理成本的同时,保障输出结果的准确性与可靠性。此外,该框架的“相关性+多样性”双优化思路,也为多模态内容压缩提供了新的借鉴方向,未来有望扩展至长视频、多模态混合文档的高效处理场景。

1 天前
2026年3月31日,小米创办人、董事长兼CEO雷军公开披露,旗下自研大模型MiMo-V2-Pro在权威大模型评测平台Text Arena的Model Rank维度跻身全球前五,位列Anthropic、OpenAI、Google之后。该评测采用双盲测试机制,由全球真实用户匿名投票排名,彻底杜绝传统评测常见的刷榜行为,排名含金量远高于常规专项数据集评测结果。

6 天前
3月25日,半导体行业盛会SEMICON China 2026在上海新国际博览中心正式启幕,本届展会总面积达10万平方米,吸引1500家国内外半导体厂商参展,预计专业观众规模将达18万人次,配套举办近20场行业论坛。展会围绕AI驱动半导体产业升级核心主题,集中展示产业链各环节面向AI算力需求的技术落地成果,为行业带来全新增长机遇。

10 天前
2026年3月,腾讯正式宣布撤销成立近十年的集团级基础研究机构AI Lab,将其全部研究能力整体并入大模型研发体系,由腾讯首席AI科学家、前OpenAI研究员姚顺雨统筹管理,原AI Lab核心研发人员已并入大语言模型部。本次调整集中资源推进混元大模型迭代,全新版本混元3.0预计于2026年4月正式发布,标志着互联网大厂AI研发进入“去实验室化”的落地攻坚阶段。

16 天前
2026年3月17日举办的GTC大会上,英伟达CEO黄仁勋正式发布企业级AI智能体平台NemoClaw。该平台基于开源框架OpenClaw打造,核心定位为OpenClaw提供“企业级盔甲”,重点解决企业本地部署AI智能体时的安全与隐私痛点。黄仁勋同时提出,企业应将OpenClaw战略提升至与Linux、Kubernetes同等重要的基础设施层级。

16 天前
2026年3月17日,钉钉创始人、CEO陈航在2026AI钉钉2.0年度新品发布会上正式推出AI原生工作平台“悟空”,该产品支持双端运行、可24小时不间断自主工作,标志着阿里巴巴企业级AI Agent战略正式落地。此前一日阿里宣布成立由CEO吴泳铭直管的Alibaba Token Hub事业群,配套设立悟空事业部打通大模型能力到B端生产力的转化路径。

16 天前
2026年3月16日举办的英伟达GTC大会上,公司CEO黄仁勋发布最新业绩预期:到2027年底,旗下Blackwell与Rubin架构芯片累计营收将至少达到1万亿美元,较此前2026年底5000亿美元的预期大幅上调。本次大会英伟达还发布了整合收购Groq技术的LPU语言处理单元协处理器,专为大语言模型推理场景优化。

16 天前
2026年3月17日举办的GTC大会上,英伟达正式推出Nemotron 3系列开源多模态模型家族,其中基于Blackwell架构深度优化的Nemotron 3 Ultra吞吐量效率较前代提升5倍,可适配复杂代码辅助、企业级工作流等场景,目前已获得CrowdStrike、ServiceNow等行业巨头的部署支持,同时亮相的还有面向物理AI、医疗领域的配套模型方案。

16 天前
2026年3月17日举办的GTC大会上,英伟达创始人黄仁勋正式宣布推出太空计算服务,将数据中心级AI推理能力扩展至近地轨道,为卫星星座、自主空间站提供底层算力支持。其核心硬件Space-1 Vera Rubin模块相较H100 GPU,太空环境下AI计算性能提升达25倍,标志着英伟达算力版图首次延伸至外太空领域。