32倍压缩率下性能反超25%,阿里COMI破解长文本压缩难题登ICLR2026
阿里巴巴未来生活实验室研发的COMI长文本压缩框架在ICLR 2026上正式亮相,成功破解高压缩率下性能断崖下跌的行业难题。该框架在32倍压缩率下,相比现有主流方法性能反超25个百分点,核心创新在于跳出仅关注“相关性”的传统思路,同时优化信息的“相关性”与“多样性”,避免冗余相似信息干扰模型决策。
当大模型处理32K长度的学术论文、合同文书等长文本时,若要将其压缩至1K规模以提升推理效率,现有压缩方法往往遭遇“翻车”:模型不仅无法精准响应查询,甚至会生成完全错误的结果。这一困扰AI行业已久的长文本压缩痛点,如今被阿里巴巴未来生活实验室的研究团队彻底破解,相关成果已入选顶级学术会议ICLR 2026。
当前主流的长文本上下文压缩方法,普遍将“与查询的相关性”作为信息筛选的唯一核心指标。但在高压缩率场景下——比如将32K长文本压缩至1K,这种思路会陷入“信息内卷”的陷阱:系统会密集保留大量语义高度相似的冗余token,看似覆盖了与查询相关的内容,实则这些重复信息无法叠加有效价值,反而会相互干扰,让大模型在冗余信息中迷失方向,最终导致性能断崖式下跌。
阿里巴巴未来生活实验室的研究团队通过分析发现,问题的根源在于传统压缩目标的根本错位。为此,他们提出了颠覆性的优化思路:高质量的长文本压缩,需要同时兼顾“信息与查询的相关性”和“信息单元间的多样性”。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
在2026年Google I/O开发者大会上,谷歌正式推出面向全场景用户的原生AI设计套件产品,从K12阶段的教师群体到年营收百万级的个体小商家都可零门槛调用全部功能,当前全球AI设计工具市场年复合增速已达68%,谷歌此番下场直接打破此前赛道由创业公司和垂直工具厂商主导的竞争格局。

2 天前
谷歌在2026年I/O开发者大会上正式发布全新音频驱动智能眼镜产品,该产品跳出此前AR眼镜依赖视觉显示的传统路径,深度整合Gemini大模型生态与谷歌全栈服务能力,主打全语音交互完成各类操作。业内认为该产品对标Meta近年推进的轻量化穿戴路线,有望在高速增长的AI穿戴市场打出差异化优势。

2 天前
2026年5月举办的Google I/O开发者大会上,Google正式公开了Gmail AI收件箱的核心迭代成果,将自研多模态大模型Gemini深度嵌入邮件系统底层,新增对话式语音搜索交互能力,普通用户无需手动筛选标签、输入精准关键词,即可快速定位深埋在收件箱中的邮件关键信息,相关实测数据显示邮件检索效率较此前提升72%。

2 天前
2026年5月20日,谷歌在I/O 2026开发者大会正式推出全新轻量大模型Gemini 3.5 Flash,其运行速度较前代提升4倍,综合表现超越上一代旗舰模型Gemini 3.1 Pro,在智能体运行、代码开发等核心场景达到顶级水准。谷歌宣布该模型即日起面向全球所有用户免费开放,大幅拉低顶尖大模型的使用成本,或将推动整个AI应用开发生态迎来新一轮变革。

2 天前
腾讯旗下微信AI团队在2026年西班牙巴塞罗那举办的ICASSP国际声学与信号处理大会上,凭借面向视障出行的WalkVLM-LR新型视觉语言模型成果拿下最佳工业论文奖。这一设立于2016年的奖项此前十年均由海外科技巨头包揽,本次是中国企业首次获奖,相关技术大幅降低信息冗余延迟,为AI无障碍落地提供了全新可行路径。

2 天前
谷歌在2026年开发者大会I/O上正式推出新一代轻量大模型Gemini 3.5 Flash,官方测试数据显示,该模型在编码、智能代理两大核心基准上的表现全面超越此前的Gemini 3.1 Pro,同时推理速度达到后者的4倍,整体部署成本大幅下降。该产品主要面向AI代理开发者、个人编码用户打造,进一步拉低了多智能体系统的落地门槛。

8 天前
近期模块化笔记本品牌Framework宣布再度上调旗下可更换RAM、存储模块售价,本次调价受上游存储芯片产能紧张、端侧AI部署需求暴涨双重驱动。当前ChatGPT、Google Gemini、Apple Intelligence等大模型纷纷落地PC端,消费级设备对内存、存储的配置需求较三年前提升近2倍,存储产业链供需缺口持续扩大。

26 天前
2026年4月27日,网易有道云笔记正式推出专为AI时代打造的LLM Wiki技能套件,瞄准大语言模型普及背景下个人知识管理的普遍痛点,提出将传统知识库从“信息检索仓库”升级为“知识增量编译器”的核心定位,推动知识管理实现从“被动检索”到“主动编译”的模式转变,试图从底层逻辑重构AI时代的个人生产力工具。