东京AI初创公司Sakana AI于2026年2月28日发布Text-to-LoRA(T2L)与Doc-to-LoRA(D2L)两项基于超网络架构的技术。其中D2L可让大模型无需重训,1秒内处理12.8万Token超长文档,速度较传统技术快40至100倍;T2L则支持自然语言生成专属性能插件,为大模型应用场景带来革新空间。
当企业还在为大模型处理百页合同、科研论文等超长文档动辄数小时的效率发愁时,来自东京的AI初创公司Sakana AI给出了新的解决方案——仅需不到一秒,大模型就能“消化”12.8万Token的超长文档,处理速度较传统技术提升40至100倍。
传统大模型处理超长文档时,往往需要通过扩展上下文窗口或全量微调实现适配,但这种方式不仅耗时久、计算成本高,还可能损害模型原有的通用性能。而Sakana AI推出的Doc-to-LoRA(D2L)技术,彻底打破了这一限制:无需对大模型进行重新训练,仅通过生成轻量化的LoRA插件,就能让模型在一秒内完成对12.8万Token超长文档的信息吸收。
数据显示,D2L可将12.8万Token的文档内容打包进不到50MB的插件,处理速度较传统技术快40至100倍,同时还能支持更长文本的处理需求。对于需要处理海量长文档的法律、医疗、科研等行业而言,这一技术将直接推动合同审查、病历分析、论文解读等流程的效率跃升。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录