近日,东京AI初创公司Sakana AI发布Text-to-LoRA(T2L)与Doc-to-LoRA(D2L)两项基于超网络架构的大模型技术。其中D2L无需对大模型重新训练,可在一秒内完成超长文档处理,速度较传统技术提升40至100倍;T2L则支持以自然语言描述生成专属性能增强插件,为大模型应用场景拓展提供新方向。
在大模型商业化落地的进程中,超长文档处理始终是制约效率的核心痛点之一。传统技术方案要么需要对模型进行全量重训,耗费大量算力与时间;要么处理速度极慢,无法满足企业实时分析合同、学术文献等场景的需求。
Doc-to-LoRA(D2L) 是此次发布的核心技术之一,它实现了大模型无需全量重训即可快速“消化”超长文档。据介绍,该技术能在不到一秒的时间内完成12.8万Token的超长文档处理,并将文档信息转化为不到50MB的轻量化插件,处理速度较传统技术提升了40至100倍,同时还支持处理更长文本内容,彻底解决了长文档处理的效率瓶颈。
Text-to-LoRA(T2L) 则聚焦于大模型的定制化需求,它允许用户通过自然语言描述,直接生成专属的性能增强插件。这意味着非技术人员也能根据业务场景需求,快速调整大模型的任务处理能力,无需掌握复杂的模型微调代码,大幅降低了大模型定制化的门槛。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
18 分钟前
近期GitHub、Stack Overflow等全球开发者平台监测数据显示,AI编码工具普及后开发者人均编码效率提升超220%,但低质量重复“垃圾代码”占比同比上涨47%。包括OpenAI ChatGPT、GitHub Copilot、DeepSeek Coder在内的主流AI编码工具均被指易生成冗余、兼容性差的代码,给长期项目维护埋下风险,引发全球开发社区广泛热议。

20 分钟前
4月6日,小米MiMo大模型负责人罗福莉在海外社交平台X公开发文,结合此前Anthropic宣布Claude封禁OpenClaw等第三方工具、小米MiMo推出分层Token定价套餐的行业动态,系统拆解Agent场景下的算力分配与大模型定价逻辑,驳斥当前行业盲目开展价格战的短视行为,引发AI产业界对大模型健康商业化路径的广泛讨论。

22 分钟前
2026年4月7日,美图公司旗下AI Agent产品RoboNeo正式接入Seedance2.0大模型,完成AI短视频创作从“单点生成”到“系统化工作流”的升级。用户可直接调用文生视频、图生视频、首尾帧控制、视频参考生成等能力,自由组合创作逻辑,有效解决AI视频生成的片段化痛点,推动视频生产向工业化落地阶段迈进。

52 分钟前
2026年4月,亚马逊创始人杰夫·贝索斯旗下全新神秘AI实验室Project Prometheus宣布前OpenAI联合创始人Kyle Kosic正式入职。该实验室专注于开发可理解物理世界的先进人工智能系统,旨在突破现有大模型技术边界,打造更高自主性的智能系统,标志着贝索斯在AI前沿领域的布局进入落地阶段。

1 小时前
4月7日,AI大模型厂商Anthropic官方披露其年化收入(ARR)已突破300亿美元,首次反超竞争对手OpenAI同期250亿美元的年化收入水平。该公司2025年末年化收入仅为90亿美元,3个多月内收入规模大涨约210亿美元,同时同步官宣最新AI芯片采购大单,引发全球AI产业对大模型商业化格局的广泛讨论。

1 小时前
2026年4月曝光的内部信息显示,OpenAI总裁格雷格·布罗克曼曾提出极具争议的融资策略:借地缘政治紧张局势炒作AI军备竞赛,人为打造“不投资即落后”的囚徒困境,诱导各国政府为避免AI竞争劣势向OpenAI注资。该计划遭到内部员工强烈反对最终流产,现任Anthropic政策负责人杰克·克拉克曾对该策略做出定性。

2 小时前
2026年4月,欧洲头部人工智能企业Mistral AI联合创始人兼CEO Arthur Mensch访韩期间,与三星电子副董事长兼CEO全永铉及核心高层会晤,双方重点围绕AI半导体存储芯片供应链、技术协同方案展开磋商。Mistral AI正寻求稳定XPU算力芯片供应以支撑模型迭代,三星在高带宽内存...

2 小时前
2026年4月,OpenAI首席执行官山姆·奥特曼在公开专访中首度回应文生视频模型Sora停用传闻,明确表示关停并非源于技术瓶颈,而是公司当前存在极大算力缺口,有限的芯片资源将优先供给GPT系列大模型迭代等更高优先级项目,Sora因内部优先级排位靠后遭遇资源挤兑暂时下线。