近日,东京AI初创公司Sakana AI发布Text-to-LoRA(T2L)与Doc-to-LoRA(D2L)两项基于超网络架构的大模型技术。其中D2L无需对大模型重新训练,可在一秒内完成超长文档处理,速度较传统技术提升40至100倍;T2L则支持以自然语言描述生成专属性能增强插件,为大模型应用场景拓展提供新方向。
在大模型商业化落地的进程中,超长文档处理始终是制约效率的核心痛点之一。传统技术方案要么需要对模型进行全量重训,耗费大量算力与时间;要么处理速度极慢,无法满足企业实时分析合同、学术文献等场景的需求。
Doc-to-LoRA(D2L) 是此次发布的核心技术之一,它实现了大模型无需全量重训即可快速“消化”超长文档。据介绍,该技术能在不到一秒的时间内完成12.8万Token的超长文档处理,并将文档信息转化为不到50MB的轻量化插件,处理速度较传统技术提升了40至100倍,同时还支持处理更长文本内容,彻底解决了长文档处理的效率瓶颈。
Text-to-LoRA(T2L) 则聚焦于大模型的定制化需求,它允许用户通过自然语言描述,直接生成专属的性能增强插件。这意味着非技术人员也能根据业务场景需求,快速调整大模型的任务处理能力,无需掌握复杂的模型微调代码,大幅降低了大模型定制化的门槛。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 小时前
2026年5月,谷歌面向全球全量用户推送搜索产品的AI功能迭代后,被曝出现罕见功能性漏洞:用户在搜索框输入英文关键词“disregard”检索时,会直接导致搜索界面加载失败、功能完全失效。该漏洞已在全球多个地区的PC端、移动端搜索场景复现,目前谷歌官方尚未作出公开回应,也未推送针对性修复补丁。

3 小时前
第三方调研机构PitchBook 2026年一季度数据显示,北美地区AI初创企业对外披露的年度经常性收入(ARR)平均注水率达47%,近6成风险投资机构(VC)对被投企业的营收虚增行为知情甚至主动提供操作指导,此类合谋造星的操作正在快速推高AI赛道估值泡沫,也为后续行业健康发展埋下不小的风险隐患。

12 小时前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

13 小时前
近日独立AI创作者借助OpenAI GPT-4o、DeepSeek大模型等工具,成功复刻科幻名作《挽救计划》(Project Hail Mary)的全星系恒星地图,经原著爱好者联合校验,该星图对书中提及的12万颗天体坐标还原度达99.7%,误差控制在0.3%以内,远超此前所有同人衍生内容的制作精度,成为近期生成式AI落地小众创作领域的标杆案例。

13 小时前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。

13 小时前
B站于2026年5月发布的第一季度财报显示,公司单季总营收达74.7亿元同比增长7%,首次实现净利润2.02亿元正式扭亏,经调整净利润5.85亿元同比大增62%。B站CEO陈睿将AI定义为历史性增长机遇,本季度广告收入25.9亿元同比激增30%,AI全链路赋能成为核心驱动因素,为国内内容平台的AI商业化落地提供了可参考的全新样本。

14 小时前
近日Mozilla正式宣布旗下火狐浏览器将启动代号为Project Nova的大规模版本重构项目,计划于2026年下半年逐步向全量用户推送升级。本次升级围绕界面现代化、隐私控制、生产力三大方向优化,最核心的更新是设置页新增全局统一开关,用户可一键关停浏览器内置的当前及未来所有AI相关功能,进一步强化用户对数据隐私的自主控制权。

14 小时前
国内头部大模型厂商DeepSeek近期官宣累计融资额突破700亿元,管理层正式对外披露全新战略方向,不再将短期商业化收益作为核心考核目标,集中全部资源攻坚前沿AI技术,其中面向开发者的编程专属大模型DeepSeek Code已进入落地筹备阶段,相关配套的Agent Harness技术团队招聘工作也已全面启动。