谷歌近日推出实验性开源大语言模型DiffusionGemma,首次将此前广泛应用于图像生成的扩散模型技术引入文本生成领域,打破传统大模型从左到右逐词生成的固有逻辑,可同时生成整段通顺文本,推理速度较传统自回归架构大模型最高提升4倍,为大语言模型效率优化提供了全新技术路径。

作为当前大语言模型的主流架构,自回归模式的效率瓶颈已经成为制约行业落地的核心痛点。在生成长文档、多轮对话等内容时,逐词生成的逻辑会导致延迟随内容长度线性上升,不仅影响用户体验,也会大幅提升企业的推理算力成本,行业一直在寻找更高效的替代架构。
当前主流大语言模型普遍采用自回归架构,从ChatGPT到谷歌此前推出的Gemma系列模型均遵循这一逻辑:生成内容时按照从左到右的顺序逐词输出,每一个新词汇的生成都需要依赖前文的全部生成结果,这就导致内容越长、生成延迟越高。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录