登录体验完整功能(收藏、点赞、评论等) — 已累计有 11635 人加入

谷歌发布开源DiffusionGemma 扩散技术加持推理最高提速4倍

详情页推荐

谷歌近日推出实验性开源大语言模型DiffusionGemma,首次将此前广泛应用于图像生成的扩散模型技术引入文本生成领域,打破传统大模型从左到右逐词生成的固有逻辑,可同时生成整段通顺文本,推理速度较传统自回归架构大模型最高提升4倍,为大语言模型效率优化提供了全新技术路径。

配图

作为当前大语言模型的主流架构,自回归模式的效率瓶颈已经成为制约行业落地的核心痛点。在生成长文档、多轮对话等内容时,逐词生成的逻辑会导致延迟随内容长度线性上升,不仅影响用户体验,也会大幅提升企业的推理算力成本,行业一直在寻找更高效的替代架构。

当前主流大语言模型普遍采用自回归架构,从ChatGPT到谷歌此前推出的Gemma系列模型均遵循这一逻辑:生成内容时按照从左到右的顺序逐词输出,每一个新词汇的生成都需要依赖前文的全部生成结果,这就导致内容越长、生成延迟越高。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。