谷歌联合英伟达发布DiffusionGemma 扩散机制实现单卡推理提速4倍

AI创作导航管理员 LV4 资深连续登录7天萌新

11 小时前

风向

2026年6月谷歌联合英伟达正式发布开源大语言模型DiffusionGemma，首次将图像领域成熟的扩散机制引入文本生成赛道，打破传统大模型逐字生成的自回归范式。该模型参数规模260亿，经英伟达硬件优化后单卡推理速度较同类传统模型提升近4倍，H100显卡单请求输出可达每秒1000标记，消费级RTX5090也能实现每秒700标记的输出效率。