2026年6月谷歌联合英伟达正式发布开源大语言模型DiffusionGemma,首次将图像领域成熟的扩散机制引入文本生成赛道,打破传统大模型逐字生成的自回归范式。该模型参数规模260亿,经英伟达硬件优化后单卡推理速度较同类传统模型提升近4倍,H100显卡单请求输出可达每秒1000标记,消费级RTX5090也能实现每秒700标记的输出效率。

2026年6月10日,谷歌DeepMind团队低调上线了实验性开源模型DiffusionGemma,这款产品从立项阶段就邀请英伟达AI计算团队参与联合硬件适配,上线首日就登顶Hugging Face开源模型趋势榜首位,引发全球AI开发者社群的广泛讨论。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录