2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。
AI生成视频是当前AIGC领域落地需求最旺盛的方向之一,但生成速度慢、推理成本高的问题,始终卡住行业规模化应用的脖子。原生扩散视频生成模型通常需要数十步甚至上百步推理才能生成合格内容,单条1080P短视频的生成成本往往数元起,就算经过知识蒸馏压缩到少步模型,推理成本依然难以满足批量生产的需求。
传统特征缓存方案虽然能在多步生成模型上实现不错的加速效果,但直接移植到少步蒸馏模型上,会产生过大的缓存误差,最终直接导致生成画面崩坏、质量不达标,这一矛盾长期没有得到行业的有效解决。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录