2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。
AI生成视频是当前AIGC领域落地需求最旺盛的方向之一,但生成速度慢、推理成本高的问题,始终卡住行业规模化应用的脖子。原生扩散视频生成模型通常需要数十步甚至上百步推理才能生成合格内容,单条1080P短视频的生成成本往往数元起,就算经过知识蒸馏压缩到少步模型,推理成本依然难以满足批量生产的需求。
传统特征缓存方案虽然能在多步生成模型上实现不错的加速效果,但直接移植到少步蒸馏模型上,会产生过大的缓存误差,最终直接导致生成画面崩坏、质量不达标,这一矛盾长期没有得到行业的有效解决。
DisCa是学界和业界首次在蒸馏后少步模型上探索可学习特征缓存加速技术的尝试,核心思路是在已经完成蒸馏、推理步数已经压缩的模型基础上,进一步挖掘推理成本的压缩空间。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
14 秒前
近期AI架构领域针对企业级生成式AI应用提出了AI代理层(Agent Tier)这一新架构方向,业内技术研究者指出,当前企业数字化工作流中隐藏着Runtime架构适配痛点,传统分层架构无法满足上下文驱动的动态企业业务需求,专门针对大语言模型驱动自动化工作流设计的AI代理层,有望解决企业AI落地中上下文丢失、任务调度混乱等问题,目前全球多家头部科技企业已启动相关架构的试点测试。

2 分钟前
4月16日,全球IT运维管理厂商ManageEngine卓豪在北京举办媒体交流会,ManageEngine卓豪中国区首席运营官李飞对外披露了品牌在中国市场的最新AI技术路线、信创适配进展与合作伙伴渠道策略。日前该品牌已完成原生监控功能对阿里云、华为云、腾讯云三大国内头部云平台的原生接入,明确将智能体作为AI落地的核心发展方向。

30 分钟前
2026年4月最新披露的消息显示,今年1月苹果公司曾因埃隆·马斯克旗下xAI开发的AI大模型产品Grok,未有效管控X平台上泛滥的非自愿性别化深度伪造内容,公开暗示或将Grok从苹果应用商店下架。苹果已就相关用户投诉正式联系X与Grok开发团队,要求其尽快制定内容审核改善方案,事件引发全球科技行业对AI生成内容监管责任的广泛讨论。

1 小时前
2026年4月16日,谷歌DeepMind公布最新AI视觉领域研究成果TIPSv2,瞄准当前视觉-语言大模型“全局理解强、局部定位弱”的行业通病。该技术基于研究发现的“小参数量学生模型精细分割表现反超大教师模型”结论改进训练方案,可帮助AI精准定位图像局部细节,解决了领域内长期悬而未决的精细分割难题。

2 小时前
2026年4月,盖洛普发布针对美国职场的AI应用最新调查报告,本次调查覆盖超过2.37万名各行业员工,结果显示美国工作场所AI渗透率已达历史新高,近半数员工在工作中使用AI,不过仅26%的员工获得雇主明确的AI整合使用指导,不当使用导致美国员工平均每周因AI浪费近8小时,暴露了全球企业AI落地的普遍痛点。

2 小时前
4月16日,外媒The Information援引知情人士消息披露,苹果公司正为旗下语音助手Siri开发团队推进紧急AI能力升级,安排约200名程序员进入为期数周的AI编程训练营,系统性学习大模型时代的AI开发工具。培训后团队将重构分工:60人保留为核心开发组,60人转岗负责运行监测与安全审查,新版Siri预计今年6月正式亮相。

2 小时前
2026年4月16日,OpenAI正式推出更新版Agents开发工具包(Agents SDK),针对企业构建生产级智能代理的安全痛点推出多项核心更新,原生集成的隔离沙箱成为本次更新最大亮点。OpenAI产品团队成员Karan Sharma表示,本次更新的核心目标是平衡智能代理的自动化效率与运行安全性,帮助企业更快部署可控的AI自动化助手。

2 小时前
2026年4月,网络安全公司OX Security发布专项安全报告,披露AI企业Anthropic推出的开源标准MCP(模型上下文协议)存在架构层面设计缺陷,其SDK的STDIO接口未对传入命令做安全校验,可被攻击者利用实现远程代码执行,目前全球已有超过20万台基于MCP开发的AI服务器暴露在网络攻击风险下,该漏洞引发AI开发与安全领域的高度关注。