2026年6月5日,腾讯云在2026AI产业应用大会上正式发布音视频AI原生能力底座WAND。依托20余年音视频技术积累,WAND内置六大自研媒体专用模型,覆盖60余项媒体AI能力,以Agent-Native模式向行业开放,实现从单点能力供给到AI应用原生媒体底座的战略升级,可填补主流通用生成式大模型在专业媒体生产场景的能力短板。

此次发布是腾讯云音视频业务沉淀20余年技术能力后的一次战略级转向——过往腾讯云对外输出的多是转码、画质增强等单点工具类能力,而WAND的推出意味着其正式锚定AI Agent时代的媒体基础设施定位,为各类AI应用提供开箱即用的音视频处理全链路支持。
WAND整体采用三层架构设计,最底层为模型引擎层,内置编解码、画质增强、智能擦除、内容生成、内容理解、音频处理六大自研媒体专用模型,针对专业媒体生产场景做了专项优化,填补了主流通用生成式大模型在音视频处理精度、效率上的不足。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录