登录体验完整功能(收藏、点赞、评论等) — 已累计有 11368 人加入

腾讯混元联合多家顶尖科研机构发布MMAE 填补AI音频编辑评估空白

详情页推荐

2026年6月,腾讯混元联合上海交通大学、新加坡南洋理工大学、天津大学、北京大学、复旦大学等顶尖科研机构,共同发布首个通用指令驱动的大规模多任务音频编辑基准测试集MMAE。首轮测试数据显示当前AI模型音频精准编辑能力不足5%,该基准将为AI音频编辑领域提供统一的系统性评估标准,推动相关技术落地商用。

配图

做过短视频后期的创作者大多有过类似的困扰:一段已经剪好的访谈音频里混入了突发的车鸣声,想要删掉杂音却要花十几小时微调音轨,找AI工具处理要么把人声一起消掉,要么改完的音频出现明显的拼接痕迹。这正是当前AI音频领域普遍面临的技术瓶颈:生成能力突飞猛进,编辑能力却迟迟跟不上实际需求。

近年来AI音频生成领域进展迅速,文本转语音、AI作曲、声音克隆等技术已经实现大规模商用,多家厂商的生成音频音质已经接近真人录制水平。但与生成端的成熟相比,AI对已有音频的编辑能力始终存在明显短板:现有模型大多只能根据提示生成完整的新音频,无法按照用户需求精准修改已有音频的特定片段,也难以做到修改部分与原音频的自然衔接,不少用户调侃现在的AI音频是“会生成不会改”,要调整内容不如直接重做。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。