腾讯混元联合多家顶尖科研机构发布MMAE 填补AI音频编辑评估空白

AI创作导航管理员 LV4 资深连续登录7天萌新

7 小时前

风向

2026年6月，腾讯混元联合上海交通大学、新加坡南洋理工大学、天津大学、北京大学、复旦大学等顶尖科研机构，共同发布首个通用指令驱动的大规模多任务音频编辑基准测试集MMAE。首轮测试数据显示当前AI模型音频精准编辑能力不足5%，该基准将为AI音频编辑领域提供统一的系统性评估标准，推动相关技术落地商用。

做过短视频后期的创作者大多有过类似的困扰：一段已经剪好的访谈音频里混入了突发的车鸣声，想要删掉杂音却要花十几小时微调音轨，找AI工具处理要么把人声一起消掉，要么改完的音频出现明显的拼接痕迹。这正是当前AI音频领域普遍面临的技术瓶颈：生成能力突飞猛进，编辑能力却迟迟跟不上实际需求。

近年来AI音频生成领域进展迅速，文本转语音、AI作曲、声音克隆等技术已经实现大规模商用，多家厂商的生成音频音质已经接近真人录制水平。但与生成端的成熟相比，AI对已有音频的编辑能力始终存在明显短板：现有模型大多只能根据提示生成完整的新音频，无法按照用户需求精准修改已有音频的特定片段，也难以做到修改部分与原音频的自然衔接，不少用户调侃现在的AI音频是“会生成不会改”，要调整内容不如直接重做。

AI音频编辑音频处理人工智能腾讯混元 MMAE

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

腾讯混元联合多家顶尖科研机构发布MMAE 填补AI音频编辑评估空白

最新文章

X社区 · 无限公约

苹果多年打磨Siri AI大更新落地智能助手转向AI陪伴定位

WWDC2026正式启幕苹果推出系统级AI重构智能生态体验

WWDC 2026落地Apple Intelligence Siri与iOS 27迎来AI级重构

小米MiMo联合TileRT 万亿参数大模型消费级GPU推理破千token每秒

Cyera团队发现Protobuf.js高危漏洞威胁AI服务供应链安全

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

腾讯混元联合多家顶尖科研机构发布MMAE 填补AI音频编辑评估空白

最新文章

X社区 · 无限公约

苹果多年打磨Siri AI大更新落地 智能助手转向AI陪伴定位

WWDC2026正式启幕 苹果推出系统级AI重构智能生态体验

WWDC 2026落地Apple Intelligence Siri与iOS 27迎来AI级重构

小米MiMo联合TileRT 万亿参数大模型消费级GPU推理破千token每秒

Cyera团队发现Protobuf.js高危漏洞 威胁AI服务供应链安全

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

标签

探索分类

帮助与支持

联系我们

安装网站应用

苹果多年打磨Siri AI大更新落地智能助手转向AI陪伴定位

WWDC2026正式启幕苹果推出系统级AI重构智能生态体验

Cyera团队发现Protobuf.js高危漏洞威胁AI服务供应链安全