2026年3月17日,阿里巴巴通义实验室联合中国科学技术大学正式开源Fun-CineForge电影级多模态配音项目。该项目推出端到端AI配音生产流水线,搭载多模态大模型架构与国内首个标注完备的CineDub中文影视配音数据集,可解决传统AI配音口型错位、情感生硬、适配复杂场景能力弱等行业痛点,相关技术已达到影视制作商用标准。
不少观众在观看译制剧、二次剪辑的影视内容时,都遇到过AI配音与角色口型错位、情绪和剧情完全脱节的“出戏”时刻——这一困扰行业多年的痛点,终于迎来了针对性的开源解决方案。
随着影视内容供给的多元化,AI配音的需求正在快速上涨:老片修复的语音重建、海外内容的本土译制、补拍片段的快速补配、短视频平台二次创作的批量配音,都在呼唤低成本、高质量的自动化配音方案。
但此前市场上的通用AI配音工具,大多仅能适配简单的旁白、播报场景,一旦遇到多人对白、情绪起伏大的戏剧桥段、带有背景混响的复杂场景,就容易出现口型匹配偏差超过0.2秒、情感表达机械、角色音色混淆等问题,始终达不到专业影视制作的准入标准。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录