2026年4月24日,社交平台Soul旗下AI研发机构Soul AI Lab宣布开源业内首个14亿参数实时数字人生成模型SoulXFlashTalk。该模型可实现亚秒级交互延迟、每秒32帧高帧率输出,本次开放包含项目页面、技术报告、源代码与模型权重全套资源。此前Soul已开源语音合成模型SoulXPodcast,此举进一步完善了其“语音+视觉”双模态开源布局,将有效降低行业研发门槛。
当下实时数字人已经广泛落地在虚拟陪伴、直播带货、在线客服等多个To C和To B场景,行业对交互体验的要求正在持续提升。流畅的实时交互要求模型同时满足低延迟和高帧率两个核心条件,此前多数高性能实时数字人技术掌握在少数大厂手中,以闭源形式对外提供服务,中小团队很难获取可商用的高性能开源方案,行业创新门槛始终居高不下。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录