登录体验完整功能(收藏、点赞、评论等) — 已累计有 12592 人加入

Soul AI Lab开源14亿参数亚秒级实时数字人模型SoulXFlashTalk

详情页推荐

2026年4月24日,社交平台Soul旗下AI研发机构Soul AI Lab宣布开源业内首个14亿参数实时数字人生成模型SoulXFlashTalk。该模型可实现亚秒级交互延迟、每秒32帧高帧率输出,本次开放包含项目页面、技术报告、源代码与模型权重全套资源。此前Soul已开源语音合成模型SoulXPodcast,此举进一步完善了其“语音+视觉”双模态开源布局,将有效降低行业研发门槛。

当下实时数字人已经广泛落地在虚拟陪伴、直播带货、在线客服等多个To C和To B场景,行业对交互体验的要求正在持续提升。流畅的实时交互要求模型同时满足低延迟和高帧率两个核心条件,此前多数高性能实时数字人技术掌握在少数大厂手中,以闭源形式对外提供服务,中小团队很难获取可商用的高性能开源方案,行业创新门槛始终居高不下。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。