登录体验完整功能(收藏、点赞、评论等) — 已累计有 12555 人加入

字节跳动发布Seeduplex全双工语音大模型 已落地豆包亿级用户

详情页推荐

2026年4月9日,字节跳动Seed团队正式推出原生全双工语音大模型Seeduplex,突破传统语音交互的回合制限制,实现“边听边说”的同步处理能力。目前该技术已在旗下AI产品豆包App全量上线,完成亿级用户规模化落地。相比传统半双工方案,其误回复率与误打断率降低50%,判停延迟缩短约250ms,抢话比例下降40%。

日常使用智能语音助手时,很多人都遇到过类似的尴尬:嘈杂环境下指令识别完全跑偏、话说到一半就被助手强行打断、每轮对话必须等对方说完才能接话,生硬的「回合制」交互与人类自然对话的逻辑相差甚远。字节跳动此次发布的新技术,正是瞄准这一困扰行业多年的用户痛点。

和传统半双工语音交互“你说我听、你停我答”的串行逻辑不同,Seeduplex从底层架构上采用了语音与语义联合建模的原生全双工框架,支持“边听边说”的并行处理,从根源上提升了语音交互的自然度。

针对复杂环境下的识别难题,该模型的抗干扰能力实现了大幅跃升,**相比传统半双工方案,误回复率与误打断率降低了50%**,即便在导航播报、多人交谈、环境杂音等干扰场景下,也能精准锁定主用户的语音指令,排除无关信息的干扰。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。