2026年4月9日,字节跳动Seed团队正式推出原生全双工语音大模型Seeduplex,突破传统语音交互的回合制限制,实现“边听边说”的同步处理能力。目前该技术已在旗下AI产品豆包App全量上线,完成亿级用户规模化落地。相比传统半双工方案,其误回复率与误打断率降低50%,判停延迟缩短约250ms,抢话比例下降40%。
日常使用智能语音助手时,很多人都遇到过类似的尴尬:嘈杂环境下指令识别完全跑偏、话说到一半就被助手强行打断、每轮对话必须等对方说完才能接话,生硬的「回合制」交互与人类自然对话的逻辑相差甚远。字节跳动此次发布的新技术,正是瞄准这一困扰行业多年的用户痛点。
和传统半双工语音交互“你说我听、你停我答”的串行逻辑不同,Seeduplex从底层架构上采用了语音与语义联合建模的原生全双工框架,支持“边听边说”的并行处理,从根源上提升了语音交互的自然度。
针对复杂环境下的识别难题,该模型的抗干扰能力实现了大幅跃升,**相比传统半双工方案,误回复率与误打断率降低了50%**,即便在导航播报、多人交谈、环境杂音等干扰场景下,也能精准锁定主用户的语音指令,排除无关信息的干扰。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录