字节跳动推出全双工语音大模型 Seeduplex-人工智能的专栏

字节跳动推出全双工语音大模型 Seeduplex

2026-04-11 00:48:20栏目：默认栏目 IP属地：IP未知

4 月 9 日，字节跳动推出原生全双工语音大模型 Seeduplex，目前已全量上线豆包 App。该模型基于「边听边说」的全新框架设计，相比上一代半双工端到端语音模型，实现了听与说同步的实时交互，在对话节奏、自然度和抗干扰能力上有所提升。

据官方介绍，Seeduplex 通过模型架构创新与训练优化，攻克了高并发下的卡顿与稳定性等工程挑战。在精准抗干扰方面，模型具备持续「倾听」能力，能理解用户所处的声学环境，准确忽略背景噪音和无关对话。复杂场景下，误回复率和误打断率较半双工模型减少 50%。在动态判停方面，模型联合语音和语义特征综合判断用户意图，面对用户思考犹豫时能耐心倾听，用户说完后快速响应，抢话比例较半双工模型下降 40%，判停表现提升 8%。

多维度评测显示，Seeduplex 在对话流畅度和节奏感上均显著优于传统半双工方案及行业主流 App 的语音通话功能。该模型已在业界率先实现规模化落地，可为上亿用户提供连续高质量的实时语音交互体验。（来源：CnBeta）