字节跳动推出全双工语音大模型 Seeduplex
4 月 9 日,字节跳动推出原生全双工语音大模型 Seeduplex,目前已全量上线豆包 App。该模型基于「边听边说」的全新框架设计,相比上一代半双工端到端语音模型,实现了听与说同步的实时交互,在对话节奏、自然度和抗干扰能力上有所提升。
据官方介绍,Seeduplex 通过模型架构创新与训练优化,攻克了高并发下的卡顿与稳定性等工程挑战。在精准抗干扰方面,模型具备持续「倾听」能力,能理解用户所处的声学环境,准确忽略背景噪音和无关对话。复杂场景下,误回复率和误打断率较半双工模型减少 50%。在动态判停方面,模型联合语音和语义特征综合判断用户意图,面对用户思考犹豫时能耐心倾听,用户说完后快速响应,抢话比例较半双工模型下降 40%,判停表现提升 8%。
多维度评测显示,Seeduplex 在对话流畅度和节奏感上均显著优于传统半双工方案及行业主流 App 的语音通话功能。该模型已在业界率先实现规模化落地,可为上亿用户提供连续高质量的实时语音交互体验。(来源:CnBeta)
红包分享
钱包管理

