中关村在线

热点资讯

字节跳动发布全双工语音大模型Seeduplex,实现自然实时人机对话

2026年4月9日,字节跳动正式发布原生全双工语音大模型Seeduplex。该模型采用“边听边说”的全新技术架构,突破传统语音交互中固有的单向响应模式,首次在大规模应用层面实现真正自然、实时、连续的人机对话。

目前,Seeduplex已全面集成至豆包App,成为业内首个完成规模化部署并面向全体用户开放的全双工语音大模型。

其核心突破在于彻底重构语音交互逻辑:不再依赖“用户说完—系统处理—系统回复”的半双工流程,而是同步完成语音接收、语义理解与响应生成,使听与说在时间维度上无缝交织。这一转变带来两项关键能力升级:

一是精准抗干扰能力。模型具备持续专注的语音感知能力,可动态建模用户所处的真实声学环境,有效识别并过滤背景杂音、他人交谈等干扰源。在车站、商场、家庭等复杂场景中,误响应与误中断的发生率较传统半双工方案降低50%。

二是动态判停能力。模型深度融合语音信号特征与上下文语义信息,对用户表达意图进行实时综合判断,从而精准把握对话节奏。当用户出现停顿、迟疑或语气转换时,系统保持静默倾听;一旦确认用户表达结束,即刻启动响应。相较半双工方案,主动抢话行为减少40%。

多维度实测结果表明,Seeduplex在对话连贯性与节奏控制方面,显著超越现有半双工语音系统及主流应用的语音通话功能;在判停准确性上较半双工基准提升8%,展现出更贴近人类对话的分寸把握与情境感知。

主观评测中,对话自然度MOS分提升12%,整体通话满意度上升8.34%;其打断响应的及时性与合理性已略微优于真人对话的平均水平,使人机交互体验进一步趋近真实人际交流。

在工程实现层面,Seeduplex依托自研大语言模型底层架构,通过结构创新、超大规模语音数据预训练、端到端推理加速及高可用性保障机制,成功应对亿级并发场景下的延迟与稳定性挑战,确保服务长期可靠运行。

即日起,用户升级至豆包App最新版本后,在“打电话”语音通话界面即可直接启用该功能。

展开全文
人赞过该文
内容纠错

相关电商优惠

评论

更多评论
还没有人评论~ 快来抢沙发吧~

读过此文的还读过

点击加载更多

内容相关产品

说点什么吧~ 0

发评论,赚金豆

收藏 0 分享
首页查报价问答论坛下载手机笔记本游戏硬件数码影音家用电器办公打印 更多

更多频道

频道导航
辅助工具