字节发布全双工语音大模型 Seeduplex，豆包打电话能边听边讲、交流更自然

3 个月前

AI资讯

72 阅读

大模型字节跳动 [语音交互 Seeduplex]

近年来，语音交互技术在智能助手、客服系统等多个场景中广泛应用。然而，传统语音模型多为半双工模式，即在听与说之间切换，导致对话存在延迟与机械感，用户体验受限。

字节跳动持续在人工智能与语音技术领域加大投入，依托豆包平台的技术积累，最新发布全双工语音大模型 Seeduplex，标志着语音交互进入一个新阶段。该模型基于“边听边说”的实时交互框架，模拟人类自然对话中的打断与回应机制，极大提升了语音交流的流畅性和拟人性。

字节发布全双工语音大模型 Seeduplex，豆包打电话能边听边讲、交流更自然

4月9日，豆包宣布其打电话功能正式接入 Seeduplex，用户在使用豆包进行语音通话时，能够感受到更加自然、实时的交互体验。

这一升级主要体现在：

Seeduplex 的推出不仅是豆包语音能力的一次飞跃，也为整个语音交互行业树立了新的技术标杆。全双工语音模型的普及有望推动以下发展方向：

未来，字节跳动或将继续拓展 Seeduplex 在更多产品线中的应用，如飞书、抖音语音功能等，进一步构建以语音为核心的人机交互生态。