谷歌干掉了「等你说完才翻译」,70+语言边听边译
从“等说完”到“边听边说”:翻译延迟被彻底消除
过去,手机翻译App通常需要用户说完一整句话,等待几秒才输出译文,这在对话场景中常导致卡顿和尴尬。Google最新发布的Gemini 3.5 Live Translate彻底改变了这一模式——它可以在用户讲话的同时,几乎同步输出译音。一句话还没说完,译音已经响起。这一突破得益于Gemini模型在流式音频处理上的优化,实现了真正的“边听边译”,让跨语言对话变得像母语交流一样自然。

70+语言实时同传,延迟压缩到秒级
新功能支持超过70种语言的实时语音翻译,覆盖全球主要语种。根据Google官方演示,从说话者开始发音到译文输出,延迟被压缩到几秒以内。翻译引擎不仅处理词汇,还能保留原话的语气、情绪和语调变化,避免机械生硬。例如,惊讶或疑问的语气会在译文中得到体现。这一能力基于Gemini模型对上下文和声学特征的深度理解,远超传统逐句翻译。
三大核心更新:从文本到耳机,覆盖全场景
此次更新包含三大核心内容:1)顶尖文本翻译质量:基于Gemini强化模型,文本翻译的准确性和流畅度显著提升,尤其擅长处理长难句和专有名词;2)耳机实时语音对话翻译(Beta版):用户佩戴兼容耳机时,可直接进行双向实时语音翻译,无需反复掏出手机。对话时,双方各自听到译音,仿佛拥有私人同传;3)语言练习与技能构建功能:新增互动式语言学习模式,用户在翻译过程中可以随时重听、对比原文与译文,并纠正发音,辅助外语学习。
实测体验:保留语气、离线可用,还有更多彩蛋
早期测试者反馈,Gemini 3.5 Live Translate在嘈杂环境下的识别率依然很高,且支持离线翻译(59种语言)、即时相机翻译(94种语言)和手写输入翻译(96种语言)。特别值得一提的是“转录”功能——连续翻译他人所说的内容(目前支持8种语言),适用于讲座或会议场景。此外,用户可在任何应用中复制文字,点按“Google 翻译”图标即可翻译,极大提升了日常使用便利性。