2026年6月9日谷歌正式发布Gemini 3.5实时翻译模型,作为其在语音到语音翻译领域的最新成果,该模型支持全球70余种语言自动识别,可在保障翻译准确率的前提下同步还原说话者的语调、语速、音高等特征,目前已进入落地阶段,将为多场景跨语言即时沟通提供全新解决方案。

对于经常参与跨国会议、跨境出行的人群来说,传统翻译工具的使用痛点始终存在:语音转文字的延迟经常打断对话节奏,机械的电子音无法传递说话者的情绪,遇上小语种更是经常出现识别错误,这些问题都极大限制了跨语言交流的效率。
随着全球跨境流动恢复,跨语言交流的需求正在快速攀升:2025年全球国际出行人次恢复至疫情前的121%,超过4成企业采用跨国远程办公模式,跨境电商实时客服需求年增速达62%。但传统翻译工具的短板十分明显:文字翻译无法应对实时对话场景,普通语音翻译延迟高、准确率不足,且机械的电子音经常丢失说话者的情绪信息,容易造成沟通误会,而专业同传服务成本高昂,普通中小商家和个人消费者根本无力承担。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录