登录体验完整功能(收藏、点赞、评论等) — 已累计有 11663 人加入

谷歌发布Gemini 3.5实时语音翻译模型 跨语言沟通告别翻译腔

详情页推荐

2026年6月,谷歌正式推出Gemini 3.5 Live Translate实时语音翻译模型,依托语音到语音翻译技术实现体验突破,翻译延时压缩至数秒级,可精准还原说话人语调、节奏、音高,彻底告别传统翻译工具的翻译腔与轮流翻译滞后问题,目前该模型已接入谷歌旗下AI Studio、翻译、Meet等多条产品线。

配图

不少有跨国会议、跨境交流经验的用户都有过类似尴尬:翻译工具慢半拍的轮流播报、生硬刻板的机械语调,往往让原本顺畅的对话频繁卡壳,沟通效率大打折扣。而谷歌最新推出的翻译模型,正在彻底改变这一现状。

随着全球跨境商务、文旅交流、远程办公的渗透率逐年提升,跨语言沟通的需求已经从特定专业场景下沉到普通用户的日常需求。但传统机器翻译工具普遍采用“说话人说完一句、系统翻译一句”的轮流交互模式,不仅延时高、容易打断对话节奏,机械合成的译文往往缺乏情绪起伏,“翻译腔”浓重,和自然沟通的体验相差甚远。而专业人工同传的成本高昂,无法覆盖日常、小额的跨语言沟通场景,行业亟需更普惠、体验更优的解决方案。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。