摘要:2026年2月,谷歌宣布对旗下AI虚拟形象(AI Avatars)及AI配音(AI Voiceovers)功能完成重磅升级,在原有基础上新增7种语言支持,使语言覆盖总量达到24种。此次升级聚焦多模态交互技术优化,旨在打破跨语言沟通壁垒,为全球企业客户服务、内容创作等场景提供无障碍数字人沟通解决方案。
当一名巴西中小企业主试图通过数字人客服咨询德国供应商的合作条款,或是肯尼亚创作者想打造本地语言的虚拟主播栏目,语言曾经是横亘在中间的一道高墙。而谷歌的最新技术升级,正在将这道阻碍全球沟通的高墙彻底推倒。
此次谷歌AI虚拟形象与配音功能的升级,核心是在原有17种语言基础上新增7种支持,使整体语言覆盖总量达到24种。这一矩阵几乎涵盖了全球所有主流商业语种,包括此前未覆盖的部分新兴市场语言,能够满足跨区域企业沟通、跨国内容创作等场景的核心需求,真正实现跨时空、跨文化的无障碍数字人互动。
除了语言数量的增加,谷歌在技术层面也进行了针对性迭代。在AI Studio平台中,新增的24种语言原生语音模型搭配主动音频识别功能,能够让AI虚拟形象的发音更贴近人类自然语调,甚至具备情感表现力,彻底告别早期数字人机械生硬的音色。同时,升级后的功能支持多角色协同对话与精细的语气调控,可适配企业培训、剧情类内容创作等对场景感要求较高的需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 小时前
2026年4月,人工智能研发公司OpenAI正式推出新一代大语言模型GPT-5.5,该模型在多模态理解、复杂任务推理、长上下文处理等多维度能力均实现大幅提升。此次迭代也被视作OpenAI推进“一站式AI超级应用”长期战略的重要节点,将对全球消费级AI工具的市场竞争格局产生深远影响。

7 小时前
AI硬件软件平台开发商Era于近日宣布完成1100万美元融资,本轮资金将主要用于面向多形态AI硬件的底层软件平台研发,覆盖智能眼镜、智能戒指、智能吊坠等消费级AI可穿戴品类。该公司认为未来AI硬件将脱离手机附属品定位,形成多形态并行的独立生态,其研发的通用软件平台将解决不同硬件形态的AI能力适配难题。

9 小时前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

10 小时前
4月21日MIT Technology Review资深记者Mat Honan发布专题报道指出,2026年全球AI应用渗透率已突破72%,覆盖办公、消费、公共服务等全场景,但伴随隐私争议、岗位替代焦虑、信息过载等问题持续发酵,公众对AI的正面认可度较2023年峰值下跌28个百分点,全球AI产业首次进入业界所称的“AI倦怠期”。

10 小时前
2026年4月23日,腾讯正式发布混元系列最新开源大语言模型Hy3 Preview,该模型总参数达295亿,在复杂推理、指令遵循、代码处理等维度表现实现显著提升,研发阶段坚持实用性、真实评测、高性价比三大原则,目前已接入多款腾讯自有产品,同时兼容主流开源智能体工具,为开发者提供了新的高性价比选型。

10 小时前
Alphabet首席执行官桑达尔·皮查伊近日披露,谷歌内部超75%的新增代码已由人工智能自动生成,标志其“AI优先”战略落地取得实质性突破。该比例2025年4月仅为30%,一年间涨幅超150%,所有AI生成代码仍需经过专业开发工程师严格审核以保障安全。2026年Alphabet预计全年资本支出将达1750亿美元,持续加码AI底层布局。

10 小时前
2026年4月23日第26个世界知识产权日来临前夕,杭州市中级人民法院公开开庭审理全国首例AI智能体流量劫持不正当竞争案,该案由杭州中院院长、一级高级法官唐学兵担任审判长。原告为AI应用“K智能体”运营方,指控被告通过输入法植入的“W智能大模型”功能劫持自身平台用户流量,案件引发AI领域竞争规则的广泛讨论。

10 小时前
2026年4月以来,国内社交平台接连出现AI合成虚假资讯:先是伪造的小米汽车官宣苹果CEO库克出任CEO海报登上微博热搜,小米高管紧急公开辟谣;随后特斯拉CEO马斯克加入拼多多旗下拼好饭的假海报再度引发大范围传播,此类足以乱真的AI合成内容造谣成本近乎为零,引发公众对数字时代信息真实性的广泛讨论。