3月2日,阿里通义实验室语音团队正式发布两款支持FreeStyle指令生成的语音AI模型——Fun-CosyVoice3.5与Fun-AudioGen-VD。前者主打多语种音色复刻与精细化表达控制,后者聚焦声音设计与场景化音频生成,用户仅需自然语言指令即可实现定制化音频内容的快速生成,无需复杂参数调整或专业技能。
当你想生成一段带东北方言腔的英语童话朗读,或是为短视频制作一段“夏夜蝉鸣+轻快吉他伴奏+AI旁白”的复合音频,以往可能需要在多个工具间切换、调整数十项参数。而现在,只需一句话的自然语言指令,阿里通义实验室的新模型就能帮你实现。
作为语音合成类模型,Fun-CosyVoice3.5的核心优势在于多语种音色复刻与精细化表达控制。用户无需提供大量样本数据,仅需描述“温柔的台湾腔女声朗读唐诗”“粗犷的俄语男声播报体育新闻”,模型就能精准匹配音色、语言与情感,实现接近真人的语音输出。对于内容创作者来说,这意味着可以快速生成不同风格的有声内容,无需依赖专业配音团队。
不同于专注语音合成的前者,Fun-AudioGen-VD更聚焦声音设计与场景化音频生成。它支持用户通过指令定制包含环境音、音效、语音的复合音频,比如“生成一段海边背景音搭配治愈系女声讲述旅行故事的音频”“制作游戏中战斗场景的激昂音效+旁白配音”。这种一体化的生成能力,能够大幅降低短视频、游戏、播客等场景的音频制作门槛。
过去,语音生成技术更多面向专业开发者,需要掌握复杂的参数设置与样本处理流程,这让普通用户望而却步。而阿里通义此次发布的两款FreeStyle模型,将核心操作简化为自然语言指令,本质上是把语音AI从“专业工具”转化为“大众创作助手”。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
14 小时前
2026年4月,人工智能研发公司OpenAI正式推出新一代大语言模型GPT-5.5,该模型在多模态理解、复杂任务推理、长上下文处理等多维度能力均实现大幅提升。此次迭代也被视作OpenAI推进“一站式AI超级应用”长期战略的重要节点,将对全球消费级AI工具的市场竞争格局产生深远影响。

16 小时前
AI硬件软件平台开发商Era于近日宣布完成1100万美元融资,本轮资金将主要用于面向多形态AI硬件的底层软件平台研发,覆盖智能眼镜、智能戒指、智能吊坠等消费级AI可穿戴品类。该公司认为未来AI硬件将脱离手机附属品定位,形成多形态并行的独立生态,其研发的通用软件平台将解决不同硬件形态的AI能力适配难题。

19 小时前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

19 小时前
4月21日MIT Technology Review资深记者Mat Honan发布专题报道指出,2026年全球AI应用渗透率已突破72%,覆盖办公、消费、公共服务等全场景,但伴随隐私争议、岗位替代焦虑、信息过载等问题持续发酵,公众对AI的正面认可度较2023年峰值下跌28个百分点,全球AI产业首次进入业界所称的“AI倦怠期”。

20 小时前
2026年4月23日,腾讯正式发布混元系列最新开源大语言模型Hy3 Preview,该模型总参数达295亿,在复杂推理、指令遵循、代码处理等维度表现实现显著提升,研发阶段坚持实用性、真实评测、高性价比三大原则,目前已接入多款腾讯自有产品,同时兼容主流开源智能体工具,为开发者提供了新的高性价比选型。

20 小时前
Alphabet首席执行官桑达尔·皮查伊近日披露,谷歌内部超75%的新增代码已由人工智能自动生成,标志其“AI优先”战略落地取得实质性突破。该比例2025年4月仅为30%,一年间涨幅超150%,所有AI生成代码仍需经过专业开发工程师严格审核以保障安全。2026年Alphabet预计全年资本支出将达1750亿美元,持续加码AI底层布局。

20 小时前
2026年4月23日第26个世界知识产权日来临前夕,杭州市中级人民法院公开开庭审理全国首例AI智能体流量劫持不正当竞争案,该案由杭州中院院长、一级高级法官唐学兵担任审判长。原告为AI应用“K智能体”运营方,指控被告通过输入法植入的“W智能大模型”功能劫持自身平台用户流量,案件引发AI领域竞争规则的广泛讨论。

20 小时前
2026年4月以来,国内社交平台接连出现AI合成虚假资讯:先是伪造的小米汽车官宣苹果CEO库克出任CEO海报登上微博热搜,小米高管紧急公开辟谣;随后特斯拉CEO马斯克加入拼多多旗下拼好饭的假海报再度引发大范围传播,此类足以乱真的AI合成内容造谣成本近乎为零,引发公众对数字时代信息真实性的广泛讨论。