小米发布自研MiMo-V2-TTS大模型语音合成迈入全能声优时代

AI创作导航管理员 LV4 资深连续登录7天萌新

3 个月前

风向

116

2026年3月19日，小米正式发布自研语音合成大模型MiMo-V2-TTS，该模型依托小米自研音频分词器与多码本语音-文本联合建模架构，经上亿小时语音数据预训练，具备情感精细化调节、多类方言生成、高质量歌声合成等能力，实现了语音合成技术从机械复读到情感共鸣的质的跨越。

如果你曾吐槽过智能设备的语音播报像“机械念稿”、导航语音情绪永远平得像白开水，小米这次的新模型或许能彻底改变这种固有印象。3月19日小米相关活动现场放出的演示视频里，MiMo-V2-TTS生成的语音既能模仿长辈唠家常的松弛感，也能一秒切换成播音腔念新闻，甚至能模仿喜剧演员的语气耍宝，表现效果几度超出现场观众预期。

和上一代语音合成模型普遍依赖单一文本-语音映射逻辑不同，MiMo-V2-TTS采用了小米自研的Audio Tokenizer音频分词器与多码本语音-文本联合建模架构，这一设计让模型不再是简单的“拼字发音”，而是能捕捉到人类语音里的韵律、停顿、情绪起伏等隐性细节。
上亿小时多来源语音数据的预训练，更是让模型积累了覆盖不同年龄、地域、场景的人类语音样本库，为多风格、高精度的语音生成打下了坚实基础。

人工智能小米 MiMo-V2-TTS 语音合成大模型 AI语音技术

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

小米发布自研MiMo-V2-TTS大模型语音合成迈入全能声优时代

最新文章

X社区 · 无限公约

二狗PPT

亚马逊影业宣布放弃发行OpenAI创始人奥尔特曼传记片《人工智能》

AI芯片产能缺口加剧三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展上线3天已减超10万斤

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

小米发布自研MiMo-V2-TTS大模型 语音合成迈入全能声优时代

最新文章

X社区 · 无限公约

二狗PPT

亚马逊影业宣布放弃发行OpenAI创始人奥尔特曼传记片《人工智能》

AI芯片产能缺口加剧 三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能 打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展 上线3天已减超10万斤

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

小米发布自研MiMo-V2-TTS大模型语音合成迈入全能声优时代

AI芯片产能缺口加剧三星拟扩建光州先进封装厂加码多领域布局

字节豆包灰度测试社交功能打通飞书账号探索AI社交新场景

蚂蚁阿福公布1亿斤减重项目进展上线3天已减超10万斤